正值申请季,托福保分进行得如火如荼,参与在线考试的人数比21年环比增长了20%左右。但被ETS取消成绩的人数,却比21年增长了接近500%,达到了约4万人次。引用来源:ETS公众号(ETS官方)—《对话ETS首任首席安全官:ETS如何维护考试安全》
与小红书里的机构们虚构出的歌舞升平、欣欣向荣、一片大好出分图景不同,这才是冷冰冰的现实。
这次,ETS究竟又做了什么?
ETS开始利用AI检测考生视线。这是一种基于计算机视觉(Computer Vision)的深度学习(Deep Learning)检测模型。通过海量的考生摄像头画面训练卷积神经网络(Convolutional Neural Network)模型,即可对确定考生的视线落点的参数进行最大似然估计(Maximum likelihood estimation)。结合参数,即可大致判断考生所看之处。
ELPIS结合ETS专利信息已经对考试软件的逆向工程,参考了多篇CVPR有关Gaze Tracking/Pupil Tracking的论文,还原了ETS的视线检测模型,并用于考前培训。详情请见:。。。
如果AI识别出异常行为,考生就会被flag;考生被flag的次数越多,系统判断该场考试的风险系数就越大。另外,真人考官亦可手动flag考生行为。由于AI识别并不完全准确,存在一定的假阳(False Positive)率,所以AI给出的flag虽然次数较多,但权重较小;而真人考官手动给出的flag虽然次数少,但权重极大。系统会根据flag次数和权重,实时计算出该场考试的风险系数,不同风险系数阈值对应着不同的检测强度。自然,更高的风险系数意味着更低的出分率。
除了先进的AI技术,增设“飞行监考/反介入专家”(Intervention Specialist)是另一个杀手锏。“飞行监考/反介入专家”由一批受过专业训练,专门针对线上监考,来自ETS OTI部门的英语母语者担任。他们不会全程监控某一位考生考试,而是像巡考一样巡回查看高风险系数的考试,而口语部分又是被巡查的重中之重。
纯物理考生从此开始身处非常矛盾的两难之境。
如果不看手机,那就不知道答案;
如果看手机,视线会被标记异常,招致关停考试;
有些机构开始利用一些“奇思妙想”试图解决问题,并美其名曰:考前培训。这些机构所谓的“考前培训”,无非发给考生几个视频,里面的主旨只有一句话:要看手机,但别看得那么明显。用余光!
如果余光真的那么厉害,小昆虫们又何必进化出复眼呢?退一步讲,即便考生可以完美的利用余光瞟到选择题答案,口语和作文又该怎么办呢?这无非是头痛医头,脚痛医脚的鸵鸟式解决方案。不能说没有一点用处,但是用处也少的可怜,解决不了本质上的痛点。
纯物理本质的痛点在哪里?
-
在于只要想看答案,视线必须向固定的某处转移;
-
一旦考生被二次安检,来不及“收摊”,被抓现行必禁考;
应该如何解决这些问题呢?
ELPIS也没办法。纯物理相当于“又让马儿跑,又让马儿不吃草”。这是哲学上的二律背反(antinomy),属于无解。因为“纯物理”错在了方法论,而方法论上的宏观错误是不可能用操作上的微观改进去弥补的。打个比方,中世纪的炼金术师为了将铜块炼成黄金,不可谓不努力、不勤奋。
他们有着神农尝百草般的执着,随时准备在爆炸和有毒气体之中献身。

引用来源:《Nature》杂志—Highly accurate protein structure prediction with AlphaFold(AlphaFold 通过深度学习实现了高精度的大规模蛋白质结构预测,彻底改变了结构生物学研究范式,加速了药物发现并深化了对生物分子功能的理解)
要是还在纠结“我怎么拍照怎么看手机才能100%让摄像头抓不到,而且不被二次安检”,ELPIS觉得不如思考以下问题:
-
如何利用爆竹将载人飞船送往火星
-
如何用手雕刻出2纳米制程的CPU
-
如何用100元实现可控核聚变
所以,错误的方法是无论花费多少努力都无法补救的。So why bother?