正值申请季,托福保分进行得如火如荼,参与在线考试的人数比21年环比增长了20%左右。但被ETS取消成绩的人数,却比21年增长了接近500%,达到了约4万人次。引用来源:ETS公众号(ETS官方)—《对话ETS首任首席安全官:ETS如何维护考试安全

与小红书里的机构们虚构出的歌舞升平、欣欣向荣、一片大好出分图景不同,这才是冷冰冰的现实。

这次,ETS究竟又做了什么?

ETS开始利用AI检测考生视线。这是一种基于计算机视觉(Computer Vision)的深度学习(Deep Learning)检测模型。通过海量的考生摄像头画面训练卷积神经网络(Convolutional Neural Network)模型,即可对确定考生的视线落点的参数进行最大似然估计(Maximum likelihood estimation)。结合参数,即可大致判断考生所看之处。

ELPIS结合ETS专利信息已经对考试软件的逆向工程,参考了多篇CVPR有关Gaze Tracking/Pupil Tracking的论文,还原了ETS的视线检测模型,并用于考前培训。详情请见:。。。

如果AI识别出异常行为,考生就会被flag;考生被flag的次数越多,系统判断该场考试的风险系数就越大。另外,真人考官亦可手动flag考生行为。由于AI识别并不完全准确,存在一定的假阳(False Positive)率,所以AI给出的flag虽然次数较多,但权重较小;而真人考官手动给出的flag虽然次数少,但权重极大。系统会根据flag次数和权重,实时计算出该场考试的风险系数,不同风险系数阈值对应着不同的检测强度。自然,更高的风险系数意味着更低的出分率。

 

 

 

除了先进的AI技术,增设“飞行监考/反介入专家”(Intervention Specialist)是另一个杀手锏。“飞行监考/反介入专家”由一批受过专业训练,专门针对线上监考,来自ETS OTI部门的英语母语者担任。他们不会全程监控某一位考生考试,而是像巡考一样巡回查看高风险系数的考试,而口语部分又是被巡查的重中之重。

纯物理考生从此开始身处非常矛盾的两难之境。

如果不看手机,那就不知道答案;

如果看手机,视线会被标记异常,招致关停考试;

有些机构开始利用一些“奇思妙想”试图解决问题,并美其名曰:考前培训。这些机构所谓的“考前培训”,无非发给考生几个视频,里面的主旨只有一句话:要看手机,但别看得那么明显。用余光!

如果余光真的那么厉害,小昆虫们又何必进化出复眼呢?退一步讲,即便考生可以完美的利用余光瞟到选择题答案,口语和作文又该怎么办呢?这无非是头痛医头,脚痛医脚的鸵鸟式解决方案。不能说没有一点用处,但是用处也少的可怜,解决不了本质上的痛点。

纯物理本质的痛点在哪里?

  1. 在于只要想看答案,视线必须向固定的某处转移;

  2. 一旦考生被二次安检,来不及“收摊”,被抓现行必禁考;

应该如何解决这些问题呢?

ELPIS也没办法。纯物理相当于“又让马儿跑,又让马儿不吃草”。这是哲学上的二律背反(antinomy),属于无解。因为“纯物理”错在了方法论,而方法论上的宏观错误是不可能用操作上的微观改进去弥补的。打个比方,中世纪的炼金术师为了将铜块炼成黄金,不可谓不努力、不勤奋。

他们有着神农尝百草般的执着,随时准备在爆炸和有毒气体之中献身。

甚至,他们发明了很多改进制造工艺的手段,比如多臂蒸馏器和分馏皿。但结果呢?现代科学告诉我们:炼金术是不可行的,因为金是原子序79的金属元素,而非化合物,所以无法被合成。 时代在变化,科技在进步,人工智能都要在某些特定领域代替博士了。

引用来源:《Nature》杂志—Highly accurate protein structure prediction with AlphaFold(AlphaFold 通过深度学习实现了高精度的大规模蛋白质结构预测,彻底改变了结构生物学研究范式,加速了药物发现并深化了对生物分子功能的理解)

要是还在纠结“我怎么拍照怎么看手机才能100%让摄像头抓不到,而且不被二次安检”,ELPIS觉得不如思考以下问题:

  • 如何利用爆竹将载人飞船送往火星

  • 如何用手雕刻出2纳米制程的CPU

  • 如何用100元实现可控核聚变

所以,错误的方法是无论花费多少努力都无法补救的。So why bother?