封面新闻 2025-05-10 13:11:58
“熬夜写的论文,AI检测直接判了80%!”大四学生晓妍(化名)在社交平台上的抱怨,引来大量毕业生共鸣。为了探究检测工具的实际情况,记者进行了一个实验:将朱自清的名篇《荷塘月色》与刘慈欣《流浪地球》的片段上传至某常用论文检测系统后,结果显示,这两篇经典作品AI生成内容总体疑似度竟分别达到了62.88%和52.88%。这样的检测结果,也让学生们普遍多了些“论文被AI误判”的担忧。(大河报)
朱自清《荷塘月色》被检出高AI率,这一结果,其实并不能说明太多问题。我们知道,严格说来AI本身并没有内容原生能力,而是根据既有的语料、素材进行化炼合成。现阶段,市面上很多AI检测系统,恰恰是基于这一大前提,通过判断文本的原生度,来反推其AI生成的概率。将《荷塘月色》的片段投入此类论文检测系统,系统很容易检测出其与公开资料高度重合,由此判定原生度低、AI概率高,从逻辑角度说,这是没有问题的。
所谓“AI论文反识别”,当然无法判断《荷塘月色》是不是AI写的,其能判断的是,这部分被拿来检测的《荷塘月色》片段文字,是不是与现有的语料库、数据库信息雷同,继而“若雷同则视作AI生成”。这里面其实有个已知可证、递进推理的思维在。而需要说明的是,“雷同文本”鉴别,其实只是最初阶的AI检测模块,这属于小儿科的功能,并不能体现水平。用AI生产的论文,去测试AI论文反识别系统,才有基本的合理性——当然了,其结果也可能并不乐观。
好的AI论文反识别系统,至少应该有两个基本的素质,也即准确率高、误伤率低。从目前来看,市面上的很多AI论文反识别系统,在这两个指标上的表现都很难令人满意。比如说,不少学生吐槽,自己辛辛苦苦“手搓”的论文,却被系统检测判定含AI率太高,简直比窦娥还冤。之于此,固然确有一部分论文写得AI里AI气而被错判的成分,但同样更应该看到,当下的很多AI论文反识别系统,的确不靠谱。
在AI平台后台记录不公开、不上传、不联通的前提下,所谓的AI论文反识别,从本质上说,只是一种基于概率的可能性测算,这并不是实锤、实证。之于此,很多高校心知肚明,其之所以要新设“AI检测”这道流程,更多只是一种姿态释放,为的是彰显对学术标准和学术品德的不弃防。AI论文反识别,可能误伤,而就算通过了其检测,也可能是错放。整个过程中,并不可靠的技术权威、基于工具理性的形式判断,替代了学术人能动的实质判断、价值评判,这很难说不是本末倒置。