《荷塘月色》被检出高AI率，“人的判断”应是学术判断的基础

封面新闻 2025-05-10 13:11:58

　　“熬夜写的论文，AI检测直接判了80%！”大四学生晓妍（化名）在社交平台上的抱怨，引来大量毕业生共鸣。为了探究检测工具的实际情况，记者进行了一个实验：将朱自清的名篇《荷塘月色》与刘慈欣《流浪地球》的片段上传至某常用论文检测系统后，结果显示，这两篇经典作品AI生成内容总体疑似度竟分别达到了62.88%和52.88%。这样的检测结果，也让学生们普遍多了些“论文被AI误判”的担忧。（大河报）

　　朱自清《荷塘月色》被检出高AI率，这一结果，其实并不能说明太多问题。我们知道，严格说来AI本身并没有内容原生能力，而是根据既有的语料、素材进行化炼合成。现阶段，市面上很多AI检测系统，恰恰是基于这一大前提，通过判断文本的原生度，来反推其AI生成的概率。将《荷塘月色》的片段投入此类论文检测系统，系统很容易检测出其与公开资料高度重合，由此判定原生度低、AI概率高，从逻辑角度说，这是没有问题的。

　　所谓“AI论文反识别”，当然无法判断《荷塘月色》是不是AI写的，其能判断的是，这部分被拿来检测的《荷塘月色》片段文字，是不是与现有的语料库、数据库信息雷同，继而“若雷同则视作AI生成”。这里面其实有个已知可证、递进推理的思维在。而需要说明的是，“雷同文本”鉴别，其实只是最初阶的AI检测模块，这属于小儿科的功能，并不能体现水平。用AI生产的论文，去测试AI论文反识别系统，才有基本的合理性——当然了，其结果也可能并不乐观。

　　好的AI论文反识别系统，至少应该有两个基本的素质，也即准确率高、误伤率低。从目前来看，市面上的很多AI论文反识别系统，在这两个指标上的表现都很难令人满意。比如说，不少学生吐槽，自己辛辛苦苦“手搓”的论文，却被系统检测判定含AI率太高，简直比窦娥还冤。之于此，固然确有一部分论文写得AI里AI气而被错判的成分，但同样更应该看到，当下的很多AI论文反识别系统，的确不靠谱。

　　在AI平台后台记录不公开、不上传、不联通的前提下，所谓的AI论文反识别，从本质上说，只是一种基于概率的可能性测算，这并不是实锤、实证。之于此，很多高校心知肚明，其之所以要新设“AI检测”这道流程，更多只是一种姿态释放，为的是彰显对学术标准和学术品德的不弃防。AI论文反识别，可能误伤，而就算通过了其检测，也可能是错放。整个过程中，并不可靠的技术权威、基于工具理性的形式判断，替代了学术人能动的实质判断、价值评判，这很难说不是本末倒置。