怎么让AI能看出谁是真AI?南开大学这帮人搞了个直接差异学习的方法,直接给模型喂数据,教会它们区分真假。最近这个成果发表在了ACM MM 2025上,也就是第33届ACM国际多媒体会议。 现在让AI查自己写的东西,主要就俩路子:一种是专门找一些数据来训练一个专门的分类器;还有一种是直接用预训练的大模型,给它定个标准让它来分类。 为啥现在的检测工具老是出错?好比你考试光背答案不做题,碰到新题肯定就傻眼了。付嘉晨解释说,想让检测器像人一样聪明,理论上得把所有大模型的数据都找来学,但现在模型迭代太快根本做不到。 团队就想着让检测器学会举一反三。他们搞了个DDL策略,直接优化预测文本的概率差和目标值之间的差距。这样一来,模型就能学到深层的语义差异了。付嘉晨说,用DDL训练出来的检测器跟有了“火眼金睛”似的,哪怕只学了DeepSeek-R1的文本,也能一眼认出GPT-5这种最新的玩意儿。 他们还搭了一个叫MIRAGE的测试数据集,里面用17个主流的大模型(13种商用加4种开源),生成了差不多10万条“人写的-AI写的”文本对。郭春乐说,这是目前唯一一个专门用来测商用大语言模型的基准数据集。 结果特别打脸:之前的检测工具在简单的数据集上能到90%,但放到MIRAGE这就掉到了60%左右。而用了DDL训练的检测器稳得一批,还是85%以上的准确率。 跟斯坦福那个DetectGPT比起来,咱们这提升了71.62%;跟马里兰、卡内基梅隆那边的Binoculars比起来,又多了68.03%。李重仪说AI和AIGC发展太快了,他们还得接着优化评估基准和技术。