怎么让ai能看出谁是真ai？南开大学这帮人搞了个直接差异学习的方法，直接给模型喂数据，教会它们区分

怎么让AI能看出谁是真AI？南开大学这帮人搞了个直接差异学习的方法，直接给模型喂数据，教会它们区分真假。最近这个成果发表在了ACM MM 2025上，也就是第33届ACM国际多媒体会议。现在让AI查自己写的东西，主要就俩路子：一种是专门找一些数据来训练一个专门的分类器；还有一种是直接用预训练的大模型，给它定个标准让它来分类。为啥现在的检测工具老是出错？好比你考试光背答案不做题，碰到新题肯定就傻眼了。付嘉晨解释说，想让检测器像人一样聪明，理论上得把所有大模型的数据都找来学，但现在模型迭代太快根本做不到。团队就想着让检测器学会举一反三。他们搞了个DDL策略，直接优化预测文本的概率差和目标值之间的差距。这样一来，模型就能学到深层的语义差异了。付嘉晨说，用DDL训练出来的检测器跟有了“火眼金睛”似的，哪怕只学了DeepSeek-R1的文本，也能一眼认出GPT-5这种最新的玩意儿。他们还搭了一个叫MIRAGE的测试数据集，里面用17个主流的大模型（13种商用加4种开源），生成了差不多10万条“人写的-AI写的”文本对。郭春乐说，这是目前唯一一个专门用来测商用大语言模型的基准数据集。结果特别打脸：之前的检测工具在简单的数据集上能到90%，但放到MIRAGE这就掉到了60%左右。而用了DDL训练的检测器稳得一批，还是85%以上的准确率。跟斯坦福那个DetectGPT比起来，咱们这提升了71.62%；跟马里兰、卡内基梅隆那边的Binoculars比起来，又多了68.03%。李重仪说AI和AIGC发展太快了，他们还得接着优化评估基准和技术。