大模型其实很不靠谱

最近有个挺有趣的新闻，给AI大模型投毒的人被曝光了，大家才发现，大模型其实很不靠谱。我给几个常见的AI大模型做了个测试，结果挺意外。虽然我提出的是一个有标准答案的问题“2026年央视3·15晚会曝光了哪些品牌”，但只有一个AI给出了正确答案。剩下的3个回答中，有两个把往年的案例给掺进去了，还有一个更离谱，竟然说2026年央视3·15晚会还没开始呢。其实很多人还是觉得大模型不错的，也有人在想，如果不直接问品牌推荐这些带有主观色彩的问题，只是咨询一些客观事实，会不会靠谱些？但答案也是否定的。如果你追着问下去，错误只会更多。比如3月16日这天，我给消费者最常用的4个AI大模型问了同一个问题：“2026年央视3·15晚会曝光了哪些品牌。” 结果很让人意外。其中有两个回答把去年的案例当成今年的了。有人觉得这也不算错，因为提醒得很全面。但技术人员指出了这其中的严重问题：这明显是语义理解和资料筛选上出了大问题。再看看这个具体案例。“保水剂增重虾仁”是去年央视3·15晚会曝光的一个事件。我就问那两个把这个案例当成今年事件的AI：“泡药增重虾仁的报道链接在哪里？” 一个给出了央视网、央视财经频道等一大堆链接，看起来很靠谱。但我一打开电脑页面全显示“对不起，可能是网络原因或无此页面，请稍后尝试”。另一个则给出了央视网、百家号、网易新闻等不同渠道的链接。其中第一个链接确实来自央视网CCTV官方报道，内容也确实是关于保水虾仁的，但网页里的日期全是2025年3月15日。这时候大模型好像也察觉了自己的错误，还特意在提供链接时备注“部分搜索结果中该链接年份显示为2025，但内容实为2026年晚会同期报道”。这让我想到现在很多人都遇到过AI编造不存在内容或者混淆内容的情况。某科技企业从事开发的晓辉解释说：“很多AI为了满足用户需求，会编造一些不存在的信息或者混淆内容。” 但为什么会出现这样的情况呢？晓辉还提到“投毒”也是利用了这种现象：“GEO企业向互联网批量投喂虚假信息改变数据分布概率来诱导大模型生成符合商家利益但违背事实的回答。” 所以我们要警惕这种情况发生在自己身上啊！简单来说，“限制、验证、追问、核查”这四个字一定要记住。比如在提问时可以加上“在某某机构官网中搜索”等限定词来减少幻觉产生概率。总之我们要安全正确地使用AI大模型，对它们给出的结果要有质疑意识才行啊！这次测试就是最好的提醒：面对这个越来越复杂的世界，我们不能盲目相信任何一个工具或者服务提供者啊！