聚焦多模态模型“幻觉”治理:杭州企业申请强化学习训练专利提升图文一致性

多模态大语言模型在融合文本与视觉信息时,长期面临一个关键难题:生成的文字描述与图像内容不一致,业界通常称之为“幻觉”。这不仅降低了输出质量,也影响了模型在实际场景中的可信度。根据国家知识产权局公开信息,全民认证科技有限公司申请的专利(公开号CN121638370A)围绕这个问题提出了较为系统的改进方案。该专利名称为“一种缓解多模态大模型幻觉的强化学习训练方法及其系统”,申请日期为2025年11月,所属方向为多模态大语言模型的强化学习训练。

这项技术进展反映了我国在人工智能基础算法与训练方法上的持续推进,也提示了产学研协作在攻克关键问题上的现实价值。随着创新从单点尝试走向系统化优化,如何提升成果转化效率、形成更良性的创新生态,仍是行业需要持续推动的方向。