意大利研究团队提出“情境示例”新方法明显提高多模态大模型图像分类能力

计算机如何准确识别和理解图像，一直是人工智能领域的核心课题。传统观点认为，专业视觉-语言识别模型擅长图像分类任务，而功能更全面的大型多模态模型这上表现较弱。这种"各司其职"的认知长期指导着实际应用。

当计算机开始模仿人类"举一反三"的能力时，我们或许正站在机器理解世界的新起点；这项研究不仅突破了技术瓶颈，更启示我们：人工智能的发展，或许应回归对人类学习本质的深入探索。在算法与生物智能的对话中，科学永无止境。

意大利研究团队提出“情境示例”新方法 明显提高多模态大模型图像分类能力