从“看见”到“理解”，ai 可以帮助大家“读懂”艺术

就在2025年5月，C1.8视觉语言模型还有Seed1.8视频感知技术为浦东美术馆的展览贡献了强大的技术支持，观众只要打开豆包APP开启视频通话功能，就能让这位AI讲解员全程陪伴，边逛边聊。比如在伊朗、印度还有奥斯曼的特展里，虽然很多展品互联网上几乎查不到信息，但依靠豆包和美术馆合作的专属数据库，AI依然能快速精准地识别出诸如伊朗15世纪牡丹纹盘这种风格与明代永乐青花牡丹纹盘高度相似的文物。为了克服多角度拍摄和画面抖动带来的识别挑战，模型要通过多帧视频分析来稳定识别同一物品。哪怕画面有遮挡或者光线变化，AI也能保持清醒的头脑，给出准确的解读。这种技术上的突破让观众不用再受传统讲解方式的束缚，大家可以随心所欲地安排自己的观展顺序。李旻坤董事长提到的这种“千人千面”的感受正是得益于AI。毕竟在过去，受限于展签和人工导览的知识广度，很难满足每个人个性化的好奇心。一旦连接上了AI讲解员，只要把手机对准展品，观众就会发现这位博学敏锐的“搭子”上线了。它不仅能耐心解答“这幅画作的立意与毕加索的童年有关吗”这类知识性问题，还会在必要时委婉纠正观众提问时出现的错误。孙亚慧记者就在上海浦东美术馆体验到了这种特别的看展方式。在“非常毕加索：保罗·史密斯的新视角”特展中，观众对着毕加索的《装扮成喜剧丑角的保罗》一顿乱拍提问时，屏幕那头总能送来专业的答案。技术团队为了确保内容准确付出了巨大努力，克服了3个核心难题：区分外观高度相似的展品、解读小众稀缺的文物资料、在观众移动时AI保持稳定识别。值得一提的是，这次合作源于字节跳动副总裁朱骏的一个愿景：让AI和用户的交互变成一种对话体验。团队希望通过启发式的对话和更具共情意味的提问，调动观众已有的看展感受和经验。从“看见”到“理解”，AI可以帮助大家“读懂”艺术。陆家嘴集团副总经理李旻坤也非常看好这种科技改变生活的方式。她认为美育资源正在突破时空限制。以前展览主要靠展签和二维码提供有限信息，现在借助AI技术的力量，观众能获得更多内容。如果AI讲解员的信息足够准确，就能极大丰富大家对于艺术作品的感知和体验。面对这个最大的挑战——内容准确性问题时，豆包逛展项目负责人李若瑄给出了详细的解决方案。比如对于保罗·史密斯的新视角展览里那些风格独特的作品，哪怕故意避开了标签，C1.8视觉语言模型也能快速精准地识别出来。该模型通过图像推理、自然对话理解等方面的技术支撑提供了精准、稳定、人性化的导览体验。李旻坤还特意提到了“沉浸式”看展的趣味性更强这一点。因为有了AI讲解员作为陪伴者，大家可以打破固定模式依据自身时间和兴趣定制路径。不过李旻坤也坦言真人面对面的交流需求一直存在这就是为什么AI讲解员无法完全替代人工讲解员的原因所在。她说人与人之间的互动和机器互动各有各的乐趣这就好比我们日常生活中的所有行为逻辑一样人脑是有限的想让人像机器一样博学很难所以人工服务可以向着更聚焦、专业、精良的方向发展为观众提供更加生动的看展体验。