人工智能的比赛逻辑变了:以前比谁家模型聪明现在比谁更懂怎么用数据

前阵子在上海搞了一场人工智能协同办公的大会,大家都在聊一个事儿:当模型一个月一个样跑得飞快的时候,竞争的重点悄悄变了。中金公司研究部那位执行总经理于钟海在台上说得挺直白,以前死磕模型性能那一套已经过时了,现在拼的是谁能把数据管好。他还说了个数据挺吓人,说实验室里顶尖的模型更新速度都到了几个月一个周期,哪怕是很牛的模型,用了一年以后能留下来的人也不多。这话说出来,现场不少专家都点头,感觉这情况太现实了。 现在计算力越来越充足,基础模型的能力也跟着猛涨,人工智能从“稀罕玩意”变成了“大路货”。金山办公那位助理总裁朱熠锷就讲了个转变的现状,说AI应用早就过了光看模型好不好的那个阶段了,现在得看谁能在数据上搞出真价值。 虽然大模型看着很厉害,但好多企业的AI项目还是卡在“演示时吹破天、落地时全完蛋”的尴尬局面上。于钟海分析说这主要不是模型本身的问题,是企业手里的数据太乱了,一直“睡大觉”。像财报、合同、设计图这些装满了公司核心知识的文档,长年累月分散在各种系统里各种格式里,弄成了一座座“孤岛”。 统计显示,企业里面超过80%的数据都是那种没法直接用机器读的非结构化数据。华中科技大学的刘禹良教授在展示和金山办公一起搞的MonkeyOCR模型时特别强调了这一点,他说能不能把一份复杂的表格、手写的备注还有跨页的图表给看懂,这直接决定了后面AI能干到什么程度。他们这个模型在解析这些复杂文档上的表现,连好多国际巨头都比不上。 面对这种难题,国内科技公司开始琢磨有咱们中国特色的办法。金山办公搞出来的WPS 365一站式平台,发展路子跟行业的新走向特别合辙。这个平台不光是个工具库,还想着给企业搭个“全域知识基座”。 他们靠三十年多来在文档处理这块儿攒下的技术底子,在格式理解和信息抽取上占了大便宜。平台用强解析能力把散成一片的数据变成了结构化的知识图谱,给企业提供了从收数据到用数据的全套解决方案。 在具体干活的时候效果很明显。智能文档库能自动找出文档之间有冲突或者重复的地方;在医药行业,表格里的信息能抓到99%的准确率,还能自动生成符合规范的报告。 现在这套系统已经落地在延锋国际、东方航空、上海信投这些华东的大公司了。在管知识资产、搞合规审查还有做自动化报告这些事儿上,效率都提上去了。 于钟海觉得这意味着人工智能的比赛逻辑变了:以前比谁家模型聪明;现在比谁更懂怎么用数据。当基础模型的能力渐渐变得“平民化”,能帮公司把经验流程这些隐性知识变成AI能直接调用的显性资产的平台,才是推动生产力革新的发动机。 这种转变不光是技术上的事,也是企业观念的大变动。大家开始重新看数据资产的战略价值,把它从一个技术支持部门升成了公司的战略核心。 高质量的管数据能力成了数字经济时代核心竞争力的一部分。咱们国家的企业正以这种踏实创新的心态迎接转型的考验。从以前追着模型跑变成现在深挖数据治理,从单一突破变成系统建设,这是产业发展规律越来越深刻的认识体现。 以管数据为核心的新阶段会把我国的产业数字化进程推向更深更广的地方去,给经济高质量发展注入新的智慧动力。