企业搞ai 重点都得放在数据治理上

就在最近WPS 365 AI协同办公上海峰会上,大伙儿讨论的重点,可都是人工智能怎么助力产业升级。中金公司研究部的于钟海就说了,现在企业搞AI,重点都得放在数据治理上。他拿了个研究数据出来,说是就算再好的模型,用了一年以后,用户想留下来都难。这就说明,企业得把数字化的根基打得更牢。 虽然大模型技术有了大突破,可很多企业的AI项目还是“看着热闹用着难”。说到底,问题不在模型本身,而是数据长期“睡大觉”。那些财报、图纸、合同、会议纪要……这些重要的知识资产因为格式五花八门、标准不一,成了阻碍AI应用的“最后一公里”。 金山办公的朱熠锷也提出来了,现在大家的思路都变了,以前是围着模型转,现在得围着数据转。金山就推出了WPS 365这个平台,专门去搞全域知识基座。他们用的MonkeyOCR模型是华中科技大学的刘禹良和金山一起研发的,在复杂文档解析这块表现特别强,手写批注、跨页表格这些都不在话下。刘禹良就强调说,文档解析准不准,直接决定了后面应用能有多强。 金山靠着38年在文档处理上的经验,把格式解析和信息抽取这块儿的技术优势给立住了。WPS 365“企业大脑”就是他们弄的,能把零散的数据变成知识图谱。像医疗健康这块,表格信息抽取的准确率都能到99%,还能自动生成规范的报告。 于钟海分析说,现在大家比的是看谁的数据理解深。等基础模型大家都会用了,能把企业的经验流程变成AI能用的资产的平台才是关键。目前WPS 365已经在制造、交通、IT这些龙头企业里用上了,知识管理和合规审查都做得不错。 这事儿也说明白了,只要通过数据治理把沉睡的资产激活,这就是数字化转型的突破口。技术跟实体经济的结合越来越深了,企业竞争格局也在变。从模型驱动变成数据驱动,不光是技术规律的体现,更是数字经济时代企业竞争力的重构方式。 等数据治理体系完善了,企业积累的老本就能变成创新的动力。这过程中技术和需求结合得紧,就能把我国数字经济建设推向更高水平。