上海的机器人技术这回可算是捅破了那层窗户纸,“世界模型”这个玩意儿算是把智能体从只能按照设定好的剧本走,彻底推到了能自己拿主意的新台阶上。虽说现在的智能机器在用起来的时候确实遇到不少坎儿,比如老得靠大量的场景数据和人来盯着干活,根本没法应对现实里那种千变万化的烂摊子,导致成本高还推不出去。特别是在管城市、搞安防这些事儿上,传统机器人没个专人在那儿遥控是万万不行的,想让大家伙儿一起高效干活几乎就是天方夜谭。造成这种情况最主要的就是以前那条技术路走得太窄了。大家以前都爱用那个视觉-语言-动作模型,虽然喂它足够多的数据能让它学会干活,但说到底它也就是在那儿模仿个样子,根本不懂什么物理规律。环境一变或者要它对付的东西不一样了,这机器马上就会掉链子。再加上采数据全靠人工去摆弄,数据规模想突破简直比登天还难,这就成了制约技术进步的一大块心病。好在这次新弄出来的“世界模型”系统给咱们指了条明路。它能帮机器人弄清楚这个世界是怎么运行的,让机器像咱们人类一样明白前后左右啥关系、还能猜猜看下一步会咋样。这样一来,就算是到了个谁都没见过的陌生地儿,它也能自己把活儿干利索。跟以前那些一比,这系统的泛化能力和适应能力可强多了,对那些特意定制的场景数据需求能少一半以上,办事效率跟稳定性自然也就上去了。 这次发布的核心宝贝是“具身超级大脑”模组还有“世界模型”3.0版本。前者就是个通用的控制模块,可以装在各种不同样子的机器人身上,一下子就给它们装上了能看空间的眼睛和能拿主意的大脑;后者呢就是通过模仿物理世界是咋转的,给机器人提供说话跟预测的支持。演示的时候那场景真挺带感的,装了这套系统的机器一眼就能看出车停得对不对、无人机是不是飞进了禁飞区,甚至还能喊两嗓子让人一起来处理事儿。 这技术对咱们干这行的来说那叫一个大好事儿。在管城市这一块儿,机器以后能帮忙天天去转悠巡逻,把公共管理的活儿搞得更溜;在安保、物流还有遇到紧急情况的时候,这无人化、智能化的新活儿也能玩得越来越花。从技术角度看啊,这算是给具身智能怎么走得更稳更宽铺好了路子。以前大家都是盯着一个任务死磕训练的那种玩法要变了,得向着去练通用本事这个方向去转。 大家伙儿还得注意点儿,这套技术现在已经不在纸上谈兵了。企业正在跟上海徐汇警方合作搞路面巡查的试点呢,琢磨着怎么让智能系统跟城市治理深度融合在一起。搞研究的团队反复强调说,系统要是不真的跑到大马路上去试几百遍、几千遍,形成“研发-应用-反馈”这么一个环环相扣的圈子,那肯定优化不了也建立不起靠谱的标准来。 以后要是“世界模型”技术练得更老练了,机器人自己做主的本事肯定还会往上长一大截。行业里头的专家说了啊,想把这门手艺干得好不光光靠算法突破就行了,还得跟咱们产业的实际需求死死抱成团。通过好几个领域的人一块儿合作搭个完整的生态圈子才是正道。 咱们都盼着未来几年里那些能看懂环境还能自己拿主意的机器人能在智慧城市、造东西还有服务大家伙儿这些地方大展拳脚。从刚开始只能听着口令干活,到后来能懂环境怎么回事儿;从以前就自己一个人单打独斗到现在一群机器能一块儿协同作战……智能机器人这技术算是真正走向自主认知的新阶段了。 这一回的突破不光是展示了咱们国家在把人工智能跟机器人捏一块儿方面的聪明才智,更是给智能技术怎么去帮实体经济忙提供了个活生生的好例子。未来该怎么把技术上的创新跟实际的场景用得更透彻点?该怎么搭出个既安全又可靠还高效的智能系统体系来?这事儿还得产学研这几大帮子人接着使劲去探索、一块儿使劲干才行。 在咱们走科技自立自强这条路的时候啊,每一步踏踏实实地走出来的突破都能给咱们的经济社会发展注进新的智能动力。