问题——从“大模型热”走向“具身化”,瓶颈不参数而在数据。 当前,人工智能产业正从以文本能力为主的模型,转向面向现实空间的具身智能:让算法进入车辆、机器人等物理载体,在复杂环境中完成移动、操作与协作等任务。业内普遍认为,“从仿真走向现实”的关键障碍不只是算力投入,更在于缺少能真实反映物理规律与交互过程的高质量数据,尤其是空间视觉、位姿与轨迹、力控触觉等多模态信息。这类数据往往必须在真实场景中通过设备采集并配合人工干预获取,既难以依靠网络抓取,也难以由纯软件自动生成,导致供给稀缺、成本高、标准不一,成为具身智能模型迭代与工程化落地的突出短板。 原因——真实物理世界“难、贵、慢”,数据产业链门槛显著抬升。 一是采集难。具身任务数据来自真实环境,受动态光照、遮挡、反光、噪声、摩擦、碰撞等不确定因素影响,数据可复用性弱,对采集流程、设备同步与标注体系要求更高。 二是组织难。高质量数据通常需要在可控且合规的场域进行长期作业,既涉及场地资源与运行许可,也要求安全管理到位、责任边界清晰。 三是转化难。人类动作与决策天然不标准,如何通过遥操作等方式将其转化为机器可学习、可泛化的“结构化经验”,并在筛选、清洗、对齐与质量评估上形成稳定流程,直接决定数据能否用于训练与评测。 鉴于此,高价值具身数据正从“辅助资源”转为“核心生产资料”。多家研究机构预测,全球训练数据采集与标注市场将持续扩张,其中机器人操作与移动等实景交互数据因稀缺、工程复杂度高,单价与增速均处于高位。 影响——数据供给格局或将重塑具身智能商业化路径与竞争优势。 对企业而言,谁能持续、规模化、合规地生产高质量实景交互数据,谁就更可能在模型能力、产品迭代速度与成本控制上取得先发优势。 对产业而言,“数据卡点”将倒逼“算力—算法—场景—数据”的一体化协同:算力需要数据支撑才能释放价值,场景运行产生的数据又反过来推动模型升级,进而形成可持续的商业闭环。 对区域竞争而言,政策开放度更高、资本周期更长、应用场景承载能力更强的经济体,可能更容易聚集企业与项目,催生新的产业集群。 对策——以合资项目切入数据服务,打通“采集—筛选—交付—反哺”链条。 据企业披露,Robo.ai近期与一家数据企业成立合资公司,并完成具身智能数据订单交付,意在将数据生产作为具身智能产业链的关键环节提前布局。项目技术路线强调以遥操作采集设备与多模态数据筛选能力,将真实世界中非标准化的人类行为转化为可训练的数据资产,并通过流程化交付满足模型训练对质量与一致性的要求。 在商业组织上,企业将自身定位为“应用落地”的闭环环节:一上对接城市级应用场景,将算法能力装载到智能商用车、无人出行等载体中,以实际运营里程与订单形成稳定的场景入口;另一方面,通过实体设备在真实环境中持续作业,沉淀并回流可用于训练的高精度数据,从而形成“算力使用—数据产出—模型迭代”的循环增长。 从更宏观的产业条件看,阿联酋近年来在自动驾驶、智慧交通等领域释放场景与政策空间,同时加大资本与算力基础设施投入,形成“政策端—资本端—应用端”相互支撑的组织方式。对企业而言,这类生态有助于缩短从试点到规模化的周期:既解决“在哪里跑、怎么跑”的许可与场域问题,也缓解数据生产所需的长期投入压力,让数据业务更容易从项目制走向体系化供给。 前景——具身数据将从“成本项”升级为“资产项”,行业或进入精细化竞争阶段。 展望未来,具身智能数据服务可能呈现三点趋势:其一,数据标准与评测体系将加速建立,围绕任务类型、传感器组合、质量指标与可追溯性形成共识,推动供需双方从“按量”转向“按质”定价;其二,数据生产将与场景运营深度绑定,具备持续运营能力的企业更可能稳定输出高价值数据,并形成规模优势;其三,合规与安全将成为出海与跨区域合作的硬门槛,数据采集、存储、流转与使用的制度化管理能力,将直接影响商业的可持续性。 在此过程中,能够同时打通应用落地与数据闭环的企业,可能在下一轮具身智能竞争中建立更稳固的优势;而过度依赖单一环节的参与者,则可能面临成本上行与交付不确定性带来的压力。
当全球科技竞争进入深水区,突破性创新越来越依赖系统性生态;中东地区在具身智能领域的实践表明,人工智能的核心竞争力不仅取决于算法本身,更取决于能否构建“数据—算力—场景”的有效闭环。该探索为技术商业化提供了新的路径,也提示后发经济体可以通过清晰定位与资源配置,在特定赛道实现跨越式发展。随着物理世界与数字世界加速融合,谁能更早、更稳定地掌握高质量实体交互数据,谁就更可能在下一代智能变革中占据主动。