谷歌推出Gemini手机端任务自动化功能，外卖等高频场景率先试水“代操作”能力

全球移动互联网发展趋于成熟的背景下，智能终端的能力边界正迎来新的突破。国际科技公司谷歌最新推出的任务自动化系统，首次在Pixel和Galaxy系列旗舰机型上打通了从语音指令到实际操作的完整流程。用户只需用自然语言下达指令，系统便可自动完成应用启动、界面点击、表单填写等多项操作，进而实现外卖下单等服务需求。技术分析认为，该系统的核心在于突破了传统语音助手偏重“查询与回答”的限制，通过深度学习实现复杂任务的拆解与执行。实测显示，在DoorDash等较为标准化的应用场景中，系统流程完成率可达90%以上。尽管目前约9分钟的执行时长仍慢于人工，但其可在后台持续运行，为用户带来“边做边办”的多任务体验。行业观察人士指出，这次迭代主要由三上因素推动：一是移动芯片算力明显提高，为实时界面识别提供基础；二是Android较开放的API生态降低了能力落地门槛；三是疫情后数字服务需求上升，“减少手动操作、提升无接触体验”成为明确的市场诉求。Strategy Analytics数据显示，2023年全球自动化服务市场规模约47亿美元，年复合增长率保持在28%以上。需要注意的是，该技术仍存在明显限制。目前仅支持Uber、DoorDash等不足10款应用，并在支付等环节面临安全验证与合规挑战。更关键的是，在非标准化界面中识别错误率高达32%，成为扩展应用范围的主要障碍。对此，谷歌工程团队表示正研发基于计算机视觉的增强识别算法，预计到2025年可将适配范围提升至主流应用的60%。市场层面，科技公司已开启新一轮竞赛。苹果据称正在iOS中测试类似能力，亚马逊则依托Alexa生态推进智能家居自动化。专家预测，随着2026年5G毫米波更普及，移动端自动化服务有望迈向千亿级市场，并可能改写应用商店的分发与使用方式。中国信息通信研究院有关专家提醒，这类技术在提升效率的同时，也会放大数据与权限风险，建议推动跨国技术标准协同，避免生态割裂与安全短板。

从“能说会答”到“能办成事”，移动端助手的升级不只是新增功能，更在重塑操作入口、服务组织方式与安全边界。新能力带来便利的同时，也对效率、可靠性与风险控制提出更高要求。能否在扩展场景与守住安全底线之间取得平衡，将决定“代办式服务”是短期噱头，还是下一轮智能终端体验变革的起点。