谷歌推出Gemini手机端任务自动化功能,外卖等高频场景率先试水“代操作”能力

全球移动互联网发展趋于成熟的背景下,智能终端的能力边界正迎来新的突破。国际科技公司谷歌最新推出的任务自动化系统,首次在Pixel和Galaxy系列旗舰机型上打通了从语音指令到实际操作的完整流程。用户只需用自然语言下达指令,系统便可自动完成应用启动、界面点击、表单填写等多项操作,进而实现外卖下单等服务需求。技术分析认为,该系统的核心在于突破了传统语音助手偏重“查询与回答”的限制,通过深度学习实现复杂任务的拆解与执行。实测显示,在DoorDash等较为标准化的应用场景中,系统流程完成率可达90%以上。尽管目前约9分钟的执行时长仍慢于人工,但其可在后台持续运行,为用户带来“边做边办”的多任务体验。行业观察人士指出,这次迭代主要由三上因素推动:一是移动芯片算力明显提高,为实时界面识别提供基础;二是Android较开放的API生态降低了能力落地门槛;三是疫情后数字服务需求上升,“减少手动操作、提升无接触体验”成为明确的市场诉求。Strategy Analytics数据显示,2023年全球自动化服务市场规模约47亿美元,年复合增长率保持在28%以上。需要注意的是,该技术仍存在明显限制。目前仅支持Uber、DoorDash等不足10款应用,并在支付等环节面临安全验证与合规挑战。更关键的是,在非标准化界面中识别错误率高达32%,成为扩展应用范围的主要障碍。对此,谷歌工程团队表示正研发基于计算机视觉的增强识别算法,预计到2025年可将适配范围提升至主流应用的60%。市场层面,科技公司已开启新一轮竞赛。苹果据称正在iOS中测试类似能力,亚马逊则依托Alexa生态推进智能家居自动化。专家预测,随着2026年5G毫米波更普及,移动端自动化服务有望迈向千亿级市场,并可能改写应用商店的分发与使用方式。中国信息通信研究院有关专家提醒,这类技术在提升效率的同时,也会放大数据与权限风险,建议推动跨国技术标准协同,避免生态割裂与安全短板。

从“能说会答”到“能办成事”,移动端助手的升级不只是新增功能,更在重塑操作入口、服务组织方式与安全边界。新能力带来便利的同时,也对效率、可靠性与风险控制提出更高要求。能否在扩展场景与守住安全底线之间取得平衡,将决定“代办式服务”是短期噱头,还是下一轮智能终端体验变革的起点。