问题:从“能说会写”到“能办成事”仍有断层。长期以来,大模型文本生成、代码辅助等表现亮眼,但在企业日常工作中,真正耗时的往往是跨系统、跨软件的流程操作,比如整理报表、录入数据、生成并分发邮件等。这类任务不仅要理解意图,还要在不同应用间切换,调用接口或直接进行界面操作。如何让模型把“理解”真正转化为“执行”,是智能体落地的关键环节。 原因:企业对“代理型智能体”的需求升温,推动厂商加快迭代。Anthropic介绍,此次推出的“计算机使用”(Computer Use)能力,可在用户许可下识别屏幕内容,并模拟点击、拖拽、输入等操作;“调度”(Dispatch)则侧重跨设备、跨时段的任务编排与交付。例如用户在移动端下达“整理数据并发送邮件”的指令,系统可在电脑端完成表格生成、邮件撰写以及文件落地等步骤。业内分析认为,一上,企业数字化沉淀了大量“流程型工作”,自动化与提效需求强烈;另一方面,部分本地软件或遗留系统缺少标准接口,仅靠API难以打通,促使厂商探索“像人一样操作界面”方案。同时,开源智能体框架与同类产品密集出现,竞争加剧,也倒逼头部企业工具链、任务编排与稳定性上加速补齐。 影响:智能体能力扩展将影响办公方式与软件生态。其一,提高生产效率。模型不只是生成内容,还能把内容投递到正确的位置,并以符合要求的格式完成提交,减少重复性人工操作。其二,改变人机协作方式。跨设备调度让“随时下达、后台执行、到岗即用”更可行,办公不再局限于固定工位。其三,推动软件服务策略调整。系统执行任务时通常优先调用具备官方接口的平台与服务以提升稳定性,接口缺失时再以屏幕识别和界面操作补位,这将促使更多应用开放标准化接口,并提升被自动化工具安全调用的能力。其四,带来新的合规与责任议题。模型获得“操作权限”后,一旦误删、误发或被诱导执行不当指令,影响可能从“答错一句话”升级为“做错一件事”,风险更外溢。 对策:以“最小权限+可追溯”为原则建立防护体系。Anthropic表示,该能力仍处于预览阶段,并在权限控制上设置多项限制:访问新应用需用户明确同意;对金融、加密资产等高敏感场景默认限制;任务执行中用户可随时中止。业内人士认为,面向更广泛的企业应用,还需在三上加强治理:其一,权限分级与隔离,按岗位和数据域设置可执行动作清单,避免“一键全权”。其二,安全审计与可追溯,记录关键操作链路、输入输出与授权痕迹,便于复盘与界定责任。其三,抵御诱导与注入攻击,通过内容过滤、上下文隔离、关键操作二次确认等机制,降低被恶意指令“借壳”操控的概率。同时,企业应完善培训与流程,明确哪些任务可交由智能体自动完成,哪些必须人工复核。 前景:从“能用”走向“可信赖”仍需时间与标准。随着模型逐步具备规划、调用工具、界面操作和结果交付的完整链路能力,智能体有望在客服运营、财务共享、研发运维、行政人事等场景形成规模化应用。但进入关键业务环节仍需跨过稳定性、可解释性与合规性门槛。未来一段时间,行业或将围绕三条主线加速竞争:一是更精细的任务分解与自检纠错能力,减少反复尝试和误操作;二是与主流办公套件、协作平台、企业管理系统更深度的标准化对接;三是形成可落地的安全与评测规范,用统一指标衡量“可控、可查、可管”的程度。可以预见,谁能更好平衡效率与安全,谁就更可能在企业级市场获得长期优势。
从“能生成”迈向“能执行”,是大模型应用走向实用的重要一步。效率提升的同时,安全、合规与责任边界也被推到更前台。只有在可用性与可控性之间建立更稳固的平衡,并推动规则、产品与管理协同完善,智能体才能成为更可信赖的数字化助手,为产业升级与社会运行提供更可持续的支撑。