豆包手机的成功不光是一种新方案的探索,更是智能助手未来的风向标

最近有个手机助手挺火,叫豆包,它能在安卓手机、Chrome浏览器还有PC桌面上搞跨端自动化,本来这就已经很厉害了,结果还拿到了千万级的投资。这玩意儿是张志勇和单文榜搞出来的,他俩以前是做硬件的,现在搞起了AI和AgentZeroFlow。有了这个自研的技术,再加上国产的大模型,豆包就变得像人一样会操作屏幕,能点外卖、买电影票。 跟市面上其他工具比起来,豆包走的路不太一样。它跟手机厂商的关系很深,能拿到高权限,所以不用让用户一步步去授权APP。虽然用起来方便了点,但也招来了一些APP的抵制。好在它用的是Android里的AccessibilityService这个权限,是给视障人士用的系统辅助功能。只要拿到这个权限,Agent就能像看东西一样读懂屏幕,再模拟人手去点击、滑动。 不过开发的时候也没少受罪。张志勇说网页上老是有验证步骤或者隐藏元素,根本不让你看懂;有的网站还总弹广告或者自动跳转,这也很影响识别准确性。 关于未来的竞争,张志勇倒是挺有信心的。因为大厂的生态太封闭了,就算他们也有类似的技术也难做到跨平台。所以他们借用了OpenClaw的开源理念,在安全性和便捷性上下了不少功夫。 现在的ZeroFlow真的很容易上手,只要在浏览器注册个账号就能用。它不光能帮忙写代码编程,还能用到财务分析或者运营流程里去。说白了就是干那些重复性的活、有逻辑的活儿。 张志勇他们希望这个技术能把人从繁琐的工作里解放出来,大家都能去做更有创意的事儿。豆包手机的成功不光是一种新方案的探索,更是智能助手未来的风向标。以后它肯定还会继续升级,给咱们的生活带来更多便利。