很多 SaaS 厂商现在还在用一种很轻的方式理解企业级通用智能体。
觉得无非就是:
- 更强一点的助手
- 更聪明一点的 Copilot
- 更会操作软件一点的 Agent
但我越来越觉得,这个理解已经落后了。
真正值得警惕的变化,不是 Agent 更聪明了。
而是:
AI 正在成为软件的新用户。
一旦你接受这一点,整个行业的竞争逻辑就会立刻变样。
因为这意味着,企业软件接下来要解决的核心问题,不再只是“怎么把页面做得更好”,而是:
怎么把自己的产品重写成一套既能服务人类员工,也能服务 AI 员工的工作基础设施。
欢迎回到大基建时代。
这次的“大基建”,不是云资源,不是数据库,不是单纯的算力。
而是:
- 面向 AI 的调用接口
- 面向任务的工作对象
- 可托付的执行链路
- 可审计的治理机制
- 可沉淀的组织资产
WorkBuddy、Cowork、悟空、Aily 看起来都在做企业级通用智能体。
但它们真正争的,已经不是一个 Agent 产品。
它们争的是:
谁会成为 AI 时代新的 Office 套件,以及未来企业里所有 SaaS 和传统软件的总入口。
一、旧共识错了:企业级通用智能体不是“新一代助手”
今天行业里一个非常普遍的误判,是把企业级通用智能体理解成“更高级的助手”。
这个判断的问题在于,它仍然默认:
人是主用户,AI 只是辅助能力。
所以很多产品讨论最后都会滑向这些问题:
- 谁更会聊天
- 谁更像真人
- 谁更会总结文档
- 谁更能操作电脑
这些问题都不重要吗?
不是。
但它们都不是主问题。
真正的主问题是:
当 AI 开始成为软件的真实用户之后,企业内新的工作界面到底会长成什么样。
过去的软件世界,是人打开系统,理解界面,填写表单,点击按钮,再跨系统搬运信息。
接下来越来越多的工作,会变成:
- 人交付一个目标
- AI 理解任务
- AI 去调用多个系统
- AI 产出结果并回写状态
- 人只负责确认、审批和兜底
也就是说:
未来企业软件的真正用户,很多时候不会先是人,而会先是 AI。
一旦你接受这一点,企业级通用智能体这件事就不再是“助手升级”。
它本质上是在重写:
企业软件的入口结构。
二、所以它们真正争的,不是功能,而是工作总入口
这也是为什么我会把 WorkBuddy、Cowork、悟空、Aily 放在一起看。
它们当然看起来不一样。
有的更像桌面执行体,有的更像协作界面,有的更像组织级办公入口,有的更像平台。
但如果只盯着表层功能差异,你会把问题看浅。
它们真正共同争夺的,其实是同一个位置:
AI 时代企业内部的默认工作总入口。
过去这个入口是谁?
- 文档
- 邮件
- IM
- 日历
- 审批系统
也就是传统意义上的 Office 套件和办公入口。
未来这个入口会逐渐变成什么?
不是某一个 SaaS 页面。
也不是某一个聊天窗口。
而是一套能够同时完成这些动作的 AI 工作套件:
- 接收任务
- 装配上下文
- 调用软件
- 执行流程
- 回写结果
- 沉淀资产
所以这波竞争的本质不是:
“谁先做出一个更像人的助手。”
而是:
谁先做出一个企业真正敢交任务的工作套件。
三、四条路线,看起来不同,本质上都在逼近同一个位置
先看腾讯 WorkBuddy。
它代表的是一条很明确的路线:
从电脑执行体出发,把电脑本身变成 AI 的工作界面。
这条路线最强的地方是执行感。
它会让人第一次非常直观地意识到,AI 不是只会说,而是真的可以在一台电脑里替你把事情做出来。
但它的边界也很清楚。
它更像桌面级工作套件,而不是完整的企业级工作套件。
它解决的是“AI 怎么坐进一台电脑”,还没有天然解决“企业怎么正式把任务交给它”。
再看 Anthropic 的 Cowork。
它背后的直觉不是“让 AI 坐进电脑”,而是:
让 AI 先成为知识工作流中的协作主体。
这条线更适合先切进分析、写作、整理、研究、共创这些场景。
它占的是知识工作的工作界面。
但它的问题也很明显:
协作感并不自动等于执行系统。
能一起工作,不代表企业就敢把任务正式托付给你。
再看钉钉的 悟空。
它最有价值的不是某个功能点,而是它所站的位置。
钉钉天然占着:
- 组织协同入口
- 审批入口
- 消息入口
- 任务入口
所以它争的不是“会不会被打开”,而是“能不能把既有办公入口升级成 AI 工作入口”。
这条路线离企业最近。
但同样,有入口不代表有系统。
入口能让你更快进场,但不能自动解决托付、治理、透明和资产沉淀。
最后看飞书 Aily。
如果说前三条线分别在争桌面、协作和组织入口,那 Aily 更像是在直接争下一代工作平台本身。
它想做的不是单点 Agent,而是:
一套承接企业知识、业务系统、任务触发、执行调度和多端发布的 AI 工作平台。
说白了,Aily 已经不是“一个 Agent”。
它更像 AI 时代 Office 套件的平台版。
这四条路线当然长得不一样。
但它们共同指向的,其实都是同一个位置:
企业内新的工作总入口。
四、为什么这件事本质上是“Office 套件重做”
很多人一听到 Office 套件,会觉得这是个有点老的词。
但恰恰因为这个词老,它反而准确。
因为 Office 套件从来都不是某一个单独软件。
它本质上是一组基础工作界面。
人类员工几乎所有正式工作,最后都会经过它:
- 接收信息
- 处理内容
- 协同沟通
- 安排时间
- 留下记录
现在企业级通用智能体要取代的,不是某一个具体软件。
它要取代的,是:
人直接操作这一组工作界面的方式。
所以这波变化最深的一层,不是“Agent 变强了”。
而是:
Office 套件这件事本身,正在从服务人类员工,变成同时服务人类员工和 AI 员工。
这也是为什么我会说,SaaS 厂商们欢迎回到大基建时代。
因为过去十几年 SaaS 的主逻辑,是围绕页面、表单、流程、角色去构建应用层价值。
接下来,行业会被迫重新回到底层问题:
- AI 怎么接任务
- AI 怎么拿上下文
- AI 怎么调用能力
- AI 怎么被审计
- AI 怎么被治理
- AI 怎么沉淀结果
这就是基础设施问题。
五、另一个信号也很关键:软件正在重新回到 CLI
还有一个容易被低估的趋势,也在印证同一件事:
软件正在重新回到 CLI。
这件事听起来像开发者话题,其实不是。
它背后真正的含义是:
软件开始为 AI 这种新用户,重新发明调用界面。
为什么 CLI 会回来?
因为对 AI 来说,CLI 比 GUI 更接近天然工作语言。
它有几个极其关键的优势:
-
意图压缩更直接 一个命令本身就是被压缩后的任务表达。
-
上下文消耗更低 读取命令、参数和结果,比理解整套页面结构便宜得多。
-
边界更清楚 输入、执行、输出、错误码、日志,天然适合 Agent 判断下一步。
-
更适合自动化和编排 一旦能力 CLI 化,它离脚本化、批处理、Agent 化就只差一步。
所以 CLI 不是复古。
它更像:
AI 时代的一种高密度工作接口。
这也意味着,未来很多 AI 时代的 Office 套件,表面上可能是对话界面,底层却越来越像命令中枢。
当然,CLI 也不是终局。
它不是要替代 API、数据库调用或者 MCP。
更准确地说,它是这几者之上的一层高效调用外壳:
- 对人来说,比直接调 API 更友好
- 对 AI 来说,比 GUI 更高效
- 对系统来说,最后仍然落在真实的数据和服务调用上
所以真正的变化不是“软件又回到了终端”。
而是:
软件开始优先为 AI 设计调用界面,再为人补上一层可视化外壳。
六、企业真正缺的,不是“更聪明”,而是“可托付”
这也是为什么我现在越来越不关心“谁更像助手”。
因为企业真正不敢把任务交给 AI,通常不是因为 AI 不够聪明。
而是因为它还不具备以下几种能力:
-
任务化 企业交付的不是一句 prompt,而是一项任务。任务有目标、有约束、有截止时间、有责任边界。
-
可观察 企业不能接受黑盒。它必须知道 AI 做到了哪一步、为什么卡住、为什么失败。
-
可治理 哪些动作能做,哪些动作不能做,什么时候需要审批,必须是内建能力。
-
可资产化 企业要的不是一次性回答,而是结果能沉淀成资产,复用成能力,回流成组织经验。
-
可迁移 企业不会满足于一个“单点会干活”的 Agent。它一定希望能力可以跨部门、跨任务、跨场景迁移。
说白了:
企业级通用智能体最大的门槛,不是智能,而是托付。
这也是为什么我会觉得,接下来最值钱的不是“更聪明的回答”,而是“更可托付的工作套件”。
七、最后一句话
如果要我用一句话总结我对这波产品的判断,我会这么说:
WorkBuddy、Cowork、悟空、Aily 看起来都在做企业级通用智能体,但它们真正争的,不是 Agent,而是 AI 时代的 Office 套件,以及未来企业所有软件的总入口。
而这场竞争真正抬起来的,也不是应用层的小创新。
而是一个更大的命题:
当软件的用户开始从人转向 AI,SaaS 就不得不重新变回基础设施。
所以,面向 AI 员工的基础设施,会成为 2026 年企业软件最关键的话题之一。
做了,不一定立刻活。
但如果你始终不能被 AI 调用、编排、托付和治理,那你大概率会慢慢退出下一代企业软件的主链路。