火山引擎张鑫:企业Agent落地,我们之前忽视了经营问题
作者 | 高 飞
我们已经习惯了用类比来描述眼下这场新工业革命。比如把AI比作蒸汽机或发电机。这个类比自然恰当,但我感觉并不完整。
因为蒸汽机进入工厂之后,改变的不只是机器的转速,还有工厂的组织方式和生产方式。于是,泰勒在1911年出版的《科学管理原理》成了现代管理学的奠基之作。这本书的主旨就是用科学化、标准化的管理方法代替传统的经验管理,以实现劳动生产率的最大化。这套体系被认为是第二次工业革命的必然产物。
今年春节过后,一波Agent热潮之后,Agent落地越来越多,“数字员工”在企业中的占比也越来越高,这也就意味着同一类管理科学问题正在回归。记得黄仁勋在CES 2025上有过一个判断:“技术部门将成为数字劳动力的人力资源部门,以后我们会有生物劳动力和数字劳动力。”这个新人力资源部门,显然,需要新的体系和工具。
FORCE原动力大会期间,我专访了火山引擎副总裁张鑫。他的团队这次发布了一系列Agent产品升级,贯穿其中的理念正是:把Agent当员工来经营。张鑫称之为数字员工的经营体系。
管理领域有一句话叫:你衡量什么,你得到什么。所以,我们先从衡量谈起。
张鑫提到一个调研中的发现:“有企业Agent做得很多,但看token调用量微乎其微,好多属于日抛型Agent,DAU甚至小于等于1。”
日抛型Agent是问题的一面:建了但没人用。另一面同样棘手:有些Agent确实在大量运行,token预算越来越高,但CEO同样说不清这笔投入带来了多少回报。两种情况背后是同一种缺失:企业缺乏衡量Agent价值的手段,进一步投入AI预算也就有了顾虑。
要补上这个缺失,需要先理解企业Agent为什么比个人Agent难这么多。这也是我最先问张鑫的问题。
一套系统,如何匹配全球业务的复杂度
日抛型Agent是一个行业性现象,其中有一个客观背景:OpenClaw龙虾一波热潮之后,过去一年Agent的构建门槛急剧降低。以OpenClaw为标志,vibe coding让零代码配置Agent成为现实。
但是为个人造Agent和为企业造Agent是两码事。
深层的原因在于企业场景本身的复杂度。个人使用AI工具提效,路径很清晰,一个人、一个清晰目标、一堆自己完全有权限的上下文。张鑫说,个人场景下的Agent之所以好用,“本质上就是因为从生产到验证,流程中只有一个人”。
但企业就完全不同了。
“企业中的Agent面对的是一群人,还往往叠加着,一个不那么清晰、甚至需要跨团队去协同制定的目标;一堆陈旧的系统;甚至是从来没有被写出来的隐性规则和知识。”他举了个例子:你去问销售团队“把你Top Sales的最佳卖点告诉我,你是怎么一步一步做的”,这个东西没有人讲清楚过,更不会有人沉淀到文档里。
这引出了张鑫提出的一对关键区分:AI驱动的超级个体和企业的数字员工。超级个体的优势是敏捷,个人拿着工具就能跑。但问题也明显:“员工的流动和流失,也就带走了业务的上下文。”知识跟着人走,不跟着组织走。
这也让我想起微软CEO纳德拉前几天的一场播客,他也把这件事上升到了企业竞争力的高度。他提出“人力资本”和“Token资本”两个概念,核心观点是: “你可以外包一项任务,甚至一份工作,但永远不能外包你的(知识)学习。”
把超级个体的知识转化成组织可沉淀的资产,这是数字员工区别于个人助手的核心要求。但采集知识的方式如果出了偏差,后果同样严重。
这个月有一个刷屏级的AI事件:今年4月起,Meta在美国员工的电脑上安装追踪软件,记录键盘敲击、鼠标移动和屏幕截图来训练AI,超过1500名员工签署了抗议请愿书,Meta CTO Andrew Bosworth承认员工士气“接近20年来最差”。
我想其实这是一个非常简单的心理学机制,对于员工来说,“我把知识贡献出来,会不会被取代?”
彼得·德鲁克1959年提出“知识工人”概念时就观察到:知识工人和体力劳动者需要完全不同的管理方式。体力劳动者可以通过计件和监控来管理,知识工人只能通过设定目标和赋予自主性来激发。监控一个知识工人的键盘敲击,和在流水线上计件是同一种思维。
张鑫在落地实践中的心得和德鲁克方向一致:首先不要上来就向业务人员索取,“先用当前Agent能达到的程度,帮他解决重复繁琐的工作,让他先尝到甜头”。其次,要让知识贡献和个人回报可见可衡量,“你孵化出四个数字员工,它们产出越多,归因到你身上的也越多”。
关键词是归因:人贡献经验形成skills,Agent基于skills产出价值,价值可追溯归因到人。人从执行者升级为Agent的优化者和管理者。
我在采访中做了一个总结:“企业主和员工之间要互相给安全感,老板要给员工安全感,员工要给老板安全感。”
CEO的真实痛点
企业Agent落地的卡点,之前我们讲的是知识和人的问题,这是心理学机制问题。但是,还有经济学机制问题。
对CEO来说,有一个更直接的痛点是钱:Agent的token预算占企业IT支出越来越高,CEO不一定怕花钱,但希望投入和回报能被计算。“我今年投了100万做Agent项目,到底给我带来了多少收益?你们号称用AI,效率到底提升了多少?”张鑫也说,这是管理者问得最多的问题。
过去的Agent平台更多停留在技术管理层面:管权限、管接入、看日志。
但既然Agent成了一种员工,CEO需要的就不仅是技术指标,还有经营指标:产出了多少、节省了多少人效、投入产出比是多少。
张鑫称之为“从Agent管理,上升到数字员工经营”。
“数字员工”这个概念并不新鲜,Copilot时代就在讲。
张鑫自己也意识到这层包袱:“一些企业一说数字员工就‘这事你们说了多少年了’。” 他的回答是:“之所以会有‘说了多少年了’的感觉,就是因为数字员工没有真正在企业内部被量化、被度量、被看见。”
只有在产品上建立了经营体系,能看到招聘、上岗、绩效产出,能做PIP和调优,数字员工才能从一个漂浮的概念变成可被操作的组织单元。
绩效数据还有一层更深的价值。
Agent运行中产生的轨迹、日志、指标和人类反馈,可以回流进Learning Loop,驱动Agent持续自我优化。张鑫用生物学做类比:如果把上下文(Context)比作大脑、Harness比作躯干和四肢,那Learning Loop就是新陈代谢系统。绩效度量不只是给CEO看的报表,它同时也是Agent进化的燃料。丰田生产方式在1970年代提出“改善”(kaizen)的核心理念:不追求一步到位的完美设计,而是通过持续的小幅改进和现场反馈形成闭环。Agent的Learning Loop本质上就是一种数字化的kaizen。
不过,Learning Loop中最具想象力的强化学习方向目前也最难落地。难点在于奖励函数,有标准答案的客观题好打分,但企业里大量任务是主观的、模糊的。“你在这个场景训好了它能判断,下一个场景怎么办?”张鑫说,“我们自己的强化学习还在路上,大家都在路上。”
从构建到经营:四个产品,两层逻辑
无论是心理学机制,还是经济学机制,有了体系,还需要工具。从知识沉淀到绩效度量再到持续迭代,这套经营体系都需要一整套产品来承载。
火山引擎这次在Agent开发和运营上,带来了几个重要产品的全新升级,其中。TRAE,大家可能相对熟悉。
TRAE最初面向程序员,是一个coding IDE,理论上非研发人员也能用。但实际上,非研发人员一打开满屏代码,“反而不符合他的taste”,张鑫说。所以TRAE WORK作为独立端发布,主界面是自然语言交互,面向更广泛的日常工作场景。
HiAgent和AgentSphere则构成另一层逻辑,更和我们今天的主旨有关。
当企业自有Agent数量达到数百上千,IT部门需要一套底座来统一管理这些Agent的开发、运行和持续迭代,这是HiAgent的角色,它管的是Agent的技术生命周期。而AgentSphere就是HiAgent之上的经营视角:统一调度、绩效看板、价值度量。AgentSphere的定位是“数字员工派遣站”。
AgentSphere作为“数字员工派遣站”,将数字员工的生命周期拆解为招聘、上岗、进化、退岗四个阶段,配套全局概览、业务产出、产物评分、投入成本四张看板。“如果绩效好,像人类员工一样可能有promotion,在Agent世界里可能是分配更多的tokens。如果绩效不好,人可能要走PIP,Agent里面可能就是通过数据回流去迭代。”张鑫说。
对比Anthropic只有Claude Code加Cowork,OpenAI言必称CodeX,火山引擎的构建工具选择显得稍显复杂。
张鑫的解释是:不同角色面对同一个能力时,需要完全不同的界面。
他还用编程语言的多产品并存演进来做类比:“最早有了C语言,为什么后来还有C++、Python、Go?我们大概能讲清楚每个语言更擅长什么,但Python就真不能用来写其他的应用吗?也未必。”
他也承认多产品带来了解释成本,“在go-to-market层面我们还需要把定位讲得更清楚”。但他个人的信条是:“AI时代技术演化太快了,我不敢太早下定义。希望给用户一定的选择权,让用户投票。”
多产品策略的背后还有一个技术层面的原因:Agent和模型在现阶段无法完全解耦。“OpenClaw之所以能成功,是因为模型达到了一定的tipping point。把OpenClaw去适配一个弱模型,是不奏效的。”
但当模型趋于商品化、能力趋于稳定以后,解耦有可能实现,“它可能会变成今天的容器,能够更好地做标准化接口”。
总之,从构建到绩效,火山引擎提供的是一整套工具。
Agent的组织方式可能和人不同
在访谈中,我和张鑫还聊到Agent的组织行为学问题。
大家知道,在人类世界,专业分工是一切经济行为的基础。人在组织内的分工方式已经很成熟了,Agent会沿用人类体系吗?
结论是不一定。我们先说比较类似的。
张鑫认为Agent至少可以从两个维度来细分:一种是稳态Agent,处理规则明确、准确性要求高的流程性任务;另一种是敏态Agent,应对开放性、探索性的场景。
正所谓,“不要用Agent战略的勤奋掩盖战术的懒惰”,好像一个企业说“我在落地Agent”就万事大吉,实际上稳态和敏态需要完全不同的建设路径。说类似,是因为在波士顿矩阵中,现金牛、明星和问号业务,就需要不同的团队类型。
再说区别比较大的,这里我们还是要回到知识这个话题。
人的知识边界是窄的,所以人类组织需要按专业分工。但模型对知识的吸取能力远超个人,未必需要照搬横向BU制。
我们走访企业的观察是:企业本能地按职能给Agent分岗,营销Agent、客服Agent、HR Agent,但这样做的实质是在用提示词约束模型能力,客观上拆出了大量功能重叠的Agent。
张鑫也用了一个比喻来描述这个状况:这是“每个萝卜都拆一个坑。”他认为,真正要做的是“组织去适配新的AI能力,而不是AI适配现有组织”。
他用自己团队的变化做例证:原来研发按前端、后端、SRE、QA、架构师、产品经理划分岗位,“现在围绕你要做的产品,用一个不大的团队,借助Agent端到端完成从产品设计到coding各个环节。” TRAE团队94%的代码已经由AI生成。横向职能在收敛,纵向深度在增加。
这意味着在一个Agent充分参与的组织里,IT部门和业务部门的关系也会重构。IT负责保证Agent基础设施的稳定运行和安全围栏,业务部门基于这些脚手架自行构建和迭代面向场景的Agent。两者从原来需求-排期-交付的串行关系,转向基础设施与应用的纵向协同。
管理科学用了一个世纪从泰勒走到丰田,但科学就意味着没有最终的标准答案。
每一次生产力工具的代际更替,都催生出上一代管理框架回答不了的新问题。张鑫说强化学习“还在路上,大家都在路上”,组织适配也才刚有雏形。Agent的经营体系不会有一个终极形态,它会和Agent的能力一起演化,和使用它的组织一起变形。
