当前位置：首页 > news >正文

火山引擎张鑫：企业Agent落地，我们之前忽视了经营问题

news 2026/6/26 5:31:08

作者 | 高飞

我们已经习惯了用类比来描述眼下这场新工业革命。比如把AI比作蒸汽机或发电机。这个类比自然恰当，但我感觉并不完整。

因为蒸汽机进入工厂之后，改变的不只是机器的转速，还有工厂的组织方式和生产方式。于是，泰勒在1911年出版的《科学管理原理》成了现代管理学的奠基之作。这本书的主旨就是用科学化、标准化的管理方法代替传统的经验管理，以实现劳动生产率的最大化。这套体系被认为是第二次工业革命的必然产物。

今年春节过后，一波Agent热潮之后，Agent落地越来越多，“数字员工”在企业中的占比也越来越高，这也就意味着同一类管理科学问题正在回归。记得黄仁勋在CES 2025上有过一个判断：“技术部门将成为数字劳动力的人力资源部门，以后我们会有生物劳动力和数字劳动力。”这个新人力资源部门，显然，需要新的体系和工具。

FORCE原动力大会期间，我专访了火山引擎副总裁张鑫。他的团队这次发布了一系列Agent产品升级，贯穿其中的理念正是：把Agent当员工来经营。张鑫称之为数字员工的经营体系。

管理领域有一句话叫：你衡量什么，你得到什么。所以，我们先从衡量谈起。

张鑫提到一个调研中的发现：“有企业Agent做得很多，但看token调用量微乎其微，好多属于日抛型Agent，DAU甚至小于等于1。”

日抛型Agent是问题的一面：建了但没人用。另一面同样棘手：有些Agent确实在大量运行，token预算越来越高，但CEO同样说不清这笔投入带来了多少回报。两种情况背后是同一种缺失：企业缺乏衡量Agent价值的手段，进一步投入AI预算也就有了顾虑。

要补上这个缺失，需要先理解企业Agent为什么比个人Agent难这么多。这也是我最先问张鑫的问题。

一套系统，如何匹配全球业务的复杂度

日抛型Agent是一个行业性现象，其中有一个客观背景：OpenClaw龙虾一波热潮之后，过去一年Agent的构建门槛急剧降低。以OpenClaw为标志，vibe coding让零代码配置Agent成为现实。

但是为个人造Agent和为企业造Agent是两码事。

深层的原因在于企业场景本身的复杂度。个人使用AI工具提效，路径很清晰，一个人、一个清晰目标、一堆自己完全有权限的上下文。张鑫说，个人场景下的Agent之所以好用，“本质上就是因为从生产到验证，流程中只有一个人”。

但企业就完全不同了。

“企业中的Agent面对的是一群人，还往往叠加着，一个不那么清晰、甚至需要跨团队去协同制定的目标；一堆陈旧的系统；甚至是从来没有被写出来的隐性规则和知识。”他举了个例子：你去问销售团队“把你Top Sales的最佳卖点告诉我，你是怎么一步一步做的”，这个东西没有人讲清楚过，更不会有人沉淀到文档里。

这引出了张鑫提出的一对关键区分：AI驱动的超级个体和企业的数字员工。超级个体的优势是敏捷，个人拿着工具就能跑。但问题也明显：“员工的流动和流失，也就带走了业务的上下文。”知识跟着人走，不跟着组织走。

这也让我想起微软CEO纳德拉前几天的一场播客，他也把这件事上升到了企业竞争力的高度。他提出“人力资本”和“Token资本”两个概念，核心观点是： “你可以外包一项任务，甚至一份工作，但永远不能外包你的（知识）学习。”

把超级个体的知识转化成组织可沉淀的资产，这是数字员工区别于个人助手的核心要求。但采集知识的方式如果出了偏差，后果同样严重。

这个月有一个刷屏级的AI事件：今年4月起，Meta在美国员工的电脑上安装追踪软件，记录键盘敲击、鼠标移动和屏幕截图来训练AI，超过1500名员工签署了抗议请愿书，Meta CTO Andrew Bosworth承认员工士气“接近20年来最差”。

我想其实这是一个非常简单的心理学机制，对于员工来说，“我把知识贡献出来，会不会被取代？”

彼得·德鲁克1959年提出“知识工人”概念时就观察到：知识工人和体力劳动者需要完全不同的管理方式。体力劳动者可以通过计件和监控来管理，知识工人只能通过设定目标和赋予自主性来激发。监控一个知识工人的键盘敲击，和在流水线上计件是同一种思维。

张鑫在落地实践中的心得和德鲁克方向一致：首先不要上来就向业务人员索取，“先用当前Agent能达到的程度，帮他解决重复繁琐的工作，让他先尝到甜头”。其次，要让知识贡献和个人回报可见可衡量，“你孵化出四个数字员工，它们产出越多，归因到你身上的也越多”。

关键词是归因：人贡献经验形成skills，Agent基于skills产出价值，价值可追溯归因到人。人从执行者升级为Agent的优化者和管理者。

我在采访中做了一个总结：“企业主和员工之间要互相给安全感，老板要给员工安全感，员工要给老板安全感。”

CEO的真实痛点

企业Agent落地的卡点，之前我们讲的是知识和人的问题，这是心理学机制问题。但是，还有经济学机制问题。

对CEO来说，有一个更直接的痛点是钱：Agent的token预算占企业IT支出越来越高，CEO不一定怕花钱，但希望投入和回报能被计算。“我今年投了100万做Agent项目，到底给我带来了多少收益？你们号称用AI，效率到底提升了多少？”张鑫也说，这是管理者问得最多的问题。

过去的Agent平台更多停留在技术管理层面：管权限、管接入、看日志。

但既然Agent成了一种员工，CEO需要的就不仅是技术指标，还有经营指标：产出了多少、节省了多少人效、投入产出比是多少。

张鑫称之为“从Agent管理，上升到数字员工经营”。

“数字员工”这个概念并不新鲜，Copilot时代就在讲。

张鑫自己也意识到这层包袱：“一些企业一说数字员工就‘这事你们说了多少年了’。” 他的回答是：“之所以会有‘说了多少年了’的感觉，就是因为数字员工没有真正在企业内部被量化、被度量、被看见。”

只有在产品上建立了经营体系，能看到招聘、上岗、绩效产出，能做PIP和调优，数字员工才能从一个漂浮的概念变成可被操作的组织单元。

绩效数据还有一层更深的价值。

Agent运行中产生的轨迹、日志、指标和人类反馈，可以回流进Learning Loop，驱动Agent持续自我优化。张鑫用生物学做类比：如果把上下文（Context）比作大脑、Harness比作躯干和四肢，那Learning Loop就是新陈代谢系统。绩效度量不只是给CEO看的报表，它同时也是Agent进化的燃料。丰田生产方式在1970年代提出“改善”（kaizen）的核心理念：不追求一步到位的完美设计，而是通过持续的小幅改进和现场反馈形成闭环。Agent的Learning Loop本质上就是一种数字化的kaizen。

不过，Learning Loop中最具想象力的强化学习方向目前也最难落地。难点在于奖励函数，有标准答案的客观题好打分，但企业里大量任务是主观的、模糊的。“你在这个场景训好了它能判断，下一个场景怎么办？”张鑫说，“我们自己的强化学习还在路上，大家都在路上。”

从构建到经营：四个产品，两层逻辑

无论是心理学机制，还是经济学机制，有了体系，还需要工具。从知识沉淀到绩效度量再到持续迭代，这套经营体系都需要一整套产品来承载。

火山引擎这次在Agent开发和运营上，带来了几个重要产品的全新升级，其中。TRAE，大家可能相对熟悉。

TRAE最初面向程序员，是一个coding IDE，理论上非研发人员也能用。但实际上，非研发人员一打开满屏代码，“反而不符合他的taste”，张鑫说。所以TRAE WORK作为独立端发布，主界面是自然语言交互，面向更广泛的日常工作场景。

HiAgent和AgentSphere则构成另一层逻辑，更和我们今天的主旨有关。

当企业自有Agent数量达到数百上千，IT部门需要一套底座来统一管理这些Agent的开发、运行和持续迭代，这是HiAgent的角色，它管的是Agent的技术生命周期。而AgentSphere就是HiAgent之上的经营视角：统一调度、绩效看板、价值度量。AgentSphere的定位是“数字员工派遣站”。

AgentSphere作为“数字员工派遣站”，将数字员工的生命周期拆解为招聘、上岗、进化、退岗四个阶段，配套全局概览、业务产出、产物评分、投入成本四张看板。“如果绩效好，像人类员工一样可能有promotion，在Agent世界里可能是分配更多的tokens。如果绩效不好，人可能要走PIP，Agent里面可能就是通过数据回流去迭代。”张鑫说。

对比Anthropic只有Claude Code加Cowork，OpenAI言必称CodeX，火山引擎的构建工具选择显得稍显复杂。

张鑫的解释是：不同角色面对同一个能力时，需要完全不同的界面。

他还用编程语言的多产品并存演进来做类比：“最早有了C语言，为什么后来还有C++、Python、Go？我们大概能讲清楚每个语言更擅长什么，但Python就真不能用来写其他的应用吗？也未必。”

他也承认多产品带来了解释成本，“在go-to-market层面我们还需要把定位讲得更清楚”。但他个人的信条是：“AI时代技术演化太快了，我不敢太早下定义。希望给用户一定的选择权，让用户投票。”

多产品策略的背后还有一个技术层面的原因：Agent和模型在现阶段无法完全解耦。“OpenClaw之所以能成功，是因为模型达到了一定的tipping point。把OpenClaw去适配一个弱模型，是不奏效的。”

但当模型趋于商品化、能力趋于稳定以后，解耦有可能实现，“它可能会变成今天的容器，能够更好地做标准化接口”。

总之，从构建到绩效，火山引擎提供的是一整套工具。

Agent的组织方式可能和人不同

在访谈中，我和张鑫还聊到Agent的组织行为学问题。

大家知道，在人类世界，专业分工是一切经济行为的基础。人在组织内的分工方式已经很成熟了，Agent会沿用人类体系吗？

结论是不一定。我们先说比较类似的。

张鑫认为Agent至少可以从两个维度来细分：一种是稳态Agent，处理规则明确、准确性要求高的流程性任务；另一种是敏态Agent，应对开放性、探索性的场景。