当前位置: 首页 > news >正文

我把小某薯运营做成了一个Agent系统

先说结论

TokenFactory的"小某薯运营专家"不是一个"能写小红书笔记的ChatGPT"。

它是一个由6个专业Agent组成的协作系统,运行在TokenFactory的Harness编排层之上,通过A2A协议实现Agent间通信,由TokenRouter做智能路由决策。

整个系统架构如下:

为什么是6个Agent,而不是1个?

这是很多工程师的第一反应——"一个大Prompt不就完了吗?"

不行。原因如下:

单Agent的三个致命问题

问题具体表现多Agent如何解决
上下文爆炸单Agent需要同时理解品牌调性、竞品动态、平台规则、达人数据……上下文窗口很快爆掉每个Agent只处理自己领域的任务,上下文精简聚焦
职责混乱单Agent容易"写着写着开始分析数据",流程不可控L3执行编排强制每个Agent只做自己的事,不允许跨职责操作
错误传播单Agent如果竞品分析出错,后续所有内容都会基于错误信息生产竞品监控Agent的输出经过L5独立评估,错误不会传播到内容生成Agent

A2A协同:一篇种草笔记的诞生过程

来看一个完整的协作流程——品牌要推一款"熬夜修复精华":

Step 1:竞品监控Agent检测到竞品本周各有3篇新品笔记,关键词集中在"熬夜肌"、"急救"——通过A2A发给选题挖掘Agent

Step 2:选题挖掘Agent结合热点+竞品数据+品牌素材库,输出选题:

  • 《熬夜到凌晨3点,第二天还被夸皮肤好?》
  • 《打工人熬夜自救指南:这瓶精华我回购了5次》
  • 《测评了10款熬夜精华,只有这瓶让我真香》

Step 3:内容生成Agent根据选题+品牌素材库+平台调性模板,生成3篇笔记的完整文案(标题+正文+标签+封面建议)

Step 4:合规审核Agent(L5+L6)逐篇扫描:

  • 第1篇:标题含"好"非极限词→通过;功效宣称"修复"在备案中→通过
  • 第2篇:文案含"回购5次"→触发L6真实性校验→需品牌确认销量数据
  • 第3篇:"测评10款"需确认是否真的做过竞品对比→标记风险

Step 5:平台发布Agent将审核通过的笔记适配各平台格式:

小某薯:种草口吻+emoji+话题标签

Step 6:数据复盘Agent在发布后72小时内追踪各笔记的曝光/互动/收藏数据,自动生成周报,并反馈到选题挖掘Agent优化下一周的内容策略

TokenRouter路由策略Benchmark

这是工程师最关心的——路由策略到底能省多少Token、质量有没有降?

跑了一周的实测数据:

路由策略周Token消耗内容质量(人工抽检评分/10分)高性能模型调用占比
全部走高性能模型112万Token8.3分100%
智能路由(TokenRouter)41万Token8.1分28%
变化↓63.4%≈持平路由精准度验证

部署踩坑实录

坑1:品牌调性漂移

  • 现象:连续生成3篇笔记后,风格开始偏离品牌预设调性
  • 原因:L1上下文窗口被竞品数据"污染",品牌素材的权重被稀释
  • 解法:L1增加"品牌调性锚定"机制——每生成3篇笔记后强制刷新品牌素材库的上下文优先级

坑2:小红书平台规则变更

  • 现象:某天全部笔记被平台限流
  • 原因:小某薯更新了引流规则,数字员工的标签策略(@品牌账号+话题标签组合)触发了新规则
  • 解法:L2工具系统增加平台规则更新订阅,规则变更后48小时内自动调整策略模板

坑3:达人数据时效性

  • 现象:推荐的部分达人已停止更新或粉丝量严重注水
  • 原因:达人数据源更新频率不够(原为周更)
  • 解法:接入实时达人数据API,推荐前增加"账号活跃度校验"前置检查

这个案例的工程亮点不在于"用AI写小某薯笔记"——这本身并不复杂。

亮点在于:

  • 多Agent协作的编排设计——6个Agent各有职责边界,通过A2A协议协同,L3确保流程不乱
  • TokenRouter的精细化路由——不是简单的"简单/复杂"二分法,而是按任务类型+复杂度+品牌等级的三维决策
  • 六层防护网的场景化落地——每一层都对应一个真实的小红书运营痛点

如果你在做一个企业级AI产品,这个案例值得仔细研究——它展示了从"Prompt工程"到"Harness工程"的范式转移。

http://www.jsqmd.com/news/662265/

相关文章:

  • E4A蓝牙APP开发实战:从零到一构建简易物联网控制终端
  • VexRiscv多核解决方案:从单核到高性能集群的实践指南
  • C++11之包装器
  • 从Deformable DETR到DINO:混合查询选择,如何让模型‘看’得更准?
  • 别再被‘子仓库’报错吓到!手把手教你用git submodule搞定项目依赖管理
  • 实战指南:5步构建跨平台AI自动化测试体系
  • 2026年行业内轻集料混凝土生产厂,轻骨料混凝土/干拌复合轻集料/lc5.0轻集料混凝土,轻集料混凝土生产商哪家好 - 品牌推荐师
  • AGI到底强在哪?2026奇点大会首次公开12维能力评估矩阵:含推理深度、跨域泛化率、因果鲁棒性实测数据
  • ChatLog:解锁QQ群聊天数据的终极分析工具
  • 自动驾驶中的占用感知综述:信息融合视角
  • 利用OWL ADVENTURE进行软件测试:自动化视觉回归测试与UI缺陷检测
  • 如何快速掌握抖音下载器:面向内容创作者的完整工具指南
  • WPF布局
  • 银行数据中心基础设施建设与运维管理【2.2】
  • 总结java学习one -
  • 软件服务管理化的客户价值创造
  • 网络安全技术思考
  • 从CTF实战到代码复现:手把手教你用Python逆向分析RC4加密的crypt.exe
  • ZeroPoint Security red team ops I CRTO 6 Persistence
  • 避坑!这些毕设太好抄了,3000+毕设案例推荐第1077期
  • 【点云处理之理论基石】—— Deep Sets:从集合不变性到点云分类的通用架构
  • AI教育平台开发技术框架
  • 从《倘若鸟儿回还》看无障碍设计:如何用技术为轮椅用户打造真正的“独立出行”体验
  • Untrunc终极指南:免费开源视频修复工具,拯救损坏的MP4/MOV文件
  • 1982-2010年陆地植被碳密度数据集
  • 突破限制!NVIDIA Profile Inspector深度调校指南:解锁显卡隐藏性能的终极秘籍
  • Linux内核中的网络管理详解
  • 微软为什么发明 SqlLocalDB?命令行直接启动,0配置成本
  • FireRed-OCR Studio入门必看:@st.cache_resource缓存机制原理与实测提速
  • 漫画离线阅读终极指南:如何轻松下载8大网站漫画内容