当前位置: 首页 > news >正文

vivo统一AI Agent能力,Chat模式落地打造可“拼”底座助力业务演进!

【背景与目标】

各位,vivo互联网项目团队围绕三大业务场景(笔记、知识库、项目管理)统一了一套可组合的AI Agent能力。本文聚焦一期「Chat模式」落地,强调Runtime Adapter的“协议无关、面向任意后端流”特性。业务诉求方面,笔记、知识库、项目管理三类场景都需要“对话式”AI能力,并逐步演进到多轮、工具调用、上下文增强与可追溯。统一入口上,不希望每条业务线重复造轮子,期待用同一套可组合Hook即插即用。一期范围是先完成Chat模式打底,但保留可扩展的“多消息一回合”“工具调用”“历史/检查点”能力。在产品体验上,遵循主流Agent设计范式,结合过往实现风格,将复杂性交由“消息模型 + 运行时适配 + 前端编排”三段式来解耦。

【设计原则】

设计原则有四点。一是“消息即协议”,把后端回传的事件统一解码为前端消息模型,UI只消费消息,不关心来源细节。二是“运行时可插拔”,只要后端能以“流”的形式输出,Adapter都会转为相同的AgentStreamEvent,前端逻辑零差异。三是“前端可编排”,用Hook/Context管理上下文、工具、重试/变体、回调,形成稳定的胶水层。四是“渐进增强”,一期只做Chat,但保留threadId/runId,为“历史/检查点/回放/评测”留出Agent能力口。

【架构总览】

只列出Chat模式强相关的核心模块。①统一消息模型,覆盖UserMessage、AssistantMessage、Thinking - Message、ActionExecution - Message、ResultMessage等类型,含status与可选parentMessageId,可扩展图片、状态消息。②Runtime Adapter接口,generateResponse(params) / retry(params)返回ReadableStream,sendFeedback统一正/负反馈,可对接多种后端“流”,无论来源如何,都会标准化为AgentStreamEvent。③前端编排(Orchestration),AgentKit作为Provider暴露上下文,统一注入runtime、actions、上下文树、消息与加载状态、重载完成回调等;useAgentChat组合useChat,提供append - Message、reloadMessages、stop - Generation、threadId、runId等能力;useChat串接Runtime流式事件,处理工具调用与Agent循环,并维护AbortController。④Vue UI组件,Chat容器封装输入/消息区/操作/建议项,借助useCopilotChatLogic与Core同步。

【事件流与消息模型:把一切都还原成消息】

后端返回的是“事件”,前端消费的是“消息”,把差异收敛在Adapter层。一是“增量累加”,把分片token聚合为Thinking - Message / AssistantMessage。二是“工具事件”,tool_call → ActionExecution - Message,tool_result → ResultMessage。三是“统一标识”,维护threadId(会话)与runId(本轮loop),为历史/检查点铺路。四是“精确收束”,依据服务端“回合结束”信号或本地规则,准确结束本轮流。上层只看到标准的AgentStreamEvent,UI组件无须关心消息从哪里来,只负责渲染消息序列。

【Agent回合循环(loop)与工具调用(tools)】

Chat模式不仅是“生成一条回复”,而是“一轮内可能包含多条消息”。把“回合循环”放在useChat中集中处理,串接流式事件,按顺序追加消息;捕获ActionExecutionMessage触发前端工具handler,并把结果回注为ResultMessage;当一轮结束,返回最终AssistantMessage并可进入下一轮;在“重载/变体”场景中,保留既有候选并追加新候选,形成多变体集合。与传输方式无关,只要后端发出等价事件,Adapter统一映射,工具消息即可完整往返。工具调用的前端形态是useAgentAction,它可描述name/description/parameters;处理时handler(args)返回值会被打包成ResultMessage回注对话;可选渲染可将工具调用或结果以内嵌卡片形式展示;同一执行ID只会触发一次handler;Adapter负责把后端的工具事件统一映射为前端消息,UI不需要关注具体协议与传输方式。

【UI交互与建议(Suggestions)】

Chat作为容器,暴露了消息渲染插槽与输入区控制,默认行为是渲染Thinking、Assistant、User、Error等消息类型;支持复制、停止、重新生成、建议点击;useCopilotChatLogic负责把Core能力(useAgentChat)与UI事件连起来,并提供节流后的建议刷新入口。

【最小上手:3步把Chat接入到任一页面】

第一步,在根组件用AgentKit包裹,并选择Runtime。第二步,页面里直接用Chat(或自定义渲染)。第三步,(可选)注册工具,供模型调用。

【与业务的契合】

笔记/知识库/项目管理方面,前端可把当前选中文段/标签/页面结构通过addContext合并入agentArgs,无需更改Runtime。知识库agent文档/集成流程智能Agent(未来规划)方面,把检索与聚合能力抽象为FrontendAction,回注ResultMessage,让Agent循环自动推进。

【面向知识库问答与集成流程智能的演进设想】

一是知识库问答Agent(RAG),支持互联网检索,结合站内知识完成回答;提供关键字检索、内容获取与语义检索(向量);后续将支持直接帮你编辑、新增文档等操作;让AI准确看到你正在关注的内容,与你的上下文保持一致,帮助你更高效地思考、写作与创造。二是集成流程,自动配置,添加节点,配置节点,验证节点,一句话帮你完成流程配置,面向非开发同学,解决流程编排困难和语法复杂的问题;支持从自然语言自动生成流程与节点参数;节点配置表单化,参数智能补全与校验,自动化验证每一步并给出修复建议;支持逐步验证与仿真运行,输出日志与每步结果检查。

【下一步需完善】

一是历史记录,当前未做持久化回放,已通过threadId预埋会话键,后续可依此查询并复原消息序列。二是检查点,runId用于标记本轮loop,未来可以支持检查点能力,在“继续/撤回/回滚”中复用,是Agent交互中必不可少的能力。三是工具事件,实现HumanInTheLoop能力,工具调用需要用户确认,或者需要用户填写表单等内容与Agent协同。

【结语】

用“消息模型 + Runtime Adapter + 前端编排”的方式,把Chat模式做成了可以“拼”的底座,UI只面向消息,不关心来源;运行时可替换,协议差异被屏蔽;工具/上下文/重试等交互都在编排层实现;threadId/runId为历史/检查点打好地基。这让三类业务都能在同一套基建上继续演进。接下来,会补齐历史与工具事件、完善多变体交互,并把“回合对齐/评测”纳入流水线。

http://www.jsqmd.com/news/860178/

相关文章:

  • 在 GPT 里[读文档]这件事,我测了 5 个 MCP 工具,为什么复杂 OCR 场景最终会走向 MinerU
  • 为 OpenClaw 配置 Taotoken 作为后端模型供应商的详细操作流程
  • CTF实战:熊海CMS 1.0的另类利用——绕过文件上传限制,用Pearcmd.php实现RCE的完整流程
  • 对比直接使用官方 API,通过 Taotoken 调用在成本透明度上的提升体验
  • 抖音批量下载终极指南:如何用开源工具高效采集视频素材
  • 程序员需求攀升:数字化浪潮下的行业必然
  • VR安全带防坠落体验平台助力高空作业安全培训
  • Firefox 148默认禁用asm.js优化,Web性能开创性技术实验落幕
  • 从HTTP/1.0到HTTP/3:聊聊那些年我们踩过的‘连接’坑,以及性能优化实战
  • 从TEC4模型机运算器实验,看懂CPU数据通路与ALU工作的底层逻辑
  • 工厂实验室建设公司厂家:建不好,产品质量白搞|中南实验室建设
  • 初创团队如何利用Taotoken统一管理多个AI项目的API成本与用量
  • 智慧职教刷课脚本:3分钟实现全平台自动学习的终极指南
  • 2026 高炉炼铁智能化技术全景与演进路径~系列文章00:高炉炼铁智能化的产业变革与2026技术全景
  • PP喷淋塔厂家选购指南:2026如何选到靠谱供应商 - 资讯纵览
  • AI智能体自进化革命:SkillOS让AI越用越聪明
  • linux编译系统工作流程及其原理
  • 非标设备物料编码:从分类到维护的 8 个关键步骤
  • AI代码涌入PyPI:数量激增、质量堪忧,生态安全面临严峻挑战
  • 如何5分钟搭建网盘直链解析服务:高效下载解决方案完全指南
  • 软件开发行业的发展:从单体架构到微服务架构的演变历程
  • 3分钟快速上手:B站视频转文字工具bili2text的完整指南
  • 小资金期货量化用什么软件:成本敏感型的现实选项
  • 自贸港封关TPO5三亚企业税务咨询合作机构参考清单 - 资讯纵览
  • DellFanManagement:重新定义戴尔笔记本风扇控制的智能革命
  • 波兰语电商短视频配音效率提升300%,ElevenLabs批量生成+SSML动态变调+自动标点停顿优化全流程
  • 2026年吸油过滤袋深度测评:从3个方面教你如何为工业场景匹配最佳方案 - 资讯纵览
  • 别再为多设备同步发愁了!手把手教你用NI-DAQmx的‘通道扩展’功能搞定多机箱数据采集
  • FEC AFC1500 SAN4-40M 电动伺服驱动控制器
  • Java开发者专属!收藏这份AgentScope Java指南,轻松入门大模型开发