当前位置: 首页 > news >正文

[MAF的Agent管道详解-05]对话历史的持久化和输入输出的增强

ChatClientAgent自身是对IChatClient对象的封装,后者提供了与LLM交互的能力。在不考虑LLM自身差异的前提下,LLM响应内容的质量和准确性取决于作为输入提供给LLM的消息列表和配置选项,如果能否提供一种灵活的机制动态地定制输入给LLM的消息列表和配置选项,无疑是非常有价值的。另一方面,LLM返回的结果往往也需要经过一些定制化的处理才能满足我们的需求,如果上述的这种机制还能对LLM返回的结果进行定制化处理,那就更加完美了。其实这个机制就实现在ChatClientAgent自身的类型定义上,它位于ChatClientAgent管道中间部分。

如上图所示,这部分主要涉及ChatHistoryProviderAIContextProvider两个核心组件。前者用于提供和存储基于Session的对话历史,后者可以视为中间件的另一种定义方式:AIContextProvider定义了两个分别在调用IChatClient前后执行的方法(InvokingAsyncInvokedAsync),前者用来定制传入IChatClient的消息列表和配置选项,后者用来对返回的结果实施再加工。

1. ChatHistoryProvider

ChatClientAgent以Session的方式被调用时,需要利用ChatHistoryProvider来获取和存储对话历史。ChatHistoryProvider定义了InvokingAsyncInvokedAsync两个方法,前者在调用IChatClient之前被调用,后者在调用IChatClient之后被调用。

publicabstractclassChatHistoryProvider{publicValueTask<IEnumerable<ChatMessage>>InvokingAsync(InvokingContextcontext,CancellationTokencancellationToken=default);publicValueTaskInvokedAsync(InvokedContextcontext,CancellationTokencancellationToken=default)=>InvokedCoreAsync(context,cancellationToken);}

两个方法都接受一个上下文对象作为其参数,对应的类型InvokingContextInvokedContext以嵌套的方式定义在ChatHistoryProvider中。

publicabstractclassChatHistoryProvider{publicsealedclassInvokingContext{publicAIAgentAgent{get;}publicAgentSession?Session{get;}publicIEnumerable<ChatMessage>RequestMessages{get;set;}}publicsealedclassInvokedContext{publicAIAgentAgent{get;}publicAgentSession?Session{get;}publicIEnumerable<ChatMessage>RequestMessages{get;}publicIEnumerable<ChatMessage>?ResponseMessages{get;}publicException?InvokeException{get;}}

上下文数据成员说明如下:

  • Agent:当前调用的AIAgent实例;
  • Session:当前调用的AgentSession实例;如果当前调用不是基于Session的调用,则该属性为null;
  • RequestMessages:当前调用提供的请求消息列表;在InvokingContext中它是一个可读写属性,在InvokedContext中它是一个只读属性;
  • ResponseMessages:当前调用得到的响应消息列表;在InvokingContext中不存在,在InvokedContext中它是一个只读属性;如果当前调用过程中发生了异常或者LLM没有返回任何响应消息,则该属性为null;
  • InvokeException:当前调用过程中发生的异常;在InvokingContext中不存在,在InvokedContext中它是一个只读属性;如果当前调用过程中没有发生异常,则该属性为null;

ChatHistoryProviderInvokingAsyncInvokedAsync方法默认会直接点调用InvokingCoreAsyncInvokedCoreAsync方法。ChatHistoryProvider的构造函数还可以提供三个消息过滤器,并且定义了一个用于提供原始对话历史的ProvideChatHistoryAsync方法,以及用于存储对话历史的StoreChatHistoryAsync方法,这些方法都是虚方法,我们可以通过重写这些方法来实现自定义的对话历史获取和存储逻辑。

publicabstractclassChatHistoryProvider{protectedChatHistoryProvider(Func<IEnumerable<ChatMessage>,IEnumerable<ChatMessage>>?provideOutputMessageFilter=null,Func<IEnumerable<ChatMessage>,IEnumerable<ChatMessage>>?storeInputRequestMessageFilter=null,Func<IEnumerable<ChatMessage>,IEnumerable<ChatMessage>>?storeInputResponseMessageFilter=null);protectedvirtualasyncValueTask<IEnumerable<ChatMessage>>InvokingCoreAsync(InvokingContextcontext,CancellationTokencancellationToken=default);protectedvirtualValueTask<IEnumerable<ChatMessage>>ProvideChatHistoryAsync(InvokingContextcontext,CancellationTokencancellationToken=default);protectedvirtualValueTaskInvokedCoreAsync(InvokedContextcontext,CancellationTokencancellationToken=default);}protectedvirtualValueTaskStoreChatHistoryAsync(InvokedContextcontext,CancellationTokencancellationToken=default);}

InvokingCoreAsync方法以如下的方法提供对话历史:

  • 调用ProvideChatHistoryAsync方法来获取对话历史消息列表;
  • 如果构造函数提供了provideOutputMessageFilter过滤器,则调用该过滤器来过滤获取到的对话历史消息列表;
  • 将消息来源设置为ChatHistoryProvider,表示消息来源于ChatHistoryProvider提供的对话历史;

InvokedCoreAsync方法以如下的方法存储对话历史:

  • 如果调用过程中发生了异常(通过InvokedContextInvokeException属性判断),则直接返回,不执行任何存储操作;
  • 如果构造函数提供了storeInputRequestMessageFilter过滤器,则调用该过滤器来过滤传入的请求消息列表;否则默认过滤掉来源于ChatHistoryProvider的消息,以避免将ChatHistoryProvider提供的请求消息再次保存一遍;
  • 如果构造函数提供了storeInputResponseMessageFilter过滤器,则调用该过滤器来过滤传入的响应消息列表;
  • 根据过滤后的请求消息列表和响应消息列表创建一个新的InvokedContext对象,并调用StoreChatHistoryAsync方法来存储对话历史;

根据上述的调用流程可以看出,在大部分场景下,自定义的ChatHistoryProvider只需要重写ProvideChatHistoryAsyncStoreChatHistoryAsync方法实现对话历史的加载和存储就可以了。为了避免对消息实施重复存储,InvokingCoreAsync方法会将加载的每个消息的来源都设置成ChatHistoryProvider。消息的来源类型通过如下这个只读结构体AgentRequestMessageSourceType来标记。

publicreadonlystructAgentRequestMessageSourceType(stringvalue):IEquatable<AgentRequestMessageSourceType>{publicstringValue{get;}publicstaticAgentRequestMessageSourceTypeExternal{get;}=newAgentRequestMessageSourceType("External");publicstaticAgentRequestMessageSourceTypeAIContextProvider{get;}=newAgentRequestMessageSourceType("AIContextProvider");publicstaticAgentRequestMessageSourceTypeChatHistory{get;}=newAgentRequestMessageSourceType("ChatHistory");}

AgentRequestMessageSourceType的三个静态属性分别表示三种具体的来源类型:

  • External:来源于外部调用,即用户输入的消息;
  • AIContextProvider:来源于注册的AIContextProvider提供;
  • ChatHistory:来源于ChatHistoryProvider;

消息的来源存储在表示消息的ChatMessage对象的AdditionalProperties字典中,系统为我们提供了一个扩展方法GetAgentRequestMessageSourceType来获取消息的来源类型,如果没有获取到或者获取到的值不是有效的AgentRequestMessageSourceType,则默认返回External

publicstaticAgentRequestMessageSourceTypeGetAgentRequestMessageSourceType(thisChatMessagemessage);

系统提供了如下几个ChatHistoryProvider的内置实现:

  • InMemoryChatHistoryProvider:是ChatHistoryProvider的内存实现版本。它不依赖外部数据库,而是将对话数据存储在当前的进程内存中。它的速度极快,无需配置数据库。但是不可持久化。程序重启后,所有历史记录都会丢失。适合于单元测试、原型开发、或者短期的临时会话;
  • CosmosChatHistoryProvider:这是一个生产级的持久化聊天历史管理器实现,专门为Azure Cosmos DB设计。它解决了数据持久化、大规模并发、多租户隔离以及自动清理等核心问题;

2. AIContextProvider

由于ChatClientAgent管道最终会调用IChatClient对象与LLM交互,不论是基于阻断式的GetResponseAsync方法还是基于流式的GetStreamingResponseAsync方法,都只有两个参数:一个是消息列表,一个是ChatOptions对象,这意味着这两个对象完全决定了LLM的响应。为了得到更符合预期的响应,我们就需要对这两个对象进行定制化的处理。在得到了LLM的响应后,我们可能还需要对响应结果进行再加工来满足后续的业务需求。

AIContextProvider就是为了解决这些问题而设计的,它定义了两个方法:PreprocessAsyncPostprocessAsync,前者在调用IChatClient之前被调用,后者在调用IChatClient之后被调用。我们可以通过继承AIContextProvider来实现一个自定义的AI上下文提供者,在PreprocessAsync方法中根据传入的上下文来定制传入IChatClient的消息列表和ChatOptions对象,在PostprocessAsync方法中根据传入的上下文来对返回的结果进行再加工。

如上图所示,所有注册的AIContextProvider构成一个类似于中间件的链条。在调用IChatClient之前,ChatClientAgent会将请求消息列表和从ChatOptions中提取的系统指令与工具集合并成一个AIContext对象,并进一步封装成InvokingContext上下文对象,然后依次调用每个AIContextProviderInvokingAsync方法对AIContext进行定制。最终交付给IChatClient的消息列表将来源于这个AIContext,采用的ChatOptions也将使用AIContext提供的系统指令。

publicsealedclassAIContext{publicstring?Instructions{get;set;}publicIEnumerable<ChatMessage>?Messages{get;set;}publicIEnumerable<AITool>?Tools{get;set;}}

IChatClient调用结束后,得到的结构或者抛出的异常会被封装成一个InvokedContext上下文对象,ChatClientAgent会将此上下文作为参数按照相反的顺序调用每个AIContextProviderInvokedAsync方法来对结果进行再加工。

publicabstractclassAIContextProvider{publicsealedclassInvokingContext{publicAIAgentAgent{get;}publicAgentSession?Session{get;}publicAIContextAIContext{get;}}publicsealedclassInvokedContext{publicAIAgentAgent{get;}publicAgentSession?Session{get;}publicIEnumerable<ChatMessage>RequestMessages{get;}publicIEnumerable<ChatMessage>?ResponseMessages{get;}publicException?InvokeException{get;}}protectedFunc<IEnumerable<ChatMessage>,IEnumerable<ChatMessage>>ProvideInputMessageFilter{get;}protectedFunc<IEnumerable<ChatMessage>,IEnumerable<ChatMessage>>StoreInputRequestMessageFilter{get;}protectedFunc<IEnumerable<ChatMessage>,IEnumerable<ChatMessage>>StoreInputResponseMessageFilter{get;}publicvirtualIReadOnlyList<string>StateKeys{get;}protectedAIContextProvider(Func<IEnumerable<ChatMessage>,IEnumerable<ChatMessage>>?provideInputMessageFilter=null,Func<IEnumerable<ChatMessage>,IEnumerable<ChatMessage>>?storeInputRequestMessageFilter=null,Func<IEnumerable<ChatMessage>,IEnumerable<ChatMessage>>?storeInputResponseMessageFilter=null);publicValueTask<AIContext>InvokingAsync(InvokingContextcontext,CancellationTokencancellationToken=default);protectedvirtualasyncValueTask<AIContext>InvokingCoreAsync(InvokingContextcontext,CancellationTokencancellationToken=default);protectedvirtualValueTask<AIContext>ProvideAIContextAsync(InvokingContextcontext,CancellationTokencancellationToken=default);publicValueTaskInvokedAsync(InvokedContextcontext,CancellationTokencancellationToken=default);protectedvirtualValueTaskInvokedCoreAsync(InvokedContextcontext,CancellationTokencancellationToken=default);protectedvirtualValueTaskStoreAIContextAsync(InvokedContextcontext,CancellationTokencancellationToken=default);}

AIContextProvider采用了于ChatHistoryProvider完全一致的定义方式:

  • InvokingAsync方法的逻辑:
    • 直接调用虚方法InvokingCoreAsync
    • InvokingCoreAsync默认会调用ProvideAIContextAsync方法来提供一个AIContext上下文,此上下文将会与作为参数的InvokingContext上下文的AIContext进行合并(具体是对包含在此上下文中的消息列表、系统指令和工具集进行合并);
    • ProvideAIContextAsync默认返回一个空的AIContext对象,我们可以通过重写ProvideAIContextAsync方法来提供额外的对话历史、系统指令和工具;
  • InvokedAsync方法的逻辑:
    • 直接调用虚方法InvokedCoreAsync
    • InvokedCoreAsync会先检查调用过程中是否发生了异常,如果发生了异常则直接返回;如果没有发生异常,它会调用另一个虚方法StoreAIContextAsync来存储处理后的结果。
    • StoreAIContextAsync默认不执行任何操作,我们可以通过重写StoreAIContextAsync方法来实现自定义的结果存储逻辑;

2.1 MessageAIContextProvider

MessageAIContextProvider派生于AIContextProvider,旨在专门实现针对请求消息(忽略系统指令和工具集)的提供,其使命是将额外的上下文消息(如RAG检索结果、用户画像等)动态地插入到当前的对话流中。它定义了属于自己的InvokingContext上下文,只保留的请求消息列表(剔除了AIContext的Instructions和Tools),

publicabstractclassMessageAIContextProvider:AIContextProvider{publicnewsealedclassInvokingContext{publicAIAgentAgent{get;}publicAgentSession?Session{get;}publicIEnumerable<ChatMessage>RequestMessages{get;}}}

MessageAIContextProvider定义了属于直接的虚方法ProvideMessagesAsync,方法方法以上面定义的InvokingContext上下文作为参数,返回提供的请求消息。重写的ProvideAIContextAsync方法会调用ProvideMessagesAsync来获取额外的请求消息,并将这些消息与原有的请求消息进行合并后返回。

publicabstractclassMessageAIContextProvider:AIContextProvider{protectedoverrideasyncValueTask<AIContext>ProvideAIContextAsync(AIContextProvider.InvokingContextcontext,CancellationTokencancellationToken=default);publicValueTask<IEnumerable<ChatMessage>>InvokingAsync(InvokingContextcontext,CancellationTokencancellationToken=default);protectedvirtualasyncValueTask<IEnumerable<ChatMessage>>InvokingCoreAsync(InvokingContextcontext,CancellationTokencancellationToken=default);protectedvirtualValueTask<IEnumerable<ChatMessage>>ProvideMessagesAsync(InvokingContextcontext,CancellationTokencancellationToken=default);}

2.2 预定义的AIContextProvider

系统提供了如下几个MessageAIContextProvider的内置实现:

  • ChatHistoryMemoryProvider:可以视为一个非常强大的RAG组件,它将聊天历史转化为了长期记忆,具体来说是将过去的对话记录向量化存入向量数据库,并在后续对话中通过语义搜索找回相关的记忆,以此增强Agent的回答能力;
  • TextSearchProvider:它是一个通用型的外部知识搜索插件。如果说ChatHistoryMemoryProvider是Agent的回忆录,那么TextSearchProvider就是Agent的搜索引擎参考书。它通过封装一个异步搜索函数,实现了RAG架构中检索注入的标准流程;
  • Mem0Provider:这是一个集成了 Mem0 (被称为AI的长期记忆层) 的上下文提供者。与ChatHistoryMemoryProvider相比,Mem0Provider的独特之处在于它不仅仅是存储向量,而是利用Mem0的后端服务来智能提取、更新和关联跨会话的记忆片段;

除了上面几个派生于MessageAIContextProvider的内置实现之外,系统还提供了如下几个AIContextProvider的内置实现:

  • AgentSkillsProvider:将Agent Skills引入MAF。在微软的Agent框架中,Skill不仅仅是简单的工具,它是一套领域特定的资产包(包含指令、参考文档、甚至可执行脚本)。这个类的作用是向 Agent 宣告这些技能的存在,并提供动态加载它们的能力;
  • CompactionProvider:这是一个专门用于上下文压缩的提供者。它的核心使命是解决大模型上下文窗口限制问题,通过智能压缩历史消息,确保Agent在长对话中既不丢失关键信息,又不超出Token限制;
  • FoundryMemoryProvider:这是一个集成了Azure AI Foundry记忆服务的上下文提供者。它的功能定位与Mem0Provider类似,但它属于Azure原生生态,利用AIProjectClient直接与云端托管的记忆库交互;
http://www.jsqmd.com/news/873418/

相关文章:

  • 2026北京大兴律师事务所权威推荐(2026 精选版)|避坑指南 + 精准选型攻略,严选北京百富律师事务所 - 新闻快传
  • 为开源AI项目配置HermesAgent使用Taotoken作为模型供应商指南
  • 5.17全系统联动调试
  • 深圳高空广告工程:物料制作要点梳理与专业安装流程详解 - GrowthUME
  • 北京大兴十大知名金牌律师事务所排名,严选北京百富律师事务所,专业顶尖团队口碑一流 - 新闻快传
  • 山东德鲁克新材料有限公司—A2 防火板/铝锥芯三维板/无胶蜂窝板/冰火板/铝单板/钢制墙板/铝天花/铝方通/铝方管源头工厂 - 新闻快传
  • IPMC感知性能应用【附程序】
  • 2026广东高端手表定制深度评测:5大维度数据排行 - 新闻快传
  • 莫比乌斯反演学习笔记
  • 5.18Bug集中修复+功能完善
  • 2026年重庆除甲醛公司实测:这几家真的靠谱 - GrowthUME
  • 2026年不锈钢拉丝原色精工字优质工厂厂家,选前必看这些细节 - GrowthUME
  • 5.16全模块功能优化+局部联调
  • 5.19-5.20整体验收+文档整理+项目交付
  • 全国中高端猎头公司排行:核心服务能力实测对比 - 得赢
  • 告别报错!手把手教你用Pycharm 2023.2 + Git搞定Manim社区版安装(附国内镜像源配置)
  • 3个理由告诉你为什么Bebas Neue字体值得设计师收藏
  • OfflineInsiderEnroll:无需微软账户的Windows预览计划终极解决方案
  • RT-Thread ADC设备驱动避坑指南:解决CubeMX代码整合与通道使能的那些坑
  • 揭秘婴儿游戏围栏源头工厂:性价比之选大公开 - 品牌测评鉴赏家
  • 5.12智能识别+自动化功能开发
  • P2401
  • 嵌入式图像处理第一步:在Hi3516/Hi3518平台上为libpng-1.6.36编译zlib依赖库
  • 如何在浏览器中快速解锁加密音乐:Unlock-Music完整实战指南
  • KindEditor技术架构深度解析:企业级富文本编辑器的模块化设计哲学
  • 2026年阿里云OpenClaw/Hermes Agent配置Token Plan部署保姆攻略
  • 从Vue3前端到NestJS后端:手把手教你打通全栈用户管理系统的数据流
  • 解锁宝藏!支持小批量订单的尿布台源头工厂大盘点 - 品牌测评鉴赏家
  • 别再只会用HAL_Delay了!深入SysTick源码,搞懂STM32 HAL库的延时到底是怎么‘卡’住你的程序的
  • Locale Remulator终极指南:Windows系统区域模拟器的完整解决方案