当前位置: 首页 > news >正文

hello_agent第八章总结

文章目录

  • 第八章 记忆与检索 知识树
    • 一、记忆系统(Memory System)
      • 核心工具:MemoryTool(hello_agents/tools/builtin/memory_tool.py)
        • 核心接口函数
        • 初始化逻辑
      • 核心协调器:MemoryManager(hello_agents/memory/manager.py)
        • 核心函数
        • 核心属性
      • 四大记忆类型(hello_agents/memory/types/)
        • 1. WorkingMemory(working.py)- 工作记忆
        • 2. EpisodicMemory(episodic.py)- 情景记忆
        • 3. SemanticMemory(semantic.py)- 语义记忆
        • 4. PerceptualMemory(perceptual.py)- 感知记忆
      • 存储层(hello_agents/memory/storage/)
        • 1. SQLiteDocumentStore(document_store.py)
        • 2. QdrantVectorStore(qdrant_store.py)
        • 3. Neo4jGraphStore(neo4j_store.py)
      • 嵌入服务层(hello_agents/memory/embedding.py)
    • 二、RAG系统(Retrieval-Augmented Generation)
      • 核心工具:RAGTool(hello_agents/tools/builtin/rag_tool.py)
        • 核心接口函数
        • 初始化逻辑
      • RAG管道(hello_agents/memory/rag/pipeline.py)
        • 核心流程函数
        • 核心属性
      • 文档处理层(hello_agents/memory/rag/document.py)
        • 核心函数
        • 实现方式
      • 高级检索策略(hello_agents/memory/rag/retrieval.py)
        • 1. 多查询扩展(MQE)
        • 2. 假设文档嵌入(HyDE)
        • 3. 扩展检索框架
      • 核心辅助函数

第八章 记忆与检索 知识树

一、记忆系统(Memory System)

核心工具:MemoryTool(hello_agents/tools/builtin/memory_tool.py)

核心接口函数
  • execute:统一入口,分发add/search/summary/stats/update/remove/forget/consolidate/clear_all操作
  • _add_memory:添加记忆,处理会话ID/多模态元数据/上下文补充,调用memory_manager.add_memory
  • _search_memory:搜索记忆,参数标准化,调用memory_manager.retrieve_memories,格式化结果
  • _forget:遗忘记忆,支持importance_based/time_based/capacity_based三种策略
  • _consolidate:整合记忆,短期记忆转长期记忆,按importance_threshold筛选
初始化逻辑
  • 接收user_id/memory_config/memory_types参数,初始化MemoryManager
  • 按需启用working/episodic/semantic/perceptual记忆类型

核心协调器:MemoryManager(hello_agents/memory/manager.py)

核心函数
  • __init__:初始化MemoryStore/MemoryRetriever,按需实例化各记忆类型
  • add_memory:分发记忆添加请求到对应记忆类型模块
  • retrieve_memories:分发记忆检索请求,聚合多类型结果
  • forget_memories:调用对应记忆类型的遗忘方法,统计遗忘数量
  • consolidate_memories:跨记忆类型迁移数据,按阈值筛选
核心属性
  • store:MemoryStore实例,统一存储入口
  • retriever:MemoryRetriever实例,统一检索入口
  • memory_types:字典,存储各启用的记忆类型实例

四大记忆类型(hello_agents/memory/types/)

1. WorkingMemory(working.py)- 工作记忆
  • 核心函数add(添加前过期清理/容量控制)、retrieve(TF-IDF+关键词混合检索)
  • 评分函数_calculate_keyword_score_calculate_time_decay,综合相似度+时间+重要性
  • 实现方式:纯内存存储,TTL自动清理,混合检索策略,容量有限(默认50条)
2. EpisodicMemory(episodic.py)- 情景记忆
  • 核心函数add(创建Episode对象,更新会话索引,持久化到SQLite+Qdrant)、retrieve(结构化过滤+语义向量检索)
  • 评分函数_calculate_episode_score(向量相似度×0.8+时间近因性×0.2)×重要性权重
  • 实现方式:SQLite+Qdrant混合存储,支持时间序列/会话级检索,结构化+向量混合检索
3. SemanticMemory(semantic.py)- 语义记忆
  • 核心函数add(生成嵌入,提取实体/关系,存储到Neo4j+Qdrant)、retrieve(向量+图+语义推理混合检索)
  • 融合函数_combine_and_rank_results(向量相似度×0.7+图相似度×0.3)×重要性权重
  • 实现方式:Neo4j+Qdrant混合架构,实体/关系提取构建知识图谱,多策略混合检索
4. PerceptualMemory(perceptual.py)- 感知记忆
  • 核心函数add(按模态编码,存储到对应Qdrant集合)、retrieve(同/跨模态向量检索)
  • 编码函数_encode_data(文本/图像/音频分别调用对应编码器)
  • 评分函数_calculate_recency_score(指数衰减模型),融合向量+时间+重要性
  • 实现方式:按模态分离的Qdrant向量存储,多模态编码器(CLIP/CLAP),支持跨模态检索

存储层(hello_agents/memory/storage/)

1. SQLiteDocumentStore(document_store.py)
  • 核心函数:saveloadquery,结构化数据持久化,支持复杂条件查询
2. QdrantVectorStore(qdrant_store.py)
  • 核心函数:add_vectorssearch_similar,高性能向量存储/检索,支持命名空间隔离
3. Neo4jGraphStore(neo4j_store.py)
  • 核心函数:_add_entity_to_graph_add_relation_to_graph,知识图谱构建/查询

嵌入服务层(hello_agents/memory/embedding.py)

  • 核心函数create_embedding_model_with_fallbackget_text_embedder
  • 实现方式:支持DashScopeEmbedding(云端)、LocalTransformerEmbedding(本地)、TFIDFEmbedding(兜底),统一嵌入接口

二、RAG系统(Retrieval-Augmented Generation)

核心工具:RAGTool(hello_agents/tools/builtin/rag_tool.py)

核心接口函数
  • execute:统一入口,分发add_text/add_document/search/ask/stats操作
  • _add_document:调用RAG管道,处理多格式文档,完成从转换到存储的全流程
  • _search:调用扩展检索框架,支持MQE/HyDE,返回相关知识片段
  • _ask:检索相关片段,构建上下文,调用LLM生成答案
初始化逻辑
  • 接收knowledge_base_path/collection_name/rag_namespace参数
  • 创建RAG管道,初始化LLM实例,按命名空间隔离知识库

RAG管道(hello_agents/memory/rag/pipeline.py)

核心流程函数
  • create_rag_pipeline:创建端到端RAG处理管道,整合文档处理/嵌入/存储/检索
  • index_document:调用文档处理→分块→向量化→存储全流程
  • search:调用扩展检索策略,返回Top-K相关片段
核心属性
  • processor:DocumentProcessor实例,文档处理入口
  • embedder:统一嵌入模型实例,复用记忆系统嵌入服务
  • vector_store:QdrantVectorStore实例,向量存储入口

文档处理层(hello_agents/memory/rag/document.py)

核心函数
  • _convert_to_markdown:统一转换多格式文档为Markdown,PDF增强处理,其他格式调用MarkItDown
  • _split_paragraphs_with_headings:基于Markdown标题层次的语义分割
  • _chunk_paragraphs:基于Token数量的智能分块,支持重叠策略
  • _approx_token_len:中英文混合Token估算,CJK字符按1Token计算
实现方式
  • 多格式统一转换为Markdown,结构化分块(标题层次+Token控制),重叠分块保证信息连续性

高级检索策略(hello_agents/memory/rag/retrieval.py)

1. 多查询扩展(MQE)
  • 核心函数:_prompt_mqe,调用LLM生成语义等价的多样化查询,提升召回率
2. 假设文档嵌入(HyDE)
  • 核心函数:_prompt_hyde,调用LLM生成假设性答案文档,桥接查询与文档语义鸿沟
3. 扩展检索框架
  • 核心函数:search_vectors_expanded,实现「扩展-检索-合并」三步流程
    • 扩展:生成MQE查询+HyDE假设文档
    • 检索:并行执行所有扩展查询的向量检索
    • 合并:去重+分数排序,返回Top-K结果
  • 可配置参数:enable_mqeenable_hydecandidate_pool_multiplier

核心辅助函数

  • embed_query:统一查询向量化接口,复用记忆系统嵌入模型
  • _preprocess_markdown_for_embedding:Markdown文本预处理,提升嵌入质量
  • _create_default_vector_store:快速创建Qdrant向量存储实例,简化初始化
http://www.jsqmd.com/news/355553/

相关文章:

  • 财务人员必看的三本书,财务会计基础入门必备
  • 流量红利下的技术人突围:测试工程师的内容创作方法论
  • 2026年2月阻尼器厂家推荐,旋转阻尼器/车载阻尼器制造公司选择指南 - 品致汇
  • 管理学从入门到进阶必读的五本经典书籍推荐
  • 时间管理书籍推荐:如果只读一本,我会选这本
  • 企业战略管理必看书籍推荐与阅读建议
  • 【毕业设计】java-springboot+vue“智慧食堂”设计与实现
  • 郑州恒达感应加热设备:20年深耕,工业加热解决方案领跑者 - 朴素的承诺
  • 公安心理测评系统2026排行榜,谁才是民警身后可靠的心灵守护者? - 健成星云
  • 财务管理十大必看书籍推荐
  • Web学习之Restful风格
  • 全链赋能 智会未来:AIX艾可视会议一体机引领行业新生态 - 朴素的承诺
  • ‌情绪计算测试:多生理信号在情感识别模型的融合验证框架‌ ‌
  • 超级文件粉碎机(文件清理、隐私销毁、文件解锁、文件删除、机密文件)
  • AIX艾可视广告机:全链赋能 智领数字化传播新生态 - 朴素的承诺
  • AIX艾可视:液晶拼接屏领军者 一站式音视频解决方案标杆 - 朴素的承诺
  • 巩义市万众给排水:橡胶软接头领航者,铸就高压力大口径品质标杆 - 朴素的承诺
  • Android 15 ServiceManager与Binder服务注册深度解析
  • 地表最强编程王者PK!Opus 4.6双榜单封神, Codex 5.3速度满分
  • 2026最新云石胶源头厂家top5推荐!国内优质云石胶权威品牌榜单发布,资质服务双优助力高品质建材应用 - 品牌推荐2026
  • 2026年专业深度测评:中国排名前五的GEO获客优化机构权威 - 电商资讯
  • AIX艾可视:LED显示屏一站式解决方案,赋能全场景智慧视界 - 朴素的承诺
  • 郑州恒达感应加热设备:深耕19年,赋能制造业智能升级 - 朴素的承诺
  • 巩义市万众给排水:高端橡胶软接头引领者,赋能多行业管道安全 - 朴素的承诺
  • 量子纠缠网络:分布式AI的终极形态
  • ‌金融波动场景下的交易流程稳定性测试强化
  • 深耕品质,链接全球——巩义市万众给排水材料有限公司橡胶柔性接头领航行业发展 - 朴素的承诺
  • 华为激活组织的“五大引擎”与“四驾马车”
  • ‌逆转事件解析:混沌注入提升系统可靠性
  • 2030年的AI:量子意识与人机共生