当前位置: 首页 > news >正文

【GitHub项目推荐--Cognee:构建 AI 记忆的知识引擎】⭐

简介

Cognee 是一个开源的 Python 框架,旨在为 AI 应用和智能体(Agents)构建持久化、动态且可学习的知识记忆系统。它超越了传统的 RAG(检索增强生成)系统,通过结合向量搜索、图数据库和认知科学方法,将原始数据转化为互连的知识图谱。Cognee 采用独特的 ECL(提取、认知化、加载)管道架构,不仅让文档可被语义搜索,还能通过实体关系进行深度推理,为 AI 系统提供类似人类的长期记忆能力。

主要功能

  • 图向量混合存储:无缝集成图数据库(如 Neo4j、Kuzu)与向量数据库(如 LanceDB、Weaviate),支持基于语义和基于关系的双重检索。

  • 模块化 ECL 管道:提供高度可定制的数据处理流程,包括数据提取(支持 30+ 数据源)、认知化(LLM 驱动的知识图谱构建)和加载(记忆固化)。

  • 多模态数据支持:原生支持文本、图像、音频转录以及过往对话历史,构建统一的知识上下文。

  • 智能体记忆管理:为 LangGraph、AutoGen 等智能体框架提供跨会话的持久化记忆,支持记忆更新、遗忘和基于反馈的自我改进。

  • MCP 集成:提供 Cognee MCP 服务器,可将知识引擎作为工具接入 Claude Desktop 或其他 MCP 兼容客户端。

  • 本地优先与生产部署:默认使用本地文件系统存储,支持 Docker 容器化部署,并可配置 PostgreSQL、S3 等生产级后端。

安装与配置

环境要求

  • Python 3.10 至 3.13

安装

推荐使用uv包管理器进行快速安装:

uv pip install cognee

或使用 pip:

pip install cognee

如需特定后端支持(如 Weaviate),可安装扩展:

pip install "cognee[weaviate]"

配置

Cognee 主要通过环境变量配置。创建一个.env文件或直接设置环境变量:

  • LLM 配置:设置LLM_API_KEY(如 OpenAI API Key)和LLM_PROVIDER(默认为 openai)。

  • 数据库配置:设置GRAPH_DATABASE_PROVIDER(kuzu, neo4j)、VECTOR_DB_PROVIDER(lancedb, pgvector)及对应的连接 URL。

  • 存储配置:设置STORAGE_PROVIDER(local, s3)等。

如何使用

Cognee 提供 Python API 和 CLI 两种使用方式。核心流程围绕Add(添加数据)、Cognify(构建知识)和Search(检索记忆)展开。

  1. 初始化与添加数据:导入cognee库,使用await cognee.add(data, dataset_name)将文本、文件路径或 URL 添加到系统中。

  2. 构建知识图谱:调用await cognee.cognify(dataset_name),系统将使用 LLM 提取实体、关系并构建图结构。

  3. 查询与检索:使用await cognee.search(query_text)进行混合搜索,或使用await cognee.get_graph()获取原始图谱进行图遍历。

  4. CLI 操作:可通过cognee-cli add "text"cognee-cli cognifycognee-cli search "query"在终端快速操作。

应用场景实例

实例 1:企业级智能客服知识库

场景:某金融公司需要构建一个能理解产品条款关联性的客服系统。传统 RAG 只能回答“什么是年金险”,但无法解释“年金险与寿险在遗产规划中的区别”。

Cognee 方案:将产品手册、法规文件录入 Cognee。当用户询问复杂关联问题时,系统不仅检索相关段落,还通过知识图谱追溯“年金险”->“受益人”->“遗产税”->“寿险”的路径,生成具有深度推理的答案,显著降低幻觉。

实例 2:科研文献智能助手

场景:研究人员需要跟踪某个领域(如“mRNA 疫苗”)的最新进展,但新论文层出不穷,难以手动建立联系。

Cognee 方案:定期爬取 arXiv 或 PubMed 的论文摘要并导入 Cognee。系统自动构建以“研究机构”、“作者”、“靶点”、“技术方法”为节点的图谱。研究员查询“CRISPR 在疫苗中的应用”时,系统能列出所有相关论文,并可视化展示技术演进路径。

实例 3:长对话 AI 伴侣

场景:开发一个具有长期记忆的 AI 伴侣,能记住用户三个月前提到的“对芒果过敏”和“喜欢科幻电影”。

Cognee 方案:将每轮对话作为数据源添加,并设置用户属性(如“过敏源”、“偏好”)。当用户说“推荐一部电影”时,Cognee 检索记忆图谱,过滤掉含有芒果场景的电影,并优先推荐科幻类,实现真正的个性化交互。

GitHub 地址

项目仓库:https://github.com/topoteretes/cognee

http://www.jsqmd.com/news/508037/

相关文章:

  • C语言自定义数据类型精讲:从struct到union,掌握数据组织的核心
  • bge-large-zh-v1.5效果展示:中文社交媒体短文本(微博/小红书)聚类效果
  • 基于 Amazon S3 Vectors + OpenClaw 的 RAG 知识库架构与实现
  • Qwen3-0.6B-FP8实战教程:Web界面+supervisorctl双轨运维
  • Redis秒杀订单簿:50微秒延迟的撮合引擎优化技巧
  • Alpamayo-R1-10B参数详解:Top-p/温度/采样数对轨迹预测的影响分析
  • JetBrains 25 岁了:AI时代IDEA 真的要倒下了吗?
  • Qwen3-32B-Chat效果展示:支持128K上下文的长文档分析与精准摘要实例
  • 第十天(3.20)
  • SkillHub 手动安装脚本
  • 前缀和与差分算法入门
  • 伏羲气象大模型Python入门教程:从零开始调用API
  • 多重背包单调队列优化的完整数学推导
  • 手把手教你用NVIDIA Jetson AGX Orin运行PointRCNN:OpenPCDet环境搭建全流程
  • Android正在变得越来越封闭,请向Android抗议,恳请不要注册抢先体验计划或Android开发人员控制台
  • 大树科技电话查询:AI时代品牌认知构建策略解析 - 十大品牌推荐
  • 从零开始:如何高效连接DeepSeek AI智能客服(附完整代码示例)
  • 后OTP时代:基于AFASA法案的无密码认证架构演进研究
  • 【2026年最新600套毕设项目分享】基于SpringBoot的校园设备维护报修系统(14199)
  • IDEA 又整新活:推出全新调试工具!
  • FFTW3实战:如何用C++实现音频降噪(附完整代码与性能对比)
  • 别35岁焦虑!网络安全行业“越老越吃香“,30岁转行正当时(附282G学习资源必收藏)
  • Qwen-Image镜像开源可部署:企业私有云中安全可控的多模态AI底座
  • AudioSeal音频保护教程:3步完成音频隐形水印添加与检测
  • 腾讯混元OCR网页版部署技巧:Nginx反向代理配置,提升安全性
  • Spring AI 2.x 全面指南:架构升级、高效的工具调用、多模型生态与实战示例
  • SPIRAN ART SUMMONER效果展示:风格迁移对比实验
  • Qwen3-32B-Chat百度开发者能力认证:部署/调优/安全/扩展四大模块考核大纲
  • GD32 Flash擦写异常排查:EXMC配置陷阱与pgerr的深层解析
  • 基于高保真UI伪造与反沙箱机制的加密货币钓鱼攻击研究