当前位置: 首页 > news >正文

RAG-项目实战一(GraphRAG优化)

一.GraphRAG与传统RAG的区别

特性传统 RAGGraphRAG
检索核心语义相似度(向量距离)语义 + 拓扑关系(点线网)
理解深度只能找到“长得像”的片段能通过“多跳”发现隐含联系
信息组织孤立的文档块(Chunks)结构化的实体与关系网络
复杂问题难以回答“为什么”、“有什么区别”擅长处理需要逻辑推理的复杂查询

二.项目结构

1.数据准备层

  • 流程:从 Neo4j 提取菜谱、食材、步骤节点,并利用 Cypher 关系将它们“缝合”成一篇篇结构化的 Markdown 文档。

举个栗子

# 这是 Python 连接 Neo4j 的标准写法。 # 它创建了一个会话(Session),with 语句确保查询完成后,连接会被正确关闭,不会占用资源。 with self.driver.session() as session: # 加载所有菜谱节点,从Category关系中读取分类信息 # match匹配节点->where过滤条件->optional可选操作->with聚合处理 recipes_query = """ MATCH (r:Recipe) WHERE r.nodeId >= '200000000' OPTIONAL MATCH (r)-[:BELONGS_TO_CATEGORY]->(c:Category) WITH r, collect(c.name) as categories RETURN r.nodeId as nodeId, labels(r) as labels, r.name as name, properties(r) as originalProperties, CASE WHEN size(categories) > 0 THEN categories[0] ELSE COALESCE(r.category, '未知') END as mainCategory, CASE WHEN size(categories) > 0 THEN categories ELSE [COALESCE(r.category, '未知')] END as allCategories ORDER BY r.nodeId """
  • 作用:将图里的“点”重新变成 LLM 容易理解的“文”,同时保留了节点 ID 供后续回溯。

2.索引构建层

  • 流程

    • 向量索引:用Milvus存储文本向量,负责“模糊语义搜素”;

    • 图索引(KV):K:索引键(简短词汇或短语),V:详细描述段落(包含相关文本片段)。将实体(菜谱、食材,烹饪步骤)存入内存字典,负责“精确关键词匹配”。

    栗子

# 处理菜谱实体 for recipe in recipes: entity_id = recipe.node_id # 没有名字就用id拼凑一个 entity_name = recipe.name or f"菜谱_{entity_id}" # 构建详细内容 content_parts = [f"菜品名称: {entity_name}"] # 解析菜谱里的属性 if hasattr(recipe, 'properties'): props = recipe.properties if props.get('description'): content_parts.append(f"描述: {props['description']}") if props.get('category'): content_parts.append(f"分类: {props['category']}") if props.get('cuisineType'): content_parts.append(f"菜系: {props['cuisineType']}") if props.get('difficulty'): content_parts.append(f"难度: {props['difficulty']}") if props.get('cookingTime'): content_parts.append(f"制作时间: {props['cookingTime']}") # 创建键值对 entity_kv = EntityKeyValue( entity_name=entity_name, index_keys=[entity_name], # 使用名称作为唯一索引键 value_content='\n'.join(content_parts), entity_type="Recipe", metadata={ "node_id": entity_id, "properties": getattr(recipe, 'properties', {}) } ) # 以id为主键存入主仓库 self.entity_kv_store[entity_id] = entity_kv # 以名称为主键建立搜索目录 self.key_to_entities[entity_name].append(entity_id)
  • 作用:确保系统既能听懂用户的“言外之意”(向量),也能记住“菜谱”(键值对)。

3.智能路由层

  • 流程:利用LLM预先分析用户的问题。

    • 简单问题 →\rightarrow→ 走传统混合检索。

    • 复杂问题(带“为什么”、“如何”、“关联”) →\rightarrow→ 走图 RAG 检索。

  • 作用降本增效。简单问题不用大费周章查全图,复杂问题不遗漏。

4.核心检索层

  • 流程

    • 双层检索:同时在实体级(具体菜谱)和主题级(菜系/风格)发力。

    • 多跳遍历:这是图RAG的核心优势,通过图结构发现隐含的知识关联。沿着图的箭头走 2-3 步,找关联知识。

    • 合并策略:用 Round-robin(轮询)把图谱结果和向量结果公平地凑在一起。

  • 作用:这是 GraphRAG 的精髓,它带回来的不是一段话,而是一张逻辑关联网

5.生成集成层

  • 流程:将检索到的多维信息注入“自适应提示词(Adaptive Prompt)”,调用大模型生成答案。

  • 作用:负责流式输出、重试机制,确保用户看到的回答既专业又亲切。

学习资源推荐

如果你想更深入地学习大模型,以下是一些非常有价值的学习资源,这些资源将帮助你从不同角度学习大模型,提升你的实践能力。

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!​

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示

​因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限,仅展示部分资料,需要点击文章最下方名片即可前往获取

四、AI大模型商业化落地方案

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

http://www.jsqmd.com/news/340932/

相关文章:

  • 正规的京东e卡回收平台推荐 - 京顺回收
  • 同城生活服务源码系统,一站式满足用户多样化需求
  • 人形机器人足球迈向2050目标:技术挑战与联盟变革
  • 2026年 MBR膜厂家推荐排行榜,中空纤维MBR膜/超滤柱式膜/绳型生物填料/RO膜,专业水处理膜技术品牌深度解析 - 品牌企业推荐师(官方)
  • 2026弹簧针厂家最新推荐:高精密定制化解决方案服务商TOP4,附选型指南 - 博客万
  • AI 工具调用流式开发,TokenStream 才是正确选择
  • 消防科普互动设备|消防装备和器材体验系统
  • 2026年评价高的企业能源管理方案公司推荐:制造企业能源管理方案、制造企业能源管理方案、双向电表、双向计量电表选择指南 - 优质品牌商家
  • 消防数字展厅智能升级|AR消防巡检员体验系统
  • C语言fscanf用法详解:如何从文件读取格式化数据
  • 2026年江苏值得选的聚氨酯平板供应商哪个专业 - myqiye
  • 元气AI Bot下载安装教程及使用教程:从安装到自动化 2026终极效率提升指南 - PC修复电脑医生
  • 干货!零门槛搞懂skills
  • GEO公司哪家好,探讨售后完善的GEO公司服务 - mypinpai
  • 激光清洗:电池电极制造的绿色经济新变革
  • PCB陶瓷基板从原料到出货的全流程追溯
  • Java面向对象——类与对象的创建
  • 2026年重庆3PE钢管厂家权威榜单 全景解析优质厂家及适配方案 各类应用场景 - 深度智识库
  • PCB陶瓷基板市场趋势:国产替代加速材料与工艺双轮驱动
  • 2026年重庆3PE钢管厂家哪家强?各品牌特色及工程适配指南 实力解析 - 深度智识库
  • 2026年度推荐:飞秒光频梳与光纤光频梳领先生产厂家盘点 - 品牌推荐大师
  • 2026年商用地暖厂家权威推荐榜:格力家用空调总代理、格力空调专卖店、格力空调厂家、格力空调总代理、格力空调新风系统选择指南 - 优质品牌商家
  • PCB陶瓷基板从主驱到充电的全场景覆盖
  • win11高级系统设置增加环境变量
  • MindSpore 大模型低比特量化部署进阶:2bit 极致压缩 + 精度补偿
  • 2026年耐腐蚀PA66尼龙隔热条/黑色尼龙隔热条厂家推荐及选择指南 - 品牌宣传支持者
  • PCB陶瓷基板DBC、AMB、DPC、LTCC工艺解析
  • MinIO停更叠加长期短板,寻求替换前请先抛弃工具思维! - 杉岩数据
  • 重磅:2026年度中国博士后国资计划(A、B、C三档)申报指南发布!
  • 不止程序员|全人群转型大模型实战指南,从0到1突破AI转型瓶颈