当前位置: 首页 > news >正文

SQL Server RAG 笔记1:图数据库构建

在AI开发中,知识图谱是非常火的一个领域,而提到图数据库大家都会第一时间想到Neo4J,其实在SQLServer中早已有支持,此篇将简单演示如何在SQLServer下构建图数据库,实现知识图谱的管理。

最终,我们将搭建出一个如下的简单知识图谱页面:


SQL Server 图数据库搭建

数据库创建与配置

开始之前需要确定SQLServer安装的版本是2017之后的版本。

-- 创建支持中文的图数据库 CREATE DATABASE GraphDB COLLATE Chinese_PRC_CI_AS; GO USE GraphDB; GO

库的创建跟创建常规数据库的方法一致。


图数据库核心表结构

在SQLServer中跟Neo4J一样基本物件都是NODE和EDGE,在SQLServer中的创建方法如下:

节点表 (Nodes)

-- 使用 AS NODE 创建原生图节点表 CREATE TABLE Nodes ( NodeType NVARCHAR(100) NOT NULL, Name NVARCHAR(255) NOT NULL, Properties NVARCHAR(MAX) DEFAULT '{}', CreatedAt DATETIME2 DEFAULT GETDATE(), UpdatedAt DATETIME2 DEFAULT GETDATE(), IsDeleted BIT DEFAULT 0 ) AS NODE; -- 创建索引 CREATE INDEX IX_Nodes_NodeType ON Nodes(NodeType); CREATE INDEX IX_Nodes_Name ON Nodes(Name);

知识点笔记

  • AS NODE:将表声明为图节点表,SQL Server 自动添加$node_id
  • $node_id:系统生成的唯一标识,格式为 JSON(如{"type":"node","schema":"dbo","table":"Nodes","id":0}
  • 自定义列:NodeTypeNameProperties等业务字段
  • 无需手动定义主键,SQL Server 自动管理节点 ID

边表 (Edges)

-- 使用 AS EDGE 创建原生图边表 CREATE TABLE Edges ( EdgeType NVARCHAR(100) NOT NULL, Properties NVARCHAR(MAX) DEFAULT '{}', Weight FLOAT DEFAULT 1.0, CreatedAt DATETIME2 DEFAULT GETDATE(), UpdatedAt DATETIME2 DEFAULT GETDATE(), IsDeleted BIT DEFAULT 0 ) AS EDGE; -- 创建索引 CREATE INDEX IX_Edges_EdgeType ON Edges(EdgeType);

知识点笔记

  • AS EDGE:将表声明为图边表,SQL Server 自动添加$edge_id$from_id$to_id
  • $edge_id:边的唯一标识,JSON 格式
  • $from_id:起始节点的$node_id
  • $to_id:目标节点的$node_id
  • 方向性:边是有向的,$from_id指向$to_id
  • 无需外键约束,原生图自动维护引用完整性

创建节点和关系跟Neo4J的Cypher语句差别很大,这里需要留意。


测试数据生成

插入节点数据

-- 人物节点 INSERT INTO Nodes (NodeType, Name, Properties) VALUES ('Person', '张三', '{"age": 35, "occupation": "工程师", "city": "北京"}'), ('Person', '李四', '{"age": 42, "occupation": "CEO", "city": "深圳"}'), ('Person', '王五', '{"age": 28, "occupation": "产品经理", "city": "杭州"}'); -- 公司节点 INSERT INTO Nodes (NodeType, Name, Properties) VALUES ('Company', '腾讯科技', '{"founded_year": 1998, "industry": "互联网"}'), ('Company', '阿里巴巴', '{"founded_year": 1999, "industry": "电子商务"}'), ('Company', '字节跳动', '{"founded_year": 2012, "industry": "科技"}');

插入边关系数据 - 使用原生图语法

-- 工作关系:使用 $from_id 和 $to_id 插入边 INSERT INTO Edges ($from_id, $to_id, EdgeType, Properties) SELECT n1.$node_id, n2.$node_id, 'WORKS_AT', '{"department": "技术部", "start_year": 2020}' FROM Nodes n1, Nodes n2 WHERE n1.Name = '张三' AND n2.Name = '腾讯科技'; INSERT INTO Edges ($from_id, $to_id, EdgeType, Properties) SELECT n1.$node_id, n2.$node_id, 'FOUNDED', '{"role": "创始人"}' FROM Nodes n1, Nodes n2 WHERE n1.Name = '李四' AND n2.Name = '阿里巴巴';

知识点笔记

  • 使用$from_id$to_id指定边的起始和目标节点
  • 通过子查询从已有节点获取$node_id
  • 边类型命名采用大写蛇形命名法,保持一致性
  • JSON 属性字段支持灵活扩展

复杂关系网络构建

-- 产品节点 INSERT INTO Nodes (NodeType, Name, Properties) VALUES ('Product', '微信', '{"launch_year": 2011, "category": "社交"}'), ('Product', '淘宝', '{"launch_year": 2003, "category": "电商"}'); -- 产品归属关系 INSERT INTO Edges ($from_id, $to_id, EdgeType, Properties) SELECT n1.$node_id, n2.$node_id, 'PRODUCES', '{}' FROM Nodes n1, Nodes n2 WHERE n1.Name = '腾讯科技' AND n2.Name = '微信'; INSERT INTO Edges ($from_id, $to_id, EdgeType, Properties) SELECT n1.$node_id, n2.$node_id, 'PRODUCES', '{}' FROM Nodes n1, Nodes n2 WHERE n1.Name = '阿里巴巴' AND n2.Name = '淘宝';

图数据库查询实战

查询节点及其邻居 - MATCH 语法

-- 使用 MATCH 语法查询张三的直接关系 SELECT n1.Name AS source_name, e.EdgeType, n2.Name AS target_name FROM Nodes n1, Edges e, Nodes n2 WHERE MATCH(n1-(e)->n2) AND n1.Name = '张三';

知识点笔记:

  • MATCH语法:SQL Server 原生图查询语法
  • n1-(e)->n2:表示从 n1 通过边 e 指向 n2
  • 方向性:->表示有向边从 n1 到 n2
  • 无需 JOIN 关键字,路径关系在 MATCH 中声明

多跳路径查询

-- 查询张三所属公司的产品(两跳查询) SELECT n1.Name AS person_name, n2.Name AS company_name, n3.Name AS product_name FROM Nodes n1, Edges e1, Nodes n2, Edges e2, Nodes n3 WHERE MATCH(n1-(e1)->n2-(e2)->n3) AND n1.Name = '张三' AND e1.EdgeType = 'WORKS_AT' AND e2.EdgeType = 'PRODUCES';

知识点笔记:

  • MATCH支持多跳路径:n1-(e1)->n2-(e2)->n3
  • 在一条 MATCH 中声明完整的路径模式
  • 边类型过滤:e1.EdgeType = 'WORKS_AT'
  • 支持任意深度的路径查询

查询边的方向信息

-- 查询边的方向(入向/出向) SELECT n.Name AS node_name, e.EdgeType, CASE WHEN e.$from_id = n.$node_id THEN 'outgoing' ELSE 'incoming' END AS direction FROM Nodes n, Edges e, Nodes n2 WHERE MATCH(n-(e)->n2) AND (n.Name = '张三' OR n2.Name = '张三');

运行测试查询会发现SQLServer在SSMS里目前还并不像Neo4J自带的browser一样可以直接把知识图谱展现出来,目前能显示的只是常规表格数据。想要看到知识图谱效果,后续需要自己搭建对应的前端应用。

http://www.jsqmd.com/news/1074972/

相关文章:

  • 终极Office激活钩子:革命性免费解锁Microsoft 365完整功能
  • Windows X-Lite 26H1 V3 第三方精简系统说明与完整安装实操指南
  • 听了一半的播客做个手势就传到平板继续听——鸿蒙隔空投送让内容跟着人走
  • 四个代码知识图谱项目对比:Understand-Anything、codegraph、GitNexus、codebase-memory-mcp 怎么选?
  • 番茄小说下载器:三步打造个人数字图书馆的免费神器
  • 腾讯AI应用开发一面,我懵了!!!
  • 【AI技术实战】企业级AI Agent平台搭建指南:从小鹏汽车“灵犀“看Agentic AI落地实践
  • 洛谷 P1866:编号 ← 排序
  • Kinovea运动分析软件:从入门到精通的完整指南
  • 被顶级AI实验室青睐的6所‘机器学习学校’实操指南
  • 在普通CPU上跑通Vicuna大模型的实战指南
  • VMware虚拟机启动报“Failed to start virtual machine”?资深架构师手把手复现+定位+修复(含12个真实客户案例脱敏分析)
  • 如何免费获取百度文库等30+平台文档:kill-doc终极指南
  • FFmpegGUI终极指南:如何用可视化界面轻松处理视频音频文件
  • 实战指南:深度解析Sunshine自托管游戏串流服务器的架构与应用
  • 5大优势揭秘:Ai2Psd终极指南助你实现AI到PSD完美转换
  • 全网热门车载音乐免费下载,无损品质资源!
  • Gemini API生产级落地指南:多模态调用、认证配置与响应解析
  • 小产坐月子十大忌讳有哪些?科学人流术后恢复指南
  • 阿里面试官笑了!连 Graph RAG 都不懂!!
  • 抖音无水印视频下载终极指南:3步实现批量下载与完整内容保存
  • 如何通过5个步骤绕过iOS 15-16激活锁:AppleRa1n开源工具详解
  • Nginx限流配置实战:保护你的个人项目
  • Multilogin 替代方案选型:团队环境、任务日志和交接字段怎么检查
  • 国内网络环境下的 Docker 镜像迁移与加速实战:用 Skopeo 替代 docker pull + docker tag + docker push
  • DCGAN六条铁律:解决模式坍缩与生成不稳的工程实践指南
  • 我怎么把上线前检查整理成一个交付 Skill
  • Vision-Language模型实战学习路径:从组件验证到端到端训练
  • 告别低效写作:高效论文写作全流程一键生成论文工具推荐(2026 最新)
  • Apple用Swift重写容器引擎?5层架构与轻量级VM深度剖析