当前位置：首页 > news >正文

RAG检索“最后一公里”：Text2SQL与Text2Cypher实战，打通多库查询任督二脉！

news 2026/7/24 6:22:38

本文深入解析RAG架构中查询构造的关键环节，重点介绍Text2SQL和Text2Cypher技术，通过LLM将自然语言精准转换为SQL或Cypher查询语句，实现向量数据库、关系型数据库和图数据库的智能交互。文章详细阐述了手动Prompt方式与Spring AI Alibaba NL2SQL引擎的实现细节，并提供了安全防护策略与Schema管理技巧，助力构建高效、安全的智能检索系统。

RAG 优化技术：查询构造

在"查询路由"一文中，我们介绍了如何根据用户意图将问题分发到不同的数据库——向量数据库做语义搜索、图数据库做关系查询、关系型数据库做结构化统计。

但这里有一个关键问题：向量数据库可以直接用自然语言检索，图数据库和关系型数据库却不行——Neo4j 需要 Cypher 查询语句，PostgreSQL 需要 SQL。自然语言问题必须被"翻译"成对应的查询语言，才能真正从这些数据库中取出数据。

查询构造（Query Construction）正是解决这一问题的环节——利用 LLM 将自然语言转化为结构化查询语句（SQL、Cypher 等），打通 RAG 检索链的"最后一公里"。

一、查询构造在 RAG 管道中的位置

回顾 Modular RAG 的完整链路：

用户问题 │ ▼Query Router（路由：决定去哪个数据库） ← 上一篇文章 │ ├──→ 向量数据库：直接语义检索（无需翻译） ├──→ 关系型数据库：需要 Text2SQL ← 本文重点 └──→ 图数据库：需要 Text2Cypher ← 本文重点 │ ▼检索结果合并 → LLM 生成答案

查询构造位于路由之后、实际检索之前——路由决定了"去哪个数据库查"，查询构造决定了"用什么语句查"。

二、Text2SQL——自然语言转 SQL

2.1 原理

Text2SQL（NL2SQL）的目标是将用户的自然语言查询意图，自动转换为结构化 SQL 语句。核心依赖 LLM 对以下三者的理解：

1. 用户的自然语言问题——想查什么
1. 数据库的 Schema（表结构）——有哪些表、字段名是什么、字段含义
1. 当前日期/上下文——“最近三个月”、"今年"等相对时间需要具体日期才能写 SQL

2.2 仙逆场景——修为体系数据库

以《仙逆》知识库中的关系型数据库为例，假设有两张核心表：

-- 角色修为信息表CREATE TABLE app.character_info ( id BIGINT NOT NULL, name VARCHAR(128) NOT NULL, -- 角色姓名 realm VARCHAR(64) NOT NULL, -- 修为境界：凝气/筑基/结丹/元婴/化神/婴变/问鼎/阴虚/阳实/天人/踏天 realm_level INT NOT NULL, -- 境界等级：1-11（凝气=1，踏天=11） sect VARCHAR(128), -- 所属门派 star_system VARCHAR(64), -- 所在星域：朱雀星/联盟星域/仙罡大陆…… breakthrough_date DATE, -- 突破至当前境界的日期 is_active BOOLEANDEFAULTTRUE -- 是否在世);COMMENT ONCOLUMN app.character_info.realm IS'修为境界：凝气、筑基、结丹、元婴、化神、婴变、问鼎、阴虚、阳实、天人、踏天';COMMENT ONCOLUMN app.character_info.realm_level IS'境界等级：1=凝气,2=筑基,3=结丹,4=元婴,5=化神,6=婴变,7=问鼎,8=阴虚,9=阳实,10=天人,11=踏天';-- 法宝信息表CREATE TABLE app.artifact_info ( id BIGINT NOT NULL, name VARCHAR(128) NOT NULL, -- 法宝名称 owner_id BIGINT NOT NULL, -- 持有者 ID，关联 character_info.id grade VARCHAR(32) NOT NULL, -- 品级：凡器/灵器/仙器/神器/古器 artifact_type VARCHAR(64), -- 类型：攻击/防御/空间/灵魂/特殊 description VARCHAR(512) -- 描述);COMMENT ONCOLUMN app.artifact_info.grade IS'品级：凡器、灵器、仙器、神器、古器';COMMENT ONCOLUMN app.artifact_info.artifact_type IS'类型：攻击、防御、空间、灵魂、特殊';

2.3 Prompt 模板设计

Text2SQL 的核心是一套精心设计的 Prompt，需要向 LLM 同时提供表结构、用户问题和当前日期：

# 角色你是一个SQL专家。请根据以下表结构信息将用户问题转换为SQL查询语句。特别注意，你只能查询，不能做修改、删除等操作。# 表结构信息{tables}# 用户问题{user_query}# 要求1. 只返回SQL语句，不需要包含任何解释和说明2. 确保SQL语法正确3. 使用上下文中提供的表名和字段名4. 如果根据所提供的表无法做查询，请直接返回空字符串""# 其他说明今天是:{today}

三个关键占位符：

•{tables}：完整的 DDL 建表语句（含 COMMENT 注释，帮助 LLM 理解字段含义）
•{user_query}：用户原始自然语言问题
•{today}：当前日期，处理"最近"、"今年"等相对时间

2.4 Spring AI 实现——完整 Text2SQL 服务

import jakarta.annotation.PostConstruct;import lombok.extern.slf4j.Slf4j;import org.apache.commons.lang3.StringUtils;import org.springframework.ai.chat.client.ChatClient;import org.springframework.ai.chat.model.ChatModel;import org.springframework.ai.chat.prompt.Prompt;import org.springframework.ai.chat.prompt.PromptTemplate;import org.springframework.beans.factory.annotation.Autowired;import org.springframework.jdbc.core.JdbcTemplate;import org.springframework.stereotype.Service;import java.text.SimpleDateFormat;import java.util.Date;import java.util.Map;/** * 《仙逆》知识库 Text2SQL 服务。 * 将自然语言问题（如"修为超过问鼎期的角色有几人在仙罡大陆"）转换为 SQL 并执行。 */@Service@Slf4jpublic class XianniSqlQueryService { private ChatClient chatClient; @Autowired private ChatModel chatModel; @Autowired private JdbcTemplate jdbcTemplate; @PostConstruct public void init() { chatClient = ChatClient.builder(chatModel).build(); } // ===== Text2SQL Prompt 模板 ===== private static final String TEXT_2_SQL_PROMPT= """ # 角色 你是一个SQL专家。请根据以下表结构信息将用户问题转换为SQL查询语句。\ 特别注意，你只能查询，不能做修改、删除等操作。 # 表结构信息 {tables} # 用户问题 {user_query} # 要求 1. 只返回SQL语句，不需要包含任何解释和说明 2. 确保SQL语法正确 3. 使用上下文中提供的表名和字段名 4. 如果根据所提供的表无法做查询，请直接返回空字符串"" # 其他说明 今天是:{today} """; // ===== 《仙逆》修为体系数据库表结构 ===== private static final String TABLES= """ CREATE TABLE app.character_info ( id BIGINT NOT NULL, name VARCHAR(128) NOT NULL, realm VARCHAR(64) NOT NULL, realm_level INT NOT NULL, sect VARCHAR(128), star_system VARCHAR(64), breakthrough_date DATE, is_active BOOLEAN DEFAULT TRUE ); COMMENT ON COLUMN app.character_info.name IS '角色姓名'; COMMENT ON COLUMN app.character_info.realm IS '修为境界：凝气、筑基、结丹、元婴、化神、婴变、问鼎、阴虚、阳实、天人、踏天'; COMMENT ON COLUMN app.character_info.realm_level IS '境界等级：1=凝气,2=筑基,3=结丹,4=元婴,5=化神,6=婴变,7=问鼎,8=阴虚,9=阳实,10=天人,11=踏天'; COMMENT ON COLUMN app.character_info.sect IS '所属门派'; COMMENT ON COLUMN app.character_info.star_system IS '所在星域'; CREATE TABLE app.artifact_info ( id BIGINT NOT NULL, name VARCHAR(128) NOT NULL, owner_id BIGINT NOT NULL, grade VARCHAR(32) NOT NULL, artifact_type VARCHAR(64), description VARCHAR(512) ); COMMENT ON COLUMN app.artifact_info.name IS '法宝名称'; COMMENT ON COLUMN app.artifact_info.owner_id IS '持有者ID，关联character_info.id'; COMMENT ON COLUMN app.artifact_info.grade IS '品级：凡器、灵器、仙器、神器、古器'; COMMENT ON COLUMN app.artifact_info.artifact_type IS '类型：攻击、防御、空间、灵魂、特殊'; """; /** * 自然语言 → SQL */ public String text2sql(String query) { PromptTemplate promptTemplate = new PromptTemplate(TEXT_2_SQL_PROMPT); SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd"); Prompt prompt = promptTemplate.create( Map.of("user_query", query, "tables", TABLES, "today", sdf.format(new Date()))); String sql= chatClient.prompt(prompt) .call() .content(); log.info("Text2SQL 生成结果: {}", sql); return sql != null ? sql.trim() : ""; } /** * 自然语言 → SQL → 执行 → 返回查询结果 */ public Map<String, Object> sqlQuery(String query) { if (StringUtils.isBlank(query)) { return Map.of("error", "查询问题为空"); } // Step 1: 生成 SQL String sql= text2sql(query); if (StringUtils.isBlank(sql)) { return Map.of("error", "无法根据该问题生成有效的 SQL 查询"); } // Step 2: SQL 安全检查——只允许 SELECT if (!sql.trim().toUpperCase().startsWith("SELECT")) { log.warn("非 SELECT 语句被拦截: {}", sql); return Map.of("error", "仅允许查询操作"); } // Step 3: 执行 SQL try { Map<String, Object> result = jdbcTemplate.queryForMap(sql); log.info("SQL 执行成功，结果: {}", result); return result; } catch (Exception e) { log.error("SQL 执行失败: {}", e.getMessage()); return Map.of("error", "SQL 执行异常: " + e.getMessage()); } }}

2.5 仙逆 Text2SQL 效果演示

用户自然语言问题	LLM 生成的 SQL
“修为达到问鼎期以上的角色有哪些，按境界从高到低排列”	`SELECT name, realm, realm_level FROM app.character_info WHERE realm_level >= 7 ORDER BY realm_level DESC`
“王林持有几件古器级别的法宝”	`SELECT COUNT(*) FROM app.artifact_info WHERE owner_id = (SELECT id FROM app.character_info WHERE name = '王林') AND grade = '古器'`
“仙罡大陆有多少角色修为超过天人”	`SELECT COUNT(*) FROM app.character_info WHERE star_system = '仙罡大陆' AND realm_level >= 10`
“哪个门派的高手最多（问鼎期及以上人数统计）”	`SELECT sect, COUNT(*) as cnt FROM app.character_info WHERE realm_level >= 7 GROUP BY sect ORDER BY cnt DESC`
“王林有几个法宝，分别是什么品级”	`SELECT art.name, art.grade FROM app.artifact_info art JOIN app.character_info ch ON art.owner_id = ch.id WHERE ch.name = '王林'`

2.6 安全防护——三道防线

Text2SQL 的核心风险是 LLM 可能生成DROP、DELETE、UPDATE等破坏性语句。安全防护需要三层：

// 第一层：Prompt 约束——明确告知 LLM "只能查询，不能修改"// （已在 Prompt 模板中约束）// 第二层：代码校验——强制只允许 SELECTif (!sql.trim().toUpperCase().startsWith("SELECT")) { return Map.of("error", "仅允许查询操作");}// 第三层：数据库权限——使用只读账户连接数据库// spring.datasource.username=readonly_user（仅有 SELECT 权限）

三、Spring AI Alibaba NL2SQL——官方开箱即用引擎

3.1 架构概览

除了手动 Prompt 方式，Spring AI Alibaba 提供了一个完整的 NL2SQL 引擎（spring-ai-alibaba-starter-nl2sql），基于StateGraph 状态图工作流编排，包含以下核心节点：

用户自然语言 │ ▼QueryRewriteNode ← 查询改写 & 意图分类（过滤闲聊） │ ▼KeywordExtractNode ← 关键词提取 & 证据收集 │ ▼SchemaRecallNode ← RAG 向量相似度召回相关表和字段 │ ▼TableRelationNode ← 外键分析，聚焦相关 Schema │ ▼PlannerNode ← 多步执行计划生成 │ ▼SqlGenerateNode ← SQL 生成（失败时带错误上下文自动重试，最多 3 次） │ ▼SqlExecuteNode ← SQL 执行 │ ▼SemanticConsistencyNode ← 语义一致性校验 │ ▼返回结果

核心机制：

•Schema 智能召回：对表名、字段名、注释做向量化，用户问题先通过 RAG 召回最相关的表和字段，再生成 SQL——LLM 不需要"记住"整个数据库 Schema
•错误自愈：SQL 执行失败时，将错误信息反馈给 LLM 重新生成，最多重试 3 次
•语义一致性校验：将 SQL 执行结果与用户原始意图对比，不一致时触发重新生成

3.2 Maven 依赖

<dependency> <groupId>com.alibaba.cloud.ai</groupId> <artifactId>spring-ai-alibaba-starter-nl2sql</artifactId> <version>1.0.0</version></dependency>

3.3 最简使用

@Autowiredprivate Nl2SqlService nl2SqlService;// 一行调用完成 Text2SQLString result = nl2SqlService.nl2sql("王林持有几件古器级别的法宝");// 内部自动完成：Schema 召回 → SQL 生成 → 执行 → 结果格式化

3.4 与手动实现的对比

维度	手动 Prompt 实现（2.4 节）	Spring AI Alibaba NL2SQL
Schema 管理	手动将完整 DDL 写入 Prompt	自动向量化 Schema，RAG 召回相关表
复杂查询	依赖单一 Prompt 的一次性生成	多节点 StateGraph 逐步推理
错误处理	需要手动捕获异常	内置最多 3 次错误重试
语义校验	无	SemanticConsistencyNode 自动校验
表数量限制	受 LLM Context Window 限制（DDL 不能太长）	Schema 召回仅注入相关表，突破 Token 上限
适用场景	表少、查询简单的原型验证	企业级多表、复杂查询场景

四、Text2Cypher——自然语言转图查询

4.1 原理

当查询路由把问题分发到图数据库（如 Neo4j）时，需要将自然语言转换为Cypher查询语言。

与 Text2SQL 类似，Text2Cypher 的核心也是Prompt + Schema 注入。区别在于图数据库的 Schema 不是"表结构"，而是节点类型、关系类型和属性。

4.2 仙逆场景——人物关系图

假设《仙逆》人物关系存储在 Neo4j 中，Schema 如下：

节点类型： Character { name, realm, sect, star_system } — 角色 Sect { name, type } — 门派 Artifact { name, grade } — 法宝 Realm { name, level } — 境界关系类型： [:KNOWS] — 相识 [:MASTER_OF] — 师徒（指向徒弟） [:DAOLU_PARTNER] — 道侣（双向） [:SWORN_BROTHER] — 结拜兄弟（双向） [:ENEMY] — 仇敌（双向） [:BELONGS_TO] — 隶属于（指向门派） [:OWNS] — 持有（指向法宝）

用 Cypher 描述图 Schema 供 LLM 理解：

图数据库Schema：节点：- Character(character_id, name, realm, realm_level, sect_name, star_system)- Sect(sect_id, name, type) // type: 正道/魔道/散修- Artifact(artifact_id, name, grade, type) // grade: 凡器/灵器/仙器/神器/古器关系：- [:KNOWS] — 角色之间互相认识- [:MASTER_OF] — 师徒关系（师傅指向徒弟）- [:DAOLU_PARTNER] — 道侣关系- [:ENEMY] — 敌对关系- [:BELONGS_TO] — 角色隶属于门派- [:OWNS] — 角色持有法宝

4.3 Spring AI 实现——Text2Cypher 服务

import jakarta.annotation.PostConstruct;import lombok.extern.slf4j.Slf4j;import org.springframework.ai.chat.client.ChatClient;import org.springframework.ai.chat.model.ChatModel;import org.springframework.ai.chat.prompt.PromptTemplate;import org.springframework.beans.factory.annotation.Autowired;import org.springframework.stereotype.Service;import java.util.List;import java.util.Map;/** * 《仙逆》知识库 Text2Cypher 服务。 * 将自然语言问题转换为 Neo4j Cypher 查询语句。 */@Service@Slf4jpublic class XianniCypherQueryService { private ChatClient chatClient; @Autowired private ChatModel chatModel; // 实际项目中注入 Neo4j Driver 或 Neo4jTemplate // @Autowired // private Neo4jTemplate neo4jTemplate; @PostConstruct public void init() { chatClient = ChatClient.builder(chatModel).build(); } private static final String TEXT_2_CYPHER_PROMPT= """ # 角色 你是一个 Neo4j Cypher 查询专家。请根据以下图数据库的 Schema 信息，\ 将用户问题转换为 Cypher 查询语句。 # 图数据库 Schema {schema} # 用户问题 {user_query} # 要求 1. 只返回 Cypher 查询语句，不要包含任何解释 2. 确保 Cypher 语法正确，使用 MATCH、WHERE、RETURN 等标准子句 3. 仅使用查询语句（MATCH…RETURN），禁止 CREATE、DELETE、DETACH DELETE 等写操作 4. 如果 Schema 中不包含回答该问题所需的信息，返回空字符串 "" # Cypher 输出 """; // 《仙逆》人物关系图 Schema privatestaticfinalStringGRAPH_SCHEMA= """ 节点： - Character { name, realm, realm_level, star_system } - Sect { name, type } - Artifact { name, grade, type } 关系： - (c1:Character)-[:KNOWS]->(c2:Character) 角色相识 - (master:Character)-[:MASTER_OF]->(disciple:Character) 师徒关系 - (c1:Character)-[:DAOLU_PARTNER]->(c2:Character) 道侣关系 - (c1:Character)-[:ENEMY]->(c2:Character) 敌对关系 - (c:Character)-[:BELONGS_TO]->(s:Sect) 隶属于 - (c:Character)-[:OWNS]->(a:Artifact) 持有法宝 """; /** * 自然语言 → Cypher */ public String text2cypher(String query) { PromptTemplate template= new PromptTemplate(TEXT_2_CYPHER_PROMPT); var prompt= template.create( Map.of("schema", GRAPH_SCHEMA, "user_query", query)); Stringcypher= chatClient.prompt(prompt) .call() .content(); log.info("Text2Cypher 生成结果: {}", cypher); return cypher != null ? cypher.trim() : ""; } /** * 自然语言 → Cypher → 执行 → 返回图查询结果 */ public List<Map<String, Object>> cypherQuery(String query) { String cypher= text2cypher(query); if (cypher.isBlank()) { log.warn("无法为该问题生成 Cypher 查询: {}", query); return List.of(); } // 安全检查——仅允许 MATCH if (!cypher.trim().toUpperCase().startsWith("MATCH")) { log.warn("非 MATCH 语句被拦截: {}", cypher); return List.of(); } log.info("执行 Cypher: {}", cypher); // 实际执行：return neo4jTemplate.query(cypher, Map.of()); return List.of(); // 示例——实际返回 Neo4j 查询结果 }}

4.4 仙逆 Text2Cypher 效果演示

用户自然语言问题	LLM 生成的 Cypher
“王林的徒弟有哪些人”	`MATCH (master:Character {name:'王林'})-[:MASTER_OF]->(disciple:Character) RETURN disciple.name, disciple.realm`
“司徒南和王林是什么关系”	`MATCH (a:Character {name:'司徒南'})-[r]->(b:Character {name:'王林'}) RETURN type(r) AS relationship`
“在王林的关系网络中，与他敌对的人分别来自哪些门派”	`MATCH (wl:Character {name:'王林'})-[:ENEMY]->(enemy:Character) OPTIONAL MATCH (enemy)-[:BELONGS_TO]->(s:Sect) RETURN enemy.name, enemy.realm, s.name AS sect`
“谁持有最多的古器级别法宝”	`MATCH (c:Character)-[:OWNS]->(a:Artifact {grade:'古器'}) RETURN c.name, COUNT(a) AS count ORDER BY count DESC LIMIT 5`
“从王林到天运子最短的关系路径是什么”	`MATCH path = shortestPath((a:Character {name:'王林'})-[*]-(b:Character {name:'天运子'})) RETURN path`

4.5 LangChain4j 原生 Neo4jText2CypherRetriever

LangChain4j 社区提供了开箱即用的 Text2Cypher 检索器：

<dependency> <groupId>dev.langchain4j</groupId> <artifactId>langchain4j-community-neo4j</artifactId> <version>${langchain4j.version}</version></dependency> ``````plaintext // LangChain4j 的 Neo4jText2CypherRetriever 将 Text2Cypher 封装为 ContentRetriever，// 可直接接入 AiServices 管道Neo4jText2CypherRetriever cypherRetriever= Neo4jText2CypherRetriever.builder() .driver(neo4jDriver) // Neo4j Driver 实例 .chatLanguageModel(chatModel) // 用于生成 Cypher 的 LLM .build();// 注入到 AiServices 中，自动完成：自然语言 → Cypher → 执行 → 结果XianniGraphAssistant assistant= AiServices.builder(XianniGraphAssistant.class) .chatLanguageModel(chatModel) .contentRetriever(cypherRetriever) .build();String answer= assistant.answer("王林的关系网络中有哪些关键人物");// 内部自动生成 Cypher、执行、将结果交给 LLM 组织成自然语言回答

五、LangChain4j SqlDatabaseContentRetriever——Text2SQL 的封装版

LangChain4j 同样提供了自动化的 Text2SQL 组件（标注为@Experimental）：

<dependency> <groupId>dev.langchain4j</groupId> <artifactId>langchain4j-experimental</artifactId> <version>${langchain4j.version}</version></dependency> ``````plaintext import dev.langchain4j.experimental.rag.content.retriever.sql.SqlDatabaseContentRetriever;import javax.sql.DataSource;/** * SqlDatabaseContentRetriever 自动完成： * 1. 通过 JDBC 元数据提取 Schema（不需要手动写 DDL） * 2. 生成 SQL → JSqlParser 校验 → 执行 → 错误重试 * 3. 将结果交给 LLM 组织成自然语言 */SqlDatabaseContentRetriever sqlRetriever= SqlDatabaseContentRetriever.builder() .dataSource(dataSource) // 注入数据源 .chatLanguageModel(chatModel) // 用于生成 SQL 的 LLM .maxRetries(3) // SQL 失败最多重试 3 次 .includedTableNames( // 限制可见表范围（安全措施） "character_info", "artifact_info") .build();// 接入 AiServicesXianniDataAssistant assistant= AiServices.builder(XianniDataAssistant.class) .chatLanguageModel(chatModel) .contentRetriever(sqlRetriever) .build();String answer= assistant.answer("仙罡大陆修为超过天人境界的角色有多少");// 内部自动：提取 Schema → 生成 SQL → 校验 → 执行 → 结果 → LLM 格式化回答

Spring AI 与 LangChain4j Text2SQL 对比

维度	Spring AI 手动实现	Spring AI Alibaba NL2SQL	LangChain4j SqlDatabaseContentRetriever
Schema 来源	手动编写 DDL	向量化 Schema + RAG 召回	JDBC 元数据自动提取
工作流复杂度	单次 Prompt	StateGraph 多节点编排	单次 Prompt + 重试
错误处理	自行捕获	最多 3 次重试 + 语义校验	最多 N 次重试（可配置）
生产就绪度	需自行完善	生产级（阿里析言 GBI 产品线开源）	@Experimental（不建议直接上生产）
数据库支持	任意（手动写 DDL 即可）	MySQL、PostgreSQL、H2	通过 JDBC 连接的数据库

六、查询构造与查询路由的组合

回顾从路由到构造的完整链路——路由决定"去哪查"，构造决定"怎么查"：

@RestController@RequestMapping("/rag")public class RagQueryController { @Autowired private QueryRouteService routeService; // 上一篇的路由服务 @Autowired private VectorDatabaseService vectorService; @Autowired private XianniSqlQueryService sqlService; // Text2SQL 服务 @Autowired private XianniCypherQueryService cypherService; // Text2Cypher 服务 @Autowired private ChatClient chatClient; @GetMapping("/query") public String fullPipeline(@RequestParam("question") String question) { // Step 1: 路由——判断去哪个数据库 String dbType= routeService.route(question); // Step 2: 查询构造 + 检索——根据数据库类型选择策略 String retrievedData; switch (dbType.trim()) { case "VECTOR": // 向量数据库：直接语义检索，无需翻译 retrievedData = vectorService.searchVectorDatabase(question); break; case "GRAPH": // 图数据库：Text2Cypher → Cypher → 执行 String cypher= cypherService.text2cypher(question); retrievedData = executeCypher(cypher); // 实际执行 Cypher break; case "RELATIONAL": // 关系型数据库：Text2SQL → SQL → 执行 Map<String, Object> sqlResult = sqlService.sqlQuery(question); retrievedData = sqlResult.toString(); break; default: retrievedData = vectorService.searchVectorDatabase(question); } // Step 3: LLM 基于检索结果生成最终答案 return chatClient.prompt() .user("基于以下检索结果回答用户问题。\n检索结果：\n" + retrievedData + "\n\n用户问题：" + question) .call() .content(); }}

仙逆示例执行链：

用户问题："王林有几件古器级别的法宝，他的道侣是谁" │ ▼ 查询路由（LLM 意图分类） ├── 前半句 → RELATIONAL（结构化统计） → Text2SQL 服务 │ └── SELECT COUNT(*) FROM artifact_info WHERE owner_id=... │ └── 后半句 → GRAPH（关系查询） → Text2Cypher 服务 └── MATCH (wl:Character {name:'王林'})-[:DAOLU_PARTNER]-(partner) RETURN partner.name │ ▼ 结果合并 + LLM 生成答案 "王林持有天逆珠（古器）、昆极鞭（古器）共 2 件古器。他的道侣是李慕婉。"

七、注意事项与小结

要点	说明
查询构造的本质	LLM 将自然语言翻译为结构化查询语言（SQL / Cypher），是路由到非向量数据库的必备桥梁
Prompt 设计要点	必须包含：角色定义 + 完整 Schema（含注释）+ 用户问题 + 当前日期，四者缺一不可
安全三层防护	Prompt 约束（只查询） → 代码校验（拦截非 SELECT/MATCH） → 数据库只读账户
Schema 管理策略	表少可直接注入 DDL；表多推荐 Spring AI Alibaba 的 RAG Schema 召回方案
错误自愈	Spring AI Alibaba NL2SQL 和 LangChain4j 均支持执行失败后带错误上下文重新生成
成本控制	Text2SQL/Text2Cypher 每次调用 LLM——建议用轻量模型（如 DeepSeek-V4 Pro 或 Qwen3-Plus），温度设为 0.0
图 + SQL 双轨	关系型查"数量/统计/列表"，图数据库查"关系/路径/网络"——各擅其长，路由分工