当前位置：首页 > news >正文

Java: 手动实现DeepSeek R1工具调用，基于ReAct与Spring AI的实践指南

news 2026/3/26 12:56:46

1. DeepSeek R1工具调用的现状与挑战

DeepSeek R1作为当前热门的开源大模型，在实际应用中经常会遇到需要调用外部工具的场景。但很多开发者在使用过程中发现，当前版本的DeepSeek R1并不支持原生的工具调用功能。这意味着当我们想让模型执行诸如查询天气、计算数学公式、调用数据库等操作时，模型本身无法直接完成这些任务。

我在实际项目中也遇到了这个问题。比如需要开发一个智能客服系统，当用户询问"北京明天天气怎么样"时，理想情况是模型能自动调用天气API获取数据。但直接使用DeepSeek R1会发现它只能给出类似"我可以帮你查询天气"这样的回应，而无法真正执行查询操作。

这种情况下的核心痛点在于：

模型无法识别何时需要调用工具
即使识别了需求，也没有标准化的方式来触发工具执行
工具执行结果无法有效反馈给模型进行后续处理

好消息是DeepSeek官方已经在GitHub上确认，下一个大版本会支持原生工具调用功能。但对于急需该功能的开发者来说，等待可能不是最佳选择。这就引出了我们今天要讨论的主题：如何基于ReAct思想和Spring AI框架，手动实现工具调用功能。

2. ReAct思想解析与提示词设计

2.1 什么是ReAct模式

ReAct(Reasoning and Acting)是一种让大模型能够进行推理和行动的技术框架。它的核心思想是将问题解决过程分解为"思考-行动-观察"的循环：

思考(Thought): 模型分析当前情况，决定下一步行动
行动(Action): 模型选择执行某个工具或直接回答
观察(Observation): 获取行动结果，作为下一轮思考的输入

这种模式特别适合DeepSeek R1这类不支持原生工具调用的模型。我曾在电商推荐系统中应用这个模式，让模型能够根据用户查询调用商品数据库，效果相当不错。

2.2 提示词设计要点

要让DeepSeek R1按照ReAct模式工作，关键在于设计严格的提示词。以下是经过我多次调试后的优化版本：

{ "action": "weather_query", "action_input": { "location": "北京", "date": "2023-11-20" } }

提示词中需要明确几个关键部分：

工具定义：清晰列出所有可用工具及其参数格式
响应格式：严格规定模型必须返回的JSON结构
流程控制：明确"思考-行动-观察"的循环机制

在实际应用中，我发现中文提示词对DeepSeek R1的效果更好。可能是因为模型对中文的理解更深入，出错率明显低于英文提示词。

3. Spring AI框架集成实践

3.1 Spring AI工具调用基础

Spring AI提供了完善的工具调用支持，即使底层模型(如DeepSeek R1)不原生支持，也能通过框架层实现。我在项目中主要使用了以下核心组件：

Tool接口：定义工具的基本契约
ToolExecutor：负责实际执行工具调用
ToolCallListener：监听工具调用事件

一个简单的天气查询工具实现如下：

@Bean public Tool weatherTool() { return new Tool() { @Override public String getName() { return "weather_query"; } @Override public String getDescription() { return "查询指定地点和日期的天气情况"; } @Override public Object execute(Map<String, Object> inputs) { // 实际调用天气API的逻辑 return weatherService.query( (String)inputs.get("location"), (String)inputs.get("date") ); } }; }

3.2 工具执行流程控制

完整的工具调用流程可以分为以下几个步骤：

初始化对话：设置系统提示词，包含工具定义和ReAct规则
用户提问：接收用户输入，触发模型推理
解析响应：从模型输出中提取JSON action
工具执行：根据action调用相应工具
结果反馈：将工具结果作为观察输入下一轮对话
循环处理：重复直到获得Final Answer

这个流程中最大的挑战是保持对话上下文的一致性。我的经验是每次工具调用后，需要将完整的"思考-行动-观察"记录添加到对话历史中。

4. 完整实现示例与优化技巧

4.1 端到端实现代码

下面是一个完整的Spring Boot应用示例，展示如何集成DeepSeek R1与工具调用：

@RestController public class ToolController { @Autowired private ChatClient chatClient; @PostMapping("/ask") public String askQuestion(@RequestBody String question) { // 初始化对话 List<Message> messages = new ArrayList<>(); messages.add(new SystemMessage(REACT_PROMPT)); messages.add(new UserMessage(question)); // 对话循环 while (true) { ChatResponse response = chatClient.call(messages); String content = response.getContent(); // 解析JSON action JsonNode action = parseAction(content); if (action == null) { return "无法解析模型响应"; } // 检查是否为最终答案 if ("Final Answer".equals(action.get("action").asText())) { return action.get("action_input").asText(); } // 执行工具 String toolName = action.get("action").asText(); JsonNode toolInput = action.get("action_input"); Object toolResult = toolExecutor.execute(toolName, toolInput); // 更新对话上下文 messages.add(new AssistantMessage(content)); messages.add(new UserMessage("Observation: " + toolResult)); } } }