当前位置：首页 > news >正文

EcomGPT-中英文-7B电商模型Java开发实战：SpringBoot集成与商品推荐API构建

news 2026/3/26 22:18:56

EcomGPT-中英文-7B电商模型Java开发实战：SpringBoot集成与商品推荐API构建

最近在做一个电商项目，产品经理提了个需求，想给用户推荐更精准的商品，而不是千篇一律的“热销榜”。我们团队评估了几个方案，最后决定试试用大模型来做这件事。EcomGPT-7B这个专门针对电商场景训练的中英文模型，就成了我们的首选。

它最大的好处是“懂行”，不仅能理解“帮我找一条适合夏天穿的连衣裙”这种模糊需求，还能结合商品标题、描述甚至用户评论，给出更贴切的推荐。对我们Java后端开发来说，关键是怎么把这个模型能力，平滑地集成到现有的SpringBoot架构里，既要保证推荐效果，又不能拖慢系统响应。

这篇文章，我就结合我们团队的实际踩坑经验，聊聊怎么在SpringBoot项目中，把EcomGPT-7B用起来，构建一个稳定、高效的智能商品推荐服务。我会从最基础的API调用封装讲起，再到如何与现有数据库联动，最后分享一些我们在性能调优上遇到的坑和解决办法。代码都是可以直接跑的，希望能帮你省点时间。

1. 环境准备与项目初始化

在开始写代码之前，得先把环境和依赖准备好。我们假设你已经有一个正在运行的SpringBoot 2.x项目，并且对Maven或Gradle比较熟悉。

1.1 核心依赖引入

首先，需要在你的pom.xml文件中添加必要的依赖。核心是用于HTTP客户端调用模型API，以及处理JSON和并发任务。

<dependencies> <!-- SpringBoot Web Starter (如果已有则忽略) --> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-web</artifactId> </dependency> <!-- OkHttp - 用于调用模型HTTP API --> <dependency> <groupId>com.squareup.okhttp3</groupId> <artifactId>okhttp</artifactId> <version>4.11.0</version> </dependency> <!-- Jackson - JSON处理 --> <dependency> <groupId>com.fasterxml.jackson.core</groupId> <artifactId>jackson-databind</artifactId> </dependency> <!-- Lombok - 简化代码 (可选但推荐) --> <dependency> <groupId>org.projectlombok</groupId> <artifactId>lombok</artifactId> <optional>true</optional> </dependency> <!-- SpringBoot Validation (用于参数校验) --> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-validation</artifactId> </dependency> </dependencies>

1.2 模型服务准备

EcomGPT-7B模型需要部署在能够提供HTTP API的服务上。通常有两种方式：

自行部署：如果你有GPU服务器，可以下载模型权重，使用类似FastChat、vLLM或TGI（Text Generation Inference）的框架部署成服务。
使用云服务API：一些云平台提供了预部署的模型服务，可以直接调用。

为了简化，我们假设模型服务已经部署好，并提供了一个类似http://your-model-server/v1/chat/completions的API端点。你需要准备以下信息：

模型服务地址 (BASE_URL)：如http://192.168.1.100:8000
API密钥 (API_KEY)：如果服务有鉴权的话。
模型名称 (MODEL_NAME)：如EcomGPT-7B。

建议将这些配置放在application.yml中：

# application.yml ecomgpt: model: base-url: ${ECOMGPT_BASE_URL:http://localhost:8000} api-key: ${ECOMGPT_API_KEY:} model-name: ${ECOMGPT_MODEL_NAME:EcomGPT-7B} # 推荐相关配置 recommendation: max-tokens: 512 # 模型生成的最大token数 temperature: 0.7 # 生成多样性，值越高越随机

2. 核心：封装模型API客户端

直接在每个业务代码里写HTTP调用会很乱，也不利于维护和优化。我们的第一步是构建一个健壮的、可配置的模型客户端。

2.1 定义配置与请求响应类

首先，创建配置类来读取application.yml中的设置。

// config/EcomGPTConfig.java import lombok.Data; import org.springframework.boot.context.properties.ConfigurationProperties; import org.springframework.stereotype.Component; @Data @Component @ConfigurationProperties(prefix = "ecomgpt.model") public class EcomGPTConfig { private String baseUrl; private String apiKey; private String modelName; }

然后，定义调用模型API时所需的请求体和响应体的数据结构。这能让我们用对象的方式操作，而不是拼接字符串。

// dto/request/ChatCompletionRequest.java import lombok.Data; import java.util.List; @Data public class ChatCompletionRequest { private String model; private List<Message> messages; private Integer max_tokens; private Double temperature; @Data public static class Message { private String role; // "system", "user", "assistant" private String content; public Message(String role, String content) { this.role = role; this.content = content; } } }

// dto/response/ChatCompletionResponse.java import lombok.Data; import java.util.List; @Data public class ChatCompletionResponse { private String id; private String object; private Long created; private String model; private List<Choice> choices; private Usage usage; @Data public static class Choice { private Integer index; private Message message; private String finish_reason; } @Data public static class Message { private String role; private String content; } @Data public static class Usage { private Integer prompt_tokens; private Integer completion_tokens; private Integer total_tokens; } }

2.2 实现模型服务客户端

这是最核心的部分，我们使用OkHttpClient来发送请求，并处理响应和异常。

// service/impl/EcomGPTClientServiceImpl.java import com.fasterxml.jackson.databind.ObjectMapper; import lombok.extern.slf4j.Slf4j; import okhttp3.*; import org.springframework.beans.factory.annotation.Autowired; import org.springframework.stereotype.Service; import javax.annotation.PostConstruct; import java.io.IOException; import java.util.concurrent.TimeUnit; @Slf4j @Service public class EcomGPTClientServiceImpl { @Autowired private EcomGPTConfig config; @Autowired private ObjectMapper objectMapper; private OkHttpClient httpClient; @PostConstruct public void init() { // 配置HTTP客户端，设置连接超时和读取超时 this.httpClient = new OkHttpClient.Builder() .connectTimeout(30, TimeUnit.SECONDS) // 连接超时 .readTimeout(120, TimeUnit.SECONDS) // 读取超时（模型推理可能较慢） .writeTimeout(30, TimeUnit.SECONDS) .build(); } /** * 调用模型聊天补全API * @param messages 对话消息列表 * @param maxTokens 最大生成token数 * @param temperature 温度参数 * @return 模型返回的文本内容 */ public String chatCompletion(List<ChatCompletionRequest.Message> messages, Integer maxTokens, Double temperature) throws IOException { // 1. 构建请求体 ChatCompletionRequest requestBody = new ChatCompletionRequest(); requestBody.setModel(config.getModelName()); requestBody.setMessages(messages); requestBody.setMax_tokens(maxTokens); requestBody.setTemperature(temperature); String jsonBody = objectMapper.writeValueAsString(requestBody); RequestBody body = RequestBody.create(jsonBody, MediaType.get("application/json")); // 2. 构建HTTP请求 String url = config.getBaseUrl() + "/v1/chat/completions"; Request.Builder requestBuilder = new Request.Builder() .url(url) .post(body); // 添加API Key鉴权头（如果需要） if (config.getApiKey() != null && !config.getApiKey().isEmpty()) { requestBuilder.addHeader("Authorization", "Bearer " + config.getApiKey()); } Request request = requestBuilder.build(); // 3. 发送请求并处理响应 try (Response response = httpClient.newCall(request).execute()) { if (!response.isSuccessful()) { String errorBody = response.body() != null ? response.body().string() : "null"; log.error("模型API调用失败，状态码: {}, 响应: {}", response.code(), errorBody); throw new RuntimeException("模型服务调用失败: " + response.code()); } String responseBody = response.body().string(); ChatCompletionResponse completionResponse = objectMapper.readValue(responseBody, ChatCompletionResponse.class); if (completionResponse.getChoices() != null && !completionResponse.getChoices().isEmpty()) { return completionResponse.getChoices().get(0).getMessage().getContent(); } else { throw new RuntimeException("模型返回结果为空"); } } catch (IOException e) { log.error("调用模型API时发生IO异常", e); throw e; } } }

3. 构建商品推荐服务

有了基础的客户端，我们就可以围绕电商业务来构建推荐服务了。核心思路是：将用户需求、用户历史行为（可选）和候选商品信息，组织成模型能理解的对话Prompt，然后解析模型的返回结果。

3.1 设计推荐Prompt

Prompt的设计直接决定了推荐效果。一个好的Prompt应该清晰定义角色、任务和输出格式。

// service/impl/ProductRecommendationServiceImpl.java import lombok.extern.slf4j.Slf4j; import org.springframework.beans.factory.annotation.Autowired; import org.springframework.beans.factory.annotation.Value; import org.springframework.stereotype.Service; import java.util.ArrayList; import java.util.List; @Slf4j @Service public class ProductRecommendationServiceImpl { @Autowired private EcomGPTClientServiceImpl ecomGPTClient; @Autowired private ProductService productService; // 假设的商品服务，用于获取候选商品 @Value("${ecomgpt.recommendation.max-tokens:512}") private Integer defaultMaxTokens; @Value("${ecomgpt.recommendation.temperature:0.7}") private Double defaultTemperature; /** * 基于用户查询进行智能商品推荐 * @param userQuery 用户查询，如“想要一款轻薄续航长的笔记本电脑” * @param candidateProductIds 候选商品ID列表（可从数据库根据粗略条件筛选） * @return 模型生成的推荐理由和商品ID（需要后续解析） */ public String recommendProducts(String userQuery, List<String> candidateProductIds) throws Exception { // 1. 从数据库获取候选商品的详细信息 List<Product> candidateProducts = productService.getProductsByIds(candidateProductIds); if (candidateProducts.isEmpty()) { return "未找到相关商品。"; } // 2. 构建候选商品信息文本 StringBuilder productsInfo = new StringBuilder(); for (Product product : candidateProducts) { productsInfo.append(String.format("- 商品ID: %s, 标题: 《%s》, 关键属性: %s, 主要卖点: %s\n", product.getId(), product.getTitle(), product.getKeyAttributes(), // 如“颜色:黑色, 尺寸:15寸, 处理器:i7” product.getSellingPoints() // 如“超长续航20小时，重量仅1.2kg” )); } // 3. 构建系统指令和用户消息 List<ChatCompletionRequest.Message> messages = new ArrayList<>(); // 系统消息：定义模型角色和任务 String systemPrompt = "你是一个专业的电商推荐助手。请根据用户的查询，从给定的候选商品列表中，挑选出最匹配的1-3个商品。\n" + "请按以下格式回复：\n" + "**推荐理由**：[简要说明为什么推荐这些商品，如何满足用户需求]\n" + "**推荐商品ID**：[列出推荐的商品ID，用逗号分隔，例如：P1001, P1002]\n" + "注意：只从提供的候选商品中选择。"; messages.add(new ChatCompletionRequest.Message("system", systemPrompt)); // 用户消息：包含用户查询和商品信息 String userPrompt = String.format("用户查询：%s\n\n以下是候选商品信息：\n%s", userQuery, productsInfo.toString()); messages.add(new ChatCompletionRequest.Message("user", userPrompt)); // 4. 调用模型 log.info("开始调用模型进行推荐，用户查询：{}", userQuery); String modelResponse = ecomGPTClient.chatCompletion(messages, defaultMaxTokens, defaultTemperature); log.info("模型推荐结果：{}", modelResponse); return modelResponse; } }

这里的Product是一个简单的实体类，代表商品。

// entity/Product.java import lombok.Data; @Data public class Product { private String id; private String title; private String description; private String keyAttributes; // 关键属性，JSON字符串或特定格式 private String sellingPoints; // 卖点 // ... 其他字段如价格、类别等 }

3.2 解析推荐结果并构建API

模型返回的是文本，我们需要从中解析出结构化的数据（如商品ID）返回给前端。

// controller/RecommendationController.java import org.springframework.beans.factory.annotation.Autowired; import org.springframework.validation.annotation.Validated; import org.springframework.web.bind.annotation.*; import javax.validation.constraints.NotBlank; import java.util.Arrays; import java.util.List; import java.util.regex.Matcher; import java.util.regex.Pattern; @RestController @RequestMapping("/api/recommend") @Validated public class RecommendationController { @Autowired private ProductRecommendationServiceImpl recommendationService; @Autowired private ProductService productService; @PostMapping("/by-query") public ApiResponse<RecommendationResult> recommendByQuery(@RequestParam @NotBlank String query, @RequestParam(required = false) String category) { try { // 1. 根据查询和类别，从数据库初步筛选一批候选商品ID（这里简化处理） List<String> candidateIds = productService.findCandidateProductIds(query, category); if (candidateIds.isEmpty()) { return ApiResponse.success(new RecommendationResult("未找到相关商品", List.of())); } // 2. 调用推荐服务 String rawRecommendation = recommendationService.recommendProducts(query, candidateIds); // 3. 解析模型返回的文本，提取商品ID List<String> recommendedProductIds = parseProductIdsFromResponse(rawRecommendation); // 4. 根据ID获取完整的商品信息 List<Product> recommendedProducts = productService.getProductsByIds(recommendedProductIds); // 5. 封装结果 RecommendationResult result = new RecommendationResult(); result.setReason(extractRecommendationReason(rawRecommendation)); // 提取推荐理由 result.setProducts(recommendedProducts); return ApiResponse.success(result); } catch (Exception e) { // 记录日志并返回友好错误信息 return ApiResponse.error("商品推荐服务暂时不可用: " + e.getMessage()); } } /** * 简单的正则解析，从模型回复中提取商品ID * 匹配格式如：**推荐商品ID**：[P1001, P1002, P1003] */ private List<String> parseProductIdsFromResponse(String response) { Pattern pattern = Pattern.compile("\\*\\*推荐商品ID\\*\\*：\\s*\\[?([^\\]]+)\\]?"); Matcher matcher = pattern.matcher(response); if (matcher.find()) { String idsStr = matcher.group(1).trim(); // 按逗号分割，并清理空格 return Arrays.stream(idsStr.split(",")) .map(String::trim) .filter(id -> !id.isEmpty()) .toList(); } return List.of(); // 没找到就返回空列表 } private String extractRecommendationReason(String response) { // 类似地，可以解析“**推荐理由**：”后面的内容 Pattern pattern = Pattern.compile("\\*\\*推荐理由\\*\\*：([^*]+)"); Matcher matcher = pattern.matcher(response); if (matcher.find()) { return matcher.group(1).trim(); } return "根据您的需求为您推荐以下商品。"; } }

这里用到的ApiResponse和RecommendationResult是简单的包装类。

// dto/response/ApiResponse.java import lombok.Data; @Data public class ApiResponse<T> { private Integer code; private String message; private T data; public static <T> ApiResponse<T> success(T data) { ApiResponse<T> response = new ApiResponse<>(); response.setCode(200); response.setMessage("success"); response.setData(data); return response; } public static <T> ApiResponse<T> error(String message) { ApiResponse<T> response = new ApiResponse<>(); response.setCode(500); response.setMessage(message); return response; } }

4. 性能优化与进阶实践

直接调用模型API可能会成为性能瓶颈，尤其是当用户并发量上来的时候。这里分享几个我们实践中觉得有用的优化点。

4.1 多线程与异步调用

同步调用会阻塞业务线程。我们可以使用Spring的@Async或CompletableFuture来实现异步非阻塞调用。

首先，启用异步支持。

// 在主应用类或配置类上添加 @EnableAsync @SpringBootApplication public class YourApplication { public static void main(String[] args) { SpringApplication.run(YourApplication.class, args); } }

然后，将模型调用服务改为异步。

// service/impl/EcomGPTClientServiceImpl.java (新增方法) import org.springframework.scheduling.annotation.Async; import java.util.concurrent.CompletableFuture; @Service public class EcomGPTClientServiceImpl { // ... 其他代码 @Async("taskExecutor") // 指定线程池 public CompletableFuture<String> chatCompletionAsync(List<ChatCompletionRequest.Message> messages, Integer maxTokens, Double temperature) { try { String result = chatCompletion(messages, maxTokens, temperature); return CompletableFuture.completedFuture(result); } catch (Exception e) { CompletableFuture<String> future = new CompletableFuture<>(); future.completeExceptionally(e); return future; } } }

记得配置一个专用的线程池，避免影响Web容器的核心线程。

// config/AsyncConfig.java import org.springframework.context.annotation.Bean; import org.springframework.context.annotation.Configuration; import org.springframework.scheduling.concurrent.ThreadPoolTaskExecutor; import java.util.concurrent.Executor; @Configuration public class AsyncConfig { @Bean(name = "taskExecutor") public Executor taskExecutor() { ThreadPoolTaskExecutor executor = new ThreadPoolTaskExecutor(); executor.setCorePoolSize(5); // 核心线程数 executor.setMaxPoolSize(20); // 最大线程数 executor.setQueueCapacity(100); // 队列容量 executor.setThreadNamePrefix("EcomGPT-Async-"); executor.initialize(); return executor; } }

在推荐服务中，就可以使用异步调用了。

// service/impl/ProductRecommendationServiceImpl.java (新增方法) public CompletableFuture<String> recommendProductsAsync(String userQuery, List<String> candidateProductIds) { // ... 构建messages的逻辑同上 return ecomGPTClient.chatCompletionAsync(messages, defaultMaxTokens, defaultTemperature); }

4.2 请求合并与缓存

对于热门查询或相似的用户请求，可以考虑使用缓存（如Redis）来存储模型返回的结果，设置一个合理的过期时间（TTL），避免重复调用模型。

// service/impl/ProductRecommendationServiceImpl.java (增加缓存) import org.springframework.cache.annotation.Cacheable; @Service public class ProductRecommendationServiceImpl { // ... 其他代码 @Cacheable(value = "productRecommendations", key = "#userQuery.concat(#candidateProductIds.hashCode())") public String recommendProductsWithCache(String userQuery, List<String> candidateProductIds) throws Exception { // 实际调用模型的逻辑 return recommendProducts(userQuery, candidateProductIds); } }

同时，在application.yml中配置缓存。

spring: cache: type: redis redis: host: localhost port: 6379

4.3 降级与熔断策略

模型服务可能不稳定。我们需要有降级方案，比如当模型调用超时或失败时， fallback 到基于规则的简单推荐（如按销量、评分排序）。

可以使用 Resilience4j 或 Sentinel 实现熔断、降级和限流。这里以简化逻辑示意：

// service/impl/ProductRecommendationServiceImpl.java (增加降级) public String recommendProductsWithFallback(String userQuery, List<String> candidateProductIds) { try { // 设置超时 return recommendProducts(userQuery, candidateProductIds); } catch (TimeoutException e) { log.warn("模型推荐超时，降级到规则推荐"); return fallbackToRuleBasedRecommendation(candidateProductIds); } catch (Exception e) { log.error("模型推荐失败", e); return fallbackToRuleBasedRecommendation(candidateProductIds); } } private String fallbackToRuleBasedRecommendation(List<String> candidateProductIds) { // 简单的降级逻辑：返回候选商品中销量最高的前3个 List<Product> topProducts = productService.getTopProductsByIds(candidateProductIds, 3, "sales"); // ... 构建降级推荐结果 return "为您推荐以下热销商品：" + topProducts.stream().map(Product::getTitle).collect(Collectors.joining(", ")); }