当前位置：首页 > news >正文

AI4J：面向Java 8+的AI Agentic SDK，一站式集成大模型与智能体开发

news 2026/5/7 15:23:03

1. 项目概述：AI4J，一个为Java 8+而生的AI Agentic SDK

如果你是一个Java开发者，正想在项目中引入大模型能力，无论是简单的对话、函数调用，还是构建复杂的智能体应用，你可能会发现一个尴尬的局面：市面上成熟的Java AI框架，比如Spring AI、LangChain4j，它们确实强大，但都要求JDK 17+。对于那些还在维护着大量基于Java 8或11的存量系统的团队来说，升级JDK版本本身就是一个充满风险和成本的大工程。这时候，一个既能向下兼容老版本JDK，又能提供现代AI开发所需全套能力的工具，就显得尤为珍贵。AI4J正是为此而生。

AI4J是一款面向JDK 8+的Java AI Agentic开发套件。它的目标很明确：让任何Java应用，无论新旧，都能以最低的迁移成本，平滑地接入AI能力。它不仅仅是一个大模型API的调用客户端，更是一个从基础模型接入到高级智能体（Agent）开发的完整工具箱。你可以用它来统一调用OpenAI、智谱、DeepSeek等十多个主流平台的Chat、Embedding、Rerank等服务；也可以用它内置的RAG（检索增强生成）能力快速搭建知识库问答系统；更可以基于其强大的ai4j-agent和ai4j-coding模块，构建具备自主规划、工具调用、团队协作能力的智能体应用。对于个人开发者，它还贴心地提供了开箱即用的CLI和TUI工具，让你在命令行里就能与Coding Agent交互，处理本地代码仓库。

简单来说，AI4J试图解决的核心痛点是：在Java生态，尤其是那些受限于历史技术栈的团队中，提供一个“一站式”的、低门槛的AI应用开发解决方案。它通过模块化设计，让你可以按需引入能力，从最简单的聊天机器人开始，逐步演进到复杂的多智能体工作流。

2. 核心架构与设计哲学：模块化与统一抽象

AI4J的设计非常清晰，遵循了“核心稳定，功能可插拔”的模块化思想。理解它的架构，是高效使用它的前提。

2.1 模块化设计：按需组合，渐进增强

整个项目被拆分为多个独立的模块，每个模块职责单一，你可以像搭积木一样组合它们。

ai4j(核心模块)：这是基石。提供了统一的多平台大模型服务接入（Chat, Embedding, Rerank等）、基础的Tool Call、MCP（模型上下文协议）支持、以及RAG的核心组件（如VectorStore抽象、IngestionPipeline）。如果你的需求只是调用API、做简单的函数调用或搭建基础的RAG，引入这个模块就够了。
ai4j-agent(智能体运行时)：在核心模块之上，提供了完整的Agent运行时环境。支持ReAct推理、子智能体（subagent）、智能体团队（agent teams）、记忆（memory）、执行追踪（trace）和工具循环（tool loop）。这是你构建具备自主决策和复杂任务分解能力的智能体的核心。
ai4j-coding(代码智能体)：专门为代码生成、理解和操作场景设计的模块。它扩展了ai4j-agent，提供了工作空间工具（workspace tools）、外部循环（outer loop）、检查点压缩（checkpoint compaction）等专为编程任务优化的能力。如果你想做一个能帮你写代码、重构代码的AI助手，这个模块是必选的。
ai4j-cli(命令行工具)：一个独立的、可执行的JAR包。它封装了ai4j-coding的能力，提供了一个功能丰富的命令行界面（CLI）和终端用户界面（TUI）。你可以直接通过命令与Coding Agent交互，无需自己编写Java代码。这对于快速体验、调试或作为轻量级开发助手非常有用。
ai4j-spring-boot-starter(Spring Boot集成)：为Spring Boot应用提供了自动配置、属性绑定等开箱即用的支持。如果你在Spring Boot项目中，用这个starter能省去大量手动配置的麻烦。
ai4j-flowgram-spring-boot-starter(FlowGram集成)：用于在Spring Boot中便捷地接入FlowGram工作流和追踪系统。
ai4j-bom(物料清单)：当你需要同时引入多个AI4J模块时，使用这个BOM（Bill of Materials）可以统一管理所有模块的版本，避免版本冲突。

设计哲学解读：这种模块化设计背后，是“渐进式增强”和“关注点分离”的理念。它允许一个项目从最简单的模型调用开始，随着业务复杂度的增长，平滑地引入更高级的Agent能力，而无需更换技术栈或进行大规模重构。同时，将CLI/TUI作为独立模块，也体现了“工具与库分离”的思想，让库本身保持纯净，而将面向最终用户的交互工具独立发布。

2.2 统一抽象层：屏蔽平台差异

AI4J另一个关键设计是统一的抽象层。无论底层对接的是OpenAI、智谱还是Ollama，对于上层应用来说，调用的接口（如IChatService、IEmbeddingService）都是一致的。这带来了几个巨大优势：

降低学习成本：开发者只需要学习一套API，就可以操作所有支持的平台。
提升可移植性：业务代码与具体模型提供商解耦。今天用OpenAI GPT-4，明天想切换到智谱GLM-4，通常只需要修改配置中的api-key和base-url，核心业务逻辑代码几乎不用动。
简化测试与Mock：统一的接口使得编写单元测试和集成测试更加容易，你可以轻松地注入一个模拟的（Mock）服务实现。

这个抽象层不仅覆盖了基础的聊天和嵌入，还延伸到了RAG的各个环节（VectorStore、Retriever、Reranker）和智能体运行时，确保了整个技术栈体验的一致性。

3. 快速上手指南：从零到一的实战

理论说再多，不如动手跑一遍。我们以在一个普通的Java 8项目中，接入OpenAI的Chat服务为例，看看AI4J有多简单。

3.1 环境准备与依赖引入

首先，确保你的项目使用JDK 8或以上版本，并构建工具是Maven或Gradle。

对于Maven项目，在pom.xml中添加依赖。如果你只需要基础功能，引入ai4j核心模块即可：

<dependency> <groupId>io.github.lnyo-cly</groupId> <artifactId>ai4j</artifactId> <version>0.6.3</version> <!-- 请使用最新版本 --> </dependency>

对于Gradle项目，在build.gradle中添加：

implementation 'io.github.lnyo-cly:ai4j:0.6.3'

注意：由于需要网络请求，AI4J底层依赖了OkHttp。如果你的项目环境有特殊的网络策略（如需要配置代理），你可能需要额外处理OkHttpClient的配置，后续会讲到。

3.2 初始化AI服务与发起第一次对话

初始化AiService是使用所有功能的大门。在非Spring环境中，我们需要手动配置。

import io.github.lnyocly.ai4j.AiService; import io.github.lnyocly.ai4j.config.Configuration; import io.github.lnyocly.ai4j.config.OpenAiConfig; import io.github.lnyocly.ai4j.platform.PlatformType; import io.github.lnyocly.ai4j.service.chat.IChatService; import io.github.lnyocly.ai4j.service.chat.completion.ChatCompletion; import io.github.lnyocly.ai4j.service.chat.completion.ChatCompletionResponse; import io.github.lnyocly.ai4j.service.chat.message.ChatMessage; public class Ai4jQuickStart { public static void main(String[] args) throws Exception { // 1. 配置OpenAI参数 OpenAiConfig openAiConfig = new OpenAiConfig(); openAiConfig.setApiKey("你的-OpenAI-API-KEY"); // 替换为你的真实Key // 如果你的网络环境需要，可以设置自定义的baseUrl，例如某些代理中转服务 // openAiConfig.setBaseUrl("https://api.openai-proxy.com/v1"); // 2. 构建全局配置 Configuration configuration = new Configuration(); configuration.setOpenAiConfig(openAiConfig); // 3. （可选但重要）配置HTTP客户端，例如设置超时和代理 // 国内访问OpenAI通常需要代理 OkHttpClient okHttpClient = new OkHttpClient.Builder() .connectTimeout(30, TimeUnit.SECONDS) // 连接超时 .readTimeout(60, TimeUnit.SECONDS) // 读取超时 .writeTimeout(30, TimeUnit.SECONDS) // 写入超时 .proxy(new Proxy(Proxy.Type.HTTP, new InetSocketAddress("127.0.0.1", 10809))) // 设置代理 .build(); configuration.setOkHttpClient(okHttpClient); // 4. 创建AI服务入口 AiService aiService = new AiService(configuration); // 5. 获取Chat服务实例 IChatService chatService = aiService.getChatService(PlatformType.OPENAI); // 6. 构建对话请求 ChatCompletion request = ChatCompletion.builder() .model("gpt-4o-mini") // 指定模型 .message(ChatMessage.withUser("用Java写一个Hello World程序")) // 用户消息 .build(); // 7. 发起同步请求 ChatCompletionResponse response = chatService.chatCompletion(request); // 8. 处理响应 if (response != null && response.getChoices() != null && !response.getChoices().isEmpty()) { String answer = response.getChoices().get(0).getMessage().getContent().getText(); System.out.println("AI回复: " + answer); } else { System.out.println("请求失败或无响应"); } } }

运行这段代码，如果网络和API Key都正确，你就能看到AI返回的Java Hello World代码了。整个过程非常直观：配置 -> 获取服务 -> 构建请求 -> 发送 -> 处理结果。

实操心得一：关于网络配置国内开发者使用OpenAI官方接口，配置代理是绕不开的一步。AI4J允许你传入自定义的OkHttpClient实例，这给了你极大的灵活性。除了代理，你还可以在这里添加日志拦截器（用于调试）、重试拦截器、认证头等。建议在测试阶段加上日志拦截器，方便查看实际的请求和响应。

HttpLoggingInterceptor loggingInterceptor = new HttpLoggingInterceptor(); loggingInterceptor.setLevel(HttpLoggingInterceptor.Level.BODY); // 打印完整的请求/响应体 OkHttpClient client = new OkHttpClient.Builder() .addInterceptor(loggingInterceptor) .proxy(...) .build(); configuration.setOkHttpClient(client);

3.3 在Spring Boot项目中集成

如果你使用的是Spring Boot，那么集成会更加优雅。首先，引入Spring Boot Starter依赖：

<dependency> <groupId>io.github.lnyo-cly</groupId> <artifactId>ai4j-spring-boot-starter</artifactId> <version>0.6.3</version> </dependency>

然后在application.yml中配置你的API Key和代理（如果需要）：

ai: openai: api-key: ${OPENAI_API_KEY:你的-OpenAI-API-KEY} # 推荐使用环境变量 okhttp: proxy-host: 127.0.0.1 proxy-port: 10809

之后，你就可以在任何Spring管理的Bean中直接注入AiService使用了：

@Service public class MyAIService { @Autowired private AiService aiService; // 由starter自动配置 public String chatWithAI(String question) throws Exception { IChatService chatService = aiService.getChatService(PlatformType.OPENAI); ChatCompletion request = ChatCompletion.builder() .model("gpt-4o-mini") .message(ChatMessage.withUser(question)) .build(); ChatCompletionResponse response = chatService.chatCompletion(request); return response.getChoices().get(0).getMessage().getContent().getText(); } }

Spring Boot Starter帮你自动处理了所有Bean的创建和配置绑定，让你能更专注于业务逻辑。

4. 核心功能深度解析

掌握了基础调用，我们来深入看看AI4J提供的几个核心且强大的功能。

4.1 流式输出与函数调用

大模型的流式输出能极大提升用户体验，避免长时间等待。AI4J通过SseListener回调机制支持流式输出。

public void testChatStream() throws Exception { IChatService chatService = aiService.getChatService(PlatformType.OPENAI); ChatCompletion request = ChatCompletion.builder() .model("gpt-4o-mini") .message(ChatMessage.withUser("给我讲一个关于Java编程的短故事")) .stream(true) // 启用流式 .build(); // 创建监听器，处理收到的每一个数据块 SseListener listener = new SseListener() { @Override protected void send() { // this.getCurrStr() 获取当前数据块的内容文本 System.out.print(this.getCurrStr()); // 注意用print，实现打字机效果 System.out.flush(); } @Override protected void onFinish() { System.out.println("\n--- 流式输出结束 ---"); // 可以在这里获取完整的输出 System.out.println("完整回复: " + this.getOutput()); } }; // 发起流式请求 chatService.chatCompletionStream(request, listener); }

函数调用（Tool Call）是大模型与外部世界交互的关键。AI4J让定义和使用函数变得非常简单。

首先，定义一个函数（例如查询天气）：

// 1. 定义函数请求参数类 @Data @FunctionRequest // AI4J注解，标识这是一个函数请求结构 public class WeatherRequest { @FunctionParameter(description = "城市名称，例如：北京") private String city; @FunctionParameter(description = "查询类型：now-当前天气，forecast-预报") private String type = "now"; } // 2. 实现函数逻辑 @FunctionCall(name = "getWeather", description = "根据城市名称查询天气信息") public class GetWeatherFunction implements Function<WeatherRequest, String> { @Override public String apply(WeatherRequest request) { // 这里模拟调用一个天气API System.out.println("[函数被调用] 查询城市: " + request.getCity() + ", 类型: " + request.getType()); // 实际项目中，这里会是HTTP请求到天气服务商 return request.getCity() + "的天气是晴朗，25摄氏度。"; } }

然后，在对话中让模型使用这个函数：

public void testToolCall() throws Exception { IChatService chatService = aiService.getChatService(PlatformType.OPENAI); // 将函数实例注册到请求中 GetWeatherFunction weatherFunction = new GetWeatherFunction(); ChatCompletion request = ChatCompletion.builder() .model("gpt-4o-mini") .message(ChatMessage.withUser("上海今天天气怎么样？")) .functions(weatherFunction) // 关键：传入函数实例 .build(); ChatCompletionResponse response = chatService.chatCompletion(request); // 检查响应中是否包含函数调用请求 ChatChoice choice = response.getChoices().get(0); ChatMessage message = choice.getMessage(); if (message.getToolCalls() != null && !message.getToolCalls().isEmpty()) { // 模型请求调用函数 for (ToolCall toolCall : message.getToolCalls()) { if ("getWeather".equals(toolCall.getFunction().getName())) { // 解析参数并执行函数 WeatherRequest weatherReq = JSON.parseObject(toolCall.getFunction().getArguments(), WeatherRequest.class); String weatherResult = weatherFunction.apply(weatherReq); System.out.println("函数执行结果: " + weatherResult); // 通常你需要将函数结果再次发送给模型，让模型生成最终回答给用户 // 这构成了一个完整的“模型请求 -> 执行函数 -> 返回结果 -> 模型总结”的循环 } } } else { // 模型直接给出了回答 System.out.println("AI直接回复: " + message.getContent().getText()); } }

AI4J的@FunctionCall和@FunctionParameter注解会自动帮你生成符合OpenAI函数调用规范的JSON Schema，大大简化了开发。需要注意的是，智谱平台目前不支持多个函数同时调用，而OpenAI等平台支持，AI4J已经做好了平台兼容性处理。

4.2 内置RAG：从文档入库到智能检索

RAG是当前构建企业级知识库问答系统的标配。AI4J内置了一整套RAG流水线，抽象做得非常好，让开发者无需关心底层向量数据库的差异。

第一步：文档处理与入库（Ingestion）这是RAG的“离线”阶段。AI4J提供了IngestionPipeline，它像一条流水线，串联了文档加载、分块、元数据增强、向量化、存储入库等所有步骤。

// 1. 获取一个向量存储实例，这里以Qdrant为例（也支持Pinecone, pgvector, Milvus） VectorStore vectorStore = aiService.getQdrantVectorStore(); // 需要在配置中设置Qdrant的连接信息 // ai: // vector: // qdrant: // host: localhost // port: 6333 // 2. 创建一条针对OpenAI Embedding和上述向量存储的流水线 IngestionPipeline pipeline = aiService.getIngestionPipeline(PlatformType.OPENAI, vectorStore); // 3. 准备文档并入库 IngestionRequest ingestRequest = IngestionRequest.builder() .dataset("company_handbook") // 数据集/命名空间，用于区分不同文档集合 .embeddingModel("text-embedding-3-small") // 指定Embedding模型 .document(RagDocument.builder() .sourceName("员工手册2024") .sourcePath("/docs/hr/employee_handbook_v2024.pdf") .tenant("company_a") // 租户隔离 .biz("human_resource") // 业务域 .version("2024.1") .build()) .source(IngestionSource.file(new File("/path/to/employee_handbook.pdf"))) // 支持File, Text, URL .chunker(new RecursiveTextChunker(500, 100)) // 设置分块器：块大小500，重叠100 .build(); IngestionResult result = pipeline.ingest(ingestRequest); System.out.println("成功入库 " + result.getUpsertedCount() + " 个文本块。");

IngestionPipeline内部使用了Apache Tika来解析各种格式的文档（PDF, Word, PPT, HTML等），然后按照你设定的规则进行分块，最后调用指定的Embedding模型生成向量，并存入向量数据库。整个过程是声明式的，你只需要告诉它“用什么模型”、“存到哪里”、“怎么分块”，剩下的它来完成。

第二步：检索与问答（Query）这是RAG的“在线”阶段。当用户提问时，我们需要从向量库中检索出相关的文档片段，拼接到提示词中，再交给大模型生成答案。

// 1. 获取RAG服务，它封装了检索和上下文组装 RagService ragService = aiService.getRagService(PlatformType.OPENAI, vectorStore); // 2. 构建查询 RagQuery query = RagQuery.builder() .query("我们公司的年假政策是怎样的？") .dataset("company_handbook") // 必须与入库时的dataset一致 .embeddingModel("text-embedding-3-small") // 需与入库时使用的模型一致 .topK(5) // 召回最相关的5个片段 .build(); // 3. 执行检索 RagResult ragResult = ragService.search(query); // 4. 获取检索到的上下文和引用来源 String context = ragResult.getContext(); // 自动组装好的上下文文本 List<Citation> citations = ragResult.getCitations(); // 每个片段的来源信息（如文件名、页码） System.out.println("检索到的上下文：\n" + context); System.out.println("\n引用来源："); citations.forEach(c -> System.out.println("- " + c.getSourceName() + " (分数: " + c.getScore() + ")"));

现在，你可以将context作为系统提示词的一部分，与用户问题一起发送给大模型，模型就能基于你公司的内部知识生成准确的回答了。

第三步：进阶优化 - 混合检索与重排序简单的向量相似度检索（Dense Retrieval）有时会漏掉关键词完全匹配但语义稍远的文档。AI4J提供了更强大的HybridRetriever（混合检索器），它结合了向量检索和传统的BM25关键词检索。

// 1. 创建稠密检索器（向量检索） DenseRetriever denseRetriever = new DenseRetriever( aiService.getEmbeddingService(PlatformType.OPENAI), vectorStore ); // 2. 创建BM25检索器（关键词检索），需要基于文本块构建索引 Bm25Retriever bm25Retriever = new Bm25Retriever(); // 假设我们有所有文本块的列表 `allChunks` bm25Retriever.index(allChunks); // 3. 创建混合检索器，使用RRF（Reciprocal Rank Fusion）策略融合两个检索器的结果 HybridRetriever hybridRetriever = new HybridRetriever( Arrays.asList(denseRetriever, bm25Retriever), new RrfFusionStrategy() // 默认的融合策略 ); // 4. 将混合检索器用于RAG服务 RagService advancedRagService = new DefaultRagService(hybridRetriever, null, new DefaultRagContextAssembler());

更进一步，为了提升最终召回片段的质量，可以使用重排序（Rerank）。重排序模型会对初步召回的多个片段进行更精细的语义相关性打分，重新排序，只保留最相关的几个。

// 获取一个重排序服务，例如使用Jina的Rerank模型 IRerankService rerankService = aiService.getRerankService(PlatformType.JINA); // 将其包装成RAG可用的Reranker Reranker reranker = aiService.getModelReranker( PlatformType.JINA, "jina-reranker-v2-base-multilingual", 3, // 精排后保留前3个 "优先保留与制度、政策相关的原文片段" // 可选的提示词，指导重排序模型 ); // 创建最终版的RAG服务：混合检索 + 精排 RagService finalRagService = new DefaultRagService(hybridRetriever, reranker, new DefaultRagContextAssembler());

通过“混合检索 + 精排”的组合，你的RAG系统在准确率和召回率上都会有显著提升。AI4J将这些复杂的组件都做了标准化封装，让你可以通过简单的组合就能搭建出工业级的RAG流水线。

4.3 智能体（Agent）运行时初探

当你的需求超越了简单的问答，需要AI能够自主规划、执行一系列工具调用来完成复杂任务时，就需要智能体（Agent）了。AI4J的ai4j-agent模块提供了一个通用的Agent运行时。

一个最简单的ReAct（Reasoning and Acting）智能体示例：

// 1. 定义智能体可用的工具 List<Tool> tools = new ArrayList<>(); tools.add(new Tool("getWeather", "查询天气", new GetWeatherFunction())); tools.add(new Tool("searchWeb", "网络搜索", new WebSearchFunction())); // 2. 创建智能体运行时配置 AgentRuntimeConfig config = AgentRuntimeConfig.builder() .model("gpt-4o-mini") .platform(PlatformType.OPENAI) .tools(tools) .maxIterations(10) // 最大循环次数，防止死循环 .build(); // 3. 创建智能体运行时 AgentRuntime runtime = new DefaultAgentRuntime(aiService, config); // 4. 给智能体下达任务 String task = "帮我查一下北京和上海明天的天气，然后对比一下哪里更适合出行。"; AgentResult result = runtime.run(task); // 5. 查看执行结果和思考过程 System.out.println("最终答案: " + result.getFinalOutput()); System.out.println("执行步骤: "); for (AgentStep step : result.getSteps()) { System.out.println(" - " + step.getThought()); // 模型的思考 if (step.getToolCall() != null) { System.out.println(" 调用工具: " + step.getToolCall().getName()); System.out.println(" 工具结果: " + step.getToolResult()); } }

在这个例子中，你只需要定义好工具（Tool），然后给智能体一个目标，它就会自动进行“思考 -> 决定调用哪个工具 -> 执行工具 -> 观察结果 -> 再思考”的循环，直到任务完成或达到最大迭代次数。AgentRuntime会自动管理整个对话历史（记忆），并处理模型输出的解析。

更强大的能力：子智能体与团队对于更复杂的任务，你可以将任务分解，交给多个专门的子智能体（Subagent）协作完成，形成一个智能体团队（Agent Team）。

// 创建不同的子智能体，每个擅长不同领域 AgentRuntime writerAgent = new DefaultAgentRuntime(aiService, configForWriting); AgentRuntime researcherAgent = new DefaultAgentRuntime(aiService, configForResearch); AgentRuntime criticAgent = new DefaultAgentRuntime(aiService, configForReview); // 创建一个团队协调员（Orchestrator） TeamOrchestrator orchestrator = new SequentialTeamOrchestrator(); orchestrator.addMember("writer", writerAgent); orchestrator.addMember("researcher", researcherAgent); orchestrator.addMember("critic", criticAgent); // 定义团队的工作流：研究员 -> 写手 -> 评审 orchestrator.setExecutionOrder(Arrays.asList("researcher", "writer", "critic")); // 运行团队任务 String complexTask = "撰写一篇关于AI4J在Java生态中价值的简短技术博客。"; TeamResult teamResult = orchestrator.execute(complexTask);

ai4j-agent模块还提供了记忆管理（ChatMemory）、执行追踪（Trace）等高级功能，让你能够构建、调试和监控复杂的智能体应用。

4.4 Coding Agent与CLI/TUI实战

ai4j-coding模块和ai4j-cli工具将智能体的能力聚焦在了“编程”这个垂直领域。想象一下，一个能理解你的代码库、能根据你的指令修改文件、运行测试的AI助手。

通过CLI快速体验最快的方式是使用预编译的CLI工具。根据你的系统执行安装脚本：

# Linux/macOS curl -fsSL https://lnyo-cly.github.io/ai4j/install.sh | sh # Windows PowerShell irm https://lnyo-cly.github.io/ai4j/install.ps1 | iex

安装后，你就可以使用ai4j命令了。一个常见的场景是让AI助手分析你当前项目的代码：

# 进入你的项目目录 cd /path/to/your/java/project # 启动一个交互式会话，使用智谱的模型，指定工作空间为当前目录 ai4j code \ --provider zhipu \ --protocol chat \ --model glm-4.7 \ --base-url https://open.bigmodel.cn/api/paas/v4 \ --api-key YOUR_ZHIPU_KEY \ --workspace .

启动后，你会进入一个交互式命令行。你可以输入自然语言指令，例如：

/ 读取src/main/java/com/example/MyService.java，并解释它的主要功能。

Coding Agent会利用其内置的“读取文件”工具，查看你的代码，然后给出解释。你还可以让它“重构这个方法”、“为这个类添加单元测试”等等。

TUI（终端用户界面）模式提供了更丰富的视觉交互，包括会话历史树、进程状态、团队看板等，更适合复杂的多轮协作任务。

ai4j tui --provider openai --model gpt-5-mini --workspace .

ACP（AI Coding Protocol）模式则是为IDE插件等外部工具设计的，它提供了一个标准化的JSON-RPC over STDIO协议，方便其他工具集成。

核心概念：Workspace、Skill与Session

Workspace：Coding Agent操作的文件系统根目录。所有文件读写工具都限定在此目录下，保证安全。
Skill：预定义的工具包或指令集。你可以将常用的操作（如“运行Maven测试”、“格式化代码”）封装成Skill，方便在不同项目和会话中复用。Skill可以放在全局目录（~/.ai4j/skills）或项目本地目录（.ai4j/skills）。
Session：一次交互会话的所有上下文，包括对话历史、执行过的工具调用、文件变更等。Session可以被保存、恢复、分叉，方便你回溯到某个历史状态继续探索。

实操心得二：Coding Agent的配置策略CLI工具支持多层配置，非常灵活：

全局配置(~/.ai4j/providers.json): 存放你常用的模型配置（如OpenAI、智谱的API Key和Base URL），给它起个名字如openai-main。

工作区配置(<workspace>/.ai4j/workspace.json): 在具体项目目录下，你可以指定使用哪个全局配置，甚至可以临时覆盖模型。

{ "activeProfile": "openai-main", "modelOverride": "gpt-5-mini", // 临时切换模型 "skillDirectories": [".ai4j/skills", "../shared-skills"] // 加载自定义技能 }

命令行参数：最高优先级，可以覆盖配置文件中的任何设置。

这种设计让你可以在公司内共享一个全局配置，然后在不同项目中使用不同的模型或技能，管理起来非常清晰。

5. 高级特性与集成

5.1 MCP（模型上下文协议）集成

MCP是一种让大模型安全、可控地访问外部数据和工具的协议。AI4J内置了MCP网关，支持STDIO、SSE和HTTP Streamable三种传输方式。这意味着你可以轻松地将数据库、API、文件系统等资源暴露给AI模型使用。

例如，你可以创建一个MCP Server，将公司内部数据库的查询能力提供给AI：

// 1. 定义一个工具，例如查询用户信息 @FunctionCall(name = "queryUser", description = "根据用户ID查询用户信息") public class QueryUserFunction implements Function<QueryUserRequest, String> { @Override public String apply(QueryUserRequest request) { // 连接数据库执行查询... return "用户信息: ..."; } } // 2. 创建MCP Server配置 McpServerConfig serverConfig = McpServerConfig.builder() .name("user-database-server") .version("1.0.0") .tools(Arrays.asList(new QueryUserFunction())) // 注册工具 .transport(new StdioTransport()) // 使用标准输入输出 .build(); // 3. 启动Server McpServer server = new McpServer(serverConfig); server.start();

启动后，这个Server就可以被支持MCP的AI客户端（如某些AI IDE）连接，模型就能安全地调用queryUser工具了。AI4J也支持作为MCP Client去连接其他MCP Server，极大地扩展了模型的能力边界。

5.2 与工作流平台（Dify, Coze, n8n）集成

许多团队使用Dify、Coze或n8n这样的可视化工作流平台来构建和部署AI应用。AI4J提供了AgentFlow端点接入能力，允许你将用AI4J开发的智能体，作为一个节点或Webhook集成到这些平台的工作流中。

本质上，你需要在你的Java应用中暴露一个HTTP端点，这个端点符合Dify/Coze等平台调用Agent的协议规范。AI4J提供了相应的适配器来简化这个流程。

@RestController @RequestMapping("/api/agent") public class AgentFlowController { @Autowired private AiService aiService; @PostMapping("/dify") public ResponseEntity<AgentFlowResponse> handleDifyWebhook(@RequestBody AgentFlowRequest request) { // 1. 将平台请求转换为AI4J智能体任务 String task = request.getQuery(); Map<String, Object> sessionVars = request.getSessionVariables(); // 2. 创建或获取对应的智能体运行时（可根据sessionId区分不同用户会话） AgentRuntime agent = createOrGetAgentRuntime(request.getSessionId()); // 3. 运行智能体 AgentResult result = agent.run(task); // 4. 将结果封装成平台期望的响应格式 AgentFlowResponse response = new AgentFlowResponse(); response.setAnswer(result.getFinalOutput()); response.setSessionVariables(updateSessionVars(sessionVars, result)); // 如果需要流式响应，可以返回SSE return ResponseEntity.ok(response); } private AgentRuntime createOrGetAgentRuntime(String sessionId) { // 实现逻辑：根据sessionId从缓存中获取，或新建一个运行时 // 可以为不同用户/会话配置不同的工具和记忆策略 // ... } }

这样，你就可以在Dify的工作流画布中，添加一个“自定义工具”节点，配置其Webhook地址指向你的这个端点，从而实现将复杂的Java智能体逻辑嵌入到可视化工作流中。

5.3 性能优化与监控

在生产环境中使用AI4J，有几个性能相关的点需要注意：

连接池与超时：大模型API调用可能很慢，务必合理配置OkHttpClient的连接池、超时时间和重试策略，避免线程被长时间占用。

OkHttpClient client = new OkHttpClient.Builder() .connectionPool(new ConnectionPool(5, 5, TimeUnit.MINUTES)) // 连接池 .connectTimeout(10, TimeUnit.SECONDS) .readTimeout(120, TimeUnit.SECONDS) // RAG或长文本生成需要更长时间 .writeTimeout(10, TimeUnit.SECONDS) .retryOnConnectionFailure(true) // 连接失败重试 .addInterceptor(new RetryInterceptor(3)) // 自定义重试拦截器，针对特定状态码 .build();

Embedding模型选择：对于RAG，Embedding模型的速度和成本至关重要。text-embedding-3-small在速度和效果上是一个不错的平衡。对于中文场景，也可以考虑智谱、百度等提供的Embedding API。
向量索引优化：向Pinecone、Qdrant插入数据时，注意批次大小（Batch Size）。AI4J的IngestionPipeline内部会做批处理，但你可以通过配置调整IngestionRequest的batchSize参数。查询时，合理设置topK，并非越大越好，通常5-10个片段足够，结合Reranker效果更佳。
Token使用监控：AI4J内置了TikTokensUtil用于估算Token消耗（主要针对OpenAI模型）。对于计费场景，建议在关键调用处记录请求和响应的Token数。流式响应中，如果平台支持stream_options，可以直接拿到usage统计。
异步处理：对于耗时较长的AI任务（如文档入库、复杂Agent运行），务必采用异步方式，避免阻塞主业务线程。可以使用CompletableFuture或集成Spring的@Async。

6. 常见问题与排查技巧实录

在实际使用中，你肯定会遇到各种问题。这里记录了一些典型场景和解决思路。

6.1 网络与连接问题

问题：调用OpenAI/智谱等海外或国内API超时或连接失败。

排查步骤：
1. 检查代理：如果你在国内，调用OpenAI必须配置代理。确保OkHttpClient中配置的代理地址和端口正确，且代理服务本身是通的。可以用curl -x http://127.0.0.1:10809 https://api.openai.com/v1/models测试。
2. 检查防火墙：公司网络可能屏蔽了某些出口。尝试在服务器上用telnet api.openai.com 443测试连通性。
3. 检查DNS：有些DNS污染会导致域名解析错误。尝试在配置中使用IP直连（如果服务商允许），或者在本地hosts文件绑定正确的IP。
4. 启用详细日志：在OkHttpClient中添加HttpLoggingInterceptor并设置为Level.BODY，查看完整的HTTP请求和响应头，确认请求是否真的发出去了，以及错误码是什么。

配置示例（Spring Boot）：

ai: okhttp: proxy-host: 127.0.0.1 proxy-port: 10809 connect-timeout: 30000 # 单位毫秒 read-timeout: 120000

6.2 模型响应异常或内容不符合预期

问题：模型回复乱码、胡言乱语，或者完全不按指令执行。

排查步骤：
1. 检查请求参数：特别是model名称是否正确。不同平台的模型命名规则不同（如OpenAI是gpt-4o-mini，智谱是glm-4）。
2. 检查消息格式：确保ChatMessage的角色（user,assistant,system）设置正确。system消息通常用于设定AI的行为准则，要放在消息列表开头。
3. 检查函数调用定义：如果涉及Tool Call，确保@FunctionCall和@FunctionParameter的description清晰无歧义。模型的函数调用能力严重依赖描述的质量。参数类的JSON序列化/反序列化是否正常。
4. 简化测试：用一个最简单的纯文本问题测试，排除函数、流式等复杂参数的影响。
5. 查看原始响应：通过日志拦截器查看模型返回的原始JSON，确认是否是模型本身的问题。

6.3 RAG检索效果不佳

问题：检索到的文档片段不相关，导致最终答案不准。

优化方向：
1. 分块策略：RecursiveTextChunker的chunkSize和overlap是关键。对于技术文档，500-1000的块大小可能合适；对于对话记录，可能更小。重叠部分可以保证上下文连贯。
2. Embedding模型：确认入库（Ingestion）和查询（Query）使用的是同一个Embedding模型。不同模型生成的向量空间不同，无法直接计算相似度。对于中文文档，优先选择对中文优化好的模型。
3. 尝试混合检索：如果纯向量检索效果不好，启用HybridRetriever结合BM25关键词检索，往往能显著提升召回率。
4. 引入重排序：在召回topK=20个片段后，使用Reranker模型（如Jina Reranker）进行精排，只取前3-5个最相关的片段送入大模型，能有效提升精度。
5. 检查元数据过滤：RagQuery支持添加元数据过滤条件（如metadataFilter），如果你在入库时设置了tenant、biz等字段，查询时可以利用它们进行精准过滤。
6. 评估与迭代：使用AI4J内置的RagEvaluator计算Precision@K、Recall@K、MRR等指标，量化评估不同配置下的效果，用数据驱动优化。

6.4 智能体陷入循环或执行错误工具

问题：Agent运行时不断重复同一个操作，或者调用了不该调用的工具。

解决策略：
1. 设置迭代上限：AgentRuntimeConfig中的maxIterations一定要设置（如10-20次），这是防止死循环的最后防线。
2. 优化工具描述：和函数调用一样，工具（Tool）的name和description必须极其清晰、无歧义，准确描述工具的功能和适用场景。
3. 提供更详细的系统提示：在给Agent的初始系统消息中，明确规则和约束。例如：“你是一个代码助手，只能使用readFile和writeFile工具。绝对不要尝试执行任何系统命令或访问网络。”
4. 启用Trace调试：AgentRuntime支持输出详细的执行追踪（Trace），记录每一步的思考、工具调用和结果。分析Trace是调试Agent行为最有效的方法。
5. 使用Subagent分工：如果一个Agent任务太复杂，容易导致模型“思维混乱”，可以将其拆解，用多个职责单一的Subagent通过团队协作来完成。

6.5 版本升级与兼容性

问题：升级AI4J版本后，原有代码报错或行为不一致。

建议：
1. 查看更新日志：AI4J的GitHub仓库和文档站有详细的更新日志（CHANGELOG），会说明不兼容的变更、废弃的API和新特性。
2. 使用BOM管理版本：在多模块项目中，强烈建议使用ai4j-bom来统一管理所有AI4J相关依赖的版本，避免不同模块版本冲突。
3. 逐步升级：不要一次性跨多个大版本升级。先升级到相邻版本，测试核心功能，再继续。
4. 关注废弃注解：如果看到@Deprecated的API，尽快按照注释或文档的建议迁移到新API上。

6.6 Spring Boot集成特殊问题

问题：在Spring Boot 2.x项目中引入starter后启动失败。

可能原因：AI4J依赖的某些库（如OkHttp）的版本可能与Spring Boot 2.6以下版本管理的版本冲突。

解决方案：在application.properties中尝试排除冲突的依赖，并明确指定版本。

# 例如，强制指定OkHttp版本 okhttp3.version=4.12.0

或者，在pom.xml中直接声明依赖：

<dependency> <groupId>io.github.lnyo-cly</groupId> <artifactId>ai4j-spring-boot-starter</artifactId> <version>${ai4j.version}</version> <exclusions> <exclusion> <groupId>com.squareup.okhttp3</groupId> <artifactId>okhttp</artifactId> </exclusion> </exclusions> </dependency> <dependency> <groupId>com.squareup.okhttp3</groupId> <artifactId>okhttp</artifactId> <version>4.12.0</version> </dependency>

最后，遇到任何奇怪的问题，开启DEBUG级别的日志通常是第一步。AI4J及其底层库（OkHttp, Jackson）的日志会提供非常宝贵的线索。社区和GitHub Issues也是寻找答案的好地方，在提问时，尽量提供你的环境信息、配置代码、错误日志和复现步骤，这样更容易获得帮助。

查看全文

http://www.jsqmd.com/news/770875/