当前位置：首页 > news >正文

12-production-best-practices 生产实践：观测、安全、成本、评测和持续演进

news 2026/5/12 18:43:39

LangChain4j 进阶实战：第 12 篇，生产实践：观测、安全、成本、评测和持续演进

前言

很多大模型应用 Demo 看起来很顺：

用户输入 -> 大模型 -> 返回答案

但真正上线后，问题会集中出现：

为什么今天回答变差了？
为什么同一个问题昨天可以，今天不行？
为什么 token 成本突然上涨？
为什么工具调用失败了？
为什么 RAG 检索到了错误资料？
为什么模型返回了不存在的 ID？
为什么用户 A 看到了用户 B 的数据？
Prompt 改坏了怎么回滚？

这些问题不是 LangChain4j 某一个 API 能解决的，而是 AI 应用生产治理问题。

这一篇作为系列收尾，重点讲生产环境里必须补上的能力：观测、安全、成本、评测、灰度、降级和持续演进。

1. Demo 和生产系统的差距

Demo 关注：

功能能不能跑通

生产系统关注：

长期运行是否稳定、可控、可解释、可回滚

对比一下：

能力	Demo	生产系统
模型调用	能返回即可	超时、重试、降级、限流
Prompt	写死代码	版本管理、灰度、回滚
RAG	能检索即可	权限过滤、来源返回、质量评估
Memory	保存上下文	TTL、删除、脱敏、隔离
Tool	能调用即可	权限、审计、确认、幂等
输出	看起来对	结构化校验、业务校验
日志	打印字符串	requestId、token、耗时、工具链路
成本	不关注	预算、统计、告警

我的理解是：AI 应用上线不是把 Demo 部署到服务器，而是把不可控的模型能力放进可控的软件工程体系里。

2. 调用日志：先做到可观测

AI 系统必须记录调用日志，否则问题很难排查。

建议每次模型调用记录：

requestId userId agentCode agentVersion workflowExecutionId modelName temperature maxTokens input output promptTokens completionTokens totalTokens latencyMs status errorMessage createdAt

如果涉及 RAG，还要记录：

retrieverName query topK minScore filter retrievedSegmentIds retrievedScores sources

如果涉及工具，还要记录：

toolName toolArguments toolResult toolLatencyMs toolStatus

日志不只是排错用，也用于后续优化：

哪些 Agent 最耗 token。
哪些问题经常检索不到。
哪些工具失败率高。
哪些 Prompt 版本效果变差。
哪些用户场景最常见。

注意：日志里可能包含隐私信息，生产环境要做脱敏和访问控制。

3. requestId 贯穿全链路

一个复杂 AI 请求可能经过：

Controller Workflow Agent Memory RAG Milvus MCP Tool Model Provider Database

必须有统一requestId贯穿。

建议：

publicclassAiRequestContext{privateStringrequestId;privateStringuserId;privateStringagentCode;privateStringworkflowExecutionId;}

日志格式：

[requestId=xxx] [userId=10001] [agent=outfit_agent] start model call

否则线上排查时，你会看到一堆零散日志，却拼不出完整链路。

4. Prompt 版本管理

Prompt 是 AI 应用里的“业务逻辑”。既然是业务逻辑，就不能随便改。

建议 P

查看全文

http://www.jsqmd.com/news/803893/

ASN.1编解码实战：从协议规范到C语言实现

如何快速掌握QQ截图独立版：Windows平台终极截图与OCR识别工具完全指南

选购鸟牌Bird功率计，这些型号值得了解——总代理深圳新朗普的一手推荐 - 品牌推荐大师1

2026天津大牌首饰哪里估价靠谱？卡地亚宝格丽实地探店 - 奢侈品回收测评

Hermes Agent 可视化监控与文档生成工具 hermes-dashboard 详解

2026年住校生卫生巾囤货：高性价比品牌选型指南 - 产业观察网

拓扑排序学习笔记

CoPaw：本地部署的AI助手工作站，打造个人专属智能工作流

2026年防漏卫生巾推荐：理性选购的高口碑品牌指南 - 产业观察网

如何让TypeScript错误提示更友好：pretty-ts-errors的终极优化方案

基于Apache Kafka构建企业级多AI智能体协作系统：KafClaw架构与实践

2026年上海留学中介，收费透明机构哪家是最好的 - 速递信息

终极Marko组件化开发指南：单文件与多文件组件最佳实践

免费开源硬件监控工具：LibreHardwareMonitor完整指南 [特殊字符]

小白程序员必看：收藏这份AI黑话指南，轻松入门大模型世界！

LyricsX：一站式macOS歌词同步解决方案，让音乐体验更智能

英雄联盟玩家的效率革命：告别手动操作，拥抱智能游戏体验

CheapClaw：基于阶段性思考与历史截断的多智能体成本优化框架

别被手册骗了！STM32F411CEU6（UFQFPN48封装）到底有几个串口？手把手教你查引脚、测硬件

凰标：每一份国风创作都被尊重、被看见@凤凰标志

上海静安婚内赠与财产维权律师：上海专业帮原配打官司律师/上海专门对付小三的律师/上海专门帮原配告小三的律师/上海免费咨询原配起诉小三/选择指南 - 优质品牌商家

南充工厂搬迁技术拆解：南充同城搬家、南充大型搬家、南充居民搬家、南充店铺搬迁、南充搬家打包、南充搬迁、南充正规的搬家选择指南 - 优质品牌商家

2026年安徽二手PCB设备回收与整厂搬迁完全指南 - 优质企业观察收录

终极免费PDF转SVG工具：简单3步完成高质量转换

告别安装器！用CMD一行命令搞定Office 2016专业增强版激活（附KMS服务器地址）

3分钟掌握APK Installer：Windows上最高效的Android应用安装终极方案

LibreHardwareMonitor：你的电脑健康管家，硬件监控从此无忧

从DDR3到JESD204B：深入拆解FPGA高速串行接收链路上的ISERDESE2核心角色

2026年上海留学机构评估，家长信赖的211背景机构深度解析 - 速递信息

LangChain4j 进阶实战：第 12 篇，生产实践：观测、安全、成本、评测和持续演进

前言

1. Demo 和生产系统的差距

2. 调用日志：先做到可观测

3. requestId 贯穿全链路

4. Prompt 版本管理

相关文章：