当前位置：首页 > news >正文

LLM 输出格式约束：JSON 模式不是万能保险

news 2026/7/6 0:38:48

LLM 输出格式约束：JSON 模式不是万能保险

一、结构化输出仍会失败

很多大模型应用要求输出 JSON，于是以为加一句“请严格输出 JSON”就安全了。实际生产里，模型仍可能输出注释、Markdown、缺字段、字段类型错误、枚举越界或内容截断。某个日志分析系统用 LLM 提取时间范围和关键词，线上出现过 JSON 被截断只剩前半段、字段值超界等多次故障，导致后端解析失败、告警漏报。

JSON 模式能降低风险，但不是万能保险。后端必须做校验和恢复。

二、先定义 Schema

flowchart TD A[模型输出] --> B[JSON 解析] B --> C[Schema 校验] C --> D[业务校验] D --> E[入库或执行]

Schema 要定义字段类型、必填项、枚举值和长度限制。不要只在自然语言里描述。

{ "type": "object", "required": ["title", "tags"], "properties": { "title": { "type": "string", "maxLength": 80 }, "tags": { "type": "array", "items": { "type": "string" } } } }

结构清楚，程序才好验证。

三、解析失败要可恢复

解析失败时，可以重试、让模型修复 JSON、降级为人工处理，或者返回可读错误。不要把坏输出直接传给业务。

parse_recovery: retry_once: true repair_json: optional fallback_manual: high_risk

重试也要有限制。JSON 解析错误通常不是随机波动——如果第一遍就错了，大概率是 Prompt 或截断问题，只重试一次足够，多轮重试只会白花 token 成本。无限重试只会增加成本。

四、业务校验比格式更重要

JSON 合法不代表业务合法。价格不能为负，日期不能早于当前时间，操作类型不能越权，工具参数不能指向危险路径。

if amount < 0: raise ValueError("amount must be positive")

模型输出进入工具调用前，必须经过业务规则校验。

最后，要统计格式失败率。某个 Prompt 或模型版本导致解析失败升高，就不能上线。结构化输出是工程接口，不是聊天结果。

输出约束还要考虑截断。模型回答超过 token 限制时，JSON 可能只生成一半。解析失败日志里要区分语法错误、字段缺失、截断、业务校验失败，这些问题的修复方向不同。

format_error_types: invalid_json: syntax missing_field: schema enum_out_of_range: schema truncated_output: length business_invalid: rule

对于高风险动作，不建议自动修复后直接执行。比如模型生成支付参数、删除路径、权限变更，即使 JSON 修复成功，也应该重新校验并要求确认。

还可以采用“先生成草稿，再由程序组装最终结构”的方式。模型负责自然语言内容，程序负责固定字段和枚举，这比让模型自由生成完整 JSON 更稳。

最后，结构化输出的 Prompt 示例要覆盖错误场景。只给一个完美示例，模型遇到缺数据时可能硬编字段。

还要考虑流式输出。前端边收边展示时，JSON 只有在结束后才完整。不要在流式中途就解析并执行业务动作，除非协议明确支持增量事件。

streaming_structured_output: parse_only_when_done: true buffer_with_size_limit: true reject_incomplete_payload: true

如果使用函数调用或工具调用，也不能跳过校验。模型生成的参数仍然可能越界、缺字段或包含危险路径。工具层永远要把模型当作不可信输入。

最后，格式约束失败的样本要进入回归集。每一次解析事故，都是下一版 Prompt 和 Schema 的测试资产。

五、总结

LLM 输出格式约束要依靠 Schema、解析校验、业务校验、有限重试和失败率监控。

JSON 模式不是万能保险。模型输出只要进入系统，就必须按接口治理。

查看全文

http://www.jsqmd.com/news/1131490/

故障复盘——让失败“变成财富“

抖音无水印下载神器：5分钟搞定批量下载难题

Docker 镜像签名：能拉取不代表能运行

Apriori 算法 Python 实战：mlxtend 库处理 9835 条购物篮数据，挖掘 26 条强规则

mRemoteNG终极指南：一站式管理所有远程连接的免费神器

LSTM 股票预测实战：PyTorch 2.3 多特征工程与 3 种归一化方法对比

Python实现国密SM4算法：从核心原理到ECB/CBC模式实战

GAIL 2016 算法实战：PyTorch 复现 9 个 Gym 任务，3 种基线对比

告别卡顿：用Winhance中文版让Windows系统重获流畅体验

终极指南：使用no-defender项目快速禁用Windows Defender与防火墙

Java Web上传文件到指定目录？这招秒传逻辑绝了，调试爽到飞起

WarcraftHelper：魔兽争霸3终极优化插件，一站式解决现代电脑兼容性问题

猫抓浏览器扩展：一站式网页资源嗅探与下载终极指南

通达信竣宝阴线点火副图抓波段指标公式三步点金指标源码三步点金副图指标源码三步点金副图指标回调启动选股指标

3大核心能力重塑英雄联盟游戏体验：League-Toolkit智能辅助工具深度解析

UCI-HAR 数据集实战：PyTorch 1.13 + CNN 模型实现 95.7% 分类准确率

位置编码外推实战：从BERT 512到26万token的3种延拓策略

3分钟完成Windows系统优化：让你的电脑焕然一新

贪吃蛇AI训练实战：DQN算法调参与100局训练曲线分析

Video2X 6.0.0：免费AI视频画质增强神器，让模糊视频秒变高清！

松下伺服 A6/A6N 系列电子齿轮比设置：Pr0.08 与 Pr0.09/Pr0.10 两种方法详解

解锁你的AI工作站：Chatbox桌面助手让智能对话触手可及

iOS系统更新真伪鉴别方法论：从版本号到固件签名的全链路验证

终极iOS降级指南：用downr1n解锁旧版系统自由

大众点评小程序风控签名mtgsig1.2逆向分析与生成原理详解

行业差异化场景下新型网络钓鱼攻击特征与四维协同防御体系研究

Apache Airflow CVE-2020-17526漏洞深度剖析：从会话伪造到安全加固

Docker化邮件中继服务架构设计与容器化部署最佳实践

VOC 格式数据集制作：LabelImg 1.8.6 标注 1000 张图片的 3 个效率技巧

OpenCV 4.8 MOG2 实战：3个关键参数调优与阴影检测性能对比