当前位置：首页 > news >正文

5. 问：某个方案写：“将用户问题先做意图分类，再路由到不同 Prompt 模板。”指出其中的一个隐性危险，并说明什么场景下危险会被放大到不可接受。

news 2026/5/28 7:13:47

这个方案的标准套路是：
用户问题 → 分类器（Classifier） → 选定Prompt模板（比如：A类问题用A模板，B类问题用B模板） → 生成回答。

其中藏着的那个隐性危险，用一句话说就是：
“意图分类的‘硬边界’，与用户真实需求的‘模糊性、交织性’之间存在根本矛盾，一旦分类错误，后续的Prompt模板会系统性压制信息的多元性，造成‘一条道走到黑’的灾难性回答。”

听不懂？我用人话翻译一遍：

你这个设计假设——每个用户问题，都能且只能被精确地分到一个框里。分进去之后，系统就只调用对应框里提前写好的Prompt。但是，真实世界的用户问题，往往一脚踩在好几个框的边界上，甚至根本不在你预设的框里。

这时候，分类器的一念之差，就会让整个系统变成一个固执的瞎子，只按自己猜的那个错误剧本往下演，再也看不到用户真正要什么。

这背后有一个架构上的“单点脆弱性”：

信息丢弃的“漏斗效应”
分类器把用户丰富的自然语言表达，压缩成一个单一的标签：INTENT_A。在这个过程中，大量的原始信息（语气、细微要求、上下文线索）被无情地丢弃了。这个标签，成了后续所有逻辑的唯一航标。
Prompt模板的“确认偏误”
一个为INTENT_A精心设计的Prompt模板，充满了对该意图的诱导和预设。比如“你是一个XX角色，请专注于回答XX……”。一旦误分类，这个模板就变成了一个“信息茧房”。生成器在里面看到的全是引导它往A方向思考的指令，它根本接收不到用户问题里指向B、C方向的信号，因为那些信号在分类阶段就已经被“过滤”掉了。

这是“自证预言”在代码里的实现：我猜你想问A，所以我只给你看关于A的提示词，最终你只能得到关于A的答案。

直接给你一个最尖锐的场景：

在线医疗预问诊系统
用户输入：“医生，我这几天后脑勺像针扎一样疼，而且脖子很僵硬，用手摸一下皮肤都疼。我本来就有偏头痛，但这次感觉不一样，想问问是不是偏头痛加重了，该吃点什么药？”

放大过程推演：

分类器的致命误判
用户的表达方式里，混杂了“自己归因于偏头痛”和“询问常规用药”的语言，这极具迷惑性。分类器很可能会高置信度地把它分到“慢性病常规咨询”这个意图里。
Prompt模板的灾难性引导
“慢性病常规咨询”对应的Prompt模板大概是这样的：
“你是专业的在线医生助理。用户描述了自己的慢性病史和疑似加重症状。请温和地给出一些生活调整和常规用药的科普建议，并建议挂号专科复查。”
生成的不可接受回答
生成器在这个模板的强力约束下，大概率会给出类似这样的回答：
“您好，偏头痛加重可能与压力、睡眠有关。您可以尝试服用平时医生开的止痛药，注意休息……如果持续加重，建议挂神经内科。”

为什么这个结果是“不可接受”的？
因为这个用户真正的症状——“后脑勺针扎样疼痛、脖子僵硬、皮肤触痛”——是病毒性脑膜炎或蛛网膜下腔出血的典型前兆，是需要立刻冲向急诊的危重信号，一分钟都耽误不得。

系统本应触发最高级别的“紧急分诊”意图，输出“立即拨打急救电话或前往急诊”的死命令。但由于分类的“一票否决”，整个系统在错误的剧本里走完了全程，给出了一个“慢性病保养”的温和但能误人性命的建议。

危险放大因子总结：
在这个场景下，危险被放大的条件是：