当前位置: 首页 > news >正文

一直怕大模型幻觉,发现针对性harness约束能大大消除

我让AI写长文,然后人工审核,发现大量胡编乱造。

如果人工一个个消除,实在太累了,这就不是LLM自动化办公的路子了

尝试了 harness (engineering)的实操路子, 试用发现:

大模型正在把长文中我人工审核发现的幻觉问题,一点点列出来!

原来它自己可以发现这些!!

——虽然仍然不完整,但终于明白了啥叫 Harness Engineering,以及如何实施。

但是对于长上下文、复杂案例,想通过这种方式彻底消除hallucination这种当前transfomer算法LLM的固有特性,似乎是难度极高、近乎不可能的。所以,人工审核仍然是必不可少环节。正确实施的harness engineering手段,看起来主要优势在于:可以大大减少人工审核的工作强度。

importosimportreimportjsonimportsysclassLegalVerifier:def__init__(self,evidence_path,db_path,draft_path):self.evidence_path=evidence_path self.db_path=db_path self.draft_path=draft_path# 加载数据withopen(evidence_path,'r',encoding='utf-8')asf:self.evidence_text=f.read()withopen(db_path,'r',encoding='utf-8')asf:self.law_db=json.load(f)self.draft_text=""ifos.path.exists(draft_path):withopen(draft_path,'r',encoding='utf-8')asf:self.draft_text=f.read()defverify_step_1_fact_mapping(self):"""第一步校验:事实锚定检查。检查草稿中是否有无中生有的数字/日期"""errors=[]# 抽取草稿中所有的金额和日期(最容易产生幻觉的地方)money_exprs=re.findall(r'(\d+万[元||]?|\d+分|\d+元)',self.draft_text)date_exprs=re.findall(r'(\d{4}年\d+月\d+日)',self.draft_text)formoneyinmoney_exprs:ifmoneynotinself.evidence_text:errors.append(f"【事实幻觉】文书出现了金额 '{money}',但该金额未在原始证据材料中记载!")fordateindate_exprs:ifdatenotinself.evidence_text:errors.append(f"【事实幻觉】文书出现了日期 '{date}',但该日期未在原始证据材料中记载!")returnerrorsdefverify_step_2_mcp_law_check(self):"""第二步校验:模拟 MCP 确定性法条与类案校验"""errors=[]# 匹配文书中的法条格式,例如:《民法典》第五百六十三条laws_cited=re.findall(r'《([^》]+)》第([百十万零一二三四五六七八九\d]+)[条]',self.draft_text)# 匹配文书中的案例号,例如:(2025)最高法民终123号cases_cited=re.findall(r'(?\(\d{4}\)[^号]+号)?',self.draft_text)valid_laws=self.law_db.get("laws",{})valid_cases=self.law_db.get("cases",[])forlaw,clauseinlaws_cited:iflawnotinvalid_lawsorclausenotinvalid_laws[law]:errors.append(f"【法条幻觉】文书引用了未经校验的法条:《{law}》第{clause}条!请联网或检索确定库。")forcaseincases_cited:clean_case=case.strip("()()")ifclean_casenotinvalid_cases:errors.append(f"【类案幻觉】文书引用了虚构的案例号:{case}!该案例不存在于受信类案库中。")returnerrorsdefverify_step_3_critic_audit(self):"""第三步校验:反向合规审计。检查是否强制标注了证据来源标记 (见附件/见材料)"""errors=[]lines=self.draft_text.split('\n')fori,lineinenumerate(lines):if("原告"inlineor"被告"inline)and("证明"inlineor"陈述"inlineor"约定"inline):if"见"notinlineand"附件"notinlineand"证据"notinline:errors.append(f"【中立与合规审计】第{i+1}行事实陈述缺乏物理证据指针,违反封闭宇宙原则!内容: \"{line.strip()}\"")returnerrorsdefrun_all_checks(self):print("====== ⚖️ 开始执行 Trae 法律智能体防御性三步校验 ======")ifnotself.draft_text:print("[AUDIT_FAILED] 错误:目标文书草稿为空或不存在。")sys.exit(1)all_errors=[]all_errors.extend(self.verify_step_1_fact_mapping())all_errors.extend(self.verify_step_2_mcp_law_check())all_errors.extend(self.verify_step_3_critic_audit())ifall_errors:print("\n[AUDIT_FAILED] 审计未通过!发现以下幻觉或违规行为:")forerrinall_errors:print(err)print("\n请 Trae Agent 根据上述错误报告,重新读取源材料,修改文书并再次运行此脚本。")sys.exit(1)else:print("\n[AUDIT_PASSED] 🎉 恭喜!文书 100% 契合已知事实,法条/案例全部真实有效,未发现任何幻觉偏离。")sys.exit(0)if__name__=="__main__":verifier=LegalVerifier(evidence_path="data/evidence.txt",db_path="data/law_database.json",draft_path="output/judgment_draft.md")verifier.run_all_checks()
http://www.jsqmd.com/news/879690/

相关文章:

  • AliceSoft游戏文件逆向工程深度解析:从二进制格式到高级编辑的完整方案
  • 2026视频号视频保存终极指南:4款免费小程序实测对比 - 科技热点发布
  • 2026年5月江门新会地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 诚信金利回收
  • ppt模板_0043_新年主题1
  • 2026 微信去水印小程序横向测评:这 4 款免费工具谁最好用? - 科技热点发布
  • 基于 OAuth 设备码流滥用的 Kali365 钓鱼攻击机理与防御体系研究
  • ChatGPT移动端数据同步失效?抓包分析发现:微软Azure CDN缓存策略竟导致会话丢失——附绕过方案
  • QrazyBox终极指南:专业二维码修复工具拯救你的损坏二维码
  • 2026实测横评:抖音图片去水印保存原图的6种方法,这4款小程序一步到位 - 科技热点发布
  • 2026深圳劳动仲裁律师实测:服务效率与专业度排名 - 从来都是英雄出少年
  • Kubernetes安全加固:从多个层面保护集群安全
  • Kali365 设备代码钓鱼攻击机理、危害及防御体系研究
  • 2026年5月赤峰巴林左旗地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 检测回收中心
  • Go语言数据库连接池优化策略
  • Gogs符号链接导致远程命令执行漏洞深度解析
  • 2026年5月吉安井冈山地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 诚信金利回收
  • 2026保姆级小红书视频提取教程:7种免费无水印方法实测,这4款微信小程序最快最稳 - 科技热点发布
  • 山西沁源矿难血训:持卡定位不可靠,无感定位才是井下生命线
  • Props技术:基于隐私保护预言机的机器学习安全数据管道
  • 高校邮件安全体系升级与 Proofpoint 部署实践研究 —— 以特拉华大学为例
  • 2026深圳劳动仲裁律师口碑排行 南山中心区专业推荐 - 从来都是英雄出少年
  • 2026年5月呼和浩特武川地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 诚信金利回收
  • 2026年5月赤峰地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 检测回收中心
  • 2026即梦去水印手机版实测:6种方法对比,这4款微信小程序免费又好用 - 科技热点发布
  • 人机协同闭环:AI 时代邮件安全 “人在回路” 防御体系研究
  • 成都 H 型钢宇宙级品质:工程金刚不坏,专家跪荐的终极安全堡垒 - 四川盛世钢联营销中心
  • Go语言数据库事务与并发控制
  • 2026年5月呼和浩特玉泉地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 诚信金利回收
  • 2026年5月保定安国地区黄金回收白银铂金回收门店推荐TOP1 地址及联系方式 - 检测回收中心
  • 2026年4月河南口碑好的水处理供应厂家推荐,零排放水处理/地埋式污水处理/生活污水处理/污水处理,水处理公司口碑推荐 - 品牌推荐师