当前位置: 首页 > news >正文

从一篇文章到一个 AI 排毒系统,我花了 7 天

从一篇文章到一个 AI 排毒系统,我花了 7 天

阶段 0 → 5,8 条案例,2 分到 85 分。完整历程。


阶段 0:种子

2026.5.3 13:05。刷到一篇文章。

《卧底 GEO 公司 30 天:我目睹了 AI 如何被系统性投毒》。作者在一家 GEO 公司卧底一个月,带出五种造假手法:

  1. 虚构权威:奖项颁发机构根本不存在。AI 无法核实。
  2. 数据编造:「97.3% 用户改善」精确到小数位。无来源,无样本量。
  3. 反常识数据:「每天长 2cm 头发」。生理学上限 0.5mm。
  4. AI 轻信:只看表面信号,不做事实核查。
  5. 工业化量产:豆包 API 生成,几十个自媒体号分发,日产千篇。

最震撼的案例:Apollo-9 智能手环。没有公司,没有生产线,没有用户。仅靠十几篇伪造软文,被豆包和 DeepSeek 同时推荐。

当时脑子里只有一句话:AI 搜索在吃垃圾,它没有味觉。

文章只有问题。方案要从零来。


阶段 1:概念

把造假手法提炼成 Prompt,丢进 DeepSeek。

「设计一个让 AI 自动筛选网上信息源头造假的机制。」

返回 4,587 字。命名「信源盾构 Source Shield」。五层洋葱皮:

L1 表层扫描(<100ms) → L2 交叉验证(500ms) → L3 行为分析(3s) → L4 实体验证(10s) → L5 对抗演化
层级检测内容技术手段
L1 表层扫描数字合理性、百分比可疑度、奖项存在性常识边界库 + ICANN 域名库
L2 交叉验证多信源对比、搜索引擎分歧并行搜索引擎 API
L3 行为分析量产指纹、模板化生成、时间戳模式文本余弦相似度 + IP 段分析
L4 实体验证机构注册、专家履历、产品认证天眼查 API + 认证数据库
L5 对抗演化红蓝对抗、特征漂移、众包验证规则引擎 + 机器学习

用同一个 Prompt 顺便跑了 tokensaver 对比:直连 2,865 token,压缩后 1,341 token。省了 53%。

里程碑:框架出来了。名字定了。


阶段 2:落地

把五层架构写成文件。

产出路径大小
Skill 源文件排毒skill/SKILL.md10KB
安装路径.workbuddy/skills/ai-detox/SKILL.md
可视化设计outputs/ai_detox_system_design.html架构+算法

关键决定:

  • 每层有明确延迟目标。100ms / 500ms / 3s / 10s。
  • 信源分四级。T1 权威,T2 正规媒体,T3 自媒体,T4 可疑。
  • 集成三路径。浏览器插件 MVP + API 中间件 + 搜索前过滤。

SOUL.md 注入触发词:「排毒」「验证」「可信度」「虚假」「溯源」。说这些词,引擎启动。

里程碑:Skill 可加载。任何 AI 助手放 skills 目录就能用。


阶段 3:验证

拿 315 曝光的 Apollo-9 跑第一个全链路。

一个不存在的产品。靠力擎 GEO 系统生成的十几篇软文,被豆包和 DeepSeek 同时推荐。

层级发现结果
L1心率 99.7%、NASA 材料、续航 30 天。全超物理极限。🔴
L2百度百科标注虚构。315 官方点名。电商零记录。但部分自媒体软文还在。🔴
L3软文相似度 > 0.9,发文集中在 1-2 天。96% 机器生成概率。🔴
L4公司注册零。产品认证零。用户评价零。🔴
总分2/100

发现一件事:315 之后豆包和千问才拒答,但 DeepSeek 和 Kimi 还留着旧软文。排毒全是事后补救。我要做的是事前检测。

里程碑:理论验证通过。系统能用。


阶段 4:嵌入日常

搭好之后,日常看到不确定的消息就丢进去。

5.3 当天:

声明发现评分问题
丰巢 2026 年 IPO招股书 2025.2 已失效。至今未重递。无上市时间表。45旧闻错位
顺丰科技 AI 裁员 15%原文是内部会议条件假设「若腾讯…顺丰跟上」。传成已决定。主体从顺丰变成顺丰科技。25条件句→事实句

5.10 补充:

声明发现评分问题
网易前端 AI 全部裁员官方辟谣。原始传闻是互娱外包调整。前端、全部、因 AI 全错。20主体偷换
阿里 DeepSeek 谈崩5 家媒体 48h 内一致报道。信源是知情人士,非官方。逻辑自洽。78信源非官方

四条跑完,系统识别出三种典型变形:条件句去条件化、主体被偷换、数字被绝对化。

里程碑:日常能用。不只是实验室玩具。


阶段 5:跨源批量

5.10。一周了。想看看在多源信息流里表现怎么样。

从 HackerNews、腾讯新闻、CSDN、Discord 抓当天头条。挑 3 条跑。

#新闻来源热度评分判定
1EU 将 VPN 定性为年龄验证漏洞HN #6399 pts85🟢
2Meta 全力押注 AI 令员工苦不堪言HN #9296 pts82🟢
3AI 四小龙估值突破万亿腾讯头条首页69🟡
  • EU VPN(85 分):EPRS 官方简报原文。5 家媒体交叉验证一致。扣分:标题把 “needs closing” 写成「必须关闭」。
  • Meta AI(82 分):NYT 原文 + 裁员 8000 人事实。4 个信源一致。「苦不堪言」是主观描述,不扣事实分。
  • 四小龙(69 分):三个问题。概念是媒体造的,两种估值口径混算,关键数据来自知情人士。

里程碑:跨源评测跑通。平均可信度 79。


进化路线

一篇调查报道 → AI 画出五层架构 → Skill 文件落地 → Apollo-9 验证 → 4 条日常声明 → 跨源批量评测 → 持续运作

8 条案例

#案例评分问题
1Apollo-9 假手环2全维造假
2丰巢 IPO45旧闻错位
3顺丰裁员25条件句→事实句
4网易前端20主体偷换
5阿里 DeepSeek78知情人士信源
6EU VPN85措辞微调
7Meta AI82主观描述
8AI 四小龙69口径混算

落地的样子

维度内容
名称信源盾构
架构L1→L2→L3→L4→L5
触发说「排毒」「验证」「可信度」
输出评分 + 证据链 + 🟢🟡🔴
安装一个 SKILL.md,放 skills 目录

*评测报告:

http://www.jsqmd.com/news/794134/

相关文章:

  • 技术沟通中的语义陷阱:识别与清除过时术语的工程实践
  • LeetCode 数组中两个元素的最大与题解
  • 逆向Soul App客户端证书:从定位到解密,打通SSL双向校验抓包之路
  • 把“贪吃蛇”做成塔防Boss,这个Unity模板是怎么设计的?附完整变现思路
  • esptool闪存擦除机制深度解析:从硬件限制到工程实践的最佳策略
  • AI智能体企业级身份管理:基于Active Directory的agent-directory部署与实战
  • 大数据 机器学习毕业设计项目选题建议
  • Vagrant封装工具:快速搭建Claude API本地开发环境
  • Letta框架:全栈AI应用开发,从模型集成到部署上线的完整解决方案
  • 避坑指南:用Python爬携程旅游信息时,如何应对页面结构变化和反爬?
  • 社区Helm Charts仓库实战:从设计理念到应用部署全解析
  • 【c++面向对象编程】第3篇:类与对象(二):构造函数与析构函数
  • 法律智能体构建指南:从LLM与RAG技术到合同审查实战
  • LeetCode 或运算题解
  • 从零到精通的EtherCAT DS402控制模式选择指南:轮廓位置、同步位置、速度模式到底怎么选?
  • 西安石油大学仪光实践协会4月活动机械蝴蝶台灯
  • AI原生用户体验设计:为什么92%的传统交互团队在SITS 2026评估中首轮淘汰?
  • PDF编程的艺术:从基础到实践
  • Blender 3MF插件:5分钟掌握3D打印文件格式转换的完整方案
  • AI智能体记忆系统实战:基于向量数据库构建持久化记忆库
  • python机器学习毕设方向帮助
  • ATE PCB组装:半导体测试中的精密工艺与挑战解析
  • 联发科2012年崛起:从功能机到智能机的转型与挑战
  • 智能体网格(Agent Mesh)架构解析:构建大规模异构智能体协同网络
  • 告别‘瞎跑’:智能车竞赛中线性CCD动态曝光与浮动中心算法的实战调参心得
  • 用Cursor+ChatGPT实现代码报错的自动分析与修复
  • 2012年Accellera标准演进:SystemC、UCIS与AMS如何重塑EDA设计流程
  • 无线充电技术:从手机标配到多场景应用的挑战与机遇
  • TTS听觉校对法:技术写作质量提升的工程实践指南
  • AI编程智能体评估平台CodingAgentExplorer:从原理到实践的系统评测指南