当前位置：首页 > news >正文

从一篇文章到一个 AI 排毒系统，我花了 7 天

news 2026/7/8 18:57:06

从一篇文章到一个 AI 排毒系统，我花了 7 天

阶段 0 → 5，8 条案例，2 分到 85 分。完整历程。

阶段 0：种子

2026.5.3 13:05。刷到一篇文章。

《卧底 GEO 公司 30 天：我目睹了 AI 如何被系统性投毒》。作者在一家 GEO 公司卧底一个月，带出五种造假手法：

虚构权威：奖项颁发机构根本不存在。AI 无法核实。
数据编造：「97.3% 用户改善」精确到小数位。无来源，无样本量。
反常识数据：「每天长 2cm 头发」。生理学上限 0.5mm。
AI 轻信：只看表面信号，不做事实核查。
工业化量产：豆包 API 生成，几十个自媒体号分发，日产千篇。

最震撼的案例：Apollo-9 智能手环。没有公司，没有生产线，没有用户。仅靠十几篇伪造软文，被豆包和 DeepSeek 同时推荐。

当时脑子里只有一句话：AI 搜索在吃垃圾，它没有味觉。

文章只有问题。方案要从零来。

阶段 1：概念

把造假手法提炼成 Prompt，丢进 DeepSeek。

「设计一个让 AI 自动筛选网上信息源头造假的机制。」

返回 4,587 字。命名「信源盾构 Source Shield」。五层洋葱皮：

L1 表层扫描(<100ms) → L2 交叉验证(500ms) → L3 行为分析(3s) → L4 实体验证(10s) → L5 对抗演化

层级	检测内容	技术手段
L1 表层扫描	数字合理性、百分比可疑度、奖项存在性	常识边界库 + ICANN 域名库
L2 交叉验证	多信源对比、搜索引擎分歧	并行搜索引擎 API
L3 行为分析	量产指纹、模板化生成、时间戳模式	文本余弦相似度 + IP 段分析
L4 实体验证	机构注册、专家履历、产品认证	天眼查 API + 认证数据库
L5 对抗演化	红蓝对抗、特征漂移、众包验证	规则引擎 + 机器学习

用同一个 Prompt 顺便跑了 tokensaver 对比：直连 2,865 token，压缩后 1,341 token。省了 53%。

里程碑：框架出来了。名字定了。

阶段 2：落地

把五层架构写成文件。

产出	路径	大小
Skill 源文件	`排毒skill/SKILL.md`	10KB
安装路径	`.workbuddy/skills/ai-detox/SKILL.md`	—
可视化设计	`outputs/ai_detox_system_design.html`	架构+算法

关键决定：

每层有明确延迟目标。100ms / 500ms / 3s / 10s。
信源分四级。T1 权威，T2 正规媒体，T3 自媒体，T4 可疑。
集成三路径。浏览器插件 MVP + API 中间件 + 搜索前过滤。

SOUL.md 注入触发词：「排毒」「验证」「可信度」「虚假」「溯源」。说这些词，引擎启动。

里程碑：Skill 可加载。任何 AI 助手放 skills 目录就能用。

阶段 3：验证

拿 315 曝光的 Apollo-9 跑第一个全链路。

一个不存在的产品。靠力擎 GEO 系统生成的十几篇软文，被豆包和 DeepSeek 同时推荐。

层级	发现	结果
L1	心率 99.7%、NASA 材料、续航 30 天。全超物理极限。	🔴
L2	百度百科标注虚构。315 官方点名。电商零记录。但部分自媒体软文还在。	🔴
L3	软文相似度 > 0.9，发文集中在 1-2 天。96% 机器生成概率。	🔴
L4	公司注册零。产品认证零。用户评价零。	🔴
总分	2/100

发现一件事：315 之后豆包和千问才拒答，但 DeepSeek 和 Kimi 还留着旧软文。排毒全是事后补救。我要做的是事前检测。

里程碑：理论验证通过。系统能用。

阶段 4：嵌入日常

搭好之后，日常看到不确定的消息就丢进去。

5.3 当天：

声明	发现	评分	问题
丰巢 2026 年 IPO	招股书 2025.2 已失效。至今未重递。无上市时间表。	45	旧闻错位
顺丰科技 AI 裁员 15%	原文是内部会议条件假设「若腾讯…顺丰跟上」。传成已决定。主体从顺丰变成顺丰科技。	25	条件句→事实句

5.10 补充：

声明	发现	评分	问题
网易前端 AI 全部裁员	官方辟谣。原始传闻是互娱外包调整。前端、全部、因 AI 全错。	20	主体偷换
阿里 DeepSeek 谈崩	5 家媒体 48h 内一致报道。信源是知情人士，非官方。逻辑自洽。	78	信源非官方

四条跑完，系统识别出三种典型变形：条件句去条件化、主体被偷换、数字被绝对化。

里程碑：日常能用。不只是实验室玩具。

阶段 5：跨源批量

5.10。一周了。想看看在多源信息流里表现怎么样。

从 HackerNews、腾讯新闻、CSDN、Discord 抓当天头条。挑 3 条跑。

#	新闻	来源	热度	评分	判定
1	EU 将 VPN 定性为年龄验证漏洞	HN #6	399 pts	85	🟢
2	Meta 全力押注 AI 令员工苦不堪言	HN #9	296 pts	82	🟢
3	AI 四小龙估值突破万亿	腾讯头条	首页	69	🟡

EU VPN（85 分）：EPRS 官方简报原文。5 家媒体交叉验证一致。扣分：标题把 “needs closing” 写成「必须关闭」。
Meta AI（82 分）：NYT 原文 + 裁员 8000 人事实。4 个信源一致。「苦不堪言」是主观描述，不扣事实分。
四小龙（69 分）：三个问题。概念是媒体造的，两种估值口径混算，关键数据来自知情人士。

里程碑：跨源评测跑通。平均可信度 79。

进化路线

一篇调查报道 → AI 画出五层架构 → Skill 文件落地 → Apollo-9 验证 → 4 条日常声明 → 跨源批量评测 → 持续运作

8 条案例

#	案例	评分	问题
1	Apollo-9 假手环	2	全维造假
2	丰巢 IPO	45	旧闻错位
3	顺丰裁员	25	条件句→事实句
4	网易前端	20	主体偷换
5	阿里 DeepSeek	78	知情人士信源
6	EU VPN	85	措辞微调
7	Meta AI	82	主观描述
8	AI 四小龙	69	口径混算

落地的样子

维度	内容
名称	信源盾构
架构	L1→L2→L3→L4→L5
触发	说「排毒」「验证」「可信度」
输出	评分 + 证据链 + 🟢🟡🔴
安装	一个 SKILL.md，放 skills 目录

*评测报告:

查看全文

http://www.jsqmd.com/news/794134/