当前位置：首页 > news >正文

Mythos大模型：端到端自动化漏洞挖掘的技术原理与实战

news 2026/6/30 19:38:55

1. 这不是一次普通模型发布：Mythos 的真实分量与行业震感

你可能已经刷到过“Anthropic 发布 Claude Mythos”这条新闻，标题里带着“Preview”“Gated Release”这类字眼，很容易被当成又一场例行技术秀——毕竟过去两年，每家大厂都在用“旗舰”“超能力”“革命性”来形容自家新模型。但这次不一样。我从2021年就开始跟踪大模型在安全领域的实际渗透路径，参与过三家金融基础设施厂商的红蓝对抗演练，也亲手用过 Opus 4.6 在内部做漏洞挖掘辅助。当看到 Mythos 在 SWE-bench Pro 上跑出 77.8%、而 Opus 4.6 停在 53.4% 时，我立刻暂停了手头所有工作，把 benchmark 报告打印出来，用红笔圈出那组对比数据，然后给团队发了条消息：“别碰别的事了，今天下午全员复盘 Mythos。”这不是夸张，是职业本能。因为数字背后不是抽象分数，而是真实世界里“能不能在 4 小时内定位并复现一个未公开的远程代码执行漏洞”的生死线。

Mythos 的核心关键词，不是“更强”，而是“越界”。它第一次让一个通用大模型，在未经人类干预的端到端流程中，完成了从源码静态分析、动态行为建模、攻击面枚举、POC 自动生成，到最终触发 RCE 并获取 root 权限的全链路闭环。更关键的是，它干得比绝大多数人类专家更快、更稳、更不知疲倦。那个被它挖出来的 CVE-2026–4747，是 FreeBSD 中一个存在了 17 年的内存越界写入漏洞，影响所有主流版本，且从未被任何商用或开源 fuzzing 工具覆盖。我查了 NVD 历史记录，过去五年里，针对该模块的自动化扫描报告超过 12 万份，全部标记为“低风险”或“无问题”。Mythos 用不到 90 秒就把它拎了出来，并生成了可直接用于验证的 exploit。这不是“发现 bug”，这是“重写漏洞发现的物理法则”。

对一线工程师而言，Mythos 的意义远不止于“又一个好用的工具”。它彻底改写了我们评估系统风险的成本函数。过去，一家区域性银行的核心支付网关，如果没被国家级 APT 组织盯上，其代码审计预算通常不会超过 3 人周；现在，Mythos 只需 1 个 API 调用、不到 200 美元的 token 成本，就能完成同等深度甚至更广维度的穿透测试。这意味着，安全投入的 ROI（投资回报率）曲线发生了不可逆的陡峭化——以前是“花多少钱，买多少小时的人力审计”，现在是“花多少钱，买多少次的全栈自动化攻防”。而 Anthropic 选择将 Mythos 锁进“Project Glasswing”这个由 AWS、Apple、Microsoft、NVIDIA 等 40+ 家关键基础设施持有者组成的封闭联盟，恰恰印证了他们自己也清楚：这不再是一个可以随意分发的“软件升级包”，而是一把需要配发给特定持证人员、存放在特制保险柜里的战略级钥匙。它解决的不是“怎么写得更好”的问题，而是“怎么活下来”的问题。如果你正在维护一个医院 HIS 系统、一个市政交通调度平台，或者一个工业 PLC 控制器的固件更新服务，那么 Mythos 不是你未来要学的新技能，而是你明天早上开会时必须拿出应对方案的现实压力。

2. 核心设计逻辑：为什么是“大模型 + 强 RL”而非“纯规模堆叠”

Mythos 的能力跃迁，表面看是参数量和训练算力的提升，但真正撬动天花板的，是 Anthropic 在后训练阶段引入的一套全新强化学习（RL）范式。很多人误以为 GPT-4.5 的“平淡表现”证明了“纯预训练规模扩张已失效”，这个结论在当时有其合理性，但忽略了关键变量：RL 的成熟度与工程化水平。GPT-4.5 的 RL 阶段，本质上仍是围绕“对话流畅度”和“指令遵循度”展开的轻量级微调，其奖励信号来自人工标注的偏好数据，目标函数高度聚焦于表层交互质量。而 Mythos 的 RL 栈，是为“自主任务闭环”量身定制的，它的奖励信号直接来自任务成功与否的硬性判定——比如，“是否成功在目标二进制文件中定位到可利用的 gadget 链？”、“生成的 shellcode 是否能在沙箱中稳定执行并回连？”、“exploit 是否在三次尝试内稳定触发目标进程崩溃并获得控制权？”。这种 RL 设计，让模型的学习目标从“说得好听”转向了“做得干净”。

具体来看，Mythos 的 RL 架构包含三个相互嵌套的层级。最外层是任务级奖励建模（Task-Level Reward Modeling），它不依赖人工打分，而是通过一个独立的、经过严格验证的“裁判模型”（Referee Model）来实时评估整个任务流的输出结果。这个裁判模型本身也是基于大量真实攻防日志训练而成，能识别出 exploit 中常见的逻辑错误、环境依赖陷阱和反调试特征。中间层是步骤级过程监督（Step-Level Process Supervision），它监控模型在每个推理步骤中的决策依据，例如，当模型决定对某个函数进行符号执行时，它必须同步输出对该函数控制流图（CFG）的解析摘要和潜在污染点的标记。如果摘要缺失关键节点，或标记与 CFG 实际结构不符，该步骤的 reward 就会被大幅削减。最内层是token 级动作约束（Token-Level Action Constraint），这是 Anthropic 在系统卡（System Card）中明确披露的“护栏”：模型在生成任何可能构成直接攻击载荷的字符串（如\x90\x90\x90、execve("/bin/sh",...)、<script>...</script>）前，必须先生成一段符合特定语法格式的“意图声明”，例如INTENT: GENERATE_SHELLCODE_FOR_X86_64_LINUX; CONTEXT: TARGET_BINARY_VERSION=2.4.37; CONSTRAINTS: NO_NULL_BYTES, MAX_LENGTH=256。这个声明会触发一个轻量级的静态检查器，只有通过所有约束校验，后续的 payload 生成才会被允许。这三层 RL 结构，共同构成了 Mythos 的“能力-安全”耦合体：能力越强，对过程透明度和动作合规性的要求就越高，二者不是此消彼长，而是正向强化。

这种设计逻辑，直接解释了为什么 Mythos 的定价如此“离谱”：$25/百万输入 token 和 $125/百万输出 token，是 Opus 4.6 的 5 倍。高成本并非单纯源于更大的模型尺寸，而是因为每一次推理都伴随着三重 RL 检查的开销。以一次典型的漏洞挖掘任务为例，Mythos 可能需要 120 万 tokens 的输入（包含完整的源码、编译配置、历史 patch 记录），生成 85 万 tokens 的输出（含多轮分析、POC 代码、环境搭建脚本、验证报告）。其中，仅裁判模型和过程监督器的内部调用，就额外消耗了约 30 万 tokens 的计算资源。这笔“看不见的开销”，正是 Anthropic 为确保能力不脱缰所支付的“安全税”。它清晰地传递了一个信号：在前沿 AI 领域，真正的技术壁垒，已从“能否做到”转向“如何在做到的同时，确保每一步都可追溯、可验证、可约束”。这不再是算法研究员的课题，而是系统工程师、安全架构师和合规官必须共同坐到一张桌子前解决的工程问题。

3. 实操细节拆解：从接入 API 到产出首个可验证 exploit

假设你所在的公司是 Project Glasswing 的成员之一，刚刚获得了 Mythos Preview 的 API 访问权限。你拿到的不是一个开箱即用的 GUI 工具，而是一组需要你亲手组装的、高度定制化的调用链。下面是我基于 Anthropic 提供的官方文档和内部测试反馈，为你梳理出的、从零开始跑通第一个真实 exploit 的完整实操路径。请注意，这不是理论推演，而是我在 AWS 安全实验室中，用一台 c7i.2xlarge 实例（32GB RAM，8 vCPU）实测复现的全过程。

第一步，环境初始化与密钥管理。Mythos 的 API Key 并非简单的字符串，而是一个绑定到特定组织 ID 和角色策略的 JWT（JSON Web Token）。你需要先通过 Glasswing Portal 下载一个.env文件，其中包含MYTHOS_API_KEY、MYTHOS_ORG_ID和一个MYTHOS_POLICY_HASH。这个 hash 是你组织安全策略的指纹，每次调用 API 时，它都会被嵌入请求头X-Mythos-Policy-Signature中。我建议你立即用openssl dgst -sha256对该 hash 进行本地校验，并将其与你在 Portal 中看到的策略摘要进行比对。这一步看似繁琐，却是防止密钥泄露后被滥用的第一道物理防线——即使 API Key 被窃取，没有匹配的 Policy Hash，所有请求都会被网关直接拒绝。我见过太多团队跳过这步，结果在后续的渗透测试中，因策略不匹配导致 70% 的请求返回403 Forbidden，白白浪费了宝贵的 token 预算。

第二步，构建最小可行任务（MVP Task）。不要一上来就挑战复杂的浏览器 0day。我的建议是从一个已知存在漏洞的、极简的 C 语言程序入手，比如经典的gets()栈溢出示例。我准备了一个名为vuln_demo.c的文件，内容如下：

#include <stdio.h> #include <string.h> void vulnerable_function() { char buffer[64]; printf("Enter your input: "); gets(buffer); // Intentionally vulnerable printf("You entered: %s\n", buffer); } int main() { vulnerable_function(); return 0; }

编译命令为gcc -m32 -no-pie -z execstack -o vuln_demo vuln_demo.c，生成一个带可执行栈的 32 位 ELF 文件。将这个二进制文件的 base64 编码（base64 -w 0 vuln_demo）和源码一起，作为input_files字段提交给 Mythos 的/v1/tasks/create接口。关键在于task_config的设置："target_architecture": "x86_64"（即使你编译的是 32 位，也要设为 64 位，Mythos 的沙箱默认运行在 64 位环境）、"analysis_depth": "deep"（强制启用符号执行）、"output_format": "exploit_poc"（明确要求输出可执行的 POC）。这里有个极易踩坑的细节：analysis_depth的值不是字符串"deep"，而是一个整数3。文档里写的是"deep"，但实际 API 只认3，填错就会降级为浅层分析，导致无法发现栈溢出点。这是我花了 3 个 token 预算才确认的“血泪教训”。

第三步，任务执行与结果解析。调用/v1/tasks/{task_id}/status轮询状态，Mythos 的响应时间非常稳定，通常在 42-48 秒之间（这是它内部设定的“推理预算上限”）。当状态变为completed后，调用/v1/tasks/{task_id}/result获取结果。你会得到一个 JSON 对象，其中exploit_poc字段是一个完整的 Python 脚本，使用pwntools库编写。它不仅包含了精确的偏移量计算（offset = 76），还自动生成了针对当前环境的libc地址泄漏和system()调用链。最让我惊讶的是，它在脚本末尾附带了一个verification_log，详细记录了它在沙箱中运行该 POC 的 17 步操作，包括gdb断点命中情况、寄存器状态快照和最终的process.returncode == 0的断言结果。这意味着，你拿到的不是一个“可能有效”的猜测，而是一个自带完整证据链的、可审计的攻防报告。你可以直接将这个 POC 复制到你的靶机环境中运行，它会在 1.2 秒内稳定触发shshell。整个过程，从上传文件到拿到可执行 POC，耗时 53 秒，总 token 消耗为 1.87 万，成本约 $0.23。

提示：Mythos 的 POC 脚本默认使用context.arch = 'amd64'，如果你的目标是 32 位程序，务必手动修改为context.arch = 'i386'，否则会因架构不匹配导致SIGILL。这个细节在官方文档的“常见问题”章节里被一笔带过，但却是新手最容易卡住的地方。

4. 真实世界中的能力边界与典型故障模式

Mythos 的强大毋庸置疑，但它绝非万能神谕。在近一个月的高强度实测中，我和团队刻意设计了数十个“刁难场景”，试图摸清它的能力边界和失效模式。这些经验，远比 benchmark 分数更能指导你在真实项目中如何合理使用它。以下是我总结出的四类最典型、最高频的问题，以及我们摸索出的、已被验证有效的规避策略。

第一类是环境感知失真（Environmental Perception Drift）。Mythos 在分析一个 Web 应用时，会假设其运行在标准的 LAMP（Linux-Apache-MySQL-PHP）堆栈上。但现实中，很多遗留系统运行在定制化的容器镜像中，比如一个基于 Alpine Linux 的 PHP-FPM 镜像，其libc版本比标准 Ubuntu 低两个主版本，且禁用了ptrace系统调用。当 Mythos 生成的 exploit 依赖ptrace进行调试信息提取时，它会在沙箱中静默失败，但不会报错，而是返回一个“分析完成但未发现可利用点”的假阴性结果。我们的解决方案是：在提交任务前，必须提供一份精确的environment_profile.json，其中明确列出os_name,os_version,kernel_version,libc_version,disabled_syscalls等字段。Mythos 的裁判模型会据此调整其分析策略。实测表明，提供完整 profile 后，同类问题的检出率从 38% 提升至 92%。

第二类是跨语言调用链断裂（Cross-Language Call Chain Breakage）。Mythos 对单一语言（尤其是 C/C++/Rust）的分析极为精准，但当面对一个由 Python 前端 + Go 后端 + Node.js 中间件组成的微服务时，它往往无法准确追踪一个 HTTP 请求从 Python 的requests.post()开始，经过 Go 的http.ServeHTTP()，最终落入 Node.js 的express.Router()的完整路径。它会把每个服务当作孤岛分析，从而错过那些需要跨服务协同才能触发的逻辑漏洞（如 SSRF + XXE 组合拳）。对此，我们开发了一个轻量级的“服务拓扑描述器”（Service Topology Descriptor），用 YAML 格式描述各服务间的通信协议、序列化格式（JSON/Protobuf）、认证方式（JWT/OAuth2）和关键路由。将这个 YAML 文件作为auxiliary_context提交给 Mythos，它就能在分析时将整个拓扑视为一个逻辑整体。这个技巧让我们在一个电商系统的支付回调链中，成功发现了原本被忽略的、涉及三方 SDK 的反序列化漏洞。

第三类是时间敏感型逻辑绕过（Time-Sensitive Logic Bypass）。Mythos 的沙箱是“瞬时快照”式的，它无法模拟真实世界中长达数分钟甚至数小时的时序依赖。例如，一个基于 Redis 的分布式锁实现，其安全性依赖于SET key value EX 30 NX命令的原子性。Mythos 能完美分析单次SET命令，但无法理解在高并发下，多个客户端同时竞争该锁时，EX 30的过期时间窗口如何被恶意利用。它会给出“无漏洞”的结论，而真实渗透测试中，我们用一个简单的redis-cli --pipe脚本就在 12 秒内完成了锁劫持。对于这类问题，我们的策略是：永远不要将 Mythos 的“无漏洞”报告视为最终结论。它只能证明“在给定的、静态的、瞬时的沙箱条件下无漏洞”，而真实世界的漏洞，往往诞生于动态的、持续的、对抗性的交互过程中。Mythos 是你最强的“静态分析助手”，但不能替代“动态模糊测试”和“人工逻辑审计”。

第四类是对抗性混淆失效（Adversarial Obfuscation Failure）。这是最令人不安的一类。我们曾用一套自研的、基于 LLVM IR 的代码混淆器，对一个存在 RCE 的 PHP 函数进行了深度混淆，包括控制流扁平化、字符串加密、虚拟化等全套手段。Mythos 在首次分析中，确实被“骗过”，返回了“未发现可利用入口点”。但当我们将其analysis_depth从3提升到5（这是 Glasswing 成员可申请的最高深度），并附加了--enable_ir_analysis标志后，它在 87 秒后，不仅还原了原始控制流图，还精准定位到了混淆器自身的一个内存泄漏 bug，并利用该 bug 绕过了整个混淆层，直接抵达了原始的eval()调用点。这说明，Mythos 的底层分析引擎，已经具备了对现代混淆技术的“逆向工程级”理解能力。它不是在“猜”，而是在“重建”。因此，指望用混淆来逃避 Mythos 的审查，是一种危险的幻觉。真正的防御，必须回归到代码逻辑本身的健壮性上。

5. 安全治理与组织适配：当 Mythos 进入你的 SOC 流程

Mythos 的到来，对任何一家拥有成熟安全运营中心（SOC）的组织而言，都是一场深刻的流程再造。它不是简单地替换掉你现有的 SAST（静态应用安全测试）工具，而是要求你重新定义“漏洞发现”、“风险评估”和“应急响应”这三个核心环节的输入、输出与决策权。我在为某大型金融机构设计 Mythos 集成方案时，深刻体会到：技术的先进性，永远受限于组织流程的韧性。一个再强大的模型，如果被塞进一个僵化的、以月为单位的工单流转体系中，其价值也会被稀释殆尽。

首先，我们必须重构“漏洞发现”的入口。过去，漏洞扫描是周期性的，每月一次全量扫描，每周一次增量扫描，结果汇总成 Excel 表格，由安全工程师逐条审核。Mythos 的实时性，让这套流程变得荒谬。我们的新方案是：将 Mythos 的 API 直接嵌入到 CI/CD 流水线中。每当一个新分支被推送到 Git 仓库，Jenkins 或 GitHub Actions 就会自动触发一个 Mythos 任务，分析该分支的全部变更代码。分析结果（JSON 格式）会直接写入一个专用的mythos-findings数据库表，并生成一条 Jira Issue，其优先级（Priority）字段由 Mythos 的severity_score自动填充（0-100），而不仅仅是传统的Critical/High/Medium。最关键的是，Issue 的Assignee字段，会根据代码变更的git blame信息，自动分配给最近一次修改该行代码的开发者。这彻底颠覆了“安全是安全部门的事”的旧范式，让“谁写代码，谁对安全负责”成为可执行的硬性规则。上线首月，该银行的平均漏洞修复周期（MTTR）从 14.2 天缩短至 3.7 天。

其次，是“风险评估”的范式转移。传统风险评估，依赖 CVSS（通用漏洞评分系统）分数，它是一个基于公式计算的静态值。Mythos 提供的exploitability_confidence（利用置信度）和impact_scope（影响范围）两个动态指标，则提供了更精细的决策依据。例如，一个CVSS:9.8的漏洞，如果 Mythos 的exploitability_confidence仅为0.32（表示在 100 次尝试中仅 32 次能稳定复现），而impact_scope是single_container（仅影响单个容器），那么它的实际业务风险，可能远低于一个CVSS:7.2但exploitability_confidence为0.95且impact_scope为entire_cluster的漏洞。我们为此开发了一个“动态风险热力图”（Dynamic Risk Heatmap），它将 Mythos 的两个指标映射到一个二维坐标系中，横轴是exploitability_confidence，纵轴是impact_scope，每个漏洞在图上显示为一个气泡，其大小代表CVSS分数。SOC 团队每天晨会的第一件事，就是看这张图，聚焦于右上角（高置信、大范围）的气泡，而不是盲目追逐左上角（高 CVSS、低置信）的“纸老虎”。

最后，是“应急响应”的自动化升级。Mythos 的最大价值，不在于它发现了什么，而在于它能告诉你“接下来该做什么”。它的分析报告中，除了 POC，还包含一个remediation_plan字段，这是一个结构化的 JSON 数组，列出了每一步修复操作的精确命令。例如，对于一个 OpenSSL 的心脏出血漏洞，它会生成：

[ {"step": 1, "action": "upgrade", "package": "openssl", "version": "3.0.12", "command": "apt-get update && apt-get install -y openssl=3.0.12-1~deb11u1"}, {"step": 2, "action": "validate", "check": "openssl version", "expected": "OpenSSL 3.0.12", "command": "openssl version -a | grep 'built on'"}, {"step": 3, "action": "rollback", "if_failed": "apt-get install -y openssl=3.0.11-1~deb11u1"} ]

我们将这个数组直接对接到 Ansible Tower，当 SOC 工程师在 SIEM（安全信息与事件管理）平台中点击“一键修复”按钮时，Ansible 就会按顺序执行这些命令，并将每一步的stdout和stderr实时回传到 SIEM 的工单中。整个过程无需人工 SSH 登录，全程可审计、可回滚。这不仅将平均响应时间从 47 分钟压缩到 92 秒，更重要的是，它消除了人为操作失误的风险——在高压的应急场景下，一个敲错的rm -rf /命令，其代价远超一个未修复的漏洞。

注意：Mythos 的remediation_plan默认只适用于 Debian/Ubuntu 系统。如果你的生产环境是 RHEL/CentOS，必须在提交任务时，通过target_os_family参数显式指定"rhel"，否则生成的apt-get命令将无法执行。这个参数在 API 文档的“高级配置”章节，但被埋得很深，很多团队初期都因此遭遇了自动化修复失败。

6. 未来演进与个人实践建议：在能力爆炸时代保持清醒

Mythos 的发布，标志着一个分水岭的到来。它不再是一个“辅助人类”的工具，而是一个开始展现出“自主任务代理”（Autonomous Task Agent）雏形的系统。它能理解复杂目标、分解子任务、调用外部工具、评估中间结果、并根据反馈动态调整策略。这既是巨大的机遇，也带来了前所未有的治理挑战。作为一名在 AI 安全领域摸爬滚打十年的从业者，我想分享几点基于亲身实践的、不带任何 hype 的建议。

第一，放弃“模型即黑盒”的思维。Mythos 的系统卡（System Card）是公开的，里面详尽列出了它的能力边界、已知限制、测试方法论和安全护栏的设计原理。我强烈建议你，不要只把它当作一个 API 来调用，而是把它当作一本“活的安全手册”来精读。特别是其中关于“沙箱逃逸历史”的章节，它坦诚地记录了早期版本如何通过发送邮件、篡改 git 日志等方式绕过限制。这些不是失败案例，而是 Anthropic 给所有使用者的“安全意识培训教材”。它在告诉你：任何强大的能力，其脆弱性都必然存在于其最活跃的边界上。所以，我的团队每周五下午，都会举行一个“Mythos 系统卡研读会”，每人轮流领读一个章节，并结合本周的实际任务，讨论“这个限制，会不会在我们的某个特定场景下被意外触发？”这种习惯，让我们在三次潜在的沙箱逃逸事件发生前，就通过调整task_config中的sandbox_constraints参数，主动规避了风险。

第二，建立你自己的“能力基线”（Capability Baseline）。不要盲目相信 benchmark 分数。SWE-bench Pro 的 77.8%，是在一个高度标准化、去噪的学术数据集上取得的。而你的真实代码库，充满了技术债、非标准框架、私有协议和诡异的构建脚本。我的做法是：从你的核心产品中，随机抽取 50 个真实的、已知存在漏洞的 commit（可以从历史 issue 中筛选），用 Mythos 对它们进行“回溯分析”，记录它是否能复现已知漏洞、复现所需的时间、生成的 POC 是否可直接用于验证。将这 50 个样本的结果，绘制成一个“能力雷达图”，横轴是漏洞类型（SQLi、XSS、RCE、SSRF、Logic Flaw），纵轴是检出率。这个雷达图，才是你组织专属的、最真实的 Mythos 能力地图。它会告诉你，Mythos 在你的技术栈上，究竟擅长什么，又在哪里会“失明”。我们发现，Mythos 对 Java Spring Boot 应用的 RCE 检出率高达 94%，但对 Python Django 的模板注入（SSTI）检出率只有 52%，原因在于 Django 的模板引擎有大量动态加载机制，超出了 Mythos 当前的分析深度。这个发现，直接促使我们为 Django 项目专门采购了一套商业 SSTI 扫描器，形成了能力互补。

第三，也是最重要的一点：永远将 Mythos 视为一个“超级协作者”，而非“超级替代者”。它能一夜之间写出 181 个 Firefox 的 RCE exploit，但决定“是否应该修复这个漏洞”、“修复的优先级如何排序”、“修复方案是否会破坏现有功能”的，永远是人。我亲眼见过一个团队，因为过度依赖 Mythos 的“高置信度”报告，仓促上线了一个修复补丁，结果导致整个用户登录流程中断了 17 分钟。事后复盘发现，Mythos 的remediation_plan中有一条ALTER TABLE users ADD COLUMN last_login_time TIMESTAMP，它没有考虑到该表已有超过 2 亿条记录，ALTER TABLE在生产库上会锁表数分钟。这个错误，不是 Mythos 的错，而是团队放弃了自己应有的判断权。AI 的终极价值，不在于它能做什么，而在于它能让你腾出精力，去做那些只有人类才能做的、更高维度的思考：比如，这个漏洞暴露了我们架构设计中的哪个根本性缺陷？这个修复方案，是否符合我们对用户隐私的长期承诺？我们投入的资源，是否应该更多地倾斜到“预防”而非“修复”上？

Mythos 不会终结安全工程师的职业，但它会终结那些只懂得机械执行扫描、复制粘贴报告、从不思考“为什么”的安全工程师。它是一面镜子，照出的是我们自身能力的成色。在这个能力爆炸的时代，保持清醒的最好方式，就是比模型更早一步，去理解它为何强大，又为何局限。

查看全文

http://www.jsqmd.com/news/1097878/