AI Agent(智能体)的输出格式应该从 Markdown 转向 HTML吗?
在近期(2026年5月)的技术圈和AI社区引发了非常热烈的讨论。提出这个观点的是 Anthropic(Claude背后的公司)负责 Claude Code 团队的工程师 Thariq Shihipar,他最近发表了一篇题为《使用 Claude Code:HTML 极其不讲理的有效性》(The unreasonable effectiveness of HTML)的文章,呼吁 AI Agent(智能体)的输出格式应该从 Markdown 转向 HTML。
要客观地看待“AI的未来是Markdown还是HTML”这个问题,我们可以从这位工程师的核心论点、HTML与Markdown的优劣势对比,以及AI交互范式的演进三个维度来剖析。
1. 为什么 Claude 工程师认为“未来是 HTML”?
Thariq Shihipar 认为 Markdown 虽然是目前与 AI 交互的主流格式,但它的局限性越来越明显。他指出了 HTML 在 AI 输出中的四大核心优势:
- 极高的信息密度与视觉表现力:Markdown 只能呈现纯文本、简单的表格和外部图片。如果让 AI 画图,它只能勉强用 ASCII 码拼凑;而 HTML 可以直接内嵌 CSS、SVG 矢量图、颜色代码和空间布局(比如在一页里做多方案的并排网格对比)。
- 双向交互能力(Interactivity):Markdown 是静态的单向输出。而在 HTML 中,AI 可以生成带有滑块、按钮、Tab 切换页面的交互式组件。你可以直接在 HTML 里拖拽滑块调整参数,然后把结果反馈给 Claude,这是 Markdown 绝对做不到的。
- 可读性与分享门槛低:超过 100 行的 Markdown 文件对非技术人员来说阅读体验极差。而 HTML 文件由于浏览器原生支持,甚至可以通过 S3 生成链接一键分享给团队里的任何人,大家打开的意愿和阅读体验大幅提升。
- “人类直接编辑”的需求正在消失:过去用 Markdown 是因为它方便人类手工修改。但现在,人们越来越倾向于“让 Claude 帮我改”,而不是自己去改代码。既然直接编辑文本的需求变弱了,Markdown 最大的优势也就随之消解了。
2. 社区的反方意见:Markdown 真的会被淘汰吗?
在 Hacker News 和开发者社区中,虽然很多人认同 HTML 带来的富交互体验(这也正是 Claude 独有的 Artifacts 功能大受欢迎的原因),但也指出了 HTML 现阶段的致命弱点:
- Token 消耗大与生成速度慢:生成带有 CSS 和 JS 的 HTML 代码,消耗的 Token 远大于结构简练的 Markdown。Thariq 自己也承认,HTML 的生成时间是 Markdown 的 2 到 4 倍。在追求极致速度的场景下,这很难让人接受。
- 版本控制(Diff)灾难:HTML 标签繁杂,在 Git 等版本控制系统中,人类很难直观地查看两次 HTML 输出的差异,而 Markdown 的 Diff 一目了然。
- 人机共创(Co-creation)的阻力:很多资深开发者依然喜欢在 AI 生成的草稿上亲手打磨。修改 Markdown 就像写字一样自然,而在一堆 <div> 和 <script> 标签里手动改文案则充满了摩擦力。
3. 怎么看?—— 我的核心观点
看待这个争议,最准确的视角不应该是“谁取代谁”,而是它们在 AI 工作流中的分工正在发生“前后端分离”:
- 第一:前端(输出与交互)的未来属于 HTML/React 组件。
当 AI 扮演“产品经理”、“数据分析师”或“系统架构师”向人类汇报工作、做方案对比、演示原型(Mockups)时,HTML 提供的丰富 UI 是降维打击。AI 正在从一个“文本生成器”进化为“动态软件/UI生成器”。你不需要看枯燥的代码,只需要看 AI 给你渲染出的界面和图表。从这个意义上说,工程师说“未来是 HTML”是对的,因为 UI 才是人类最自然的交互界面。
- 第二:后端(输入与 AI 间通信)的未来依然是 Markdown(或 JSON)。
Markdown 并没有死,它退居幕后,成为了 “AI 的母语”和“结构化指令格式”。
当人类给 AI 写 Prompt、System Instructions(系统提示词),或者定义 AI Agent 的能力(比如现在流行的 SKILL.md 架构)时,Markdown 依然是王者。
它的 Token 效率极高(像 # 和 * 比 <h1> 和 <li> 节省大量算力和成本),并且层次结构(H1 -> H2 -> H3)极其契合大语言模型的注意力机制。
总结:
Claude 工程师的观点代表了 AI 应用层(UX/UI)的演进方向 —— AI 的交付物不再是“一坨富文本”,而是“一个可以直接运行的微型网页程序(Artifact)”。但在底层逻辑、提示词工程、知识库构建和 AI 智能体之间的通信中,轻量、高信噪比的 Markdown 在未来很长一段时间内依然不可替。
