当前位置: 首页 > news >正文

AI Agent(智能体)的输出格式应该从 Markdown 转向 HTML吗?

在近期(2026年5月)的技术圈和AI社区引发了非常热烈的讨论。提出这个观点的是 Anthropic(Claude背后的公司)负责 Claude Code 团队的工程师 Thariq Shihipar,他最近发表了一篇题为《使用 Claude Code:HTML 极其不讲理的有效性》(The unreasonable effectiveness of HTML)的文章,呼吁 AI Agent(智能体)的输出格式应该从 Markdown 转向 HTML。

要客观地看待“AI的未来是Markdown还是HTML”这个问题,我们可以从这位工程师的核心论点、HTML与Markdown的优劣势对比,以及AI交互范式的演进三个维度来剖析。


1. 为什么 Claude 工程师认为“未来是 HTML”?


Thariq Shihipar 认为 Markdown 虽然是目前与 AI 交互的主流格式,但它的局限性越来越明显。他指出了 HTML 在 AI 输出中的四大核心优势:

  • 极高的信息密度与视觉表现力:Markdown 只能呈现纯文本、简单的表格和外部图片。如果让 AI 画图,它只能勉强用 ASCII 码拼凑;而 HTML 可以直接内嵌 CSS、SVG 矢量图、颜色代码和空间布局(比如在一页里做多方案的并排网格对比)。
  • 双向交互能力(Interactivity):Markdown 是静态的单向输出。而在 HTML 中,AI 可以生成带有滑块、按钮、Tab 切换页面的交互式组件。你可以直接在 HTML 里拖拽滑块调整参数,然后把结果反馈给 Claude,这是 Markdown 绝对做不到的。
  • 可读性与分享门槛低:超过 100 行的 Markdown 文件对非技术人员来说阅读体验极差。而 HTML 文件由于浏览器原生支持,甚至可以通过 S3 生成链接一键分享给团队里的任何人,大家打开的意愿和阅读体验大幅提升。
  • “人类直接编辑”的需求正在消失:过去用 Markdown 是因为它方便人类手工修改。但现在,人们越来越倾向于“让 Claude 帮我改”,而不是自己去改代码。既然直接编辑文本的需求变弱了,Markdown 最大的优势也就随之消解了。


2. 社区的反方意见:Markdown 真的会被淘汰吗?


在 Hacker News 和开发者社区中,虽然很多人认同 HTML 带来的富交互体验(这也正是 Claude 独有的 Artifacts 功能大受欢迎的原因),但也指出了 HTML 现阶段的致命弱点:

  • Token 消耗大与生成速度慢:生成带有 CSS 和 JS 的 HTML 代码,消耗的 Token 远大于结构简练的 Markdown。Thariq 自己也承认,HTML 的生成时间是 Markdown 的 2 到 4 倍。在追求极致速度的场景下,这很难让人接受。
  • 版本控制(Diff)灾难:HTML 标签繁杂,在 Git 等版本控制系统中,人类很难直观地查看两次 HTML 输出的差异,而 Markdown 的 Diff 一目了然。
  • 人机共创(Co-creation)的阻力:很多资深开发者依然喜欢在 AI 生成的草稿上亲手打磨。修改 Markdown 就像写字一样自然,而在一堆 <div> 和 <script> 标签里手动改文案则充满了摩擦力。

3. 怎么看?—— 我的核心观点


看待这个争议,最准确的视角不应该是“谁取代谁”,而是它们在 AI 工作流中的分工正在发生“前后端分离”:

  • 第一:前端(输出与交互)的未来属于 HTML/React 组件。

当 AI 扮演“产品经理”、“数据分析师”或“系统架构师”向人类汇报工作、做方案对比、演示原型(Mockups)时,HTML 提供的丰富 UI 是降维打击。AI 正在从一个“文本生成器”进化为“动态软件/UI生成器”。你不需要看枯燥的代码,只需要看 AI 给你渲染出的界面和图表。从这个意义上说,工程师说“未来是 HTML”是对的,因为 UI 才是人类最自然的交互界面。

  • 第二:后端(输入与 AI 间通信)的未来依然是 Markdown(或 JSON)。

Markdown 并没有死,它退居幕后,成为了 “AI 的母语”和“结构化指令格式”。
当人类给 AI 写 Prompt、System Instructions(系统提示词),或者定义 AI Agent 的能力(比如现在流行的 SKILL.md 架构)时,Markdown 依然是王者。
它的 Token 效率极高(像 # 和 * 比 <h1> 和 <li> 节省大量算力和成本),并且层次结构(H1 -> H2 -> H3)极其契合大语言模型的注意力机制。

总结:


Claude 工程师的观点代表了 AI 应用层(UX/UI)的演进方向 —— AI 的交付物不再是“一坨富文本”,而是“一个可以直接运行的微型网页程序(Artifact)”。但在底层逻辑、提示词工程、知识库构建和 AI 智能体之间的通信中,轻量、高信噪比的 Markdown 在未来很长一段时间内依然不可替。

http://www.jsqmd.com/news/797698/

相关文章:

  • TI FMCW毫米波雷达进阶:多普勒FFT与速度解模糊实战
  • CompressO:重新定义媒体文件压缩的自由与效率
  • AIGC检测原理是什么?为什么改稿没用?降AI工具是怎么工作的?
  • 拆解LCD12864串行时序:用STM32的GPIO模拟,一步步带你读懂那张时序图
  • 2026 年 Redis 面试题全解析:原理 + 实战 + 高频考点
  • Wechatsync(文章同步助手)自动发布神器
  • 【Linux实战】从零部署Python科学计算环境:NumPy与Matplotlib的安装与验证
  • 佛山翡翠回收哪家稳?收的顶30年老店,鉴定透明秒到账 - 奢侈品回收测评
  • 别再只看市盈率了!揭秘 2026 年量化圈最火的“读心术”因子
  • Xilinx MIG核读写DDR3时,这个时序细节没处理好,数据就全乱了(附Vivado 2020.1调试实录)
  • 【Portal实战指南】STEP 7 Basic许可证丢失排查与一键修复
  • 华为防火墙/交换机syslog日志收集实战:从设备配置到Kibana展示的保姆级流程
  • 5分钟免费解锁iPhone激活锁:applera1n终极使用指南
  • SKILL技能包学习
  • 大模型长文档理解新拐点已至(2026年Claude专项能力解密):支持128K上下文+动态摘要锚点+引用溯源追踪
  • 从“人肉运维”到解放双手:我们小团队如何用Jenkins Pipeline + Git分支策略搞定多环境(开发/测试/生产)自动化发布
  • 开源工具phantom-secrets:轻量级秘密管理方案,助力安全开发与CI/CD
  • 我的智能车调参血泪史:如何用STM32和模糊PID让小车跑得更稳?
  • AC鸭的温度墙
  • 别再只盯着CRC了!聊聊Modbus ASCII模式里的LRC校验,附C语言实现与调试技巧
  • 车载互联十年反思:从76%安全担忧看智能座舱设计的人因工程挑战
  • 中文大语言模型资源导航:Awesome-Chinese-LLM项目全解析
  • vim翻页命令用法详解
  • 保姆级教程:用EEGLAB搞定脑电数据预处理,从导入到ICA去伪迹全流程避坑
  • nlux框架:快速构建可定制AI对话界面的JavaScript解决方案
  • 2026年5月正规珠海旅行社最新靠谱纯玩线路推荐:珠海香港澳门一/二日经典地标游!附珠港澳旅游核心FAQ(15问必答) - 奋斗者888
  • 告别USB复合设备驱动混乱:手把手教你用IAD(接口关联描述符)正确管理多接口
  • FFXIV TexTools深度解析:从游戏资源编辑到个性化创作的全流程实战
  • 从零到上手:用LDAP Browser连接和管理你的OpenLDAP服务器(Windows平台实战)
  • CANN/asc-devkit FreeAllEvent API文档