当前位置: 首页 > news >正文

AI输出格式之争:Markdown会被HTML取代吗?

AI输出格式之争:Markdown会被HTML取代吗?

最近,Anthropic旗下Claude Code的工程师Thariq Shihipar撰写文章称,自己如今更倾向于让Claude直接输出HTML,而非过去默认的Markdown,这一表态在AI开发者圈子引发讨论。

有人觉得,Markdown是过去十几年最成功、最轻量的内容格式之一,简单、清晰、跨平台,几乎所有AI工具、代码仓库、笔记软件都围绕它建立了生态。但也有人认同,当AI的输出越来越长、越来越复杂,Markdown似乎暴露出“短板”。

在Thariq Shihipar看来,问题不在于Markdown不够优秀,而在于它难承载智能代理时代的信息密度。“动辄上百行的Markdown文件,读起来很吃力。”相比只能依赖标题、粗体、列表来组织内容的Markdown,HTML能提供更灵活的布局、更丰富的视觉层次,甚至交互能力。

这个观点得到不少AI圈知名人物支持。Andrej Karpathy(卡帕西)公开支持这一看法,透露自己已习惯在提问最后加上“以HTML的形式组织回答”,然后在浏览器里打开生成的文件阅读。卡帕西认为,音频会是人类更偏好的AI输入方式,而视觉则会成为AI更理想的输出方式。他还畅想了AI输出形式的演化路径:纯文本—Markdown—HTML—……—由扩散模型神经网络直接生成的交互式视频/模拟系统。在他看来,未来AI输出的终点,可能不再是“文档”,而是某种实时生成、可交互、可操作的动态视觉内容。

这让关于Markdown与HTML的争论,不只是“格式之争”,背后折射出AI产品形态正在发生变化。过去,人们默认AI是“聊天机器人”,输出应是文本;但当AI成为智能代理,帮人处理任务、组织信息、生成界面、调用工具后,人们不得不重新思考:AI最合适的输出形式,还应不只是文本吗?

Thariq Shihipar在随后长文里展示大量HTML输出案例,解释为何在AI时代,HTML很可能比Markdown更适合作为下一代默认输出格式。他在X上列举了五个关键点:

1.信息密度:HTML能承载比Markdown丰富得多的信息,可实现基础文档结构,也能呈现表格数据、设计样式、插图、代码片段、交互效果、工作流程、空间数据、图像等。Claude能读懂的信息,几乎都可用HTML高效呈现,这让HTML成为AI模型传递深度信息、方便审阅内容的高效方式。而Markdown做不到这些时,模型只能用低效方式凑数,如用ASCII字符画图表、用Unicode字符模拟色彩展示。

2.视觉清晰度与阅读体验:随着Claude处理的任务愈发复杂,其编写的文档变长。Thariq Shihipar发现,超过一百行的Markdown文档很难耐心读完,更别说团队其他人。而HTML文档阅读体验好,Claude可从视觉层面优化结构,通过标签页、插图、超链接等让文档浏览顺畅,还支持移动端自适应布局。

3.便于分享:Markdown文件分享不便,多数浏览器无法原生良好渲染,常作为附件发送。而HTML文件上传到服务器(如S3对象存储)就能直接分享链接,同事可在任意设备上打开查阅、随时引用。用HTML格式撰写文档,别人愿意阅读的概率更高。

4.双向交互:HTML支持人与文档交互,可加入滑块、调节旋钮调整设计参数、微调算法配置并实时查看效果变化,还可复制调整后的配置粘贴到Claude Code的提示词里继续使用。

5.数据与上下文接入:Claude Code能读取海量本地上下文,Thariq Shihipar撰写文章时,让Claude Code遍历自己的代码文件夹,找出过往生成的所有HTML文件,整理分类后自动生成汇总HTML文档,用图表展示每类文件。除本地文件系统,Claude Code还能通过MCP工具获取更多外部上下文,如Slack、Linear等协作工具,搭配Chrome中的Claude插件读取浏览器内容,调取Git版本历史记录等。

6.创作体验更愉悦:用Claude制作HTML文档更有乐趣,能让人更有参与感和投入感。

Thariq Shihipar担心,有人会把他的观点理解成新的“/html技巧”或固定提示词模板。他强调,不需要专门设计复杂Prompt,直接告诉Claude“帮我生成一个HTML文件”或“生成一个HTML成品文档”即可。关键是想清楚HTML成品要实现的功能和使用方式,现阶段建议直接从零自然下达指令,慢慢熟悉不同场景的运用。

为具体说明,Thariq Shihipar针对不同场景制作多种HTML文件,可在此查看全部示例:https://thariqs.github.io/html - effectiveness/。

-规范、规划与探索:HTML像“更丰富的画布”,让Claude更深入问题。Thariq Shihipar处理问题时,倾向让Claude逐步生成一整套关联的HTML文件。如先让Claude Code头脑风暴、探索方案并生成分析页面,再围绕某个方向展开制作设计稿、Mockup或代码示例,思路清晰后输出最终实现计划。确认方案没问题后,开启新会话并把前面生成的HTML文件交给Claude进入实现阶段。验证环节,让负责校验的Agent读取这些文件,使验证模型获得更完整、丰富的上下文信息,准确理解项目内容。示例提示词如“我不确定引导页方向,生成6种差异明显的方案并在HTML文件里用网格布局并排展示,标注取舍”“用HTML生成完整实施计划,包含原型图、数据流展示和关键代码片段”。适用场景包括探索代码实现方式、视觉设计方案等。

-代码评审与理解:代码在Markdown里难阅读,HTML可渲染差异对比、注释、流程图、模块结构图等,可用于理解AI生成的代码、完成代码评审、向他人解释PR。Thariq Shihipar提交的每个PR都会附上HTML代码说明。示例提示词如“帮我生成HTML文档评审PR,讲解流式处理/反压逻辑,渲染代码差异,加行内边注,按严重程度标注问题并补充内容”。适用场景包括创建PR、评审PR、理解代码知识点等。

-设计与原型:Claude Design基于HTML,HTML在设计表达上能力强,即便最终产品不是网页,Claude也可用HTML画出设计稿并转成所需语言,还可制作交互动效原型。示例提示词如“我想做新的结算按钮原型,点击后播放动画并变紫色,用HTML做带滑块和选项的页面,调试动画参数,加复制按钮”。适用场景包括生成设计系统产物、调整组件、可视化组件库、制作动画原型等。

-报告、研究与学习:Claude Code擅长整合多源信息并转换成易读报告,可检索Slack、代码库、Git历史、网络信息等,输出长文档、交互式讲解页或幻灯片,可用SVG做图表让内容更直观。示例提示词如“我不懂限流机制,读取相关代码,用单个HTML页面讲解,包含流程图、关键代码和注意事项”。适用场景包括总结功能运行原理、讲解技术概念、写周报、事故报告等。

-自定义编辑界面:有些需求难用文字描述,Thariq Shihipar会让Claude为当前任务做一次性专用编辑器,最后加导出功能,如“复制为JSON”“复制为提示词”按钮,将界面操作结果转成文本贴回Claude Code继续使用。示例提示词如“我要重新排序30个Linear任务,做HTML页面,任务为可拖拽卡片,分四列,预先排序,加‘复制为Markdown’按钮,导出最终顺序并为每类任务写说明”“这是功能开关配置,做表单编辑器,按业务分组展示开关,标明依赖关系,开启未满足依赖开关时给出警告,加‘复制差异’按钮”“我在调试系统提示词,做左右分栏编辑器,左边编辑提示词,高亮变量插槽,右边三个示例输入,实时渲染填充结果,加字符/Token计数器和复制按钮”。适用场景包括排序、分类、归类内容,编辑结构化配置,调试提示词、模板、文案,筛选、审批、打标、导出数据集,注释文档、转录文本、差异注释并导出,选择难以用文字表达的参数等。

随着关于“从Markdown转向HTML”的文章传播,Thariq Shihipar收到很多关于这种工作流的讨论。他对常见问题进行了解答:

-:会不会更耗Token?

-Thariq Shihipar:Markdown通常用更少Token,但HTML表达力更强,整体产出效果更好。Opus 4.7支持100万上下文窗口,Token增加几乎感知不到。

-:你现在什么时候还用Markdown?

-Thariq Shihipar:说实话,我几乎完全不用Markdown了,我可能算是极端的HTML拥护者。

-:怎么查看HTML文件?

-Thariq Shihipar:我一般直接在本地浏览器打开(也可让Claude帮打开);需要分享就上传到S3生成链接。

-:生成时间比Markdown更长吗?

-Thariq Shihipar:确实更长!HTML生成时间大约是Markdown的2 - 4倍,但我觉得效果值得。

-:版本控制怎么办?

-Thariq Shihipar:这是HTML最大的缺点之一。HTML的差异对比杂乱,比Markdown难审阅。

-:怎么让Claude做出符合我审美、不丑的页面?

-Thariq Shihipar:前端设计插件能帮助Claude生成好看的HTML。想匹配公司风格,可让Claude读取代码库,生成设计系统HTML文件,之后用它作为参考生成其他页面。

Thariq Shihipar表示,使用HTML的真正原因是能更深度地参与到Claude的工作流程中。“我曾经担心,因不再深度阅读方案,只能放手让Claude自己做决定。但现在我可以开心地说:用HTML时,我比以往任何时候都更有掌控感。希望你也能有同样的体验。”

不过,围绕“用HTML取代Markdown”,开发者社区有不同声音。一些网友担心,开发流程转向HTML,人类与大模型“共同编辑同一份文档”的能力会被削弱。Markdown更接近“可编辑文本”,开发者能快速阅读、随时插入和删改内容,无需额外处理布局和页面结构。而重新给大模型发送Prompt修改HTML内容,会让修改路径变长、打断思路。有人担心,“默认输出HTML”成主流后,人和大模型“共同创作”的模式会弱化。还有网友指出,并非所有软件工程师都是前端开发者,当开发者需亲自修改、维护、协作内容时,HTML可能带来新的复杂性。

那么,你是否尝试过让AI使用HTML作为输出格式?相比Markdown,体验是更进一步,还是只是“看起来更高级”?在AI Agent时代,Markdown真会退出历史舞台吗?欢迎分享看法。

http://www.jsqmd.com/news/821621/

相关文章:

  • VMware虚拟机安装Windows11:从零到桌面的完整避坑指南
  • 基于Discord与OpenAI API的AI自用机器人开发实战指南
  • 重塑直播时间维度:当文本源成为你的智能时间管家
  • 国内超精密运动平台品牌排行 实测维度全解析 - 奔跑123
  • 科技早报晚报|2026年5月15日:无摄像头空间感知、Android 设备实验室与视频检索代理,今天更值得跟进的 3 个技术机会
  • Digital-IDE技术架构解析:硬件开发的一站式解决方案
  • 国内精密大理石平台主流供应商实力排行盘点 - 奔跑123
  • 别再只用GitHub了!手把手教你用GitLab搭建团队专属代码仓库(附TortoiseGit配置)
  • DHGNN实战:动态超图神经网络如何革新社交情感分析
  • DLSS Swapper:5分钟掌握游戏性能优化的终极神器
  • DPU加速数据包转向逻辑:从P4编程到K8s集成的实战指南
  • 区块浏览器后端:区块/交易/地址/合约查询、链数据统计.
  • NoFences:告别混乱桌面!这款开源免费分区工具让你工作效率翻倍
  • 3步掌握Mermaid实时编辑器:从新手到专业图表设计师的完整指南
  • BilibiliDown终极指南:三分钟学会B站视频批量下载神器
  • DroidCam OBS Plugin:将智能手机摄像头转化为专业直播源的完整技术方案
  • Prompt Engineering入门到精通:从核心技巧到实战应用的全方位指南
  • 2015-2026.5上市公司政府采购合同公告数据
  • 盒马礼品卡回收避坑指南|闲置福利卡变现认准正规平台 - 喵权益卡劵助手
  • WechatSogou:基于搜狗微信搜索的微信公众号数据采集与解析利器
  • 从蒙特卡罗到数据同化:集合卡尔曼滤波(EnKF)核心原理与Python实践解析
  • 2026杭州黄金回收今日行情:琳弘湾延安路门店实测与三区攻略 - 润富黄金珠宝行
  • 【Fusion360】从草图到装配:核心快捷键与高效建模技巧全解析
  • 深入解析网易游戏NPK文件:从二进制格式到完整资源提取实战指南
  • 告别百度网盘!手把手教你用VirtualBox 7.0快速安装纯净版Win10虚拟机
  • C#与Python的深度握手:利用IronPython实现脚本引擎集成
  • AI安全专家系统:基于LLM智能体的自动化安全测试与漏洞分析
  • 历时五年、花费超五百万美元,Wasp 为何称创建新 Web 开发语言是个错误?
  • 用STM32F103和DRV8711驱动步进电机:从原理图到代码的保姆级避坑指南
  • fre:ac音频转换器:跨平台免费音频转换的终极解决方案