当前位置: 首页 > news >正文

一周内三巨头齐发新技术,AI从文字机器到表达工具的起点来了?

三巨头扎堆推出交互式可视化功能

3月12日,Anthropic官宣,Claude现在可以在对话中直接生成交互式图表、流程图和可视化内容。若询问它关于元素周期表的问题,它能直接绘制可点击的周期表,每个元素点进去都有详细信息。有意思的是,两天前OpenAI刚给ChatGPT上线类似的交互式可视化功能,而Google的Gemini去年11月就开始做这件事了。一周之内,三巨头全部发出了自己的新技术,这难道只是巧合?

Claude的可视化功能特点

「给AI一块白板」和大家理解的AI画图不同。Claude画的东西,底层是HTML代码和SVG矢量图形,相当于给Claude发一块白板,让它边说边画。而Midjourney图像生成,更像是程序员现场写代码、现场渲染。和Claude已有的Artifacts功能相比,「白板」定位不同。Artifacts是作品,可以下载、分享、反复使用,在侧边面板里,关了对话还在;但对话内的可视化是临时的,对话往下走可能就没了。若觉得图不对,告知Claude它会当场改正;若想深挖某个部分,点击一下它会继续展开。这个功能的前身是「Imagine with Claude」实验,当时该功能只给Max用户体验几天后就关闭,很多人以为是技术秀,结果半年后核心能力以更实用的方式落地。

Claude功能测试情况

Inc.的记者让Claude生成Timothée Chalamet争议事件的交互式时间线,它不仅做了完整的事件节点可视化,还添加了「愤怒指数」仪表盘。另一个测试是让它做宝可梦系列的视觉历史,带有游戏、影视、文化事件的分类筛选器,完成度相当高。该功能默认开启,免费用户也能用,目前支持Web端和桌面端,移动端暂时没有。

三巨头技术发展历程对比

2025年11月,Google的Gemini上线交互式图像,将教材里的静态图变成可点击的学习工具;2026年初又推出「Guided Learning」模式,把图像、视频、测验打包成学习伴侣。2026年3月10日,OpenAI的ChatGPT上线「动态视觉解释」,覆盖70 + 个数学和科学概念,每周有1.4亿人用ChatGPT学数学和科学。2026年3月12日,Anthropic上线,且免费用户也可使用。对比之下,Google去年12月给Gemini Ultra上的高级交互式图表和模拟,订阅费每月200美元,门槛较高。Anthropic此前在音频、图像、视频等多模态方向基本没投入,现在另辟蹊径,用代码画图,扬长避短。

三家不同的打法思路

OpenAI的ChatGPT高度结构化,有70多个预设主题,从二项式展开到库仑定律、从指数衰减到胡克定律,每个都有专门设计的交互模块,但不能可视化任意话题,超出预设主题就不触发。好处是做得精,专业感强,教学设计有章法;代价是范围窄,灵活性差。OpenAI先做教育,面向高中生和大学生,以后再扩张,配合去年上线的Study Mode和QuizGPT,其在教育赛道布局完整。

Gemini的路子像给一张现有的图「开外挂」,AI识别图像里的关键元素,自动生成可点击的标签和解释面板。例如点一下细胞图里的高尔基体,就会弹出其定义和功能。本质上围绕图像做文章,得先有图才能交互。但Google的优势在生态,LearnLM教育模型、YouTube视频、Google Classroom的打通,让这个功能可以直接嵌入课堂场景,这是OpenAI和Anthropic做不到的。

Claude不限主题,不限场景,不要预设模板,理论上能画任何可以用代码表达的东西,而且这些可视化还能和Figma、Canva、Slack等第三方应用联动,暗示Anthropic想构建一个连接生产力工具的视觉交互层。今年1月Claude上线的Connectors功能让它能直接操作第三方应用,现在加上可视化,拼图又多了一块。不过,Claude也有缺点,如The New Stack的记者让Claude画非塔台机场的VFR进近模式图,大体对了,但「中场侧风进入」的标注位置搞错了,且复杂可视化速度较慢,一个复杂可视化可能要等30秒,而用搜索引擎找一张类似的图只要3秒,但在Beta阶段这些都正常。

AI可视化发展趋势与思考

三家同时押注可视化,可能意味着纯文本回复正在触及天花板。AI聊天核心交互一直是文字问答,但越来越多场景证明文字难以胜任,如解释时间复杂度,一张图比三段话清楚;呈现销售数据,一个可拖动的图表比一堆数字有感觉;教物理概念,让学生自己拖参数看变化比对着公式发呆管用得多。而且教育研究表明,交互式学习比被动阅读的理解效果好得多。之前的AI没有画的能力,只能用文字硬扛,现在三家同时点亮了画图技能,且各家选择都和自身生态有关。OpenAI有1.4亿周活学生用户,做教育顺理成章;Google有LearnLM和Classroom生态,做标注式学习是老本行;Anthropic代码能力最强,用代码画白板是自然延伸。Digital Trends报道提到,Anthropic把这次更新定义为Claude「学会选择最佳表达格式」,Claude正在从「文字助手」变成「多格式表达引擎」。AI竞赛持续三年多,模型能力差距变小,跑分互有胜负,用户感知模糊,「谁更会表达」成了新战场,这一轮三家答案一致:让AI学会画画。不过这些功能都还是早期,Claude的标注偶尔出错,ChatGPT的交互模块覆盖面有限,Gemini的高级功能需要200美元的入场费。真正的竞赛不在谁先上线,而在谁能把「边说边画」做成用户根本不会注意到的自然交互。2026年3月这一周,或许就是AI从文字机器变成表达工具的起点。三巨头扎堆推出新技术,究竟是巧合,还是故意为之呢?

http://www.jsqmd.com/news/709199/

相关文章:

  • S32K3功能安全实战:手把手教你用MCAL配置FCCU,搞定内存ECC错误处理
  • 计算机毕业设计:Python股票智能诊断与趋势预测系统 Flask框架 深度学习 机器学习 AI 大模型(建议收藏)✅
  • 保姆级教程:在RK3588 Android 12/11上抓取硬件编解码码流(附Codec2/OMX命令详解)
  • 别只看游戏卡了!聊聊英伟达Tesla、AMD Instinct和英特尔数据中心GPU,它们才是AI算力的幕后主角
  • 暗黑2存档编辑器终极指南:10分钟掌握游戏角色自定义
  • 令牌管理革命:Tiktokenizer如何实现AI成本精准控制
  • iziModal事件系统完全指南:如何监听和控制模态框生命周期
  • JavaQuestPlayer终极指南:3步快速运行QSP游戏的完整解决方案
  • SSHFS-Win终极指南:在Windows上快速挂载远程Linux文件系统的完整教程
  • Harness Engineering:工程化驾驭AI编程助手,从智能补全到规格驱动开发
  • Frida Gadget持久化实战:从原理到踩坑,聊聊重打包那些事儿
  • ILSpy BAML反编译器实战指南:解密WPF应用的界面密码
  • React-antd-admin-template国际化与主题切换功能实现教程
  • AI遗嘱规划师:模型生命终结协议
  • Python新手必看:遇到‘utf-8‘解码失败别慌,这3个排查步骤帮你搞定(附requests库实战)
  • 从‘mv’命令看Linux哲学:一个简单指令背后的设计思维与高效工作流
  • 栈结构实战:从「有效括号」到「最小栈」,吃透栈的核心用法
  • [特殊字符] 终极漫画阅读体验:Venera 开源阅读器完整指南!
  • 告别Electron!用Qt QWebEngine + QWebChannel 打造高性能桌面混合应用(附完整Demo)
  • EmojiOne彩色字体终极指南:5分钟打造跨平台表情统一体验
  • 别再只给Gerber了!与PCB工厂高效沟通:坐标文件和钻孔文件的正确打开方式
  • WarcraftHelper终极优化指南:2024年魔兽争霸III完全配置教程
  • GPEN处理儿童照片伦理规范建议:避免过度美化
  • 2026 内蒙古防静电地板与硫酸钙防静电地板本土厂家甄选参考 - 深度智识库
  • CompLLM:大语言模型长上下文处理技术解析
  • 多模态大语言模型推理能力提升方法DRIFT解析
  • 从Rancher Server到Node Agent:一张图看懂Rancher 2.8架构,搞懂它如何“遥控”你的K8s
  • PvZWidescreen终极指南:免费让《植物大战僵尸》完美适配宽屏显示器
  • florr.io新手必看:从Ant Egg到Mythic,一份超详细的生物掉落率速查表(附实战心得)
  • 清晰曝光与长效耐用兼得——2026四川招牌/灯箱制作优选服务商横评 - 深度智识库