当前位置: 首页 > news >正文

大学买不到GPU怪我?黄仁勋斯坦福现场火力全开:是你们体制的错!

过去 60 年的计算底座已被彻底颠覆,“把 GPU 比作原子弹极其愚蠢。”

编译 | 王启隆

出品丨AI 科技大本营(ID:rgznai100)

最近,黄仁勋回到母校斯坦福,参与了一场访谈形式的客座讲座。台下盯着他的,不只是学生,还有一整代正在被 AI 改写职业命运的人。

大家表面上在问课程、开源、芯片、算力,真正想问的,其实是另一件事,过去那套计算机世界的规则,是不是已经翻篇了?如果真的翻篇了,我们该拿什么去追下一局?

这是个焦虑的时代。马斯克为 xAI 重金组建超大计算集群,硅谷大厂为了抢夺 H100 和 B200 芯片互不相让,加上跨国半导体出口管制的博弈愈演愈烈,整个行业都笼罩在极度的算力焦虑之中。而黄仁勋这次给出的回答,很少是温和的。

一开口就把背景拉到 60 多年那么长,说过去我们熟悉的计算,本质上更像一种预录制系统,图像是提前做好的,软件是提前写好的,响应也是按既定路径发生的。但现在,计算正变成一种实时生成的东西。它不只是执行命令,而是在理解语境、生成反馈、调用工具,甚至开始具备一点点像「思考」的能力。

顺着这个判断往下推,变化就不只是模型变强了,也不只是多了一波 AI 创业机会,而是从软件怎么写、芯片怎么造、公司怎么组织,到大学该怎么教学生,全都得重来一遍。

这是一篇难得的对话。黄仁勋把自己这几十年怎么判断技术浪潮、怎么扛过错误、怎么设计系统、怎么理解竞争,掰开了讲给一群即将下场的人听。

要点速览

  • AI 不是给旧计算范式加一层外挂,而是在把过去 60 多年的计算模型整套改写。过去的计算更像「预录制」,现在的计算越来越像「实时生成」,这会连带改变软件、芯片、组织形态和教育方式。

  • co-design 时最核心的一层,不只是软硬协同这四个字,而是把算法、编译器、框架、芯片、网络、存储放在同一张桌子上一起优化。英伟达过去十年的巨大跃迁,本质上就来自这种极端协同设计。

  • 最前沿的商业模型今天确实最好用,但另一方面,开源依然是语言平权、行业拓边和 AI 安全的必要基础。尤其在生物、自动驾驶、机器人这些领域,如果没有人先把基础模型和训练方法做出来,下游生态根本起不来。

  • MFU 高低本身不是一个好指标,真正该看的,是系统最终交付了多少有价值的 token、每瓦特能换来多少实际智能输出,而不是 flops 漂不漂亮。

  • 未来大学不可能只靠预先写好的教材跟上 AI 的速度。AI 不只是一个要学的对象,它本身就该成为课程体系和学习过程的一部分。

  • AI 时代最重要的能力不是追热点,而是重新理解系统。谁能更早看清新的计算模式、围绕它重组技术和资源,谁才更可能吃到下一阶段最大的红利。

CSDN读者高能福利🎁

今日算力券已开放

扫码领取 100 小时云算力

咖啡券领取链接:https://s.csdn.cn/4nPsOp

过去熟知的计算是“预录制”的,现在一切都是实时“生成”的

主持人:我们正身处一场比纳斯卡赛车还要狂飙突进的全球竞赛中,而这多少得“怪”你——老黄就像一位布道师,给了我们所需的全部算力、能量,甚至更多,让我们度过了我生命中最疯狂的 12 个月——相信在座的许多人也有同感。而这一切,才刚刚开始。你对待每一件事都倾注了极大的热情,包括去年的课程,以及每一次我有幸与你交流时,你总是把大量的时间留给学生和创业者。谢谢你。我们直接切入正题好吗?

黄仁勋:好,我们开始吧。

主持人:好的,我们来个快问快答。什么是“软硬件协同设计”(Co-design)?它为什么如此重要?

黄仁勋:我稍后就来回答这个问题。当下是投身计算机科学的最好时代。原因显而易见:计算技术正在经历一场过去 60 多年来前所未有的彻底颠覆。

过去 64 年来,你们所使用的计算机、我们的计算模型、对计算机的认知、计算机的架构、编写和运行程序的方式,甚至将计算机推向市场和应用领域的思路,自 IBM System/360 问世以来,基本没有发生过根本性的改变。事实上,我当年学习计算机架构的启蒙教材,就是 System/360 的手册。

虽然从个人电脑到互联网、移动设备再到云计算,很多东西都变了,但计算模型——也就是计算机科学的底层根基——直到今天才迎来了真正的巨变。这是有史以来第一次,编写软件的方式、处理神经网络与传统软件的差异,以及应用程序所能达到的边界,都发生了翻天覆地的变化。一切都截然不同了。

从最高维度来看,一个最简单的理解方式是:过去我们熟知的计算,本质上是“预录制”的(pre-recorded)。无论是图像、视频还是软件,基本上都是事先准备好的内容。但现在,一切都是实时“生成”的(generated)。实时生成的美妙之处在于,它可以与你当下的语境保持高度一致,并给出恰如其分的反馈;它不仅能执行你的明确指令,还能真正响应你的意图。从这个意义上说,计算机已经发生了本质的蜕变。

那么问题来了,这对整个技术栈的每一层意味着什么?从现代软件的开发方式、方法论,到你如何组织一家公司来开发软件,都已被彻底颠覆。我们使用的工具、思考代码的路径完全变了。运行软件的方式——无论是运行神经网络还是编译后的二进制文件——也大相径庭。

那么,这对计算机系统、网络和存储意味着什么?对架构其上的软件栈和云服务又意味着什么?当然,在应用层面,它又解锁了什么?刚才有人提到我们刚刚开源了一款名为 Alpamayo 的软件。我在自动驾驶领域已经深耕了大约 13 年,无人驾驶出租车遍地开花的时代真的要来了。未来,所有能移动的物体都将实现机器人化。

这就是一个典型的例子:在深度学习和人工智能出现之前,我们根本不敢想象能实现这样的应用。这是一个巨大的突破口,让我恍然大悟:“啊哈!过去那些我们需要依靠计算机视觉来解决的难题,现在终于有了根本性的解法。”

所以,你需要重新思考其中的每一个环节。什么是软件工程师?如何重组公司架构?AI 时代的计算机到底是什么样的?如何去设计它的架构?一直延伸到你能用它做什么,以及你会把它部署在哪里。这一切都被重构了。对我而言,这段旅程其实始于 15 年前。我有幸接触到了该领域的一些早期研究,就像所有斯坦福的学生一样,你把问题拆解,从第一性原理出发去推导,最终得出结论:一切都变了。

所以,在座的计算机科学专业的同学们,你们真正见证了 AI 变得实用化的第一代。几年前,我们还停留在生成式 AI 的阶段。大家知道,生成式 AI 不仅让生成图像、文本摘要和翻译变得很酷,它还赋予了机器“思考”的能力。当我看到生成式 AI 时,别人看到的是它能画图,我当然也欣赏这一点,但我看到的是:既然它能以图像的形式生成思想,既然它能生成思想,它就能进行推理。在 GPT 问世之后,AI 具备思考能力已经成为不争的事实。

接下来的问题是:你该如何训练、微调一个 AI,让它能够一步步地进行推理?又该如何以半监督的方式,在极大规模上教会它做到这一点?这些都是你需要解决的工程难题。但在你看到 GPT 的那一刻,你就会感叹:“啊哈,机器思考的时代近在咫尺了。”

思考,其实就是生成供内部消耗的 Token;而生成供外部消耗的 Token,则被称为“工具调用”(tool use)。所以,在两年前 GPT 诞生之后,我们能预见到今天的局面其实并不困难。当然,这期间涌现了海量的技术发明,许多了不起的人做出了惊人的贡献,但你几乎能提前预见到这一刻的到来。

现在,我们拥有了智能体系统(agentic systems)。那么接下来呢?如果未来的计算机不再是被动响应你的指令,不再是按需购买,世界会变成什么样?今天的计算,本质上是“按需计算”。“按需”(on-demand)这个词正是我们这一代人发明的,用来定义我们使用计算机的方式。按需使用的分时计算机演变成了云计算,而云计算自然也是按需的。但在未来的智能体世界里,这些计算机将是持续运行的。当计算机 24 小时永不停歇地运转时,世界会发生什么?云服务会变成什么样?你的个人电脑会变成什么样?所有这些系统又将何去何从?

这又是一次重新思考一切的绝佳机会。这就是我的开场白:因为我们所做出的改变,计算机科学的一切都变了,每一个科学领域的一切也都变了。现在是重返校园学习的最好时机。

协同设计与现代教育

主持人:我准备把提问权交给学生们了。首先是关于协同设计(co-design),这是投票第一的问题。

黄仁勋:协同设计非常有趣。简单来说,在过去,我们将计算进行了抽象分层,设计微处理器的人只管设计微处理器,做编译器的人只管做编译器,搞编程语言的人只管搞编程语言,以此类推。大家都知道这一点,我们甚至将它们划分成了不同的学科。

但这带来了一个问题,而这个问题的解法恰恰诞生在斯坦福。RISC(精简指令集)的魅力何在?约翰·轩尼诗(John Hennessy)教授那项伟大研究的精髓是什么?它的精髓就在于,你必须将编译器和微处理器架构和谐地“协同设计”。否则,你可能会造出一个极其紧凑、各项指标都优化到极致的微处理器,但遗憾的是,它极难编译,甚至根本无法编译。

所以,他们创造了一种更简单的指令集,将这种简单性暴露给编译器,让编译器能更好地生成代码。事实证明,一台经过协同设计的简单机器,加上一个优秀的编译器,其性能远超两个各自独立优化到极致的系统。这非常“斯坦福”,这是你们的学术传承,也是轩尼诗教授留下的伟大印记。

顺着这个思路想:在通用计算时代结束之后,会发生什么?为什么计算机科学中的每一个问题,都非得用通用设备来解决不可?某种程度上你可以说,如果有通用设备,那当然最好。然而,面对一些极端的难题——无论是早期的计算机图形学,还是分子动力学、量子化学、流体动力学、大型介观多物理场问题,亦或是深度学习——这些问题的计算强度实在太大了。你为什么还要用一台通用计算机去硬扛呢?

所以,这里最大的洞察是:如果你同时懂算法、懂计算机系统、懂编译器、懂框架,还懂芯片架构,并且你能同时对这所有层级进行全局优化,结果会怎样?事实胜于雄辩。这就是我刚才描述的做法所带来的结果。英伟达可能是有史以来第一家将“极端协同设计”贯彻到底的计算机系统公司。我们真正在 CPU、GPU、网络、交换机和存储等所有层面上进行了全面的协同设计。

你问我们得到了什么?你们都知道以前的摩尔定律。摩尔定律大约是每 18 个月性能翻一番,算下来差不多是 5 年提升 10 倍,10 年提升 100 倍。那是摩尔定律的黄金时代。在座的计算机科学家都知道,支撑摩尔定律的一个底层概念叫“登纳德缩放定律”(Dennard scaling)。但登纳德缩放定律在几年前——其实大概十年前——就已经耗尽了潜力,尽管我们一直在试图压榨它。

在过去的十年里,如果你仅仅依赖微处理器的自然迭代,不去碰软件,只享受半导体和微处理器设计带来的速度提升,最好的情况下你只能获得 100 倍的性能增长。但由于登纳德缩放定律失效和摩尔定律的基本终结,你在这十年里实际上可能只获得了 10 倍左右的提升。

但在英伟达的协同设计下,我们在十年内实现了 100 万倍的性能提升。100 万倍!当你面对如此庞大的数字时,究竟是 10 万倍还是 100 万倍已经不重要了。正是因为我们在 10 年内获得了 100 万倍的性能跃升,让计算规模以如此惊人的速度膨胀,AI 研究人员才会说:“我们干脆把整个互联网的数据都拿来用吧!为什么还要费心去筛选和创造数据?直接把世界上所有的数据都喂给计算机就行了。”

这就是当你能以极其疯狂的速度完成某件事时,所带来的巨大突破。打个比方,如果你能以光速旅行,那你选择住在哪里根本不重要。如果你能在 10 分钟内从纽约飞到加州,我们的自由度、社会的方方面面都会被彻底颠覆,对吧?同理,如果你能让计算速度提升 100 万倍,关于计算的一切就都改变了。这才是真正的巨大突破。因为协同设计,因为英伟达的这种路径,我们极大地加速了计算,从而创造了这种无限丰饶的机遇,让所有人都能重新构想未来。

主持人:酷。我有一堆追问,但我忍住了。仅仅一个词就引出了这么精彩的回答。

黄仁勋:在英伟达工作就是这种体验。你抛给我一个词,我能跟你滔滔不绝讲上半个小时,因为我有太多的东西想跟你们分享。

主持人:下一个问题是:面对行业的剧变,教育应该如何演进?它正在发生改变吗?

黄仁勋:这是一个极其出色的问题。答案很明确:AI 必须成为你们课程体系的一部分。不仅仅是去学习 AI,更是要用 AI 来辅助教学。

如你所知,教科书的问题在于,编写它需要耗费巨大的心血。我在斯坦福上学时,轩尼诗教授还在写他的那本经典教材。当时全都是手写稿,感觉他每周都在写一章。我甚至不知道他是怎么做到一周写一章的,但随着时间的推移,所有的笔记最终汇编成了第一版教科书。那肯定花了好几年的时间。

我认为,大学和那些预先编写好的教科书,已经不可能跟得上 AI 实时生成信息和知识的速度了。所以,未来的教育必定是两者的结合。我不知道你们怎么样,但如果没有 AI,我已经没法学习了。我不仅让 AI 帮我读论文,读完之后,我还会让它去阅读与之相关的一大堆衍生论文。这样一来,它就变成了一个超级研究员。首先我让它做总结,问它一些基础问题,然后我就像和一位专属研究员对话一样,去深入探讨这篇论文。很多人没有意识到这一点。大多数人依然认为 AI 只是用来总结文档的,但在总结的过程中,AI 实际上学到了很多东西。我真心希望 AI 能够与课程体系深度融合。

不过,我也要为教科书辩护一句:第一性原理是永远不会变的。归根结底,Mead 和 Conway(VLSI 设计先驱)的方法论依然像过去一样坚如磐石。确实,过去那种追求恒定电流密度、恒定功率密度的缩放过程,以及与现代半导体设计相关的所有设计优化,我们基本上已经挖掘到头了。现在已经没有什么东西是完全等比例缩放(ISO)的了。但了解我们从何而来依然大有裨益。我依然鼓励大家去领悟第一性原理。

我在斯坦福求学时,就已经在 AMD 工作并设计微处理器了。能够同时看到工业界的实际设计方法,与学术界关于如何设计这些东西的第一性原理,这种感觉非常棒。我非常享受这种双管齐下的状态,这让我学到了更多。这意味着,当你在使用紧跟时代、结合现实语境的 AI 时,如果你同时也在学习第一性原理的知识,你就会获得和我当年一样美妙的体验。

透明系统的美妙之处在于,每个人都可以去审查它、拷问它

主持人:下一个问题是:你对开源有什么看法?开源如何保持在技术的前沿?

黄仁勋:这其实涉及两个层面:一是闭源专有软件与开源软件的对比,二是我做开源的真实意图。我先谈谈我的意图。

首先,英伟达消耗的 Anthropic 和 OpenAI 的 Token 数量可能比任何人都多。原因很简单,我们要做大量的代码编写和芯片设计,现在我们 100% 的工程师都在智能体的辅助下工作。我希望他们使用最新一代的工具与智能体协作,从而彻底重塑英伟达的工作方式。

所以第一点,如果你能用 OpenAI 和 Anthropic 的 AI,我强烈建议你去用,因为它们真的非常有用。它们运行得极好,而且还在不断进化。如你所知,大语言模型是内在的核心技术,但云服务是一个完整的产品,云代码是围绕它构建的一整套生态系统。这个生态在不断完善,模型也在不断变强。你不太可能去 GitHub 上随便下载一个开源模型,就能达到同样惊艳的效果。所以我强烈推荐大家使用现成的、前沿的商业 AI 模型,我们自己也是这么做的。

那么问题来了:既然如此,我们为什么还要如此努力地推进开源模型?原因在于,语言模型至关重要,它们代表了人类智能的代码化。我们非常渴望实现自我自动化,这是极为重要的一环。但你需要明白,AI 的本质是学习信息的表征(representation)、意义和结构。那么信息存在于哪里呢?就在我们此刻对话的周遭世界中。

之所以存在结构,是因为你每天醒来看到的世界大体上是相同的,否则一切就成了毫无意义的白噪音。生物系统和物理系统之所以有结构,是因为只有基于结构,我才能学习到更高维度的表征。如果我能学到这种表征,我就能驾驭它。这说得通吧?正因为我能学习语言的表征,所以我能生成语言,驾驭语言,并将它投入使用。

我想把同样的逻辑应用到化学、蛋白质、基因、物理学、物理系统,比如机器人领域。请注意,你表征所有这些事物的方式是截然不同的,因为它们的结构不同,维度也不同。你训练它们的方式也会有天壤之别,对吧?因为你不可能凭空变出一个包含海量化学或物理数据的“人类语言互联网语料库”。所以,你必须为这些领域发明全新的策略。

我们决定在一些基础支柱领域倾注心血。因为英伟达具备这样的人才和规模,我们有能力在多个不同领域,向世界交付第一批极具价值的“艺术品”——数据、模型以及训练方法。其中一些领域我非常看重:第一个当然是 Nemotron 语言模型,我稍后会解释为什么我们要亲自下场做语言模型;第二个是 BioNeMo,专攻生物学;第三个是刚才有人提到的 Alpamayo,专攻自动驾驶和 AI 导航;第四个是 GR00T,专攻人形机器人关节控制和通用机器人 AI;最后是气候科学,也就是介观多物理场模拟。

我们决定在所有这些不同的领域充当拓荒者。原因在于,如果没我们带头,这些领域的科学家根本不具备构建基础模型所需的算力规模和底层技术。所以我们决定挺身而出。正是因为我们的努力,我们激活了医疗保健行业,激活了生命科学领域。现在,世界上每一家自动驾驶汽车公司都在与我们合作,无论哪家公司,其底层都有英伟达的影子。我们让整个生态系统真正繁荣了起来,现在我们正在推进机器人领域,等等。如果我们不迈出第一步去构建基础模型,下游的整个产业就很难被激活。所以,这本质上是为了拓展 AI 的边界,实现这种能力的民主化。

至于我们为什么要做语言模型,原因有两个。第一,世界上有太多的社会和群体,他们语言的受众规模不够大,不足以让其他商业公司将其作为首要任务。那些大公司可能会让模型懂一点瑞典语,但不太可能把瑞典语放在最高优先级,因为这个国家虽然不小,但也没那么大。中文当然被照顾得很好,印度的某些方言也被照顾得很好。但你知道,世界上还有 230 多种其他语言。对于这海量的其他语言,除非你发自内心地在乎,否则它们永远得不到顶级的支持。人类的智慧,无论其人口规模大小,都应该被珍视。所以,我们打造了一个接近前沿水平的大语言模型——Nemotron,并且我们把一切都开源了。这样一来,如果有人想把它微调成自己选择的任何语言,都易如反掌。

第二个原因非常关键:我们希望将这些语言模型与特定领域的模型融合,因为这里面包含着人类的先验知识(human priors)。例如,Alpamayo 就是一个将语言模型与世界模型融合的产物。一方面,它是专门为检测汽车、道路等元素而设计的;但另一方面,我们坚信,如果 AI 模型(也就是 Alpamayo 这个自动驾驶模型)能够像人类一样进行推理,能够利用人类的先验知识去思考,那么它成长为一个极其优秀且安全的驾驶系统所需的“经验值”就会大幅降低。它需要的训练数据量会显著减少。我们已经证明了这一点:Alpamayo 可能是世界上最高效的自动驾驶系统之一,它仅仅积累了几百万英里的经验,而不是几十亿英里。这就足以说明这套系统是真的管用。

总之,我给了一个长篇大论的回答,把问题彻底拆解了。你没法指望我只用一两句话打发你。但开源模型真的非常重要。还有最后一点:如果你希望 AI 是安全可靠的,它就必须是开源的。原因很简单:你无法防御一个黑盒,也无法为一个黑盒提供安全保障。你更不能把一个能力极强但完全不透明的黑盒,塞进你的关键系统里。当然,有很多方法可以缓解这种不透明性。比如,你可以要求它在执行任何操作之前,必须向你一步步地解释它的推理过程;在采取行动之前,必须先拿出一个计划。但问题是,它随时可能撒谎。

透明系统的美妙之处在于,每个人都可以去审查它、拷问它。如果你有一个透明的开源系统,研究人员就可以自由地使用它。如果你有一个透明的系统,未来防御超级智能体网络攻击的方式,显然不是去陷入一场“看谁的模型版本更高”的军备竞赛——你搞出一个 7.0 版本的攻击模型,我如果拿不出 8.0 就只能被动挨打,然后你又搞出 9.0,双方互相折磨到发疯。这显然不是最聪明的做法。

最聪明的防御策略是:面对这些可怕的赛博攻击,我们将部署数以百万计、十亿计、极其廉价的微型 AI 组成蜂群,系统性地将威胁包围起来。就像构建一个巨大的防御穹顶。例如,Nemotron Nano 就被广泛应用于网络安全领域。所有的网络安全公司都在使用 Nemotron Nano,因为它速度极快且成本极低,你可以训练它来检测网络攻击,然后直接部署数万亿个这样的微型卫士。

算力利用率(MFU)高还是低?我希望它永远处于低位

主持人:顺着开源扩展这个话题,一月份我们见面时,讨论了“开源扩展”(open scaling)这个话题。我们谈到了瓶颈:数据是一个瓶颈,算力是另一个瓶颈。我们在 GTC 大会上共同宣布了一个实验项目,也就是“联邦扩展”(coalition scaling)的构想。

所以,接下来的问题是如何提高算力的利用率,因为算力正变得越来越稀缺。

上周有消息称,xAI 的一份内部备忘录显示,他们的孟菲斯集群池的 MFU(模型算力利用率)只有 11%,这意味着大约有 110 亿的算力资源处于闲置状态。

或许你可以谈谈为什么我们要尝试联邦扩展这个实验,以及在没有那种能够打通上下游进行极致优化的垂直整合公司的情况下,我们该如何提高开源生态系统的算力利用率?

黄仁勋:你们知道 MFU 是什么吗?其实,单看 MFU 这个指标是完全错误的。它仅仅代表了你在执行任务时消耗的浮点运算(flops)的百分比。不幸的是,对于任何指标而言,如果你衡量错了对象,你就会得出错误的结论。

如果你问我,我个人是希望 MFU 高还是低?我希望它永远处于低位。因为我想让系统足够聪明,实现“超额配置”(overprovisioned),这样它才能运转自如。正因为我做了超额配置,所以我才会有那么多看似闲置的算力。

原因在于,在这些大规模数据中心里,计算的运作方式是这样的:你拥有算力(flops)、内存带宽、内存容量和网络带宽。在任何给定的时间点,总有一个环节会成为瓶颈。你真正应该做的是,在所有环节上都进行超额配置,这样才能避开阿姆达尔定律(Amdahl's law)的诅咒,否则你将永远在与阿姆达尔定律搏斗。但是,如果你是按照峰值需求而不是基础负载来配置资源,那么当负载处于低谷时,那些超额配置的算力自然会闲置。然而,在关键时刻,系统会瞬间飙升到 100% 的 MFU,尽管这只是一小段时间。可如果在这一小段时间里,你没有那些超额配置的算力储备来支撑,那么这“一小段时间”的卡顿,就会变成极其漫长的煎熬。

主持人:那么对于那些试图训练模型的团队来说,你看到了什么情况?算力现在很便宜吗?

黄仁勋:不,算力本身是很便宜的。

主持人:但 H100 的价格在上涨啊。

黄仁勋:那不是因为它的浮点运算能力,而是因为 H100 Hopper 架构的内存带宽、它的整体架构设计,以及它所包含的一切综合能力,而不仅仅是它的 flops。

主持人:所以我们不应该把算力看作是一种稀缺资源吗?

黄仁勋:不,问题的关键不在这里。打个比方,以前我们不懂车的时候,总是问:“你这车有多少马力?” 但现在,谁还会只看马力买车呢?

主持人:那么你认为我们应该用什么正确的指标来衡量呢?性能吗?当你告诉团队:“伙计们,这就是我们明年必须达到的性能目标”时,你发现你越来越看重哪种评估标准(eval)?

黄仁勋:你必须制定一个真正严肃、切中要害的评估标准,否则大家只会去刷 flops 数据。如果你找了一个容易刷的指标,大家把那个数字刷得再高,也不会让系统变得更聪明,也不会让你取得真正的成功。拥有庞大的算力本身并没有错,但它是必要不充分条件。仅此而已。

主持人:从某种意义上说,你可以把输出的 Token 视为智能的体现。所以,衡量标准是否应该类似于“每瓦特输出的智能单位”?

黄仁勋:是的。请注意,“每瓦特输出的 Token 数”远比单纯的 flops 要重要得多。事实上,我们现在非常清楚这一点,因为在解码这些大语言模型时,决定“每瓦特 Token 数”的最关键因素,实际上是贯穿 NVLink72 架构的总带宽。此时的 MFU 极其低下,因为预填充(prefill)的工作量并不大,主要是解码(decode),但你可以将解码和预填充解耦。它是分离的。所以你看,我在 MFU 极低的情况下,依然交付了极其惊人的“每瓦特 Token 数”。

主持人:但并非所有的 Token 都是生而平等的,对吧?我们该如何考量这一点?在设计未来的系统时,当没有一个统一的智能衡量标准,而生成代码的 Token 显然比生成其他内容的 Token 更具“每瓦特价值”时,什么才是正确的衡量方式?这个问题说明白了吗?

黄仁勋:完全明白。你总是需要回归到本质:你不能仅仅为了“考试拿高分”(SAT scores)去优化系统,你是在为一个更宏大的目标进行优化。道理是一样的。你必须明确什么是成功,你评估成功的方式,将极大程度地决定人们的努力方向。英伟达在内部做得极其出色的一点,就是我们建立了一套评估架构的系统,而仅仅看 flops 实在是太狭隘、太敷衍了。

主持人:你的工作极其艰巨,那就是试图设计一个涵盖不同智能类型的“指数”。因为当我们的团队在使用英伟达的架构进行研究时,我们有一个实验室在搞代码生成,另一个实验室在探索超导材料的边界,等等。他们每个人都在追求完全不同的评估指标。但他们用的都是英伟达的芯片。当你的客户各自拥有截然不同的评估标准时,你如何解决这个众口难调的问题?

黄仁勋:这正是设计底层平台架构之所以如此艰难的原因。它就是这么难。问题在于:如果你打造的东西过度拟合(overfit)某一个特定领域,你确实可以在那个领域所向披靡。你为了这个特定问题量身定制,表现极其惊艳,但问题是,那个市场、那个问题空间可能根本不够大,不足以支撑起足够庞大的研发资金。所以,你希望系统能胜任多重任务,具备跨领域的能力。但另一方面,如果你什么都能做,你可能什么都做不精。你就太平庸、太通用了。

所以,在这两者之间把握平衡,是一门真正的艺术。这就是我赖以为生的手艺。我们不应该做什么?我们应该在哪些领域加倍投入?哪些领域值得我们倾注十倍的资源?这需要极具前瞻性的视野、战略眼光,需要一定程度的试错,甚至需要一些个人的直觉享受和娱乐精神,不断迭代,所有这一切交织在一起。

主持人:我们可以聊聊 Feynman 架构的蓝图吗?我对这款芯片非常期待,但目前很难获取到相关信息。基于目前的蓝图,你觉得这件“艺术品”最终会呈现出怎样的形态?

黄仁勋:我可以跟你们分享一下我们一路走来的心路历程。看看 Hopper 架构,Hopper 是为一个当时还相当新的问题空间设计的,那个领域叫做“预训练”(pre-training)。随着预训练的兴起,我们得出了一个结论:尽管前一代架构已经相当强大,但我们应该建造更大、极其庞大的系统。比世界上任何最大的科学超级计算机还要大。

这可不是件小事。当时世界上最大的超级计算机造价大约是 3.5 亿美元,而我们却在想:“你知道吗?预训练将成为一个极其广阔的领域和一个至关重要的问题。我们应该设计出造价高达数十亿美元的系统。” 在当时提出这个想法,听起来简直像疯了。你当时绝对一个客户都找不到。原因很简单,历史上卖出过最贵的东西才 3.5 亿美元,而你却要造一个价值几十亿美元的庞然大物。这完全是在为一个规模为零的市场做开发。

但基于第一性原理的推导,我们还是义无反顾地去做了。于是,专为预训练设计的 Hopper 诞生了,事实证明,这是一个极其伟大的决策。

我们做的第二件事是,我们意识到:“好吧,预训练之后呢?我们当然会继续提升训练性能,但 AI 的最终目标不是训练,而是推理(inference)。那么,推理真正需要什么样的系统?”

于是,我们创造了 NVLink72。原因在于,在处理神经网络时,首先是预填充(涉及上下文处理和注意力机制),然后是解码。生成海量的 Token 需要极高的内存带宽。你所需的内存带宽,远远超出了单块芯片所能提供的极限。所以我们想:“为什么我们不把 72 块芯片组合在一起呢?”

为此,我们不得不发明各种全新的交换和互连系统,创造了全新的 SerDes(串行器/解串器),本质上,我们打造了世界上第一台机架级计算机。它就是 Grace Blackwell NVLink72。与上一代相比,它的速度提升了 50 倍。仅仅两年时间,我们将性能提升了 50 倍。如果是摩尔定律,两年只能提升 2 倍。所以,这项架构和洞察简直堪称完美,而解码、推理、大语言模型和 Token 生成的爆发,恰好与 Grace Blackwell 的问世完美契合,一飞冲天。所以,Grace Blackwell 是又一个不可思议的划时代产品。

现在问题来了,Vera Rubin 架构又是怎么回事?它背后的核心理念是什么?核心理念是,AI 的目标不仅仅是“思考”,更是“执行任务”。所以 Vera Rubin 是为智能体(Agents)量身定制的。

那么,智能体的计算模式和处理模式是怎样的?显然,智能体需要加载大量的内存。它有工作记忆(短期记忆),而长期记忆我们存放在存储设备中。这个存储设备必须能够与 GPU 直接通信。你不能通过网络把数据拷来拷去,你希望存储设备直接接入处理器。所以我们设计了直接连接到架构总线上的存储。同时,我们要使用大量的工具,所以 CPU 变得至关重要。

但是,当前这一代 CPU 主要是为云计算设计的,动辄拥有数百个核心,比如 200 个核。然而,在智能体的应用场景中,由于 AI 是一个价值数十亿美元的庞大系统,当它发出指令去调用某个工具时,那个工具是在 CPU 上运行的。此时,这台价值连城的 GPU 超级计算机,就得干等着这颗 CPU。因此,对于智能体来说,CPU 极其需要超低的延迟。所以我们设计了 Vera,对于当前单线程、多核单线程的代码来说,它是目前性能最强悍的,我们专门为此打造了这款 CPU。

你会发现,用直觉解决这些问题的方法,就是去思考未来的计算模式究竟是怎样的。它与过去有何不同?你必须在脑海中建立一个心智模型,然后设计出一个能够完美运行这种模式的系统。现在,智能体时代已经到来。我们将让它们在 Vera Rubin 上奔跑。

至于 Feynman 架构,当它问世时,我希望它能应对这样的场景:就像所有的软件一样,今天我们称之为智能体,过去可能叫模块或子模块。未来,你肯定会看到由智能体组成的庞大系统,智能体手下还有子智能体,子智能体下面还有更小的智能体。你会面对一个“智能体集群”(swarm of agents),那么这种形态会催生出什么样的计算机呢?这很可能就是 Feynman 架构所要解决的命题。

主持人:关于这一点我还有一个追问。你一直以来非常擅长的一点,就是能提前一代预判瓶颈,并预先给出解决方案。比如一年前的供应链问题,光子学最终成了一个巨大的解法。当我们把目光投向能源瓶颈时——老实说,铜线本身就已经成了传输的瓶颈之一。在你看来,这个问题将如何解决?毕竟能源危机无处不在。

黄仁勋:首先,我们得做自己力所能及的事。就像生活中的一切一样,无论面临什么问题,无论外部环境有多少担忧,你都应该优先解决那些在你掌控之中的事。而在我们掌控之中的,就是提升能源效率。如果你看“每瓦特 Token 数”,我们已经将其提升了 50 倍,接下来我们还得继续以显著的倍数提升它,这种提升是会产生复利效应的。这是我们能做的第一件事。我们可以通过协同设计、架构创新等手段来掌控这一点。

我们能做的第二件事,也是我们可以去启发他人的事,就是通过大量的市场教育,激励整个生态系统为此做好准备。在过去的五年里,我一直在努力帮助人们理解未来可能需要的算力规模。刚才我也向大家推演了我是如何评估未来能源需求的。未来计算所需的能源总量,很可能是我们现有总量的 1000 倍,这是一个极其庞大的数字。

然而,换个角度想:未来的计算机将具备两个特征。第一,它是生成式的,因为它具备智能,能感知上下文环境;第二,它是持续运行的。这种“持续运行的生成式计算”,与过去那种“只有在被使用时才启动的、基于检索的预录制计算”相比,所需的能源该如何估算?

所以,如果你说我们需要 1000 倍的能源,哪怕最后发现我们低估了几个数量级,我也不会感到惊讶。我们需要海量的算力,我们需要海量的能源,所以你必须去向人们解释这一切。你必须用一种符合常识、肉眼可见的方式去解释。其实一路上有很多迹象表明,这一切正在发生。就像我刚才为你们拆解逻辑一样,我是在进行推理,好让你们觉得这顺理成章。

所以,能源需求确实极高。最后是能源的来源问题。能源的来源多种多样。不幸的是,由于过去人们对可持续能源成本的过度担忧,导致我们在这一领域的投资严重不足。但现在,正是人类历史上投资可持续能源的最佳时机。原因在于,市场驱动力已经变得空前强大。在过去,你需要政府补贴才能去建太阳能农场,需要政府补贴才能去建核电站。但现在,市场会心甘情愿地为你买单。当下的市场力量极其汹涌。这是我们升级陈旧电网、全面引入各类可持续能源的绝佳契机。

不要仅仅追求快乐,也要去主动拥抱痛苦和煎熬

主持人:在教育方面,这也是一个绝佳的时机。我了解到的一点是,我们最初是为斯坦福的学生设计这门课的,但结果发现,有大量其他人在观看,尤其是许多投资者和资本方。所以,如果你有什么想对这个群体传达的,请畅所欲言。毕竟,对着资本方把同样的话说上无数遍,有时候确实挺乏味的。

黄仁勋:我倒不介意这个。

主持人:所以,如果你想传达什么,请随意。我们来看下一个问题是什么?这个问题是:在接下来的几年里,大家应该如何最有效地分配自己的脑力?

黄仁勋:首先,我想回应一下关于“痛苦与煎熬”的那番话。有一种建议是,你应该选择你热爱的、让你充满激情的事物作为你的事业。我认为这听起来很棒。如果你碰巧知道自己的激情所在,知道自己热爱什么,那当然好。但我认为,有很多人其实并不知道自己的激情在哪里,也不知道自己热爱什么。这很正常,因为没人能全知全能。你怎么可能知道你尚未认知的事物呢?所以,从很多层面来说,那种认为“你只能选择让你充满激情、让你快乐的职业”的观点,门槛实在太高了。

原因在于,无论你决定以什么为生,无论你是否找到了所谓的激情,这就是你的工作。就拿我来说,我以前的工作是洗厕所和清理餐桌。那就是我的工作,而在我的工作里,我会拼尽全力做到最好。无论你交给我什么任务,我都会倾尽所能。直到今天,我依然如此。

外界有一种误解,认为当 CEO 的人一定热爱自己的工作。有些 CEO 可能会说:“哦,我充满激情,我热爱我的工作。” 他们是在撒谎。没有哪个 CEO 敢说,自己从早晨睁眼到晚上睡觉,每一分钟都乐在其中。

事实是,我真正热爱的工作内容只占 10%,剩下的 90% 都非常艰难,但我依然会拼尽全力去完成,甚至是“熬”过去的。我真的是在煎熬中度过的。我当然更愿意去做那 10% 让我开心的事。但那 10% 的事情,总量就只有那么多。每家公司都面临着堆积如山、各种各样的难题。在人生的旅途中,你也会遇到无数不同类型的麻烦,你必须学会磨砺自己,无论多么艰难,都要渴望达到一个更好的状态。为了变得更好,不惧艰难。你把这叫什么?这就叫煎熬。你虽然不喜欢,但你依然倾尽全力去面对。

我认为,当你经历煎熬,当你从挣扎中获益,并且你经受了无数次这样的考验后,它会赋予你韧性(resilience)。当那一刻到来,当世界、你的家人、你的公司或你的同事需要你变得坚强,需要你展现韧性,需要你咬紧牙关挺过去的时候,如果你没有经历过无数次的锤炼,你是不会具备这种品格和肌肉记忆的。所以我建议,不要仅仅去追求快乐,也要去主动拥抱一些痛苦和煎熬,因为总有一天你会需要这种力量。

把英伟达的 GPU 和原子弹相提并论,毫无逻辑可言

主持人:我们看下一个问题。这些都是最重要的问题。同意。是的,这个问题是关于你对其他竞争对手国家获取英伟达芯片的看法。

黄仁勋:首先,你知道我们是靠什么谋生的吗?我们制造 GPU。GPU 被用来玩电子游戏,被用来调度酱油配送,被用于医疗成像。如果你昨天刚做了 CT 扫描,放心,那背后就有英伟达的技术。世界上每一台医疗成像系统里都有英伟达。所以问题是,你到底制造的是什么?

我从根本上反对、并且认为毫无逻辑可言的一点,就是在这个时代,把英伟达的 GPU 和原子弹相提并论。全球有十亿人在使用英伟达的 GPU。我向你们所有人推荐英伟达 GPU,我向我的家人、孩子、我爱的人推荐英伟达 GPU。但我绝不会向任何人推销原子弹。所以,这种类比极其愚蠢。如果你从这个荒谬的预设出发,你就无法理清后续的逻辑。

第二个我认为极其荒谬的观点是:为什么美国公司要去其他国家竞争?“反正你迟早会输掉那个市场,那为什么还要去?” 如果你们都信奉这种哲学,那你每天早上干嘛还要起床?我不信奉“反正迟早会输”这一套。我绝不认同。如果你想让我输,你得在战场上真刀真枪地打败我。这些年来,我打过无数场硬仗,我活得挺好。

如你所知,竞争服务于市场,竞争能让你的公司变得更强大。我一点也不害怕去市场上真刀真枪地竞争。但那种“反正会输,索性不去竞争”的想法,对我来说毫无逻辑。

最后,那种认为我们应该剥夺某些国家使用通用计算能力的观点,同样站不住脚。我们现在都承认英伟达是一家通用计算公司,我刚才列举了一大堆通用场景。为了让一两家公司受益,而去剥夺其他人使用通用计算的权利,这根本说不通。凭什么要让整个行业做出牺牲,只为了让那一两家公司获利?

美国科技产业是我们国家的瑰宝之一。你们未来都将成为其中的一员。如果我尽到了我的职责,当你们毕业时,你们将步入人类历史上最强大、最鼎盛的计算机产业。但是,如果我们因为某些原因主动放弃,或者通过政策决定我们不能去销售,从而将三分之二的市场拱手让给其他公司,那么等你们毕业时,你们进入的将只是一个徒有其表的空壳产业。这种产业空心化的教训我们已经见识过了。很久以前,同样的论调扼杀了美国的电信产业。今天,美国已经没有任何底层的电信技术了。它完全是被政策“赶出”我们国家的。

所以,必须有人站出来为此抗争。有些逻辑体系声称 AI 将会降临,将会迎来一个“奇点”时刻。当那个奇点降临,它将成为世界上最强大的力量。它会像闪电一样突然出现,我们不知道它会在周三还是周四的晚上 7 点到来,但只要它一出现,游戏就结束了。他们甚至说,这有一定概率会导致我们所知的社会彻底终结。拜托,我们都看过《沙丘》,没必要在现实中重演一遍。

我认为,在公众面前兜售他们的科幻幻想,当所有人都在关注并相信他们的话时,这是一种极不负责任的行为。这不是事实。所谓“我们完全不知道这些系统是如何运作的”,这不是事实。所谓“这项技术会在某一个纳秒内突然变得无限强大并接管世界”,这也不是事实。所谓“我们毫无防御之力”,这同样不是事实。这些全都是捏造出来的,而且不幸的是,这种捏造甚至伤害了在座的各位。你们是学计算机科学的,你们希望毕业时,人们依然看重计算机。我们希望创造一个对你们正在努力掌握的技术充满乐观的未来。我们希望创造那样的未来。我们希望确保美国、确保所有人都能从 AI 中受益。所有人都应该拥有 AI。但没有任何人应该拥有核弹。大家能同意这一点吗?

所以,小伙子,谢谢你激起了我的表达欲。开个玩笑。我只是想把这些心里话说出来。

主持人:我的基调是理性乐观派,坚信乐观主义。不过,我要从另一个角度稍微反驳一下。我完全同意,用原子弹来做类比从第一性原理上就是错的。但我们观察到的现状是,算力紧缺。我们美国的独立团队、初创公司、大学,他们根本拿不到算力。那么,从优先级的角度来看,在我们把这种稀缺资源运往海外之前,美国难道不应该享有优先获取权吗?

黄仁勋:绝对应该。但现实并非如此。绝对不是你说的这样。

主持人:抓到把柄了吧。

黄仁勋:是啊。绝对应该,但也绝对不是你说的这样。问题出在哪里?芯片多得是。伙计们,如果斯坦福的校长现在下订单,我保证立刻发货。我绝对说到做到。

主持人:大家听到了吧。好吧,这可不是开玩笑的。我们在外面为了算力都快熬干了。不,不,这真不是开玩笑。这是一个非常严肃的问题。

黄仁勋:事实并非如此。所谓“人们给我下订单,而我不给他们发货”,这绝不是事实。前提是你得下单啊!事实是,根本问题完全出在另一个地方。

斯坦福需要算力,科学研究需要算力。但根本问题在于,现有的体制已经无法提供大规模的算力了。你想想看,斯坦福所有的研究部门,都分散在不同的院系里。你们各自去筹集资金,各自申请拨款。没人愿意把自己的科研经费拿出来共享。但没有任何一笔单独的经费,足以支撑起一个庞大的计算集群——那种你平时可能只用一小部分时间,但一旦需要,就必须爆发出惊人算力的超级计算机。整个世界已经从那种集中式的计算环境,退化成了每个人都在用笔记本电脑单打独斗的局面。这就是今天的计算环境。从根本上说,所有的大学,斯坦福也不例外,你们根本没有几十亿美元的算力预算。这笔钱根本不存在。但这是谁的错?是斯坦福自己的错。

我之所以这么说,是因为我是在赋予你们解决问题的力量。当某件事是你的错时,你就有能力去改变它。你同意吗?如果我说:“哦,这不是你的错,孩子。你是个失败者,但这不怪你。” 或者我指着你说:“嘿,孩子,你是个白痴,但这不怪你。” 不,这绝对是你的错。而当你承认这是你的错时,你也就赋予了自己解决它的力量。不是吗?你正在赋予自己解决问题的底气。所以,你现在是在和一个坚信“我能掌控自己未来”的人对话。明白吗?

如果我是斯坦福的决策者,你们必须找到一种方法,改变你们做预算的方式,改变你们对待计算资源的方式。你们必须想办法把资源整合起来,为斯坦福建造一台校园级的超级计算机,就像斯坦福过去建造直线加速器那样,让所有人都能共享。当然,你们也可以直接把这事外包给别人来做。这些都是可行的。但前提是,你必须拿得出 10 亿美元。你需要有一笔合理的资金去建造这样的基础设施,因为这就是它的造价。这就是成事的代价。

主持人:我刚才查了一下,我们这里可是有 400 亿美元的捐赠基金。如果是你接手,你会怎么使用这笔钱?

黄仁勋:我会立刻从中划出 10 亿美元,交给某个云服务商,让这里的每一位学生和研究人员都能用上 AI 超级计算机。我会立刻这么做。当然,你得做好规划。如果你想买 10 亿美元的西红柿,你不能跑到杂货店,发现他们没有 10 亿美元的西红柿,然后大喊:“啊哈!你故意不卖西红柿给我!” 这太荒谬了。所以你必须提前规划。你必须说:“明年我们需要价值 10 亿美元的算力来支持斯坦福的科研,我们要把它建起来。”

技术固然重要,但战略更是生死攸关

主持人:下一个问题:你工作中最棒和最糟糕的部分是什么?

黄仁勋:当你是一家公司的 CEO 时,你能享受到很多极其美妙的特权。比如,你真正成为了那个将愿景、战略和执行力交汇融合的人。你需要生活在那个交汇点上。当你拥有一家实力雄厚的公司,并且我身边围绕着极其出色的计算机科学家——其中很多就来自斯坦福——当你身处这样的团队中时,你的愿景是非常容易落地的。正因为你身边都是牛人,你的愿景也会变得更加宏大、更有野心。这就是最棒的部分。

这个最棒的部分,我几乎每天都在享受。我一直在不断更新对未来的认知和愿景,思考我们在其中的角色,以及我们应该如何重塑自我,以便为那个未来做出更多贡献,或者干脆由我们去创造那个未来。作为 CEO,你有幸生活在这样一个充满想象力、极具战略性、高度复杂且没有标准答案的世界里。从很多方面来说,这是创造力的极致体现。

另一方面,伴随这种权力而来的,是对那些与你同乘一艘飞船、同舟共济的人的沉重责任。他们加入你的团队,想要帮你实现这个愿景,他们是你团队的一部分,你对他们的福祉负有深深的责任感。所以,当公司境况不佳时——比如在早年间,我们还在摸索前行的时候,公司可能经历了四五次濒临破产的绝境。我是说真的,差点就灰飞烟灭了,我们只能靠着最后一口气吊着,或者彻底被打趴下。在那些至暗时刻,你会感到尴尬、屈辱、艰难。你不知道出路在哪里。你常常身处黑暗之中,你感到恐惧。作为人类,我们所有的负面情绪,在那个位置上都会被放大一千倍、一百万倍。

作为上市公司的 CEO,你始终暴露在聚光灯下。公司顺风顺水时,皆大欢喜;一旦遇到挫折,铺天盖地的指责就会接踵而至。所以,这是一份极度缺乏安全感、极度脆弱的职业。

主持人:下一个问题是,在英伟达的早期阶段,你犯过的最大错误是什么?你从中学到了什么?

黄仁勋:让我给你举一个别人可能会认为是错误的例子,但我会告诉你那其实不是。任何了解我们历史的人都知道,我们第一代产品的架构和所使用的技术,完全走错了方向。不是错了一点点,是错得离谱。一群聪明的工程师和专业人士,拿着融来的钱,造出了一个东西,然后说:“来看看这个”,结果根本跑不起来。我们用曲面代替三角形,放弃了 Z-buffer(深度缓冲),用正向纹理映射取代了逆向纹理映射。我们把每一件事都做错了。全错了。里面连浮点运算都没有。错得彻头彻尾。

所以,我们在技术上做出了大量极其糟糕的选择。我承认那是纯粹的技术失误,但它却逼出了极其天才的战略举措。你如何带领一家名声扫地、浪费了大量资金和两年半时间走弯路、被竞争对手四面楚歌的公司,最终成为今天唯一的幸存者?

那次转型教会了我很多。技术固然重要,但战略更是生死攸关。你如何看待世界?如何应对竞争?如何切入市场?如何保存和调配资源?在 30 多岁时,正是通过那次惨痛的失败,通过公司几乎灰飞烟灭的绝境,我学到了极其深刻的战略思维、竞争策略和辗转腾挪的技巧,这些经验让我受用至今。

如果说我犯过什么真正意义上、纯粹的战略错误,那就是当 PC 或移动设备开始腾飞时,一些在移动领域举足轻重的巨头找到我们,希望我们在移动设备上合作。当时我做出的选择……现在回想起来,当他们找上门时,我本该回答:“不了,没兴趣。” 但我们却决定转移大量资源去研发移动设备芯片。我以为我们能提供巨大的价值。但如果我当时能再往深处多想两层,就会发现,就我们擅长的领域而言,我们在那个市场能提供的真正价值,充其量只是边缘化的。

所以我调转船头,带领公司杀入移动设备市场。我们把它做成了一项价值 10 亿美元的业务,这给了我们一种正向反馈的错觉。但紧接着,在 3G 向 4G 过渡的时期,我们被彻底封杀了。高通是 3G 到 4G 调制解调器(基带芯片)的绝对霸主,而那才是手机中最核心的部件。不是 SoC(系统级芯片),不是计算机图形处理,甚至不是应用处理器。调制解调器才是手机的命脉。所以在那次技术迭代中,他们轻而易举地把我们踢出了局。我本该预见到这一点的。如果重来一次,我会说:“是的,这在头几年可能是一个非常诱人的机会,但之后我们就会被扫地出门,那还有什么意义?不如把资源留给其他领域。”

不过,我们还是挺过来了。被踢出局后,那个 10 亿美元的业务瞬间归零。但我的补救措施是,我把我们在移动端积累的所有技术——那些关于极低功耗和极致能效的专业知识——全部转移到了一个当时还不存在的应用领域:机器人。刚才有人提到了 Thor 芯片。Thor 其实是我们当年在移动设备上使用的那款芯片的曾曾曾孙。那一整条技术血脉、所有的团队,以及我们积累的专业知识,对我们走到今天起到了至关重要的作用。但这不是为错误开脱。最初进入那个市场本身就是浪费时间,所以我认为那是一个巨大的战略失误。

主持人:谈到战略,有时候战略就是要有足够精准的预判。从系统设计的角度来看,你认为你更新了哪些先验认知?或者说,你建立了一套怎样的预测机制,让你能在这种充满战争迷雾、未来走向并不完全清晰的情况下,依然保持自信,觉得“虽然看不清全貌,但大方向是没错的”?对于那些在未来形态还不明朗时,依然需要做系统设计的从业者,你有什么建议吗?

黄仁勋:是的,其实你刚才已经用到了所有正确的词汇。我做的第一件事就是问自己:我观察到了什么?基于我观察到的现象,让我们将其拆解回第一性原理。把它彻底拆解,然后问自己:接下来会发生什么?首先要问,这是一件大事吗?比如深度学习、计算机视觉、AlexNet,这是大事吗?它之所以是大事,是因为老天啊,这里有两个工程师(Alex 和 Ilya),当然还有 Hinton,他们搞出了一个神经网络模型,然后“轰”的一声,一举粉碎了在此之前几十年来所有计算机科学家在计算机视觉领域取得的成果。所以,这是一件大事吗?这种质量和性能的跃升,绝对是件惊天动地的大事。

接下来的问题是:那么接下来会发生什么?你能把它推向多远?如果能用这种方式解决视觉问题,那还能解决什么问题?如果它能解决这些极其惊艳的难题,这对计算机和计算本身意味着什么?你就是这样不断地问自己这些问题,一路推导回第一性原理。然后基于此,你在脑海中构建出一个关于计算未来的心智模型:它将走向何方?它能做什么?比如,自动驾驶汽车和机器人。模型会变得多大?如果模型变得极其庞大,计算机又该长什么样?处理神经网络与处理浮点数、整数以及基于第一性原理的数学运算有何不同?过去我们习惯用 FP64、FP32 来表达一切,但显然,神经网络根本不需要这样做。

所以,你就像这样一步步推导,构建出一个关于未来的心智模型,并明确你的公司、你自己在其中的位置,然后从那个未来倒推回来。当然,问题是你可能会错。通常情况下,如果你能正确地进行逻辑推演,你不会错得太离谱,但也不可能全对。所以我倾向于非常坦然地说:好吧,这些是极有可能发生的事,这些是绝对会发生的事,而这些是可能会发生的事。基于这些判断,我认为我们必须朝着那个大方向前进。我们会在前行的过程中摸着石头过河。

而在建立公司、并在这一过程中取得成功的核心技巧在于:你朝着这个方向前进,是需要消耗能量、时间与金钱的。而你消耗在上面的每一分时间、能量和金钱,都意味着你放弃了做其他事情的机会。所以,执行一项战略的机会成本,才是真正高昂的代价。你必须问自己:你该如何变得足够聪明,使得这种机会成本降到最低,同时让你的可选项(optionality)最大化?你需要时刻思考所有这些问题。这没有简单的答案,但在很多方面,你其实是在努力让这段旅程本身就能“自给自足”。

主持人:大家马上就要冲上来找你要签名了。我们的对话就到这里结束。谢谢。非常感谢。

推荐阅读:

苏姿丰谈AMD扎根中国30年、对话李开复:AI转型只能由CEO亲自挂帅,别只听CIO的

三周、1.81倍、百亿:中国AI的压制性时刻

Google搜索迎25年来最大改版,Gemini Omni和3.5 Flash两大模型重磅发布!

免费领取 100 小时 AI 算力|限时开放

加入 AI 开发者计划
获取:

✅ AI 算力资源
✅ 官方技术社群
✅ Workshop 与 AI Academy
✅ 开发者专属福利
☕ 9.9 元瑞幸咖啡券(前 50 名)

咖啡券领取地址:https://s.csdn.cn/4nPsOp

http://www.jsqmd.com/news/863471/

相关文章:

  • Sub2API + CCSwitch 实现 Codex 反向代理:多账号流量分发实战(解决codex手机号验证)可以润色吗
  • 【紧急更新】Midjourney v6.1金属纹理算法变更预警:3个必须重训的材质参数阈值,错过将导致PBR贴图链断裂
  • 武安市建龙废钢基地物资:峰峰矿专业的废钢回收公司推荐几家 - LYL仔仔
  • 2026年国内矿粉球团粘合剂头部厂家实力排行 - 奔跑123
  • 3步彻底解决Windows右键菜单卡顿:ContextMenuManager终极优化指南
  • 抖音无水印批量下载终极指南:douyin-downloader免费神器
  • 5分钟搭建个人游戏云:Sunshine跨平台串流服务器完全指南
  • 2026年全球优质筋膜枪选购指南:轻松找到你的专属按摩神器 - 博客万
  • G-Helper:华硕笔记本的轻量级性能管家,让你的电脑重获新生
  • N_m3u8DL-CLI-SimpleG:让M3U8视频下载变得如此简单的终极图形界面工具
  • 2026论文降AI率工具谁是性价比之王?早标网最低1.0元/千字性价比拉满 - 全维度降AI
  • MelonLoader终极指南:解锁Unity游戏无限可能的5个核心步骤
  • 2026年软考知识点—计算机等级考试—软件设计师考前备忘录—东方仙盟
  • 三步掌握AMD Ryzen处理器终极调优:SMUDebugTool完整使用指南
  • 2026港口码头监管低空平台建设指南:全域数字底座如何赋能安全高效运行 - 品牌2025
  • 【测试】一文读懂软件测试:新手真正需要的测试认知
  • Sunshine游戏串流终极方案:打造你的私人云游戏服务器
  • G-Helper:3步快速配置指南,释放华硕笔记本的真正潜能
  • 中兴光猫终极解锁指南:一键开启工厂模式与永久Telnet的完整解决方案
  • 2026年长春黄金回收避坑指南——福昌夏等六大机构实测对比 - 黄金上门回收
  • 高效掌握外语词汇:ToastFish桌面单词记忆工具完整指南
  • 鸣潮自动化助手:5步轻松实现后台智能战斗与资源收集
  • 2026年成都有哪些值得信赖的AI搜索优化公司? - 品牌推荐官方
  • 路由双雄对决:静态 vs 动态,从原理到实战的终极指南(万字长文)
  • 中兴光猫工厂模式解锁终极指南:zteOnu让你的网络管理更简单
  • 重庆顺坤机械科技:永川专业的CNC数控加工公司找哪家 - LYL仔仔
  • 国内矿粉粘结剂头部品牌排行 核心性能与服务实测对比 - 奔跑123
  • 2026年成都GEO公司专业大揭秘!TOP6权威排行榜推荐不容错过 - 品牌推荐官方
  • SQLite Viewer:3分钟学会在线查看SQLite数据库的终极方案
  • Midjourney拍立得风格失效预警:当--stylize值>800时,胶片颗粒算法将触发不可逆失真(附修复补丁)