当前位置：首页 > news >正文

算力战争背后：GPU到底凭什么这么贵？

news 2026/7/12 22:41:51

你开启电脑，键入一行代码，屏幕之上浮现一个模型训练进度条，自0%至100%，GPU在消耗。你觉得你在运行AI，实则你在耗费钱财。

真的。

一款高端的GPU，其价钱能够对标一辆二手的小轿车，并且你没办法买到。在2025年时，全球GPU市场的产值攻破2800亿美元，当中数据中心所使用的GPU占据了60%以上。这一家公司就占据了超出85%的市场份额，每年的出货量快要达到4000万片。每一块，宛如印钞机。

那么你可曾晓得最为离谱的究竟是什么呢？图形处理器最初被设计创造出来的时候，压根就不是用于人工智能方面的。它原来是为了能够方便人们玩游戏而设计的呀！

显卡不卡，卡的是你的想象力

在1999年的时候，推出了 256，它号称是“世界上第一款GPU”。其使命在于，要让3D游戏当中的怪物变得更加逼真，要让子弹特效变得更为炫酷。谁都没有想到，历经二十多年后，这个东西竟然会成为人工智能的引擎。

怎么做到的？

有着如同大学教授般能力的CPU，对各类知识均有所掌握，然而却在同一 time 仅能教导一名学生，那GPU又如何呢？它恰似幼儿园教师那般，仅仅会数数，可却能够于同一时刻对五十个孩童展开教导，AI训练的实质便是数量众多且不断重复的矩阵乘法运算，而恰好GPU在这方面最为擅长。

比方说。在2012年，Alex 借助两块GTX 580训练出了一个名为的神经网络，于图像识别竞赛中，其错误率相较于第二名低了10个百分点。就在那一年，深度学习全面爆发开来了。而GTX 580的算力为1.58 ，大致每秒能够执行1.58万亿次浮点运算。

而今的H100究竟何在呢？其单精度算力能够达到60 ，此乃GTX 580的三十八倍之多。并且其价格已然从三百美元，迅猛飙升至三万美元以上了。

为什么GPU比黄金还贵？

你可能会想，技术升级了，产量大了，东西不是应该更便宜吗？

错了。

GPU的制造花费的确是在降低了，然而需求增长得更为疯狂，速度更快。在2024年的时候，全球范围内AI大模型的数量突破了3000个，并且每个大模型在开展训练工作时都需要上万块GPU同时进行运转。据说GPT-4的训练过程中使用了25000块A100 ，且持续运行了100天。仅仅电费这一项支出就快要接近1亿美元了。

更为关键之处在于，GPU的制造深切地依赖着台积电的先进封装工艺。在2025年的时候，台积电的CoWoS封装月产能仅仅为3.2万片。然而全球订单量却超过了15万片。供需比达不到1:5。这便意味着，哪怕你拥有资金，也需要进行排队。

多长时间会排到队呢？2024年的订单，曾经是一直延续排放到2025年年底的状态。有一些公司，纯粹是借助两倍的价格，前往黑市进行扫货的行为。你说说，这样的情况贵不贵呢？

算力不是数字，是时间

不少人倾向于运用FLOPS去对比GPU的强弱程度，然而，真正具有关键意义的，是“你能够在多长时间之内把这个模型跑完”。

一项的基准测试表明，于训练BERT模型之际，一块A100所需时长为2.8天，然而一块H100所需时长仅为1.1天。所节省下来的1.7天，若换算成电费、人力以及机会成本，或许价值几十万美金。

所以，大型公司压根不在意单独一块 GPU 的价格高低状况，他们仅仅侧重于考量每单位计算能力能够节省下来的具体时间量。

可是小团队就并非那般幸运了，在2024年，有一家初创公司，由于买不到GPU，所以不得不将模型训练任务外包给云计算平台，结果一个月花费了120万美元，该团队仅有八个人，全都在烧钱。

谁在用GPU，谁在用命？

于数据中心之中，GPU并非始终保持24小时满负荷运转状态，有时它用于运行训练工作，有时它被用于进行推理任务，有时它处于空转情形，然而即便空转状态其也存在耗电状况。

一台微波炉的功耗与一张H100的700瓦功耗相近，3000张H100一同运行一个小时，会消耗2100度电，如此一来基于一年的情况，GPU本身的费用相比电费反倒更低。

考虑散热情况？液冷已然成为了符合基本条件需具备的配置了。传统的依靠空气对流散热的风冷方式压根就压制不住功率达到700瓦时所产生的热量。到2025年的时候，在全球范围内的数据中心领域里，液冷市场的规模实现了突破80亿美元的情况，其中超过一半以上的份额是源自GPU集群对于冷却的需求。

因此你瞧，一块GPU价格高，并非仅仅是芯片本身价值不菲。它背后涉及的电力供应、散热措施、网络连接、机房环境，每一个相关环节都在耗费大量资金。

普通人怎么用得起？

你可能觉得，这东西跟我没关系。但事实是，你每天都在用。

哪怕是要用GPT去询问一个问题，其背后至少得调用数千块GPU来进行推理。哪怕只是去刷短视频，那推荐算法同样也是在GPU上面运行的。哪怕仅仅是用手机拍摄了一张照片，其中的AI美颜实际上也是在云端的GPU之上完成计算的。

只不过这些成本被平台消化了，你没直接付钱。

然则倘若你身为一名学生，欲自行运行一个模型以进行实践呢？租赁云GPU一个月的费用大概处于500至2000美元之间。绝大多数人根本没有能力去承担这笔费用。故而当前流行着一种做法：去进行拼单。数人共同租用一台GPU服务器，依次轮流使用。既能够节省费用，又具备较高的效率。

在2025年时，于国内涌现出了数量超过50家的GPU算力共享平台，且其用户量实现了突破200万的情况。其中最小的套餐是按照小时进行租赁的模式，每一小时的价格为6块钱。这样的价格听起来是不是会让人觉得颇为便宜呢？然而需要注意的是，那所使用的是低端显卡。要是使用高端卡的话，那么一小时的费用则需要80块。