算力战争背后:GPU到底凭什么这么贵?
你开启电脑,键入一行代码,屏幕之上浮现一个模型训练进度条,自0%至100%,GPU在消耗。你觉得你在运行AI,实则你在耗费钱财。
真的。
一款高端的GPU,其价钱能够对标一辆二手的小轿车,并且你没办法买到。在2025年时,全球GPU市场的产值攻破2800亿美元,当中数据中心所使用的GPU占据了60%以上。 这一家公司就占据了超出85%的市场份额,每年的出货量快要达到4000万片。每一块,宛如印钞机。
那么你可曾晓得最为离谱的究竟是什么呢?图形处理器最初被设计创造出来的时候,压根就不是用于人工智能方面的。它原来是为了能够方便人们玩游戏而设计的呀!
显卡不卡,卡的是你的想象力
在1999年的时候,推出了 256,它号称是“世界上第一款GPU”。其使命在于,要让3D游戏当中的怪物变得更加逼真,要让子弹特效变得更为炫酷。谁都没有想到,历经二十多年后,这个东西竟然会成为人工智能的引擎。
怎么做到的?
有着如同大学教授般能力的CPU,对各类知识均有所掌握,然而却在同一 time 仅能教导一名学生,那GPU又如何呢?它恰似幼儿园教师那般,仅仅会数数,可却能够于同一时刻对五十个孩童展开教导,AI训练的实质便是数量众多且不断重复的矩阵乘法运算,而恰好GPU在这方面最为擅长。
比方说。在2012年,Alex 借助两块GTX 580训练出了一个名为的神经网络,于图像识别竞赛中,其错误率相较于第二名低了10个百分点。就在那一年,深度学习全面爆发开来了。而GTX 580的算力为1.58 ,大致每秒能够执行1.58万亿次浮点运算。
而今的H100究竟何在呢?其单精度算力能够达到60 ,此乃GTX 580的三十八倍之多。并且其价格已然从三百美元,迅猛飙升至三万美元以上了。
为什么GPU比黄金还贵?
你可能会想,技术升级了,产量大了,东西不是应该更便宜吗?
错了。
GPU的制造花费的确是在降低了,然而需求增长得更为疯狂,速度更快。在2024年的时候,全球范围内AI大模型的数量突破了3000个 ,并且每个大模型在开展训练工作时都需要上万块GPU同时进行运转。据说GPT-4的训练过程中使用了25000块A100 ,且持续运行了100天。仅仅电费这一项支出就快要接近1亿美元了。
更为关键之处在于,GPU的制造深切地依赖着台积电的先进封装工艺。在2025年的时候,台积电的CoWoS封装月产能仅仅为3.2万片。然而全球订单量却超过了15万片。供需比达不到1:5。这便意味着,哪怕你拥有资金,也需要进行排队。
多长时间会排到队呢?2024年的订单,曾经是一直延续排放到2025年年底的状态。有一些公司,纯粹是借助两倍的价格,前往黑市进行扫货的行为。你说说,这样的情况贵不贵呢?
算力不是数字,是时间
不少人倾向于运用FLOPS去对比GPU的强弱程度,然而,真正具有关键意义的,是“你能够在多长时间之内把这个模型跑完”。
一项的基准测试表明,于训练BERT模型之际,一块A100所需时长为2.8天,然而一块H100所需时长仅为1.1天。所节省下来的1.7天,若换算成电费、人力以及机会成本,或许价值几十万美金。
所以,大型公司压根不在意单独一块 GPU 的价格高低状况,他们仅仅侧重于考量每单位计算能力能够节省下来的具体时间量。
可是小团队就并非那般幸运了,在2024年,有一家初创公司,由于买不到GPU,所以不得不将模型训练任务外包给云计算平台,结果一个月花费了120万美元,该团队仅有八个人,全都在烧钱。
谁在用GPU,谁在用命?
于数据中心之中,GPU并非始终保持24小时满负荷运转状态,有时它用于运行训练工作,有时它被用于进行推理任务,有时它处于空转情形,然而即便空转状态其也存在耗电状况。
一台微波炉的功耗与一张H100的700瓦功耗相近,3000张H100一同运行一个小时,会消耗2100度电,如此一来基于一年的情况,GPU本身的费用相比电费反倒更低。
考虑散热情况?液冷已然成为了符合基本条件需具备的配置了。传统的依靠空气对流散热的风冷方式压根就压制不住功率达到700瓦时所产生的热量。到2025年的时候,在全球范围内的数据中心领域里,液冷市场的规模实现了突破80亿美元的情况,其中超过一半以上的份额是源自GPU集群对于冷却的需求。
因此你瞧,一块GPU价格高,并非仅仅是芯片本身价值不菲。它背后涉及的电力供应、散热措施、网络连接、机房环境,每一个相关环节都在耗费大量资金。
普通人怎么用得起?
你可能觉得,这东西跟我没关系。但事实是,你每天都在用。
哪怕是要用GPT去询问一个问题,其背后至少得调用数千块GPU来进行推理。哪怕只是去刷短视频,那推荐算法同样也是在GPU上面运行的。哪怕仅仅是用手机拍摄了一张照片,其中的AI美颜实际上也是在云端的GPU之上完成计算的。
只不过这些成本被平台消化了,你没直接付钱。
然则倘若你身为一名学生,欲自行运行一个模型以进行实践呢?租赁云GPU一个月的费用大概处于500至2000美元之间。绝大多数人根本没有能力去承担这笔费用。故而当前流行着一种做法:去进行拼单。数人共同租用一台GPU服务器,依次轮流使用。既能够节省费用,又具备较高的效率。
在2025年时,于国内涌现出了数量超过50家的GPU算力共享平台,且其用户量实现了突破200万的情况。其中最小的套餐是按照小时进行租赁的模式,每一小时的价格为6块钱。这样的价格听起来是不是会让人觉得颇为便宜呢?然而需要注意的是,那所使用的是低端显卡。要是使用高端卡的话,那么一小时的费用则需要80块。
算力会越来越贵吗?
短期看,会。
到2025年的时候,台积电的3纳米制程良率仅为70%,这极大地抬高了GPU的制造成本,并且HBM3显存的产能同样处于紧缺状态,三星以及SK海力士2025年的订单已然排满。
长期看,不一定。
处于研发进程中的有量子计算,还有光子计算,以及存算一体芯片。在2024年的时候,有一家名为的公司,推出了晶圆级芯片,该芯片是直接在一大块晶圆上进行集成,集成了85万个AI核心。尽管其生态尚不具备成熟的状态,不过至少是给算力领域带去了另外一种可能性。
而且,摩尔定律还没死透——只是慢下来了。
最后说一句
GPU的算力并非技术所达的终点,它仅是在这个时代里最为强硬的货币。无论谁拥有了算力,便能够以更快的速度去迭代模型,能够以更快的速度去占领市场,能够以更快的速度去定义未来。
不过说到底,算力自身不存在价值。真正具备价值的,是你运用算力去开展的事情。
是让AI更聪明,还是让世界更分裂?
我不清楚答案,然而我明白,每次你敲下回车键,GPU就在为你作答。
你是用来画图的?写代码的?还是拿来炒币的?
那块GPU不会说话,但它知道。
