显卡怎么越来越贵?聊聊GPU算力背后那些事
老实说,我也难以确切记起,究竟是自哪一日起始,电脑显卡的价格便如同乘坐了火箭那般。
可能就连楼下从事修电脑工作的陈师傅都未曾想到,在过去几年的时候,还能够运用“甜品卡”这个词汇去夸赞一张显卡在性价比方面较高,然而现如今,就连“甜品”这两个字都已然成为了回忆。要是你真的打算去购买一张能够顺畅运行AI模型的显卡,那么钱包不瘦个两三斤,根本是无法达成的。
这番背后究竟出现了什么状况呢?确切来讲,完全是源于一个词汇——图形处理器运算力。
什么是GPU算力,真的比CPU厉害那么多吗?
咱先别急于去翻动那些技术手册,来,说一个在程序员群体当中流传开来的陈旧笑话。
讲的是,有那么一天,中央处理器和图形处理器打了个赌,赌的是,谁能够在一秒钟之内,创作出来数量最多的”我爱编程“这句代码。中央处理器轻轻一笑,一下子就写出了一条。图形处理器瞅了一眼之后,直接招呼了一万个小弟,让每个人都各自写一句,写完了之后,还对着中央处理器发问:”你那个要不要添加字体,要不要添加颜色呀?我这儿还能够给你生成一个彩虹版本呢。“。
虽然是个段子,但道理就藏在里头。
CPU,也就是中央处理器,好似一位全能学霸,微积分、英语、物理这些都能应对,然而一次仅能解答一道题目。那GPU,即图形处理器,它更如同整整一班的学生,虽说每个人只会做最为简单的加减法,可是他们能够同时运算一万道题目。
这就是所谓的“并行计算”。
GPU算力,简单来讲就是那种“一万人同时做简单题”的能力,它和CPU不一样,CPU追求的是单道题的解题速度,而它追求的是“同时能算多少道题”,这个数量,在技术文档里通常是用“每秒浮点运算次数”也就是FLOPS来衡量的,截至2025年底,一张顶级的消费级显卡,单精度浮点算力已经突破了每秒100万亿次,没错,你没看错,是“万亿”这个单位。
为什么AI训练非要GPU不可?
这问题其实挺有意思的。
网上或许你浏览过,提及训练一个 AI 模型,讲确切点是大语言模型,需动用几千张乃至上万张显卡。头一回听闻此情况之时,自己也着实吃了一惊——如此想来搞 AI 并非是耗费脑力,而是在耗费显卡呀?
但事实就是这样。
AI训练的实质,实际上就是矩阵乘法,你听闻过的全部大模型,不管是用于回答问题,还是用于画图,其底层皆是无数个矩阵在极度疯狂地进行相乘、相加,而矩阵乘法这种情况,恰恰就是GPU最为擅长去做的事情。
比如说,假定你存在着一个规模为1000乘以1000的矩阵,需要同另外一个规模为1000乘以1000的矩阵进行乘法运算 ,要是运用CPU,它仅仅能够逐个元素地去计算,计算完毕之后或许需要耗费几毫秒,甚至有可能达到几十毫秒。然而对于GPU而言呢 ,它能够将矩阵切割成数量众多的小块 ,交付给那一万个 “学生” 同时展开计算 ,说不定几百微秒就能够计算完成了。
在训练一个模型时,这个模型需要处理数万亿个token,而对于它来说,这时间差距,就成了天壤之别。
算力这么强,那玩游戏是不是过剩了?
这话放在十年前,可能还有争议。但现在?
你瞧一瞧当下游戏的分辨率情况,4K已然成为了标准配置,8K也正朝着这个方向发展。更不必说光追了,光线追踪技术从本质上来说乃是在对真实的物理光线传播路径予以模拟,每一束光线都关联着大量的浮点运算。倘若你将光追效果全部开启并且再设置为4K分辨率,一张显卡的显存带宽以及算力瞬间就会被填满。
再顺带讲一下,截止至二零二五年的第四个季度,在市面上存有支持硬件层面光追表现的游戏已然超出了三百款。而这样个数目于二零二零年的时候还未达到六十款。
所以并非是算力过剩,恰恰相反,游戏之于算力存在需求,图形渲染对于算力也有着需求,而这种需求宛如深不见底的洞穴。
为什么现在显卡越来越贵?算力真的供不应求吗?
来,咱们聊点现实的。
说个数据,是我前些日子于二手平台瞅见的:有一款旗舰级消费显卡,其于2023年得以发布,官方所建议的零售价格为15999元。然而在二手交易市场当中,它的成交价格一度被炒作至22000元以上。溢价近乎达到40%。
这种价格狂涨的原因,其实不完全是玩家在抢。
而更多的情况是,与之争抢,高校实验室也在争抢,甚至个人开发者同样在争抢。原因在于企业级的数据中心显卡,像那种价格动辄几十万一张的A100系列、H100系列,根本不是普通之人能够触及的。所以,许多人便将目光转向了消费级显卡,虽说其精度稍差些,不过数量充足能满足需求,性价比颇高。
按照我所见到的行业统计情况来看,在2024年中国大陆区域市场所销售的消费级显卡当中,大概有18%的货物最终是朝着小型AI训练或者推理场景去的。而这个数字在2019年的时候,还达不到3%。
个人买显卡跑AI,划算吗?
这得分情况说。
要是你仅仅是开展一些轻量级的推理任务,像是去调试自身的小型模型、运行 进行图片绘制,那么购置一张处于中高端级别的消费级显卡实际上是能够满足需求的,花费呢,大约处在五千至一万的区间之内。
不过要是你打算亲自从起始点开始训练一个模型,哪怕它仅仅是个规模处于中等程度的,那可行性就不怎么高了。原因在于训练牵扯到数量众多的出错尝试以及反复修正。你或许运行一次就得耗费几个小时甚至是几天的时间,里面包含电费、显卡损耗费用、时间方面的成本——全面计算下来,倒不如直接去购置云GPU服务更划算。
基于2025年第一季度所查找的一份市场报价来看,租用含一张A100 80GB显卡的云服务,其计费方式为按小时计算,费用大概是28到35块钱。倘若你仅仅进行短期实验,这种模式明显在经济考量上相较于购买显卡划算许多。
以后GPU算力会越来越集中吗?
这是个值得思考的问题。
现下,有一种趋势愈发显著,那便是大厂构建超大规模的算力集群,而普通人和小公司唯有去租赁,算力正逐渐演变成如同电力以及自来水那般的基础设施。
此等模式究竟好不好?是好的,缘由在于它使得门槛得以降低。然而,这也让人略微存有担忧——倘若算力全然集中于几家公司之手,那么AI领域的创新是否也会逐渐变得集中起来?
我并非很愿意给出一个确定不移的答案。我仅能讲,这个问题于诸多科技论坛以及学术会议之上被不断反复地讨论过了。截止到2025年年中,全球处于兴建之中或者已经投入生产的超大型GPU集群(单个集群超过10000张显卡)起码有12个,其中超过一半是由不超过三家公司进行运营的。
写在最后
回到最开始的问题:显卡为什么越来越贵?
表面看去,呈现出的是供需处于失衡状态,然而朝着深入的方向去思索,实际上是整个数字世界正历经着一场底层计算架构的转移,CPU不再占据绝对主导地位,GPU这个以往仅仅承担“让画面更加美观”任务的角色,突然间变成了引领AI时代发展的动力源泉。
而我们每个人,正站在这个迁移的中间点。
有点奇妙,也有点焦虑。
然而我一直觉着,那般技术这玩意儿,终归到底那可是给人去服务的。不管算力究竟有多强大,哪怕显卡价格多么昂贵,最终呀依旧得回转到那个问题上去咧:你凭借它能够做成啥?能够把啥问题给解决掉?能够使得啥事情变得稍微好那么一点儿?
这,可能才是GPU算力真正的价值所在。
