讲真,我看到这个消息的时候人差点蚌埠住。
Anthropic,这个天天把"AI安全"挂在嘴边的公司,前脚刚说完Musk是"evil",后脚就宣布要去用Meta的超算集群Colossus。这反转力度,电视剧都不敢这么拍吧?
据报道,Anthropic这次租用的是Colossus 1,拥有超过22万块GPU,总共30万千瓦的计算能力。而且更重要的是,未来还会用上GB200——就是那个Blackwell架构的新一代AI芯片。
说实话,这件事我一开始是完全看不懂的:搞推理需要这么多GPU吗?你一个Claude做推理,又不是训练模型,需要30万千瓦的算力?这里肯定有什么我还没搞懂的。
后来我想了下,得益于之前玩过一段时间的推理服务部署,我对大规模推理有点经验——一个商业模型每秒可能处理几千个请求,如果并发高了,延迟就会爆炸。所以理论上,如果你服务全球几亿用户,百万级别的QPS,算力需求确实会很离谱。我甚至当时真想试试看,具体算一下:如果Claude每秒处理10000个请求,每个请求消耗1000 tokens,那一天的token消耗量是多少……粗略估算,大概是860亿tokens/Day。这个数字有点恐怖,但似乎又有点合理。
不过这都不是重点,重点是:
为什么Musk要把算力给自己的竞争对手用?
想了一下,这背后可能有更深的考量。是在下一盘大棋,要通过算力共享来占据更有利的位置?还是想在其他地方获得更大的话语权?这比我想象的要复杂太多了。说句不好听的话,这比单纯的数据中心军备竞赛可怕10086倍。
也许真正的底层逻辑,只有他们自己才清楚。但不管怎么说,这波操作真的很魔幻——毕竟没有人能想到,"AI安全一哥"Anthropic会去租用"AI狂人"Musk的超算。
你们怎么看这事?是不是也觉得魔幻到家了?
