当前位置: 首页 > news >正文

硅基流动递表港交所冲击“Token工厂第一股”:高估值背后是AI水电煤还是资本泡沫?

硅基流动递表港交所剑指“Token工厂第一股”:高估值背后是AI水电煤还是资本泡沫?

6月30日,硅基流动向港交所递表,剑指“Token工厂第一股”。这家成立不到三年的公司,不做大模型、不做AI应用,专门做AI产业的 "Token批发商"。具体而言,是把英伟达、华为昇腾等不同芯片的算力,和DeepSeek、Qwen、GLM等上百个模型,统一封装成标准化的Token服务,用户按调用量付费,不用关心底层用的什么芯片、什么模型。

听起来很美好,资本也相当买账。34个月里,硅基流动完成7轮融资,估值从天使轮2.3亿元的投前估值,一路飙升到最新B+轮77.4亿元的投后估值,涨了33倍。阿里、华为、美团、商汤等半条AI产业链都成为其股东,阵容十分豪华。然而,翻开招股书,情况就不同了。

2025年,硅基流动营收5533万元,同比增长653%,但净亏损也达到3.45亿元,是收入的6倍多。更让人揪心的是毛利率,直接降至 -24%,意味着每赚1块钱,还要倒贴2毛4。一边是资本热捧、估值高涨,一边是越卖越亏、毛利率为负。硅基流动这门“Token生意”,究竟是AI时代的水电煤,还是又一个烧钱换规模的资本游戏?“Token工厂”凭什么有这么高的估值?

爆红背后:一人一事的推动

硅基流动的爆红,源于一个人和一件事。第一个人是创始人袁进辉,他是清华计算机系博士,师从中国AI奠基人张钹院士,是AI Infra圈里的“技术老兵”。2008年毕业后,他进入微软亚洲研究院担任主管研究员,研发出当时世界最快的主题模型训练算法LightLDA,还获得过微软亚研院院长特别奖。2016年,袁进辉从微软离职创业,推出深度学习框架OneFlow,在分布式训练领域曾是国产之光。2023年,OneFlow被王慧文的“光年之外”收购,后并入美团,但袁进辉拒绝了美团的留任邀请,带着核心团队二次创业,硅基流动由此诞生。

第二件事是2025年春节的DeepSeek狂欢。DeepSeek R1横空出世,全网争抢使用,算力瞬间崩溃。硅基流动联手华为云昇腾,首发国产化部署方案,一夜之间承接了大量流量,上线仅10小时就被迫限流。这场爆红让硅基流动一战成名,也坐实了“中国最大独立Token供应商”的称号。

招股书援引弗若斯特沙利文的数据显示,2025年中国词元按吞吐量统计,市场前三名合计拿下约87%的份额,硅基流动排第四,市场份额约为1.5%。虽看似份额不大,但外界推测对应的前三名分别是火山引擎、阿里云、百度智能云,硅基流动作为创业公司能在巨头夹缝中占据一席之地,已实属不易。其运营数据也十分亮眼:截至2026年4月,平台注册用户超过1000万,日均Token吞吐量达到5785亿次;公有云付费客户从2024年的2455家,飙升到2025年的71.6万家,一年涨了约292倍。这或许就是资本愿意给予77亿估值的原因。

然而,问题来了:140倍的PS(市销率),到底贵不贵?对比海外同类玩家,Fireworks AI在2025年10月C轮融资时估值40亿美元,对应ARR约2.8亿美元,PS约14倍;Together AI刚官宣一笔8亿美元的C轮融资,估值翻倍到83亿美元,对应今年初约10亿美元的年化收入,PS约8倍。两家海外对标公司的PS都在10到15倍区间,硅基流动140倍的估值,是它们的近10倍。这多出来的溢价,市场到底在赌什么?

两条业务线:根基不稳

硅基流动有两条业务线,情况截然不同。第一条是公有云服务,即MaaS,这是“Token工厂”故事的主角。2025年,这条线贡献了2926万元营收,占总收入52.9%,首次超过另一块业务。但它存在致命问题:不赚钱,毛利率是 -119%,意味着每收入1块钱,硅基流动要倒贴1块1毛9,卖得越多,亏得越狠。很多人认为是“烧钱换客户”,毕竟2025年光免费代金券就花费了5400多万元。但这只是表面现象,更深层次的问题是:公有云业务从商业模式上就很难盈利。

从价格方面看,硅基流动上DeepSeek - V3的常规价格一度是输入2元/百万Token、输出8元/百万Token,R1是输入4元、输出16元,加上新用户注册就送2000万免费Token,早期确实比官方便宜三到五成。但这个优势正在迅速缩小:2026年5月,DeepSeek将V4 - Pro的限时5折优惠永久化,降幅达75%,缓存命中的输入价格降至0.025元/百万Token,比硅基流动的老价格便宜很多。原厂一降价,中间商的价格优势就被削弱了,因为硅基流动的成本结构本身就不占优势。对于闭源模型,它拿不到权重,只能通过原厂API或授权渠道转接,相当于“二道贩子”,成本理论上不可能比原厂更低。对于开源模型,它虽可自己租卡部署、做推理优化,但原厂有最大规模的调用量、最深的模型理解、最极致的工程优化,单位成本还是比它低。硅基流动的价格优势更多是靠补贴、优化和比客户自建便宜一点,并非系统性的成本优势。真要打价格战,原厂降得起,它降不起。

那么,用户为什么还用它呢?早期用户可能是冲着便宜,但真正留下来的,更多是冲着多模型统一接入。170多个模型可随意切换,代码几乎不用改动,加上智能路由、容灾、成本管控等企业级功能,节省的不仅是钱,还有时间和精力。但这门“省事”生意的护城河有多深呢?

再看客户比例,招股书披露,2026年前四个月,公有云付费客户约64万家,人均ARPU约22元,高价值付费客户占比不到1%。这表明客户数量被长尾用户快速拉高,但不排除少数大客户贡献了更高的付费金额。真正的问题在于,长尾客户天然价格敏感,迁移成本又低,今天你便宜就用你,明天别家更便宜就转走。而大客户即便付费更多,也会把价格、稳定性和供应链安全压到极致,议价能力更强。

第二条是本地部署解决方案,才是真正的“利润奶牛”。客户自己有算力,硅基流动把推理引擎和调度系统部署到客户数据中心,收取软件许可费、实施费和维保费。2025年这项业务营收2607万元,占比47.1%,毛利率高达82.5%。看似美好,但也存在隐忧。一是客户越来越集中,本地部署客户数量从2024年的28家减少到2025年的20家,2026年前四个月仅新增5家;但平均每客户收益从22.4万元暴涨到130.3万元,涨了481%,说明收入越来越依赖少数大客户。二是规模化有天花板,本地部署本质是项目制生意,交付周期长、复用率低,更像一家“AI工程服务商”,而不是“Token工厂”。

两条业务线,一个撑估值、一个赚利润,搭配看似精妙。但“Token工厂”这个核心故事,其实主要是2025年才提出的。2024年,公有云收入才106.9万元,本地部署才是绝对主力。尴尬的是,硅基流动必须继续把MaaS这条亏钱的线做大,才能撑住估值故事,可每做大一分,亏损就扩大一分。想象力和现金流,短期内只能选一个。

“中立第三方”:护城河有多深?

硅基流动最大的卖点是中立第三方。大厂云做MaaS,都是“自研模型 + 云生态”打包销售,如豆包之于字节、通义之于阿里。大模型厂商把推理放在这些云上,总担心调用数据被拿去训练竞品。硅基流动不做模型、不做应用,只做中间层,恰好解决了这个信任问题。但这个位置真的稳固吗?

往上看,硅基流动是纯粹的“租卡方”,对供应链没有话语权。招股书披露,2025年公司向前五大供应商合计采购1.173亿元,占采购总额70.8%,最大单一供应商占比20.4%。招股书还提到,往绩记录期内有两名主要业务伙伴同时是公司的客户及供应商,对照股东名单不难猜到,这大概率就是阿里、华为哈勃这类公司。这些大客户一边通过股权和算力租赁赚硅基流动的钱,一边旗下的云和模型业务又在市场上跟它抢客户,这仗该怎么打?更关键的是,硅基流动没有定价权,芯片涨价,成本跟着涨;大厂云降价,售价也得跟着降,两头都由别人说了算。

往下看,硅基流动没有自研模型,对产品同样没有掌控力。它能卖什么、卖多贵,很大程度取决于开源社区和模型厂商。而它最大的卖点“多模型统一接入”,技术门槛并不高。火山引擎、阿里云、百度智能云都在做模型市场、做统一API,一旦大厂把开放也做成标配,价格还更低,硅基流动的核心价值随时可能被绕开。国产芯片厂商也是变量,昇腾、沐曦、摩尔线程这些芯片,眼下软件栈不够成熟,需要硅基流动这样的中间层做适配。可万一哪天芯片厂商自己把统一软件栈做出来了,中间层的价值还剩多少?

它的股东名单已经很能说明问题。阿里、华为、美团、商汤、创新工场等组成一张AI产业链地图,里面有些角色,既是股东,又是供应商,还是竞争对手。对这些产业资本来说,这笔账怎么算都不亏。自家MaaS跑出来了,是主营业务的胜利;“独立中间层”这个物种真跑通了,就通过股权分一杯羹,横竖都不亏。

硅基流动140倍PS的估值,本质上押注的是一个时间差。在国产芯片自研软件方案成熟之前、在竞争对手补齐中立能力之前、在大厂把多模型平台做起来之前,先把位置占住。但时间差是有保质期的。招股书披露,截至2025年末账面现金及现金等价物1.72亿元、定期存款1亿元;2026年内公司密集完成A +、B、B +三轮融资,合计融资约14.8亿元,七轮累计融资约19.5亿元,家底不算薄。但这笔钱能撑多久,仍取决于公有云亏损能不能尽快收窄。Token工厂到底是AI时代的水电煤,还是又一个资本催熟的泡沫,答案可能要等下一轮周期才能揭晓。

http://www.jsqmd.com/news/1127065/

相关文章:

  • 唤起 GBA 回忆!Key Boy Advance 键盘 2026 年四季度发货,起售价约 282 美元
  • 10分钟上手uos-tc-exporter:从安装到获取TC指标的快速教程
  • SoftBR配置文件转换全攻略:从perf_data.br到perf.data的完整流程
  • openEuler-lsb入门教程:10分钟快速搭建LSB兼容环境
  • 影刀RPA新手教程:1688批发网自动化找货询价与下单完全指南
  • 内容没流量?实战演示AI Agent如何构建“一人公司”内容自动化生产线
  • 携程酒店实时价格监控---接口逆向(token逆向)
  • ICM-42605 IMU与ARM Cortex-M4实现高精度运动追踪
  • 好用的郑州geo生产厂家
  • Mac安装IDA Pro全攻略:解决安全警告、架构兼容与Python配置
  • Wireshark网络流量分析实战:从TCP故障排查到安全威胁识别
  • 孤能子视角:三十六计之隔岸观火——时序相位选择
  • 为什么每个openEuler开发者都需要openEuler-pkginfo:5大核心优势
  • uos-tc-exporter完全指南:如何通过Prometheus监控Linux网络流量控制
  • 终极指南:如何用IwaraDownloadTool高效下载和管理Iwara视频
  • Windows右键菜单终极清理指南:ContextMenuManager让你的电脑操作效率提升300%
  • 德达全屋富氧解决方案如何用静音黑科技重塑居家呼吸体验
  • OpenEuler bridge-utils入门:如何快速搭建Linux网络桥接环境
  • YOLO数据集格式转换实战:PASCAL VOC XML与YOLO TXT互转详解
  • 充电桩(move)- 2024庐阳区初中组T4
  • MindSpore实战:从零搭建Windows环境并训练首个模型
  • 网络性能测试实战:oe-performance中的Netperf测试配置与结果分析
  • aops-ceres插件生态:支持gala-gopher与fluentd的配置指南
  • openeuler/sysmonitor核心功能解析:10大监控模块守护你的系统安全
  • Windows右键菜单终极清理指南:ContextMenuManager让你的操作效率翻倍
  • SQL注入防御:从数据库访问控制到纵深安全体系构建
  • AI编程工具安全风险与工程实践:从Claude Code事件看生产级应用挑战
  • CPU占用过高怎么办?openEuler/sysmonitor性能监控与优化终极指南
  • UTBotJava符号执行技术详解:从代码分析到测试生成的完整流程
  • hygon-qemu vs 原生Qemu:海光定制化增强带来的5大优势