当前位置：首页 > news >正文

突破30,000！信创模盒构建国产算力适配新极点，深度攻克大模型部署工程瓶颈

news 2026/7/7 17:41:09

在国产算力生态从“底层构建”迈向“工程落地”的关键窗口期，信创模盒（ModelHub XC）今日正式宣布：社区累计完成的信创算力适配认证模型数量已正式突30,000大关。这一数字不仅是对信创模盒算力池储备广度的量化印证，更标志着我们在异构算力环境下的标准化适配与工程化能力实现了质的飞跃。作为连接国产芯片与主流算法框架的枢纽，信创模盒始终致力于通过深度的底层调优，消除异构芯片间的性能鸿沟，为开发者提供开箱即用的国产算力方案。

深度覆盖主流算力，构建全栈适配底座

本轮适配工作的核心成就之一，在于实现了对当前国内主流算力底座的深度覆盖。信创模盒社区已针对多款核心加速芯片完成了系统级优化，其中包括：

华为昇腾Ascend 910-B3 与 910-B4 系列，
摩尔线程Mthreads S4000，
海光Hygon K100-AI，
沐曦MetaX C-500，
天数智芯Iluvatar BI-100 / BI-150 / MRV-100，
寒武纪Cambricon MLU370-X4 / MLU370-X8，
曦望Sunrise PT-200，
昆仑芯Kunlunxin R200-8F / P-800 ，
壁仞Biren 166M 等多款芯片。

值得关注的是，信创模盒在适配效能上展现了极高的工业化水平，意味着在信创模盒的算力调度下，从基础的NLP任务到复杂的多模态大模型，均能在上述国产芯片上获得稳定的运行环境与算子支持。

生态版图持续扩张，协作模式再升级

信创模盒社区的繁荣离不开芯片厂商的深度参与。近期，我们在厂商协作层面取得了多项重要进展：曦望（Sunrise）与壁仞（Biren）已启动批量适配流程，通过信创模盒的标准化测试套件，加速其全系产品进入商业化部署阶段。与此同时，信创模盒已正式启动与瀚博半导体（VastaiTech）的相关合作，尽管目前尚未进入大规模批量适配阶段，但双方已就底层软硬件接口对齐与推理引擎优化等核心课题展开了深入的前期对接。这种“先导合作+批量加速”的模式，确保了信创模盒能够持续吸收前沿硬件算力，为用户提供更多元的底座选择。

攻坚智谱GLM-5：从环境配置到量化复现的工程突破

在三万个适配任务中，智谱大模型GLM-5在国产异构算力上的部署面临着严苛的环境配置挑战。由于国产芯片驱动、固件版本与大模型软件栈（如PyTorch、vLLM）之间存在极其敏感的版本依赖，团队在环境解耦与内核调优上投入了大量精力。

除环境配置外，模型量化设置是另一大技术难点。为了在有限的显存带宽下保持精度，团队针对GLM-5的权重分布进行了定制化的量化校准。令人振奋的是，信创模盒技术团队已成功在天数智芯Iluvatar BI-150平台上实现了GLM-5的完美复现与部署验证。这一突破不仅验证了天数智芯芯片在承载超大规模参数模型时的硬件上限，也体现了信创模盒在处理复杂量化算法（如INT4 QAT或特定位宽对齐）时的工程化解决能力。

展望未来：深化推理优化，跑出信创“加速度”

适配数量的突破只是第一步，如何让模型“跑得稳、跑得快”是信创模盒当下的核心课题。目前，我们在完成基础部署的基础上，正集中力量推进推理环节的极限优化。针对不同算力架构的显存管理特性和通信原语调优，我们致力于将推理速率提升至工业级商用标准。

信创模盒将继续深耕“适配+调优”的双轮驱动战略，通过XC-LLM等自研推理引擎，将国产算力的硬件潜能转化为实实在在的业务生产力，助力国产大模型生态在万亿级参数时代实现真正的自主可控。

ModelHub XC 信创模盒是一个众创共享的国产化算力和模型开源社区，致力于打造国产化算力开发者和生态厂商合作共赢的开放平台，成为“最新最全的国产算力模型社区”，让每一个优秀模型都能在国产化算力平台上生根发芽，推动 AI 国产化事业快速升级。
欢迎访问「信创模盒」ModelHub XC（modelhub.org.cn），共同探索国产算力的无限可能。
如有相关业务需要，请联系我们。

查看全文

http://www.jsqmd.com/news/526651/