当前位置：首页 > news >正文

瑞士发布国家级开源大模型Apertus：AI公共基础设施的全球新范式

news 2026/7/3 4:55:39

瑞士发布国家级开源大模型Apertus：AI公共基础设施的全球新范式

【免费下载链接】Apertus-70B-Instruct-2509-unsloth-bnb-4bit项目地址: https://ai.gitcode.com/hf_mirrors/unsloth/Apertus-70B-Instruct-2509-unsloth-bnb-4bit

在全球人工智能竞赛愈演愈烈之际，一个主权国家正以全新姿态入局。瑞士近日正式推出其国家级开源大语言模型Apertus，旨在为依赖OpenAI等商业公司模型的全球用户提供全新选择。这一命名源自拉丁语"开放"的AI系统，由洛桑联邦理工学院（EPFL）、苏黎世联邦理工学院（ETH Zurich）及瑞士国家超级计算中心（CSCS）三大公立机构联合研发，标志着公共科研力量在通用人工智能领域的突破性实践。

"当前Apertus代表着公共AI模型的最高成就——由公立机构打造、服务公共利益的技术成果。这是AI作为公共基础设施的最佳例证，正如公路、供水和电力系统一样，应当成为现代社会不可或缺的基础资源。"推动AI公共化的核心倡导者约书亚·谭如是强调。这一理念颠覆了当前AI领域由科技巨头主导的商业范式，将技术主权重新交还公众领域。

全透明架构：从训练到部署的开源革命

瑞士科研团队为Apertus构建了彻底开放的技术架构，允许用户对模型训练的每一个环节进行审计追溯。除模型本体外，研发机构同步发布了详尽的训练流程文档、完整源代码及全部训练数据集，构建起学术界罕见的全链路开放体系。这种透明度不仅回应了AI领域长期存在的"黑箱"争议，更为合规应用奠定了坚实基础。

特别值得注意的是，Apertus的开发全程遵循瑞士数据保护法规与版权法律框架，使其成为欧洲企业合规应用的理想选择。瑞士银行家协会此前曾表示，本土研发的大语言模型具有"巨大长期潜力"，尤其在满足瑞士严格的数据保护标准和银行保密法规方面具备先天优势。尽管瑞士银行业目前已在使用多种AI模型处理业务，但Apertus的合规特性可能引发行业应用格局的重塑。

该模型采取无许可使用策略，研究人员、爱好者及企业均可基于其进行二次开发与定制化改造。理论上，开发者可利用Apertus构建智能客服系统、多语言翻译工具、教育辅助平台等各类AI应用，这种开放生态系统有望催生丰富的行业创新。

多语言训练：15万亿 tokens 构建的语言包容性

Apertus的训练数据集规模达15万亿tokens，覆盖超过1000种语言，其中非英语数据占比高达40%，特别包含瑞士德语和罗曼什语等本土语言。这种语言多样性设计打破了主流大模型的英语中心倾向，为多语言NLP研究提供了宝贵资源。

瑞士官方强调，模型训练完全采用公开可获取的数据，且爬虫系统在遇到网站的机器可读退出请求时会严格遵守。这一做法与部分AI企业形成鲜明对比——此前Perplexity等公司曾被指控无视网站爬虫协议进行数据抓取，多家AI企业也因未经授权使用新闻内容和创意作品训练模型而面临法律诉讼。Apertus的合规采集机制，为解决AI训练数据的版权争议提供了参考范式。

目前Apertus提供两种参数规模版本：80亿参数轻量版与700亿参数完整版，用户可通过瑞士电信（Swisscom）或开源平台Hugging Face获取使用。这种多规格部署策略兼顾了不同用户的算力需求，从个人开发者到企业级应用均可找到适配方案。

如上图所示，该图片为Engadget媒体的标志图。作为全球知名的科技资讯平台，其对Apertus这类前沿AI技术的关注，反映了瑞士此次模型发布在国际科技领域的影响力，为读者提供了权威信息来源的视觉印证。