当前位置: 首页 > news >正文

百度文心大模型4.5全系列源代码开放 配套API服务同步上线

百度文心大模型4.5全系列源代码开放 配套API服务同步上线

【免费下载链接】ERNIE-4.5-21B-A3B-PT项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-21B-A3B-PT

2025年6月30日,百度正式对外宣布文心大模型4.5系列完成开源工作,并同步推出API服务接口。此次开源行动涵盖10款不同规格的模型产品,参数规模从470亿混合专家(MoE)架构延伸至3亿轻量级稠密模型,全面覆盖文本生成、多模态交互等主流AI应用场景。开发者可通过飞桨星河社区、HuggingFace平台及百度智能云千帆大模型平台获取完整的模型权重与代码资源,所有开源资产均采用Apache 2.0协议授权,为商业应用与学术研究提供灵活支持。

百度文心大模型4.5开源家族在技术架构上实现重大突破,创新性地提出多模态异构模型设计。该架构专门优化大语言模型向多模态能力扩展的持续预训练流程,在确保文本任务性能不降反升的前提下,通过多模态混合专家预训练机制、高效训练推理引擎以及模态专属后训练策略等三大技术支柱,显著增强模型对跨模态信息的理解能力。全系列模型均基于飞桨深度学习框架开发,在大语言模型预训练阶段实现47%的FLOPs利用率(MFU),达到行业领先的计算效率水平。

如上图所示,该架构图清晰呈现了文心大模型4.5系列的产品矩阵,通过A47B、A3B和0.3B三个技术分支构建起完整的模型生态。这一模块化设计充分体现了百度在大模型架构创新上的系统性思考,为开发者提供了从超大规模到轻量化部署的全场景技术选择。

第三方评测数据显示,文心大模型4.5系列在12项国际权威基准测试中刷新性能纪录,尤其在指令理解准确率、世界知识覆盖率、视觉语义解析和跨模态推理速度等关键指标上表现突出。文本模型方面,其在MMLU、HumanEval等主流评测中全面超越DeepSeek-V3和Qwen3等竞品;多模态领域更实现突破性进展,依托精细化视觉感知能力与海量视觉常识库,成功构建"思考-执行"一体化认知框架,在VQAv2、Flickr30K等多模态评测中性能超越闭源的OpenAI o1模型。轻量化产品矩阵中,210亿参数的文心4.5-21B-A3B-Base文本模型与同量级Qwen3性能持平,而280亿参数的文心4.5-VL-28B-A3B多模态模型不仅在同参数开源模型中位列第一,甚至可与320亿参数的Qwen2.5-VL展开性能竞争。

作为国内AI技术研发的先行者,百度构建了从算力基础设施、深度学习框架、大模型算法到行业应用的全栈技术体系。此次开源行动中,基于飞桨平台多年积累的开源生态优势,同步发布文心大模型开发套件ERNIEKit和高效部署工具FastDeploy,形成覆盖模型训练、微调优化、推理部署的全流程技术支持。特别值得关注的是,该系列模型通过飞桨框架实现多芯片架构兼容,可无缝适配CPU、GPU及各类国产加速芯片,大幅降低企业级应用的部署门槛。这种"框架+模型"的双层开源模式,标志着我国大模型技术在生态开放度与产业实用性方面进入新阶段,将加速AI技术在智能制造、智慧城市、医疗健康等关键领域的深度渗透。

随着文心大模型4.5系列的开源,百度正在重塑AI产业的创新格局。Apache 2.0协议下的商业友好特性,结合飞桨生态丰富的工具链支持,预计将吸引超过10万家企业加入模型应用开发。这种开放式创新模式不仅有利于构建良性竞争的技术生态,更能通过开发者社区的集体智慧推动模型持续进化。未来,随着模型轻量化技术的成熟与垂直领域知识库的完善,文心大模型有望在边缘计算设备、嵌入式系统等终端场景实现规模化应用,最终形成"通用智能+行业专精"的多层次AI服务体系,为数字经济发展注入新动能。

【免费下载链接】ERNIE-4.5-21B-A3B-PT项目地址: https://ai.gitcode.com/hf_mirrors/baidu/ERNIE-4.5-21B-A3B-PT

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.jsqmd.com/news/85102/

相关文章:

  • 开源突破:SWE-Dev-9B模型横空出世,重新定义软件工程AI助手能力边界
  • 登顶开源Agent模型榜首:阿里通义DeepResearch凭何超越OpenAI与深度求索?
  • AI行业周报:腾讯混元3D模型开源破局 谷歌Gemma 3等新品重塑技术边界
  • 阿里重磅开源轻量级视觉大模型:Qwen3-VL-4B/8B本地化部署全攻略,小参数撬动大能力
  • JVM 面试题相关总结
  • 100秒出片:Step-Video-T2V-Turbo如何让视频创作效率提升300倍?
  • 3、数字转型时代的商业模式探索
  • 4、数字转型时代的商业模式与高增长企业价值构成
  • 5、高增长企业商业模式的价值构成与多样性分析
  • 6、高增长、高科技企业的商业模式剖析
  • 7、主流、高科技与高增长企业商业模式剖析
  • 9、高增长企业商业模式的盈利能力分析
  • 数据结构进阶:树与递归之美
  • 软件测试20个基础面试题【含答案】
  • 软件测试面试题含答案
  • NeurIPS 2025重磅突破:Tar-7B实现视觉理解与生成的统一范式
  • 1、商业模式:创新、数字化转型与数据分析的融合洞察
  • 2025软件测试面试题(持续更新)
  • 阶跃星辰开源语音大模型Step-Audio2mini震撼发布:重新定义端到端音频AI技术边界
  • 谷歌Gemma 3 270M开源:轻量级AI模型如何重塑移动端智能体验
  • 从“接口404”到“内存爆炸”——前端调试的Chrome实战指南
  • 智谱AI推出GLM-4.5V-FP8多模态模型,视觉语言理解能力刷新行业标杆
  • 百度ERNIE-4.5轻量化模型突破推理效率瓶颈:210亿参数实现128K上下文智能处理
  • 字节跳动Seed-OSS-36B震撼开源:512K超长上下文引领大模型效率革命
  • 【核心复现】模拟风电不确定性——拉丁超立方抽样生成及缩减场景研究(Matlab代码)
  • LightVAE:重塑视频生成效率标准,开创低显存高速度新范式
  • 【压缩空气储能】非补燃压缩空气储能系统集成的零碳排放综合能源优化调度(Matlab代码实现)
  • 突破AI记忆瓶颈:M3-Agent多模态智能体如何重塑长时序交互能力
  • 储能参与现货电能量-调频辅助服务市场的双层交易决策研究(Matlab代码实现)
  • PCB实战及拓展坞实现