百度开源文心大模型4.5系列 中国算力平台率先上线 赋能千行百业智算生态

2025 年 6 月 30 日,百度正式开源文心大模型 4.5 系列,中国算力平台模创空间率先上线该系列模型。此次开源的文心大模型 4.5 系列包含 10 款模型,既有激活参数规模为 47B 和 3B 的混合专家(MoE)模型,其中最大模型总参数量达 424B,也有 0.3B 参数的稠密型模型,并且实现了预训练权重和推理代码的完全开源。

在技术方面,文心大模型 4.5 系列创新运用多模态混合专家模型预训练技术,通过异构混合专家结构与多维旋转位置编码相结合,增强不同专家间的正交性,从而提升文本生成、图像理解以及多模态推理等任务的效能。为支持高效训练,该模型提出了异构混合并行和多层级负载均衡策略;在推理方面,则提出多专家并行协同量化方法和卷积编码量化算法,构建了高效的训练推理框架。同时,针对不同模态进行精调,大语言模型优化通用语言理解和生成能力,多模态大模型侧重视觉语言理解,还支持思考和非思考模式。

性能表现上,文心大模型 4.5 系列均基于飞桨深度学习框架进行训练、推理和部署,大语言模型预训练中的模型 FLOPs 利用率(MFU)达到 47%。在多个文本和多模态基准测试中,该系列模型达到了当前最优(SOTA)水平,尤其在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果显著。其中,文本模型性能超越了 DeepSeek – V3、Qwen3 等模型,多模态模型也优于闭源的 OpenAI o1。

此次文心大模型 4.5 系列在由工信部指导、中国信息通信研究院建设的中国算力平台上线,该平台汇聚了 “多源 + 多元” 的模型服务。模型的上线有助于形成 “算力 + 模型 + AI 创作” 的智算生态共建空间,通过 “模型接入→开发创作→共享共建” 的完整价值链,赋能开发者快速构建 AI 应用,推动算力资源聚合与算力产业生态完善,加速算力在各行业的赋能应用。

此外,文心大模型 4.5 开源系列还在飞桨星河社区、HuggingFace、GitCode 等平台上线,全球开发者、企业、研究机构等都可免费访问并下载体验。该模型权重按照 Apache 2.0 协议开源,支持学术研究和产业应用的开展。

说明:本站所有内容均收集于互联网,如果有不妥之处,敬请谅解。如有侵权内容,请联系我们删除。内容并不能代表产品厂家,或者是第三方的观点,非专业技术类人员,请勿对服务器设备进行操作,以免造成设备不可使用或数据丢失。同时凯铧互联小编建议用户定期对云服务器数据进行备份保存! 北京凯铧互联科技有限公司(简称凯铧互联)由多名前阿里云资深技术专家创立,核心员工来自阿里云、腾讯云等,作为阿里云重要的合作伙伴,专注于为企业用户提供云计算及云计算的解决方案,高端网站建设,设计及维护服务,设计开发经验丰富,用户认可率高. 今天的分享就到这里啦,若您需要帮助, 可以直接扫描添加我们客服微信号,阿里云代理商凯铧互联专业技术团队为您提供全面/便捷/专业的7x24技术服务。