推广 热搜:   服务  系统    公司  行业  中国  教师  企业  参数 

飞桨框架3.0正式版发布!大模型训练时间减半

   日期:2025-04-10     浏览:102    移动:http://lanlanwork.gawce.com/mobile/quote/12138.html

4月1日,中国首个自主研发、开源开放、功能丰富的深度学习平台飞桨,宣布新一代飞桨框架3.0正式发布,以“动静统一自动并行”等五大核心技术创新为大模型训推提速。

作为大模型时代的Infra“基础设施”,深度学习框架的重要性愈发凸显,大模型训练、推理等任务都离不开深度学习框架的优化与支撑。图片

飞桨框架3.0架构图

飞桨框架3.0从设计理念上实现了从底层硬件适配到顶层开发体验的全面进化,在训练效率、性能、兼容性等关键指标上建立了新标杆。其中,“动静统一自动并行”、“大模型训推一体“、“科学计算高阶微分”、“神经网络编译器”、“异构多芯适配”这五大技术新特性,系统性解决了当前大模型产业面临的训练成本高、推理效率低、硬件适配难等核心痛点。

飞桨提出的"动静统一自动并行"技术,大幅降低大模型开发训练成本,让算法创新回归核心价值创造;同时,"训推一体"设计理念打破了训练与推理的割裂状态,通过全方位深度优化,飞桨框架3.0能够支持众多开源大模型进行高性能推理,并在 V3/R1上取得了突出的性能表现。

目前,飞桨框架3.0支持文心4.5、文心X1等多款主流大模型,DeepSeek-R1满血版单机部署吞吐提升一倍。通过技术算法创新,飞桨让低时延、高吞吐、低算力成本的推理服务成为了现实。

同时,在科学智能领域,飞桨框架3.0锚定科学前沿探索需要,提升微分方程求解速度。通过高阶自动微分和神经网络编译器技术,加速微分方程求解,速度比PyTorch开启编译器优化后的2.6版本平均快115%。飞桨还对DeepXDE、Modulus 等主流开源科学计算工具进行了广泛适配,并成为 DeepXDE 的默认推荐后端。其展现的科学智能潜力在气象预测、生命科学、航空航天等领域具有广泛的应用价值。

此外,在运算速度上,借助创新研制的神经网络编译器CINN,实现性能的显著提升,部分算子执行速度提升4倍,模型端到端训练速度提升27.4%。

在硬件适配方面,飞桨框架3.0推出了多芯片统一适配方案,构建"一次开发,全栈部署"的生态体系。目前已支持60余款主流芯片,覆盖训练集群、自动驾驶、智能终端等场景,开发者只需编写一份代码即可实现跨芯片无缝迁移,硬件适配成本直降80%。

公开信息显示,早在2016年飞桨首次开源,并于2018年发布1.0版本,填补了国内深度学习框架空白;到2021年2.0版本发布,成熟完备的动态图模式引领行业,更强大的分布式训练能力,兼具了易用性与灵活性;再到如今飞桨框架3.0发布,专为大模型设计,以五大特性开启大模型时代。

本文地址:http://lanlanwork.gawce.com/quote/12138.html    阁恬下 http://lanlanwork.gawce.com/ , 查看更多

特别提示:本信息由相关企业自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


相关行业动态
推荐行业动态
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2023001713号