9月9日,wave summit 深度学习开发者大会2025在北京隆重举行,本次大会由深度学习技术及应用国家工程研究中心主办,百度飞桨与文心大模型联合承办。
在大会现场,百度宣布正式开源其最新研发的思考型模型——ERNIE-4.5-21B-A3B-Thinking。该模型基于ERNIE-4.5-21B-A3B进一步训练而成,专注于提升深度推理能力,在内容生成、逻辑推导、数学运算、代码编写以及工具调用等多个复杂任务场景中展现出卓越性能。


https://www.php.cn/link/3f2b8decc6771a77dad1fa90ced28eaa
文心大模型
百度飞桨-文心大模型 ERNIE 3.0 文本理解与创作
56 查看详情

同时,百度推出了ERNIEKit文心大模型开发套件,提供简化的模型后训练解决方案,开发者仅需4张GPU即可高效完成对ERNIE-4.5-300B-A47B模型的调优工作,显著降低了大模型落地应用的技术门槛。此外,大会还发布了大规模计算图数据集GraphNet,包含超过2700个模型计算图及配套的标准化评估体系,填补了AI编译器测试基准领域的空白,为编译优化与性能提升提供了重要支撑。
源码地址:点击下载
以上就是百度开源最新思考模型 ERNIE-4.5-21B-A3B-Thinking的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/355554.html
微信扫一扫
支付宝扫一扫