快手 kwaipilot 团队近日推出了 kat-dev-72b-exp。
这是 KAT-Coder 系列模型在强化学习方向上的实验性升级版本,在权威软件开发评测基准 SWE-Bench Verified 上实现了 74.6% 的成绩,刷新了开源大模型在该领域的性能纪录。

据悉,该模型依托快手自主研发的工业级强化学习框架 SeamlessFlow,通过全新的数据平面设计,实现了训练流程与 Agent 的彻底解耦,有效支撑多智能体协作及在线强化学习等高复杂度场景。
为应对复杂 Agent 架构带来的技术难题,团队创造性地引入 Trie Packing 技术,并对底层训练引擎进行深度重构,显著提升了模型在共享前缀行为序列上的训练效率。结合难度感知的策略优化机制,模型在探索与利用之间达成良好平衡。同时,借助基于海量开源代码库构建的大规模、端到端可验证的软件工程任务集,KAT-Dev-72B-Exp 在实际编程能力上展现出卓越表现。
免费体验 KAT-Coder:https://www.php.cn/link/127449db06658be5e1bc1cd51bde8b78
KAT-Dev-72B-Exp 开源项目地址:https://www.php.cn/link/58e473658c4b6757ec8379817d35e6fa
以上就是快手 Kwaipilot 团队开源 KAT-Dev-72B-Exp的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/35730.html
微信扫一扫
支付宝扫一扫