9 月 29 日,深度求索正式推出 deepseek v3.2-exp 模型(实验性版本),显著提升了长文本处理效率,并宣布 api 调用成本下降超过 50%。在此次发布的公告中,有这样一段值得关注的内容:
在新模型的研发过程中,需设计并实现大量全新的 GPU 算子。我们采用高级语言 TileLang 进行快速原型开发,以支持更深层次的技术探索。
据悉,TileLang 是一种轻量级的领域专用语言(DSL),专注于简化在 GPU 和 NPU 等加速器上的算子开发。其核心设计理念在于将复杂的硬件调度逻辑与算法实现分离,从而提升开发效率。
该语言由北京大学团队主导研发,主要贡献者包括王磊、董宇骐,以及北大计算机学院副研究员、博士生导师杨智。
https://www.php.cn/link/12c9572aee915aa05233c43f75e915a6
立即进入“豆包AI人工智官网入口”;
立即学习“豆包AI人工智能在线问答入口”;
TileLang 的关键技术优势体现在以下几个方面:
降低 NPU 算子开发难度:采用类似 Python 的语法结构,显著减少了编程门槛;通过将调度空间封装为可复用的原语,使开发者能更聚焦于数据流的设计。高度可扩展性:实现数据流与调度策略的解耦,NPU 算子的优化由编译器自动完成,同时充分挖掘底层硬件潜力。卓越性能表现:允许开发者感知并利用 NPU 硬件特性,在理论上相比 Triton 可实现更优的执行效率。
TileLang 使用类 Python 语法,并基于 TVM 构建其底层编译架构,既提升了开发效率,又保留了对高性能优化的支持能力,让开发者无需在生产力和性能之间妥协。

https://www.php.cn/link/7c9d8efa5f0fc84385730c20b6a569e3
TileLang 的重要意义在于大幅降低了 GPU 编程的入门门槛。长期以来,GPU 高性能计算被视为技术“高壁垒”领域,要求开发者掌握复杂的硬件架构、内存层级和并行机制。

据 TileLang 社区组织者、Tile-AI 发起人王磊博士在一次技术沙龙中介绍,传统模式下开发一个高效能算子往往需要数周时间,且代码维护困难。而借助 TileLang 的分层抽象设计,不同背景的开发者都能参与进来。他指出:
对于没有硬件背景的新手,可以像编写数学表达式一样进行编程;而对于资深工程师,则仍可深入到底层进行精细调优。
源码地址:点击下载
以上就是DeepSeek 拥抱国产 GPU 编程语言 TileLang的详细内容,更多请关注php中文网其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/64062.html
微信扫一扫
支付宝扫一扫