RWKV 社区八月动态:RWKV7s 0.1B 发布,G0 13B 训练中,6 篇论文

欢迎大家收看《rwkv 社区最新动态》,本期内容收录了 rwkv 社区 2025 年 8 月的最新动态。

只需 3 分钟,快速了解 RWKV 社区 8 月都有哪些新鲜事!

8 月动态省流版(TL;DR)

RWKV 模型新闻动态

RWKV-7s 0.1B 发布 RWKV7-G0 13.3B 正在训练

RWKV 学术研究动态

新论文:Monthly Service Prediction for 4G/5G Systems: A Short Time Series Based Neural Network Solution(基于 RWKV 的时序预测,发表于中科院 1 区 TOP 期刊 IEEE TCCN) 新论文:REB-former: RWKV-enhanced E-branchformer for Speech Recognition(基于 RWKV 增强的自动语音识别模型,发表于 Interspeech 2025) 新论文:A Multimodal Bone Stick Matching Approach Based on Large-Scale Pre-Trained Models and Dynamic Cross-Modal Feature Fusion(基于 RWKV 的多模态骨签匹配,发表于 Applied Sciences) 新论文:MSFF-RWKV : Single-Structure Multi-stage Feature Fusion Lightweight Super-Resolution Network(基于 RWKV 的图像超分辨率,已入选 ICIC 2025) 新论文:Smooth Reading: Bridging the Gap of Recurrent LLM to Self-Attention LLM on Long-Context Tasks(基于 RWKV 的推理优化) PointDGRWKV: Generalizing RWKV-like Architecture to Unseen Domains for Point Cloud Classification(基于 RWKV 的点云域泛化框架)

RWKV 社区市场活动

RWKV 团队参加全球互联网大会

RWKV 模型新闻动态

RWKV-7s 0.1B 发布

RWKV-7s 0.1B 模型开源发布,其中 RWKV7a-G1b 0.1B 于 8 月 19 日完成训练并开源发布,RWKV7b-G1b 0.1B 于 8 月 22 日完成训练并开源发布。两个模型较原生的 RWKV7-G1a 0.1B 均有合理提升。

经测试,RWKV7+DE 稀疏模型,在端侧的推理速度与 RWKV7 相同,实现了不占内存不减速度的免费性能提升。

RWKV 社区八月动态:RWKV7s 0.1B 发布,G0 13B 训练中,6 篇论文

模型 模型构成 总参数 (M) 激活参数 (M) 每 Token 读取数值量

RWKV7-G1 0.1B RWKV-7 191.03 140.70 768 RWKV7a-G1b 0.1B RWKV-7 + DE 997.85 142.23 13,056 RWKV7b-G1b 0.1B RWKV-7 + DE + DEA 1,806.75 145.83 25,344

推理代码:

https://github.com/BlinkDL/RWKV-LM/blob/main/RWKV-v7/rwkv_v7a_demo.py

https://github.com/BlinkDL/RWKV-LM/blob/main/RWKV-v7/rwkv_v7b_demo.py

可以与 RWKV7 代码做 diff 对比:

https://github.com/BlinkDL/RWKV-LM/blob/main/RWKV-v7/rwkv_v7_demo_fast.py

RWKV7-G0 13.3B 正在训练

2025 年 8 月 26 日,RWKV7-G0 13.3B 模型训练进度已达 33%。在仅完成三分之一训练的情况下,该模型在 MMLU 测试已取得 63.21% 成绩,相较于 RWKV-6 14.1B 的 55.38% 提升近 8 个百分点。

模型版本 参数量 训练进度 MMLU 分数 (%)

v6 14.1B 100% 55.38 v7 13.3B 20% 58.57 v7 13.3B 27% 60.18 v7 13.3B 33% 63.21

目前 RWKV-7 已发布 0.1/0.4/1.5/2.9/7.2B 支持全球所有 100+ 种语言的带推理基底模型,且 13.3B 正在训练,即将陆续发布。

RWKV 学术研究动态

RWKV 学术研究包括基于 RWKV 架构的新论文RWKV 社区参加的学术研究

Monthly Service Prediction for 4G/5G Systems

论文名称:Monthly Service Prediction for 4G/5G Systems: A Short Time Series Based Neural Network Solution 论文链接:https://ieeexplore.ieee.org/abstract/document/11104274 发布日期:2025-07-30

本文基于 RWKV 模型开发了一个短时间序列预测框架,包括深度时间聚类表示(DTCR)和递减时间差网络(DTD-Net)。DTCR 使用 RWKV 编码器聚类数据以提升内部逻辑,DTD-Net 通过裁剪月度特征块减少注意力操作防止过拟合。实验在中国移动服务数据上验证了框架的有效性,平均 MAPE 为 0.126 和 0.120。

该论文的模型十分高效,已发表于中科院 1 区 TOP 期刊 IEEE TCCN

RWKV 社区八月动态:RWKV7s 0.1B 发布,G0 13B 训练中,6 篇论文

魔乐社区 魔乐社区

天翼云和华为联合打造的AI开发者社区,支持AI模型评测训练、全流程开发应用

魔乐社区 102 查看详情 魔乐社区

REB-former

论文名称:REB-former: RWKV-enhanced E-branchformer for Speech Recognition 论文链接:https://www.isca-archive.org/interspeech_2025/song25b_interspeech.html 发布日期:2025-08-17

本文提出了 REB-former,一种基于 RWKV 增强的 E-Branchformer 模型,用于自动语音识别 (ASR)。该模型交错结合了 E-Branchformer 和 RWKV 层,并引入 GroupBiRWKV 模块克服 RWKV 的单向性,旨在降低计算复杂度并提升语音建模能力。REB-former 在 LibriSpeech 100h 数据集上实现了先进的性能,显著降低了词错误率。

论文的模型十分有效,已发表于音频领域重要会议 Interspeech 2025

RWKV 社区八月动态:RWKV7s 0.1B 发布,G0 13B 训练中,6 篇论文

A Multimodal Bone Stick Matching Approach

论文名称:A Multimodal Bone Stick Matching Approach Based on Large-Scale Pre-Trained Models and Dynamic Cross-Modal Feature Fusion 论文链接:https://www.mdpi.com/2076-3417/15/15/8681 发布日期:2025-08-05

本文基于 RWKV 模型及其变体,提出了一种多模态骨签匹配方法。该方法利用 Vision-RWKV 提取视觉特征、RWKV 分析铭文、BERT 编码考古元数据,并通过动态跨模态特征融合机制整合信息。实验表明,该方法在骨签碎片匹配中达到94.73%的准确率,显著优于传统方法。

该论文的方法非常新颖有效,已发表于 JCR Q2 分区的 Applied Sciences。

RWKV 社区八月动态:RWKV7s 0.1B 发布,G0 13B 训练中,6 篇论文

MSFF-RWKV

论文名称:MSFF-RWKV : Single-Structure Multi-stage Feature Fusion Lightweight Super-Resolution Network 论文链接:https://link.springer.com/chapter/10.1007/978-981-96-9949-0_35 发布日期:2025-07-15

本文基于 RWKV 模型提出了一种轻量级图像超分辨率网络 MSFF-RWKV。通过单块多阶段特征融合策略,结合 LPP-Shift 和 ME-Shift 模块,显著减少了参数和计算复杂度,同时提升了图像重建质量。实验表明,该模型在 PSNR 和 SSIM 指标上优于现有方法,参数减少 26.6%。

该论文的模型非常优秀,已收录于 ICIC 2025。

RWKV 社区八月动态:RWKV7s 0.1B 发布,G0 13B 训练中,6 篇论文

Smooth Reading

论文名称:Smooth Reading: Bridging the Gap of Recurrent LLM to Self-Attention LLM on Long-Context Tasks 论文链接:https://arxiv.org/abs/2507.19353 发布日期:2025-07-25

本文基于 RWKV 模型提出 Smooth Reading 方法,这是一种分块推理策略,灵感来源于人类阅读方式。该方法将长上下文分成小块处理,迭代总结信息以减少内存需求,优化循环模型性能。实验显示,该方法在 LongBench 上提升性能高达 3.61%,并保持高效训练和推理速度,显著缩小与自注意力模型的差距。

RWKV 社区八月动态:RWKV7s 0.1B 发布,G0 13B 训练中,6 篇论文

PointDGRWKV

论文名称:PointDGRWKV: Generalizing RWKV-like Architecture to Unseen Domains for Point Cloud Classification 论文链接:https://arxiv.org/abs/2508.20835 发布日期:2025-08-28

本文介绍了 PointDGRWKV,首个针对点云分类域泛化 (DG PCC) 的 RWKV-based 框架。它解决了 RWKV 直接应用于点云时,固定方向 Token Shift 导致的几何扭曲和 Bi-WKV 注意力机制易受跨域差异影响的问题。PointDGRWKV 提出了自适应几何 Token Shift (AGT-Shift) 和跨域 Key 特征分布对齐 (CD-KDA) 模块,以增强局部几何建模和跨域鲁棒性,同时保持 RWKV 的线性效率,并在 DG PCC 基准上实现了先进性能。

RWKV 社区八月动态:RWKV7s 0.1B 发布,G0 13B 训练中,6 篇论文

社区市场活动

RWKV 团队参加全球互联网大会

2025 年 8 月 14 日,RWKV 团队参加全球互联网大会,详细介绍了 RWKV 模型最新进展。

RWKV 社区八月动态:RWKV7s 0.1B 发布,G0 13B 训练中,6 篇论文

加入 RWKV 社区

欢迎大家加入 RWKV 社区,可以从 RWKV 中文官网了解 RWKV 模型,也可以加入 RWKV 论坛、QQ 频道和 QQ 群聊,一起探讨 RWKV 模型。

? RWKV 中文文档:https://www.rwkv.cn ? RWKV 论坛:https://community.rwkv.cn/ ? QQ 频道:https://pd.qq.com/s/9n21eravc ? BiliBili 视频教程:https://space.bilibili.com/3546689096910933

源码地址:点击下载

以上就是RWKV 社区八月动态:RWKV7s 0.1B 发布,G0 13B 训练中,6 篇论文的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/359481.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月6日 02:15:26
下一篇 2025年11月6日 02:20:04

相关推荐

  • C++ 函数库与标准模板库的学习资源和社区支持

    学习资源:c++++ 标准库参考指南c++ 官网boost c++ 库stl cookbookc++ 常见面试问题社区支持:c++ 论坛stack overflow c++ 子论坛reddit c++ 子版块github c++ 代码库discord c++ 社区服务器 C++ 函数库与标准模板库的…

    2025年12月18日
    000
  • C++框架的团队协作最佳实践:提高工作效率

    通过遵守以下最佳实践,团队可以提高 c++++ 框架中的协作效率:使用版本控制系统,用于跟踪代码更改和协调协作。采用持续集成,以便及早发现问题并确保代码更改的稳定性。实施代码审查,以提高代码质量并减少错误。标准化代码风格,以增强可读性和消除混乱。建立清晰的沟通渠道和促进协作,以促进团队讨论和高效推进…

    2025年12月18日
    000
  • C++框架的社区资源:学习和支持渠道全攻略

    c++++ 框架的社区资源提供了学习和支持:论坛:stack overflow、c++ forum、boost forums教程和文档:cppcon、pluralsight、o’reilly media社区活动:c++ 用户组、meetups、github 组织实战案例:提供使用框架构建…

    2025年12月18日
    000
  • 如何将C++框架与深度学习集成

    将 c++++ 框架与深度学习集成可提升效率和算法能力,方法如下:安装 tensorflow c api 或 pytorch c++ api创建 c++ 项目加载深度学习模型:tensorflow 使用 loadsavedmodel,pytorch 使用 torch::jit::load集成深度学习…

    2025年12月18日
    000
  • 如何在 C++ 框架中集成持续集成和持续交付?

    在 c++++ 框架中集成持续集成和持续交付 (ci/cd) 包含以下步骤:代码更改触发 ci/cd 流程。ci 系统自动构建和测试代码。cd 系统将通过测试的代码部署到测试或生产环境。cd 系统监控应用程序并向开发人员提供反馈。 在 C++ 框架中集成持续集成和持续交付 持续集成 (CI) 和持续…

    2025年12月18日
    000
  • C++ 框架如何在跨平台场景中保持可扩展性和维护性?

    在 c++++ 开发中,框架可促进跨平台可扩展性和维护性:可扩展性:使用抽象类和接口实现平台无关的功能。利用代码生成工具自动化平台特定代码编写。组织代码为可重用模块以促进共享。维护性:应用统一的代码风格。进行单元测试以确保代码正确性。使用版本控制系统来跟踪更改并支持协作。实战案例:一个跨平台 gui…

    2025年12月18日
    000
  • C++框架与第三方代码的交互:确保兼容性和稳定性

    在 c++++ 开发中,与第三方代码交互时,最佳实践包括:使用版本控制和依赖关系管理工具,以跟踪版本和避免兼容性问题。通过抽象,创建一个隔离层,以减少与框架代码的耦合。确保接口兼容性,以避免编译或运行时错误。进行稳定性测试,以确保第三方代码与框架可靠地交互。建立持续集成管道,以快速检测和解决因第三方…

    2025年12月18日
    000
  • 如何衡量C++框架的学习进度?

    衡量 c++++ 框架学习进度的 5 个方法:完成任务:构建应用程序并实现功能,展示对框架基础知识的理解。问题解决:通过解决问题加深对框架的理解和底层原理的理解。代码阅读和比较:阅读示例代码并将其与自己的代码进行比较,发现知识差距。教程和文章:查找教程和文章,补充知识并获得不同视角。社区贡献:参与社…

    2025年12月18日
    000
  • C++框架如何简化团队协作?

    c++++ 框架通过以下方式简化团队协作:强制执行代码一致性,确保不同成员开发的代码保持一致。提供开箱即用的组件,减少重复劳动,提高开发效率。集成协作工具,简化项目管理和代码变更跟踪。通过标准化代码风格、重复利用组件和集成协作工具,c++ 框架可以极大地改善团队协作,减少合并冲突,提高代码质量,使团…

    2025年12月18日
    000
  • 如何将C++框架与HTML技术集成

    可无缝集成 c++++ 框架和 html,步骤如下:使用 web 服务器(如 apache)将 html 文件提供给客户端。在框架中设置路由表,映射 url 路径到 c++ 处理程序。c++ 处理程序接收来自客户端的 html 请求并生成响应。利用 c++ 框架的工具生成动态 html 响应。 如何…

    2025年12月18日
    000
  • C++框架如何管理代码版本控制和变更跟踪?

    c++++ 框架通过 git 和 ide 集成提供代码版本控制功能。此外,变更跟踪机制允许跟踪代码中的特定更改,这对于审查代码和修复问题很有用。例如,使用 qt creator 查看 git 历史记录并回滚错误的提交可以帮助解决内存泄漏问题。 C++ 框架中的代码版本控制和变更跟踪 在现代软件开发中…

    2025年12月18日
    000
  • 如何将C++框架与CSS技术集成

    在 c++++ 框架中集成 css 允许开发人员使用熟悉的 css 规则美化应用程序界面。步骤包括:安装 css 库(如 libcsspp、csspp、smile);添加一个 css 文件并定义样式规则;使用库函数将 css 文件应用到框架中。 在 C++ 框架中集成 CSS 技术 CSS(层叠样式…

    2025年12月18日
    000
  • C++框架如何解决跨团队开发的沟通问题?

    c++++ 框架通过实施以下措施解决跨团队开发的沟通问题:强制执行代码规范以确保一致的编码风格和标准。提供预定义的接口以消除对自定义接口的需求,从而减少误解。集中式代码存储库和自动化工具可以简化协作和提高代码质量。 C++ 框架如何通过提高沟通效率解决跨团队开发问题 跨团队开发的沟通问题是软件开发中…

    2025年12月18日
    000
  • 如何将C++框架与 DevOps工具集成?

    将 c++++ 框架与 devops 工具集成可提升效率:实施持续集成:选择 jenkins 等 ci 工具,配置构建管道以自动编译、测试和部署。集成代码审查:使用 gitlab 等工具定义审查规则,实现自动代码审查。自动化测试:使用 catch2 等框架创建测试用例,集成到 ci 管道中自动执行测…

    2025年12月18日
    000
  • C++ 框架集成中的故障排除和调试技巧

    故障排除技巧:启用日志记录以捕获错误信息。使用断点调试器暂停执行并检查变量。利用异常处理捕捉意外情况并记录或重新抛出。单元测试隔离问题并快速识别错误。分析核心转储以获取详细的错误上下文。 C++ 框架集成中的故障排除和调试技巧 在 C++ 应用程序中集成框架时,可能会遇到难以追踪的错误。为了高效解决…

    2025年12月18日
    000
  • 如何使用 DevOps 实践管理 C++ 框架的集成过程

    如何使用 devops 管理 c++++ 框架集成devops 实践通过使用流水线工具缩小开发和运维团队之间的差距,提高软件开发和交付的效率和质量。针对 c++ 框架集成,devops 实践具体包括:选择流水线工具:如 jenkins、gitlab ci/cd、azure devops。定义代码构建…

    2025年12月18日
    000
  • 如何管理C++框架与其他技术的升级和维护?

    要管理 c++++ 框架和技术组件的升级和维护,建议遵循以下步骤:使用版本控制跟踪更改。将组件锁定到特定版本以确保兼容性。利用自动化工具简化升级过程。使用分阶段方法逐步更新。进行彻底的测试以验证功能。 如何管理 C++ 框架与其他技术的升级和维护 在 C++ 中使用框架和库可以显著提高代码质量和开发…

    2025年12月18日
    000
  • c++如何使用第三方库

    C++ 中使用第三方库可扩展程序功能并提高开发效率。具体步骤包括:查找和选择库安装库包含头文件链接库好处包括代码重用、功能扩展、维护和更新,但应谨慎选择库并注意许可证条款和定期更新。 C++ 中使用第三方库 在 C++ 中使用第三方库是一种扩展程序功能和提高开发效率的常用方法。第三方库提供了预先编写…

    2025年12月18日
    000
  • C++框架在金融交易系统中的应用

    c++++ 框架广泛应用于金融交易系统,原因在于其高性能和对多线程的支持。受欢迎的框架包括 chronotrader 和 hft platform。一个实战案例演示了如何使用 chronotrader 为高频交易构建交易引擎,涉及设置项目、编写策略、配置事件循环、整合市场数据、发送订单以及监控和优化…

    2025年12月18日
    000
  • C++框架在嵌入式系统中的适配性

    c++++ 框架可显著提升嵌入式系统开发效率和可靠性,原因包括代码重用、模块化和可扩展性。选择框架时应考虑应用程序需求、支持平台和文档支持情况。面向嵌入式系统的 arduino-mbed 框架提供了丰富的库、低级内存管理和 arduino/mbed 平台集成。通过以下步骤安装、创建项目、编写代码并编…

    2025年12月18日
    000

发表回复

登录后才能评论
关注微信