OneRec— 快手推出的端到端生成式推荐系统

程序猿 • 2025年11月5日 13:22:05 • 用户投稿 • 阅读 0

onerec 是快手开发的全新端到端生成式推荐系统。该系统基于编码器-解码器结构，引入稀疏 mixture-of-experts（moe）机制，以增强模型容量并维持高效的计算效率。与传统级联式推荐系统不同，onerec 采用会话式生成策略，能够输出上下文一致的推荐内容，并通过迭代偏好对齐模块结合直接偏好优化（dpo）来进一步提升推荐质量。在训练流程中，onerec 将多模态信息量化为 token 序列输入模型，采用两阶段训练方式：首先进行基础 item 预测任务训练，随后利用 dpo 进行偏好对齐。

文心快码

文心快码（Comate）是百度推出的一款AI辅助编程工具

35 查看详情

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

OneRec的核心功能

端到端生成式架构：OneRec 使用编码器-解码器结构，将推荐问题转化为序列生成任务。编码器整合用户的历史行为数据，解码器则借助稀疏混合专家（MoE）结构逐步生成可能感兴趣的视频内容。会话式生成方法：区别于传统的单点预测方式，OneRec 创新性地提出会话式生成机制，可生成完整的推荐列表，从而更有效地捕捉上下文关系。实验验证与性能提升：在快手平台进行的在线 A/B 测试显示，OneRec 带来了 1.6% 的观看时长增长，在多项指标上优于传统方法。

OneRec的技术机制

编码器-解码器结构：OneRec 采用 Encoder-Decoder 框架，把推荐任务建模为序列生成问题。编码器提取用户全生命周期行为特征，解码器使用稀疏 MoE 架构逐个生成候选视频。该方式能更好地追踪用户兴趣演变，并输出连贯的推荐结果。多模态分词机制：OneRec 首创协同感知的多模态分词方案，融合视频标题、标签、语音识别、图像理解等多源信息，转换为分层语义 ID，实现更精细的兴趣建模。强化学习偏好对齐：系统引入奖励驱动的偏好对齐机制，通过强化学习提升模型表现。模型综合运用偏好奖励、格式奖励和业务目标构建复合奖励体系，优化生成推荐序列。有助于更准确把握用户的深层偏好，提高推荐相关性。性能优化设计：通过对架构的重构，大幅减少关键算子数量，并借助稀疏 MoE 扩展模型规模，显著提高了计算效率。经过训练与推理优化，系统实现了更高的浮点运算利用率（MFU），从而提升了整体算力效率。

OneRec的项目链接

arXiv技术论文：https://www.php.cn/link/185c61d8cf01c01ddf5f7ba337f72084

OneRec的应用领域

短视频推荐：在快手短视频主场景中，OneRec 承担约 25% 的请求流量（QPS）。依托生成式结构与偏好对齐机制，在用户停留时间、点赞、评论、关注等互动指标方面均有明显提升。本地生活服务：在本地生活场景中，OneRec 同样展现出卓越效果。AB 实验结果显示，推动交易总额（GMV）增长 21.01%，订单量提升 17.89%，购买用户数增加 18.58%，新增用户获取效率提升 23.02%。直播内容匹配：系统被应用于直播推荐场景，通过动态生成推荐序列，精准匹配用户实时兴趣，显著提升用户参与度与互动频率。广告投放：在广告推荐方面，OneRec 的生成式结构可根据用户行为动态生成广告推荐内容，有效提高广告点击率与转化效果。

以上就是OneRec— 快手推出的端到端生成式推荐系统的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/329051.html

区别快手

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

浅析laravel中.env文件的使用方法

上一篇 2025年11月5日 13:22:03

剪视频新选择 Premiere 将在本月登陆 iPhone 与 iPad 平台

下一篇 2025年11月5日 13:22:27

用户投稿

composer require-dev和require有什么不同_Composer Require与Require-Dev区别解析

require用于声明项目运行必需的依赖，如框架、数据库组件和第三方SDK，这些包会随项目部署到生产环境；2. require-dev用于声明仅在开发和测试阶段需要的工具，如PHPUnit、PHPStan、Faker等，不会默认部署到生产环境；3. 安装时composer install根据环境决定…

程序猿
2026年5月10日
10000
用户投稿

php常量怎么用_PHP常量（define/const）定义与使用方法

PHP中可通过define函数和const关键字定义常量，用于存储不可变值。define适用于全局作用域，支持动态名称和条件定义，如define(‘SITE_NAME’, ‘MyWebsite’)；const在编译时生效，语法简洁但限制多，只能在类或全…

程序猿
2026年5月10日
0000
用户投稿

Go语言接口与切片：如何识别和操作[]interface{}

本文将深入探讨Go语言中如何识别和操作`[]interface{}`类型的切片。我们将介绍类型断言（Type Assertion）的关键作用，并通过`switch`语句演示如何安全地检测`[]interface{}`类型，并进而遍历其内部元素。文章旨在提供清晰的示例代码和专业指导，帮助开发者有效地处…

程序猿
2026年5月10日
0000
用户投稿

c++中头文件和源文件的区别_c++头文件与源文件作用对比

头文件声明接口，源文件实现逻辑。头文件含类、函数声明及宏定义，通过#include被多文件共享，用include守卫防重；源文件实现具体功能，编译为目标文件后由链接器合并。声明与实现分离提升模块化与编译效率，模板和内联函数因需编译时可见故常置于头文件，命名空间避免符号冲突，整体结构使项目更清晰易维护…

程序猿
2026年5月10日
0000
用户投稿

Go语言中复制数组的几种方法详解

本文介绍了在 Go 语言中复制数组和切片的几种方法，重点讲解了内置的 `copy` 函数的使用方式，以及在多维切片场景下深拷贝与浅拷贝的区别，并提供了相应的代码示例。通过本文，你将掌握在不同场景下选择合适的复制方法，避免潜在的陷阱。在 Go 语言中，复制数组和切片是一个常见的操作。根据不同的需求，…

程序猿
2026年5月10日
0000
用户投稿

解决PHP foreach循环中变量“继承”问题：理解与避免意外数据泄露

本文探讨PHP foreach循环中一个常见的陷阱：当循环内部的数组或变量未被显式初始化时，其值可能会“继承”自上一次循环迭代，导致意外的数据泄露和逻辑错误。文章将深入分析这一现象的根源，并通过示例代码展示如何通过在每次迭代开始时正确初始化变量来解决此问题，确保代码行为的预期一致性。引言：fore…

程序猿
2026年5月10日
1000
用户投稿

Pandas：基于条件和 Groupby 替换列中的特定字符

本文介绍了如何使用 Pandas 库，结合 groupby 函数和字符串操作，根据特定条件替换 DataFrame 列中的字符。通过累积计数和字典映射，能够灵活地修改列中的特定部分，并根据替换值调整相关文本，实现数据清洗和转换的目的。在数据分析和处理中，经常需要根据特定条件修改 DataFrame…

程序猿
2026年5月10日
0000
用户投稿

Go语言中sync.WaitGroup的深度解析与实践

sync.WaitGroup是Go语言中用于并发编程的重要同步原语，它允许主协程等待一组子协程执行完毕。本文将深入探讨WaitGroup的工作原理、典型使用模式及其与sync.Mutex等其他同步机制的区别，并通过实际代码示例，帮助读者掌握其在并发控制中的应用，避免常见的误区，确保并发程序的正确性和…

程序猿
2026年5月10日
0000
用户投稿

HTML文档脚本怎么加载_HTML加载JavaScript教程

脚本应优先通过defer或async异步加载以避免阻塞渲染；将脚本放在body底部可防阻塞，但推荐使用defer确保DOM解析完成后再执行；async适用于独立脚本，defer用于依赖DOM或需顺序执行的脚本；优化方式包括代码分割、懒加载、CDN加速和浏览器缓存；加载失败时应重试、降级处理并监控错误…

程序猿
2026年5月10日
0000
用户投稿

Python怎么实现一个上下文管理器_Python上下文管理器协议实现

自定义Python上下文管理器需实现__enter__和__exit__方法，前者在进入with块时获取资源并返回对象，后者在退出时释放资源并可处理异常；通过类或contextlib.contextmanager装饰生成器函数均可创建；文件操作中with open()自动关闭文件是典型应用；__ex…

程序猿
2026年5月10日
0000
用户投稿

JavaScript解释器_javascript代码执行

JavaScript通过引擎解析执行，先语法分析生成AST，再编译为字节码或机器码，最后执行；执行时创建上下文并入栈，同步代码直接运行，异步任务由API处理后回调入队，事件循环在调用栈空时将回调推入执行；此机制解释了变量提升、暂时性死区及宏任务与微任务执行顺序差异。 JavaScript代码的执行依…

程序猿
2026年5月10日
0000
CSS的display属性有哪些值？inline和block有什么区别？

css的display属性通过定义元素的显示方式来控制网页布局。1.block元素独占一行，可设置宽高，默认如div、p等；2.inline元素不独占行，宽高由内容决定，如span、a；3.inline-block兼具block和inline特性，可并排显示且能设尺寸；4.none隐藏元素且不占空间…

程序猿
2026年5月10日 • 用户投稿
0000
用户投稿

C++怎么使用静态库和动态库_C++链接静态库与动态库的方法与区别

静态库在编译时链接，生成独立可执行文件；动态库运行时加载，节省内存。1. 静态库用ar打包.o文件为.a，编译时通过-L和-l链接；2. 动态库需-fPIC编译生成.so，运行前配置LD_LIBRARY_PATH或系统路径；3. 静态库体积大但部署方便，动态库共享内存利于更新。在C++项目开发中，…

程序猿
2026年5月10日
0000
用户投稿

HTML Class属性详解：多类名与命名规范

HTML中的class属性用于为元素应用样式和行为。理解不同类型的类名定义方式至关重要，特别是单类名（如class=”name”或class=”name-new”）和多类名（如class=”name new”）之间的区别。核心在…

程序猿
2026年5月10日
1000
用户投稿

c++中&的作用引用与取地址运算符区别解析

在c++++中，&amp;amp;amp;符号既可以作为引用运算符，也可以作为取地址运算符。1) 作为引用运算符时，&amp;amp;amp;用于创建变量的别名，常用于函数参数和返回值，提高效率。2) 作为取地址运算符时，&amp;amp;amp;返回…

程序猿
2026年5月10日
1000
用户投稿

HTML代码怎么实现响应式布局_HTML代码响应式布局原理与媒体查询应用

响应式布局的核心原理是“一次开发，多端适应”，其本质在于通过弹性网格、流式图片和CSS媒体查询等技术，使网页能根据设备屏幕尺寸、分辨率等特性动态调整布局与内容呈现。与传统固定宽度布局不同，响应式设计采用相对单位（如%、rem、vw）、灵活的图片处理及媒体查询，实现移动端优先、自适应多设备的连续体验。…

程序猿
2026年5月10日
0000
用户投稿

为什么 TypeScript 比 JavaScript 更好

javascript 长期以来一直是 web 开发的基石，支持从小型脚本到大型应用程序的各种项目。然而，随着项目规模的扩大，javascript 的动态类型和缺乏结构性可能会成为开发的瓶颈。typescript 应运而生，它凭借静态类型检查和强大的工具集，迅速成为许多开发者构建可靠、可扩展应用程序的…

程序猿
2026年5月10日
1000
HTML如何制作网格布局？grid和flexbox的区别？

要制作真正的网格布局应首选css grid，因为它是专为二维布局设计的工具，能同时控制行和列；而flexbox适用于一维线性布局，适合沿单一轴线排列内容。1. 使用css grid时，先设置容器的display: grid，再通过grid-template-columns和grid-template…

程序猿
用户投稿 2026年5月10日
0000
用户投稿

JavaScript模块化是什么_ES6模块和CommonJS有什么区别呢

JavaScript模块化将代码拆分为独立可复用单元，ES6模块（import/export，编译时加载、实时引用）与CommonJS（require/module.exports，运行时加载、值拷贝）核心区别在于设计目标和运行机制不同。 JavaScript模块化是把代码按功能拆分成独立、可复用的…

程序猿
2026年5月10日
0000
用户投稿

C++STL算法merge和inplace_merge使用技巧

merge用于合并两个有序区间到新空间，inplace_merge则原地合并同一容器内两个连续有序段；前者需额外存储空间，后者在原容器操作，适用于归并排序的合并阶段，二者均要求输入有序，时间复杂度为O(N+M)，合理使用可提升效率。在C++标准模板库（STL）中，merge 和 inplace_m…

程序猿
2026年5月10日
0000