onerec 是快手开发的全新端到端生成式推荐系统。该系统基于编码器-解码器结构,引入稀疏 mixture-of-experts(moe)机制,以增强模型容量并维持高效的计算效率。与传统级联式推荐系统不同,onerec 采用会话式生成策略,能够输出上下文一致的推荐内容,并通过迭代偏好对齐模块结合直接偏好优化(dpo)来进一步提升推荐质量。在训练流程中,onerec 将多模态信息量化为 token 序列输入模型,采用两阶段训练方式:首先进行基础 item 预测任务训练,随后利用 dpo 进行偏好对齐。
文心快码
文心快码(Comate)是百度推出的一款AI辅助编程工具
35 查看详情
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜
OneRec的核心功能
端到端生成式架构:OneRec 使用编码器-解码器结构,将推荐问题转化为序列生成任务。编码器整合用户的历史行为数据,解码器则借助稀疏混合专家(MoE)结构逐步生成可能感兴趣的视频内容。会话式生成方法:区别于传统的单点预测方式,OneRec 创新性地提出会话式生成机制,可生成完整的推荐列表,从而更有效地捕捉上下文关系。实验验证与性能提升:在快手平台进行的在线 A/B 测试显示,OneRec 带来了 1.6% 的观看时长增长,在多项指标上优于传统方法。
OneRec的技术机制
编码器-解码器结构:OneRec 采用 Encoder-Decoder 框架,把推荐任务建模为序列生成问题。编码器提取用户全生命周期行为特征,解码器使用稀疏 MoE 架构逐个生成候选视频。该方式能更好地追踪用户兴趣演变,并输出连贯的推荐结果。多模态分词机制:OneRec 首创协同感知的多模态分词方案,融合视频标题、标签、语音识别、图像理解等多源信息,转换为分层语义 ID,实现更精细的兴趣建模。强化学习偏好对齐:系统引入奖励驱动的偏好对齐机制,通过强化学习提升模型表现。模型综合运用偏好奖励、格式奖励和业务目标构建复合奖励体系,优化生成推荐序列。有助于更准确把握用户的深层偏好,提高推荐相关性。性能优化设计:通过对架构的重构,大幅减少关键算子数量,并借助稀疏 MoE 扩展模型规模,显著提高了计算效率。经过训练与推理优化,系统实现了更高的浮点运算利用率(MFU),从而提升了整体算力效率。
OneRec的项目链接
arXiv技术论文:https://www.php.cn/link/185c61d8cf01c01ddf5f7ba337f72084
OneRec的应用领域
短视频推荐:在快手短视频主场景中,OneRec 承担约 25% 的请求流量(QPS)。依托生成式结构与偏好对齐机制,在用户停留时间、点赞、评论、关注等互动指标方面均有明显提升。本地生活服务:在本地生活场景中,OneRec 同样展现出卓越效果。AB 实验结果显示,推动交易总额(GMV)增长 21.01%,订单量提升 17.89%,购买用户数增加 18.58%,新增用户获取效率提升 23.02%。直播内容匹配:系统被应用于直播推荐场景,通过动态生成推荐序列,精准匹配用户实时兴趣,显著提升用户参与度与互动频率。广告投放:在广告推荐方面,OneRec 的生成式结构可根据用户行为动态生成广告推荐内容,有效提高广告点击率与转化效果。
以上就是OneRec— 快手推出的端到端生成式推荐系统的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/329051.html
微信扫一扫
支付宝扫一扫

