学好线性代数,玩转推荐系统

作者 | 汪昊

审校 | 重楼

说到21 世纪互联网的技术,除了 Python / Rust / Go 等一系列新型编程语言的诞生,信息检索技术的蓬勃发展也是一大亮点。互联网上第一个纯技术商业模式就是以谷歌和百度为代表的搜索引擎技术。然而让大家臆想不到的是,推荐系统诞生的年代也很久远。早在1992 年,人类历史上第一个推荐系统就以论文的形式发表出来了,而在这个时候,谷歌和百度还没有诞生。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

学好线性代数,玩转推荐系统

不像搜索引擎那样被人们认为是刚需,很快就诞生了许多独角兽。以推荐系统为核心技术的科技公司要等到2010 年代今日头条和抖音崛起后才会出现。毫无疑问,今日头条和抖音成为了推荐系统最成功的代表性公司。如果说第一代信息检索技术搜索引擎是美国人先发制人,那么第二代信息检索技术推荐系统就被牢牢的控制在中国人手里。而我们现在遇到了第三代信息检索技术—— 基于大语言模型的信息检索。目前来看先发者是欧美国家,但目前中美正在齐头并进。

近几年来,推荐系统领域的权威会议 RecSys 频频将最佳论文奖颁给序列推荐(Sequential Recommendation)。这说明该领域目前越来越重视垂直应用。而有一个推荐系统的垂直应用是如此重要,但至今都没有掀起滔天巨浪,这个领域就是基于场景的推荐(Context-aware Recommendation),简称CARS。我们偶尔会见到有些 CARS 的Workshop,但是这些Workshop 的论文每年不超过10 篇,门可罗雀。

CARS 可以用来干什么?首先CARS 已经被汉堡王等快餐公司使用。它还可以在用户驾驶汽车的时候,根据场景给用户推荐音乐。另外,我们可以畅想一下,我们有没有可能根据天气状况给用户推荐出行计划?抑或是根据用户的身体状况给用户推荐餐饮?其实,只要我们充分的发挥自己的想象力,总是能给CARS 找出不同的落地应用。

然而问题来了,既然CARS 的用途这么广泛,为什么这么少的人发表论文?原因很简单,因为CARS 几乎没有公开的数据集可以使用。目前最好用的 CARS 的公开数据集是来自斯洛文尼亚的LDOS-CoMoDa 数据集。除此之外,我们很难找到别的数据集合。LDOS-CoMoDa 利用调研的形式提供了用户观影时的场景数据,使得广大研究人员从事 CARS 研究成为了可能。数据公开的时间点在2012 年到2013 年左右,但是目前知道这个数据集合的人很少。

言归正传,本文主要介绍MatMat / MovieMat 算法和PowerMat 算法。这些算法都是用来解决 CARS 问题的利器。我们先来看一下MatMat 是如何定义CARS 问题的:我们首先重新定义用户评分矩阵,我们把用户评分矩阵的每一个评分值替换成方阵。方阵的对角线元素是原始的评分值,非对角线元素都是场景信息。

学好线性代数,玩转推荐系统

我们下面定义 MatMat 算法的损失函数,该函数修改了经典的矩阵分解损失函数,形式如下:

学好线性代数,玩转推荐系统

其中 U 和V 都是矩阵。我们通过这种方式,改变了原始的矩阵分解中的向量点乘。将向量点乘变成了矩阵乘法。我们举下面一个例子来看:

学好线性代数,玩转推荐系统

我们在MovieLens Small Dataset 上做一下性能对比实验,得到如下结果:

学好线性代数,玩转推荐系统

可以看到,MatMat 算法的效果优于经典的矩阵分解算法。我们再来检查一下推荐系统的公平性:

学好线性代数,玩转推荐系统

可以看到,MatMat 在公平性指标上表现依然不遑多让。MatMat 的求解过程较为复杂,即便是发明算法的作者本人,也没有在论文中写出推导过程。但是俗话说的好,学好线性代数,走遍天下都不怕。相信聪明的读者自己一定能推导出相关的公式,并实现这个算法。MatMat 算法论文的原文地址可以在下面的链接找到:https://www.php.cn/link/9b8c60725a0193e78368bf8b84c37fb2 。这篇论文是国际学术会议IEEE ICISCAE 2021 最佳论文报告奖。

MatMat 算法被应用在了基于场景的电影推荐领域,该算法的电影实例被命名为MovieMat。MovieMat 的评分矩阵是按照如下方法定义的:

学好线性代数,玩转推荐系统

作者随后做了对比实验:

学好线性代数,玩转推荐系统

在LDOS-CoMoDa 数据集合上,MovieMat 取得了性能远高于经典矩阵分解的效果。下面我们来观察一下公平性的测评结果:

学好线性代数,玩转推荐系统

在公平性方面,经典矩阵分解取得了优于MovieMat 的结果。MovieMat 的原始论文可以在下面的链接找到:https://www.php.cn/link/f4ec6380c50a68a7c35d109bec48aebf

我们有的时候会遇到这样的问题。我们新到了一个地点,光有场景数据,而没有用户评分数据该怎么办?不要紧,Ratidar Technologies LLC (北京达评奇智网络科技有限责任公司) 发明了基于零样本学习的 CARS 算法—— PowerMat。PowerMat 的原始论文可以在下面的链接找到:https://www.php.cn/link/1514f187930072575629709336826443

PowerMat 的发明人借用了MAP 和DotMat,定义了如下的MAP 函数:

学好线性代数,玩转推荐系统

其中U 是用户特征向量、V 是物品特征向量、R 是用户评分值,而C 是场景变量。具体的,我们得到如下公式:

学好线性代数,玩转推荐系统

利用随机梯度下降对该问题进行求解,我们得到下述公式:

学好线性代数,玩转推荐系统

通过观察,我们发现在这组公式里没有出现任何输入数据相关的变量,因此 PowerMat 是仅与场景相关的零样本学习算法。该算法可以应用在如下场景:游客打算去某地旅游,但是从来没有去过当地,因此只有天气等场景数据,我们可以利用 PowerMat 给游客推荐打卡景点等等。

下面是PowerMat 和其他算法的对比数据:

学好线性代数,玩转推荐系统

通过这张图,我们发现PowerMat 和MovieMat 旗鼓相当,不分伯仲,并且效果都要优于经典的矩阵分解算法。而下面这张图显示,即使是在公平性指标方面,PowerMat 依旧表现强劲:

学好线性代数,玩转推荐系统

通过对比实验,我们发现PowerMat 是优秀的CARS 算法。

互联网的数据工程师经常说数据高于一切。并且在2010 年代左右互联网有一股强劲的看好数据看衰算法的风气。CARS 是个很好的例子。因为绝大多数人得不到相关数据,因此这个领域的发展一直受到了很大的限制。感谢斯洛文尼亚的研究人员公开了 LDOS-CoMoDa 数据集合,使得我们有机会发展这个领域。我们也希望有越来越多的人关注 CARS,落地 CARS,为 CARS 融资……

作者简介

汪昊,前Funplus 人工智能实验室负责人。曾在ThoughtWorks、豆瓣、百度、新浪等公司担任技术和技术高管职务。在互联网公司和金融科技、游戏等公司任职13 年,对于人工智能、计算机图形学和区块链等领域有着深刻的见解和丰富的经验。在国际学术会议和期刊发表论文42 篇,获得IEEE SMI 2008 最佳论文奖、ICBDT 2020 / IEEE ICISCAE 2021 / AIBT 2023 / ICSIM 2024 最佳论文报告奖。

以上就是学好线性代数,玩转推荐系统的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/425099.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月7日 11:04:38
下一篇 2025年11月7日 11:10:10

相关推荐

  • 怎样用免费工具美化PPT_免费美化PPT的实用方法分享

    利用KIMI智能助手可免费将PPT美化为科技感风格,但需核对文字准确性;2. 天工AI擅长优化内容结构,提升逻辑性,适合高质量内容需求;3. SlidesAI支持语音输入与自动排版,操作便捷,利于紧急场景;4. Prezo提供多种模板,自动生成图文并茂幻灯片,适合学生与初创团队。 如果您有一份内容完…

    2025年12月6日 软件教程
    000
  • 助力工业转型升级金士顿工博会大放异彩

    在刚刚落幕的第二十五届中国国际工业博览会(简称“工博会”)上,参会嘉宾或满载而归,或回味无穷,但无一例外地达成了一项共识——人工智能正深度赋能新型工业化,中国制造业正从“制造”迈向“智造”,并在转型升级之路上取得了令人瞩目的成就。 工业变革的核心在于技术架构的重塑与关键技术的支撑。当现代工业逐步演进…

    2025年12月6日 行业动态
    000
  • 英特尔Q3财报:终于扭亏为盈 净利润41亿美元

    当地时间23日,美国芯片巨头英特尔发布了2025年第三季度财报,宣布公司成功实现盈利,终结了连续六个季度的亏损局面。这是英特尔在美国政府注资后发布的首份季度财报,营收和净利润双双超出市场预期,净利润高达41亿美元,与去年同期166亿美元的净亏损形成鲜明对比。受此利好消息影响,英特尔美股盘后股价大涨约…

    2025年12月6日 行业动态
    000
  • BLG抖音账号简介里的成员ID被删除!打完要解散了?

    昨日,在《英雄联盟》s15瑞士轮的第五轮比赛中,tes以2-1战胜blg,成功挺进2025全球总决赛淘汰赛,而blg则遗憾止步于此。 根据多位网友在微博上分享的信息,BLG战队因未知原因将其抖音账号个人简介中的队员名字(陈泽彬、杨陵、卓定、赵嘉豪、骆文俊)全部移除,并出现了粉丝数量下滑的现象。截至目…

    2025年12月6日 游戏教程
    000
  • 蚂蚁开源 Ring-1T,成就推理、编程、通用智能三冠王

    ai 能不能真正“动脑子”?这个问题有了新答案。 蚂蚁开源团队推出的 Ring-1T 模型,为这个长期存在的疑问提供了最具说服力的实证。不同于以往依赖海量数据“记忆”答案的语言模型,Ring-1T 试图让 AI 在复杂问题中真正“推理”出答案。 它通过强化学习与多阶段推理机制的结合,使模型能够在反馈…

    2025年12月6日 科技
    000
  • 小米14 Ultra系统更新卡顿 小米14 Ultra升级修复教程

    小米14 Ultra更新后卡顿多因系统适配和缓存问题,可通过清理存储、清除应用缓存、重启手机缓解;进一步进入开发者选项调快动画、限制后台进程,并开启强制GPU渲染、关闭内存扩展及管理自启动应用以提升流畅度;若无效可尝试修复系统或恢复出厂设置,通常能恢复正常体验。 小米14 Ultra在系统更新后出现…

    2025年12月6日 手机教程
    000
  • AIGC免费检测入口 知网官网查重直达链接

    知网个人查重需付费,官方入口为https://cx.cnki.net,支持查重及AIGC检测,费用1.5元/千字符,登录官网上传文档并支付即可获取报告。 ☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜ 知网官方目前不提供完全免费的AIGC检测…

    2025年12月6日 科技
    000
  • 抖音月付关闭方法教程

    如何关闭抖音月付功能 1、进入个人中心‌: 启动抖音应用,点击屏幕右下角的“我”,然后点击右上角的“三条横线”菜单按钮。‌‌ 2、进入钱包管理‌: 在菜单中选择“我的钱包”,进入后找到并点击“抖音月付”选项。‌‌ SuperDesign 开源的UI设计AI智能体 216 查看详情 3、申请关闭服务‌…

    2025年12月6日 软件教程
    000
  • 突然就“推理 Agent 元年”了,再聊 AI Chat 与 AI Agent

    今年 3 月份,我们还在以为 ai agent 的新纪元需要等到“泛 agi”,依靠大模型自身的能力和与之相辅相成的一系列技术的发展,诸如 rag、调用链等,去将大模型的能力更深入地“外置”给 agent 单元体。 然而到了下半年,随着大模型自身推理能力的爆发,以及生态中 MCP、ACP、A2A、上…

    2025年12月6日 行业动态
    000
  • 《最终幻想7》重制版三部曲制作人:创作者应努力做出比AI更好的游戏!

    《最终幻想7重制版》系列的导演滨口直树近日在接受国外媒体采访时,就生成式人工智能(AI)在游戏制作中的角色发表了看法。他明确表示,自己不会在创作过程中依赖AI,并强调人类创作者应始终掌握创意主导权。 尽管目前史克威尔艾尼克斯尚未出台关于AI使用的正式规范,滨口直树仍坚定地表示,在他负责的项目中,AI…

    2025年12月6日 行业动态
    000
  • AI推文助手如何制作行业白皮书 AI推文助手的专业报告生成

    首先明确白皮书主题与受众,确定行业领域及读者特征,并输入关键词引导AI生成;接着构建包含执行摘要、市场背景等模块的结构化框架,合理分配字数比例并分段指令生成;随后提供权威数据来源与可视化提示,增强内容可信度;再通过设定语言风格与专业术语表,提升文本专业性;最后采用分章节生成与人工校验相结合的方式,确…

    2025年12月6日 科技
    000
  • 抖音怎么挂自己的点单小程序

    在当前的数字化浪潮中,社交平台已成为品牌推广与商品销售的重要阵地。作为国内领先的短视频平台,抖音的活跃用户已突破1.5亿大关,为各类商家提供了广阔的营销空间。借助抖音平台,商家不仅能有效传播品牌形象,还能通过接入点单小程序,提升用户的购买效率和体验感。 什么是点单小程序? 点单小程序是一种基于微信生…

    2025年12月5日
    000
  • 喜茶微信点单怎么用抖音券:详细教程及优惠攻略

    【引言】 作为新式茶饮的领军品牌,喜茶凭借其高品质原料与持续创新的产品赢得了广大消费者的喜爱。为提升服务效率与用户体验,喜茶全面上线了微信小程序点单功能,让用户无需排队即可完成下单。与此同时,喜茶携手抖音平台推出专属优惠活动——抖音券,进一步降低消费门槛。本文将为您全面解析如何在喜茶微信点单时使用抖…

    2025年12月5日
    000
  • 抖音的私信定位在哪里?私信功能有什么作用?

    作为广受欢迎的社交平台,抖音中的私信功能是用户沟通的重要方式之一。然而不少刚接触抖音的朋友常常困惑:私信到底在哪?它又能用来做什么? 一、抖音私信入口在哪里? 其实,抖音的私信入口设计得十分直观,主要分布在手机App和电脑端两个场景中。 手机端抖音App 这是大多数用户使用的操作方式,主要有两个常用…

    2025年12月5日
    000
  • 抖音网页版能切换账号吗_抖音网页版多账号切换技巧

    抖音网页版可切换账号,已登录用户点击右上角头像,选择“添加账号”并登录新号即可保存;切换时点击头像,在账号列表中选择目标账号,页面自动刷新进入,操作快捷,适合多账号管理。 抖音网页版当然可以切换账号,操作很简单。只要你已经登录过一个账号,就能快速添加并来回切换其他账号,方便管理多个主页或工作账号。 …

    2025年12月5日
    100
  • 什么是抖音LIVE礼物以及它们如何运作?抖音LIVE

    抖音LIVEGifts是抖音上的一项便捷功能,可让观看者对您的视频做出反应,表达对您努力的赞赏。这是新兴抖音用户在平台上赚钱的更流行的方式之一,并有助于流行的抖音表演者现在可以从他们的内容中获得健康的收入。如果您想知道可以从抖音帐户中赚多少钱,请使用我们的奖金抖音影响者收入估算器查看抖音ers赚多少…

    2025年12月5日
    000
  • 鲍师傅抖音外卖怎么点单

    鲍师傅抖音外卖是一款广受用户喜爱的线上订餐平台,为消费者提供了高效便捷的用餐解决方案。接下来,我们将从多个方面详细介绍如何在该平台上顺利下单。 1. 获取并安装鲍师傅抖音外卖App 首先,请打开您手机上的应用商店(如苹果App Store或安卓各大市场),搜索“鲍师傅抖音外卖”,下载并完成安装。安装…

    2025年12月5日
    000
  • 抖音店铺订单退货率查看方法

    近年来,抖音店铺作为新兴的电商渠道迅速崛起,受到越来越多商家和消费者的青睐。对于卖家而言,掌握并监控店铺的订单退货率至关重要。本文将从多个维度详细讲解如何查看抖音店铺的订单退货率。 认识抖音店铺订单退货率 在实际操作之前,首先需要明确什么是订单退货率。它指的是在指定统计周期内,发生退货的订单数占总订…

    2025年12月5日
    000
  • 抖音电商带货平台收费解析 | 抖音带货成本详解

    一、引言 随着抖音在短视频行业的迅猛发展,越来越多品牌商家与内容创作者纷纷投身于抖音电商带货行列。那么,抖音是否对带货行为收取费用?本文将围绕抖音带货的成本构成、平台抽成机制以及直播销售模式等方面进行全面解读。 二、抖音电商带货的主要成本 1. 平台入驻是否收费? 目前,抖音电商平台对入驻主体不收取…

    2025年12月5日
    000
  • 华莱士抖音团购怎么提前点单

    近年来,抖音团购逐渐成为大众热衷的消费方式,吸引了众多品牌入驻。作为广受喜爱的快餐品牌之一,华莱士也已上线抖音团购服务,为用户带来更高效、实惠的用餐选择。本文将详细讲解如何在华莱士抖音团购中实现提前点单,助你轻松抢购心仪套餐。 华莱士抖音团购是什么 华莱士抖音团购即通过其官方抖音账号选购餐品的一种新…

    2025年12月5日
    000

发表回复

登录后才能评论
关注微信