在 Fastly 上使用 AI 构建“为您”推荐!

忘记炒作;人工智能在哪里创造真正的价值?让我们利用边缘计算来利用人工智能的力量,打造更智能、快速、安全、可靠的用户体验。

推荐无处不在,每个人都知道,使网络体验更加个性化可以使其更具吸引力和成功。 我的亚马逊主页知道我喜欢家居用品、厨具,现在还喜欢夏季服装:

在 Fastly 上使用 AI 构建“为您”推荐!

如今,大多数平台都让您在快速或个性化之间做出选择。在 fastly,我们认为您和您的用户应该同时拥有两者。 如果每次你的网络服务器生成一个页面,它只适合一个最终用户,你就无法从缓存中受益,而这正是像 fastly 这样的边缘网络做得很好的地方。

那么如何从边缘缓存中受益,同时使内容个性化? 我们之前写过很多关于如何将复杂的客户端请求分解为多个较小的、可缓存的后端请求的文章,您可以在我们的开发人员中心的个性化主题中找到教程、代码示例和演示。

但是,如果您想更进一步并在边缘生成个性化数据该怎么办? “边缘”——处理您网站流量的 fastly 服务器,是距离最终用户最近的点,且仍在您的控制范围内。一个制作特定于某个用户的内容的好地方。

“为你”用例

产品推荐本质上是短暂的,特定于单个用户,并且可能会经常变化。 但它们也不需要持续存在——我们通常不需要知道我们向每个人推荐了什么,只需要知道特定算法是否比其他算法实现了更好的转换。 一些推荐算法需要访问大量的状态数据,例如哪些用户与您最相似以及他们的购买或评分历史记录,但通常这些数据很容易批量预生成。

基本上,生成推荐通常不会创建事务,不需要数据存储中的任何锁,并利用可从当前用户会话立即可用的输入数据,或在离线构建过程中创建的输入数据。

听起来我们可以在边缘生成推荐!

一个现实世界的例子

我们来看看纽约大都会艺术博物馆的网站:

在 Fastly 上使用 AI 构建“为您”推荐!

大都会博物馆藏品中的 500,000 件左右的藏品中,每一件都有一个页面,上面有图片和相关信息。 它还具有相关对象的列表:

在 Fastly 上使用 AI 构建“为您”推荐!

这似乎使用了相当简单的分面系统来生成这些关系,向我展示同一艺术家的其他艺术品,或博物馆同一侧翼中的其他物体,或者也是由纸制成或起源于同一时期的其他物体.

这个系统的好处(从开发人员的角度来看!)是,由于它仅基于一个输入对象,因此可以预先生成到页面中。

如果我们想通过一系列基于最终用户浏览大都会网站时的个人浏览历史记录的推荐来增强这一点,而不仅仅是基于这个对象,该怎么办?

添加个性化推荐

我们可以通过很多方法来做到这一点,但我想尝试使用语言模型,因为人工智能现在正在发生,而且它与大都会现有的相关艺术品机制似乎工作的方式确实不同。 计划是这样的:

下载大都会博物馆的开放获取收藏数据集。通过语言模型运行它以创建向量嵌入 – 适合机器学习任务的数字列表。为生成的 50 万个向量(代表大都会艺术博物馆的艺术品)构建一个高性能相似性搜索引擎,并将其加载到 kv 存储中,以便我们可以从 fastly compute 中使用它。

完成所有这些后,当您浏览大都会博物馆的网站时,我们应该能够:

在 cookie 中跟踪您访问过的艺术品。查找这些艺术品对应的向量。计算代表您的浏览兴趣的平均向量。将其插入我们的相似性搜索引擎以查找最相似的艺术品。从 met 的对象 api 加载有关这些艺术品的详细信息,并通过个性化推荐来增强页面。

瞧,个性化推荐:

在 Fastly 上使用 AI 构建“为您”推荐!

好吧,让我们来分解一下。

Build AI Build AI

为您的业务构建自己的AI应用程序。不需要任何技术技能。

Build AI 28 查看详情 Build AI

创建数据集

met 的原始数据集是一个包含很多列的 csv,如下所示:

object number,is highlight,is timeline work,is public domain,object id,gallery number,department,accessionyear,object name,title,culture,period,dynasty,reign,portfolio,constituent id,artist role,artist prefix,artist display name,artist display bio,artist suffix,artist alpha sort,artist nationality,artist begin date,artist end date,artist gender,artist ulan url,artist wikidata url,object date,object begin date,object end date,medium,dimensions,credit line,geography type,city,state,county,country,region,subregion,locale,locus,excavation,river,classification,rights and reproduction,link resource,object wikidata url,metadata date,repository,tags,tags aat url,tags wikidata url1979.486.1,false,false,false,1,,the american wing,1979,coin,one-dollar liberty head coin,,,,,,16429,maker," ",james barton longacre,"american, delaware county, pennsylvania 1794–1869 philadelphia, pennsylvania"," ","longacre, james barton",american,1794      ,1869      ,,http://vocab.getty.edu/page/ulan/500011409,https://www.wikidata.org/wiki/q3806459,1853,1853,1853,gold,dimensions unavailable,"gift of heinz l. stoppelmann, 1979",,,,,,,,,,,,,,http://www.metmuseum.org/art/collection/search/1,,,"metropolitan museum of art, new york, ny",,,1980.264.5,false,false,false,2,,the american wing,1980,coin,ten-dollar liberty head coin,,,,,,107,maker," ",christian gobrecht,1785–1844," ","gobrecht, christian",american,1785      ,1844      ,,http://vocab.getty.edu/page/ulan/500077295,https://www.wikidata.org/wiki/q5109648,1901,1901,1901,gold,dimensions unavailable,"gift of heinz l. stoppelmann, 1980",,,,,,,,,,,,,,http://www.metmuseum.org/art/collection/search/2,,,"metropolitan museum of art, new york, ny",,,

足够简单,可以将其转换为两列,一个 id 和一个字符串:

id,description1,"one-dollar liberty head coin; type: coin; artist: james barton longacre; medium: gold; date: 1853; credit: gift of heinz l. stoppelmann, 1979"2,"ten-dollar liberty head coin; type: coin; artist: christian gobrecht; medium: gold; date: 1901; credit: gift of heinz l. stoppelmann, 1980"3,"two-and-a-half dollar coin; type: coin; medium: gold; date: 1927; credit: gift of c. ruxton love jr., 1967"

现在我们可以使用 hugging face ai 工具集中的 transformer 包,并生成每个描述的嵌入。 我们使用sentence-transformers/all-minilm-l12-v2模型,并使用主成分分析(pca)将结果向量减少到5维。 这会给你类似的东西:

[  {    "id": 1,    "vector": [ -0.005544120445847511, -0.030924081802368164, 0.008597176522016525, 0.20186401903629303, 0.0578165128827095 ]  },  {    "id": 2,    "vector": [ -0.005544120445847511, -0.030924081802368164, 0.008597176522016525, 0.20186401903629303, 0.0578165128827095 ]  },  …]

我们有 50 万个这样的数据集,因此不可能将整个数据集存储在边缘应用程序的内存中。 我们希望对这些数据进行自定义类型的相似性搜索,这是传统键值存储所不提供的。由于我们正在构建实时体验,因此我们也确实希望避免一次搜索 50 万个向量。

那么,让我们对数据进行分区。 我们可以使用 kmeans 聚类来对彼此相似的向量进行分组。 我们将数据分成 500 个不同大小的簇,并为每个簇计算一个称为“质心向量”的中心点。 如果您以二维方式绘制此向量空间并放大,它可能看起来有点像这样:

在 Fastly 上使用 AI 构建“为您”推荐!

红十字是每个向量簇的数学中心点,称为质心。它们可以像我们 50 万向量空间的寻路器一样工作。例如,如果我们想找到与给定向量 a 最相似的 10 个向量,我们可以首先寻找最近的质心(在 500 个质心中),然后仅在其相应的簇内进行搜索——这是一个更易于管理的区域!

现在我们有 500 个小数据集和一个将质心点映射到相关数据集的索引。 接下来,为了实现实时性能,我们想要预编译搜索图,这样我们就不需要在运行时初始化和构造它们,并且可以使用尽可能少的cpu时间。 一种非常快速的最近邻算法是分层可导航小世界(hnsw),它有一个纯 rust 实现,我们用它来编写我们的边缘应用程序。 因此,我们编写了一个小型独立 rust 应用程序来为每个数据集构建 hnsw 图结构,然后使用 bincode 将实例化结构的内存导出到二进制 blob。

现在,这些二进制 blob 可以加载到 kv 存储中,针对集群索引进行键控,并且集群索引可以包含在我们的边缘应用程序中。

这种架构允许我们按需将部分搜索索引加载到内存中。而且由于我们永远不需要一次搜索超过几千个向量,因此我们的搜索将始终廉价且快速。

构建边缘应用程序

我们在边缘运行的应用程序需要处理多种类型的请求:

html 页面: 我们从 metmuseum.org 获取这些内容并转换响应以添加额外的前端 和 标签,这样我们就可以注入一些我们自己的前端处理和内容fastly 脚本和样式资源 由这些额外标签引用,我们可以直接从边缘应用程序的二进制文件中提供服务。推荐端点,生成并返回推荐** 所有其他(非 html)请求: 图像以及大都会艺术博物馆自己的脚本和样式表,我们直接从其域代理,无需更改。

我们最初用 javascript 构建了这个应用程序,但最终将推荐部分移植到 rust,因为我们喜欢即时距离的 hnsw 实现。

客户端 javascript 做了一些有趣的事情:

使用 intersectionobserver,当用户将页面向下滚动到相关对象部分时,我们会触发一个事件。这是一个超级高效的 api,比使用 onscroll 等旧方法要好得多。获取我们的特别推荐 api 端点(然后我们可以在边缘处理并返回对象信息)使用客户端函数内置的模板编写一些 html将该 html 附加到页面并将交叉观察器移动到新元素,以便当您滚动浏览建议时,我们会不断加载更多内容。

这样,我们可以在不调用我们的推荐算法的情况下提供主要的 html 有效负载,但推荐的提供速度足够快,我们可以在您滚动时加载它们,并且当您到达它们时它们几乎肯定会在那里。

我喜欢以这种方式做事,因为尽快向用户提供第一个首屏视图绝对是最重要的。 除非滚动才能看到的任何内容都可以稍后加载,特别是如果它是复杂的个性化内容 – 如果用户不打算滚动,则生成它是没有意义的。

结束语

现在您拥有了两全其美的优势:能够提供高度个性化的内容,几乎不需要对源进行任何阻塞提取,并且优化的 html 有效负载可以以令人难以置信的速度呈现,从而使您的应用程序能够有效地享受无限的可扩展性和近乎完美的弹性.

这不是一个完美的解决方案。 如果 fastly 提供更多更高级别的功能来通过查询机制而不是简单的键查找来公开边缘数据(让我们知道这是否对您有帮助!),并且这种特定机制有明显的缺陷 – 如果我对以下方面有单独的兴趣两个或更多非常不同的东西(比如19世纪的油画和古罗马双耳瓶)我会得到建议,这将是这些之间的理论语义“中间点”,而不是一个非常有用的结果。

不过,希望这证明了一个原则,即弄清楚如何在边缘工作通常会在可扩展性、性能和弹性方面带来巨大的好处。

让我们知道您在community.fastly.com 上构建了什么!

以上就是在 Fastly 上使用 AI 构建“为您”推荐!的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/465358.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 05:13:12
下一篇 2025年11月8日 05:14:32

相关推荐

  • 理解 C/C++ 中的 char**

    在c++和c++中,char**是指向char类型的指针。它通常用于表示字符串数组,例如命令行参数 (argv)、动态字符串数组或每行都是一个字符串的二维数组。尽管一开始会令人困惑,但通过一些示例,您将看到它的操作方式与处理“字符串表”类似。 什么是 char* *?char* 是指向 char 的…

    2025年12月18日
    000
  • C++ 中如何正确声明和使用友元类

    友元类是一种可访问其他类私有成员的特殊类。声明友元类时使用 friend 关键字,如:friend class friendclass; 在友元类中,可通过作用域解析运算符 (::) 访问友元类的私有成员:friendclass::accessprivatemember(outer); 实战案例:在…

    2025年12月18日
    000
  • C++ 函数的 STL 迭代器有哪些?

    C++ 函数的 STL 迭代器 STL(标准模板库)迭代器是一个通用的机制,用于遍历容器中元素。C++ 函数支持几种 STL 迭代器类型,用于不同的目的。 类型 以下是 C++ 函数支持的常见 STL 迭代器类型: 输入迭代器 (InputIterator):只支持单向遍历,元素不可改变。输出迭代器…

    2025年12月18日
    000
  • 剖析 C++ 函数性能优化盲区,深入优化见真章

    优化 c++++ 函数性能需要识别并消除常见的盲区,包括:1. 过量内存分配;2. 复制操作;3. 函数调用开销;4. 缓存局部性;5. 分支错误预测。通过采用内存池、移动语义、内联函数、优化缓存访问和分支预测,可以显著提升函数性能。 剖析 C++ 函数性能优化盲区,深入优化见真章 优化 C++ 函…

    2025年12月18日
    000
  • 哪些 C++ 函数库函数是多线程安全的?

    c++++ 多线程安全库函数提供了多线程环境中的安全数据操作:std::atomic:提供原子类型,进行原子读取和写入操作,确保同时只有一个线程修改值。std::mutex:提供互斥量,允许线程独占访问共享资源,通过 lock() 和 unlock() 函数获取和释放。std::condition_…

    2025年12月18日
    000
  • 命名空间在 C++ 中如何嵌套?

    嵌套命名空间在 c++++ 中用于组织命名空间,允许将相关类、函数和变量分组在一起。嵌套命名空间的语法如下:通过 outer_namespace::inner_namespace 使用作用域解析运算符访问嵌套命名空间元素。通过 using namespace outer_namespace::inn…

    2025年12月18日
    000
  • C 代码片段:)

    数据类型 #include // struct datatypestruct person { char name[50]; int age; float salary;};// enum datatypeenum color {red, green, blue};int main() { // b…

    2025年12月18日
    000
  • 如何将 C++ 框架与物联网技术集成?

    将 c++++ 框架与物联网技术集成将 c++ 框架与 iot 技术集成至关重要,以互操作 iot 设备。qt 和 boost.asio 等流行框架可用于连接 iot 设备:qt:跨平台应用程序框架,提供广泛的 ui 控件、网络和传感器支持。boost.asio:c++ 库,用于异步网络编程,提供高…

    2025年12月18日
    000
  • C++ 框架支持可扩展性的最佳实践是什么?

    在构建可扩展的 c++++ 应用程序时,选择支持可扩展性的框架至关重要。以下最佳实践可以实现可扩展性:运用分层架构将应用程序解耦为不同的层,实现不同层独立修改和扩展。使用依赖注入灵活切换实现,而无需修改代码逻辑。提供接口而非实现,抽象底层实现,便于轻松切换实现。 C++ 框架支持可扩展性的最佳实践 …

    2025年12月18日
    000
  • 在C++框架集成中使用第三方库的优缺点?

    第三方库在 c++++ 框架集成中的优缺点:优点:功能扩展:提供丰富功能,如数据库连接、图像处理或机器学习算法。代码重用:节省开发时间,减少返工。性能优化:针对特定任务性能优化。社区支持:提供支持、文档和示例。缺点:依赖性管理:版本、更新和兼容性问题。代码维护:第三方库维护责任不在框架团队。授权问题…

    2025年12月18日
    000
  • 如何调试 C++ 框架中的跨团队协作问题?

    要调试跨团队协作问题,需要:理解代码库结构。使用调试器逐步执行代码。设置日志记录机制。编写单元测试以隔离问题。采取实战案例,设置日志记录和测试以识别问题并向团队报告。 如何在 C++ 框架中调试跨团队协作问题 在大型 C++ 框架的开发中,多个团队通常协作处理不同的模块。这可能会导致复杂的跨团队协作…

    2025年12月18日
    000
  • 如何确保C++框架扩展的安全性?

    可通过以下步骤确保 c++++ 框架扩展的安全性:1. 验证用户输入;2. 使用安全的库;3. 限制访问敏感信息;4. 处理异常;5. 实施代码审查。通过遵循这些步骤,您可以确保扩展代码的安全性和框架的整体完整性。 如何在确保 C++ 框架扩展的安全性? 在扩展 C++ 框架时,确保安全性至关重要。…

    2025年12月18日
    000
  • 如何将C++框架与Java集成?

    如何将 c++++ 框架与 java 集成?可以通过以下方法集成:java native interface (jni):使用 c 语言接口访问 c++ 框架。jna (java native access):使用 java 库调用 c++ 类和函数。 如何将 C++ 框架与 Java 集成 前言 …

    2025年12月18日
    000
  • 哪种C++框架最适合用于云原生开发?

    最流行的 c++++ 云原生框架包括 envoy(服务网格)、grpc(rpc 框架)和 kubernetes(编排平台)。envoy 提供负载均衡、服务发现和 tls 加密;grpc 支持高效的网络通信;kubernetes 提供容器化应用程序的协调和编排。通过使用这些框架,企业可以在云平台上构建…

    2025年12月18日
    000
  • 哪种C++框架最适合开发跨平台Web应用程序?

    最佳 c++++ 跨平台 web 应用程序框架包括:qt:提供用户界面和应用程序开发功能。poco:包含网络编程、数据存储和并发编程库。libcurl:用于网络应用程序开发的低级 c 语言库,也可通过 c++ 使用。 最佳 C++ 跨平台 Web 应用程序框架 在当今快节奏的数字世界中,开发跨平台 …

    2025年12月18日
    000
  • 如何使用C++框架在Web应用程序中实现实时通信?

    使用 c++++ 框架实现实时通信时,选择一个合适的框架至关重要,例如 websocket++、boost.asio 或 pistache。使用 websocket++ 作为示例,服务器端设置监听地址和端口,并使用 on_message 处理程序接收和广播消息。客户端设置连接和消息处理程序,连接到服…

    2025年12月18日
    000
  • 扩展C++框架时应该考虑哪些安全方面的因素?

    扩展 C++ 框架时的安全考量因素 扩展 C++ 框架需要仔细考虑安全隐患,以避免引入漏洞和使应用程序面临风险。以下是一些关键的安全考量因素,并提供了代码示例以供演示。 输入验证 验证用户输入以防止恶意输入攻击(例如 SQL 注入或跨站脚本攻击)。 // 验证用户电子邮件try {std::rege…

    2025年12月18日
    000
  • C++ 框架中的授权机制如何工作?

    c++++ 框架中的授权机制使用授权模型来控制对资源的访问和操作。这些模型包括角色模型,其中用户被分配到预定义的角色,以及访问控制列表 (acl),其中明确指定允许哪些用户执行哪些操作。在 rbac 模型中,用户被分配到具有特定权限集的角色。而在基于 acl 的授权中,权限被明确指定给单个用户或实体…

    2025年12月18日
    000
  • C++ 框架在云环境中的安全性挑战有哪些?

    在云环境中,c++++ 框架面临着 5 个安全性挑战:内存安全应对措施:使用智能指针和内存管理工具。安全编程实践应对措施:遵循安全编码准则,实施静态分析。第三方库安全风险应对措施:选择信誉良好的库,定期更新。资源泄露应对措施:实现资源回收机制。身份验证和授权应对措施:集成身份验证和授权框架,实施 r…

    2025年12月18日
    000
  • C++ 框架新手入门问答辑录:解决入门阶段困惑

    对于 c++++ 框架新手,boost 库或 qt 框架是不错的选择,可以简化开发过程。框架通过提供预先构建的组件节省时间和精力。管理框架依赖关系可使用 cmake 或 vcpkg 等工具。部署框架的方式取决于特定框架,可以静态或动态链接。调试异常时,可使用调试器和堆栈跟踪,并确保框架版本及依赖关系…

    2025年12月18日
    000

发表回复

登录后才能评论
关注微信