深度学习中余弦相似度为1的常见原因及调试指南

程序猿 • 2025年12月14日 14:57:25 • 好文分享 • 阅读 0

本教程深入探讨了在深度学习任务中，即使输入张量看似不同，余弦相似度仍可能计算为1的常见原因。文章解释了余弦相似度仅衡量向量方向而非幅度的特性，并通过分析代码示例揭示了导致向量完全对齐的多种情况，包括直接赋值和模型输出的特性。同时，提供了详细的调试策略，帮助开发者识别并解决此类问题。

1. 余弦相似度的核心概念

余弦相似度（cosine similarity）是一种衡量两个非零向量之间夹角余弦值的度量方法。它的核心在于评估向量的方向相似性，而非其幅值（长度）的差异。当两个向量的方向完全一致时，它们之间的夹角为0度，余弦值为1；当方向完全相反时，夹角为180度，余弦值为-1；当它们正交时，夹角为90度，余弦值为0。

其计算公式如下：$$text{similarity} = cos(theta) = frac{A cdot B}{|A| |B|} = frac{sum_{i=1}^n A_i Bi}{sqrt{sum{i=1}^n Ai^2} sqrt{sum{i=1}^n B_i^2}}$$其中，$A$ 和 $B$ 是两个向量，$A cdot B$ 是它们的点积，$|A|$ 和 $|B|$ 分别是它们的欧几里得范数（即向量的长度或幅值）。

2. 余弦相似度为1的深层机制

理解余弦相似度为1的关键在于认识到它只关注方向。即使两个向量的数值内容完全不同，只要它们在多维空间中指向同一个方向，它们的余弦相似度就会是1。

2.1 向量完全相同

这是最直接的情况。如果两个向量在数值上完全相同，它们无疑指向同一个方向，且幅值也相同，因此余弦相似度为1。

2.2 向量共线且方向一致（幅值不同）

这是更具迷惑性的情况，也是许多开发者容易忽视的。如果一个向量是另一个向量的正数倍，那么它们的方向是完全一致的，即使它们的幅值（长度）不同，余弦相似度仍然为1。

示例代码：

import torchimport torch.nn.functional as F# 向量Avector_a = torch.tensor([1.0, 2.0, 3.0])# 向量B是向量A的两倍（方向相同，幅值不同）vector_b = vector_a * 2print(f"Vector A: {vector_a}")print(f"Vector B: {vector_b}")# 计算余弦相似度similarity = F.cosine_similarity(vector_a, vector_b, dim=-1)print(f"Cosine Similarity (A, B): {similarity.item()}") # 输出接近 1.0# 向量C与向量A方向不同vector_c = torch.tensor([3.0, 2.0, 1.0])print(f"Vector C: {vector_c}")similarity_ac = F.cosine_similarity(vector_a, vector_c, dim=-1)print(f"Cosine Similarity (A, C): {similarity_ac.item()}") # 输出一个小于1的值

在这个例子中，vector_a 和 vector_b 的数值内容明显不同，但它们的余弦相似度是1，因为它们指向相同的方向。

3. 深度学习场景下的具体分析与代码解析

在深度学习模型中，尤其是在处理嵌入向量（embeddings）时，余弦相似度为1的问题可能由多种因素引起。结合提供的训练代码，我们可以进行详细分析。

3.1 训练循环中的张量来源分析

观察训练代码中的关键部分：

for i, (_image1, _label1) in enumerate(train_loader):    image1 = _image1.to(DEVICE)    label1 = _label1[0]    vector1_tensor = model(image1) # 当前批次的嵌入向量    if (i == 0): # 异常处理或初始化情况      image2 = image1      label2 = label1      vector2_tensor = vector1_tensor # 直接将 vector1_tensor 赋值给 vector2_tensor    # PROBLEM LOCATION    similarity =  F.cosine_similarity(vector1_tensor, vector2_tensor, dim = -1)    # ... 其他训练逻辑 ...    # 循环结束前的张量回收与更新    image2 = image1.clone()    label2 = label1    vector2_tensor = vector1_tensor.detach() # 将当前 vector1_tensor 的副本（无梯度）赋给 vector2_tensor

初始化阶段 (i == 0) 的问题：在第一个批次（i == 0）中，vector2_tensor 被直接赋值为 vector1_tensor。这意味着 vector1_tensor 和 vector2_tensor 指向的是同一个张量对象。它们不仅数值相同，而且是内存中的同一份数据。在这种情况下，它们的余弦相似度必然为1。即使它们在后续的梯度计算中可能因为 detach() 操作而有所区分，但在计算 similarity 的那一刻，它们是完全相同的。

后续迭代 (i > 0) 的问题：在随后的迭代中，vector2_tensor 的值来源于上一个迭代中 vector1_tensor 的 detach() 副本。这意味着当前迭代计算的 similarity 是在比较：

vector1_tensor (当前批次的 image1 经过 model 得到的嵌入)vector2_tensor (上一个批次的 image1 经过 model 得到的嵌入，且已 detach())

如果 vector1_tensor 和 vector2_tensor 始终计算为1，则意味着：

模型输出的稳定性： 尽管 image1 可能在批次之间有所不同，但模型（例如VGG作为特征提取器）可能将不同输入映射到高度相似或共线的嵌入空间中。数据本身的相似性： 如果连续批次的 image1 之间差异非常小，即使模型正常工作，其输出的嵌入向量也可能高度相似。模型坍塌 (Model Collapse)： 在对比学习或自监督学习中，如果损失函数或正则化不当，模型可能会将所有输入映射到相同的点或方向，导致嵌入空间坍塌，所有嵌入向量的余弦相似度都趋近于1。这通常是训练失败的信号。

3.2 VGG 模型与嵌入空间

提供的 trans_VGG 模型是一个基于VGG架构的特征提取器，它将输入图像转换为一个固定维度的向量（例如800维）。如果这个VGG模型没有经过充分的预训练，或者在当前任务中其全连接层（fc_layer）未能学习到区分性的特征，它可能会将不同的输入图像映射到高度相似的向量方向上。

4. 调试与验证策略

当遇到余弦相似度持续为1的问题时，可以采取以下步骤进行调试和验证：

4.1 检查张量内容与属性

这是最直接的验证方式，可以帮助你了解 vector1_tensor 和 vector2_tensor 的实际状态。

# 在计算 similarity 之前添加以下调试代码print(f"Iteration: {i}")print(f"vector1_tensor shape: {vector1_tensor.shape}, norm: {torch.norm(vector1_tensor).item():.4f}")print(f"vector2_tensor shape: {vector2_tensor.shape}, norm: {torch.norm(vector2_tensor).item():.4f}")# 打印张量的前几个元素，观察数值差异print(f"vector1_tensor (first 5 elements): {vector1_tensor[0, :5]}")print(f"vector2_tensor (first 5 elements): {vector2_tensor[0, :5]}")# 检查张量是否是同一个对象print(f"Are vector1_tensor and vector2_tensor the same object? {vector1_tensor is vector2_tensor}")# 检查张量是否包含完全相同的数值print(f"Are vector1_tensor and vector2_tensor numerically equal? {torch.equal(vector1_tensor, vector2_tensor)}")# 手动计算余弦相似度以验证 F.cosine_similarity 的行为dot_product = torch.sum(vector1_tensor * vector2_tensor, dim=-1)norm_v1 = torch.norm(vector1_tensor, dim=-1)norm_v2 = torch.norm(vector2_tensor, dim=-1)manual_similarity = dot_product / (norm_v1 * norm_v2 + 1e-8) # 加一个小的 epsilon 避免除以零print(f"Manual Cosine Similarity: {manual_similarity.item():.4f}")

通过这些打印信息，你可以快速判断：

如果 vector1_tensor is vector2_tensor 为 True，那么问题出在张量赋值逻辑上。如果 torch.equal(vector1_tensor, vector2_tensor) 为 True 但 is 为 False（例如通过 clone() 复制），则它们是数值完全相同的不同对象。如果两者都为 False，但余弦相似度仍为1，则说明它们是数值不同但方向一致的共线向量。

4.2 审查训练逻辑与数据来源

确认 vector1_tensor 和 vector2_tensor 的预期来源： 在对比学习任务中，通常 vector1_tensor 和 vector2_tensor 应该来自不同的输入（例如，一对正样本或一对负样本），以学习区分性特征。目前的逻辑 (vector2_tensor = vector1_tensor 或 vector1_tensor.detach()) 使得它们之间存在强烈的依赖性，这可能不是期望的对比对生成方式。检查数据加载器： 确保 train_loader 每次提供的 _image1 具有足够的随机性和多样性。如果数据集非常小或图像内容高度相似，即使模型正常，输出的嵌入也可能趋于一致。

4.3 调整模型架构或训练策略

模型坍塌的缓解： 如果怀疑是模型坍塌，可以考虑：增加对比损失的负样本数量： 确保模型有足够的“不相似”样本来学习区分。引入正则化： 例如L2正则化、Dropout等，防止模型过拟合或特征退化。使用不同的损失函数： 例如InfoNCE损失等，这些损失函数通常设计有防止模型坍塌的机制。调整学习率和优化器： 适当调整超参数可能有助于模型跳出局部最优。VGG特征提取器： 如果VGG模型是随机初始化的，其在训练初期可能无法提取有意义的特征。考虑使用预训练的VGG模型，并在其基础上进行微调。

4.4 可视化嵌入空间

使用降维技术（如PCA或t-SNE）将高维嵌入向量投影到2D或3D空间中，可以直观地观察嵌入向量的分布。如果所有嵌入点都聚集在一个非常小的区域，或者呈现出明显的共线趋势，则表明模型可能存在坍塌问题。

5. 注意事项

区分“不同”的含义： 在调试时，要明确“张量不同”是指内存地址不同 (is not)、数值内容不同 (torch.equal 为 False)，还是仅仅是幅值不同但方向一致。对比学习的挑战： 在设计对比学习任务时，如何有效地生成正负样本对，以及如何避免模型坍塌，是核心挑战。确保 vector1_tensor 和 vector2_tensor 的来源和关系能够真正反映你想要学习的相似性/差异性。梯度流： detach() 操作会切断梯度流。在你的代码中，vector2_tensor = vector1_tensor.detach() 意味着 `vector

以上就是深度学习中余弦相似度为1的常见原因及调试指南的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1375379.html

ai cos 深度学习

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Pandas滚动窗口均值中的skipna参数：兼容性与行为分析

上一篇 2025年12月14日 14:57:16

解决余弦相似度始终为 1 的问题：深度学习中的向量表示分析

下一篇 2025年12月14日 14:57:34

好文分享

Uniapp 中如何不拉伸不裁剪地展示图片？

灵活展示图片：如何不拉伸不裁剪在界面设计中，常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。对于不同尺寸的图片，可以采用以下处理方式：极端宽高比：撑满屏幕宽度或高度，再等比缩放居中。非极端宽高比：居中显示，若能撑满则撑满。然而，如果需要不拉伸不…

程序猿
2025年12月24日
4000
好文分享

如何让小说网站控制台显示乱码，同时网页内容正常显示？

如何在不影响用户界面的情况下实现控制台乱码？当在小说网站上下载小说时，大家可能会遇到一个问题：网站上的文本在网页内正常显示，但是在控制台中却是乱码。如何实现此类操作，从而在不影响用户界面（UI）的情况下保持控制台乱码呢？答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体，并通过在客户端…

程序猿
2025年12月24日
8000
好文分享

如何在地图上轻松创建气泡信息框？

地图上气泡信息框的巧妙生成地图上气泡信息框是一种常用的交互功能，它简便易用，能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。利用地图库的原生功能大多数地图库，如高德地图，都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现：高德地图 JS API 参考文…

程序猿
2025年12月24日
4000
好文分享

如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画？

如何实现元素scrollleft变化时的平滑动画效果？在许多网页应用中，滚动容器的水平滚动条（scrollleft）需要频繁使用。为了让滚动动作更加自然，你希望给scrollleft的变化添加动画效果。解决方案：scroll-behavior 属性要实现scrollleft变化时的平滑动画效果…

程序猿
2025年12月24日
0000
好文分享

如何为滚动元素添加平滑过渡，使滚动条滑动时更自然流畅？

给滚动元素平滑过渡如何在滚动条属性（scrollleft）发生改变时为元素添加平滑的过渡效果？解决方案：scroll-behavior 属性为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码： click the button to slide right!…

程序猿
2025年12月24日
5000
好文分享

如何选择元素个数不固定的指定类名子元素？

灵活选择元素个数不固定的指定类名子元素在网页布局中，有时需要选择特定类名的子元素，但这些元素的数量并不固定。例如，下面这段 html 代码中，activebar 和 item 元素的数量均不固定： *n *n 如果需要选择第一个 item元素，可以使用 css 选择器 :nth-child()。该…

程序猿
2025年12月24日
2000
好文分享

使用 SVG 如何实现自定义宽度、间距和半径的虚线边框？

使用 svg 实现自定义虚线边框如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片，但是这种方法存在引入外部资源、性能低下的缺点。为了避免上述问题，可以使用 svg（可缩放矢量图形）来创建纯代码实现。一种方…

程序猿
2025年12月24日
1000
好文分享

旋转长方形后，如何计算其相对于画布左上角的轴距？

绘制长方形并旋转，计算旋转后轴距在拥有 1920×1080 画布中，放置一个宽高为 200×20 的长方形，其坐标位于 (100, 100)。当以任意角度旋转长方形时，如何计算它相对于画布左上角的 x、y 轴距？以下代码提供了一个计算旋转后长方形轴距的解决方案： const x = 200;co…

程序猿
2025年12月24日
0000
好文分享

旋转长方形后，如何计算它与画布左上角的xy轴距？

旋转后长方形在画布上的xy轴距计算在画布中添加一个长方形，并将其旋转任意角度，如何计算旋转后的长方形与画布左上角之间的xy轴距？问题分解：要计算旋转后长方形的xy轴距，需要考虑旋转对长方形宽高和位置的影响。首先，旋转会改变长方形的长和宽，其次，旋转会改变长方形的中心点位置。求解方法：计算旋…

程序猿
2025年12月24日
0000
好文分享

旋转长方形后如何计算其在画布上的轴距？

旋转长方形后计算轴距假设长方形的宽、高分别为 200 和 20，初始坐标为 (100, 100)，我们将它旋转一个任意角度。根据旋转矩阵公式，旋转后的新坐标 (x’, y’) 可以通过以下公式计算： x’ = x * cos(θ) – y * sin(θ)y’ = x * …

程序猿
2025年12月24日
0000
好文分享

如何让“元素跟随文本高度，而不是撑高父容器？

如何让元素跟随文本高度，而不是撑高父容器在页面布局中，经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中，父容器被较高的图片撑开，而文本的高度没有被考虑。本问答将提供纯css解决方案，让图片跟随文本高度，确保父容器的高度不会被图片影响。解决方法为了解决这个问题，需要将图片从文档流中脱离…

程序猿
2025年12月24日
0000
好文分享

如何计算旋转后长方形在画布上的轴距？

旋转后长方形与画布轴距计算在给定的画布中，有一个长方形，在随机旋转一定角度后，如何计算其在画布上的轴距，即距离左上角的距离？以下提供一种计算长方形相对于画布左上角的新轴距的方法： const x = 200; // 初始 x 坐标const y = 90; // 初始 y 坐标const w =…

程序猿
2025年12月24日
2000
好文分享

CSS元素设置em和transition后，为何载入页面无放大效果？

css元素设置em和transition后，为何载入无放大效果很多开发者在设置了em和transition后，却发现元素载入页面时无放大效果。本文将解答这一问题。原问题：在视频演示中，将元素设置如下，载入页面会有放大效果。然而，在个人尝试中，并未出现该效果。这是由于macos和windows系统…

程序猿
2025年12月24日
2000
好文分享

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
2000
好文分享

如何利用 CSS 选中激活标签并影响相邻元素的样式？

如何利用 css 选中激活标签并影响相邻元素？为了实现激活标签影响相邻元素的样式需求，可以通过 :has 选择器来实现。以下是如何具体操作：对于激活标签相邻后的元素，可以在 css 中使用以下代码进行设置： li:has(+li.active) { border-radius: 0 0 10px…

程序猿
2025年12月24日
1000
好文分享

如何模拟Windows 10 设置界面中的鼠标悬浮放大效果？

win10设置界面的鼠标移动显示周边的样式（探照灯效果）的实现方式在windows设置界面的鼠标悬浮效果中，光标周围会显示一个放大区域。在前端开发中，可以通过多种方式实现类似的效果。使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

程序猿
2025年12月24日
2000
好文分享

如何计算旋转后的长方形在画布上的 XY 轴距？

旋转长方形后计算其画布xy轴距在创建的画布上添加了一个长方形，并提供其宽、高和初始坐标。为了视觉化旋转效果，还提供了一些旋转特定角度后的图片。问题是如何计算任意角度旋转后，这个长方形的xy轴距。这涉及到使用三角学来计算旋转后的坐标。以下是一个 javascript 代码示例，用于计算旋转后长方…

程序猿
2025年12月24日
0000
好文分享

为什么我的 Safari 自定义样式表在百度页面上失效了？

为什么在 Safari 中自定义样式表未能正常工作？在 Safari 的偏好设置中设置自定义样式表后，您对其进行测试却发现效果不同。在您自己的网页中，样式有效，而在百度页面中却失效。造成这种情况的原因是，第一个访问的项目使用了文件协议，可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

程序猿
2025年12月24日
0000
好文分享

如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果？

如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果，可以通过以下途径： CSS 解决方案 DEMO 1: Windows 10 网格悬停效果：https://codepen.io/tr4553r7/pe…

程序猿
2025年12月24日
0000
好文分享

使用CSS mask属性指定图片URL时，为什么浏览器无法加载图片？

css mask属性未能加载图片的解决方法使用css mask属性指定图片url时，如示例中所示： mask: url(“https://api.iconify.design/mdi:apple-icloud.svg”) center / contain no-repeat; 但是，在网络面板中却…

程序猿
2025年12月24日
0000