为深度学习选择最好的GPU

程序猿 • 2025年11月27日 08:45:56 • 用户投稿 • 阅读 1

在进行机器学习项目时，特别是在处理深度学习和神经网络时，最好使用GPU而不是CPU来处理，因为在神经网络方面，即使是一个非常基本的GPU也会胜过CPU。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

但是你应该买哪种GPU呢?本文将总结需要考虑的相关因素，以便可以根据预算和特定的建模要求做出明智的选择。

为什么 GPU 比 CPU 更适合机器学习？

CPU（中央处理器）是计算机的主力，它非常灵活，不仅需要处理来自各种程序和硬件的指令，并且处理速度也有一定的要求。为了在这种多任务环境中表现出色，CPU 具有少量且灵活快速的处理单元（也称为核）。

GPU（图形处理单元）GPU在多任务处理方面不那么灵活。但它可以并行执行大量复杂的数学计算。这是通过拥有更多数量的简单核心（数千个到上万）来实现的，这样可以同时处理许多简单的计算。

并行执行多个计算的要求非常适合于:

图形渲染——移动的图形对象需要不断地计算它们的轨迹，这需要大量不断重复的并行数学计算。机器和深度学习——大量的矩阵/张量计算，GPU可以并行处理。任何类型的数学计算，可以拆分为并行运行。

在Nvidia自己的博客上已经总结了CPU和GPU的主要区别:

张量处理单元(TPU)

随着人工智能和机器/深度学习的发展，现在已经有了更专门的处理核心，称为张量核（Tensor cores）。在执行张量/矩阵计算时，它们更快更有效。因为我们在机器/深度学习中所处理的数据类型就是张量。

虽然有专用的tpu，但一些最新的GPU也包括许多张量核，我们会在后面总结。

Nvidia vs AMD

这将是一个相当短的部分，因为这个问题的答案肯定是Nvidia

虽然可以使用AMD的gpu进行机器/深度学习，但在写本文时，Nvidia的GPU具有更高的兼容性，并且通常更好地集成到TensorFlow和PyTorch等工具中（比如目前PyTorch的AMD GPU的支持还只能在Linux上使用）。

使用AMD GPU需要使用额外的工具(ROCm)，这个会有一些额外的工作，并且版本可能也不会更新的很快。这种情况将来可能会有所改善，但是现在为止，最好还是使用Nvidia。

GPU选择的主要属性

选择一个够完成机器学习任务并且符合预算的GPU，基本上归结为四个主要因素的平衡:

GPU有多少内存?GPU有多少个CUDA和/或张量核?卡使用什么芯片架构?功耗要求是多少（如果有）？

下面将逐一探讨这些方面，希望能让你更好地理解什么对你来说是重要的。

GPU内存

答案是，越多越好!

这实际上取决于你的任务，以及这些模型有多大。例如，如果你正在处理图像、视频或音频，那么根据定义，你将处理相当大量的数据，GPU RAM将是一个非常重要的考虑因素。

总有办法解决内存不足的问题(例如减少批处理大小)。但是这将会浪费训练的时间，因此需要很好地平衡需求。

根据经验，我的建议如下:

4GB：我认为这是绝对的最小值，只要你不是在处理过于复杂的模型，或者大的图像、视频或音频，这个在大多数情况下能工作，但是达不到日常使用的需要。如果你刚刚起步，想尝试一下又不想全力投入，那么可以从它开始8GB：这是一个日常学习很好的开始，可以在不超过RAM限制的情况下完成大多数任务，但在使用更复杂的图像、视频或音频模型时会遇到问题。12GB：我认为这是科研最基本的的要求。可以处理大多数较大的模型，甚至是那些处理图像、视频或音频的模型。12GB+ ：越多越好，你将能够处理更大的数据集和更大的批处理大小。超过12GB才是价格真正开始上涨的开始。

一般来说，如果成本相同的话，选择“速度较慢”但内存较大的卡会更好。请记住，GPU的优势是高吞吐量，这在很大程度上依赖于可用的RAM来通过GPU传输数据。

CUDA核心和Tensor 核心

这其实很简单，越多越好。

首先考虑RAM，然后就是CUDA。对于机器/深度学习来说，Tensor 核比CUDA核更好(更快，更有效)。这是因为它们是为机器/深度学习领域所需的计算而精确设计的。

但是这并不重要，因为CUDA内核已经足够快了。如果你能得到一张包含Tensor 核的卡，这是一个很好的加分点，只是不要太纠结于它。

后面你会看到“CUDA”被提到很多次，我们先总结一下它:

CUDA核心——这些是显卡上的物理处理器，通常有数千个，4090已经1万6了。

CUDA 11 -数字可能会改变，但这是指安装的软件/驱动程序，以允许显卡正常的工作。NV会定期发布新版本，它可以像任何其他软件一样安装和更新。

CUDA代数(或计算能力)-这描述了显卡卡在它的更新迭代的代号。这在硬件上是固定的，因此只能通过升级到新卡来改变。它由数字和一个代号来区分。例子:3。x[Kepler]，5。x [Maxwell]， 6。x [Pascal]， 7。x[Turing]和8。x(Ampere)。

芯片架构

这实际上比你想象的更重要。我们这里不讨论AMD，我的眼里只有”老黄“。

上面我们已经说了，30系列的卡就是Ampere架构，最新的40系列是 Ada Lovelace。一般老黄都会使用一个著名科学家和数学家来对架构命名，这次选择的是著名英国诗人拜伦之女，建立了循环和子程序概念的女数学家、计算机程序创始人Ada Lovelace来命名。

了解对于卡的计算能力，我们要了解2个方面：

Omneky

用最先进的深度学习为客定制个性化的广告

54 查看详情显着的功能改进这里一个重要的功能就是，混合精度训练：

使用精度低于 32 位浮点数的数字格式有很多好处。首先它们需要更少的内存，从而能够训练和部署更大的神经网络。其次它们需要更少的内存带宽，从而加快数据传输操作。第三数学运算在精度降低的情况下运行得更快，尤其是在具有 Tensor Core 的 GPU 上。混合精度训练实现了所有这些好处，同时确保与完全精度训练相比不会丢失特定于任务的准确性。它通过识别需要完全精度的步骤并仅对这些步骤使用 32 位浮点而在其他任何地方使用 16 位浮点来实现这一点。

这里是Nvidia 官方文档，有兴趣的可以看看：

https://docs.nvidia.com/deeplearning/performance/mixed-precision-training/index.html

如果您的 GPU 具有 7.x (Turing) 或更高的架构，才有可能使用混合精确训练。也就是说桌面的RTX 20 系列或高版本，或服务器上的 “T”或“A”系列。

混合精度训练具有如此优势的主要原因是它降低了 RAM 使用率，Tensor Core 的 GPU会加速混精度训练，如果没有的话使用FP16也会节省显存，可以训练更大的批大小，间接提升训练速度。

是否会被弃用

如果你对RAM有特别高的要求，但又没有足够的钱买高端卡，那么你可能会选择二手市场上的老款GPU。这有一个相当大的缺点……这张卡的寿命结束了。

一个典型的例子就是Tesla K80，它有4992个CUDA核心和24GB的RAM。2014年，它零售价约为7000美元。现在的价格从 150到170美元不等!（咸鱼的价格600-700左右）这么小的价格却有这么大的内存，你一定很兴奋。

但是这有一个非常大的问题。K80的计算架构是3.7 (Kepler)，CUDA 11起已经不支持(当前CUDA版本为11.7)。这意味着这张卡已经废了，所以它才卖的这么便宜。

所以在选择2手卡时一定要看清楚是否支持最新版本的驱动和CUDA，这是最重要的。

高端游戏卡 VS 工作站/服务器卡

老黄基本上把卡分成了两部分。消费类显卡和工作站/服务器的显卡(即专业显卡)。

这两个部分之间有明显的区别，对于相同的规格(RAM, CUDA内核，架构)，消费类显卡通常会更便宜。但是专业卡通常会有更好的质量，和较低的能源消耗（其实涡轮的噪音挺大的，放机房还可以，放家里或者试验室有点吵）。

高端(非常昂贵)的专业卡，你可能会注意到它们有很大的RAM(例如RTX A6000有48GB, A100有80GB!)。这是因为它们通常直接针对3D建模、渲染和机器/深度学习专业市场，这些市场需要高水平的RAM。再说一次，如果你有钱，买A100就对了!（H100是A100的新版，目前无法评价）

但是我个人认为，我们还是选择消费者的高端游戏卡，因为如果你不差钱，你也不会看这篇文章，对吧

选择建议

所以在最后我根据预算和需求提出一些建议。我将其分为三个部分:

低预算中等预算高预算

高预算不考虑任何超出高端消费显卡。还是那句话如果你有钱：A100，H100随便买。

本文中会包含在二手市场买到的卡片。这主要是因为我认为在低预算的情况下，二手是可以考虑的。这里还包括了专业桌面系列卡(T600、A2000和A4000)，因为它的一些配置比同类消费类显卡稍差，但功耗明显更好。

低预算

中等预算

高预算

在线/云服务

如果你决定花钱买显卡不适合你，你可以利用谷歌Colab，它可以让你免费使用GPU。

但这是有时间限制的，如果你使用GPU太长时间，他们会把你踢出去，然后回到CPU上。如果GPU处于非活动状态太长时间，可能是在你写代码的时候，它也会把GPU拿回来。GPU也是自动分配的，所以你不能选择你想要的确切的GPU（你也可以每月9.9刀弄个Colab Pro，我个人觉得要比低预算好很多，但是要求有梯子，$49.99的Colab Pro+有点贵，不建议）。

在写本文时，通过Colab可以获得以下GPU:

在前面也提到了，K80有24GB的RAM和4992个CUDA核心，它基本上是两个K40卡连在一起。这意味着当你在Colab中使用K80时，你实际上可以访问一半的卡，所以也就是只有12GB和2496个CUDA内核。

总结

最后现在4090还是处于耍猴的状态，基本上要抢购或者加价找黄牛

但是16384 CUDA + 24GB，对比3090 的10496 CUDA ，真的很香。

而4080 16G的9728CUDA 如果价格能到7000内，应该是一个性价比很高的选择。12G的 4080就别考虑了，它配不上这个名字。

对于AMD的 7900XTX 应该也是一个很好的选择，但是兼容性是个大问题，如果有人测试的话可以留言。

40系列老黄一直在耍猴，所以如果不着急的话还再等等把：

你不买，我不买，明天还能降两百

以上就是为深度学习选择最好的GPU的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/832463.html

ai deepl gpu 机器学习深度学习

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Java框架与传统编程方法有哪些关键区别？

上一篇 2025年11月27日 08:45:51

了解了解一下SQLSERVER里的鬼影记录

下一篇 2025年11月27日 08:45:57

用户投稿

Uniapp 中如何不拉伸不裁剪地展示图片？

灵活展示图片：如何不拉伸不裁剪在界面设计中，常常需要以原尺寸展示用户上传的图片。本文将介绍一种在 uniapp 框架中实现该功能的简单方法。对于不同尺寸的图片，可以采用以下处理方式：极端宽高比：撑满屏幕宽度或高度，再等比缩放居中。非极端宽高比：居中显示，若能撑满则撑满。然而，如果需要不拉伸不…

程序猿
2025年12月24日
4000
用户投稿

如何让小说网站控制台显示乱码，同时网页内容正常显示？

如何在不影响用户界面的情况下实现控制台乱码？当在小说网站上下载小说时，大家可能会遇到一个问题：网站上的文本在网页内正常显示，但是在控制台中却是乱码。如何实现此类操作，从而在不影响用户界面（UI）的情况下保持控制台乱码呢？答案在于使用自定义字体。网站可以通过在服务器端配置自定义字体，并通过在客户端…

程序猿
2025年12月24日
8000
用户投稿

如何在地图上轻松创建气泡信息框？

地图上气泡信息框的巧妙生成地图上气泡信息框是一种常用的交互功能，它简便易用，能够为用户提供额外信息。本文将探讨如何借助地图库的功能轻松创建这一功能。利用地图库的原生功能大多数地图库，如高德地图，都提供了现成的信息窗体和右键菜单功能。这些功能可以通过以下途径实现：高德地图 JS API 参考文…

程序猿
2025年12月24日
4000
用户投稿

如何使用 scroll-behavior 属性实现元素scrollLeft变化时的平滑动画？

如何实现元素scrollleft变化时的平滑动画效果？在许多网页应用中，滚动容器的水平滚动条（scrollleft）需要频繁使用。为了让滚动动作更加自然，你希望给scrollleft的变化添加动画效果。解决方案：scroll-behavior 属性要实现scrollleft变化时的平滑动画效果…

程序猿
2025年12月24日
0000
用户投稿

如何为滚动元素添加平滑过渡，使滚动条滑动时更自然流畅？

给滚动元素平滑过渡如何在滚动条属性（scrollleft）发生改变时为元素添加平滑的过渡效果？解决方案：scroll-behavior 属性为滚动容器设置 scroll-behavior 属性可以实现平滑滚动。 html 代码： click the button to slide right!…

程序猿
2025年12月24日
6000
用户投稿

如何选择元素个数不固定的指定类名子元素？

灵活选择元素个数不固定的指定类名子元素在网页布局中，有时需要选择特定类名的子元素，但这些元素的数量并不固定。例如，下面这段 html 代码中，activebar 和 item 元素的数量均不固定： *n *n 如果需要选择第一个 item元素，可以使用 css 选择器 :nth-child()。该…

程序猿
2025年12月24日
3000
用户投稿

使用 SVG 如何实现自定义宽度、间距和半径的虚线边框？

使用 svg 实现自定义虚线边框如何实现一个具有自定义宽度、间距和半径的虚线边框是一个常见的前端开发问题。传统的解决方案通常涉及使用 border-image 引入切片图片，但是这种方法存在引入外部资源、性能低下的缺点。为了避免上述问题，可以使用 svg（可缩放矢量图形）来创建纯代码实现。一种方…

程序猿
2025年12月24日
2000
用户投稿

如何让“元素跟随文本高度，而不是撑高父容器？

如何让元素跟随文本高度，而不是撑高父容器在页面布局中，经常遇到父容器高度被子元素撑开的问题。在图例所示的案例中，父容器被较高的图片撑开，而文本的高度没有被考虑。本问答将提供纯css解决方案，让图片跟随文本高度，确保父容器的高度不会被图片影响。解决方法为了解决这个问题，需要将图片从文档流中脱离…

程序猿
2025年12月24日
1000
用户投稿

为什么 CSS mask 属性未请求指定图片？

解决 css mask 属性未请求图片的问题在使用 css mask 属性时，指定了图片地址，但网络面板显示未请求获取该图片，这可能是由于浏览器兼容性问题造成的。问题如下代码所示：立即学习“前端免费学习笔记（深入）”； icon [data-icon=”cloud”] { –icon-cl…

程序猿
2025年12月24日
3000
用户投稿

如何利用 CSS 选中激活标签并影响相邻元素的样式？

如何利用 css 选中激活标签并影响相邻元素？为了实现激活标签影响相邻元素的样式需求，可以通过 :has 选择器来实现。以下是如何具体操作：对于激活标签相邻后的元素，可以在 css 中使用以下代码进行设置： li:has(+li.active) { border-radius: 0 0 10px…

程序猿
2025年12月24日
2000
用户投稿

如何模拟Windows 10 设置界面中的鼠标悬浮放大效果？

win10设置界面的鼠标移动显示周边的样式（探照灯效果）的实现方式在windows设置界面的鼠标悬浮效果中，光标周围会显示一个放大区域。在前端开发中，可以通过多种方式实现类似的效果。使用css 使用css的transform和box-shadow属性。通过将transform: scale(1.…

程序猿
2025年12月24日
3000
用户投稿

为什么我的 Safari 自定义样式表在百度页面上失效了？

为什么在 Safari 中自定义样式表未能正常工作？在 Safari 的偏好设置中设置自定义样式表后，您对其进行测试却发现效果不同。在您自己的网页中，样式有效，而在百度页面中却失效。造成这种情况的原因是，第一个访问的项目使用了文件协议，可以访问本地目录中的图片文件。而第二个访问的百度使用了 ht…

程序猿
2025年12月24日
1000
用户投稿

如何用前端实现 Windows 10 设置界面的鼠标移动探照灯效果？

如何在前端实现 Windows 10 设置界面中的鼠标移动探照灯效果想要在前端开发中实现 Windows 10 设置界面中类似的鼠标移动探照灯效果，可以通过以下途径： CSS 解决方案 DEMO 1: Windows 10 网格悬停效果：https://codepen.io/tr4553r7/pe…

程序猿
2025年12月24日
1000
用户投稿

使用CSS mask属性指定图片URL时，为什么浏览器无法加载图片？

css mask属性未能加载图片的解决方法使用css mask属性指定图片url时，如示例中所示： mask: url(“https://api.iconify.design/mdi:apple-icloud.svg”) center / contain no-repeat; 但是，在网络面板中却…

程序猿
2025年12月24日
1000
用户投稿

如何用CSS Paint API为网页元素添加时尚的斑马线边框？

为元素添加时尚的斑马线边框在网页设计中，有时我们需要添加时尚的边框来提升元素的视觉效果。其中，斑马线边框是一种既醒目又别致的设计元素。实现斜向斑马线边框要实现斜向斑马线间隔圆环，我们可以使用css paint api。该api提供了强大的功能，可以让我们在元素上绘制复杂的图形。立即学习“前端…

程序猿
2025年12月24日
1000
用户投稿

图片如何不撑高父容器？

如何让图片不撑高父容器？当父容器包含不同高度的子元素时，父容器的高度通常会被最高元素撑开。如果你希望父容器的高度由文本内容撑开，避免图片对其产生影响，可以通过以下 css 解决方法：绝对定位元素： .child-image { position: absolute; top: 0; left: …

程序猿
2025年12月24日
1000
CSS 帮助

我正在尝试将文本附加到棕色框的左侧。我不能。我不知道代码有什么问题。请帮助我。 css .hero { position: relative; bottom: 80px; display: flex; justify-content: left; align-items: start; color:…

程序猿
2025年12月24日 • 用户投稿
3000
用户投稿

前端代码辅助工具：如何选择最可靠的AI工具？

前端代码辅助工具：可靠性探讨对于前端工程师来说，在HTML、CSS和JavaScript开发中借助AI工具是司空见惯的事情。然而，并非所有工具都能提供同等的可靠性。个性化需求关于哪个AI工具最可靠，这个问题没有一刀切的答案。每个人的使用习惯和项目需求各不相同。以下是一些影响选择的重要因素：立…

程序猿
2025年12月24日
1000
用户投稿

如何用 CSS Paint API 实现倾斜的斑马线间隔圆环？

实现斑马线边框样式：探究 css paint api 本文将探究如何使用 css paint api 实现倾斜的斑马线间隔圆环。问题：给定一个有多个圆圈组成的斑马线图案，如何使用 css 实现倾斜的斑马线间隔圆环？答案：立即学习“前端免费学习笔记（深入）”；使用 css paint api…

程序猿
2025年12月24日
1000
用户投稿

如何使用CSS Paint API实现倾斜斑马线间隔圆环边框？

css实现斑马线边框样式想定制一个带有倾斜斑马线间隔圆环的边框？现在使用css paint api，定制任何样式都轻而易举。 css paint api 这是一个新的css特性，允许开发人员创建自定义形状和图案，其中包括斑马线样式。立即学习“前端免费学习笔记（深入）”；实现倾斜斑马线间隔圆环 …

程序猿
2025年12月24日
1000