老黄手捧ChatGPT专用「核弹」炸场,英伟达H100至尊版速度提10倍!

英伟达,赢麻了!

刚刚结束的GTC大会上,靠着满屏的「生成式AI」,手握一块支撑ChatGPT算力、提速10倍的H100 NVLINK芯片,老黄就差把这几个字写在脸上——「我是赢家」。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

ChatGPT,Microsoft 365, Azure,Stable Diffusion,DALL-E,Midjourney……所有这些时下最红最爆的AI产品,英伟达全都能从中分得一杯羹。

今年初ChatGPT在全球的爆火,让英伟达股价飙升,市值直接增加700多亿美元。目前,英伟达市值为6400亿美元。

图片

而如今,AI的iPhone时刻已经到来,第四次科技革命就要开启,而手握A100和H100的英伟达,或成最大赢家。

在GTC大会上,老黄宣布了英伟达在GPU、加速库、计算光刻、云平台上的亮眼进步,更是放出豪言——英伟达就是要做AI圈的台积电!

现在已经有人猜测,今天的演讲都是在H100上用AIGC模型生成的。

ChatGPT专用GPU已来

这次大会上最重磅的发布,就是针对ChatGPT打造的NVIDIA H100 NVLINK。

因为算力需求巨大,针对ChatGPT等LLM的推理,英伟达推出了新款Hopper GPU,配备双GPU NVLINK的PCIE H100,具有94B内存。

图片

事实上,深度学习的历史从2012年之后,就一直与英伟达息息相关。

老黄表示,2012年深度学习元老Hinton和学生Alex Kerchevsky、Ilya Suskever在训练AlexNet时,用的正是GeForce GTX 580。

随后,AlexNet一举夺得ImageNet图像分类竞赛冠军,成为了深度学习大爆炸的奇点。

而时隔10年,在OpenAI的Ilya Suskever也是用着英伟达的DGX,训练出了ChatGPT背后的GPT3,及GPT3.5。

图片

老黄自豪地说,目前在云上唯一可以实际处理ChatGPT的GPU,就是HGX A100。

但与A100相比,一台搭载四对H100和双GPU NVLINK的服务器速度还要快上10倍!因为H100可以将LLM的处理成本降低一个数量级。

随着生成式AI掀起一波机遇浪潮,AI正处于转折点,使得推理工作负载呈阶梯函数式增长。

在以前,设计一个云数据中心来处理生成式AI,是巨大的挑战。

一方面,理想情况下最好使用一种加速器,使数据中心具有弹性;但另一方面,没有一个加速器能以最优的方式处理在算法、模型、数据类型和大小方面的多样性。英伟达的One Architecture平台就兼具加速功能和弹性。

而今天,英伟达宣布,推出全新的推理平台。每种配置都对某类工作负载进行了优化。

图片

比如针对AI视频工作负载,英伟达就推出了L4,在视频解码和转码、视频内容审核、视频通话功能上做了优化。

而一台8-GPU L4服务器,将取代一百多台用于处理AI视频的双插槽CPU服务器。

同时,英伟达还针对Omniverse、图形渲染以及文本转图像/视频等生成式AI推出了L40。其性能是英伟达最受欢迎的云推理GPU T4的10倍。

当前,Runway推出的Gen-1,以及Gen-2生成式AI模型拥有的强大能力便是借助了英伟达的GPU。

另外,英伟达还推出了全新的超级芯片Grace-Hopper,适用于推荐系统和向量数据库。

挑战芯片极限破,计算光刻提速40倍

在芯片领域,英伟达联合台积电、ASML和Synopsys,历时4年终于完成了计算光刻技术的一项重大突破——NVIDIA cuLitho计算光刻库。

在到达2nm制程的极限后,光刻就是突破点。

计算光刻模拟了光通过光学元件后与光刻胶相互作用时的行为,通过应用逆物理算法,我们可以预测掩膜板上的图案,以便在晶圆上生成最终图案。

在芯片设计和制造领域中,计算光刻是最大的计算工作负载,每年都要消耗数百亿CPU小时。相比之下,英伟达创造的这个新算法,可以让日益复杂的计算光刻工作流程能够在GPU上并行执行。

总结来说,cuLitho不仅能使计算速度提升40倍,而且功耗也可以降低9倍之多。

举个例子,英伟达的H100需要89块掩膜板。

如果用CPU进行处理的话,每个掩膜板都需要消耗两周的时间。而如果在GPU上运行cuLitho,则只需8个小时即可处理完一个掩膜板。

而台积电也可以用500个DGX H100系统中的4,000个Hopper GPU,完成之前需要多达40,000台基于CPU的服务器才能搞定的工作,并且功率也会从35MW降至5MW。

图片

值得注意的是,cuLitho加速库与Ampere和Volta架构的GPU也是兼容的,不过Hopper是最快的解决方案。

老黄表示,由于光刻技术已经处于物理学的极限,晶圆厂能够提高产量,为2nm及以后的发展做好准备。

AI的iPhone时刻

这几个月,ChatGPT以摧枯拉朽之势,眼看就要掀起第四次科技革命。「我们正处于AI的iPhone时刻」这个说法,也随之广泛流传开。

在GTC大会上,老黄也是激动地把这句话重复了三遍。

iPhone时刻来临,初创公司如OpenAI在竞相构建颠覆性的产品和商业模式,而谷歌、微软这样的老牌公司,则在寻求着应对之法。

它们的种种举动,都是由生成式AI在全球引发的制定AI战略的紧迫感。

英伟达加速计算始于DGX AI超级计算机,这也是当前大型语言模型实现突破的背后引擎。

GTC上,老黄自豪地表示,是我亲手将全球首款DGX交给了OpenAI。

从那之后,「财富」100强企业中,其中有一半都安装了DGXAI超级计算机。

DGX配有8个H100 GPU模组,同时H100配有Transformer引擎,能够处理ChatGPT这样令人惊叹的模型。

8个H100模组通过NVLINK Switch彼此相连,实现了全面无阻塞通信。8个H100协同工作,就像是一个巨型的GPU。

让老黄倍感激动的是,微软宣布Azure将向其H100 AI超级计算机开放私人预览版。

并称,「DGX超计算机是现代AI工厂。我们正处于AI的iPhone时刻。」

一手带出ChatGPT

过去十年,加速和纵向扩展结合使各种应用实现百万倍性能提升。

令人印象最深刻的例子,便是2012年,AlexNet深度学习框架的提出。

当时,Alex Krizhevsky、Ilya Suskever,以及Hinton在GeForce GTX 580上使用了1400万张图完成了训练,可处理262千万亿次浮点运算。

十年后,Transformer面世。

Ilya Suskever训练了GPT-3来预测下一个单词,需要进行的浮点运算比训练AlexNet模型要多一百万倍。

由此,创造出了令全世界震惊的AI——ChatGPT。

用老黄的一句话总结:

这意味着崭新的计算平台已经诞生,AI的「iPhone时刻」已经到来。加速计算和AI技术已经走进现实。

达奇AI论文写作 达奇AI论文写作

达奇AI论文辅助写作平台,在校学生、职场精英都在用的AI论文辅助写作平台

达奇AI论文写作 24 查看详情 达奇AI论文写作

加速库是加速计算的核心。这些加速库连接了各种应用,进而再连接到各行各业,形成了网络中的网络。

经过30年的开发,目前已经有数千款应用被英伟达的库加速,几乎涉及科学和工业的每个领域。

目前,所有的英伟达GPU都兼容CUDA。

现有的300个加速库和400个AI模型覆盖了量子计算、数据处理、机器学习等广泛的领域。

这次GTC大会,英伟达宣布更新了其中的100个。

英伟达Quantum平台由库和系统组成,可供研究人员推进量子编程模型、系统架构和算法。

cuQuantum是用于量子电路仿真的加速库,其中IBM、百度等公司已经将这一加速库集成到他们的仿真框架中。

Open Quantum CUDA是英伟达的混合GPU-Quantum编程模型。

英伟达还宣布推出一个量子控制链路,这是与Quantum Machines合作开发的。它可以将英伟达GPU连接到量子计算机,以极快的速度进行纠错。

还有RAFT新库推出,用于加速索引、数据加载和近邻搜索。

此外,英伟达还宣布了DGX Quantum,用DGX构建,并利用最新开源的CUDA Quantum,这个新平台为从事量子计算的研究人员提供了一个革命性的高性能和低延迟的架构。

图片

英伟达还推出了NVIDIA Triton Management Service软件,可在整个数据中心自动扩展和编排Triton推理实例。适用于像GPT-3大语言模型的多GPU、多节点推理。

用于计算机视觉的CV-CUDA和用于视频处理的VPF是英伟达新的云规模加速库。

老黄宣布CV-CUDA Beta优化了预处理和后处理,实现了更高的云吞吐量,将成本和能耗减少了四分之一。

目前,微软处理视觉搜索、Runway为其生成式AI视频处理过程,全都采用了CV-CUDA和VRF库。

此外,英伟达加速计算还帮助基因组学实现了里程碑式发展。使用英伟达助力的仪器设备,将整个基因组测序的成本降低至100美元,成为另一个里程碑。

英伟达NVIDIA Parabrics加速库可用于云端或仪器设备内的端到端基因组分析,并且适用于各种公有云和基因组学平台。

ChatGPT在跑,英伟达在赚

现在,ChatGPT、Stable Diffusion、DALL-E和Midjourney,已经唤醒了全世界对于生成式AI的认知。

当红炸子鸡ChatGPT仅在推出2个月后,就月活破亿,已经成为史上用户增长最快的应用。

图片

可以说,它就是一台计算机。不仅能生成文本、写诗、改写研究论文、解决数学问题、甚至还能编程。

众多突破性成果造就了今天的生成式AI。

Transformer能够以大规模并行的方式,从数据的关系和依赖性中学习上下文和含义。这使得LLMs能够利用海量数据进行学习,在没有明确训练的情况下执行下游任务。

另外,受物理学启发的扩散模型,能够通过无监督学习来生成图像。

老黄总结道,短短十几年,我们就从识别猫,跨越到了生成在月球行走的太空服猫的过程。

现在完全可以说,生成式AI就是一种新的计算机,一种可以用人类语言进行编程的计算机。

图片

此前,命令计算机解决问题,是独属于程序员的特权,但是如今,人人都可以是程序员了。

和比尔盖茨一样,老黄也下了类似的定义:生成式AI是一种新型计算平台,与PC、互联网、移动设备和云类似。

通过Debuild,我们只要说清楚自己想要什么,就可以直接设计和部署Web应用。

很明显,生成式AI将几乎重塑所有行业。

图片

要做AI界的「台积电」

在这样的背景下,专业公司都需要使用自己的专有数据,来构建定制模型。

接着,老黄自豪宣布,行业需要一个类似台积电的代工厂,来构建自定义的大语言模型,而英伟达,就是这个「台积电」!

大会上,英伟达宣布推出NVIDIA AI Foundations云服务,让客户可以定制LLM和生成式AI。

图片

这个云服务包括语言、视觉和生物学模型制作服务。

其中,Nemo用于构建定制的语言文本转文本生成式模型。

图片

而Picasso是视觉语言模型制作,可以用于训练自定义模型,包括图像、视频和3D应用。

只要向Picasso发送文本提示和元数据的API调用,Picasso就会用DGX Cloud上的模型把生成的素材发送回应用。

更厉害的地方是,把这些素材导入NVIDIA Omniverse,就可以构建逼真的元宇宙应用,和数字孪生仿真。

另外,英伟达还在和Shutterstock合作,开发Edify-3D生成式模型。

同时,英伟达和Adobe的合作也继续扩展,把生成式AI融入营销人员和创意人士的日常工作流,并且,尤其注意对于艺术家版权的保护。

第三个领域,就是生物学。

如今,药物研发行业的价值已经达到近2万亿元,研发投入高达2500亿美元。

NVIDIA Clara就是一款医疗健康应用框架,用于影像、仪器、基因组学分析和药物研发。

而最近,生物圈的热门方向是利用生成式AI发现疾病靶因、设计新分子或蛋白类药物等。

与之相应的,BIONEMO可以让用户使用专有数据创建、微调、提供自定义模型,包括AlphaFold、ESMFold、OpenFold等蛋白质预测模型。

最后,老黄总结道,NVIDIA AI Foundations是一个云服务和代工厂,用于构建自定义语言模型和生成式AI。

老黄云服务,月租36999美元

英伟达这次,还推出了一款云服务。

它敏锐地看到客户需要更简单快捷访问NVIDIA AI的需求,因而推出了NVIDIA DGX Cloud。

图片

DGX Cloud与Microsoft Azure、Google GCP和Oracle OCI都有合作。只要一个浏览器,NVIDIA DGX AI超级计算机,就能即时接入每家公司!

在这款云上,可以运行NVIDIA AI Enterprise加速库套件,直接解决AI端到端的开发和部署。

并且,云上不止提供NVIDIA AI,还有全球最主要的几大云服务商。

而英伟达的第一个NVIDIA DGX Cloud,就是Oracle Cloud Infrastructure(OCI)。

图片

在OCI中,NVIDIA CX-7和BlueField-3两个王炸合体,立马组合出一台强力超算。

据介绍,企业现在可以租用DGX Cloud,月租36999美元起。

最后,当然还是每年GTC大会的保留节目——Omniverse。老黄宣布了关于元宇宙平台Omniverse更新。

现在,Microsoft和NVIDIA,正准备将Omniverse带给数以亿计的Microsoft 365和Azure用户。

此外,还有消息称:老黄为了能让H100合规地出口中国,便照着之前A800的经验特调了一款「H800」,将芯片之间的数据传输率降到了H100的50%左右。

总结来说,老黄在这次的大会已经相当明确,英伟达要做AI领域的台积电,像晶圆厂一样提供代工,在此基础上让行业内其他公司训练算法。

这种商业模式,能成功吗?

以上就是老黄手捧ChatGPT专用「核弹」炸场,英伟达H100至尊版速度提10倍!的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/563674.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月10日 02:19:30
下一篇 2025年11月10日 02:23:16

相关推荐

  • 怎么了解L2生态_用户应该怎么追踪扩容技术路线

    首先明确L2技术分类,包括Rollups、状态通道和侧链,重点区分ORU与ZRU及其数据可用性;其次关注Optimism、Arbitrum、zkSync等核心项目进展,跟踪升级路线与链上指标;最后利用L2Beat、Dune Analytics和Token Terminal等工具分析TVL、用户行为与…

    2025年12月11日
    000
  • 币圈入门必备的十大平台 新手常用的加密货币交易软件推荐

    市面上的加密货币交易所数量众多,功能各异,安全性、交易对、手续费以及用户体验都是衡量其优劣的重要标准。本篇文章旨在提供一份详尽的交易所排名与介绍,帮助读者更好地理解各个平台的特点,从而做出明智的选择。我们将深入探讨每个平台的优势与特色服务,力求呈现一个全面且客观的视角,以便您在数字资产的世界中稳健前…

    2025年12月11日 好文分享
    000
  • 什么是阿尔法(Alpha)?新用户如何参与or能参与吗?小白入门篇

    阿尔法在加密领域表现为未公开项目信息、早期参与资格、独特市场分析及低流动性潜力资产。通过关注行业研究员、设置关键词提醒、研读项目文档并交叉验证信息,可从社交媒体获取线索;积极参与官方社群、贡献价值、参加活动并与核心成员建立联系,能深入接触一手资讯;利用Nansen、Dune等工具监控大额地址、追踪聪…

    2025年12月11日
    000
  • 如何看懂链上安全事件_用户应该怎么跟踪官方调查结果

    用户可通过官方公告、安全公司报告及链上%ignore_a_1%交叉验证事件。首先查看项目官网与社交账号的声明,获取攻击时间与受损地址;其次查阅CertiK、慢雾等机构的技术分析报告,了解攻击路径与资金流向;再通过Etherscan等浏览器核实合约交易记录,并用欧科云链、Nansen等工具监控黑客地址…

    2025年12月11日
    000
  • 虚拟币专用软件有哪些 2026虚拟币专用软件top10推荐

    随着数字资产市场的不断成熟,选择一款安全可靠的专用软件至关重要。本文为您展望并推荐2026年值得关注的十大虚拟币软件,涵盖资产管理、交易和数据分析等领域,旨在帮助您更高效、安全地管理数字财富。 一、综合交易平台类 1、Binance:作为全球领先的数字资产交易平台,提供丰富的交易对和金融衍生品。其深…

    2025年12月11日
    000
  • 多链充值是什么_新手应该怎么避免充错链导致资产损失

    多链充值需选择与收款方一致的区块链网络,如USDT支持ERC20、TRC20、BEP20等不同链,各链互不相通。1、确认目标平台支持的网络类型,核对充值地址标注的链名。2、转账前检查钱 包当前网络是否匹配,如向TRC20地址充值须切换至TRON网络。3、通过地址格式辅助判断:以“0x”开头多为ERC…

    2025年12月11日
    000
  • 3分钟了解币安人生(BINANCELIFE)是什么?它是如何运作的?值得购买吗?

    币安人生(BINANCELIFE)是基于BSC的NFT数字藏品,1、以唯一标识符确保所有权;2、通过智能合约发行,用户购盲盒获随机NFT;3、设计融合加密文化,具社区共鸣;4、稀有度与流动性影响价值,需综合项目背景与个人风险判断。 币安人生(binancelife)是一种在币安智能链上发行的数字藏品…

    2025年12月11日
    000
  • 什么是稳定币_为什么稳定币成为加密交易基础资产

    稳定币是锚定法定货币或资产的数字货币,通过1:1储备机制保持价值稳定,主要类型包括法币抵押型(如USDT)、加密资产抵押型(如DAI)、算法型和商品锚定型(如XAUT),其中法币抵押型占市场主导。在加密交易中,稳定币作为核心结算工具,超90%比特币交易以其结算,形成“加密美元本位”;同时在市场波动时…

    2025年12月11日
    000
  • LP做市是什么_用户应该怎么理解LP承担的无常损失风险

    无常损失是LP因市场价格变动导致资产价值低于持有价值的差额,源于AMM机制的恒定乘积公式;当价格偏离越大,损失越高,例如ETH从1500美元涨至3000美元(Δ=2),按IL = 1 – (2√Δ)/(1+Δ)计算,损失约5.7%;可通过选择稳定币对、获取手续费收益及参与激励计划来减轻影…

    2025年12月11日
    000
  • 假空投网站有哪些特点_用户应该怎么识别恶意页面

    假空投网站通过伪造官方页面诱导用户泄露私钥或签署恶意交易,需谨慎识别。一、检查域名真实性,核对完整网址是否存在拼写错误或非常用后缀,悬停查看链接真实地址,手动输入官网链接避免跳转。二、警惕索要助记词或私钥的行为,正规项目不会要求输入密钥信息,钱 包授权仅需签名确认。三、核实项目官方公告渠道,通过官网…

    2025年12月11日
    000
  • 如何加入加密程序员社区_用户应该怎么通过GitHub贡献代码

    创建GitHub账户并配置安全设置是参与加密开源项目的第一步,需注册账号、验证邮箱、完善信息并启用双因素认证;接着通过搜索“crypto”等关键词寻找高星且活跃的项目,查看README和CONTRIBUTING指南,选择标有”good first issue”的议题;随后Fo…

    2025年12月11日
    000
  • 如何跟踪链上热点_用户应该怎么使用AI搜索链上事件提高监控效率

    利用AI搜索技术跟踪链上热点可显著提升监控效率。一、使用AI驱动的链上搜索引擎,支持自然语言查询,如“过去24小时USDT最大单笔转出是谁”,系统返回含地址、金额、时间及风险标签的结构化答案,并可跳转至交易详情页验证。二、配置实时事件智能告警,通过设定AI判断规则(如高风险合约且交易额超100万美元…

    2025年12月11日
    000
  • 如何用AI做学习助手_用户应该怎么构建个性化加密学习体系

    明确学习目标后,用户可通过AI构建加密知识图谱、定制每日任务、互动问答及实战反馈,系统化掌握区块链技能。 Binance币安 欧易OKX ️ Huobi火币️ 一、明确学习目标与方向 在构建个性化加密学习体系前,用户需清晰界定自身想掌握的知识领域,例如智能合约开发、链上数据分析或DeFi机制设计。这…

    2025年12月11日
    000
  • 如何监控链上趋势_用户应该怎么使用AI工具提高监控效率

    利用AI工具实时分析区块链数据可高效监控市场趋势与异常活动。首先通过Chainalysis等平台追踪鲸鱼地址,设置超百万美元转账提醒,重点关注流入交易所的资金动向;其次使用Glassnode等AI工具检测前50币种的异常交易模式,识别洗盘或拉高出货行为,并结合社交媒体情绪验证操纵嫌疑;最后构建LST…

    2025年12月11日
    000
  • AI辅助交易是什么_用户应该怎么利用AI进行策略回测

    AI辅助回测通过历史数据模拟交易策略,评估其盈利与风险。用户需选择合规平台,导入完整K线数据,输入交易逻辑并设置贴近实盘的参数,运行回测获取收益率、最大回撤等指标。在优化阶段,AI可遍历参数组合,采用网格搜索法寻找最优配置,但需防范过度拟合。应使用样本外数据验证泛化能力,确保策略稳健。为进一步提升性…

    2025年12月11日
    000
  • 怎么订阅链上快讯_用户应该怎么筛选可信媒体

    首先通过API服务订阅链上快讯,如在蜜蜂查官网注册并获取API密钥,调用支持中文的接口实时获取资讯;其次可采用去中心化消息协议,部署支持AMOP的区块链节点,配置公私钥和订阅话题以接收加密消息;最后需筛选可信媒体源,优先选择有声誉、信息透明、引用可靠数据且经多信源验证的媒体,避免匿名或传播未经证实消…

    2025年12月11日
    000
  • 节点是什么_为什么节点分布影响区块链的去中心化水平

    节点是区块链去中心化的基础,其分布广泛性直接影响网络抗审查与安全性;通过优化软件、简化操作、社区支持和资助计划可提升节点均衡性,结合监控工具识别集中风险并调整网络策略以维护去中心化。 Binance币安 欧易OKX ️ Huobi火币️ 节点是区块链网络中的基础组成部分,负责验证和传播交易与区块信息…

    2025年12月11日
    000
  • 手续费Gas是什么_为什么Gas变化会影响链上交互成本

    Gas是区块链交易成本的核心,其价格由基础费和小费构成,受网络拥堵影响动态调整;用户通过支付Gas激励矿工打包交易,不同链采用差异化的Gas机制以优化成本与效率。 Binance币安 欧易OKX ️ Huobi火币️ Gas是区块链网络中执行操作所需的计算资源单位,其价格波动直接影响交易成本。 一、…

    2025年12月11日
    000
  • AI交易Agent是什么_用户应该怎么使用智能代理提高效率

    AI交易Agent通过配置个性化策略、集成实时数据、多因子回测与异常应对机制实现智能交易。首先设定风险收益参数并选择资产类别,确保策略匹配投资风格;接着接入权威API获取资金费率与订单簿等数据,保障分析时效性;随后利用历史数据回测,筛选夏普比率高于2的优质配置;最后设置15%价格波动阈值触发减仓或人…

    2025年12月11日
    000
  • 比特币有几个公链和私链 一文了解币圈

    比特币只有一个主链,即公共区块链;公链开放去中心化,私链由中心化机构控制;分叉链是独立新公链,并非比特币私链。 对于初入加密资产领域的朋友来说,经常会困惑于各种“链”的概念。本文将清晰地解答一个核心问题:比特币究竟有几个链,并以此为切入点,帮助您快速理解公链与私链的区别,为您的探索之旅打下坚实基础。…

    2025年12月11日
    000

发表回复

登录后才能评论
关注微信