PyTorch模型导出ONNX：在无PyTorch环境中高效推理

程序猿 • 2025年12月14日 11:38:39 • 好文分享 • 阅读 0

本文介绍如何在不依赖PyTorch的环境中部署和运行PyTorch训练的模型。针对软件依赖限制，核心方案是利用PyTorch的ONNX导出功能，将模型转换为通用ONNX格式。这使得模型能在轻量级运行时（如ONNX Runtime）中高效执行推理，从而避免在部署环境中安装庞大的PyTorch库，实现模型与框架的解耦，满足最小依赖软件的需求。

在现代软件开发中，深度学习模型的集成越来越普遍。然而，像pytorch这样的深度学习框架虽然功能强大，但其完整的安装包通常较大，包含众多依赖项。这对于那些追求最小化依赖、轻量级部署或在资源受限环境中运行的软件来说，构成了一个显著的挑战。例如，在嵌入式系统、边缘设备或对运行时环境有严格限制的应用中，直接引入pytorch库是不切实际的。本文将详细阐述如何通过将pytorch模型导出为onnx（open neural network exchange）格式，实现在不安装pytorch的环境中进行高效模型推理。

1. 理解ONNX及其优势

ONNX是一个开放标准，旨在统一深度学习模型表示，促进不同框架之间的模型互操作性。它允许开发者在一个框架（如PyTorch）中训练模型，然后将其导出为ONNX格式，并在另一个框架或运行时（如ONNX Runtime）中进行部署和推理。

ONNX的主要优势包括：

框架无关性： 模型一旦导出为ONNX，便不再依赖于原始训练框架。性能优化： ONNX运行时（如ONNX Runtime）通常经过高度优化，能够利用多种硬件加速器（CPU、GPU、NPU等），提供比原生框架更快的推理速度。部署灵活性： ONNX模型可以在多种操作系统和编程语言环境中部署，极大地简化了跨平台集成。最小化依赖： 部署ONNX模型通常只需要ONNX Runtime库，而非完整的深度学习框架，显著降低了软件的依赖负担。

2. PyTorch模型导出为ONNX格式

将PyTorch模型导出为ONNX格式是实现无PyTorch环境推理的第一步。PyTorch提供了一个内置的torch.onnx.export函数来完成这项任务。

示例代码：模型训练与导出

假设我们有一个简单的PyTorch模型：

import torchimport torch.nn as nnimport numpy as np# 定义一个简单的模型class SimpleModel(nn.Module):    def __init__(self):        super(SimpleModel, self).__init__()        self.fc = nn.Linear(10, 2) # 输入10个特征，输出2个类别    def forward(self, x):        return self.fc(x)# 实例化模型并加载预训练权重（此处简化为随机初始化）model = SimpleModel()# 实际应用中，这里会加载训练好的模型权重，例如：# model.load_state_dict(torch.load('path/to/your/model_weights.pth'))model.eval() # 切换到评估模式，这对于导出ONNX至关重要，因为它会禁用Dropout等训练特有的层# 准备一个虚拟输入张量，用于追踪模型计算图# 这个虚拟输入的形状和数据类型必须与模型的实际输入匹配dummy_input = torch.randn(1, 10) # 批大小为1，输入特征为10的张量# 定义ONNX模型的保存路径onnx_path = "MLmodel.onnx"# 导出模型到ONNXtry:    torch.onnx.export(model,                       dummy_input,                       onnx_path,                       export_params=True,        # 导出模型的所有参数（权重和偏置）                       opset_version=11,          # 指定ONNX操作集版本，通常选择最新稳定版本                       do_constant_folding=True,  # 是否执行常量折叠优化                       input_names=['input_tensor'], # 定义输入张量的名称                       output_names=['output_tensor'],# 定义输出张量的名称                       dynamic_axes={'input_tensor': {0: 'batch_size'},    # 声明输入张量的批次维度是动态的                                     'output_tensor': {0: 'batch_size'}})   # 声明输出张量的批次维度是动态的    print(f"模型已成功导出到 {onnx_path}")except Exception as e:    print(f"模型导出失败: {e}")

torch.onnx.export关键参数说明：

model: 要导出的torch.nn.Module实例。args: 一个或一组虚拟输入张量，PyTorch会通过跟踪这些输入在模型中的流动来构建计算图。f: 输出ONNX文件的路径。export_params: 如果为True，则将模型的权重和偏置作为常量嵌入到ONNX图中。opset_version: 指定ONNX操作集版本。选择一个与目标ONNX Runtime版本兼容的版本。do_constant_folding: 是否执行常量折叠优化，有助于减小模型大小和提高推理效率。input_names, output_names: 给出输入和输出张量的名称，这有助于在ONNX Runtime中识别它们。dynamic_axes: 这是一个字典，用于指定哪些维度是动态的。例如，{‘input_tensor’: {0: ‘batch_size’}}表示名为input_tensor的输入的第0维（通常是批次维度）是可变的。这对于处理不同批次大小的输入非常重要。

3. 在无PyTorch环境中进行推理

模型导出为ONNX格式后，我们就可以在任何支持ONNX Runtime的环境中进行推理，而无需安装PyTorch。

示例代码：使用ONNX Runtime进行推理

import onnxruntime as ortimport numpy as np# ONNX模型的路径onnx_path = "MLmodel.onnx"try:    # 创建ONNX Runtime会话    # providers参数可以指定运行时使用的执行提供者，例如'CPUExecutionProvider'或'CUDAExecutionProvider'    # 默认情况下，ONNX Runtime会尝试使用可用的最优化提供者。    session = ort.InferenceSession(onnx_path, providers=['CPUExecutionProvider'])    # 获取模型的输入和输出名称    # ONNX Runtime的输入和输出信息存储在session.get_inputs()和session.get_outputs()中    input_name = session.get_inputs()[0].name    output_name = session.get_outputs()[0].name    print(f"模型输入名称: {input_name}")    print(f"模型输出名称: {output_name}")    # 准备输入数据    # 输入数据必须是NumPy数组，并且数据类型（如np.float32）和形状要与ONNX模型期望的匹配    # 假设模型的输入是 (batch_size, 10)    A = np.random.rand(1, 10).astype(np.float32) # 单个样本，10个特征，数据类型为float32    print(f"输入数据形状: {A.shape}, 类型: {A.dtype}")    # 执行推理    # session.run()方法接收一个输出名称列表和一个输入字典    results = session.run([output_name], {input_name: A})    Result = results[0] # ONNX Runtime返回一个列表，通常我们取第一个元素作为结果    print("推理结果:", Result)except Exception as e:    print(f"ONNX Runtime推理失败: {e}")

注意事项：

安装ONNX Runtime： 在部署环境中，需要安装ONNX Runtime库。可以通过pip install onnxruntime（CPU版本）或pip install onnxruntime-gpu（GPU版本）进行安装。数据类型匹配： ONNX模型通常期望float32类型的数据。在准备输入NumPy数组时，务必使用.astype(np.float32)来确保数据类型匹配。输入形状匹配： 输入NumPy数组的形状必须与ONNX模型在导出时定义的输入形状兼容，特别是要考虑动态轴。C++集成： ONNX Runtime提供C/C++/Python/Java等多种语言的API。对于需要与C++项目集成的场景（如PyBind11），可以直接使用ONNX Runtime的C++ API来加载和运行ONNX模型，实现高效且无Python依赖的推理。

4. 总结

通过将PyTorch模型导出为ONNX格式，我们成功地解决了在不依赖PyTorch的环境中进行模型推理的问题。ONNX标准和ONNX Runtime提供了一个强大、灵活且高效的解决方案，特别适用于以下场景：

最小化依赖软件： 当目标部署环境对软件依赖有严格限制时。跨平台部署： 需要在不同操作系统或硬件架构上运行模型。性能优化： 追求比原生框架更快的推理速度。多语言集成： 方便地将模型集成到C++、Java等非Python应用中。

遵循本文提供的步骤和注意事项，开发者可以有效地将PyTorch训练的强大模型部署到更广泛、更受限的应用场景中，实现深度学习模型的真正“一次训练，随处部署”。

以上就是PyTorch模型导出ONNX：在无PyTorch环境中高效推理的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1371662.html

c++java python session 多语言大模型操作系统深度学习硬件加速编程语言软件开发

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Python while 循环中的常见陷阱：类型不匹配与循环控制

上一篇 2025年12月14日 11:38:33

python怎么反转一个字符串或列表_python字符串与列表反转方法

下一篇 2025年12月14日 11:38:44

好文分享

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
3000
好文分享

使用 Mask 导入本地图片时，如何解决跨域问题？

跨域疑难：如何解决 mask 引入本地图片产生的跨域问题？在使用 mask 导入本地图片时，你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢？让我们深入了解一下： mask 框架假设你以 http(s) 协议加载你的 html 文件，而当使用 file:// 协议打开本地文件时，就会产生跨域…

程序猿
2025年12月24日
3000
好文分享

构建模拟：从头开始的实时交易模拟器

简介嘿，开发社区！我很高兴分享我的业余项目 Simul8or – 一个实时日间交易模拟器，旨在为用户提供一个无风险的环境来练习交易策略。该项目 100% 构建在 ASP.NET WebForms、C#、JavaScript、CSS 和 SQL Server 技术堆栈上，没有外部库或框架。从头开始构…

程序猿
2025年12月24日
4000
好文分享

Bear 博客上的浅色/深色模式分步指南

我最近使用偏好颜色方案媒体功能与 light-dark() 颜色函数相结合，在我的 bear 博客上实现了亮/暗模式切换。我是这样做的。第 1 步：设置 css css 在过去几年中获得了一些很酷的新功能，包括 light-dark() 颜色函数。此功能可让您为任何元素指定两种颜色 &#8211…

程序猿
2025年12月24日
2000
好文分享

CSS定位溢出隐藏时出现内容与边框之间的缝隙该如何解决？

css 定位溢出隐藏边框和内容之前出现缝隙？问题中遇到的缝隙问题是由非整数或非整倍缩放导致的。这不仅限于使用溢出隐藏，即使是在普通情况下，例如两个 div 嵌套且内部 div 和外部 div 的边框紧贴在一起时，也可能出现此问题。原因：当尺寸以小数像素或非整倍缩放时，浏览器的渲染引擎将无…

程序猿
2025年12月24日
0000
好文分享

如何在 Web 开发中检测浏览器中的操作系统暗模式？

检测浏览器中的操作系统暗模式在 web 开发中，用户界面适应操作系统（os）的暗模式设置变得越来越重要。本文将重点介绍检测浏览器中 os 暗模式的方法，从而使网站能够针对不同模式调整其设计。 w3c media queries level 5 最新的 web 标准引入了 prefers-color…

程序猿
2025年12月24日
1000
好文分享

如何使用 CSS 检测操作系统是否处于暗模式？

如何在浏览器中检测操作系统是否处于暗模式？新发布的 os x 暗模式提供了在 mac 电脑上使用更具沉浸感的用户界面，但我们很多人都想知道如何在浏览器中检测这种设置。新标准检测操作系统暗模式的解决方案出现在 w3c media queries level 5 中的最新标准中：立即学习“前端免…

程序猿
2025年12月24日
1000
好文分享

如何检测浏览器环境中的操作系统暗模式？

浏览器环境中的操作系统暗模式检测在如今科技的海洋中，越来越多的设备和软件支持暗模式，以减少对眼睛的刺激并营造更舒适的视觉体验。然而，在浏览器环境中检测操作系统是否处于暗模式却是一个令人好奇的问题。检测暗模式的标准要检测操作系统在浏览器中是否处于暗模式，web 开发人员可以使用 w3c 的媒体查…

程序猿
2025年12月24日
3000
好文分享

浏览器中如何检测操作系统的暗模式设置？

浏览器中的操作系统暗模式检测近年来，随着用户对夜间浏览体验的偏好不断提高，操作系统已开始引入暗模式功能。作为一名 web 开发人员，您可能想知道如何检测浏览器中操作系统的暗模式状态，以相应地调整您网站的设计。新 media queries 水平 w3c 的 media queries level…

程序猿
2025年12月24日
1000
好文分享

正则表达式在文本验证中的常见问题有哪些？

正则表达式助力文本输入验证在文本输入框的验证中，经常遇到需要限定输入内容的情况。例如，输入框只能输入整数，第一位可以为负号。对于不会使用正则表达式的人来说，这可能是个难题。下面我们将提供三种正则表达式，分别满足不同的验证要求。 1. 可选负号，任意数量数字如果输入框中允许第一位为负号，后面可输入…

程序猿
2025年12月24日
3000
好文分享

我在学习编程的第一周学到的工具

作为一个刚刚完成中学教育的女孩和一个精通技术并热衷于解决问题的人，几周前我开始了我的编程之旅。我的名字是OKESANJO FATHIA OPEYEMI。我很高兴能分享我在编码世界中的经验和发现。拥有计算机科学背景的我一直对编程提供的无限可能性着迷。在这篇文章中，我将反思我在学习编程的第一周中获得的关…

程序猿
2025年12月24日
1000
好文分享

为什么多年的经验让我选择全栈而不是平均栈

在全栈和平均栈开发方面工作了 6 年多，我可以告诉您，虽然这两种方法都是流行且有效的方法，但它们满足不同的需求，并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序，但它们的实现方式却截然不同。如果您在两者之间难以选择，我希望我在两者之间的经验能给您一些有用的见解。在这篇文章中，我…

程序猿
2025年12月24日
3000
好文分享

掌握 Web 动画：CSS 与未优化和优化的 JavaScript 性能

网页动画可以显着改善用户体验，但如果实施不仔细，也会影响网站性能。在本文中，我将比较三种不同的方法来对大小脉冲的圆形元素进行动画处理。我将使用 css、未优化的 javascript 和优化的 javascript，并向您展示如何使用 chrome devtools 衡量它们的性能。网页动画简介 …

程序猿
2025年12月24日
1000
降低性能的两行 CSS（fps 到 ps）

我最近发布了 learn wc，如果您看过它，您可能已经注意到背景中的动画，其中彩色圆圈在屏幕上对角移动。看起来像这样：它在 chrome 和 safari 上运行良好，但我注意到 firefox 上的性能严重下降。性能太差了，我直接在 firefox 中禁用了这个动画。动画是如何运作的？动…

程序猿
2025年12月24日 • 好文分享
0000
好文分享

姜戈顺风

本教程演示如何在新项目中从头开始配置 django 和 tailwindcss。 django 设置创建一个名为 .venv 的新虚拟环境。 # windows$ python -m venv .venv$ .venvscriptsactivate.ps1(.venv) $# macos/linu…

程序猿
2025年12月24日
1000
好文分享

花 $o 学习这些编程语言或免费

→ Python → JavaScript → Java → C# → 红宝石 → 斯威夫特 → 科特林 → C++ → PHP → 出发 → R → 打字稿 []https://x.com/e_opore/status/1811567830594388315?t=_j4nncuiy2wfbm7ic…

程序猿
2025年12月24日
0000
好文分享

css中的video怎么提高画质

在 CSS 中提高视频画质的方法包括：使用高分辨率视频优化视频文件大小调节播放速率使用 CSS 控制（object-fit、background-size、filter）使用硬件加速考虑不同设备的播放能力如何提高 CSS 中视频的画质在 CSS 中，可以通过多种方法提高视频的画质，从而改善用户体…

程序猿
2025年12月24日
0000
好文分享

揭秘主流编程语言中的基本数据类型分类

标题：基本数据类型大揭秘：了解主流编程语言中的分类正文：在各种编程语言中，数据类型是非常重要的概念，它定义了可以在程序中使用的不同类型的数据。对于程序员来说，了解主流编程语言中的基本数据类型是建立坚实程序基础的第一步。目前，大多数主流编程语言都支持一些基本的数据类型，它们在语言之间可能有所差异…

程序猿
2025年12月24日
0000
好文分享

css和c的区别是什么

区别是：1、C语言是一门面向过程、抽象化的通用程序设计语言、计算机编程语言，广泛应用于底层开发；2、CSS是一种用来表现HTML或XML等文件样式的计算机语言，可以做到网页和内容进行分离的一种样式语言。本教程操作环境：windows7系统、CSS3&&HTML5版、Dell G3电…

程序猿
2025年12月24日
1000
在桌面端和移动端用CSS开启硬件加速实例代码

你知道我们可以在浏览器中用css开启硬件加速，使GPU (Graphics Processing Unit) 发挥功能，从而提升性能吗？现在大多数电脑的显卡都支持硬件加速。鉴于此，我们可以发挥GPU的力量，从而使我们的网站或应用表现的更为流畅。在桌面端和移动端用CSS开启硬件加速 CSS ani…

程序猿
好文分享 2025年12月23日
0000