CFFI中处理嵌套void*结构体与内存生命周期管理教程

程序猿 • 2025年11月29日 04:00:46 • 用户投稿 • 阅读 0

在使用python的cffi库与c语言进行交互时，尤其是在处理涉及复杂数据结构和多层指针（特别是`void*`）的场景下，内存管理是一个常见的挑战。本教程将深入探讨一个典型问题：当c函数返回一个包含指向其内部栈上局部变量的指针的结构体时，如何在python中安全地接收、传递并重新传递给c函数，避免内存损坏和段错误。我们将通过一个具体的例子来分析问题根源，并提供一个健壮的解决方案。

理解问题：CFFI与C语言间复杂数据结构的内存挑战

当C代码创建了一个包含嵌套结构体，且这些嵌套结构体通过void*指针链接，然后将顶层结构体返回给Python CFFI时，如果C语言中这些嵌套结构体是在栈上分配的，那么在C函数返回后，它们所占据的内存区域将变得无效。Python CFFI虽然可以接收这个结构体，但其内部的指针将指向已失效的内存地址，导致后续操作（如将此结构体传回C函数进行访问）时发生段错误或数据损坏。

考虑以下C语言定义：

test.h

typedef enum State {    state_1 = 0,    state_2,    state_3,    state_4} state_t;typedef struct buffer {    char* name;    state_t state;    void* next;} buffer_t;typedef struct buffer_next {    char* name;    state_t state;    void* next;} buffer_next_t;typedef struct buffer_next_next {    char* name;    state_t state;    void* next;} buffer_next_next_t;extern buffer_t createBuffer();extern int accessBuffer(buffer_t buffer);

以及对应的C实现：

test.c

#include  // For printf// ... (struct and enum definitions from test.h)buffer_t createBuffer(){    buffer_next_next_t bufferNN; // 栈上分配    buffer_next_t bufferN;       // 栈上分配    buffer_t buffer;             // 栈上分配    bufferNN.name = "buffer_next_next";    bufferNN.state = 3;    bufferNN.next = NULL; // 确保最内层指针初始化    bufferN.name = "buffer_next";    bufferN.state = 2;    bufferN.next = &bufferNN; // 指向栈上局部变量    buffer.name = "buffer";    buffer.state = 1;    buffer.next = &bufferN; // 指向栈上局部变量    // 在C函数内部访问是安全的，因为此时栈帧仍有效    // accessBuffer(buffer);     return buffer; // 返回一个副本，但内部指针仍指向栈上}int accessBuffer(buffer_t buffer){    // 强制类型转换并解引用void*指针    buffer_next_t *buffer_next = (buffer_next_t*)buffer.next;    buffer_next_next_t *buffer_next_next = (buffer_next_next_t*)buffer_next->next;    printf("%s, %s, %sn", buffer.name, buffer_next->name, buffer_next_next->name);    return 0;}

在上述C代码中，createBuffer函数在栈上分配了bufferNN、bufferN和buffer这三个结构体。bufferN.next指向bufferNN的地址，buffer.next指向bufferN的地址。当createBuffer函数返回时，其栈帧被销毁，bufferNN和bufferN所占用的内存区域将不再有效，成为“野指针”。

CFFI的ABI模式集成与问题复现

使用CFFI的ABI模式与上述C代码交互的Python脚本如下：

test.py

import osimport subprocessfrom cffi import FFIffi = FFI()here = os.path.abspath(os.path.dirname(__file__))header = os.path.join(here, 'test.h')# 使用cc -E预处理头文件以获取完整的C定义ffi.cdef(subprocess.Popen([    'cc', '-E',    header], stdout=subprocess.PIPE).communicate()[0].decode('UTF-8'))# 加载编译后的共享库lib = ffi.dlopen(os.path.join(here, 'test.so'))# 调用C函数创建buffervalue = lib.createBuffer()print(value) # 打印CFFI对象表示lib.accessBuffer(value) # 再次将CFFI对象传回C函数

运行此Python代码，通常会在lib.accessBuffer(value)这一行触发段错误。这是因为当createBuffer函数返回后，value（一个buffer_t的Python CFFI表示）内部的next指针指向了无效的内存区域。当accessBuffer尝试解引用这些野指针时，就会导致程序崩溃。

通过GDB调试可以清晰地看到这一过程：

C函数内部调用accessBuffer时 (正常)

MewXAI

一站式AI绘画平台，支持AI视频、AI头像、AI壁纸、AI艺术字、可控AI绘画等功能

311 查看详情

(gdb) p buffer$15 = {name = 0x7ffff77ff01d "buffer", state = state_2, next = 0x7fffffffd860}(gdb) p ((buffer_next_t*)buffer.next)[0]$16 = {name = 0x7ffff77ff011 "buffer_next", state = state_3, next = 0x7fffffffd880}(gdb) p ((buffer_next_next_t*)buffer_next->next)[0]$17 = {name = 0x7ffff77ff000 "buffer_next_next", state = state_4, next = 0x1}

此时指针指向的内存内容是正确的。

Python调用lib.accessBuffer(value)时 (段错误)

(gdb) p buffer$18 = {name = 0x7ffff77ff01d "buffer", state = state_2, next = 0x7fffffffd860}(gdb) p ((buffer_next_t*)buffer.next)[0]$19 = {name = 0x963190 "", state = 8, next = 0x7fffffffd948} // name已损坏(gdb) p ((buffer_next_next_t*)buffer_next->next)[0]$20 = {name = 0x1 , state = 8, next = 0x0} // name指向非法地址

可以看到，当Python将value传回C函数时，其内部的name指针和next指针已经指向了无效或被覆盖的内存区域，导致解引用时出错。

解决方案：在Python中管理内存分配

解决这个问题的关键在于，确保所有被指针引用的数据结构，其内存生命周期能够持续到它们不再被使用为止。在CFFI的场景下，这意味着我们需要在Python侧使用ffi.new()来分配这些C数据结构，从而让Python的垃圾回收机制来管理它们的生命周期。

步骤1：在Python中分配字符串内存CFFI中的字符串需要特别处理。我们可以使用ffi.new(“char[SIZE]”, b”string_value”)来分配一个C风格的字符数组，并用字节字符串初始化它。

步骤2：在Python中分配嵌套结构体内存对于buffer_t、buffer_next_t和buffer_next_next_t，我们应该使用ffi.new(“STRUCT_TYPE *”)来分配指向这些结构体的指针。这样分配的内存是在Python的控制之下，不会在C函数返回后立即失效。

步骤3：链接结构体将分配好的字符串和嵌套结构体通过.name和.next属性正确地链接起来。

下面是修正后的Python代码：

import osimport subprocessfrom cffi import FFIffi = FFI()here = os.path.abspath(os.path.dirname(__file__))header = os.path.join(here, 'test.h')ffi.cdef(subprocess.Popen([    'cc', '-E',    header], stdout=subprocess.PIPE).communicate()[0].decode('UTF-8'))lib = ffi.dlopen(os.path.join(here, 'test.so'))# --- 在Python中分配和管理所有内存 ---# 1. 分配字符串内存name_bnn = ffi.new("char[20]", b"buffer_next_next")name_bn = ffi.new("char[20]", b"buffer_next")name_b = ffi.new("char[20]", b"buffer")# 2. 分配嵌套结构体内存 (使用指针类型)bufferNN_py = ffi.new("buffer_next_next_t *")bufferNN_py.name = name_bnnbufferNN_py.state = 3bufferNN_py.next = ffi.NULL # 最内层指针可以设为NULLbufferN_py = ffi.new("buffer_next_t *")bufferN_py.name = name_bnbufferN_py.state = 2bufferN_py.next = bufferNN_py # 指向Python管理的内存buffer_py = ffi.new("buffer_t *")buffer_py.name = name_bbuffer_py.state = 1buffer_py.next = bufferN_py # 指向Python管理的内存# 3. 将Python创建的结构体（通过解引用指针）传递给C函数# 注意：accessBuffer期望的是buffer_t类型，所以传递 buffer_py[0]lib.accessBuffer(buffer_py[0])# 此时，如果C的createBuffer函数仍然存在，且你希望测试其返回值，可以继续调用# value_from_c = lib.createBuffer()# print(value_from_c)# lib.accessBuffer(value_from_c) # 这仍然会导致段错误，因为C函数返回的是野指针print("Successfully accessed buffer from Python-managed memory.")

运行这段修正后的Python代码，将不再出现段错误，并且C函数会正确打印出所有字符串。

buffer, buffer_next, buffer_next_nextSuccessfully accessed buffer from Python-managed memory.

通过GDB调试验证：

(gdb) p buffer$4 = {name = 0xa967d0 "buffer", state = state_2, next = 0xa3ab30}(gdb) p ((buffer_next_t*)buffer.next)[0]$5 = {name = 0x9e8220 "buffer_next", state = state_3, next = 0xb35620}(gdb) p ((buffer_next_next_t*)buffer_next->next)[0]$6 = {name = 0xa59d40 "buffer_next_next", state = state_4, next = 0x0}

此时，所有指针都指向有效的、由Python CFFI分配的内存地址，并且可以正确访问其内容。

注意事项与最佳实践

内存生命周期管理是关键： 在CFFI中，理解C和Python之间内存生命周期的差异至关重要。当C函数返回指向栈上局部变量的指针时，这些指针在函数返回后立即失效。ffi.new()的作用： ffi.new()是CFFI中分配C兼容内存的主要方式。它确保了分配的内存在Python的垃圾回收机制下得到管理，只要Python对象（如buffer_py）存在，其指向的C内存就有效。字符串处理： CFFI需要字节字符串（b”…”）来初始化C的char*或char[]。使用ffi.new(“char[SIZE]”, b”…”)是创建C字符串的安全方式。指针类型与值类型： 当C函数期望一个结构体值（例如int accessBuffer(buffer_t buffer)），而你在Python中用ffi.new(“buffer_t *”)分配了一个指针时，需要通过解引用（例如buffer_py[0]）来传递结构体的值。CFFI的ABI模式与API模式： 本文主要讨论ABI模式，其中CFFI通过加载共享库并在运行时解析符号来工作。在API模式下，你可以直接从C源代码生成接口，可能在某些情况下提供更紧密的集成和更好的类型检查。然而，内存管理原则依然适用。避免C函数返回野指针： 如果C代码必须创建复杂的数据结构并将其传递给Python，应确保这些结构体及其嵌套内容在堆上分配（例如使用malloc），并明确约定由哪一方负责释放内存，以避免内存泄漏。

总结

通过CFFI在Python和C之间传递包含多层void*指针的复杂结构体时，核心挑战在于确保所有指针指向的内存区域在整个交互过程中都保持有效。当C函数返回的结构体内部指针指向栈上局部变量时，会导致内存损坏。通过在Python侧使用ffi.new()来分配所有相关的C数据结构和字符串内存，我们可以将内存的生命周期管理委托给Python，从而有效地解决了这一问题，确保了程序稳定运行和数据完整性。

以上就是CFFI中处理嵌套void*结构体与内存生命周期管理教程的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/913586.html

access c++c语言 python python脚本 typedef 字节栈

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

金士顿固态硬盘怎么样

上一篇 2025年11月29日 04:00:42

崩坏星穹铁道命运重渊宝箱位置-崩铁雅努萨波利斯宝箱位置在哪

下一篇 2025年11月29日 04:00:48

好文分享

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
3000
好文分享

使用 Mask 导入本地图片时，如何解决跨域问题？

跨域疑难：如何解决 mask 引入本地图片产生的跨域问题？在使用 mask 导入本地图片时，你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢？让我们深入了解一下： mask 框架假设你以 http(s) 协议加载你的 html 文件，而当使用 file:// 协议打开本地文件时，就会产生跨域…

程序猿
2025年12月24日
3000
好文分享

构建模拟：从头开始的实时交易模拟器

简介嘿，开发社区！我很高兴分享我的业余项目 Simul8or – 一个实时日间交易模拟器，旨在为用户提供一个无风险的环境来练习交易策略。该项目 100% 构建在 ASP.NET WebForms、C#、JavaScript、CSS 和 SQL Server 技术堆栈上，没有外部库或框架。从头开始构…

程序猿
2025年12月24日
4000
好文分享

正则表达式在文本验证中的常见问题有哪些？

正则表达式助力文本输入验证在文本输入框的验证中，经常遇到需要限定输入内容的情况。例如，输入框只能输入整数，第一位可以为负号。对于不会使用正则表达式的人来说，这可能是个难题。下面我们将提供三种正则表达式，分别满足不同的验证要求。 1. 可选负号，任意数量数字如果输入框中允许第一位为负号，后面可输入…

程序猿
2025年12月24日
3000
使用 React 构建 Fylo 云存储网站

介绍在这篇博文中，我们将逐步介绍如何使用 react 创建一个功能丰富的云存储网站。该网站受 fylo 启发，提供了主页、功能、工作原理、感言和页脚等部分。在此过程中，我们将讨论用于构建这个完全响应式网站的结构、组件和样式。项目概况该项目由多个部分组成，旨在展示云存储服务。每个部分都是用 re…

程序猿
2025年12月24日 • 好文分享
0000
使用 React 构建食谱查找器网站

介绍在本博客中，我们将使用 react 构建一个食谱查找网站。该应用程序允许用户搜索他们最喜欢的食谱，查看趋势或新食谱，并保存他们最喜欢的食谱。我们将利用 edamam api 获取实时食谱数据并将其动态显示在网站上。项目概况食谱查找器允许用户：按名称搜索食谱。查看趋势和新添加的食谱。查看各…

程序猿
2025年12月24日 • 好文分享
2000
好文分享

为什么多年的经验让我选择全栈而不是平均栈

在全栈和平均栈开发方面工作了 6 年多，我可以告诉您，虽然这两种方法都是流行且有效的方法，但它们满足不同的需求，并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序，但它们的实现方式却截然不同。如果您在两者之间难以选择，我希望我在两者之间的经验能给您一些有用的见解。在这篇文章中，我…

程序猿
2025年12月24日
3000
好文分享

姜戈顺风

本教程演示如何在新项目中从头开始配置 django 和 tailwindcss。 django 设置创建一个名为 .venv 的新虚拟环境。 # windows$ python -m venv .venv$ .venvscriptsactivate.ps1(.venv) $# macos/linu…

程序猿
2025年12月24日
1000
好文分享

不可变数据结构：ECMA 4 中的记录和元组

不可变数据结构：ecmascript 2024 中的新功能 ecmascript 2024 引入了几个令人兴奋的更新，但对我来说最突出的一个功能是引入了不可变数据结构。这些新结构——记录和元组——改变了 javascript 中数据管理的游戏规则。它们提供了一种令人满意的方式来保持我们的数据健全、安…

程序猿
2025年12月24日
0000
好文分享

花 $o 学习这些编程语言或免费

→ Python → JavaScript → Java → C# → 红宝石 → 斯威夫特 → 科特林 → C++ → PHP → 出发 → R → 打字稿 []https://x.com/e_opore/status/1811567830594388315?t=_j4nncuiy2wfbm7ic…

程序猿
2025年12月24日
0000
好文分享

css和c的区别是什么

区别是：1、C语言是一门面向过程、抽象化的通用程序设计语言、计算机编程语言，广泛应用于底层开发；2、CSS是一种用来表现HTML或XML等文件样式的计算机语言，可以做到网页和内容进行分离的一种样式语言。本教程操作环境：windows7系统、CSS3&&HTML5版、Dell G3电…

程序猿
2025年12月24日
1000
好文分享

html5怎么导视频_html5用video标签导出或Canvas转DataURL获视频【导出】

HTML5无法直接导出video标签内容，需借助Canvas捕获帧并结合MediaRecorder API、FFmpeg.wasm或服务端协同实现。MediaRecorder适用于WebM格式前端录制；FFmpeg.wasm支持MP4等格式及精细编码控制；服务端方案适合高负载场景。如果您希望在网页…

程序猿
2025年12月23日
4000
好文分享

如何查看编写的html_查看自己编写的HTML文件效果【效果】

要查看HTML文件的浏览器渲染效果，需确保文件以.html为扩展名保存、用浏览器直接打开、利用开发者工具调试、必要时启用本地HTTP服务器、或使用编辑器实时预览插件。如果您编写了HTML代码，但无法直观看到其在浏览器中的实际渲染效果，则可能是由于文件未正确保存、未使用浏览器打开或文件扩展名设置错误…

程序猿
2025年12月23日
4000
好文分享

html5怎么加php_html5用Ajax与PHP后端交互实现数据传递【交互】

HTML5不能直接运行PHP，需通过Ajax与PHP通信：前端用fetch发送请求，PHP接收处理并返回JSON，前端解析响应更新DOM；注意跨域、编码、CSRF防护和输入过滤。 HTML5 本身是前端标记语言，不能直接运行 PHP 代码，但可以通过 Ajax（异步 JavaScript）与 PHP…

程序猿
2025年12月23日
3000
好文分享

HTML5怎么制作广告_HTML5用动画与交互制横幅或弹窗广告吸引点击【制作】

可利用HTML5结合CSS3动画、Canvas、Web Animations API、Intersection Observer和video标签制作互动广告：一用@keyframes实现横幅入场动画；二用Canvas绘制并响应悬停；三用Web Animations API控制弹窗时序；四用Inter…

程序猿
2025年12月23日
3000
好文分享

html5怎么打包运行_HT5用Webpack或Gulp打包后浏览器打开运行【打包】

应通过 HTTP 服务运行打包后的 HTML5 页面，而非双击打开：一、Webpack 配 webpack-dev-server 启动本地服务；二、Gulp 配 BrowserSync 提供实时重载；三、用 Python/Node.js 轻量 HTTP 工具托管 dist 目录；四、仅当必须双击运行…

程序猿
2025年12月23日
1000
好文分享

html5文件运行不出来怎么回事_析html5文件运行失败原因【解析】

首先检查文件扩展名和编码格式，确保为.html且使用UTF-8编码；接着验证HTML5结构完整性，包含及正确闭合的标签；然后排查外部资源路径是否正确，利用开发者工具查看404错误；排除浏览器兼容性问题，优先在现代浏览器中测试并避免未广泛支持的API；检查JavaScript语法错误与执行顺序，确保脚…

程序猿
2025年12月23日
1000
好文分享

html5怎么读取文件_html5用FileReader API读取本地文件内容或属性【读取】

HTML5的FileReader API支持读取本地文件内容及获取基本信息：一、通过input type=”file”获取File对象；二、用readAsText读取文本；三、用readAsDataURL生成Data URL预览资源；四、用readAsArrayBuffer读…

程序猿
2025年12月23日
1000
好文分享

html5怎么插入文档_HT5用object或iframe嵌入PDF/Word文档显示【插入】

可在HTML5中用iframe或object标签嵌入PDF，需设宽高及可访问路径；Word文档需借OneDrive等第三方服务代理渲染；须处理跨域限制并提供下载降级方案。如果您希望在HTML5页面中嵌入PDF或Word文档并直接显示，可以使用或标签实现。以下是几种可行的嵌入方法：一、使用ifra…

程序猿
2025年12月23日
3000
好文分享

html5怎么设置黑体_html5用CSS font-family设黑体或font-weight加粗【设置】

在HTML5中实现黑体及加粗需用CSS的font-family和font-weight：一、font-family按优先级列“SimHei”,“Microsoft YaHei”,“Heiti SC”,sans-serif；二、font-weight用700或bold；三、组合声明并注意继承；四、可用…

程序猿
2025年12月23日
1000