2D人体姿态关键点数据处理:JSON格式解析与模型适配策略

2d人体姿态关键点数据处理:json格式解析与模型适配策略

本文探讨了在2D人体姿态估计中,如何处理和适配特定JSON格式的关键点数据。针对用户自定义的`[x, y, confidence]`扁平化列表格式,文章指出直接寻找原生输出此格式的模型存在挑战。核心策略是理解现有数据结构,并根据目标姿态估计模型的输入要求进行数据重格式化。教程将提供JSON解析示例,并讨论关键点顺序、坐标归一化等重格式化要点,旨在帮助开发者高效地将自定义数据应用于主流姿态估计框架。

在2D人体姿态估计任务中,获取图像中人物的关键点坐标是核心目标。开发者常会遇到现有关键点数据(无论是标注数据还是其他模型输出)采用特定JSON格式,而主流姿态估计模型(如YOLOv8-pose、OpenPose、MediaPipe等)通常有其预定义的输入或输出格式。本文将针对类似以下示例的JSON格式数据,探讨如何进行解析、理解,并提出将其适配到主流姿态估计模型的方法。

理解自定义关键点JSON格式

我们首先分析提供的JSON数据结构。该格式将人体关键点表示为一个扁平化的列表,其中每个关键点由三个浮点数组成:[x坐标, y坐标, 置信度]。

{  "version": 1.0,  "people": [    {      "face_keypoints": [],      "pose_keypoints": [        104.81, 34.44, 0.91, // Keypoint 1 (x, y, confidence)        83.90, 80.05, 0.72, // Keypoint 2        // ... more keypoints ...        0, 0, 0,            // Missing or undetected keypoint        93.98, 28.16, 0.93  // Last keypoint      ],      "hand_right_keypoints": [],      "hand_left_keypoints": []    }  ]}

在这个结构中:

version: 版本信息。people: 一个列表,每个元素代表检测到的一个人。pose_keypoints: 包含人体姿态关键点的列表。这是一个扁平化的数组,每三个元素构成一个关键点 (x, y, confidence)。如果某个关键点未被检测到,其坐标和置信度可能为 0, 0, 0。face_keypoints, hand_right_keypoints, hand_left_keypoints: 同样用于存储面部和手部关键点,在本例中为空。

这种扁平化列表的格式在某些场景下(例如OpenPose的早期输出或自定义数据集)较为常见,但其关键点的具体语义(例如第一个三元组代表鼻子,第二个代表左眼等)需要额外的映射表来定义。

直接寻找原生输出模型的挑战

开发者常常希望找到一个模型能够直接输出与其现有数据完全匹配的JSON格式。然而,这在实践中往往是困难的。

标准化差异: 不同的姿态估计模型和数据集(如COCO、MPII)定义了不同的关键点集合和顺序。例如,COCO数据集定义了17个关键点,而OpenPose可能定义了25个。输出结构多样性: 模型的输出格式多种多样,可能是原始的张量、特定API对象、或者不同结构的JSON/CSV文件。直接匹配到 [x, y, confidence] 的扁平化列表并非通用标准。后处理: 大多数模型在推理后都会进行后处理,将原始模型输出转换为更易读或标准化的格式。即使模型内部生成了类似的数据,最终暴露给用户的API输出也可能不同。

因此,与其寻找一个原生输出完全匹配的模型,更实际的方法是采用数据重格式化策略。

策略:数据重格式化以适配模型

核心思想是:将现有自定义格式的关键点数据,转换为目标姿态估计模型所要求的输入格式,或者在模型输出后,将其结果转换为期望的自定义格式。

1. 解析自定义JSON数据

首先,我们需要编写Python代码来解析上述自定义JSON格式,将其转换为更易于处理的结构,例如一个包含 (x, y, confidence) 元组的列表。

import jsondef parse_custom_keypoints_json(json_data_str):    """    解析自定义JSON字符串,提取人体姿态关键点。    """    data = json.loads(json_data_str)    people_keypoints_list = []    for person_data in data.get("people", []):        pose_keypoints_flat = person_data.get("pose_keypoints", [])        # 将扁平化列表转换为 (x, y, confidence) 元组列表        keypoints = []        for i in range(0, len(pose_keypoints_flat), 3):            if i + 2 < len(pose_keypoints_flat):                x = pose_keypoints_flat[i]                y = pose_keypoints_flat[i+1]                confidence = pose_keypoints_flat[i+2]                keypoints.append((x, y, confidence))        people_keypoints_list.append(keypoints)    return people_keypoints_list# 示例JSON数据(来自问题内容)example_json_str = """{"version": 1.0, "people": [{"face_keypoints": [], "pose_keypoints": [104.818897637795, 34.4436363636364, 0.915185123682022, 83.9055118110236, 80.0581818181818, 0.723944239318371, 42.5826771653543, 79.8254545454545, 0.618412546813488, 34.7716535433071, 142.661818181818, 0.757904663681984, 31.244094488189, 204.8, 0.52992781996727, 122.456692913386, 81.2218181818182, 0.589333228766918, 125.48031496063, 145.92, 0.702833116054535, 131.527559055118, 192, 0.366538248956203, 58.7086614173228, 193.861818181818, 0.298667620576452, 0, 0, 0, 0, 0, 0, 107.842519685039, 196.421818181818, 0.324830377765466, 0, 0, 0, 0, 0, 0, 93.9842519685039, 28.16, 0.932040095329285, 107.086614173228, 26.9963636363636, 0.939965099096298, 71.3070866141732, 32.5818181818182, 0.885046675801277, 0, 0, 0], "hand_right_keypoints": [], "hand_left_keypoints": []}]} """parsed_keypoints = parse_custom_keypoints_json(example_json_str)# print(parsed_keypoints) # 输出解析后的关键点列表

这段代码将原始的扁平化列表转换为更结构化的关键点列表,每个关键点是一个 (x, y, confidence) 元组。

2. 目标模型的数据格式要求

以Ultralytics YOLOv8-pose为例,其姿态估计任务的标注格式通常是文本文件(.txt),每行代表一张图片中的一个目标,格式如下:class_id bbox_x_center bbox_y_center bbox_width bbox_height keypoint1_x keypoint1_y keypoint1_visibility keypoint2_x keypoint2_y keypoint2_visibility …

其中:

所有坐标(bbox和keypoint)都必须是相对于图像宽度和高度的归一化值(0到1之间)。visibility(可见性)通常是0(未标注)、1(遮挡但可见)、2(可见)。在推理场景下,这通常被替换为置信度或直接省略。关键点的顺序必须与模型训练时使用的顺序一致(例如COCO关键点顺序)。

这意味着,如果您想使用现有数据训练YOLOv8-pose,或者将YOLOv8-pose的输出转换为您的格式,您需要进行以下转换:

关键点顺序映射: 将您的自定义关键点顺序映射到目标模型(如COCO)的关键点顺序。这通常需要一个预定义的映射表。坐标归一化: 将绝对像素坐标 (x, y) 转换为相对于图像尺寸的归一化坐标 (x_norm, y_norm)。x_norm = x / image_widthy_norm = y / image_height边界框信息: 如果目标模型需要,您可能需要从关键点估算或从其他来源获取每个人的边界框 (bbox_x_center, bbox_y_center, bbox_width, bbox_height)。置信度/可见性: 根据目标模型的具体要求处理关键点的置信度。

3. 示例:将解析数据适配到YOLOv8-pose(概念性)

假设我们已经解析了自定义JSON数据,并获得了 keypoints = [(x1, y1, c1), (x2, y2, c2), …]。现在我们将其转换为YOLOv8-pose所需的格式。

def reformat_for_yolov8_pose(parsed_keypoints_list, image_width, image_height, coco_keypoint_map):    """    将解析后的关键点数据转换为YOLOv8-pose兼容的格式。    此函数仅为概念性示例,需要根据实际情况进行完善。    Args:        parsed_keypoints_list: parse_custom_keypoints_json 的输出。        image_width: 原始图像宽度。        image_height: 原始图像高度。        coco_keypoint_map: 一个字典,将自定义关键点索引映射到COCO关键点索引。                           例如:{custom_idx: coco_idx, ...}    Returns:        一个列表,包含每个人的YOLOv8-pose格式字符串。    """    yolov8_labels = []    for person_keypoints in parsed_keypoints_list:        # 1. 估算边界框 (这里简化处理,实际可能需要更精确的算法)        # 排除 (0,0,0) 的关键点来估算边界框        valid_keypoints = [(x, y) for x, y, c in person_keypoints if c > 0]        if not valid_keypoints:            continue # 没有有效关键点,跳过此人        min_x = min(kp[0] for kp in valid_keypoints)        max_x = max(kp[0] for kp in valid_keypoints)        min_y = min(kp[1] for kp in valid_keypoints)        max_y = max(kp[1] for kp in valid_keypoints)        bbox_width = (max_x - min_x) / image_width        bbox_height = (max_y - min_y) / image_height        bbox_x_center = ((min_x + max_x) / 2) / image_width        bbox_y_center = ((min_y + max_y) / 2) / image_height        # 2. 准备关键点列表并进行归一化和排序        # 假设我们有25个关键点,且已知道它们的COCO映射        # 这里需要一个更复杂的映射逻辑,将原始关键点与COCO 17个关键点对应        # 简化为直接使用原始关键点,并假设其顺序与某个标准匹配        # 填充COCO 17个关键点,如果原始数据有更多,需要选择性映射        # 如果原始数据有25个关键点,需要根据COCO的17个关键点进行筛选和排序        # 示例中假设 person_keypoints 的顺序与COCO关键点大致对应或可映射        # 为了演示,我们假设自定义数据的前17个关键点与COCO顺序一致        # 实际应用中,需要根据具体的关键点定义进行精确映射        keypoints_formatted = []        for i in range(17): # 假设目标是COCO 17个关键点            if i  0 else 0                 keypoints_formatted.extend([x_norm, y_norm, visibility])            else:                # 如果自定义数据关键点不足17个,则填充0                keypoints_formatted.extend([0.0, 0.0, 0])        # 3. 组合成YOLOv8-pose的标签行        # class_id 0 通常代表 "person"        label_line = f"0 {bbox_x_center:.6f} {bbox_y_center:.6f} {bbox_width:.6f} {bbox_height:.6f}"        label_line += " " + " ".join([f"{val:.6f}" for val in keypoints_formatted])        yolov8_labels.append(label_line)    return yolov8_labels# 假设图像尺寸和COCO关键点映射(需要根据实际情况定义)# 这是一个简化的映射示例,实际需要根据您的自定义关键点和COCO关键点对应关系来构建# 例如:{0: 0, 1: 1, ... 16: 16} 假设前17个关键点直接对应COCOcoco_keypoint_mapping_example = {i: i for i in range(17)} image_w, image_h = 640, 480 # 假设图像尺寸# 转换数据yolov8_formatted_labels = reformat_for_yolov8_pose(parsed_keypoints, image_w, image_h, coco_keypoint_mapping_example)# for label in yolov8_formatted_labels:#     print(label)

注意事项:

关键点语义和顺序: 最关键的一步是理解您的自定义JSON中每个 (x, y, confidence) 三元组代表哪个身体部位,并将其与目标模型(如COCO)所定义的关键点进行精确映射。如果关键点数量不一致,需要进行增删和排序。坐标归一化: 几乎所有现代深度学习模型都要求输入坐标是归一化的。边界框: 许多姿态估计模型(特别是基于检测的模型,如YOLOv8-pose)需要边界框信息。如果您的原始数据中没有,您需要从关键点中估算。可见性/置信度: 目标模型可能对关键点的可见性或置信度有特定的编码要求。

选择和适配姿态估计模型

在完成数据重格式化后,您可以选择适合您需求的姿态估计模型:

YOLOv8-pose: Ultralytics YOLOv8系列提供了姿态估计功能。它易于使用,性能良好,并且有详细的文档说明如何准备数据集。OpenPose:

以上就是2D人体姿态关键点数据处理:JSON格式解析与模型适配策略的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1381250.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
Python itertools:生成固定首尾元素的序列排列
上一篇 2025年12月14日 22:48:04
Mac 如何配置 zsh 与 Python
下一篇 2025年12月14日 22:48:19

相关推荐

  • 修复Django电商项目中AJAX过滤产品列表图片不显示问题

    在Django电商项目中,当使用AJAX动态加载过滤后的产品列表时,常遇到图片无法正常显示的问题。这通常是由于前端模板中图片加载方式(如data-setbg属性结合JavaScript库)与AJAX动态内容更新机制不兼容所致。解决方案是直接在AJAX返回的HTML中使用标准的标签来渲染图片,确保浏览…

    2026年5月10日
    000
  • 开源免费PHP工具 PHP开发效率提升利器

    推荐开源免费PHP开发工具以提升效率:VS Code、Sublime Text轻量高效,PhpStorm专业强大;调试用Xdebug、Kint、Ray;依赖管理选Composer;代码质量工具包括PHPStan、Psalm、PHP_CodeSniffer;数据库管理可用%ignore_a_1%MyA…

    2026年5月10日
    000
  • Matplotlib 地图中多类型图例的创建与优化

    Matplotlib 地图中多类型图例的创建与优化Matplotlib 地图中多类型图例的创建与优化Matplotlib 地图中多类型图例的创建与优化Matplotlib 地图中多类型图例的创建与优化

    本教程旨在解决matplotlib地图可视化中,如何在一个图例中同时展示颜色块(如区域分类)和自定义标记(如特定兴趣点)的问题。文章详细介绍了当传统`patch`对象无法正确显示标记时,如何利用`matplotlib.lines.line2d`创建标记图例句柄,并将其与颜色块图例句柄合并,从而生成一…

    2026年5月10日 用户投稿
    100
  • Golang JSON序列化:控制敏感字段暴露的最佳实践

    本教程探讨golang中如何高效控制结构体字段在json序列化时的可见性。当需要将包含敏感信息的结构体数组转换为json响应时,通过利用`encoding/json`包提供的结构体标签,特别是`json:”-“`,可以轻松实现对特定字段的忽略,从而避免敏感数据泄露,确保api…

    2026年5月10日
    000
  • 利用海象运算符简化条件赋值:Python教程与最佳实践

    本文旨在探讨Python中海象运算符(:=)在条件赋值场景下的应用。通过对比传统if/else语句与海象运算符,以及条件表达式,分析海象运算符在简化代码、提高可读性方面的优势与局限性。并通过具体示例,展示如何在列表推导式等场景下合理使用海象运算符,同时强调其潜在的复杂性及替代方案,帮助开发者更好地掌…

    2026年5月10日
    100
  • 怎么在PHP代码中实现图片上传功能_PHP图片上传功能实现与安全处理教程

    首先创建含enctype的HTML表单,再用PHP接收文件,检查目录、移动临时文件,验证类型与大小,生成唯一文件名,并调整php.ini限制以确保上传成功。 如果您尝试在PHP项目中添加图片上传功能,但服务器无法正确接收或保存文件,则可能是由于表单配置、文件处理逻辑或安全限制的问题。以下是实现该功能…

    2026年5月10日
    100
  • 比特币新手教程 比特币交易平台有哪些

    比特币是一种去中心化的数字货币,基于区块链技术实现点对点交易,具有匿名性、有限发行和不可篡改等特点;新手可通过交易所购买,P2P交易获得比特币,常用平台包括Binance、OKX和Huobi;交易流程包括注册账户、实名认证、绑定支付方式、充值法币并下单购买,可选择市价单或限价单;比特币存储方式有交易…

    2026年5月10日
    000
  • RichHandler与Rich Progress集成:解决显示冲突的教程

    在使用rich库的`richhandler`进行日志输出并同时使用`progress`组件时,可能会遇到显示错乱或溢出问题。这通常是由于为`richhandler`和`progress`分别创建了独立的`console`实例导致的。解决方案是确保日志处理器和进度条组件共享同一个`console`实例…

    2026年5月10日
    000
  • 使用 Jupyter Notebook 进行探索性数据分析

    Jupyter Notebook通过单元格实现代码与Markdown结合,支持数据导入(pandas)、清洗(fillna)、探索(matplotlib/seaborn可视化)、统计分析(describe/corr)和特征工程,便于记录与分享分析过程。 Jupyter Notebook 是进行探索性…

    2026年5月10日
    000
  • 前端缓存策略与JavaScript存储管理

    根据数据特性选择合适的存储方式并制定清晰的读写与清理逻辑,能显著提升前端性能;合理运用Cookie、localStorage、sessionStorage、IndexedDB及Cache API,结合缓存策略与定期清理机制,可在保证用户体验的同时避免安全与性能隐患。 前端缓存和JavaScript存…

    2026年5月10日
    200
  • HTML5网页如何实现手势操作 HTML5网页移动端交互的处理技巧

    首先利用原生touch事件实现滑动判断,再通过preventDefault解决滚动冲突,接着引入Hammer.js处理复杂手势,最后通过优化点击区域、避免事件冲突和增加视觉反馈提升体验。 在移动端浏览器中,HTML5网页可以通过触摸事件实现手势操作,提升用户体验。虽然原生JavaScript提供了基…

    2026年5月10日
    000
  • 深入理解 Express.js 中 next() 参数的作用与中间件机制

    本文深入探讨 express.js 中间件函数中的 `next()` 参数。它负责将控制权传递给请求-响应周期中的下一个中间件或路由处理程序。文章将详细解释 `next()` 的工作原理、中间件的注册与执行顺序,以及不正确使用 `next()` 可能导致请求挂起的风险,并通过代码示例和实际应用场景,…

    2026年5月10日
    000
  • Python命令怎样使用profile分析脚本性能 Python命令性能分析的基础教程

    使用Python的cProfile模块分析脚本性能最直接的方式是通过命令行执行python -m cProfile your_script.py,它会输出每个函数的调用次数、总耗时、累积耗时等关键指标,帮助定位性能瓶颈;为进一步分析,可将结果保存为文件python -m cProfile -o ou…

    2026年5月10日
    000
  • PHP动态生成表单输入与POST数据获取实践指南

    本教程详细阐述了如何在php中根据动态数据源(如数据库值)生成多个表单输入框,并演示了如何通过post方法准确无误地获取这些动态生成的输入值。文章强调了正确的输入框命名策略,避免了常见的命名误区,并提供了完整的代码示例,确保开发者能够高效处理动态表单数据。 动态生成表单输入 在Web开发中,我们经常…

    2026年5月10日
    000
  • Python递归函数追踪与性能考量:以序列打印为例

    本文深入探讨了Python中一种递归打印序列元素的方法,并着重演示了如何通过引入缩进参数来有效追踪递归函数的执行流程和参数变化。通过实际代码示例,文章揭示了递归调用可能带来的潜在性能开销,特别是对调用栈空间的需求,以及Python默认递归深度限制可能导致的错误,为读者提供了理解和优化递归算法的实用见…

    2026年5月10日
    000
  • python中zip函数详解 python多序列压缩zip函数应用场景

    zip函数的应用场景包括:1) 同时遍历多个序列,2) 合并多个列表的数据,3) 数据分析和科学计算中的元素运算,4) 处理csv文件,5) 性能优化。zip函数是一个强大的工具,能够简化代码并提高处理多个序列时的效率。 在Python中,zip函数是一个非常有用的工具,它能够将多个可迭代对象打包成…

    2026年5月10日
    000
  • JavaScript 动态菜单点击高亮效果实现教程

    本教程详细介绍了如何使用 JavaScript 实现动态菜单的点击高亮功能。通过事件委托和状态管理,当用户点击菜单项时,被点击项会高亮显示(绿色),同时其他菜单项恢复默认样式(白色)。这种方法避免了不必要的DOM操作,提高了性能和代码可维护性,确保了无论点击方向如何,功能都能稳定运行。 动态菜单高亮…

    2026年5月10日
    200
  • Python中怎样使用pymongo?

    在python中使用pymongo可以轻松地与mongodb数据库进行交互。1)安装pymongo:pip install pymongo。2)连接到mongodb:from pymongo import mongoclient; client = mongoclient(‘mongod…

    2026年5月10日
    000
  • JavaScript函数中插入加载动画(Spinner)的正确方法

    本文旨在解决在JavaScript函数中插入加载动画(Spinner)时遇到的异步问题。通过引入async/await和Promise.all,确保在数据处理完成前后正确显示和隐藏加载动画,提升用户体验。我们将提供两种实现方案,并详细解释其原理和优势。 在Web开发中,当执行耗时操作时,显示加载动画…

    2026年5月10日
    100
  • Golang空接口如何应用在项目中

    空接口可用于接收任意类型值,常见于日志函数、通用数据结构、JSON动态解析及配置驱动逻辑,提升代码灵活性,但需配合类型断言确保安全,避免滥用以降低维护成本。 空接口 interface{} 在 Go 语言中是一个非常灵活的类型,它可以存储任何类型的值。虽然它牺牲了一部分类型安全,但在实际项目中合理使…

    2026年5月10日
    100

发表回复

登录后才能评论
关注微信