2D人体姿态关键点数据处理：JSON格式解析与模型适配策略

程序猿 • 2025年12月14日 22:48:14 • 好文分享 • 阅读 0

本文探讨了在2D人体姿态估计中，如何处理和适配特定JSON格式的关键点数据。针对用户自定义的`[x, y, confidence]`扁平化列表格式，文章指出直接寻找原生输出此格式的模型存在挑战。核心策略是理解现有数据结构，并根据目标姿态估计模型的输入要求进行数据重格式化。教程将提供JSON解析示例，并讨论关键点顺序、坐标归一化等重格式化要点，旨在帮助开发者高效地将自定义数据应用于主流姿态估计框架。

在2D人体姿态估计任务中，获取图像中人物的关键点坐标是核心目标。开发者常会遇到现有关键点数据（无论是标注数据还是其他模型输出）采用特定JSON格式，而主流姿态估计模型（如YOLOv8-pose、OpenPose、MediaPipe等）通常有其预定义的输入或输出格式。本文将针对类似以下示例的JSON格式数据，探讨如何进行解析、理解，并提出将其适配到主流姿态估计模型的方法。

理解自定义关键点JSON格式

我们首先分析提供的JSON数据结构。该格式将人体关键点表示为一个扁平化的列表，其中每个关键点由三个浮点数组成：[x坐标, y坐标, 置信度]。

{  "version": 1.0,  "people": [    {      "face_keypoints": [],      "pose_keypoints": [        104.81, 34.44, 0.91, // Keypoint 1 (x, y, confidence)        83.90, 80.05, 0.72, // Keypoint 2        // ... more keypoints ...        0, 0, 0,            // Missing or undetected keypoint        93.98, 28.16, 0.93  // Last keypoint      ],      "hand_right_keypoints": [],      "hand_left_keypoints": []    }  ]}

在这个结构中：

version: 版本信息。people: 一个列表，每个元素代表检测到的一个人。pose_keypoints: 包含人体姿态关键点的列表。这是一个扁平化的数组，每三个元素构成一个关键点 (x, y, confidence)。如果某个关键点未被检测到，其坐标和置信度可能为 0, 0, 0。face_keypoints, hand_right_keypoints, hand_left_keypoints: 同样用于存储面部和手部关键点，在本例中为空。

这种扁平化列表的格式在某些场景下（例如OpenPose的早期输出或自定义数据集）较为常见，但其关键点的具体语义（例如第一个三元组代表鼻子，第二个代表左眼等）需要额外的映射表来定义。

直接寻找原生输出模型的挑战

开发者常常希望找到一个模型能够直接输出与其现有数据完全匹配的JSON格式。然而，这在实践中往往是困难的。

标准化差异： 不同的姿态估计模型和数据集（如COCO、MPII）定义了不同的关键点集合和顺序。例如，COCO数据集定义了17个关键点，而OpenPose可能定义了25个。输出结构多样性： 模型的输出格式多种多样，可能是原始的张量、特定API对象、或者不同结构的JSON/CSV文件。直接匹配到 [x, y, confidence] 的扁平化列表并非通用标准。后处理： 大多数模型在推理后都会进行后处理，将原始模型输出转换为更易读或标准化的格式。即使模型内部生成了类似的数据，最终暴露给用户的API输出也可能不同。

因此，与其寻找一个原生输出完全匹配的模型，更实际的方法是采用数据重格式化策略。

策略：数据重格式化以适配模型

核心思想是：将现有自定义格式的关键点数据，转换为目标姿态估计模型所要求的输入格式，或者在模型输出后，将其结果转换为期望的自定义格式。

1. 解析自定义JSON数据

首先，我们需要编写Python代码来解析上述自定义JSON格式，将其转换为更易于处理的结构，例如一个包含 (x, y, confidence) 元组的列表。

import jsondef parse_custom_keypoints_json(json_data_str):    """    解析自定义JSON字符串，提取人体姿态关键点。    """    data = json.loads(json_data_str)    people_keypoints_list = []    for person_data in data.get("people", []):        pose_keypoints_flat = person_data.get("pose_keypoints", [])        # 将扁平化列表转换为 (x, y, confidence) 元组列表        keypoints = []        for i in range(0, len(pose_keypoints_flat), 3):            if i + 2 < len(pose_keypoints_flat):                x = pose_keypoints_flat[i]                y = pose_keypoints_flat[i+1]                confidence = pose_keypoints_flat[i+2]                keypoints.append((x, y, confidence))        people_keypoints_list.append(keypoints)    return people_keypoints_list# 示例JSON数据（来自问题内容）example_json_str = """{"version": 1.0, "people": [{"face_keypoints": [], "pose_keypoints": [104.818897637795, 34.4436363636364, 0.915185123682022, 83.9055118110236, 80.0581818181818, 0.723944239318371, 42.5826771653543, 79.8254545454545, 0.618412546813488, 34.7716535433071, 142.661818181818, 0.757904663681984, 31.244094488189, 204.8, 0.52992781996727, 122.456692913386, 81.2218181818182, 0.589333228766918, 125.48031496063, 145.92, 0.702833116054535, 131.527559055118, 192, 0.366538248956203, 58.7086614173228, 193.861818181818, 0.298667620576452, 0, 0, 0, 0, 0, 0, 107.842519685039, 196.421818181818, 0.324830377765466, 0, 0, 0, 0, 0, 0, 93.9842519685039, 28.16, 0.932040095329285, 107.086614173228, 26.9963636363636, 0.939965099096298, 71.3070866141732, 32.5818181818182, 0.885046675801277, 0, 0, 0], "hand_right_keypoints": [], "hand_left_keypoints": []}]} """parsed_keypoints = parse_custom_keypoints_json(example_json_str)# print(parsed_keypoints) # 输出解析后的关键点列表

这段代码将原始的扁平化列表转换为更结构化的关键点列表，每个关键点是一个 (x, y, confidence) 元组。

2. 目标模型的数据格式要求

以Ultralytics YOLOv8-pose为例，其姿态估计任务的标注格式通常是文本文件（.txt），每行代表一张图片中的一个目标，格式如下：class_id bbox_x_center bbox_y_center bbox_width bbox_height keypoint1_x keypoint1_y keypoint1_visibility keypoint2_x keypoint2_y keypoint2_visibility …

其中：

所有坐标（bbox和keypoint）都必须是相对于图像宽度和高度的归一化值（0到1之间）。visibility（可见性）通常是0（未标注）、1（遮挡但可见）、2（可见）。在推理场景下，这通常被替换为置信度或直接省略。关键点的顺序必须与模型训练时使用的顺序一致（例如COCO关键点顺序）。

这意味着，如果您想使用现有数据训练YOLOv8-pose，或者将YOLOv8-pose的输出转换为您的格式，您需要进行以下转换：

关键点顺序映射： 将您的自定义关键点顺序映射到目标模型（如COCO）的关键点顺序。这通常需要一个预定义的映射表。坐标归一化： 将绝对像素坐标 (x, y) 转换为相对于图像尺寸的归一化坐标 (x_norm, y_norm)。x_norm = x / image_widthy_norm = y / image_height边界框信息：如果目标模型需要，您可能需要从关键点估算或从其他来源获取每个人的边界框 (bbox_x_center, bbox_y_center, bbox_width, bbox_height)。置信度/可见性： 根据目标模型的具体要求处理关键点的置信度。

3. 示例：将解析数据适配到YOLOv8-pose（概念性）

假设我们已经解析了自定义JSON数据，并获得了 keypoints = [(x1, y1, c1), (x2, y2, c2), …]。现在我们将其转换为YOLOv8-pose所需的格式。

def reformat_for_yolov8_pose(parsed_keypoints_list, image_width, image_height, coco_keypoint_map):    """    将解析后的关键点数据转换为YOLOv8-pose兼容的格式。    此函数仅为概念性示例，需要根据实际情况进行完善。    Args:        parsed_keypoints_list: parse_custom_keypoints_json 的输出。        image_width: 原始图像宽度。        image_height: 原始图像高度。        coco_keypoint_map: 一个字典，将自定义关键点索引映射到COCO关键点索引。                           例如：{custom_idx: coco_idx, ...}    Returns:        一个列表，包含每个人的YOLOv8-pose格式字符串。    """    yolov8_labels = []    for person_keypoints in parsed_keypoints_list:        # 1. 估算边界框 (这里简化处理，实际可能需要更精确的算法)        # 排除 (0,0,0) 的关键点来估算边界框        valid_keypoints = [(x, y) for x, y, c in person_keypoints if c > 0]        if not valid_keypoints:            continue # 没有有效关键点，跳过此人        min_x = min(kp[0] for kp in valid_keypoints)        max_x = max(kp[0] for kp in valid_keypoints)        min_y = min(kp[1] for kp in valid_keypoints)        max_y = max(kp[1] for kp in valid_keypoints)        bbox_width = (max_x - min_x) / image_width        bbox_height = (max_y - min_y) / image_height        bbox_x_center = ((min_x + max_x) / 2) / image_width        bbox_y_center = ((min_y + max_y) / 2) / image_height        # 2. 准备关键点列表并进行归一化和排序        # 假设我们有25个关键点，且已知道它们的COCO映射        # 这里需要一个更复杂的映射逻辑，将原始关键点与COCO 17个关键点对应        # 简化为直接使用原始关键点，并假设其顺序与某个标准匹配        # 填充COCO 17个关键点，如果原始数据有更多，需要选择性映射        # 如果原始数据有25个关键点，需要根据COCO的17个关键点进行筛选和排序        # 示例中假设 person_keypoints 的顺序与COCO关键点大致对应或可映射        # 为了演示，我们假设自定义数据的前17个关键点与COCO顺序一致        # 实际应用中，需要根据具体的关键点定义进行精确映射        keypoints_formatted = []        for i in range(17): # 假设目标是COCO 17个关键点            if i  0 else 0                 keypoints_formatted.extend([x_norm, y_norm, visibility])            else:                # 如果自定义数据关键点不足17个，则填充0                keypoints_formatted.extend([0.0, 0.0, 0])        # 3. 组合成YOLOv8-pose的标签行        # class_id 0 通常代表 "person"        label_line = f"0 {bbox_x_center:.6f} {bbox_y_center:.6f} {bbox_width:.6f} {bbox_height:.6f}"        label_line += " " + " ".join([f"{val:.6f}" for val in keypoints_formatted])        yolov8_labels.append(label_line)    return yolov8_labels# 假设图像尺寸和COCO关键点映射（需要根据实际情况定义）# 这是一个简化的映射示例，实际需要根据您的自定义关键点和COCO关键点对应关系来构建# 例如：{0: 0, 1: 1, ... 16: 16} 假设前17个关键点直接对应COCOcoco_keypoint_mapping_example = {i: i for i in range(17)} image_w, image_h = 640, 480 # 假设图像尺寸# 转换数据yolov8_formatted_labels = reformat_for_yolov8_pose(parsed_keypoints, image_w, image_h, coco_keypoint_mapping_example)# for label in yolov8_formatted_labels:#     print(label)

注意事项：

关键点语义和顺序： 最关键的一步是理解您的自定义JSON中每个 (x, y, confidence) 三元组代表哪个身体部位，并将其与目标模型（如COCO）所定义的关键点进行精确映射。如果关键点数量不一致，需要进行增删和排序。坐标归一化： 几乎所有现代深度学习模型都要求输入坐标是归一化的。边界框： 许多姿态估计模型（特别是基于检测的模型，如YOLOv8-pose）需要边界框信息。如果您的原始数据中没有，您需要从关键点中估算。可见性/置信度： 目标模型可能对关键点的可见性或置信度有特定的编码要求。

选择和适配姿态估计模型

在完成数据重格式化后，您可以选择适合您需求的姿态估计模型：

YOLOv8-pose: Ultralytics YOLOv8系列提供了姿态估计功能。它易于使用，性能良好，并且有详细的文档说明如何准备数据集。OpenPose:

以上就是2D人体姿态关键点数据处理：JSON格式解析与模型适配策略的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1381250.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Python itertools：生成固定首尾元素的序列排列

上一篇 2025年12月14日 22:48:04

Mac 如何配置 zsh 与 Python

下一篇 2025年12月14日 22:48:19

好文分享

如何解决本地图片在使用 mask JS 库时出现的跨域错误？

如何跨越localhost使用本地图片？问题: 在本地使用mask js库时，引入本地图片会报跨域错误。解决方案: 要解决此问题，需要使用本地服务器启动文件，以http或https协议访问图片，而不是使用file://协议。例如： python -m http.server 8000 然后，可以…

程序猿
2025年12月24日
2000
好文分享

使用 Mask 导入本地图片时，如何解决跨域问题？

跨域疑难：如何解决 mask 引入本地图片产生的跨域问题？在使用 mask 导入本地图片时，你可能会遇到令人沮丧的跨域错误。为什么会出现跨域问题呢？让我们深入了解一下： mask 框架假设你以 http(s) 协议加载你的 html 文件，而当使用 file:// 协议打开本地文件时，就会产生跨域…

程序猿
2025年12月24日
2000
好文分享

正则表达式在文本验证中的常见问题有哪些？

正则表达式助力文本输入验证在文本输入框的验证中，经常遇到需要限定输入内容的情况。例如，输入框只能输入整数，第一位可以为负号。对于不会使用正则表达式的人来说，这可能是个难题。下面我们将提供三种正则表达式，分别满足不同的验证要求。 1. 可选负号，任意数量数字如果输入框中允许第一位为负号，后面可输入…

程序猿
2025年12月24日
0000
好文分享

为什么多年的经验让我选择全栈而不是平均栈

在全栈和平均栈开发方面工作了 6 年多，我可以告诉您，虽然这两种方法都是流行且有效的方法，但它们满足不同的需求，并且有自己的优点和缺点。这两个堆栈都可以帮助您创建 Web 应用程序，但它们的实现方式却截然不同。如果您在两者之间难以选择，我希望我在两者之间的经验能给您一些有用的见解。在这篇文章中，我…

程序猿
2025年12月24日
0000
好文分享

姜戈顺风

本教程演示如何在新项目中从头开始配置 django 和 tailwindcss。 django 设置创建一个名为 .venv 的新虚拟环境。 # windows$ python -m venv .venv$ .venvscriptsactivate.ps1(.venv) $# macos/linu…

程序猿
2025年12月24日
0000
好文分享

花 $o 学习这些编程语言或免费

→ Python → JavaScript → Java → C# → 红宝石 → 斯威夫特 → 科特林 → C++ → PHP → 出发 → R → 打字稿 []https://x.com/e_opore/status/1811567830594388315?t=_j4nncuiy2wfbm7ic…

程序猿
2025年12月24日
0000
好文分享

深入理解CSS框架与JS之间的关系

深入理解CSS框架与JS之间的关系在现代web开发中，CSS框架和JavaScript (JS) 是两个常用的工具。CSS框架通过提供一系列样式和布局选项，可以帮助我们快速构建美观的网页。而JS则提供了一套功能强大的脚本语言，可以为网页添加交互和动态效果。本文将深入探讨CSS框架和JS之间的关系，…

程序猿
2025年12月24日
0000
HTML+CSS+JS实现雪花飘扬（代码分享）

使用html+css+js如何实现下雪特效？下面本篇文章给大家分享一个html+css+js实现雪花飘扬的示例，希望对大家有所帮助。很多南方的小伙伴可能没怎么见过或者从来没见过下雪，今天我给大家带来一个小Demo，模拟了下雪场景，首先让我们看一下运行效果可以点击看看在线运行：http://hai…

程序猿
2025年12月24日 • 好文分享
5000
10款好看且实用的文字动画特效，让你的页面更吸引人！

图片和文字是网页不可缺少的组成部分，图片运用得当可以让网页变得生动，但普通的文字不行。那么就可以给文字添加一些样式，实现一下好看的文字效果，让页面变得更交互，更吸引人。下面创想鸟就来给大家分享10款文字动画特效，好看且实用，快来收藏吧！ 1、网页玻璃文字动画特效模板简介：使用css3制作网页渐变底…

程序猿
2025年12月24日 • 好文分享
0000
好文分享

tp5如何引入css文件

tp5引入css文件的方法：1、将css文件放在public目录下的static文件里即可；2、在页面引入中写上“”语句即可。本教程操作环境：windows7系统、CSS3&&HTML5版、Dell G3电脑。其实很简单,只需要将css,js,image文件放在这个目录下即可页…

程序猿
2025年12月24日
0000
好文分享

聊聊CSS 与 JS 是如何阻塞 DOM 解析和渲染的

本篇文章给大家介绍一下css和js阻塞 dom 解析和渲染的原理。有一定的参考价值，有需要的朋友可以参考一下，希望对大家有所帮助。 hello~各位亲爱的看官老爷们大家好。估计大家都听过，尽量将CSS放头部，JS放底部，这样可以提高页面的性能。然而，为什么呢？大家有考虑过么？很长一段时间，我都是知其…

程序猿
2025年12月24日
2000
好文分享

js如何修改css样式

js修改css样式的方法：1、使用【obj.className】来修改样式表的类名；2、使用【obj.style.cssTest】来修改嵌入式的css；3、使用【obj.className】来修改样式表的类名；4、使用更改外联的css。本教程操作环境：windows7系统、css3版，DELL G…

程序猿
2025年12月24日
0000
好文分享

如何使用纯CSS、JS实现图片轮播效果

本篇文章给大家详细介绍一下使用纯css、js实现图片轮播效果的方法。有一定的参考价值，有需要的朋友可以参考一下，希望对大家有所帮助。 .carousel {width: 648px;height: 400px;margin: 0 auto;text-align: center;position: a…

程序猿
2025年12月24日
0000
好文分享

css怎么设置文件编码

在css中，可以使用“@charset”规则来设置编码，语法格式“@charset “字符编码类型”;”。“@charset”规则可以指定样式表中使用的字符编码，它必须是样式表中的第一个元素，并且不能以任何字符开头。本教程操作环境：windows7系统、CSS3&&…

程序猿
2025年12月24日
0000
好文分享

js如何修改css

js修改css的方法：1、使用【obj.style.cssTest】来修改嵌入式的css；2、使用【bj.className】来修改样式表的类名；3、使用更改外联的css文件，从而改变元素的css。本教程操作环境：windows7系统、css3版，DELL G3电脑。 js修改css的方法：方法…

程序猿
2025年12月24日
0000
好文分享

js如何改变css样式

js改变css样式的方法：1、使用cssText方法；2、使用【setProperty()】方法；3、使用css属性对应的style属性。本教程操作环境：windows7系统、css3版，DELL G3电脑。 js改变css样式的方法：第一种：用cssText div.style.cssText…

程序猿
2025年12月24日
0000
好文分享

为什么css放上面js放下面

css放上面js放下面的原因：1、在加载html生成DOM tree的时候，可以同时对DOM tree进行渲染，这样可以防止闪跳，白屏或者布局混乱；2、javascript加载后会立即执行，同时会阻塞后面的资源加载。本文操作环境：Windows7系统、HTML5&&CSS3版，DE…

程序猿
2025年12月24日
0000
好文分享

推荐六款移动端 UI 框架

作为一个前端人员来说，总结几款相对来说不错的用于移动端开发的UI框架是非常必要的，以下几种移动端UI框架就能基本满足工作中开发需要，根据项目需求，选用合适的框架搭建项目，更能容易提高开发效率。一、MUI 最接近原生APP体验的高性能前端框架，追求性能体验，是我们开始启动MUI项目的…

程序猿
2025年12月24日
0000
好文分享

css如何实现图片的旋转展示效果（代码示例）

本篇文章给大家带来内容是通过代码示例介绍使用css+js实现图片的旋转展示，制作一个手动操作的“无限”照片轮播图。有一定的参考价值，有需要的朋友可以参考一下，希望对你们有所帮助。下面我们就开始介绍如何实现效果。 1、构建图像轮播框架首先是HTML。它有点难以阅读，因为我们删除了元素之间的任何空格…

程序猿
2025年12月24日
0000
好文分享

css3+js实现烟花绽放的动画效果（代码示例）

本篇文章给大家介绍通过js+css3的transforms属性和keyframes属性来实现烟花绽放的动画效果的方法。有一定的参考价值，有需要的朋友可以参考一下，希望对你们有所帮助。首先我们来看看效果：动画的实现原理：动画使用了两个关键帧（keyframes）：一个是烟花筒上升的轨迹，另一个…

程序猿
2025年12月24日
0000