在 NumPy 数组中对内嵌字典进行值排序的教程

在 NumPy 数组中对内嵌字典进行值排序的教程

本教程详细介绍了如何在 NumPy 数组中包含的字典中,根据字典的值进行降序排序。文章将通过示例代码演示如何从 NumPy 数组中提取字典对象,并利用 Python 的 sorted() 函数结合 lambda 表达式实现灵活的自定义排序,最终生成一个按值排序的新字典,适用于数据分析和报告场景。

1. 问题背景与数据结构

在数据处理过程中,我们有时会将复杂的数据结构(如字典)存储在 numpy 数组中。例如,在统计城市伤亡人数的场景中,我们可能得到一个 city_dict 字典,其键为城市名,值为总伤亡人数。当这个字典被封装进一个 numpy 数组时,我们面临的问题是如何有效地对其进行排序,特别是按照伤亡人数(字典的值)进行降序排列,以找出伤亡最严重的城市。

考虑以下示例数据,它是一个包含城市及其总伤亡人数的字典:

import numpy as npcity_dict = {    'New Delhi': 2095, 'Samastipur': 4, 'Bombay': 210, 'Imphal': 603,    'Aizawl': 2, 'Amapur': 2, 'Raisikah': 1, 'Champhai': 1,    'Jamshedpur': 32, 'Chennai': 366, 'Chiaplant': 1, 'Tindol': 7,    'Calcutta': 57, 'Tirupattur': 6, 'Gauhati': 112, 'Jorhat': 3,    'Massad': 1, 'Chandigarh': 333, 'Jodhpur': 2, 'Amritsar': 768,    'Tipaimukh': 6, 'Guwahati': 822, 'Harchowal': 1, 'Mothan Wala': 2,    'Qadian': 7, 'Baloda Bazar': 10}# 将字典放入 NumPy 数组np_city = np.array(city_dict)print("原始 NumPy 数组内容:")print(np_city)print("NumPy 数组的类型:", type(np_city))print("NumPy 数组中元素的类型:", np_city.dtype)

运行上述代码,你会发现 np_city 实际上是一个 dtype=object 的 NumPy 数组,它只包含一个元素,这个元素就是我们传入的整个 city_dict 字典。

原始 NumPy 数组内容:{'New Delhi': 2095, 'Samastipur': 4, 'Bombay': 210, 'Imphal': 603, 'Aizawl': 2, 'Amapur': 2, 'Raisikah': 1, 'Champhai': 1, 'Jamshedpur': 32, 'Chennai': 366, 'Chiaplant': 1, 'Tindol': 7, 'Calcutta': 57, 'Tirupattur': 6, 'Gauhati': 112, 'Jorhat': 3, 'Massad': 1, 'Chandigarh': 333, 'Jodhpur': 2, 'Amritsar': 768, 'Tipaimukh': 6, 'Guwahati': 822, 'Harchowal': 1, 'Mothan Wala': 2, 'Qadian': 7, 'Baloda Bazar': 10}NumPy 数组的类型: NumPy 数组中元素的类型: object

2. 从 NumPy 数组中提取字典

由于 np_city 是一个包含单个字典对象的 NumPy 数组,我们需要先将其中的字典对象提取出来。NumPy 数组提供了一个方便的方法 .item() 来获取仅包含一个元素的数组中的该元素。

# 提取 NumPy 数组中的字典对象extracted_dict = np_city.item()print("n提取出的字典对象:")print(extracted_dict)print("提取出的对象类型:", type(extracted_dict))

现在 extracted_dict 就是原始的 city_dict 字典,我们可以对其进行标准的 Python 字典操作。

3. 对字典进行排序

Python 的内置 sorted() 函数是实现排序的关键。sorted() 函数可以接受一个可迭代对象,并返回一个新的排序后的列表。对于字典,我们通常需要根据其键或值进行排序。

为了按字典的值进行排序,我们需要:

使用 extracted_dict.items() 方法获取字典的键值对列表(以元组 (key, value) 的形式)。将这个列表传递给 sorted() 函数。利用 key 参数指定排序依据。这里我们使用 lambda item: item[1],表示对每个键值对元组 item,我们根据其第二个元素(即值)进行排序。设置 reverse=True 参数,实现降序排序。

最后,我们可以使用字典推导式将排序后的键值对列表转换回一个新的字典。需要注意的是,从 Python 3.7+ 开始,字典会保留插入顺序,因此这种方式创建的字典将保持排序后的顺序。

# 对字典进行降序排序sorted_city_casualties = {    key: value    for key, value in sorted(extracted_dict.items(), key=lambda item: item[1], reverse=True)}print("n按伤亡人数降序排序后的城市字典:")print(sorted_city_casualties)

4. 完整示例代码

下面是整合了上述步骤的完整代码示例:

import numpy as npimport csv # 仅为示例背景,实际排序不依赖csv文件# 示例数据:城市及其总伤亡人数的字典# 在实际应用中,这个字典可能通过读取CSV文件或其他数据源生成city_dict = {    'New Delhi': 2095, 'Samastipur': 4, 'Bombay': 210, 'Imphal': 603,    'Aizawl': 2, 'Amapur': 2, 'Raisikah': 1, 'Champhai': 1,    'Jamshedpur': 32, 'Chennai': 366, 'Chiaplant': 1, 'Tindol': 7,    'Calcutta': 57, 'Tirupattur': 6, 'Gauhati': 112, 'Jorhat': 3,    'Massad': 1, 'Chandigarh': 333, 'Jodhpur': 2, 'Amritsar': 768,    'Tipaimukh': 6, 'Guwahati': 822, 'Harchowal': 1, 'Mothan Wala': 2,    'Qadian': 7, 'Baloda Bazar': 10}# 将字典放入 NumPy 数组np_city = np.array(city_dict)print("--- 原始数据 ---")print("NumPy 数组内容:", np_city)print("NumPy 数组类型:", type(np_city))print("NumPy 数组元素类型:", np_city.dtype)# 1. 从 NumPy 数组中提取字典对象extracted_dict = np_city.item()print("n--- 提取字典 ---")print("提取出的字典对象:", extracted_dict)print("提取出的对象类型:", type(extracted_dict))# 2. 对字典进行降序排序(按值)# sorted() 函数返回一个元组列表,每个元组是 (key, value)# key=lambda item: item[1] 表示按元组的第二个元素(值)排序# reverse=True 表示降序sorted_items = sorted(extracted_dict.items(), key=lambda item: item[1], reverse=True)# 3. 将排序后的键值对列表转换回字典sorted_city_casualties = {key: value for key, value in sorted_items}print("n--- 排序结果 ---")print("按伤亡人数降序排序后的城市字典:")print(sorted_city_casualties)# 如果只需要前N个结果,可以这样做:top_5_cities = dict(sorted_items[:5])print("n--- 前5个伤亡最严重的城市 ---")print(top_5_cities)

5. 注意事项与总结

NumPy 数组与字典的封装: 当你将一个 Python 字典直接传递给 np.array() 时,如果字典是唯一的元素,NumPy 会创建一个 dtype=object 的数组,其中包含你的字典作为单个元素。这不是一个结构化数组,而是将 Python 对象“原样”存储在 NumPy 容器中。.item() 方法: 它是从只包含一个元素的 NumPy 数组中提取该元素的便捷方式。如果数组包含多个元素,使用 .item() 会引发 ValueError。sorted() 函数的灵活性: sorted() 函数是 Python 中非常强大的排序工具。通过 key 参数,你可以指定任何可调用对象(如 lambda 函数或自定义函数)来定义排序的依据,这使得它在处理复杂数据结构时非常灵活。字典的顺序: 从 Python 3.7+ 开始,字典会保留元素的插入顺序。因此,通过字典推导式从排序后的键值对列表创建新字典时,新字典的元素顺序将与排序后的列表一致。获取 Top N 结果: 在字典排序完成后,如果只需要获取前几个或后几个结果,可以直接对 sorted() 函数返回的列表进行切片操作,然后再转换回字典。

通过以上步骤,我们能够高效地处理在 NumPy 数组中封装的字典数据,并根据特定需求对其进行排序,这在数据分析和报告生成中是一个非常实用的技巧。

以上就是在 NumPy 数组中对内嵌字典进行值排序的教程的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1374193.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 13:56:29
下一篇 2025年12月14日 13:56:44

相关推荐

发表回复

登录后才能评论
关注微信