使用字典值有条件地划分 DataFrame 列

程序猿 • 2025年12月14日 03:54:38 • 用户投稿 • 阅读 0

本文介绍了如何根据 DataFrame 中某一列的值，以及一个字典的键值映射关系，有条件地更新 DataFrame 的另一列。当 DataFrame 列中的值存在于字典的键中时，执行除法操作；否则，保持原值不变。我们将探讨多种实现方法，并分析其优缺点，帮助你选择最适合自己场景的方案。

在数据分析和处理中，经常会遇到需要根据特定条件修改 DataFrame 列的情况。一个常见的场景是，我们有一个 DataFrame，其中包含需要调整的数值列和一个用于查找调整因子的 ID 列。同时，我们还有一个字典，将 ID 映射到对应的调整因子。目标是根据 ID 列的值，从字典中查找对应的调整因子，并将数值列除以该因子。如果 ID 在字典中不存在，则保持数值列不变。

以下我们将探讨几种实现此目标的方法。

方法 1: 使用 apply 函数

apply 函数可以按行或按列对 DataFrame 进行操作。我们可以使用 apply 函数，结合字典的 get 方法，实现有条件的除法操作。

import pandas as pddf = pd.DataFrame({  "integer_id": [1, 2, 3],  "delta": [10, 20, 30]})d = {1: 0.5, 3: 0.25}df['delta'] = df.apply(lambda r: r['delta']/d.get(r['integer_id'], 1), axis=1)print(df)

这段代码首先定义了一个 DataFrame df 和一个字典 d。然后，使用 apply 函数遍历 DataFrame 的每一行。对于每一行，lambda 函数会获取 integer_id 列的值，并在字典 d 中查找对应的调整因子。d.get(r[‘integer_id’], 1) 的作用是：如果 r[‘integer_id’] 存在于字典 d 中，则返回对应的值；否则，返回默认值 1，从而保证 delta 列的值在 integer_id 不存在于字典中时保持不变。最后，将 delta 列除以调整因子，并将结果赋值回 delta 列。

方法 2: 使用 map 函数和 fillna 函数

map 函数可以将 Series 中的每个值映射到另一个值。我们可以使用 map 函数将 integer_id 列映射到字典 d 中的值，然后使用 fillna 函数处理缺失值。

import pandas as pddf = pd.DataFrame({  "integer_id": [1, 2, 3],  "delta": [10, 20, 30]})d = {1: 0.5, 3: 0.25}df["delta"] /= df.integer_id.map(d).fillna(1)print(df)

这段代码首先使用 df.integer_id.map(d) 将 integer_id 列映射到字典 d 中的值。由于字典 d 中不存在 integer_id 为 2 的键，因此映射结果中对应的位置会是 NaN。然后，使用 fillna(1) 将 NaN 值替换为 1，从而保证 delta 列的值在 integer_id 不存在于字典中时保持不变。最后，将 delta 列除以映射结果。

方法 3: 使用 replace 函数和 where 函数

replace 函数可以替换 Series 中的值。where 函数可以根据条件选择 Series 中的值。我们可以使用 replace 函数将字典 d 中的键替换为对应的值，然后使用 where 函数根据条件选择是否执行除法操作。

import pandas as pddf = pd.DataFrame({  "integer_id": [1, 2, 3],  "delta": [10, 20, 30]})d = {1: 0.5, 3: 0.25}divisor = df['integer_id'].replace(d)df['delta'] = df['delta'].where(df['integer_id'].isin(d.keys()), df['delta'] / divisor)print(df)

这段代码首先使用 df[‘integer_id’].replace(d) 将 integer_id 列中存在于字典 d 的键替换为对应的值。然后，使用 df[‘delta’].where(df[‘integer_id’].isin(d.keys()), df[‘delta’] / divisor) 根据 integer_id 是否在字典 d 的键中选择是否执行除法操作。如果 integer_id 在字典 d 的键中，则执行除法操作；否则，保持原值不变。

总结与注意事项

以上三种方法都可以实现根据字典值有条件地划分 DataFrame 列的目标。选择哪种方法取决于具体的场景和个人偏好。

apply 函数的优点是代码简洁易懂，但性能相对较差，尤其是在处理大型 DataFrame 时。map 函数和 fillna 函数的优点是性能较好，但代码相对复杂。replace 函数和 where 函数的代码可读性较好，但是需要额外的变量来存储除数。

在实际应用中，可以根据 DataFrame 的大小和性能要求选择合适的方法。如果 DataFrame 较小，或者对性能要求不高，可以使用 apply 函数。如果 DataFrame 较大，并且对性能要求较高，可以使用 map 函数和 fillna 函数，或者replace 函数和 where 函数。

此外，需要注意的是，如果字典 d 中的值包含 0，则在执行除法操作时可能会出现 ZeroDivisionError 错误。为了避免这种情况，可以在执行除法操作之前，先检查字典 d 中的值是否为 0。

希望本教程能够帮助你理解如何根据字典值有条件地划分 DataFrame 列。

以上就是使用字典值有条件地划分 DataFrame 列的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1364259.html

代码可读性

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

413.8K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

使用字典值按键划分DataFrame列的多种方法

上一篇 2025年12月14日 03:54:34

使用字典值有条件地划分 Pandas DataFrame 列

下一篇 2025年12月14日 03:54:46

用户投稿

什么是功能类优先的 CSS 框架？

理解功能类优先 tailwind css 是一款功能类优先的 css 框架，用户可以通过组合功能类轻松构建设计。为了理解功能类优先，我们首先要区分语义类和功能类这两种 css 类名命名方式。语义类以前比较常见的 css 命名方式是根据页面中模块的功能来命名。例如：立即学习“前端免费学习笔记（深…

程序猿
2025年12月24日
1000
用户投稿

SCSS – 增强您的 CSS 工作流程

在本文中，我们将探索 scss (sassy css)，这是一个 css 预处理器，它通过允许变量、嵌套规则、mixins、函数等来扩展 css 的功能。 scss 使 css 的编写和维护变得更加容易，尤其是对于大型项目。 1.什么是scss？ scss 是 sass（syntropically …

程序猿
2025年12月24日
0000
用户投稿

css3选择器优化技巧

CSS3 选择器优化技巧可提升网页性能：减少选择器层级，提高浏览器解析效率。避免通配符选择器，减少性能损耗。优先使用 ID 选择器，快速定位目标元素。用类选择器代替标签选择器，精确匹配。使用属性选择器，增强匹配精度。巧用伪类和伪元素，提升性能。组合多个选择器，简化代码。利用 CSS 预处理器，增强代…

程序猿
2025年12月24日
3000
用户投稿

css代码规范有哪些

CSS 代码规范对于保持一致性、可读性和可维护性至关重要，常见的规范包括：命名约定：使用小写字母和短划线，命名特定且描述性。缩进和对齐：按特定规则缩进、对齐选择器、声明和值。属性和值顺序：遵循特定顺序排列属性和值。注释：解释复杂代码，并使用正确的语法。分号：每个声明后添加分号。大括号：左大括号前换行…

程序猿
2025年12月24日
7000
用户投稿

html5能否插入xml文档_html5xml嵌入与节点解析展示【攻略】

需用JavaScript加载解析XML：一、XMLHttpRequest异步获取并解析；二、DOMParser解析内联XML字符串；三、fetch API配合DOMParser处理；四、XMLSerializer序列化调试；五、getElementsByTagNameNS处理命名空间。如果您希望在…

程序猿
2025年12月23日
3000
用户投稿

html如何改变成HTML5_HTML升级为HTML5步骤与转换技巧【指南】

需更新DOCTYPE为，设置lang属性，用语义化元素替代div，升级表单输入类型，以audio/video替代Flash嵌入多媒体。如果您正在维护一个传统HTML网页，希望将其升级为符合现代标准的HTML5格式，则需要对文档结构、元素语义、语法规范及媒体支持等方面进行系统性调整。以下是将HTML…

程序猿
2025年12月23日
0000
用户投稿

HTML如何实现数值相加_JavaScript计算功能开发【教程】

可通过五种JavaScript方法实现网页中多数值实时相加：一、内联事件+ID获取；二、表单submit+preventDefault；三、input事件实时计算；四、ES6箭头函数与解构；五、data属性批量处理多组。如果您在网页中需要实现两个或多个数值的相加运算，并将结果实时显示，可以通过嵌入…

程序猿
2025年12月23日
0000
用户投稿

html5怎么加表格_HTML5用table加tr/td/th标签添加行列数据表格【添加】

HTML5表格需用定义结构，含等标签，支持标题、rowspan/colspan合并、CSS边框及语义分组。如果您希望在HTML5页面中创建结构化数据展示区域，则需要使用标准的表格标签来构建行列布局。以下是添加表格的具体步骤：一、基础表格结构定义 HTML5中表格必须以标签为容器，内部使用定义行…

程序猿
2025年12月23日
0000
用户投稿

如何用html实现文字html_用HTML代码展示HTML文字内容【展示】

需将HTML特殊字符转义为实体以实现代码原样显示，常用方法包括：手动实体替换、pre/code标签配合转义、JavaScript动态转义、CSS white-space控制、highlight.js语法高亮。如果您希望在网页中直接显示HTML代码本身，而不是让浏览器解析并渲染这些代码，则需要将HT…

程序猿
2025年12月23日
0000
用户投稿

html如何写点击代码_编写HTML元素点击事件的代码【代码】

实现HTML元素点击响应有五种方法：一、内联onclick属性；二、JavaScript获取元素后用addEventListener绑定；三、事件委托绑定到父容器；四、自定义函数配合onclick调用；五、用preventDefault和stopPropagation控制默认行为与冒泡。如果您希望…

程序猿
2025年12月23日
0000
用户投稿

如何提升HTML代码质量_编程规范优化指南【解析】

HTML代码质量优化需遵循五项规范：一、正确使用语义化标签提升可访问性与SEO；二、属性值强制双引号并显式书写布尔属性；三、精简嵌套层级，统一双空格缩进；四、class/id采用kebab-case命名，强调语义与唯一性；五、必须声明DOCTYPE、lang和UTF-8编码。如果您在编写HTML代…

程序猿
2025年12月23日
0000
用户投稿

HTML如何设置横向布局_Flexbox排列方法【解析】

Flexbox通过display: flex、flex-direction: row、justify-content、flex-wrap: nowrap及子项flex属性实现元素横向排列。如果您希望在HTML页面中实现元素的横向排列，Flexbox提供了一种简洁且强大的布局方式。以下是实现横向布局…

程序猿
2025年12月23日
3000
用户投稿

c语言如何生成html_用C语言程序输出HTML格式文件【文件】

C语言动态生成HTML文件有五种方法：一、用fprintf逐行写入；二、构建缓冲区后fwrite一次性写入；三、用宏简化标签输出；四、从模板文件加载并替换变量；五、用结构体组织元素并序列化。如果您希望使用C语言程序动态生成HTML格式的文件，则需要通过标准文件I/O操作将符合HTML语法的文本内容…

程序猿
2025年12月23日
0000
用户投稿

html如何表格_创建HTML数据表格并设置样式【设置】

HTML表格通过table、tr、td构建基础结构，用th和thead/tbody实现语义化表头，CSS控制边框、尺寸、对齐及类名复用样式。如果您需要在网页中展示结构化数据，HTML表格是实现这一目标的基础方式。以下是创建HTML数据表格并设置样式的具体步骤：一、使用table、tr、td标签构…

程序猿
2025年12月23日
0000
用户投稿

html如何空一段距离_在HTML元素间创建空白距离【空白】

可通过margin、padding、空元素、br标签或CSS类五种方式控制HTML元素间距：margin设外边距，padding设内边距，空元素设高度，br强制换行，CSS类统一管理。如果您希望在HTML元素之间创建空白距离，可以通过多种方式控制元素间的垂直或水平间距。以下是实现此效果的具体方法：…

程序猿
2025年12月23日
0000
用户投稿

html怎么运行带代码_html运行带代码方法【教程】

使用标签组合并转义特殊字符可安全显示HTML代码；通过JavaScript动态设置textContent能防止解析执行；引入Highlight.js等高亮库还可实现语法着色与行号功能，提升代码可读性。如果您在编写HTML文件时希望其中的代码片段能够被正确显示而非被浏览器解析执行，则需要采取特定方法…

程序猿
2025年12月23日
0000
用户投稿

如何学习html代码_html代码学习技巧【指南】

掌握HTML需系统学习：一、理解基本结构，如doctype、html、head、body；二、反向学习现成网页；三、用在线平台实时练习；四、构建最小可运行项目；五、用开发者工具排查错误。如果您希望掌握HTML代码编写能力，但对基础语法和实践方法感到困惑，则可能是由于缺乏系统的学习路径和有效的练习方…

程序猿
2025年12月23日
0000
用户投稿

html如何校正背景图_校正HTML背景图的位置与大小【位置】

校正HTML背景图需配置background-position控制位置、background-size调整尺寸、background复合属性整合设置、background-origin指定定位基准，并检查盒模型与父容器影响。如果您在HTML中设置了背景图，但图像显示位置偏移或尺寸拉伸变形，则可能是…

程序猿
2025年12月23日
0000
用户投稿

CSS布局技巧：解决搜索栏输入框与按钮对齐问题

本教程旨在解决网页开发中常见的搜索栏输入框与提交按钮的对齐难题。文章将深入分析导致元素错位的常见CSS属性，并提供两种现代且高效的解决方案：Flexbox布局和`display: inline-block`。通过优化HTML结构和应用精确的CSS规则，确保搜索栏在不同场景下都能实现完美的视觉对齐，同…

程序猿
2025年12月23日
0000
用户投稿

解决jQuery计算中NaN错误：正确处理数值常量的实践指南

本文旨在解决jQuery脚本中因错误处理数值常量而导致的NaN计算结果问题。通过分析尝试将数字字面量作为HTML元素选择器并解析其值这一常见误区，文章将详细阐述如何正确地在JavaScript/jQuery中定义和使用数值常量进行计算，并提供清晰的代码示例和最佳实践，确保数值计算的准确性。理解jQ…

程序猿
2025年12月23日
0000

发表回复

登录后才能评论

使用字典值有条件地划分 DataFrame 列

关于作者

相关推荐

发表回复