Pandas 中基于条件和 Groupby 替换列中的特定字符

程序猿 • 2025年12月14日 13:20:30 • 用户投稿 • 阅读 0

本文介绍了如何使用 Pandas 的 groupby 功能，并结合字符串处理，根据条件替换 DataFrame 列中的特定字符。具体来说，我们将根据 ‘ACCOUNT’ 列进行分组，然后将 ‘ASSET_CLASS’ 列中的 “XX” 替换为递增的两位数字，并根据替换的数字修改资产类别名称，例如将 “FI CHF” 替换为 “FI CHF Gov” 或 “FI CHF Corporate”。此外，还介绍了当一个账户同时拥有 CHF 和 EUR 资产时，如何使用更精细的分组策略来实现相同的替换逻辑。

基于 Groupby 的字符串替换

在 Pandas 中，经常需要根据分组对数据进行转换。本节将演示如何使用 groupby 和字符串操作来替换 DataFrame 中特定列的字符，并根据替换结果修改其他字符串。

示例 DataFrame

首先，我们创建一个示例 DataFrame：

import pandas as pddf = pd.DataFrame({    'ACCOUNT': [1, 1, 2, 2],    'ASSET_CLASS': ['11201XX FI CHF', '11201XX FI CHF',                    '12201XX FI EUR', '12201XX FI EUR',                   ],})print(df)

输出:

   ACCOUNT ASSET_CLASS0        1  11201XX FI CHF1        1  11201XX FI CHF2        2  12201XX FI EUR3        2  12201XX FI EUR

替换 “XX” 并修改资产类别名称

以下代码演示了如何基于 ‘ACCOUNT’ 列进行分组，并将 ‘ASSET_CLASS’ 列中的 “XX” 替换为递增的两位数字，同时修改资产类别名称。

s1 = df.groupby('ACCOUNT').cumcount().add(1).astype('str').str.zfill(2)m = {'01': ' Gov', '02': ' Corporate'}s2 = df['ASSET_CLASS'].str.split('XX')df['ASSET_CLASS'] = s2.str[0] + s1 + s2.str[1] + s1.map(m)print(df)

代码解释：

df.groupby(‘ACCOUNT’).cumcount(): 根据 ‘ACCOUNT’ 列进行分组，并计算每个组内的累计计数。.add(1): 将累计计数加 1，因为我们希望从 1 开始计数。.astype(‘str’).str.zfill(2): 将计数转换为字符串，并使用 zfill(2) 填充前导零，确保所有数字都是两位数。例如，1 变为 “01”，2 变为 “02”。m = {’01’: ‘ Gov’, ’02’: ‘ Corporate’}: 创建一个字典，用于将替换的数字映射到相应的资产类别名称后缀。s2 = df[‘ASSET_CLASS’].str.split(‘XX’): 将 ‘ASSET_CLASS’ 列中的字符串按照 “XX” 分割成两部分。df[‘ASSET_CLASS’] = s2.str[0] + s1 + s2.str[1] + s1.map(m): 将分割后的字符串、替换的数字和资产类别名称后缀拼接在一起，更新 ‘ASSET_CLASS’ 列。

输出：

   ACCOUNT         ASSET_CLASS0        1  1120101 FI CHF Gov1        1  1120102 FI CHF Corporate2        2  1220101 FI EUR Gov3        2  1220102 FI EUR Corporate

处理一个账户拥有多种资产类别的情况

如果一个账户同时拥有多种资产类别（例如 CHF 和 EUR），则需要更精细的分组策略。以下示例演示了如何处理这种情况。

示例 DataFrame

df = pd.DataFrame({    'ACCOUNT': [1, 1, 1, 1, 2, 2],    'ASSET_CLASS': ['11201XX FI CHF', '11201XX FI CHF',                    '12201XX FI EUR', '12201XX FI EUR',                    '12201XX FI EUR', '12201XX FI EUR',                   ],})print(df)

输出:

   ACCOUNT ASSET_CLASS0        1  11201XX FI CHF1        1  11201XX FI CHF2        1  12201XX FI EUR3        1  12201XX FI EUR4        2  12201XX FI EUR5        2  12201XX FI EUR

基于账户和资产类别进行分组

以下代码演示了如何基于 ‘ACCOUNT’ 和资产类别进行分组，并将 ‘ASSET_CLASS’ 列中的 “XX” 替换为递增的两位数字，同时修改资产类别名称。

s1 = df.groupby(['ACCOUNT', df['ASSET_CLASS'].str.split(' ').str[-1]]).cumcount()        .add(1).astype('str').str.zfill(2)m = {'01': ' Gov', '02': ' Corporate'}s2 = df['ASSET_CLASS'].str.split('XX')df['ASSET_CLASS'] = s2.str[0] + s1 + s2.str[1] + s1.map(m)print(df)

代码解释：

df.groupby([‘ACCOUNT’, df[‘ASSET_CLASS’].str.split(‘ ‘).str[-1]]): 根据 ‘ACCOUNT’ 列和 ‘ASSET_CLASS’ 列的最后一个单词（即资产类别）进行分组。df[‘ASSET_CLASS’].str.split(‘ ‘).str[-1] 用于提取资产类别。其余步骤与前面的示例相同，用于计算累计计数、替换 “XX” 和修改资产类别名称。

输出：

   ACCOUNT         ASSET_CLASS0        1  1120101 FI CHF Gov1        1  1120102 FI CHF Corporate2        1  1220101 FI EUR Gov3        1  1220102 FI EUR Corporate4        2  1220101 FI EUR Gov5        2  1220102 FI EUR Corporate

总结

本文介绍了如何使用 Pandas 的 groupby 功能和字符串操作，根据条件替换 DataFrame 列中的特定字符。通过灵活运用 groupby 和字符串处理函数，可以实现各种复杂的数据转换任务。在实际应用中，需要根据具体的数据结构和业务需求选择合适的分组策略和替换逻辑。

以上就是Pandas 中基于条件和 Groupby 替换列中的特定字符的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/1373535.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

Python怎么使用enumerate获取索引和值_enumerate函数索引与值遍历指南

上一篇 2025年12月14日 13:20:24

解决Selenium启动Chrome浏览器SSL证书验证失败问题

下一篇 2025年12月14日 13:20:38

好文分享

HTML5怎么制作广告_HTML5用动画与交互制横幅或弹窗广告吸引点击【制作】

可利用HTML5结合CSS3动画、Canvas、Web Animations API、Intersection Observer和video标签制作互动广告：一用@keyframes实现横幅入场动画；二用Canvas绘制并响应悬停；三用Web Animations API控制弹窗时序；四用Inter…

程序猿
2025年12月23日
3000
好文分享

html5怎么插入文档_HT5用object或iframe嵌入PDF/Word文档显示【插入】

可在HTML5中用iframe或object标签嵌入PDF，需设宽高及可访问路径；Word文档需借OneDrive等第三方服务代理渲染；须处理跨域限制并提供下载降级方案。如果您希望在HTML5页面中嵌入PDF或Word文档并直接显示，可以使用或标签实现。以下是几种可行的嵌入方法：一、使用ifra…

程序猿
2025年12月23日
3000
好文分享

html5怎么引入字体_HTML5用@font-face引入本地或网络字体文件【引入】

需用CSS的@font-face规则加载自定义字体，步骤包括：准备WOFF2/WOFF/TTF多格式文件并存放至项目目录；在CSS中为每种字重和样式单独声明@font-face；通过font-family应用字体；可选Google Fonts外链方式；添加font-display: swap缓解FO…

程序猿
2025年12月23日
1000
好文分享

怎么用html5链接_html5用a标签href属性给文字或图片加跳转链接【使用】

HTML5中使用a元素配合href属性实现跳转：可为文字、图片添加超链接；支持绝对URL、相对路径及页面内锚点；通过target=”_blank”和rel=”noopener”可在新标签页安全打开链接。如果您希望在网页中为文字或图片添加可点击的跳转功…

程序猿
2025年12月23日
4000
好文分享

html如何学好_学好HTML的关键点与练习【关键】

学好HTML需掌握基础语法结构、熟记语义化标签、通过真实项目练习、验证代码规范性并拆解优质网页源码。具体包括：标准HTML5骨架、正确使用header/nav/main等标签、构建个人页与新闻页、W3C校验及阅读mozilla.org源码。如果您希望掌握HTML语言并能熟练构建网页结构，则需要聚焦…

程序猿
2025年12月23日
2000
好文分享

flash怎么变为html5_用Swiffy或CreateJS将Flash动画转HTML5【转换】

可采用四种方法迁移Flash动画至HTML5：一、用Swiffy转换SWF为Canvas/JS；二、用CreateJS从Animate导出HTML5 Canvas；三、用Lottie+Bodymovin将AE版动画转JSON播放；四、用Ruffle模拟器直接运行原SWF。如果您希望将现有的Flas…

程序猿
2025年12月23日
1000
好文分享

html5怎样插入可预览文档_html5文档预览功能实现与控件选择【步骤】

HTML5文档预览有五种方式：一、用iframe嵌入Google Docs等在线服务；二、用embed/object标签加载同源PDF；三、集成PDF.js实现自定义渲染；四、用FileReader配合Office Online Viewer预览Office文件；五、后端转HTML再前端加载。如果…

程序猿
2025年12月23日
1000
好文分享

html如何上传到空间_将HTML文件上传到网站空间步骤【步骤】

HTML文件无法上网访问是因为未上传至网站空间，需通过FTP客户端、主机控制面板、Git部署或SFTP命令行四种方式之一上传到服务器根目录。如果您已经编写完成一个HTML文件，但无法在互联网上访问它，则可能是由于该文件尚未上传至网站空间。以下是将HTML文件上传到网站空间的具体步骤：一、使用FT…

程序猿
2025年12月23日
4000
好文分享

如何敲代码html5_正确敲写HTML5代码的步骤与规范【步骤】

编写HTML5代码需遵循五步规范：一、声明并构建含lang属性、head与body的结构；二、用header、nav、main等语义化元素替代div；三、正确嵌套文本元素，空元素不闭合斜杠且img必有alt；四、link引入CSS，script合理使用async/defer；五、通过W3C验证并确保…

程序猿
2025年12月23日
3000
好文分享

html5拖放怎么操作_HT5用draggable属性或JS监听drag事件实现拖放【操作】

HTML5拖放功能需五步实现：一、设draggable=”true”启用拖动；二、用dragstart设置dataTransfer数据与视觉反馈；三、目标容器监听dragover并preventDefault；四、监听drop事件获取数据并操作DOM；五、dataTransf…

程序猿
2025年12月23日
3000
好文分享

html5怎么画实心_html5用CSS background-color或SVG画实心图形【绘制】

HTML5提供CSS background-color和SVG两种原生方式绘制实心图形：一、CSS用div+background-color画矩形；二、SVG用画矩形；三、用画圆形；四、用画多边形；五、用画任意闭合路径。如果您希望在网页中绘制实心图形，HTML5 提供了多种原生方式实现，无需依赖外…

程序猿
2025年12月23日
0000
好文分享

HTML5图片怎么重叠_HTML5用position:absolute或z-index让图片重叠【重叠】

HTML5中图片重叠靠CSS的position和z-index实现，与HTML5版本无关；需设父容器position: relative，子图片position: absolute并用top/left等定位，z-index控制层级。 HTML5 中让图片重叠，核心是用 CSS 的 position …

程序猿
2025年12月23日
0000
好文分享

html5 对号怎么写_HTML5用✓实体或CSS画勾选框显示对号【写法】

可在HTML5中通过五种方式显示对号：一、HTML字符实体（如✓）；二、直接输入Unicode字符✓（需UTF-8编码）；三、CSS伪元素绘制；四、SVG内联绘制；五、Web字体图标（如Font Awesome）。如果您希望在HTML5页面中显示对号（✓），可通过字符实体、Unicode直接输入或…

程序猿
2025年12月23日
0000
好文分享

html如何看懂_看懂并理解HTML代码结构【理解】

掌握HTML解析需五步：一、识别%ignore_a_1%根元素及head/body骨架；二、依缩进分析嵌套层级；三、辨识header、nav等语义标签功能；四、解析class、href等属性与文本关联；五、用浏览器开发者工具验证DOM结构。如果您看到一段HTML代码但无法快速识别其组织方式和各标签…

程序猿
2025年12月23日
2000
好文分享

html5怎样让搜索框支持拖拽排序_html5拖拽API与搜索框排序【技巧】

需利用HTML5 Drag and Drop API实现搜索框拖拽排序：一、设draggable=”true”并监听dragstart/dragover/drop事件；二、用DataTransfer传递JSON上下文；三、CSS定制拖拽反馈样式；四、隔离拖拽与输入焦点；五、检…

程序猿
2025年12月23日
0000
好文分享

带悬停展开的HTML5按钮宽度动画【指南】

应采用max-width替代width实现更稳定动画，通过设置按钮初始max-width为72px、hover时增至160px，配合overflow: hidden和padding-right预留空间，避免重排跳动并确保文本完整显示。如果您希望创建一个在鼠标悬停时平滑展开显示额外文本的HTML5按…

程序猿
2025年12月23日
0000
好文分享

怎么运行editplus中的html代码_editplus运行html代码步骤【指南】

在EditPlus中编写HTML代码并保存为.html文件，2. 通过配置用户工具添加浏览器路径，3. 使用快捷键或右键打开浏览器预览页面，实现代码编辑与效果查看分离。要在 EditPlus 中运行 HTML 代码，需要借助外部浏览器来查看效果，因为 EditPlus 本身只是一个文本编辑器，不具…

程序猿
2025年12月23日
0000
好文分享

html5怎么添加链接_HTML5用a标签href属性给文字或图片加跳转链接【添加】

HTML5中使用a标签及href属性实现跳转：一、文字链接直接包裹文本并设href；二、图片链接将img嵌套于a内；三、加target=”_blank”和rel=”noopener”实现安全新窗口打开；四、用id和#href实现页面内锚点跳转；五、空链…

程序猿
2025年12月23日
0000
好文分享

html5怎么指定路径_HTML5用相对或绝对路径指定图片视频等资源位置【指定】

HTML5资源无法显示通常因路径错误，解决方法包括：一、相对路径（如src=”images/logo.png”）；二、绝对路径（如src=”/media/video.mp4″）；三、data URL内联小资源；四、base标签统一基准路径；五、避免fi…

程序猿
2025年12月23日
0000
好文分享

html5证书怎么查_html5用SSL证书工具查站点HTTPS证书有效性【查询】

验证HTTPS证书有效性需三步：一、浏览器开发者工具查证书信息；二、在线SSL检测工具分析证书链与OCSP状态；三、OpenSSL命令行本地验证并提取证书详情。如果您尝试验证某个网站是否正确部署了适用于HTML5环境的HTTPS证书，或需确认其SSL证书是否有效、未过期、匹配域名且由可信机构签发，…

程序猿
2025年12月23日
0000