怎样用Python实现数据脱敏—字段加密与掩码技术

数据脱敏可通过掩码、加密和哈希等方式实现。1. 掩码隐藏部分数据,如手机号显示为1381234,身份证号显示为110101**011234;2. 使用aes对称加密可实现数据加密与解密;3. 哈希处理用于保留唯一性但不可逆,如将邮箱转为md5值;4. 根据需求选择策略:展示用掩码、需还原用加密、保留标识用哈希,结合pandas批量处理数据表。

怎样用Python实现数据脱敏—字段加密与掩码技术

数据脱敏是保护敏感信息的重要手段,尤其在处理用户隐私、金融交易或医疗记录时。Python 作为一门功能强大且易上手的编程语言,非常适合用于实现数据脱敏任务,比如字段加密和掩码处理。下面介绍几种常见但实用的方法。

怎样用Python实现数据脱敏—字段加密与掩码技术

1. 使用掩码隐藏部分数据

掩码是一种最常见的数据脱敏方式,常用于电话号码、身份证号、银行卡号等字段。做法通常是保留部分字符可见,其余用 * 或其他符号代替。

怎样用Python实现数据脱敏—字段加密与掩码技术

适用场景:

立即学习“Python免费学习笔记(深入)”;

显示用户手机号为 138****1234身份证号显示为 110101********1234

实现方法:

怎样用Python实现数据脱敏—字段加密与掩码技术

def mask_phone(phone, visible_length=3):    return phone[:visible_length] + '*' * (len(phone) - visible_length)# 示例print(mask_phone("13812345678"))  # 输出: 138********

如果是固定长度的字段,比如身份证号(18位),可以这样写:

def mask_id_card(id_card):    return id_card[:6] + '*' * 6 + id_card[-6:]# 示例print(mask_id_card("110101199001011234"))  # 输出: 110101******011234

提示: 对于变长字段要特别注意边界条件,比如字符串长度是否满足掩码要求。

2. 字段加密:使用对称加密算法 AES

如果希望原始数据完全不可见,同时又能在需要时解密还原,可以采用加密的方式。AES 是一种常见的对称加密算法,适合用于字段级加密。

安装依赖:

pip install pycryptodome

示例代码:

from Crypto.Cipher import AESfrom Crypto.Random import get_random_bytesfrom Crypto.Util.Padding import padimport base64key = get_random_bytes(16)  # 16字节密钥cipher = AES.new(key, AES.MODE_CBC)def encrypt_data(data):    data_bytes = data.encode('utf-8')    ciphertext = cipher.encrypt(pad(data_bytes, AES.block_size))    return base64.b64encode(cipher.iv + ciphertext).decode('utf-8')# 示例encrypted = encrypt_data("张三")print(encrypted)

注意事项:

密钥必须妥善保存,否则无法解密。加密后的数据通常以 Base64 形式存储。如果你打算长期使用加密数据,建议将 IV(初始向量)与密文一起存储。

3. 敏感字段替换为哈希值

如果你只需要保留数据的唯一性而不关心可还原性,可以用哈希函数处理。例如将邮箱地址转为 MD5 值。

适用场景:

立即学习“Python免费学习笔记(深入)”;

用户ID映射成匿名标识符邮箱地址脱敏后仍可用于关联分析

示例代码:

import hashlibdef hash_email(email):    return hashlib.md5(email.encode()).hexdigest()# 示例print(hash_email("zhangsan@example.com"))

优点: 简单快速,不可逆
缺点: 可能存在碰撞风险,不适合高安全等级场景

4. 数据脱敏策略的选择建议

根据不同的业务需求和安全级别,可以选择合适的脱敏方式:

仅展示用: 掩码处理即可需恢复原始数据: 用对称加密(如 AES)只需保留唯一标识: 用哈希批量处理数据表: 可结合 pandas 库进行列处理

举个例子:

import pandas as pddf = pd.DataFrame({    'name': ['张三', '李四'],    'phone': ['13812345678', '13987654321']})df['phone'] = df['phone'].apply(lambda x: mask_phone(x))print(df)

基本上就这些。数据脱敏不复杂,但容易忽略细节,比如字段长度、加密密钥管理、数据一致性等。只要根据实际需求选对方法,用 Python 实现起来还是挺轻松的。

以上就是怎样用Python实现数据脱敏—字段加密与掩码技术的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/1363431.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年12月14日 03:24:52
下一篇 2025年12月14日 03:25:03

相关推荐

  • Python中如何使用类继承?面向对象编程进阶

    类继承是构建可维护和可扩展代码的关键,因为它支持代码复用、多态性和清晰的层次结构。1. 它通过“是-a”关系减少冗余代码,使系统结构更清晰;2. 共享父类方法并允许子类覆盖或扩展行为,提升可维护性;3. 新增功能只需继承并添加差异部分,实现高效扩展。多重继承应谨慎使用,因其可能引发菱形继承问题,尽管…

    2025年12月14日 好文分享
    000
  • 在Windows系统中以管理员权限运行Python脚本

    本文介绍如何在Windows操作系统中通过Python脚本启动另一个脚本并赋予其管理员权限。通过创建辅助Python脚本并利用os.system函数调用runas命令,可以有效地提升目标脚本的权限,从而执行需要管理员权限的操作,例如修改系统配置或访问受保护的资源。本文提供详细步骤和示例代码,帮助开发…

    2025年12月14日
    000
  • 解决Python CSV写入时引号问题:csv.writer参数详解

    本文旨在解决在使用Python的csv.writer模块时,输出CSV文件内容被双引号包裹的问题。通过详细的代码示例和参数解释,展示如何正确设置csv.reader和csv.writer的参数,避免不必要的引号,并提供一个完整的解决方案,用于在指定CSV列中替换字符串。 问题背景 在使用Python…

    2025年12月14日
    000
  • 解决Python csv.writer的转义字符和引用参数问题

    摘要 本文旨在解决在使用Python的csv.writer时,由于未正确设置delimiter、quotechar、escapechar等参数,导致输出CSV文件内容被双引号包裹的问题。我们将通过一个实际案例,详细讲解如何正确配置这些参数,避免不必要的引用,并提供修改后的代码示例,以确保CSV文件按…

    2025年12月14日
    000
  • Python中如何实现文件压缩?zipfile模块使用

    要使用python压缩文件或文件夹,可通过zipfile模块实现。1. 压缩单个或多个文件时,使用zipfile对象的write()方法,并可选arcname参数控制压缩包内路径和名称;2. 压缩整个文件夹需结合os.walk()遍历目录结构,并逐个添加文件至zip包中,确保保留原始目录结构;3. …

    2025年12月14日 好文分享
    000
  • 在Windows上以管理员权限运行Python脚本的实用指南

    本文详细阐述了在Windows操作系统中,如何确保Python脚本以管理员权限运行。针对标准执行方式无法自动获取高权限的问题,本文提供了一种简洁有效的解决方案:通过创建一个独立的Python启动器脚本,利用Windows内置的runas命令来启动目标Python脚本,从而成功绕过权限限制,确保依赖管…

    2025年12月14日
    000
  • 如何使用Python处理视频?OpenCV基础入门

    openc++v是python视频处理的首选库,因为它性能高效、功能全面、与python生态集成度高且拥有活跃社区支持。1. 它底层由c++编写并优化,提供接近原生速度,适合大规模或实时视频处理;2. 提供从视频读写到高级计算机视觉任务的完整工具链,无需切换库;3. 拥有完善的文档和庞大的社区资源,…

    2025年12月14日 好文分享
    000
  • Python中如何处理信号?signal模块详解

    要设置信号处理函数,使用signal.signal()注册;常见信号如sigint、sigterm、sighup和sigalrm各有用途;在多线程中只有主线程能接收信号。具体来说:1.用signal.signal(signal.sigxxx, handler)为指定信号注册处理函数,handler接…

    2025年12月14日 好文分享
    000
  • Python中如何使用Lambda函数?匿名函数应用实例

    lambda函数是python中用于创建匿名函数的一种简洁方式,适用于简单、单次使用的场景。它通过lambda关键字定义,结构为“lambda 参数: 表达式”,返回表达式结果,例如square = lambda x: x ** 2等价于定义单行函数。lambda常见于高阶函数如map()、filt…

    2025年12月14日 好文分享
    000
  • Python类型提示进阶:使用Pydantic实现泛型配置与动态对象加载

    本教程探讨了在Python中尝试使用Unpack和TypeVar实现动态函数签名时遇到的类型检查限制。当Unpack应用于一个绑定到TypedDict的TypeVar时,Mypy会报错,表明Unpack需要一个具体的TypedDict类型。文章详细解释了这一限制,并提供了一种基于Pydantic的健…

    2025年12月14日
    000
  • 动态函数签名生成:TypeVar与Unpack的局限及Pydantic解决方案

    本文探讨了在Python中尝试使用TypeVar结合Unpack来动态生成类方法签名的挑战,特别是当TypeVar绑定到TypedDict时遇到的类型检查器限制。我们深入分析了Unpack在此场景下的行为,并指出其需要直接操作TypedDict而非其泛型变量。针对这一限制,文章提出并详细演示了如何利…

    2025年12月14日
    000
  • 如何使用 tqdm 监控文件批量读写与处理进度

    本教程详细介绍了如何利用 Python tqdm 库有效监控文件操作进度,特别是在批量处理(如加密/解密)场景下。我们将探讨如何计算总进度并为每个文件操作提供更新回调,从而实现对整个文件处理过程的直观进度条显示,提升用户体验。 引言:理解文件操作进度监控的挑战 在 python 中进行文件操作时,尤…

    2025年12月14日
    000
  • 使用tqdm跟踪文件写入与处理进度

    本文详细介绍了如何利用Python的tqdm库有效地跟踪文件处理(如加密、解密或批量写入)的进度。文章通过自定义迭代器函数,实现了在文件级别而非字节级别对操作总进度进行可视化,解决了传统tqdm示例主要针对下载流式数据的局限性,并提供了清晰的代码示例和集成指导,帮助开发者为文件操作添加直观的进度条。…

    2025年12月14日
    000
  • 使用tqdm高效跟踪文件写入与目录处理进度

    本文深入探讨了如何利用Python的tqdm库来跟踪文件写入操作的进度,尤其是在处理大型文件或批量处理目录下文件时。我们将介绍两种核心策略:针对单个大文件写入的块级进度跟踪,以及针对整个目录文件处理的宏观进度显示。通过详细的代码示例和解释,读者将学会如何将tqdm集成到文件加密、解密或其他数据转换流…

    2025年12月14日
    000
  • Python tqdm 实践:构建文件处理与写入操作的进度条

    本文深入探讨了如何利用 Python tqdm 库为文件处理和写入操作添加进度条。不同于常见的下载进度追踪,我们将展示一种策略,通过监控文件级别的处理完成情况来更新进度条,特别适用于一次性读取和写入整个文件内容的场景。文章将提供详细的代码示例和实现步骤,帮助开发者在文件加密、转换等任务中实现直观的进…

    2025年12月14日
    000
  • 使用tqdm追踪文件写入进度

    本文详细介绍了如何利用Python的tqdm库来可视化文件操作的进度,特别是针对批量文件处理场景。我们将探讨tqdm在追踪文件写入或处理完成情况时的应用,而非单一写入操作的字节级进度。通过自定义迭代器函数,我们可以有效地聚合文件夹内所有文件的总大小,并以专业、清晰的方式展示处理进度,从而提升用户体验…

    2025年12月14日
    000
  • 解决NumPy中uint8整数溢出导致对数函数返回-inf的问题

    在Python图像处理中,当对uint8类型的NumPy数组应用如log(x + 1)这样的对数函数时,若像素值为255,可能会意外得到-inf结果。这是因为uint8类型在执行255 + 1时会发生整数溢出,导致结果回绕为0,而log(0)则为负无穷。本教程将详细解释这一现象,并提供将数组显式转换…

    2025年12月14日
    000
  • NumPy图像处理:对数变换中的数据类型溢出陷阱与规避

    在NumPy中对图像数据进行对数变换时,若原始图像为uint8类型,np.log(x + 1)运算可能因整数溢出导致x + 1变为0,进而产生-inf结果。这是因为uint8类型255加1会回绕至0。解决方案是在进行对数运算前,将图像数据类型转换为浮点数(如np.float32),以避免溢出,确保计…

    2025年12月14日
    000
  • Google地图评论数据抓取:Playwright问题与Selenium解决方案

    本文旨在解决使用Playwright抓取Google地图评论数据时遇到的不完整问题。核心在于理解动态网页内容加载机制,并提出采用Selenium WebDriver结合显式等待和通用定位策略的解决方案。通过优化元素查找和交互逻辑,确保在页面内容更新后仍能准确、完整地提取数据,提高抓取任务的稳定性和成…

    2025年12月14日
    000
  • 解决NumPy中uint8整数溢出导致对数函数返回负无穷的问题

    在Python中使用NumPy库进行图像处理时,开发者经常会遇到各种数据类型相关的挑战。其中一个常见但容易被忽视的问题是,当对uint8类型的图像数据执行某些数学运算(如对数变换)时,可能会出现意料之外的负无穷(-inf)结果。这通常是由于NumPy数组的特定数据类型(uint8)在执行加法运算时发…

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信