Django模板中安全地过滤特定HTML标签：使用Bleach库实现内容白名单

程序猿 • 2025年11月10日 11:12:58 • web前端 • 阅读 0

本文深入探讨如何在django应用中安全地处理用户输入的html内容，以有效防止跨站脚本（xss）攻击，同时仅允许显示预定义的特定html标签。我们将详细介绍如何利用python的`bleach`库，通过构建标签白名单机制，实现对用户输入html的精确净化，确保在前端页面安全、合规地渲染内容。

在现代Web应用中，允许用户输入并显示HTML内容是一种常见需求，例如富文本编辑器或评论区。然而，直接将用户输入的HTML渲染到页面上存在巨大的安全风险，尤其是跨站脚本（XSS）攻击。恶意用户可能会注入标签或其他有害代码，窃取用户信息或破坏页面功能。Django的safe过滤器或{% autoescape off %}标签虽然能阻止HTML自动转义，但它们会允许所有HTML内容，无法满足只允许特定标签的需求。

为了解决这一问题，我们需要一种机制来过滤用户输入的HTML，只保留一个预定义的、安全的标签白名单。Python的bleach库正是为此而生，它提供了一个强大而灵活的HTML清洗工具。

为什么选择Bleach？

Django自带的safe过滤器仅仅是标记字符串为“安全”，告诉模板引擎不要对其进行HTML转义。这意味着如果用户输入了alert(‘XSS’);并使用|safe渲染，该脚本会直接执行。这显然不是我们想要的结果。

bleach库则不同，它是一个专门用于清理和消毒HTML的第三方库。它允许开发者定义一个允许的HTML标签、属性、样式和协议的白名单，然后从输入的HTML中移除所有不在白名单中的内容，从而有效地抵御XSS攻击。

立即学习“前端免费学习笔记（深入）”；

安装Bleach

首先，你需要在你的Python环境中安装bleach库。通过pip可以轻松完成：

pip install bleach

使用Bleach进行HTML内容过滤

bleach的核心功能体现在其clean()方法上。以下是如何定义允许的HTML标签并使用bleach.clean()来过滤用户输入的示例：

假设我们只允许用户输入
（换行）、（斜体）、（加粗）、

（无序列表）和

（列表项）这五种HTML标签。

import bleach# 定义允许的HTML标签白名单# 注意：bleach默认会移除所有不在白名单中的标签及其内容，# 但可以通过指定strip=False来保留标签内容，只移除标签本身。ALLOWED_TAGS = ['br', 'i', 'strong', 'ul', 'li']# 示例用户输入，包含允许和不允许的标签，以及潜在的恶意脚本user_input = """
这是一个示例内容，包含斜体和
换行。
alert("XSS");

列表项1

列表项2
点击我"""# 使用bleach.clean()进行过滤# tags参数接受一个列表，指定允许的HTML标签# strip参数默认为True，表示移除不允许的标签及其内容。# 如果想保留内容，只移除标签本身，可以设置为False。cleaned_user_input = bleach.clean(user_input, tags=ALLOWED_TAGS, strip=True)print("--- 原始输入 ---")print(user_input)print("n--- 过滤后的输出 ---")print(cleaned_user_input)

输出结果：

AiPPT模板广场

AiPPT模板广场-PPT模板-word文档模板-excel表格模板

147 查看详情

--- 原始输入 ---
这是一个示例内容，包含斜体和
换行。
alert("XSS");

列表项1

列表项2
点击我--- 过滤后的输出 ---这是一个示例内容，包含斜体和
换行。

列表项1

列表项2

从输出可以看出，

标签、标签以及包含javascript:协议的标签都被成功移除，而白名单中的、、
、
和

标签则得以保留。

Django中的集成与最佳实践

在Django应用中，你可以在视图函数、表单的clean()方法或自定义模板过滤器中调用bleach.clean()。

1. 在视图函数中处理

# your_app/views.pyfrom django.shortcuts import renderimport bleachALLOWED_TAGS = ['br', 'i', 'strong', 'ul', 'li']def display_user_content(request): user_raw_html = request.POST.get('content', '') # 假设从POST请求获取 # 在传递给模板之前进行清洗 cleaned_html = bleach.clean(user_raw_html, tags=ALLOWED_TAGS, strip=True) context = { 'safe_content': cleaned_html } return render(request, 'your_template.html', context)

然后在Django模板中，你可以安全地渲染这个已清洗过的HTML：

用户提交内容：
{{ safe_content|safe }} {# 此时使用|safe是安全的，因为内容已经过bleach清洗 #}

2. 创建自定义模板过滤器

为了更好地复用和保持模板的简洁性，你可以创建一个自定义模板过滤器来封装bleach的逻辑。

首先，在你的Django应用目录下创建一个templatetags文件夹（如果不存在），并在其中创建一个Python文件，例如my_filters.py：

# your_app/templatetags/my_filters.pyfrom django import templateimport bleachregister = template.Library()ALLOWED_TAGS_FOR_CONTENT = ['br', 'i', 'strong', 'ul', 'li']# 也可以定义其他用途的标签列表，例如评论区可以允许更少的标签@register.filterdef bleach_html(value): """ 使用bleach清洗HTML内容，只保留预定义的安全标签。 """ if not isinstance(value, str): return value return bleach.clean(value, tags=ALLOWED_TAGS_FOR_CONTENT, strip=True)# 如果需要更灵活的标签控制，可以考虑传入标签列表作为参数# 但模板过滤器传参通常只支持一个，复杂场景建议在视图中处理# @register.filter# def bleach_html_with_tags(value, tags_str):# if not isinstance(value, str):# return value# allowed_tags = [tag.strip() for tag in tags_str.split(',')]# return bleach.clean(value, tags=allowed_tags, strip=True)

然后，在你的Django模板中加载并使用这个过滤器：

{% load my_filters %}

用户提交内容：
{# 假设 user.profile.bio 包含用户输入的HTML #} {{ user.profile.bio|bleach_html|safe }} {# 先清洗，再标记为安全 #}

注意： 即使使用了自定义过滤器，最终渲染时仍然需要加上|safe，因为bleach_html过滤器返回的是一个普通的字符串，Django模板引擎在autoescape模式下依然会对其进行转义。|safe的作用是告诉模板引擎，这个字符串是安全的，可以直接作为HTML输出。

注意事项与总结

白名单原则：始终采用白名单机制，即只允许明确批准的标签和属性，而不是尝试黑名单禁止所有已知恶意内容。黑名单容易遗漏新的攻击向量。属性和样式：bleach不仅可以过滤标签，还可以通过attributes和styles参数控制允许的HTML属性和CSS样式。例如，bleach.clean(html, tags=[‘a’], attributes={‘a’: [‘href’, ‘title’]})。协议：对于href、src等可能包含URL的属性，bleach允许通过protocols参数限制允许的协议（如http, https, m ailto），以防止javascript:等恶意协议。清理时机：HTML清理操作应该在数据存储到数据库之前进行，或者在从数据库读取后、渲染到模板之前进行。通常建议在数据进入应用层时就进行清洗，例如在表单验证或模型保存前。用户体验：在清理HTML时，如果移除了用户输入的某些标签，最好能给用户一些反馈，例如说明允许的标签列表，或者在前端富文本编辑器中限制可用的功能。

通过bleach库，我们可以有效地在Django应用中实现对用户输入HTML的安全过滤，仅允许特定的HTML标签显示，从而在提供丰富内容展示能力的同时，极大地增强了应用的安全性，有效防范了XSS攻击。这是一个在处理用户生成内容时不可或缺的安全实践。

以上就是Django模板中安全地过滤特定HTML标签：使用Bleach库实现内容白名单的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/581753.html

ai app css css样式 django go html java javascript python 前端工具

赞 (0)

打赏微信扫一扫支付宝扫一扫

0 0

生成海报

关于作者

程序猿签约作者

368.6K 文章

0 评论

1 粉丝

这个人很懒，什么都没有留下～

在HTML字符串中动态嵌入变量：避免常见陷阱与最佳实践
上一篇 2025年11月10日 11:12:44

响应式代码块：利用CSS控制宽度与水平滚动条
下一篇 2025年11月10日 11:16:40

相关推荐

 好文分享

访问免费股票市场 API 获取实时市场利率

如果您热衷于交易或只是对股票市场感到好奇，那么获取实时市场汇率将会改变游戏规则。想象一下无需支付高额费用即可实时跟踪股票！听起来很棒，对吧？嗯，这就是免费股票交易 api 发挥作用的地方。在本文中，我们将深入探讨如何利用免费股票市场 api 获取交易策略或研究所需的数据。什么是股票市场 api？ …

程序猿
2025年12月19日
0000

好文分享

父容器溢出滚动，子DIV横向排列如何实现？

如何实现父容器溢出滚动，子div横向排列这个问题可以采用 css 中的 overflow-x 和 white-space 属性来解决。在父容器 .ctn 中，设置 overflow-x: scroll;，表示容器水平方向上的内容超出宽度时显示滚动条。同时设置 white-space: nowra…

程序猿
2025年12月19日
0000

好文分享

Yii中confirm失效，直接执行后续代码的原因是什么？

yii的confirm为何失效，直接执行后续代码？在yii中使用confirm提示用户确认操作，但有时会出现确认框未弹出，直接执行后续操作的情况。这可能是由以下原因造成的：没有加载必要的js文件确保在视图中加载了yii的activefield和activeform组件所必需的js文件。从错误…

程序猿
2025年12月19日
0000

好文分享

方法链：filter()map()效率低下？

方法链接您可能见过使用 array.prototype.filter() 和 array.prototype.map() 在 javascript 中编辑和删除 array 数据中的值的代码例如： [1,2,3].map((mapped) => mapped + 1).filter((fi…

程序猿
2025年12月19日
0000

好文分享

如何实现父容器横向滚动并让子div横向排列？

实现[父容器溢出滚动,子div横向排列] 要实现父容器溢出滚动，同时让子div横向排列，可以通过设置父容器的css属性： overflow-x: scroll;white-space: nowrap;width: 100%; 将这些样式应用到父容器后，当内容超出容器宽度时，就会出现水平滚动条。并且由…

程序猿
2025年12月19日
0000

好文分享

Ubuntu下没有HBuilder怎么办？Vscode 是你的最佳选择吗？

Ubuntu下的HBuilder替代品想要寻找一款类比HBuilder的集成开发环境（IDE）？别担心，即使在Ubuntu系统中，也有一些出色的选择。虽然目前尚未发现与HBuilder完全相似的替代品，但开发者推荐的强大编辑器Vscode是您不错的选择。Vscode拥有丰富的功能，可以满足您的开…

程序猿
2025年12月19日
0000

好文分享

在Ubuntu下，有哪些类似HBuilder的前端开发工具？

Ubuntu下有哪些类似于HBuilder的开发工具？ HBuilder是一款适用于HTML、JS、CSS、Less、PHP等前端语言的集成开发环境。那么，在Ubuntu系统中，有哪些类似于HBuilder的开发工具呢？答案：在Ubuntu中，目前还没有与HBuilder完全类似的开发工具。然而…

程序猿
2025年12月19日
0000

好文分享

如何用 CSS 选择器和原生 JavaScript 操作 HTML 元素？

笔试题详解 1. css选择器如何使用 css 选择器从以下 html 元素中选择除元素之外的所有元素或选择第偶数索引的元素？立即学习“Java免费学习笔记（深入）”；答案： div p:nth-child(even), div :not(p) 2. 原生 javascript 如何使用原…

程序猿
2025年12月19日
0000

好文分享

Nodejs 中的数据库优化技术

优化数据库交互对于构建高性能 node.js 应用程序至关重要，尤其是随着数据和用户量的增加。本文将介绍数据库优化的最佳实践，重点关注 mongodb 和 postgresql。主题包括索引、查询优化、数据结构和缓存技术。数据库优化简介高效的数据库管理可提高性能、减少延迟并降低成本。无论您使用的…

程序猿
2025年12月19日
0000

好文分享

CSS 选择器与原生 JS 操作 DOM：如何选择非 p 元素和偶数位置的 p 元素？如何插入和删除 HTML？

笔试题解惑本篇问答主要解决两道笔试题，帮助开发者厘清 css 选择器和原生 js 的操纵 dom 知识。 1. css 选择器问题：如何在 css 中选择 div 中的非 p 元素或选择偶数位置的 p 元素？立即学习“前端免费学习笔记（深入）”；答案：选择非 p 元素：div :not(p…

程序猿
2025年12月19日
0000

好文分享

如何使用 CSS 选择器和原生 JavaScript 操作 DOM 元素？

笔试题解惑问题 1：选择 div 内元素考虑求解 div 中非 p 元素或偶数下标的 p 元素，可以使用 css 选择器： div :not(p) 选择非 p 元素div p:nth-child(even) 选择偶数下标的 p 元素问题 2：操作 dom 立即学习“Java免费学习笔记（深入）…

程序猿
2025年12月19日
0000

好文分享

ECMAScript 中改变世界的 JavaScript 功能以前所未有的方式提升您的代码！

1. 顶级等待 – 异步简化！异步代码需要将所有内容包装在函数中的日子已经一去不复返了。通过顶级的await，我们可以直接在模块中使用await，而不需要异步函数包装器。此功能对于简化代码和减少样板文件特别方便在顶级等待之前，获取数据需要一个异步函数： async function fetchd…

程序猿
2025年12月19日
0000

NodeList 和 HTMLCollection ：实时集合和静态集合

我们将详细研究nodelist和htmlcollection以及nodelist和htmlcollection。首先，两者都有一个 length 属性，返回列表（集合）中的元素数量。 1.html集合 html dom 中的 htmlcollection 已上线； getelementsbycla…

程序猿
2025年12月19日 • 好文分享
0000

好文分享

如何使用原生 JavaScript 操作 DOM 并插入或删除 HTML 内容？

笔试题求解 1. css 选择问题：选择 div 中的非 p 元素或选择偶数下标 p 元素。答案： div p:nth-child(even)div :not(p) 2. 原生 javascript 操作 dom 立即学习“Java免费学习笔记（深入）”；问题：使用原生 javascript …

程序猿
2025年12月19日
0000

好文分享

Claude AI now runs JavaScript, Python beats JavaScript on GitHub, new Nodejs versions and more

欢迎来到新一期的“JavaScript 本周”！今天，我们将介绍 JavaScript 在编程领域的地位转变、Claude AI 和 Node.js 的突破性更新，以及备受争议的 JS0/JSSugar 提案，以及您不容错过的令人兴奋的新工具！ Python 击败 JavaScript Pytho…

程序猿
2025年12月19日
0000

好文分享

计时器 – JavaScript 挑战

您可以在 github 仓库中找到这篇文章中的所有代码。异步编程定时器相关的挑战有时间限制的缓存 class timelimitedcache { constructor() { this._cache = new map(); } set(key, value, duration) { con…

程序猿
2025年12月19日
0000

好文分享

使用 Alpinejs 构建带有可点击控件的简单自动播放轮播

这是使用 alpine.js 创建简单轮播的分步示例。 alpine.js 是一个轻量级 javascript 框架，提供反应性，可用于构建交互式组件，而无需大量 javascript。在此示例中，我们将创建一个基本的轮播，一次显示一张图像，并使用“上一页”和“下一页”按钮来浏览它们。让我们开始吧…

程序猿
2025年12月19日
0000

好文分享

如何实现动态渐进显示点、线和文本？

实现渐进式显示点、线和文本在实现动态渐出的效果时，可以使用如下思路：对于后台开发，建议采用以下方法：使用渐进脚本：利用 CSS3 的 transition 或 animation 属性，设置元素在一定时间内从透明过渡到不透明。这样，元素将平滑地渐入渐出。分步显示：将元素分成多个部分，然后逐一显…

程序猿
2025年12月19日
0000

好文分享

反对解决 JavaScript SSR 框架中的双数据问题的争论

JavaScript 服务器端渲染 (SSR) 框架中的“双数据问题”是指两次发送相同数据的冗余 – 一次在服务器生成的 HTML 输出中，另一次作为序列化数据以启用客户端水合作用。虽然解决这个问题似乎是有益的，但由于复杂性、实际性能和开发人员体验之间的权衡，存在着反对解决该问题的令人信…

程序猿
2025年12月19日
0000

好文分享

如何在 Nodejsd 中集成 Cloudinary

高效管理图像和视频等媒体资产对于 web 应用程序至关重要，cloudinary 提供了一个出色的解决方案来无缝处理这些资产。在这篇文章中，我们将逐步介绍 cloudinary 在 node.js 项目中的集成过程。什么是云？ cloudinary 是一种基于云的媒体管理服务，允许开发人员以 we…

程序猿
2025年12月19日
0000

发表回复
请登录后评论...
登录后才能评论