用AI打击键盘侠和网络喷子,保护被网暴者的生命安全

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

网暴又夺生命!用AI打击键盘侠和网络喷子,能否拯救被网暴者的命运?

​一个95后女生自杀了,起因只是在网上发布了这么一篇博文。

网暴又夺生命!用AI打击键盘侠和网络喷子,能否拯救被网暴者的命运?

这篇充满温情的博文发布后,主人公郑灵华却遭遇到了大量的造谣和谩骂。

有人质疑她的身份,造谣说她是“陪酒女”,只是因为她的头发是粉色的;有人造谣她是“老少恋”、“恰流量”、“骗子精”,造谣她利用爷爷的病挣钱。

如是总总,不堪入目。尽管很多媒体对谣言进行了辟谣,但是郑灵华没有收到道歉,甚至郑灵华在拿起法律武器维权的时候,依然受到骚扰。

最终,郑灵华患上抑郁症,不久前结束了自己的生命。

这样的事情在互联网上发生过很多次,这种弥漫在网络世界的“人言可畏”不仅让人观感恶心,甚至能夺取人们的生命,这样的行为也有个专门的名词——网络暴力,简称“网暴”。

那么在AI已经可以和人类对答如流的今天,AI是否可以在识别网暴行为中发挥作用呢?

突破两大难点,识别网暴言论准确率超90%

尽管大部分互联网平台都已经上线了一些识别特别言论的系统,但是这些系统大多只是针对关键的词进行检测和删除,显然是不够智能的,稍加注意就能绕开这些限制。

事实上,准确识别网暴言论,需要做到两点:

如何联系上下文准确识别网暴言论?如何高效识别网暴言论?

第一点关注的是网暴言论的内容,因为网络上大部分信件和留言都是分段的,往往是在对话中,网暴行为逐渐变得严重,最终酿成恶果。

第二点关注的是速度,毕竟互联网环境下,要处理的数据太多了,如果检测需要很久,那么这个系统将毫无实际价值,也不会得到采用。

网暴又夺生命!用AI打击键盘侠和网络喷子,能否拯救被网暴者的命运?

英国的一组研究人员开发了一种新的人工智能模型,称为 BiCapsHate,它克服了这两个挑战,研究结果1月19日发表在《IEEE Transactions on Computational Social Systems》上的一项论文中。

Originality AI Originality AI

专门为网络出版商设计的抄袭和AI检测工具

Originality AI 26 查看详情 Originality AI

网暴又夺生命!用AI打击键盘侠和网络喷子,能否拯救被网暴者的命运?

该模型由五层深层神经网络组成,它从一个输入层开始,处理输入文本,然后到一个 embedding 层,将文本嵌入到一个数字表示中,然后是 BiCaps 层学习顺序和语言上下文表示,dense层为最终分类准备模型,最后输出层输出结果。

BiCaps 层是最重要的组成部分,它通过胶囊网络(capsule networks)有效地获取输入文本前后方向不同方向的上下文信息。得益于丰富的手工调试的浅层和深层辅助功能(包括Hatebase词典),使模型信息更加丰富。研究人员在五个基准数据集上进行了广泛的实验,以证明所提出的BiCapsHate模型的有效性。总体结果显示,BiCapsHate优于现有的最先进的方法,包括fBERT, HateBERT和ToxicBERT。

在平衡和非平衡数据集上,BiCapsHate分别达到94%和92% f-score的准确率。

速度快,可以在GPU运行

塔里克 · 安瓦尔(Tarique Anwar)是约克大学计算机科学系的讲师,他参与了这项研究。他指出,网上的争论往往会导致负面的、可恨的和辱骂性的“网暴”评论,而现有的社交媒体平台的内容审查做法无法控制这种情况。

他说:“此外,网上仇恨言论有时会映射现实环境,导致犯罪和暴力行为。”,塔里克 · 安瓦尔也表示,网上仇恨言论导致身体暴力和暴乱的例子有好几次。

网暴又夺生命!用AI打击键盘侠和网络喷子,能否拯救被网暴者的命运?

为了帮助解决这个问题,塔里克 · 安瓦尔的团队决定开发 BiCapsHate,并且取得了非常好的效果。

正如安瓦尔指出的那样,语言在某些情况下可能是模棱两可的,即一个词在一种语境中可能是正面的,而在另一种语境中可能是就是负面的。此前的模型在这方面都不够优秀,如 HateBERT、 toxicBERT 和 fBERT,这些人工智能能够在一定程度上捕捉上下文,但是塔里克 · 安瓦尔认为“这些仍然不够好”。

BiCapsHate 的另一个优点是该模型能够使用有限的硬件资源执行计算。“(其他模型)需要像 GPU 这样的高端硬件资源,以及用于计算的高端系统,”塔里克 · 安瓦尔解释说。“相反,BiCapsHate……可以在 CPU 机器上执行,即使你只有8GB的内存。”

值得注意的是,到目前为止,该人工智能已经被开发和测试,仅用于分析英语言论,因此它将需要被改编为其他语言。与更激烈的仇恨言论相比,它也不太善于发现带有温和或微妙的仇恨语气的攻击性词语。

研究人员希望下一步能够探索评估在线表达仇恨的用户的心理健康状况的方法。如果有人担心这个人精神不稳定,并且可能对现实世界中的人施加身体暴力,可以考虑早期干预来降低发生这种情况的可能性。​

以上就是用AI打击键盘侠和网络喷子,保护被网暴者的生命安全的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/551408.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月9日 20:15:51
下一篇 2025年11月9日 20:17:09

相关推荐

  • 优化LangChain与ChromaDB:提升RAG响应完整性与准确性

    本文旨在解决基于langchain和chromadb构建的检索增强生成(rag)系统中,因文档分块策略不当导致响应内容不完整的问题。通过深入探讨文本分块大小、重叠度以及检索器配置的关键参数,提供实用的代码示例和最佳实践,帮助开发者优化rag管道,确保从pdf等源文档中获取全面且准确的回答。 在构建基…

    2025年12月14日
    000
  • 解决Pandas DataFrame query方法中日期时间变量引用失败的问题

    在使用Pandas DataFrame的query()方法进行数据筛选时,直接在查询字符串中引用Python日期时间变量可能会导致ValueError。本文将深入探讨这一常见问题,解释其根本原因,并提供一个简洁而有效的解决方案:通过在变量名前添加@符号来正确地将外部Python变量注入到query(…

    2025年12月14日
    000
  • 如何在Python中实现条件不满足时重新获取输入

    本文旨在讲解如何在Python程序中,当用户输入不符合预设条件时,能够提示用户并重新获取输入,直至满足条件为止。通过示例代码,我们将演示如何使用while循环来实现这一功能,并避免陷入无限循环。掌握此技巧可以提升程序的健壮性和用户体验。 在编写Python程序时,经常需要用户输入数据。为了保证程序的…

    2025年12月14日
    000
  • Python 包内部模块引用最佳实践:解决 No module named 错误

    本教程详细阐述了在 Python 包内部正确引用模块的方法,特别是如何解决 No module named 错误。通过确保 __init__.py 文件的存在以及合理运用相对导入,开发者可以有效地管理包内模块间的依赖关系,构建结构清晰、可维护的 Python 项目。 1. 理解 Python 包结构…

    2025年12月14日
    000
  • Python 包内部模块引用:解决子模块导入根模块问题

    本文旨在解决 Python 包开发中常见的子模块无法导入根目录模块的问题。当子文件夹内的文件尝试引用包根目录下的模块时,常会遇到 No module named 错误。教程将详细阐述如何通过正确配置 __init__.py 文件来定义 Python 包,并利用相对导入机制 (from ..modul…

    2025年12月14日
    000
  • Brython图形显示故障排查:深入理解脚本路径与常见陷阱

    本文旨在解决Brython图形应用中常见的显示故障,特别是当出现“样式表语法错误”等误导性提示时。教程通过一个实际案例,揭示了这类问题往往并非表面所示,而是源于HTML中Python脚本文件路径配置不当。文章强调了在调试Brython应用时,全面检查HTML结构,尤其是script type=&#8…

    2025年12月14日
    000
  • Brython图形渲染疑难解答:HTML中Python脚本路径与加载机制

    本文探讨Brython图形应用中遇到的常见问题:图形不显示。尽管表面上可能出现样式表语法错误等误导性提示,但核心问题往往在于HTML文件中Python脚本的引用路径不正确。教程将详细解释如何通过检查这一行。它告诉Brython去加载名为main.py的Python文件。如果实际文件路径是src/ma…

    2025年12月14日
    000
  • 探索REST API请求头与参数模式:从文档到实践

    在与REST API交互时,理解请求头和查询参数的结构至关重要。本文将探讨如何获取这些API模式信息,从查阅官方文档、利用OpenAPI/Swagger规范到在缺乏明确指导时进行观察和试错。我们将通过Riot Games API的实例,演示如何正确配置请求头和查询参数,以确保API调用的成功与高效。…

    2025年12月14日
    000
  • Brython应用调试指南:解析Python脚本加载错误与图形显示异常

    本文旨在解决Brython应用中常见的图形显示问题,特别是当看似无关的“无效语法”错误实则掩盖了Python脚本加载失败这一核心问题时。我们将深入探讨HTML中Brython脚本的正确引用方式,强调src属性的重要性,并提供利用浏览器开发者工具进行有效调试的策略,帮助开发者快速定位并解决文件路径或资…

    2025年12月14日
    000
  • 使用PyPSA和Gurobi求解器设置时间限制

    本文档旨在指导用户如何在PyPSA模型中使用Gurobi求解器时设置时间限制。我们将详细介绍如何配置solver_options参数,以及如何处理求解器因达到时间限制而中断的情况,确保模型在可控的时间范围内求解,并获得可用的次优解。 在PyPSA模型中配置Gurobi求解器的时间限制 在使用PyPS…

    2025年12月14日
    000
  • Python Selenium应对动态Web元素的定位策略

    本文旨在探讨如何使用Python Selenium有效定位和交互动态生成的Web元素。针对类名或ID在运行时和页面刷新时变化的场景,教程将详细介绍基于链接文本、CSS选择器和XPath的多种定位策略,并提供实用的代码示例和注意事项,帮助开发者构建更稳定、健壮的自动化测试或爬虫脚本。 在web自动化测…

    2025年12月14日
    000
  • PyMilvus连接Milvus Cloud数据库故障排除与最佳实践

    本文旨在指导用户解决在使用PyMilvus连接Milvus Cloud数据库时遇到的MilvusException: Fail connecting to server错误。我们将详细介绍从基础连接配置、网络连通性验证到PyMilvus版本管理和官方示例利用的全面故障排除步骤,确保用户能够顺利建立与…

    2025年12月14日
    000
  • Python中高效查找指定子文件夹的策略

    本文探讨在Python中高效查找特定子文件夹的策略。针对传统os.listdir在大规模目录下性能低下的问题,引入并详细介绍了os.scandir。通过对比分析,阐明os.scandir如何利用系统级优化减少I/O操作,提供更快的目录遍历能力,并给出优化后的代码示例,帮助开发者构建高性能的文件系统操…

    2025年12月14日
    000
  • PyCharm文件移动重构中未使用的导入自动移除问题及局部解决方案

    PyCharm在执行文件移动重构时,会自动移除文件中未使用的导入语句,这对于部分开发者而言是困扰。本文将探讨此行为的现状,指出其为已知问题,并提供一种局部解决方案,以防止特定导入被意外删除。 问题描述与现状 PyCharm作为一款功能强大的Python集成开发环境,其提供的重构功能,特别是文件移动(…

    2025年12月14日
    000
  • 从 Azure ItemPaged 迭代器中提取数据到字典或列表

    本文旨在帮助初学者理解如何从 Azure SDK 返回的 ItemPaged 迭代器中提取数据,并将其转换为更易于使用的数据结构,如字典或列表。我们将重点介绍如何访问迭代器中对象的属性,以及如何将这些属性提取到自定义的数据结构中。通过本文,你将能够有效地处理 Azure API 返回的数据,并将其用…

    2025年12月14日
    000
  • 从API正确解析Apache Parquet数据的实践指南

    本文旨在解决从API获取Parquet格式数据时常见的解码问题。核心在于避免将二进制数据误处理为文本,而是通过requests.Response.content直接获取原始字节流,并结合io.BytesIO与pandas.read_parquet或pyarrow.parquet.read_table…

    2025年12月14日
    000
  • Python游戏开发:动态调整下落精灵速度的教程

    本教程将指导您如何在Python游戏中使用livewires库,根据玩家得分动态调整下落精灵(如雪球)的速度。通过修改精灵的类变量并引入一个分数阈值检查机制,您可以实现在游戏进程中逐步提升难度,增强游戏的可玩性。教程将涵盖代码实现细节,并提供优化建议以确保速度调整的准确性和鲁棒性。 1. 游戏场景与…

    2025年12月14日
    000
  • Flask应用启动后保持后台数据库更新

    本文介绍了如何在Flask应用启动后,利用后台任务持续更新数据库。通过使用APScheduler库,我们可以创建一个后台调度器,定时执行数据库更新函数。文章详细讲解了如何配置和启动调度器,并提供了代码示例,帮助开发者解决Flask应用在启动后无法持续运行后台任务的问题,确保数据库始终保持最新状态。 …

    2025年12月14日
    000
  • Selenium自动化:利用显式等待解决动态按钮点击难题

    在使用Selenium进行网页自动化时,有时会遇到元素已被找到但无法点击的问题,尤其对于动态加载的按钮如“Load More”。本文将深入探讨这一常见挑战,并提供一种可靠的解决方案:利用Selenium的显式等待(Explicit Waits)机制,确保元素在可交互状态时才执行点击操作,从而有效提升…

    2025年12月14日
    000
  • PyTorch DataLoader 目标张量批处理行为详解与修正

    在使用 PyTorch DataLoader 进行模型训练时,如果 Dataset 的 __getitem__ 方法返回的标签(target)是一个 Python 列表而非 torch.Tensor,DataLoader 默认的批处理机制可能导致标签张量形状异常,表现为维度被转置。本文将深入解析这一…

    2025年12月14日
    000

发表回复

登录后才能评论
关注微信