一种全新易用的基于Word-Word关系的NER统一模型,刷新了14种数据集并达到新SoTA

一种全新易用的基于词间关系的命名实体识别(ner)统一模型,刷新了14种数据集并达到新的最佳表现(sota)。这篇论文名为《unified named entity recognition as word-word relation classification》,已被aaai2022收录,详细内容可通过链接https://arxiv.org/pdf/2112.10070.pdf查看。

NER任务通常分为三种类型:平面NER(flat NER)、重叠NER(overlapped NER)和不连续NER(discontinuous NER)。近期的研究致力于通过一个统一的大模型来同时解决这三种问题。现有的最佳方法主要基于span-based和seq2seq的方法,但span-based方法需要枚举所有可能的span组合,存在时间复杂度问题;而seq2seq方法则容易产生错误传播。

因此,本文提出了一种新颖的框架,通过预测词与词之间的关系(称之为W2NER)来解决所有NER问题。词间关系主要分为三种:下一邻居词关系(NNW)、尾部-头部词关系(THW-*)和无关系(NONE)。为了解决图的稀疏性问题,文章采用了一个多粒度的二维图来表示词间关系。

一种全新易用的基于Word-Word关系的NER统一模型,刷新了14种数据集并达到新SoTA

模型由三个主要模块组成:

编码层(Encoder Layer):通过BERT获取表示信息,然后通过LSTM获取上下文信息。

卷积层(Convolution Layer):包含一个条件层归一化(CLN)层,用于获得词j在词i前提下的表示。接着是BERT风格的网格表示层,通过BERT的三个嵌入层获得信息表示、关系位置信息表示和位置域表示,并通过MLP融合。最后通过多粒度的空洞卷积(Multi-Granularity Dilated Convolution)采样不同的信息。

共同预测层(Co-Predictor Layer):使用一个普通的MLP和一个用于变长标签预测的biaffine预测器,最后通过softmax层输出结果。

解码层(Decoder Layer)通过NNW和THW-*构建实体环,如图所示:

一种全新易用的基于Word-Word关系的NER统一模型,刷新了14种数据集并达到新SoTA

实验结果显示,该模型在14个公开数据集(包括中文和英文)上都取得了最佳表现,成为最新的SoTA。具体实验结果如下:

英文平面数据集

一种全新易用的基于Word-Word关系的NER统一模型,刷新了14种数据集并达到新SoTA

中文平面数据集

一种全新易用的基于Word-Word关系的NER统一模型,刷新了14种数据集并达到新SoTA

乾坤圈新媒体矩阵管家 乾坤圈新媒体矩阵管家

新媒体账号、门店矩阵智能管理系统

乾坤圈新媒体矩阵管家 17 查看详情 乾坤圈新媒体矩阵管家 英文重叠数据集

一种全新易用的基于Word-Word关系的NER统一模型,刷新了14种数据集并达到新SoTA

中文重叠数据集,F1性能

一种全新易用的基于Word-Word关系的NER统一模型,刷新了14种数据集并达到新SoTA

英文不连续数据集

一种全新易用的基于Word-Word关系的NER统一模型,刷新了14种数据集并达到新SoTA

与前沿最佳论文对比:

一种全新易用的基于Word-Word关系的NER统一模型,刷新了14种数据集并达到新SoTA

消融实验显示,F1性能:

一种全新易用的基于Word-Word关系的NER统一模型,刷新了14种数据集并达到新SoTA

训练速度和推理速度也得到了极大提升:

一种全新易用的基于Word-Word关系的NER统一模型,刷新了14种数据集并达到新SoTA

总的来说,这篇文章提出了一个简单有效的NER新框架,具有较高的应用价值和潜力。

以上就是一种全新易用的基于Word-Word关系的NER统一模型,刷新了14种数据集并达到新SoTA的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/468939.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 06:45:49
下一篇 2025年11月8日 06:49:32

相关推荐

  • Golang如何实现微服务日志收集

    答案:Go微服务通过统一结构化日志输出、标准输出写入、集中采集与上下文追踪实现高效日志收集。1. 使用zap等库输出JSON格式日志;2. 日志写入stdout/stderr,由容器运行时捕获;3. 部署Promtail、Fluent Bit等Agent将日志发送至Loki或Elasticsearc…

    好文分享 2025年12月16日
    000
  • 如何在Golang中优化容器化应用启动时间

    通过编译优化、镜像精简、初始化控制和平台协同,可显著缩短Golang容器应用冷启动时间。具体包括:使用CGO_ENABLED=0、-ldflags=”-s -w”和-trimpath减小二进制体积;采用多阶段Docker构建,基于distroless等最小基础镜像减少运行时开…

    2025年12月16日
    000
  • Golang如何实现文件批量处理工具

    答案:使用Golang实现文件批量处理工具需遍历目录、筛选文件并并发处理。通过filepath.Walk递归遍历,按扩展名等条件过滤文件;利用goroutine和sync.WaitGroup实现并发控制,避免资源耗尽;处理逻辑可抽象为函数变量,支持替换文本、重命名、编码转换等操作;结合channel…

    2025年12月16日
    000
  • 如何在Golang中获取函数参数个数

    使用reflect.TypeOf和NumIn方法可获取函数参数个数,示例中example函数有3个参数,输出为3;对于可变参数函数如variadicExample,NumIn返回2,IsVariadic返回true,表明其为可变参数函数,需注意反射仅适用于函数类型且存在性能开销。 在Golang中,…

    2025年12月16日
    000
  • Golang如何实现Web表单上传文件

    前端表单需设置enctype=”multipart/form-data”以正确提交文件数据。2. 后端使用net/http和mime/multipart解析表单,调用r.ParseMultipartForm(32 在Go语言中实现Web表单上传文件,主要依赖标准库 net/h…

    2025年12月16日
    000
  • PHP与Go基于Unix域套接字的进程间通信:解决连接管理与读取阻塞问题

    本文深入探讨了如何利用unix域套接字实现php与go程序间的进程间通信(ipc)。通过一个具体的案例,我们分析了php客户端在读取go服务器响应时可能遇到的无限等待问题,并提供了核心解决方案——在go服务器端正确关闭客户端连接。文章涵盖了go服务器和php客户端的实现细节、关键代码示例以及连接管理…

    2025年12月16日
    000
  • Go语言中向已关闭的Tar归档文件追加内容的实现方法

    在go语言中,直接向已关闭的`tar`归档文件追加内容并非直观操作。由于`tar`文件规范要求归档以1024字节的零填充记录作为结束标记,`tar.writer.close()`会写入这些标记。本文将详细介绍如何通过以读写模式重新打开文件,并巧妙地将文件指针回溯1024字节,从而覆盖结束标记,实现向…

    2025年12月16日
    000
  • 如何在Golang中实现协程同步

    Golang中协程同步主要通过sync.WaitGroup、sync.Mutex、channel和sync.Cond实现。使用sync.WaitGroup可等待一组协程完成,适用于批量任务场景;通过Add(n)设置计数,每个协程结束调用Done(),主线程调用Wait()阻塞直至所有任务结束。当多个…

    2025年12月16日
    000
  • Go语言中带有互斥锁的结构体如何安全地实现JSON序列化

    本文探讨了在go语言中,当结构体包含`sync.rwmutex`并自定义`marshaljson`方法时,如何避免因内部递归调用`json.marshal`而导致的无限循环问题。核心解决方案是利用类型别名来创建一个不带自定义序列化方法的副本,从而在确保数据并发安全的同时,实现结构体的正确json编码…

    2025年12月16日
    000
  • GNU Make中动态目标生成与多维迭代构建策略

    本文探讨了在gnu make中实现跨平台多架构动态构建的策略。针对`:=`无法在目标定义时动态评估自动变量的问题,我们引入了`foreach`、`eval`和`define`的组合用法,通过定义模板并动态生成目标及其配方,有效解决了需要迭代不同操作系统和架构组合进行构建的场景,从而避免了手动枚举所有…

    2025年12月16日
    000
  • Go语言并发执行外部命令:构建高效协程池的最佳实践

    本文详细探讨了在Go语言中高效、可控地并发执行大量外部命令的策略。针对简单`go`关键字导致的问题和传统`WaitGroup`批处理的局限性,文章提出并详细阐述了基于工作池(Worker Pool)模式的解决方案,通过结合通道(channel)进行任务分发和`sync.WaitGroup`进行任务完…

    2025年12月16日
    000
  • Go Datastore Put 操作中的“无效实体类型”错误解析

    本文深入探讨了在使用 Go 语言的 Google Cloud Datastore 客户端库执行 `Put` 操作时,可能遇到的“datastore: invalid entity type”错误。核心问题在于 `datastore.Put` 函数期望接收一个指向结构体的指针,而非结构体值本身。文章通…

    2025年12月16日
    000
  • 使用 Go 的 net/http 包服务 PHP 文件

    本文介绍了如何使用 Go 的 net/http 包来服务 PHP 文件。由于 Go 的 FCGI 包的局限性,推荐使用 CGI 或通过反向代理(如 Nginx)将 Go 程序和 PHP FCGI 程序结合起来。后者效率更高,并能利用反向代理的诸多优势,例如 keep-alive 超时等,从而提高整体…

    2025年12月16日
    000
  • 获取 Go 中 reflect.Interface 类型值的正确方法

    本文旨在阐述在 Go 语言中,如何正确获取类型为 `reflect.Interface` 的值。由于 Go 语言的反射机制对接口类型的特殊处理,直接使用 `reflect.TypeOf` 获取接口的类型可能会得到非预期的结果。本文将介绍一种通过复合类型间接获取 `reflect.Interface`…

    2025年12月16日
    000
  • 如何在Golang中判断变量是否为数组或切片

    答案:通过reflect.TypeOf(v).Kind()判断变量是否为数组或切片,若值为reflect.Array或reflect.Slice则对应为数组或切片类型,使用时需先判空避免panic。 在Golang中判断一个变量是否为数组或切片,可以通过反射(reflect包)来实现。Go语言的类型…

    2025年12月16日
    000
  • Go语言中高效反转32位二进制数的位操作技巧

    本文将深入探讨在go语言中,如何利用位操作(bit manipulation)技术高效地反转一个32位无符号整数(uint32)的二进制位序。通过一系列精心设计的位移和掩码操作,我们能够实现极快的二进制反转,这对于性能敏感的场景,如位数组处理或加密算法,具有重要意义。 在底层编程、加密算法或竞技编程…

    2025年12月16日
    000
  • Go Goroutine深度解析:与协程的本质差异与调度机制

    go语言的goroutine是一种轻量级并发原语,常与传统协程(coroutine)混淆。本文旨在明确区分goroutine与协程的核心差异:协程通过显式指令控制挂起与恢复,而goroutine则在特定运行时事件(如i/o、通道操作)发生时隐式地让出控制权。文章还将探讨goroutine的调度机制,…

    2025年12月16日
    000
  • Go语言中版本号字符串的比较:利用Hashicorp Go-Version库

    本教程详细阐述了在go语言中比较版本号字符串的最佳实践。针对版本号的复杂性,我们推荐使用hashicorp的`go-version`库。该库提供了一套健壮的api,能够方便地解析、规范化和比较版本号,确保比较逻辑的准确性和可靠性。文章将提供具体示例代码,指导读者如何在项目中集成和使用此库。 在软件开…

    2025年12月16日
    000
  • PHP与Go基于Unix域套接字的进程间通信:连接管理与常见陷阱

    本文探讨了php客户端与go服务端通过unix域套接字进行进程间通信时遇到的连接挂起问题。核心原因是go服务端在处理完请求后未能及时关闭客户端连接,导致php客户端持续等待数据。解决方案是在go服务端的连接处理函数中,使用`defer c.close()`确保连接被正确关闭。文章详细分析了php的`…

    2025年12月16日
    000
  • 如何在Golang中实现Web表单自动填充

    在Golang中实现Web表单自动填充需通过html/template将后端数据绑定到前端输入框的value属性,利用{{.FieldName}}语法传递结构体或map数据,支持编辑回显与提交失败时保留用户输入,结合ParseFiles加载独立模板文件可提升维护性,同时注意XSS防护与表单重复提交问…

    2025年12月16日
    000

发表回复

登录后才能评论
关注微信