用OCR技术,自动识别各种验证码,工具已开源

今天我在给大家分享一个 OCR​ 应用——ddddocr自动识别验证码

前面 4 个d是“带带弟弟”的首拼音。[/笑哭]。

项目地址:https://github.com/sml2h3/ddddocr。

使用的时候用pip​命令直接安装即可pip install ddddocr。

OCR的核心技术包含两方面,一是目标检测模型检测图片中的文字,二是文字识别模型,将图片中的文字转成文本文字。

第一类验证码最简单,它们没有复杂的背景图片,所以目标检测模型可以省略,直接将图片送入文字识别模型即可。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

用OCR技术,自动识别各种验证码,工具已开源

识别代码如下:

import ddddocr
from PIL import Image

# 模型
ocr = ddddocr.DdddOcr(beta=True)

# 验证码图片
with open('test.jpg', 'rb') as f:
image = f.read()

res = ocr.classification(image)
# 验证码文字内容
print(res)

第二类验证码有复杂的背景,需要先用目标检测模型框出文字,在进行识别。

码上飞 码上飞

码上飞(CodeFlying) 是一款AI自动化开发平台,通过自然语言描述即可自动生成完整应用程序。

码上飞 138 查看详情 码上飞

用OCR技术,自动识别各种验证码,工具已开源

代码如下:

import ddddocr
import cv2

det = ddddocr.DdddOcr(det=True)

with open("test2.jpg", 'rb') as f:
image = f.read()

# 目标检测
poses = det.detection(image)
print(poses)

im = cv2.imread("test2.jpg")

# 遍历检测出的文字
for box in poses:
x1, y1, x2, y2 = box
# 给每个文字画矩形框
im = cv2.rectangle(im, (x1, y1), (x2, y2), color=(0, 0, 255), thickness=2)

cv2.imwrite("result.jpg", im)

输出结果如下:

用OCR技术,自动识别各种验证码,工具已开源

可以看到文字部分已经被框出来了,如果我们在上述代码直接将im[y1:y2, x1:x2]送入文字识别模型,就可以识别出对应的文本内容了。

ddddocr还能识别下面这种带滑块的验证码。

用OCR技术,自动识别各种验证码,工具已开源

用OCR技术,自动识别各种验证码,工具已开源

这种虽然不属于OCR的业务范畴,但作为一个通用的验证码识别工具,作者还是支持了,必须给作者点个赞。

以上就是用OCR技术,自动识别各种验证码,工具已开源的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/545139.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月9日 17:08:39
下一篇 2025年11月9日 17:12:43

相关推荐

  • 推荐有效的工具和技术来进行网站性能优化

    随着互联网的快速发展,越来越多的企业将自己的业务扩展到了网上。然而,随之而来的问题是网站的性能优化。一个高效的网站能够提高用户体验,增加访问量以及销售额。为了达到这些目标,下面将要介绍一些有效的工具和技术来帮助您对网站进行性能优化。 页面压缩:页面压缩是通过减少文件大小来提高页面加载速度的一种方法。…

    2025年12月22日
    200
  • 实现响应式布局的技术和策略

    如何实现响应式布局的技术与方法 引言:随着移动设备的普及和多种终端的涌现,实现响应式布局已成为现代网页开发的重要一环。响应式布局可以使网页在不同的屏幕尺寸下自动适应,提供更好的用户体验。本文将介绍响应式布局的技术与方法,并提供具体的代码示例。 一、媒体查询(Media Queries)媒体查询是实现…

    2025年12月21日
    000
  • 静态重定位技术的原理及其应用案例

    静态重定位技术的原理和应用 引言:在现代计算机系统中,内存管理是一个非常重要的课题。随着软件的复杂性和规模的增加,内存的限制成为了我们面临的一个挑战。为了更高效地利用内存资源,静态重定位技术应运而生。本文将介绍静态重定位技术的原理、应用以及提供一些具体的代码示例。 一、静态重定位技术的原理静态重定位…

    2025年12月21日
    000
  • 分析静态定位技术的优缺点

    静态定位技术的优势与局限性分析 随着现代科技的发展,定位技术已经成为我们生活中不可或缺的一部分。而静态定位技术作为其中的一种,具有其特有的优势和局限性。本文将对静态定位技术进行深入分析,以便更好地了解其应用现状和未来的发展趋势。 首先,我们来看一下静态定位技术的优势所在。静态定位技术是通过对待定位对…

    2025年12月21日
    000
  • 优化网页设计的方法——静态定位的应用技巧

    在现代互联网领域中,网页设计是一个至关重要的领域。深入探究网页设计的方方面面,现代设计师越来越意识到静态定位技术的重要性。静态定位技术可以使得网页设计更灵活,更符合用户的需求,从而大大提高用户对于网页的满意度与使用体验。本文将探究静态定位技术的作用,以及如何在网页设计中去优化与应用静态定位技术。 一…

    2025年12月21日
    000
  • 用Canvas技术打造引人入胜的动态效果,轻松get!

    轻松掌握Canvas技术,打造炫酷动态效果 Canvas是HTML5中一项功能强大的绘图技术,可以实现各种炫酷的动态效果。本文将带你一步步学习Canvas的基本用法,并提供具体的代码示例,让你轻松掌握这项技术。 一、Canvas简介 Canvas是HTML5中的一个元素,用于在网页上绘制图形、动画等…

    2025年12月21日
    000
  • 了解canvas的JS技术:你熟知哪些呢?

    探究canvas的JS技术:你知道有哪些吗? 简介 在现代Web开发中,JavaScript已经成为不可或缺的一部分。作为一种脚本语言,它可以为网页添加交互性和动态性。而在JS技术中,canvas则是一个重要的API之一。本文将带您深入了解canvas的JS技术,并介绍一些常用的canvas相关功能…

    2025年12月21日
    200
  • 再谈前端HTML模板技术

    这篇文章介绍的内容是关于再谈前端HTML模板技术,有着一定的参考价值,现在分享给大家,有需要的朋友可以参考一下 在web2.0之前,写jsp的时候虽然有es和JSTL,但是还是坚持jsp。后面在外包公司为了快速交货,还是用了php Smart技术。 web2.0后,前端模板技术风行。 代表有如下三大…

    2025年12月21日 好文分享
    000
  • js如何实现OCR识别 基于Tesseract.js的OCR实现

    javascript实现ocr识别主要依赖tesseract.js库,它是一个纯javascript ocr引擎。解决方案步骤如下:1. 引入tesseract.js,可通过cdn或npm安装;2. 准备包含文本的图片,可以是本地文件或url;3. 使用tesseract.recognize()方法…

    2025年12月20日 好文分享
    000
  • XML数据绑定技术有哪些

    XML数据绑定技术通过将XML与程序对象映射,提升开发效率与代码可读性,主要分为基于XSD生成代码(如JAXB)和基于注解运行时绑定(如Simple XML)两类;选择时需权衡Schema稳定性、性能、开发效率及框架成熟度;相比手动解析,其优势在于类型安全、低维护成本,但面临大文件内存开销与复杂结构…

    2025年12月17日
    000
  • Python开发建议:掌握常用的调试工具和技术

    Python作为一种强大、灵活的编程语言,被广泛应用于各种软件开发领域。然而,许多开发者在学习和使用Python时,往往忽略了调试技术的重要性。调试是软件开发过程中不可或缺的一部分,它可以帮助开发者找到和解决代码中的问题,提高开发效率,保证软件质量。因此,掌握常用的调试工具和技术对于Python开发…

    2025年12月13日
    000
  • Python底层技术揭秘:如何实现图像处理

    Python底层技术揭秘:图像处理的实现及代码示例 导语:图像处理是计算机科学中十分重要的一个领域。通过使用Python以及相关的底层技术,我们能够实现各种各样的图像处理操作。在本文中,我们将揭示Python图像处理的底层技术,并提供一些实用的代码示例。 一、Python图像处理的基础知识在开始探讨…

    2025年12月13日
    000
  • Python底层技术揭秘:如何实现哈希算法

    Python底层技术揭秘:如何实现哈希算法,需要具体代码示例 摘要:哈希算法是计算机领域中常用的技术之一,用于快速确定数据的唯一标识。Python作为一门高级语言,提供了许多内建的哈希函数,如hash()函数以及各种散列算法的实现。本文将揭示哈希算法的原理和Python底层实现的细节,并提供具体的代…

    2025年12月13日
    000
  • php-gd怎样生成验证码干扰线_php-gd绘制验证码干扰线

    答案:使用PHP-GD库生成验证码时,通过创建画布、设置颜色、绘制随机干扰线和输出字符可有效提升安全性。首先创建80×30像素图像并设背景为白色;接着分配文字颜色为黑色;然后使用imageline函数在图像上绘制多条随机位置和角度的干扰线,颜色略深于背景以降低自动识别率;最后生成随机字符绘制到图像并…

    2025年12月12日
    000
  • php-gd怎样生成验证码_php-gd动态验证码生成实例

    使用PHP-GD生成验证码需先启用GD扩展,创建包含随机字符、干扰线和背景色的图像。通过session存储验证码值,前端用img标签调用并支持点击刷新,提交后在check.php中比对session值完成验证。 使用 PHP-GD 生成验证码是常见的安全措施,用于防止机器人自动提交表单。通过 GD …

    2025年12月12日
    100
  • php-gd如何创建验证码背景_php-gd验证码背景制作

    使用PHP-GD库创建验证码背景需先初始化真彩色画布,设置随机浅色背景,再通过循环添加噪点和干扰线以增强防识别能力。 使用PHP-GD库创建验证码背景,关键在于生成一张图像,并添加干扰元素如噪点、线条或渐变背景,以增强安全性并防止自动识别。以下是具体实现方法。 创建基本画布 使用imagecreat…

    2025年12月12日
    000
  • php如何生成一个验证码图片?php GD库生成图形验证码教程

    图形验证码通过PHP结合GD库生成,核心是创建图片、绘制随机字符与干扰元素,并将字符存入Session用于验证。 图形验证码,这个在互联网世界里既熟悉又让人有点烦躁的小东西,它的核心作用无非是想区分你究竟是人还是机器。PHP结合GD库来生成这类图片,其实是个挺经典也相当实用的场景。它不像那些复杂的机…

    2025年12月12日
    100
  • 如何生成验证码?GD库图形处理教程

    生成验证码的核心在于服务器端图像处理技术,常用php的gd库实现。其步骤包括:1.创建画布并定义尺寸;2.分配背景、文字及干扰颜色;3.生成随机字符并存入session;4.绘制文字(可用imagettftext增加自然扭曲);5.添加干扰元素如点、线;6.输出图片并销毁资源。传统验证码仍有价值在于…

    2025年12月11日 好文分享
    000
  • PHP怎么实现文件批量OCR 图片批量OCR识别操作教程

    要实现php批量ocr,首先选择ocr引擎如百度ocr或tesseract-ocr,接着用php脚本循环读取文件并调用ocr接口识别内容,最后存储结果;优化效率可通过并行处理、图像预处理、选择合适引擎和调整api参数实现;数据清洗需定义规则并使用字符串函数或nlp技术处理噪声;常见错误应检查api配…

    2025年12月10日 好文分享
    000
  • PHP中的验证码生成:如何实现图形验证码功能

    在php中实现图形验证码功能需检查gd库并按步骤生成。1. 检查服务器环境,确保启用gd库,若未启用则在php.ini中开启并重启服务器;2. 创建画布、设置颜色、添加干扰元素、写入随机字符串、输出图片并销毁资源;3. 通过添加噪点、线条、使用不同字体及truetype字体增强安全性;4. 将验证码…

    2025年12月10日
    100

发表回复

登录后才能评论
关注微信