用OCR技术，自动识别各种验证码，工具已开源

程序猿 • 2025年11月9日 17:08:54 • 用户投稿 • 阅读 2

今天我在给大家分享一个 OCR 应用——ddddocr自动识别验证码。

前面 4 个d是“带带弟弟”的首拼音。[/笑哭]。

项目地址：https://github.com/sml2h3/ddddocr。

使用的时候用pip命令直接安装即可pip install ddddocr。

OCR的核心技术包含两方面，一是目标检测模型检测图片中的文字，二是文字识别模型，将图片中的文字转成文本文字。

第一类验证码最简单，它们没有复杂的背景图片，所以目标检测模型可以省略，直接将图片送入文字识别模型即可。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

识别代码如下：

import ddddocr
from PIL import Image

# 模型
ocr = ddddocr.DdddOcr(beta=True)

# 验证码图片
with open('test.jpg', 'rb') as f:
image = f.read()

res = ocr.classification(image)
# 验证码文字内容
print(res)

第二类验证码有复杂的背景，需要先用目标检测模型框出文字，在进行识别。

码上飞

码上飞（CodeFlying）是一款AI自动化开发平台，通过自然语言描述即可自动生成完整应用程序。

138 查看详情

代码如下：

import ddddocr
import cv2

det = ddddocr.DdddOcr(det=True)

with open("test2.jpg", 'rb') as f:
image = f.read()

# 目标检测
poses = det.detection(image)
print(poses)

im = cv2.imread("test2.jpg")

# 遍历检测出的文字
for box in poses:
x1, y1, x2, y2 = box
# 给每个文字画矩形框
im = cv2.rectangle(im, (x1, y1), (x2, y2), color=(0, 0, 255), thickness=2)

cv2.imwrite("result.jpg", im)

输出结果如下：

可以看到文字部分已经被框出来了，如果我们在上述代码直接将im[y1:y2, x1:x2]送入文字识别模型，就可以识别出对应的文本内容了。

ddddocr还能识别下面这种带滑块的验证码。

这种虽然不属于OCR的业务范畴，但作为一个通用的验证码识别工具，作者还是支持了，必须给作者点个赞。

以上就是用OCR技术，自动识别各种验证码，工具已开源的详细内容，更多请关注创想鸟其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 chuangxiangniao@163.com 举报，一经查实，本站将立刻删除。
发布者：程序猿，转转请注明出处：https://www.chuangxiangniao.com/p/545139.html

ocr 技术验证码

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

程序猿签约作者

414.1K 文章

0 评论

2 粉丝

这个人很懒，什么都没有留下～

苹果iPhone14卡死怎么办

上一篇 2025年11月9日 17:08:54

知名车评人陈震发生交通事故座驾劳斯莱斯闪灵维修费或超百万：曾称买车损险不划算

下一篇 2025年11月9日 17:09:40

好文分享

推荐有效的工具和技术来进行网站性能优化

随着互联网的快速发展，越来越多的企业将自己的业务扩展到了网上。然而，随之而来的问题是网站的性能优化。一个高效的网站能够提高用户体验，增加访问量以及销售额。为了达到这些目标，下面将要介绍一些有效的工具和技术来帮助您对网站进行性能优化。页面压缩：页面压缩是通过减少文件大小来提高页面加载速度的一种方法。…

程序猿
2025年12月22日
2000
好文分享

实现响应式布局的技术和策略

如何实现响应式布局的技术与方法引言：随着移动设备的普及和多种终端的涌现，实现响应式布局已成为现代网页开发的重要一环。响应式布局可以使网页在不同的屏幕尺寸下自动适应，提供更好的用户体验。本文将介绍响应式布局的技术与方法，并提供具体的代码示例。一、媒体查询（Media Queries）媒体查询是实现…

程序猿
2025年12月21日
0000
好文分享

静态重定位技术的原理及其应用案例

静态重定位技术的原理和应用引言：在现代计算机系统中，内存管理是一个非常重要的课题。随着软件的复杂性和规模的增加，内存的限制成为了我们面临的一个挑战。为了更高效地利用内存资源，静态重定位技术应运而生。本文将介绍静态重定位技术的原理、应用以及提供一些具体的代码示例。一、静态重定位技术的原理静态重定位…

程序猿
2025年12月21日
0000
好文分享

分析静态定位技术的优缺点

静态定位技术的优势与局限性分析随着现代科技的发展，定位技术已经成为我们生活中不可或缺的一部分。而静态定位技术作为其中的一种，具有其特有的优势和局限性。本文将对静态定位技术进行深入分析，以便更好地了解其应用现状和未来的发展趋势。首先，我们来看一下静态定位技术的优势所在。静态定位技术是通过对待定位对…

程序猿
2025年12月21日
0000
好文分享

优化网页设计的方法——静态定位的应用技巧

在现代互联网领域中，网页设计是一个至关重要的领域。深入探究网页设计的方方面面，现代设计师越来越意识到静态定位技术的重要性。静态定位技术可以使得网页设计更灵活，更符合用户的需求，从而大大提高用户对于网页的满意度与使用体验。本文将探究静态定位技术的作用，以及如何在网页设计中去优化与应用静态定位技术。一…

程序猿
2025年12月21日
0000
好文分享

用Canvas技术打造引人入胜的动态效果，轻松get！

轻松掌握Canvas技术，打造炫酷动态效果 Canvas是HTML5中一项功能强大的绘图技术，可以实现各种炫酷的动态效果。本文将带你一步步学习Canvas的基本用法，并提供具体的代码示例，让你轻松掌握这项技术。一、Canvas简介 Canvas是HTML5中的一个元素，用于在网页上绘制图形、动画等…

程序猿
2025年12月21日
0000
好文分享

了解canvas的JS技术：你熟知哪些呢？

探究canvas的JS技术：你知道有哪些吗？简介在现代Web开发中，JavaScript已经成为不可或缺的一部分。作为一种脚本语言，它可以为网页添加交互性和动态性。而在JS技术中，canvas则是一个重要的API之一。本文将带您深入了解canvas的JS技术，并介绍一些常用的canvas相关功能…

程序猿
2025年12月21日
2000
再谈前端HTML模板技术

这篇文章介绍的内容是关于再谈前端HTML模板技术，有着一定的参考价值，现在分享给大家，有需要的朋友可以参考一下在web2.0之前，写jsp的时候虽然有es和JSTL，但是还是坚持jsp。后面在外包公司为了快速交货，还是用了php Smart技术。 web2.0后，前端模板技术风行。代表有如下三大…

程序猿
2025年12月21日 • 好文分享
0000
js如何实现OCR识别基于Tesseract.js的OCR实现

javascript实现ocr识别主要依赖tesseract.js库，它是一个纯javascript ocr引擎。解决方案步骤如下：1. 引入tesseract.js，可通过cdn或npm安装；2. 准备包含文本的图片，可以是本地文件或url；3. 使用tesseract.recognize()方法…

程序猿
2025年12月20日 • 好文分享
0000
好文分享

XML数据绑定技术有哪些

XML数据绑定技术通过将XML与程序对象映射，提升开发效率与代码可读性，主要分为基于XSD生成代码（如JAXB）和基于注解运行时绑定（如Simple XML）两类；选择时需权衡Schema稳定性、性能、开发效率及框架成熟度；相比手动解析，其优势在于类型安全、低维护成本，但面临大文件内存开销与复杂结构…

程序猿
2025年12月17日
0000
用户投稿

Python开发建议：掌握常用的调试工具和技术

Python作为一种强大、灵活的编程语言，被广泛应用于各种软件开发领域。然而，许多开发者在学习和使用Python时，往往忽略了调试技术的重要性。调试是软件开发过程中不可或缺的一部分，它可以帮助开发者找到和解决代码中的问题，提高开发效率，保证软件质量。因此，掌握常用的调试工具和技术对于Python开发…

程序猿
2025年12月13日
0000
用户投稿

Python底层技术揭秘：如何实现图像处理

Python底层技术揭秘：图像处理的实现及代码示例导语：图像处理是计算机科学中十分重要的一个领域。通过使用Python以及相关的底层技术，我们能够实现各种各样的图像处理操作。在本文中，我们将揭示Python图像处理的底层技术，并提供一些实用的代码示例。一、Python图像处理的基础知识在开始探讨…

程序猿
2025年12月13日
0000
用户投稿

Python底层技术揭秘：如何实现哈希算法

Python底层技术揭秘：如何实现哈希算法，需要具体代码示例摘要：哈希算法是计算机领域中常用的技术之一，用于快速确定数据的唯一标识。Python作为一门高级语言，提供了许多内建的哈希函数，如hash()函数以及各种散列算法的实现。本文将揭示哈希算法的原理和Python底层实现的细节，并提供具体的代…

程序猿
2025年12月13日
0000
用户投稿

php-gd怎样生成验证码干扰线_php-gd绘制验证码干扰线

答案：使用PHP-GD库生成验证码时，通过创建画布、设置颜色、绘制随机干扰线和输出字符可有效提升安全性。首先创建80×30像素图像并设背景为白色；接着分配文字颜色为黑色；然后使用imageline函数在图像上绘制多条随机位置和角度的干扰线，颜色略深于背景以降低自动识别率；最后生成随机字符绘制到图像并…

程序猿
2025年12月12日
0000
用户投稿

php-gd怎样生成验证码_php-gd动态验证码生成实例

使用PHP-GD生成验证码需先启用GD扩展，创建包含随机字符、干扰线和背景色的图像。通过session存储验证码值，前端用img标签调用并支持点击刷新，提交后在check.php中比对session值完成验证。使用 PHP-GD 生成验证码是常见的安全措施，用于防止机器人自动提交表单。通过 GD …

程序猿
2025年12月12日
1000
用户投稿

php-gd如何创建验证码背景_php-gd验证码背景制作

使用PHP-GD库创建验证码背景需先初始化真彩色画布，设置随机浅色背景，再通过循环添加噪点和干扰线以增强防识别能力。使用PHP-GD库创建验证码背景，关键在于生成一张图像，并添加干扰元素如噪点、线条或渐变背景，以增强安全性并防止自动识别。以下是具体实现方法。创建基本画布使用imagecreat…

程序猿
2025年12月12日
1000
用户投稿

php如何生成一个验证码图片？php GD库生成图形验证码教程

图形验证码通过PHP结合GD库生成，核心是创建图片、绘制随机字符与干扰元素，并将字符存入Session用于验证。图形验证码，这个在互联网世界里既熟悉又让人有点烦躁的小东西，它的核心作用无非是想区分你究竟是人还是机器。PHP结合GD库来生成这类图片，其实是个挺经典也相当实用的场景。它不像那些复杂的机…

程序猿
2025年12月12日
1000
如何生成验证码？GD库图形处理教程

生成验证码的核心在于服务器端图像处理技术，常用php的gd库实现。其步骤包括：1.创建画布并定义尺寸；2.分配背景、文字及干扰颜色；3.生成随机字符并存入session；4.绘制文字（可用imagettftext增加自然扭曲）；5.添加干扰元素如点、线；6.输出图片并销毁资源。传统验证码仍有价值在于…

程序猿
2025年12月11日 • 用户投稿
0000
PHP怎么实现文件批量OCR 图片批量OCR识别操作教程

要实现php批量ocr，首先选择ocr引擎如百度ocr或tesseract-ocr，接着用php脚本循环读取文件并调用ocr接口识别内容，最后存储结果；优化效率可通过并行处理、图像预处理、选择合适引擎和调整api参数实现；数据清洗需定义规则并使用字符串函数或nlp技术处理噪声；常见错误应检查api配…

程序猿
2025年12月10日 • 用户投稿
1000
用户投稿

PHP中的验证码生成：如何实现图形验证码功能

在php中实现图形验证码功能需检查gd库并按步骤生成。1. 检查服务器环境，确保启用gd库，若未启用则在php.ini中开启并重启服务器；2. 创建画布、设置颜色、添加干扰元素、写入随机字符串、输出图片并销毁资源；3. 通过添加噪点、线条、使用不同字体及truetype字体增强安全性；4. 将验证码…

程序猿
2025年12月10日
1000

发表回复

登录后才能评论

用OCR技术，自动识别各种验证码，工具已开源

关于作者

相关推荐

发表回复