免费的OCR识别工具就是香!

哈喽,大家好,我是爱撸码的开源大叔!

经常在网上查询文档资料的朋友一定有过这样的经历:好不容易找到了需要的内容,可是别说下载了,连复制一句话都不给复制的。尤其是 PDF 文档和图片类资料,就算我们充值下载到本地,很多也无法复制文本,只能手动敲出来。

项目中有些场景也需要图片识别,比如识别证件、证照等等。

下面分享一款%ignore_a_1%端的 OCR 文字识别软件——「PaddleOCR」,可以帮助我们解决这一问题。

PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力使用者训练出更好的模型,并应用落地。

特性丰富易用的OCR相关工具组件半自动数据标注工具PPOCRLabel:支持快速高效的数据标注数据合成工具Style-Text:批量合成大量与目标场景类似的图像支持用户自定义训练,提供丰富的预测推理部署方案支持PIP快速安装使用可运行于Linux、Windows、MacOS等多种系统支持多语言OCR模型支持中英文数字组合识别、竖排文本识别、长文本识别效果展示

免费的OCR识别工具就是香!
免费的OCR识别工具就是香!

不需要安装任何工具,可以直接在pc端进行图片识别,喜欢pyton的同学,可以按照下面的安装教程部署。

免费的OCR识别工具就是香!

模型列表

模型简介

模型名称

推荐场景

检测模型

方向分类器

识别模型

中英文超轻量OCR模型(9.4M)

ch_ppocr_mobile_v2.0_xx

移动端&服务器端

推理模型/ 预训练模型]

推理模型 / 预训练模型

推理模型/ 预训练模型

中英文通用OCR模型(143.4M)

ch_ppocr_server_v2.0_xx

服务器端

EasySub – AI字幕生成翻译工具 EasySub – AI字幕生成翻译工具

EasySub 是一款在线 AI 字幕生成器。 它提供AI语音识别、AI字幕生成、AI字幕翻译,本来就很简单的视频剪辑。

EasySub – AI字幕生成翻译工具 40 查看详情 EasySub – AI字幕生成翻译工具

推理模型/ 预训练模型

推理模型/ 预训练模型

推理模型 / 预训练模型

还有更多模型,这里不全列举了,感兴趣同学可以去官网阅读学习。

通用中英文OCR数据集ICDAR2019-LSVTICDAR2017-RCTW-17中文街景文字识别中文文档文字识别ICDAR2019-ArTPP-OCR Pipeline

PP-OCR是一个实用的超轻量OCR系统。主要由DB文本检测[2]、检测框矫正和CRNN文本识别三部分组成[7]。该系统从骨干网络选择和调整、预测头部的设计、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型自动裁剪量化8个方面,采用19个有效策略,对各个模块的模型进行效果调优和瘦身,最终得到整体大小为3.5M的超轻量中英文OCR和2.8M的英文数字OCR。

安装教程

1、安装python3

代码语言:javascript代码运行次数:0运行复制

#下载软件包wget https://www.python.org/ftp/python/3.6.8/Python-3.6.8.tgz#解压tar -zxvf Python-3.6.8.tgzcd  Python-3.6.8#编译./configure#安装make make install#创建软连接ln -s /usr/local/python3/bin/python3 /usr/bin/python3#查看版本python3 -V

在安装过程中如果出现configure: error: no acceptable C compiler found in $PATH,是缺少合适的编译器

代码语言:javascript代码运行次数:0运行复制

sudo yum install gcc-c++

出现这个问题zipimport.ZipImportError: can’t decompress data; zlib not available,缺少依赖包

代码语言:javascript代码运行次数:0运行复制

yum -y install zlib*

2、安装PaddlePaddle2.0

代码语言:javascript代码运行次数:0运行复制

pip3 install --upgrade pippython3 -m pip install paddlepaddle==2.0.0 -i https://mirror.baidu.com/pypi/simple

3、克隆代码

代码语言:javascript代码运行次数:0运行复制

git clone https://gitee.com/paddlepaddle/PaddleOCR

4、安装PaddleOCR 第三方依赖包

代码语言:javascript代码运行次数:0运行复制

cd PaddleOCR#安装第三方依赖项pip3 install -r requirements.txt

5、模型下载

代码语言:javascript代码运行次数:0运行复制

mkdir inference && cd inference# 下载检测模型并解压wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_det_infer.tar&& tar xf ch_ppocr_mobile_v2.0_det_infer.tar# 下载方向分类器模型并解压wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar && tar xf ch_ppocr_mobile_v2.0_cls_infer.tar#下载文本方向分类器病解压wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_rec_infer.tar && tar xf ch_ppocr_mobile_v2.0_rec_infer.tar

6、识别图片

代码语言:javascript代码运行次数:0运行复制

#识别单张图片python3 tools/infer/predict_system.py --image_dir="992822f810dc3cbbdcca711a1c4b0097.jpg"  --det_model_dir="./inference/ch_ppocr_mobile_v2.0_det_infer/"  --rec_model_dir="./inference/ch_ppocr_mobile_v2.0_rec_infer/" --cls_model_dir="./inference/ch_ppocr_mobile_v2.0_cls_infer/" --use_angle_cls=True --use_space_char=Trueimage_dir:源文件目录 det_model_dir:识别后存放的文件目录

如果报错ModuleNotFoundError: No module named ‘cv2’,缺少cv2

代码语言:javascript代码运行次数:0运行复制

# 安装pip3wget https://pypi.python.org/packages/source/p/pip/pip-18.1.tar.gz# 解压tar -zxvf pip-18.1.tar.gz # 安装cd pip-18.1python3 setup.py buildpython3 setup.py install# 添加到软连接ln -s /usr/local/python3/bin/pip3 /usr/bin/pip3pip install opencv-python

如果出现pip is configured with locations that require TLS/SSL, however the..不可用的解决方法

代码语言:javascript代码运行次数:0运行复制

yum install openssl-devel -ycd Python-3.6.8./configure --with-sslmakesudo make install

在识别图像时候报错的一些解决方案

代码语言:javascript代码运行次数:0运行复制

#深度学习pip install paddlepaddle  -i https://pypi.tuna.tsinghua.edu.cn/simple# ModuleNotFoundError: No module named 'PIL'pip install pillow# MODULENOTFOUNDERROR: NO MODULE NAMED 'PADDLE'pip install paddlehub==1.6.0 -i https://pypi.tuna.tsinghua.edu.cn/simple#No module named 'imgaug'pip install git+https://github.com/aleju/imgaug

ps:Paddle-OCR也可以部署在Windows系统中。

代码语言:javascript代码运行次数:0运行复制

pip3 install --upgrade pippython3 -m pip install paddlepaddle==2.0.0 -i https://mirror.baidu.com/pypi/simplegit clone https://github.com/PaddlePaddle/PaddleOCR#在PaddleOCR目录下pip3 install -r requirements.txt

总结

Paddle-OCR 属于Paddle 框架其中的一个应用,提供了很多好玩的模型,支持多种语言的数据集,关键是提供了轻量级模型,降低了使用难度。

以上就是免费的OCR识别工具就是香!的详细内容,更多请关注创想鸟其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/453482.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2025年11月8日 00:20:01
下一篇 2025年11月8日 00:23:58

相关推荐

  • 什么是BRC-20?它和以太坊上的ERC-20有什么不同?

    binance币安交易所 注册入口: APP下载: 欧易OKX交易所 注册入口: APP下载: 火币交易所: 注册入口: APP下载: BRC-20是基于比特币网络的一种实验性同质化代币标准。它利用Ordinals协议将数据铭刻在聪(Satoshi)上,实现了在比特币链上发行和转移代币的功能,这与依…

    好文分享 2025年12月9日
    000
  • 虚拟币排行榜20名最新2025年 10月数字货币前20榜单

    binance币安交易所 注册入口: APP下载: 欧易OKX交易所 注册入口: APP下载: 火币交易所: 注册入口: APP下载: 2025年10月,数字货币市场预计将呈现更加多元和成熟的格局。本榜单基于当前技术演进、生态系统建设、市场应用和社区共识进行前瞻性预测,旨在揭示那些可能在未来市场中占…

    2025年12月9日
    000
  • 什么是跨链桥?如何将资产从一条链转移到另一条链?

    binance币安交易所 注册入口: APP下载: 欧易OKX交易所 注册入口: APP下载: 火币交易所: 注册入口: APP下载: 跨链桥是一种连接独立区块链的“桥梁”,它允许用户将资产或数据从一个区块链网络(如以太坊)安全地转移到另一个网络(如Solana),解决了不同链之间的孤岛问题,极大地…

    2025年12月9日
    000
  • 什么是“创世区块”?它对比特币有什么特殊的意义?

    binance币安交易所 注册入口: APP下载: 欧易OKX交易所 注册入口: APP下载: 火币交易所: 注册入口: APP下载: 创世区块,又称区块0,是比特币区块链中第一个被创建的区块。它由中本聪在2009年1月3日创建,是整个比特币系统的基石,所有后续区块都直接或间接地链接到它,犹如一部史…

    2025年12月9日
    000
  • 中心化交易所(CEX)与去中心化交易所(DEX)对比

    在数字资产交易的广阔天地中,中心化交易所(cex)和去中心化交易所(dex)是两种主流的平台类型,它们各自拥有独特的优势和局限性。理解两者的核心差异,对于投资者来说至关重要,因为它直接影响到交易的安全性、便捷性以及所能提供的资产种类。本文将深入探讨cex和dex的运作机制、特点以及它们在实际应用中的…

    好文分享 2025年12月9日
    000
  • 如何选择加密货币交易所?关键考量因素

    在数字资产浪潮汹涌的今天,选择一个可靠、安全且功能强大的加密货币交易所,是每位投资者迈向成功的第一步。面对市面上琳琅满目的选择,如何拨开迷雾,精准识别出最适合自己的交易平台,成为了一个至关重要的问题。本文将深入探讨选择加密货币交易所时应重点关注的几个关键考量因素,帮助您构建一套完善的筛选标准,确保您…

    好文分享 2025年12月9日
    000
  • 美联储举办支付创新会议,聚焦稳定币与代币化,讨论传统金融与DeFi融合

    美联储举办支付创新会议,聚焦稳定币与代币化 近日,美国联邦储备系统举办了一场备受瞩目的支付创新会议,其核心议题直指稳定币与资产代币化这两大金融科技前沿领域。此次会议汇集了来自传统金融机构、科技公司、监管机构以及新兴区块链项目的专家与决策者,共同探讨支付系统的未来演变,特别是传统金融与去中心化金融如何…

    2025年12月9日
    000
  • Meme币官方网址是什么_Meme币官方网站入口

    Meme币,又称模因币,是一种起源于互联网文化、笑话或热点事件的加密货币。它们通常不具备复杂的底层技术或宏大的应用场景,其价值更多地依赖于社区的共识和持续的热度推动。 一、知名Meme币官方入口 1、由于Meme币是一个宽泛的类别,并非单一项目,因此没有统一的“官方网站”。每个Meme币项目都有其独…

    2025年12月9日
    000
  • 2025币安(币an)最新官方地址 币安官方认证首页地址入口

    币安最新官网访问入口: 币安官方APP下载地址: 访问币安时,务必通过币安官方认证入口进入,以确保页面安全与账户隐私。进入官网后,可在首页显眼位置看到“注册”与“登录”按钮。建议将该页面加入浏览器收藏夹,方便日后直接访问,避免误入仿冒网站。 币安官方注册流程 币安支持邮箱与手机号两种注册方式,操作简…

    2025年12月9日
    000
  • 什么是K线图?我如何看懂红绿柱子来判断买卖时机?

    binance币安交易所 注册入口: APP下载: 欧易OKX交易所 注册入口: APP下载: 火币交易所: 注册入口: APP下载: K线图,又称蜡烛图,是金融市场中记录特定周期内价格走势的图表。它直观地展示了开盘价、最高价、最低价和收盘价,是技术分析中判断多空力量和预测未来行情的核心工具。 认识…

    2025年12月9日
    000
  • 什么是Gas费?为什么转账有时那么贵,如何节省?

    binance币安交易所 注册入口: APP下载: 欧易OKX交易所 注册入口: APP下载: 火币交易所: 注册入口: APP下载: Gas费是区块链网络上的交易手续费,就像汽车的燃油。它用于支付给验证者处理和验证交易的报酬,是确保网络安全与稳定运行的核心机制。 为什么转账有时那么贵? 1、网络拥…

    2025年12月9日
    000
  • 币安交易所官网入口 币安交易平台APP最新版v3.6.0安装指南

    币安(binance)是全球知名的数字货币交易所,提供现货、合约、理财、质押等多元化服务。本文将介绍币安交易所官网入口的安全访问方式,并为你讲解币安交易平台app最新版v3.6.0的安装指南,帮助新用户轻松完成下载安装与账户注册。 币安官网访问入口 建议通过币安官方认证网址进入官网,避免因非官方链接…

    2025年12月9日 好文分享
    000
  • Meme币官网平台入口_Meme币官网主页在线平台链接

    meme币,又称模因币,是一类源于互联网文化、表情包或网络热点的加密货币。它们通常具有高度的社区驱动性和病毒式传播特性,从最初的玩笑和实验,逐渐演变为数字资产领域中一个充满活力与投机色彩的独特分支。这类代币的价值往往与社区的关注度、社交媒体的热度以及市场情绪紧密相连,吸引了大量寻求高风险高回报机会的…

    2025年12月9日
    000
  • 美联储将于10月21日举办加密支付创新会议

    美联储将于10月21日举办一场主题为加密支付创新的重要会议,这一消息迅速在全球金融科技领域引起广泛关注。此次会议被视为传统金融监管机构与新兴加密世界之间一次关键的对话,标志着全球最大的中央银行之一正以更加开放和审慎的态度,深入探索数字货币与支付系统的未来。 会议背景与战略意图 随着区块链技术的成熟和…

    2025年12月9日
    000
  • 以太坊合约如何实现权限控制_以太坊合约权限管理方法

    在以太坊智能合约中,权限控制是保障资产安全和系统稳定运行的关键。一个设计良好的权限管理机制可以有效防止未经授权的操作,确保只有特定角色的地址才能执行敏感功能。本文将介绍几种主流的以太坊合约权限管理方法,帮助开发者构建更安全的去中心化应用。 一、所有权模式(Ownable) 1、所有权模式是最基础、最…

    2025年12月9日
    000
  • 中文币怎么购买 中文币购买渠道

    中文币购买渠道:主流加密货币交易所 购买中文币最常见、最便捷的渠道就是通过**主流的加密货币交易所**。这些平台提供法币入金、币币交易等多种服务,方便用户直接使用法定货币购买加密货币。选择一个**信誉良好、安全性高**的交易所是保障资金安全的关键。以下是几个推荐的交易所,并对它们进行简要介绍: 1.…

    好文分享 2025年12月9日
    000
  • 黄金疯涨,比特币却原地发呆?“数字黄金”人设崩了?

    黄金疯涨,比特币却原地发呆? 当国际金价一路高歌猛进,接连突破历史高位时,加密货币世界的“数字黄金”——比特币,却显得异常平静,甚至有些步履蹒跚。这种强烈的反差,不禁让许多投资者和市场观察者心生疑虑:比特币那顶被寄予厚望的“数字黄金”桂冠,是否已经摇摇欲坠?它作为价值储存和避险资产的人设,难道真的崩…

    2025年12月9日
    000
  • 比特币地址怎么生成_比特币地址生成的具体方法

    binance币安交易所 注册入口: APP下载: 欧易OKX交易所 注册入口: APP下载: 火币交易所: 注册入口: APP下载: 获取一个比特币地址是参与数字资产交易的第一步,它就像您的银行账号一样,用于接收和发送比特币。本文将为您介绍几种主流且安全的比特币地址生成方法,帮助您轻松上手。 一、…

    2025年12月9日
    000
  • 美联储10月降息概率达99%,加密市场迎来政策关键周

    美联储降息预期达99%叠加SEC批准加密ETP新规,美元走弱与监管明确化推动资产重配,黄金、美股成长板块及加密货币迎来利好,机构加速布局数字资产,市场进入流动性宽松与制度创新共振的新阶段。 2025年10月的第三周,全球金融市场正屏息凝视,等待一个几乎确定无疑的货币事件——美联储的再次降息。根据CM…

    2025年12月9日
    000
  • 如何查看比特币交易记录_查询比特币交易记录的步骤

    binance币安交易所 注册入口: APP下载: 欧易OKX交易所 注册入口: APP下载: 火币交易所: 注册入口: APP下载: 查询比特币的交易记录是了解资金流向和确认交易状态的关键一步。由于其网络的公开透明特性,任何人都可以通过使用区块链浏览器轻松追踪任何一笔交易的详细信息。 一、准备查询…

    2025年12月9日
    000

发表回复

登录后才能评论
关注微信