PaddleOCR实战经验：推理模型下载及使用教程

释放双眼，带上耳机，听听看~！

本文分享了使用PaddleOCR进行模型训练、评估、导出的实战经验，包括推理模型的下载和使用教程。针对文本检测和文本识别，提供了详细的操作步骤和代码示例。

在实际理解并掌握PaddleOCR的模型训练，模型评估，模型导出实操之前，我觉得有必要先下载他们已经训练好的推理模型，直接进行模型预测，感受下实际推理模型的使用。

由于PaddleOCR的文档内容比较杂乱，实践期间发现了很多问题，包括PaddleOCR的版本不同，目录结构的差异等。所以我记录下我自己的实战经验。

安装环境

机器环境：Mac M1芯片 ARM64架构

PaddleOCR版本：2.6

Python版本：3.9

PaddleOCR的推理模型库

PaddleOCR已经帮你整理好了对应算法的模型列表，包括推理模型，训练模型，预训练模型以及nb模型，网址如下：

github.com/PaddlePaddl…

本次我们需要下载的就是对应算法：文本检测，文本识别，文本方向分类器对应的推理模型。

PaddleOCR实战经验：推理模型下载及使用教程

在使用PaddleOCR已经发布的推理模型之前，我们需要先将PaddleOCR的代码下载到本地：

git clone https://github.com/PaddlePaddle/PaddleOCR.git
cd PaddleOCR

具体操作可以参考 juejin.cn/post/718961…

文本检测

我们可以直接参考Paddle的官方文档：github.com/PaddlePaddl…

我的操作步骤如下：

首先下载推理模型，我选择了原始超轻量模型，下载到了PaddleOCR/pretrained_models文件夹下

PaddleOCR实战经验：推理模型下载及使用教程

cd PaddleOCR
mkdir pretrained_models
cd pretrained_models

## 下载对应推理模型
wget https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar
tar -xf ch_PP-OCRv3_det_infer.tar && rm -rf ch_PP-OCRv3_det_infer.tar

这样就可以看到解压出来的推理模型文件夹下有对应的模型文件

PaddleOCR实战经验：推理模型下载及使用教程

这样就可以通过命令行的方式执行推理模型了，由于我在MAC上进行CPU运行，需要将—use_gpu参数设置为False

cd PaddleOCR
python3 tools/infer/predict_det.py --det_algorithm="DB" --det_model_dir="./pretrained_models/ch_PP-OCRv3_det_infer" --image_dir="./doc/imgs/" --use_gpu=False

结果运行如下：

PaddleOCR实战经验：推理模型下载及使用教程

文本识别

同样参考的文档如下：github.com/PaddlePaddl…

同样的操作步骤如下：

首先下载推理模型，我选择了原始超轻量模型，下载到了PaddleOCR/pretrained_models文件夹下

PaddleOCR实战经验：推理模型下载及使用教程

cd PaddleOCR
mkdir pretrained_models
cd pretrained_models

## 下载对应推理模型
wget https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar
tar -xf ch_PP-OCRv3_rec_infer.tar && rm -rf ch_PP-OCRv3_rec_infer.tar

这样就可以通过命令行的方式执行推理模型了，由于我在MAC上进行运行，需要将—use_gpu参数设置为False

cd PaddleOCR
python3 tools/infer/predict_rec.py --image_dir="https://b2.7b2.com/Users/shaoshuai.shao/Desktop/WechatIMG189.jpeg" --rec_model_dir="./pretrained_models/ch_PP-OCRv3_rec_infer" --rec_char_dict_path='./ppocr/utils/ppocr_keys_v1.txt' --use_gpu=False

–image_dir 参数设置为需要识别的图片路径

–rec_model_dir 参数设置为刚刚下载的推理模型的文件夹地址

–rec_char_dict_path 这个参数需要设置为推理模型使用的字符字典，这个字典的地址取值有点绕。由于我们当前下载的是已经打包好的推理模型，需要查看下生成推理模型的对应配置，查询看下图

PaddleOCR实战经验：推理模型下载及使用教程

可以看到推演模型生成时候的配置选择的字典目录路径就是 ppocr/utils/ppocr_keys_v1.txt。

执行结果如下

PaddleOCR实战经验：推理模型下载及使用教程

文本方向分类器

同样参考的文档如下：github.com/PaddlePaddl…

同样的操作步骤如下：

首先下载推理模型，我选择了原始分类器模型，下载到了PaddleOCR/pretrained_models文件夹下

PaddleOCR实战经验：推理模型下载及使用教程

cd PaddleOCR
mkdir pretrained_models
cd pretrained_models

## 下载对应推理模型
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar
tar -xf ch_ppocr_mobile_v2.0_cls_infer.tar && rm -rf ch_ppocr_mobile_v2.0_cls_infer.tar

这样就可以通过命令行的方式执行推理模型了，由于我在MAC上进行运行，需要将—use_gpu参数设置为False

cd PaddleOCR
python3 tools/infer/predict_cls.py --image_dir="https://b2.7b2.com/Users/shaoshuai.shao/Desktop/WechatIMG189.jpeg" --cls_model_dir="./pretrained_models/ch_ppocr_mobile_v2.0_cls_infer" --use_gpu=False

注：PaddleOCR内置的文本方向分类器只支持了0和180度的分类。如果想支持更多角度，可以自己修改算法进行支持。

文本检测、方向分类和文字识别串联

cd PaddleOCR
python3 tools/infer/predict_system.py --image_dir="https://b2.7b2.com/Users/shaoshuai.shao/Desktop/WechatIMG190.jpeg" --det_model_dir="./pretrained_models/ch_PP-OCRv3_det_infer" --cls_model_dir="./pretrained_models/ch_ppocr_mobile_v2.0_cls_infer" --rec_model_dir="./pretrained_models/ch_PP-OCRv3_rec_infer" --use_angle_cls=true --use_gpu=False

–image_dir 带扫描的图像地址

–det_model_dir 上面文档中下载文本检测推演模型的地址

–rec_model_dir 上面文档中下载文本识别推演模型的地址

–cls_model_dir 上面文档中下载方向分类推演模型的地址

引用

github.com/PaddlePaddl…

本网站的内容主要来自互联网上的各种资源，仅供参考和信息分享之用，不代表本网站拥有相关版权或知识产权。如您认为内容侵犯您的权益，请联系我们，我们将尽快采取行动，包括删除或更正。

{{userData.name}}已认证

PaddleOCR实战经验：推理模型下载及使用教程

安装环境

PaddleOCR的推理模型库

文本检测

文本识别

文本方向分类器

文本检测、方向分类和文字识别串联

引用

GPT-4: 大规模预训练与多模态学习的人工智能模型

基于OpenCV的简单人脸识别实现指南

GeoSpy.ai

Globe Explorer

即梦Dreamina

Luma Dream Machine

Motionshop

Kling AI | Sora-Like Video Model

归档

{{userData.name}}已认证

安装环境

PaddleOCR的推理模型库

文本检测

文本识别

文本方向分类器

文本检测、方向分类和文字识别串联

引用

GPT-4: 大规模预训练与多模态学习的人工智能模型

基于OpenCV的简单人脸识别实现指南

PaddleOCR：深度学习技术助力文本检测和识别

YOLOv5车牌识别模型训练与评估详解

基于PaddleOCR的多视角集装箱箱号检测与识别

自己动手训练扩散模型，生成想要的美女写真