手把手0基础Centos下安装与部署paddleOcr 教程
2025.09.18 11:24浏览量:0简介:本文为零基础用户提供CentOS系统下安装与部署PaddleOCR的详细教程,涵盖环境准备、依赖安装、代码下载、模型下载及测试验证全流程,助力快速上手OCR开发。
手把手0基础Centos下安装与部署paddleOcr教程
引言
PaddleOCR是百度开源的一款基于深度学习的OCR(Optical Character Recognition,光学字符识别)工具库,支持多种语言的文本检测与识别。对于需要在CentOS系统上部署OCR服务的开发者来说,掌握PaddleOCR的安装与部署是关键一步。本文将详细介绍如何在CentOS环境下,从零开始安装并部署PaddleOCR,适合没有相关经验的开发者参考。
环境准备
1. 系统要求
- 操作系统:CentOS 7或更高版本。
- Python版本:推荐Python 3.6及以上版本。
- CUDA与cuDNN(如需GPU加速):根据GPU型号安装对应的CUDA和cuDNN版本。
2. 安装依赖
在CentOS上安装必要的依赖包,包括但不限于:
sudo yum install -y epel-release
sudo yum install -y python3 python3-devel python3-pip gcc git wget
如果计划使用GPU加速,还需安装NVIDIA驱动、CUDA和cuDNN。具体安装步骤可参考NVIDIA官方文档。
安装PaddlePaddle
PaddleOCR依赖于PaddlePaddle深度学习框架。根据是否使用GPU,选择相应的安装命令。
CPU版本安装
python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple
GPU版本安装
首先确认CUDA和cuDNN已正确安装,然后根据CUDA版本选择合适的PaddlePaddle GPU版本安装命令,例如:
# 假设CUDA版本为10.2
python3 -m pip install paddlepaddle-gpu==2.2.2.post102 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html
安装完成后,可通过以下命令验证安装是否成功:
python3 -c "import paddle; paddle.utils.run_check()"
安装PaddleOCR
1. 克隆PaddleOCR仓库
git clone https://github.com/PaddlePaddle/PaddleOCR.git
cd PaddleOCR
2. 安装PaddleOCR依赖
python3 -m pip install -r requirements.txt -i https://mirror.baidu.com/pypi/simple
下载预训练模型
PaddleOCR提供了多种语言的预训练模型,可根据需求下载。例如,下载中文OCR模型:
# 下载中文文本检测模型
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_det_train.tar
tar xvf ch_ppocr_mobile_v2.0_det_train.tar
mv ch_ppocr_mobile_v2.0_det_train inference/det_db
# 下载中文文本识别模型
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_rec_train.tar
tar xvf ch_ppocr_mobile_v2.0_rec_train.tar
mv ch_ppocr_mobile_v2.0_rec_train inference/rec_crnn
# 下载中文方向分类器(可选)
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar
tar xvf ch_ppocr_mobile_v2.0_cls_train.tar
mv ch_ppocr_mobile_v2.0_cls_train inference/cls
配置与运行
1. 配置文件修改
根据实际需求修改configs/
目录下的配置文件,例如ppocr/utils/ppocr_keys_v1.txt
为识别字典文件,configs/det/det_mv3_db.yml
为检测模型配置文件等。
2. 运行OCR
图像文本检测与识别
python3 tools/infer_rec.py -c configs/rec/rec_icdar15_train.yml -o Global.pretrained_model=inference/rec_crnn/best_accuracy Global.infer_img=doc/imgs_words/ch/word_1.jpg
将-o Global.infer_img=
后的路径替换为待识别图片的路径。
批量处理图片
若需批量处理图片,可编写脚本遍历图片目录,调用PaddleOCR进行识别。示例脚本(batch_infer.py
):
import os
from paddleocr import PaddleOCR
# 初始化PaddleOCR
ocr = PaddleOCR(use_angle_cls=True, lang="ch") # 使用中文模型
# 图片目录
img_dir = "path/to/your/images"
# 遍历目录,处理每张图片
for img_name in os.listdir(img_dir):
if img_name.lower().endswith(('.png', '.jpg', '.jpeg')):
img_path = os.path.join(img_dir, img_name)
result = ocr.ocr(img_path, cls=True)
for line in result:
print(line)
运行脚本:
python3 batch_infer.py
性能优化与调试
1. 性能优化
- 使用GPU加速:确保已正确安装CUDA和cuDNN,并在PaddleOCR初始化时指定
use_gpu=True
。 - 模型裁剪与量化:PaddleOCR支持模型裁剪和量化,可减小模型体积,提高推理速度。
- 批量处理:对于大量图片,采用批量处理方式可提高效率。
2. 调试技巧
- 日志查看:PaddleOCR提供了详细的日志输出,可通过修改配置文件中的日志级别来调整日志详细程度。
- 可视化工具:利用PaddleOCR的可视化工具,如
tools/plot_bbox.py
,可直观查看检测结果。 - 错误排查:遇到错误时,首先检查依赖是否安装完整,配置文件是否正确,再根据错误信息逐步排查。
结论
通过本文的详细步骤,即使是没有相关经验的开发者也能在CentOS系统上成功安装并部署PaddleOCR。PaddleOCR的强大功能使其在多种OCR应用场景中表现出色,无论是文本检测、识别还是方向分类,都能提供高效准确的解决方案。希望本文能为你的OCR开发之路提供有力支持。
发表评论
登录后可评论,请前往 登录 或 注册