手把手0基础Centos下安装与部署paddleOcr 教程

作者：谁偷走了我的奶酪2025.09.18 11:24浏览量：3

简介：本文为零基础用户提供CentOS系统下安装与部署PaddleOCR的详细教程，涵盖环境准备、依赖安装、代码下载、模型下载及测试验证全流程，助力快速上手OCR开发。

手把手0基础Centos下安装与部署paddleOcr教程

引言

PaddleOCR是百度开源的一款基于深度学习的OCR（Optical Character Recognition，光学字符识别）工具库，支持多种语言的文本检测与识别。对于需要在CentOS系统上部署OCR服务的开发者来说，掌握PaddleOCR的安装与部署是关键一步。本文将详细介绍如何在CentOS环境下，从零开始安装并部署PaddleOCR，适合没有相关经验的开发者参考。

环境准备

1. 系统要求

操作系统：CentOS 7或更高版本。
Python版本：推荐Python 3.6及以上版本。
CUDA与cuDNN（如需GPU加速）：根据GPU型号安装对应的CUDA和cuDNN版本。

2. 安装依赖

在CentOS上安装必要的依赖包，包括但不限于：

sudo yum install -y epel-release
sudo yum install -y python3 python3-devel python3-pip gcc git wget

如果计划使用GPU加速，还需安装NVIDIA驱动、CUDA和cuDNN。具体安装步骤可参考NVIDIA官方文档。

安装PaddlePaddle

PaddleOCR依赖于PaddlePaddle深度学习框架。根据是否使用GPU，选择相应的安装命令。

CPU版本安装

python3 -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

GPU版本安装

首先确认CUDA和cuDNN已正确安装，然后根据CUDA版本选择合适的PaddlePaddle GPU版本安装命令，例如：

# 假设CUDA版本为10.2
python3 -m pip install paddlepaddle-gpu==2.2.2.post102 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

安装完成后，可通过以下命令验证安装是否成功：

python3 -c "import paddle; paddle.utils.run_check()"

安装PaddleOCR

1. 克隆PaddleOCR仓库

git clone https://github.com/PaddlePaddle/PaddleOCR.git
cd PaddleOCR

2. 安装PaddleOCR依赖

python3 -m pip install -r requirements.txt -i https://mirror.baidu.com/pypi/simple

下载预训练模型

PaddleOCR提供了多种语言的预训练模型，可根据需求下载。例如，下载中文OCR模型：

# 下载中文文本检测模型
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_det_train.tar
tar xvf ch_ppocr_mobile_v2.0_det_train.tar
mv ch_ppocr_mobile_v2.0_det_train inference/det_db
# 下载中文文本识别模型
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_rec_train.tar
tar xvf ch_ppocr_mobile_v2.0_rec_train.tar
mv ch_ppocr_mobile_v2.0_rec_train inference/rec_crnn
# 下载中文方向分类器（可选）
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar
tar xvf ch_ppocr_mobile_v2.0_cls_train.tar
mv ch_ppocr_mobile_v2.0_cls_train inference/cls

配置与运行

1. 配置文件修改

根据实际需求修改configs/目录下的配置文件，例如ppocr/utils/ppocr_keys_v1.txt为识别字典文件，configs/det/det_mv3_db.yml为检测模型配置文件等。

2. 运行OCR

图像文本检测与识别

python3 tools/infer_rec.py -c configs/rec/rec_icdar15_train.yml -o Global.pretrained_model=inference/rec_crnn/best_accuracy Global.infer_img=doc/imgs_words/ch/word_1.jpg

将-o Global.infer_img=后的路径替换为待识别图片的路径。

批量处理图片

若需批量处理图片，可编写脚本遍历图片目录，调用PaddleOCR进行识别。示例脚本（batch_infer.py）：

import os
from paddleocr import PaddleOCR
# 初始化PaddleOCR
ocr = PaddleOCR(use_angle_cls=True, lang="ch")  # 使用中文模型
# 图片目录
img_dir = "path/to/your/images"
# 遍历目录，处理每张图片
for img_name in os.listdir(img_dir):
    if img_name.lower().endswith(('.png', '.jpg', '.jpeg')):
        img_path = os.path.join(img_dir, img_name)
        result = ocr.ocr(img_path, cls=True)
        for line in result:
            print(line)

运行脚本：

python3 batch_infer.py

性能优化与调试

1. 性能优化

使用GPU加速：确保已正确安装CUDA和cuDNN，并在PaddleOCR初始化时指定use_gpu=True。
模型裁剪与量化：PaddleOCR支持模型裁剪和量化，可减小模型体积，提高推理速度。
批量处理：对于大量图片，采用批量处理方式可提高效率。

2. 调试技巧

日志查看：PaddleOCR提供了详细的日志输出，可通过修改配置文件中的日志级别来调整日志详细程度。
可视化工具：利用PaddleOCR的可视化工具，如tools/plot_bbox.py，可直观查看检测结果。
错误排查：遇到错误时，首先检查依赖是否安装完整，配置文件是否正确，再根据错误信息逐步排查。

结论

通过本文的详细步骤，即使是没有相关经验的开发者也能在CentOS系统上成功安装并部署PaddleOCR。PaddleOCR的强大功能使其在多种OCR应用场景中表现出色，无论是文本检测、识别还是方向分类，都能提供高效准确的解决方案。希望本文能为你的OCR开发之路提供有力支持。

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

活动

咨询

开发者热搜

手把手0基础Centos下安装与部署paddleOcr 教程

手把手0基础Centos下安装与部署paddleOcr教程

引言

环境准备

1. 系统要求

2. 安装依赖

安装PaddlePaddle

CPU版本安装

GPU版本安装

安装PaddleOCR

1. 克隆PaddleOCR仓库

2. 安装PaddleOCR依赖

下载预训练模型

配置与运行

1. 配置文件修改

2. 运行OCR

图像文本检测与识别

批量处理图片

性能优化与调试

1. 性能优化

2. 调试技巧

结论

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

百度千帆·大模型服务及Agent开发平台

百度千帆·数据智能平台

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者