手把手0基础Centos下安装与部署PaddleOCR教程

作者：渣渣辉2025.09.19 14:22浏览量：332

简介：本文为0基础开发者提供CentOS系统下PaddleOCR的完整安装部署指南，涵盖环境准备、依赖安装、源码下载、模型下载及测试运行的详细步骤，助力快速实现OCR功能落地。

引言

PaddleOCR是百度开源的一款高性能OCR工具库，支持多种语言的文本检测与识别，广泛应用于文档处理、票据识别等场景。对于刚接触Linux系统或OCR技术的开发者来说，在CentOS环境下完成PaddleOCR的安装与部署可能存在一定难度。本文将以“手把手”的方式，详细介绍如何在CentOS系统中从零开始安装并部署PaddleOCR，确保即使是没有经验的用户也能顺利完成。

一、环境准备

1.1 确认CentOS版本

首先，需要确认你的CentOS系统版本。PaddleOCR对系统环境有一定要求，推荐使用CentOS 7或更高版本。可以通过以下命令查看系统版本：

cat /etc/redhat-release

1.2 更新系统

为了确保系统的稳定性和兼容性，建议先更新系统到最新状态：

sudo yum update -y

1.3 安装必要的开发工具

安装编译和运行PaddleOCR所需的开发工具，如gcc、make、cmake等：

sudo yum install -y gcc make cmake git wget

二、安装Python环境

PaddleOCR主要基于Python开发，因此需要安装Python及其包管理工具pip。

2.1 安装Python 3.7+

CentOS 7默认安装的Python版本可能较低，建议通过源码编译安装Python 3.7或更高版本。这里以Python 3.7为例：

# 下载Python 3.7源码
wget https://www.python.org/ftp/python/3.7.12/Python-3.7.12.tar.xz
# 解压
tar -xf Python-3.7.12.tar.xz
cd Python-3.7.12
# 配置并编译安装
./configure --enable-optimizations
make -j$(nproc)
sudo make altinstall

2.2 验证Python安装

安装完成后，验证Python版本：

python3.7 --version

2.3 安装pip

Python 3.7安装完成后，通常会自带pip。如果没有，可以通过以下命令安装：

curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py
python3.7 get-pip.py

三、安装PaddlePaddle

PaddleOCR依赖于PaddlePaddle深度学习框架，需要先安装PaddlePaddle。

3.1 安装PaddlePaddle GPU版（可选）

如果你的服务器有NVIDIA GPU，并且已经安装了CUDA和cuDNN，可以安装GPU版的PaddlePaddle以获得更好的性能。首先确认CUDA和cuDNN版本，然后根据PaddlePaddle官方文档选择对应的安装命令。例如，安装CUDA 10.1对应的PaddlePaddle GPU版：

python3.7 -m pip install paddlepaddle-gpu==2.2.0.post101 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

3.2 安装PaddlePaddle CPU版

如果没有GPU，或者只需要在CPU环境下运行，可以安装CPU版的PaddlePaddle：

python3.7 -m pip install paddlepaddle==2.2.0 -i https://mirror.baidu.com/pypi/simple

3.3 验证PaddlePaddle安装

安装完成后，验证PaddlePaddle是否安装成功：

python3.7 -c "import paddle; paddle.utils.run_check()"

如果看到“PaddlePaddle is installed successfully!”的提示，说明安装成功。

四、安装PaddleOCR

4.1 克隆PaddleOCR源码

通过git克隆PaddleOCR的官方仓库：

git clone https://github.com/PaddlePaddle/PaddleOCR.git
cd PaddleOCR

4.2 安装依赖库

进入PaddleOCR目录后，安装所需的Python依赖库：

python3.7 -m pip install -r requirements.txt

4.3 下载预训练模型

PaddleOCR提供了多种语言的预训练模型，可以通过以下命令下载：

# 下载中文OCR模型（检测+识别）
sh tools/download_models.sh ch_PP-OCRv3_det_infer ch_PP-OCRv3_rec_infer ch_PP-OCRv3_cls_infer

五、运行PaddleOCR

5.1 简单测试

下载完模型后，可以进行简单的测试，验证PaddleOCR是否能正常运行：

python3.7 tools/infer_rec.py -c configs/rec/PP-OCRv3/rec_chinese_common_v3.0_train.yml -o Global.pretrained_model=./output/ch_PP-OCRv3_rec_train/best_accuracy Global.infer_img=./doc/imgs_words/ch/word_1.jpg

如果看到识别结果，说明PaddleOCR已经可以正常使用。

5.2 自定义使用

PaddleOCR支持通过配置文件自定义模型、数据集等参数。例如，修改configs/rec/PP-OCRv3/rec_chinese_common_v3.0_train.yml文件中的Global.pretrained_model路径为你下载的模型路径，Global.infer_img为你想要识别的图片路径。

六、常见问题与解决方案

6.1 依赖冲突

在安装过程中，可能会遇到依赖冲突的问题。建议使用虚拟环境（如venv或conda）来隔离PaddleOCR的依赖：

# 创建虚拟环境
python3.7 -m venv paddle_env
# 激活虚拟环境
source paddle_env/bin/activate
# 在虚拟环境中安装PaddlePaddle和PaddleOCR
pip install paddlepaddle==2.2.0
pip install -r requirements.txt

6.2 CUDA/cuDNN版本不匹配

如果安装GPU版的PaddlePaddle时遇到CUDA/cuDNN版本不匹配的问题，需要确保安装的PaddlePaddle版本与CUDA/cuDNN版本兼容。可以参考PaddlePaddle官方文档中的版本对应表。

6.3 内存不足

在运行大型模型或处理大量图片时，可能会遇到内存不足的问题。可以通过减小batch size、使用更小的模型或增加服务器内存来解决。

七、总结

本文详细介绍了在CentOS系统下从零开始安装并部署PaddleOCR的完整过程，包括环境准备、Python环境安装、PaddlePaddle安装、PaddleOCR安装与运行等步骤。通过本文的指导，即使是没有经验的开发者也能顺利完成PaddleOCR的部署，并开始进行OCR相关的开发工作。希望本文能对你有所帮助！

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

活动

咨询