logo

手把手0基础Centos下安装与部署PaddleOCR教程

作者:渣渣辉2025.09.19 14:22浏览量:0

简介:本文为0基础开发者提供CentOS系统下PaddleOCR的完整安装部署指南,涵盖环境准备、依赖安装、源码下载、模型下载及测试运行的详细步骤,助力快速实现OCR功能落地。

引言

PaddleOCR是百度开源的一款高性能OCR工具库,支持多种语言的文本检测与识别,广泛应用于文档处理、票据识别等场景。对于刚接触Linux系统或OCR技术的开发者来说,在CentOS环境下完成PaddleOCR的安装与部署可能存在一定难度。本文将以“手把手”的方式,详细介绍如何在CentOS系统中从零开始安装并部署PaddleOCR,确保即使是没有经验的用户也能顺利完成。

一、环境准备

1.1 确认CentOS版本

首先,需要确认你的CentOS系统版本。PaddleOCR对系统环境有一定要求,推荐使用CentOS 7或更高版本。可以通过以下命令查看系统版本:

  1. cat /etc/redhat-release

1.2 更新系统

为了确保系统的稳定性和兼容性,建议先更新系统到最新状态:

  1. sudo yum update -y

1.3 安装必要的开发工具

安装编译和运行PaddleOCR所需的开发工具,如gcc、make、cmake等:

  1. sudo yum install -y gcc make cmake git wget

二、安装Python环境

PaddleOCR主要基于Python开发,因此需要安装Python及其包管理工具pip。

2.1 安装Python 3.7+

CentOS 7默认安装的Python版本可能较低,建议通过源码编译安装Python 3.7或更高版本。这里以Python 3.7为例:

  1. # 下载Python 3.7源码
  2. wget https://www.python.org/ftp/python/3.7.12/Python-3.7.12.tar.xz
  3. # 解压
  4. tar -xf Python-3.7.12.tar.xz
  5. cd Python-3.7.12
  6. # 配置并编译安装
  7. ./configure --enable-optimizations
  8. make -j$(nproc)
  9. sudo make altinstall

2.2 验证Python安装

安装完成后,验证Python版本:

  1. python3.7 --version

2.3 安装pip

Python 3.7安装完成后,通常会自带pip。如果没有,可以通过以下命令安装:

  1. curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py
  2. python3.7 get-pip.py

三、安装PaddlePaddle

PaddleOCR依赖于PaddlePaddle深度学习框架,需要先安装PaddlePaddle。

3.1 安装PaddlePaddle GPU版(可选)

如果你的服务器有NVIDIA GPU,并且已经安装了CUDA和cuDNN,可以安装GPU版的PaddlePaddle以获得更好的性能。首先确认CUDA和cuDNN版本,然后根据PaddlePaddle官方文档选择对应的安装命令。例如,安装CUDA 10.1对应的PaddlePaddle GPU版:

  1. python3.7 -m pip install paddlepaddle-gpu==2.2.0.post101 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html

3.2 安装PaddlePaddle CPU版

如果没有GPU,或者只需要在CPU环境下运行,可以安装CPU版的PaddlePaddle:

  1. python3.7 -m pip install paddlepaddle==2.2.0 -i https://mirror.baidu.com/pypi/simple

3.3 验证PaddlePaddle安装

安装完成后,验证PaddlePaddle是否安装成功:

  1. python3.7 -c "import paddle; paddle.utils.run_check()"

如果看到“PaddlePaddle is installed successfully!”的提示,说明安装成功。

四、安装PaddleOCR

4.1 克隆PaddleOCR源码

通过git克隆PaddleOCR的官方仓库:

  1. git clone https://github.com/PaddlePaddle/PaddleOCR.git
  2. cd PaddleOCR

4.2 安装依赖库

进入PaddleOCR目录后,安装所需的Python依赖库:

  1. python3.7 -m pip install -r requirements.txt

4.3 下载预训练模型

PaddleOCR提供了多种语言的预训练模型,可以通过以下命令下载:

  1. # 下载中文OCR模型(检测+识别)
  2. sh tools/download_models.sh ch_PP-OCRv3_det_infer ch_PP-OCRv3_rec_infer ch_PP-OCRv3_cls_infer

五、运行PaddleOCR

5.1 简单测试

下载完模型后,可以进行简单的测试,验证PaddleOCR是否能正常运行:

  1. python3.7 tools/infer_rec.py -c configs/rec/PP-OCRv3/rec_chinese_common_v3.0_train.yml -o Global.pretrained_model=./output/ch_PP-OCRv3_rec_train/best_accuracy Global.infer_img=./doc/imgs_words/ch/word_1.jpg

如果看到识别结果,说明PaddleOCR已经可以正常使用。

5.2 自定义使用

PaddleOCR支持通过配置文件自定义模型、数据集等参数。例如,修改configs/rec/PP-OCRv3/rec_chinese_common_v3.0_train.yml文件中的Global.pretrained_model路径为你下载的模型路径,Global.infer_img为你想要识别的图片路径。

六、常见问题与解决方案

6.1 依赖冲突

在安装过程中,可能会遇到依赖冲突的问题。建议使用虚拟环境(如venv或conda)来隔离PaddleOCR的依赖:

  1. # 创建虚拟环境
  2. python3.7 -m venv paddle_env
  3. # 激活虚拟环境
  4. source paddle_env/bin/activate
  5. # 在虚拟环境中安装PaddlePaddle和PaddleOCR
  6. pip install paddlepaddle==2.2.0
  7. pip install -r requirements.txt

6.2 CUDA/cuDNN版本不匹配

如果安装GPU版的PaddlePaddle时遇到CUDA/cuDNN版本不匹配的问题,需要确保安装的PaddlePaddle版本与CUDA/cuDNN版本兼容。可以参考PaddlePaddle官方文档中的版本对应表。

6.3 内存不足

在运行大型模型或处理大量图片时,可能会遇到内存不足的问题。可以通过减小batch size、使用更小的模型或增加服务器内存来解决。

七、总结

本文详细介绍了在CentOS系统下从零开始安装并部署PaddleOCR的完整过程,包括环境准备、Python环境安装、PaddlePaddle安装、PaddleOCR安装与运行等步骤。通过本文的指导,即使是没有经验的开发者也能顺利完成PaddleOCR的部署,并开始进行OCR相关的开发工作。希望本文能对你有所帮助!

相关文章推荐

发表评论