数字图像处理核心技能：从基础到进阶的练习题精讲

作者：渣渣辉2025.09.19 11:23浏览量：5

简介：本文聚焦数字图像处理领域，通过基础操作、进阶算法、实战案例三大模块的练习题解析，系统梳理图像处理核心技能，提供可复用的代码实现与优化思路。

数字图像处理核心技能：从基础到进阶的练习题精讲

一、基础图像操作练习题

1.1 图像读取与显示

题目：使用OpenCV读取本地图片，将其转换为灰度图并显示，同时保存处理后的结果。

import cv2
# 读取彩色图像
img = cv2.imread('input.jpg')
# 转换为灰度图
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 显示结果
cv2.imshow('Gray Image', gray_img)
cv2.waitKey(0)
cv2.destroyAllWindows()
# 保存结果
cv2.imwrite('gray_output.jpg', gray_img)

关键点：

cv2.imread()默认读取BGR格式，需注意颜色空间转换
cv2.waitKey(0)实现窗口持续显示，参数为毫秒级延迟
图像保存时需指定文件扩展名（如.jpg/.png）

1.2 像素级操作

题目：将图像中所有大于200的像素值设置为255，小于50的设置为0，形成二值化效果。

import numpy as np
# 创建阈值掩码
mask = (gray_img > 200) | (gray_img < 50)
# 应用掩码
binary_img = np.where(mask, 255, 0).astype(np.uint8)

优化建议：

使用NumPy的向量化操作替代循环，提升处理速度
考虑使用cv2.threshold()实现更高效的二值化

二、进阶算法应用练习题

2.1 图像滤波与增强

题目：对含噪声图像分别应用均值滤波、高斯滤波和中值滤波，比较去噪效果。

# 添加高斯噪声
mean, sigma = 0, 25
noise = np.random.normal(mean, sigma, gray_img.shape)
noisy_img = gray_img + noise.astype(np.uint8)
# 应用滤波器
mean_filtered = cv2.blur(noisy_img, (5,5))
gaussian_filtered = cv2.GaussianBlur(noisy_img, (5,5), 0)
median_filtered = cv2.medianBlur(noisy_img, 5)

效果对比：

均值滤波：计算简单但易模糊边缘
高斯滤波：根据空间距离加权，保留更多细节
中值滤波：对椒盐噪声效果显著，计算量较大

2.2 边缘检测与轮廓提取

题目：使用Canny算法检测图像边缘，并提取最大轮廓的外接矩形。

# Canny边缘检测
edges = cv2.Canny(gray_img, 100, 200)
# 查找轮廓
contours, _ = cv2.findContours(edges, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
# 提取最大轮廓
if contours:
    max_contour = max(contours, key=cv2.contourArea)
    x,y,w,h = cv2.boundingRect(max_contour)
    cv2.rectangle(img, (x,y), (x+w,y+h), (0,255,0), 2)

参数调优：

Canny阈值选择：建议高阈值是低阈值的2-3倍
轮廓近似方法：cv2.CHAIN_APPROX_SIMPLE可压缩冗余点

三、实战项目案例

3.1 人脸检测系统

题目：实现实时摄像头人脸检测，并在检测到人脸时绘制矩形框。

# 加载预训练模型
face_cascade = cv2.CascadeClassifier(cv2.data.haarcascades + 'haarcascade_frontalface_default.xml')
cap = cv2.VideoCapture(0)
while True:
    ret, frame = cap.read()
    if not ret: break
    gray_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    faces = face_cascade.detectMultiScale(gray_frame, 1.3, 5)
    for (x,y,w,h) in faces:
        cv2.rectangle(frame, (x,y), (x+w,y+h), (255,0,0), 2)
    cv2.imshow('Face Detection', frame)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
cap.release()
cv2.destroyAllWindows()

关键技术：

Haar级联分类器的尺度因子（1.3）和最小邻居数（5）参数
实时处理需优化检测速度，可考虑降低分辨率

3.2 图像拼接应用

题目：将两张有重叠区域的图像拼接成全景图。

# 使用OpenCV的Stitcher类
stitcher = cv2.Stitcher_create()
status, panorama = stitcher.stitch([img1, img2])
if status == cv2.Stitcher_OK:
    cv2.imwrite('panorama.jpg', panorama)
else:
    print("拼接失败，错误代码:", status)

常见问题处理：

特征点不足：调整cv2.SIFT_create()的参数
曝光差异：使用cv2.detail.ExposureCompensator
几何变形：采用cv2.detail.BundleAdjusterRay

四、性能优化技巧

4.1 多线程处理

题目：并行处理100张图像的灰度转换。

from concurrent.futures import ThreadPoolExecutor
def process_image(img_path):
    img = cv2.imread(img_path)
    return cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
with ThreadPoolExecutor(max_workers=4) as executor:
    gray_images = list(executor.map(process_image, image_paths))

适用场景：

I/O密集型操作（如批量读写）
计算密集型但可并行化的任务

4.2 内存管理

题目：处理大尺寸图像时的内存优化策略。

# 分块处理示例
def process_large_image(img_path, block_size=1024):
    img = cv2.imread(img_path)
    h, w = img.shape[:2]
    for y in range(0, h, block_size):
        for x in range(0, w, block_size):
            block = img[y:y+block_size, x:x+block_size]
            # 处理每个图像块
            processed_block = cv2.GaussianBlur(block, (5,5), 0)
            # 将处理后的块写回

优化方向：

使用cv2.UMat实现OpenCL加速
及时释放不再使用的图像对象（del img）
考虑使用内存映射文件处理超大规模图像

五、学习资源推荐

经典教材：
- 《Digital Image Processing》（Rafael C. Gonzalez）
- 《Computer Vision: Algorithms and Applications》（Richard Szeliski）
开源库：
- OpenCV：最全面的计算机视觉库
- scikit-image：基于NumPy的Python图像处理库
- Pillow：Python Imaging Library的友好分支
实践平台：
- Kaggle竞赛：提供真实场景的数据集
- GitHub开源项目：如YOLO、U-Net等经典模型实现

通过系统练习本文提供的案例，开发者可逐步掌握数字图像处理的核心技能。建议从基础操作开始，逐步过渡到算法实现，最终完成完整项目开发。在实际应用中，需特别注意算法选择与性能优化的平衡，根据具体场景调整参数和实现方案。

发表评论

开发者关注产品榜

最热文章

关于作者

被阅读数
被赞数
被收藏数

活动

咨询

开发者热搜

数字图像处理核心技能：从基础到进阶的练习题精讲

数字图像处理核心技能：从基础到进阶的练习题精讲

一、基础图像操作练习题

1.1 图像读取与显示

1.2 像素级操作

二、进阶算法应用练习题

2.1 图像滤波与增强

2.2 边缘检测与轮廓提取

三、实战项目案例

3.1 人脸检测系统

3.2 图像拼接应用

四、性能优化技巧

4.1 多线程处理

4.2 内存管理

五、学习资源推荐

相关文章推荐

文心一言接入指南：通过百度智能云千帆大模型平台API调用

从 MLOps 到 LMOps 的关键技术嬗变

Sugar BI教你怎么做数据可视化 - 拓扑图，让节点连接信息一目了然

更轻量的百度百舸，CCE Stack 智算版发布

打造合规数据闭环，加速自动驾驶技术研发

LMOps 工具链与千帆大模型平台

发表评论

开发者关注产品榜

百度千帆·大模型服务及Agent开发平台

百度千帆·数据智能平台

秒哒-生成式应用开发平台

百度智能云客悦智能客服平台

最热文章

关于作者