第 1 章 引言 (Introduction)
核心结论
-
数字图像处理 (DIP) 定义:用计算机算法处理数字图像;从图像到信息或从图像到图像。
-
应用领域:医学 / 遥感 / 安防 / 工业检测 / 文档 / 娱乐 / 通信。
-
历史:1920s 报纸传输 → 1960s 太空竞赛 → 1980s CT / MRI → 2010+ 深度学习。
-
关键阶段:图像获取 → 增强 → 复原 → 分割 → 特征提取 → 识别。
-
本书结构:基础(第 1-3 章)→ 频率域与复原(第 4-5 章)→ 颜色 / 变换 / 压缩(第 6-8 章)→ 形态学 / 分割 / 特征 / 分类(第 9-12 章)。
|
本章主旨
本章是全书导论——给出 DIP 的定义、应用、历史、关键阶段。理解后才能选对研究方向 / 算法 / 工具。 |
一、核心概念
本章围绕 5 个核心概念展开:定义 → 应用 → 历史 → 关键阶段 → 本书结构。
| 概念 | 定义 + 重要性 | 实现提示 |
|---|---|---|
DIP 定义 |
用计算机处理数字图像;从图像到信息或图像到图像。 |
§1.1;与计算机视觉的区别。 |
应用领域 |
医学 / 遥感 / 安防 / 工业 / 文档 / 娱乐 / 通信。 |
§1.2;DIP 渗透所有行业。 |
历史 |
1920s 报纸 → 1960s 太空 → 1980s CT → 2010+ 深度学习。 |
§1.3;理解历史脉络。 |
关键阶段 |
获取 → 增强 → 复原 → 分割 → 特征 → 识别。 |
§1.4;DIP pipeline 通用。 |
本书结构 |
基础 → 频率域 → 颜色 / 变换 → 形态 / 分割 / 特征 / 分类。 |
§1.5;按"图像处理流程"组织。 |
二、详细笔记
2.1 DIP 定义 (What is DIP?)
What:用计算机算法处理数字图像。
Why:定义 DIP 与 CV 的边界;理解后才能选对工具。
How:
DIP 三大类别:
-
低级:图像到图像(去噪 / 增强 / 锐化)。
-
中级:图像到特征(分割 / 边缘 / 纹理)。
-
高级:图像到语义(识别 / 理解)。
|
DIP vs CV
|
When:选工具(OpenCV / scikit-image / Pillow);选研究方向。
Example*:OpenCV 是 DIP 工具;torchvision 是 CV 工具;现代两者界限模糊。
2.2 应用领域 (Applications)
What:DIP 渗透到几乎所有行业。
Why:理解 DIP 的市场价值;选择行业方向。
How:
主要应用领域(§1.2):
-
医学:CT / MRI / X 光 / 病理图像分析。
-
遥感:卫星图像 / 土地利用 / 气象。
-
安防:人脸识别 / 视频监控 / 异常检测。
-
工业:质检 / 缺陷检测 / 机器人视觉。
-
文档:OCR / 表格识别 / 历史文献数字化。
-
娱乐:电影特效 / 游戏 / VR / AR。
-
通信:视频编解码(H.264 / H.265 / AV1)。
|
DIP 应用规模
|
When:选行业;评估项目价值;求职方向。
Example*:GE Healthcare 医疗影像;DigitalGlobe 遥感;Hikvision 安防。
2.3 历史 (History)
What:DIP 从 1920s 到 2024 的演进。
Why:理解历史才能选对当前 / 未来方向。
How:
DIP 关键里程碑(§1.3):
-
1920s:报纸图像跨大西洋传输(巴特兰电缆)。
-
1960s:太空竞赛推动 DIP(NASA 月球图像增强)。
-
1970s:CT 发明(Hounsfield / Cormack 1979 诺贝尔奖)。
-
1980s:JPEG 标准(1992);DIP 商业化。
-
1990s:互联网图像;小波理论。
-
2000s:数码相机普及;DIP 库成熟(OpenCV 2000)。
-
2010s:深度学习(AlexNet 2012 ImageNet)。
-
2020s:Transformer / Diffusion / 基础模型。
|
DIP 的"工程时代"
|
When:评估技术趋势;选学习方向。
Example*:OpenCV 1.0 (2000) → 4.x (2022) → 5.x (2024)。
2.4 关键阶段 (Key Stages)
What:DIP pipeline 的通用 6 个阶段。
Why:理解 pipeline 才能设计完整 DIP 系统。
How:
DIP 关键阶段(§1.4):
-
图像获取(Image acquisition):传感器 + 镜头。
-
图像增强(Enhancement):去噪 / 锐化 / 对比度。
-
图像复原(Restoration):去模糊 / 去噪 / 修复。
-
彩色图像处理(Color):色彩空间 / 转换。
-
小波 / 多分辨率(Wavelets):多尺度分析。
-
压缩(Compression):JPEG / JPEG 2000。
-
形态学(Morphology):膨胀 / 腐蚀 / 开闭。
-
分割(Segmentation):阈值 / 区域 / 边缘。
-
特征提取(Features):SIFT / HOG / CNN。
-
识别(Pattern classification):SVM / CNN。
|
DIP Pipeline 的应用
|
When:设计 DIP 系统;理解完整流程;选对算法。
Example*:ImageJ 是经典 DIP pipeline 工具;OpenCV 是现代通用库。
2.5 本书结构 (Book Overview)
What:本书按 DIP pipeline 组织。
Why:理解结构才能选读章节 / 设计课程。
How:
本书结构:
-
第 1-3 章:基础(引言 / 数字图像基础 / 灰度变换与空间滤波)。
-
第 4-5 章:频率域 / 复原。
-
第 6-8 章:颜色 / 小波 / 压缩。
-
第 9 章:形态学。
-
第 10 章:分割。
-
第 11 章:特征提取。
-
第 12 章:模式分类(与 CV 重叠)。
|
本书与传统 CV 教材的区别
|
When:选课程;选研究 / 工程方向;找工作。
Example*:Gonzalez & Woods DIP 4e 是 DIP 经典教材;Szeliski CV2 是 CV 经典教材。