第 1 章 引言 (Introduction)

      +

      核心结论

      • 数字图像处理 (DIP) 定义:用计算机算法处理数字图像;从图像到信息或从图像到图像。

      • 应用领域:医学 / 遥感 / 安防 / 工业检测 / 文档 / 娱乐 / 通信。

      • 历史:1920s 报纸传输 → 1960s 太空竞赛 → 1980s CT / MRI → 2010+ 深度学习。

      • 关键阶段:图像获取 → 增强 → 复原 → 分割 → 特征提取 → 识别。

      • 本书结构:基础(第 1-3 章)→ 频率域与复原(第 4-5 章)→ 颜色 / 变换 / 压缩(第 6-8 章)→ 形态学 / 分割 / 特征 / 分类(第 9-12 章)。

      本章主旨

      本章是全书导论——给出 DIP 的定义、应用、历史、关键阶段。理解后才能选对研究方向 / 算法 / 工具。

      一、核心概念

      本章围绕 5 个核心概念展开:定义 → 应用 → 历史 → 关键阶段 → 本书结构。

      概念 定义 + 重要性 实现提示

      DIP 定义

      用计算机处理数字图像;从图像到信息或图像到图像。

      §1.1;与计算机视觉的区别。

      应用领域

      医学 / 遥感 / 安防 / 工业 / 文档 / 娱乐 / 通信。

      §1.2;DIP 渗透所有行业。

      历史

      1920s 报纸 → 1960s 太空 → 1980s CT → 2010+ 深度学习。

      §1.3;理解历史脉络。

      关键阶段

      获取 → 增强 → 复原 → 分割 → 特征 → 识别。

      §1.4;DIP pipeline 通用。

      本书结构

      基础 → 频率域 → 颜色 / 变换 → 形态 / 分割 / 特征 / 分类。

      §1.5;按"图像处理流程"组织。

      二、详细笔记

      2.1 DIP 定义 (What is DIP?)

      What:用计算机算法处理数字图像。

      Why:定义 DIP 与 CV 的边界;理解后才能选对工具。

      How

      DIP 三大类别:

      • 低级:图像到图像(去噪 / 增强 / 锐化)。

      • 中级:图像到特征(分割 / 边缘 / 纹理)。

      • 高级:图像到语义(识别 / 理解)。

      DIP vs CV
      • DIP:传统图像处理;偏底层 + 中层;偏数学公式。

      • CV:计算机视觉;偏高层识别;近年深度学习主导。

      • 边界模糊:DIP 第 12 章讲模式分类,已是 CV 范畴。

      When:选工具(OpenCV / scikit-image / Pillow);选研究方向。

      Example*:OpenCV 是 DIP 工具;torchvision 是 CV 工具;现代两者界限模糊。

      2.2 应用领域 (Applications)

      What:DIP 渗透到几乎所有行业。

      Why:理解 DIP 的市场价值;选择行业方向。

      How

      主要应用领域(§1.2):

      • 医学:CT / MRI / X 光 / 病理图像分析。

      • 遥感:卫星图像 / 土地利用 / 气象。

      • 安防:人脸识别 / 视频监控 / 异常检测。

      • 工业:质检 / 缺陷检测 / 机器人视觉。

      • 文档:OCR / 表格识别 / 历史文献数字化。

      • 娱乐:电影特效 / 游戏 / VR / AR。

      • 通信:视频编解码(H.264 / H.265 / AV1)。

      DIP 应用规模
      • 全球 DIP 市场 2024 > 150 亿美元(含硬件 + 软件 + 服务)。

      • 增长最快:医疗影像 / 自动驾驶 / 安防。

      • DIP 工程师需求持续增长。

      When:选行业;评估项目价值;求职方向。

      Example*:GE Healthcare 医疗影像;DigitalGlobe 遥感;Hikvision 安防。

      2.3 历史 (History)

      What:DIP 从 1920s 到 2024 的演进。

      Why:理解历史才能选对当前 / 未来方向。

      How

      DIP 关键里程碑(§1.3):

      • 1920s:报纸图像跨大西洋传输(巴特兰电缆)。

      • 1960s:太空竞赛推动 DIP(NASA 月球图像增强)。

      • 1970s:CT 发明(Hounsfield / Cormack 1979 诺贝尔奖)。

      • 1980s:JPEG 标准(1992);DIP 商业化。

      • 1990s:互联网图像;小波理论。

      • 2000s:数码相机普及;DIP 库成熟(OpenCV 2000)。

      • 2010s:深度学习(AlexNet 2012 ImageNet)。

      • 2020s:Transformer / Diffusion / 基础模型。

      DIP 的"工程时代"
      • 1980s-2000s:经典算法时代(Sobel / Canny / SIFT / HOG)。

      • 2010s:深度学习时代(CNN / ResNet / GAN)。

      • 2020s:基础模型时代(ViT / SAM / CLIP)。 每一时代都需重新学习新方法。

      When:评估技术趋势;选学习方向。

      Example*:OpenCV 1.0 (2000) → 4.x (2022) → 5.x (2024)。

      2.4 关键阶段 (Key Stages)

      What:DIP pipeline 的通用 6 个阶段。

      Why:理解 pipeline 才能设计完整 DIP 系统。

      How

      DIP 关键阶段(§1.4):

      1. 图像获取(Image acquisition):传感器 + 镜头。

      2. 图像增强(Enhancement):去噪 / 锐化 / 对比度。

      3. 图像复原(Restoration):去模糊 / 去噪 / 修复。

      4. 彩色图像处理(Color):色彩空间 / 转换。

      5. 小波 / 多分辨率(Wavelets):多尺度分析。

      6. 压缩(Compression):JPEG / JPEG 2000。

      7. 形态学(Morphology):膨胀 / 腐蚀 / 开闭。

      8. 分割(Segmentation):阈值 / 区域 / 边缘。

      9. 特征提取(Features):SIFT / HOG / CNN。

      10. 识别(Pattern classification):SVM / CNN。

      DIP Pipeline 的应用
      • 医学影像:CT → 增强 → 分割 → 病灶识别。

      • 自动驾驶:相机 → ISP → 检测 / 跟踪 → 决策。

      • 文档 OCR:扫描 → 增强 → 分割 → 字符识别。

      When:设计 DIP 系统;理解完整流程;选对算法。

      Example*:ImageJ 是经典 DIP pipeline 工具;OpenCV 是现代通用库。

      2.5 本书结构 (Book Overview)

      What:本书按 DIP pipeline 组织。

      Why:理解结构才能选读章节 / 设计课程。

      How

      本书结构:

      • 第 1-3 章:基础(引言 / 数字图像基础 / 灰度变换与空间滤波)。

      • 第 4-5 章:频率域 / 复原。

      • 第 6-8 章:颜色 / 小波 / 压缩。

      • 第 9 章:形态学。

      • 第 10 章:分割。

      • 第 11 章:特征提取。

      • 第 12 章:模式分类(与 CV 重叠)。

      本书与传统 CV 教材的区别
      • 本书偏 DIP:传统图像处理(数学公式 + 算法)。

      • CV2 教材偏识别:深度学习 + 任务驱动。

      • 两书互为补充:DIP 偏底层 + 算法,CV2 偏高层 + 应用。

      When:选课程;选研究 / 工程方向;找工作。

      Example*:Gonzalez & Woods DIP 4e 是 DIP 经典教材;Szeliski CV2 是 CV 经典教材。

      三、关键图表

      视觉图表

      图 1-1
      Figure 1. 图 1-1:DIP 关键阶段
      图 1-2
      Figure 2. 图 1-2:DIP 应用领域

      非可视化条目

      非可视化条目(表 / 算法)
      编号 内容摘要

      表 1.1

      DIP 应用领域与代表案例。

      表 1.2

      DIP 历史里程碑(1920s-2020s)。

      核心公式对照表

      核心公式对照表
      概念 公式

      DIP pipeline

      \(\text{获取} \to \text{增强} \to \text{复原} \to \text{分割} \to \text{特征} \to \text{识别}\)

      四、思维导图

      mindmap
        root((第 1 章 引言))
          定义
            图像处理
            三大类别
            DIPvsCV
          应用
            医学
            遥感
            安防
          历史
            1920报纸
            1960太空
            1980CT
            2010深度
          关键阶段
            获取增强
            复原分割
            特征识别
          本书结构
            基础3章
            频率复原
            颜色压缩
            形态分割

      五、重点与易错点

      • DIP vs CV 边界模糊:本书偏传统 DIP;CV2 偏深度学习识别。

      • DIP 应用已渗透所有行业:医学 / 安防 / 工业 / 娱乐 / 通信。

      • 历史脉络决定学习重点:1980s-2000s 经典算法仍是工具;2010+ 深度学习主导新应用。

      • pipeline 是 DIP 系统设计核心:6 阶段通用;按场景取舍。

      • 跨章衔接:第 2 章图像基础;第 3 章灰度变换;第 4 章频率域;第 5 章复原;第 6-8 章颜色 / 变换 / 压缩;第 9-12 章形态 / 分割 / 特征 / 分类。