第 8 章 图像压缩与水印 (Image Compression and Watermarking)

      +

      核心结论

      • 压缩基础(§8.1):冗余(编码 / 像素间 / 心理视觉);信息论(熵 / 码长)。

      • 无损压缩(§8.2):Huffman / 算术 / LZW / RLE;典型压缩比 2-3×。

      • 有损压缩(§8.3):变换编码(FFT / DCT / DWT)+ 量化 + 熵编码;典型压缩比 10-50×。

      • JPEG 标准(§8.4):8×8 DCT + 量化表 + Huffman;最广泛使用。

      • JPEG 2000 标准(§8.5):DWT + EBCOT;更高压缩比 / 无块效应。

      • 视频压缩(§8.6):H.264 / H.265 / AV1;帧内 + 帧间预测。

      • 数字水印(§8.7):嵌入信息到图像;版权保护 / 认证。

      本章主旨

      本章是 DIP "压缩"——把图像从大文件压缩为小文件。理解后才能选对压缩算法 / 标准 / 工具。

      一、核心概念

      本章围绕 7 个核心概念展开:基础 → 无损 → 有损 → JPEG → JPEG2000 → 视频 → 水印。

      概念 定义 + 重要性 实现提示

      压缩基础

      冗余 + 信息论(熵 / 码长)。

      §8.1;理解压缩本质。

      无损压缩

      Huffman / 算术 / LZW / RLE。

      §8.2;可逆;压缩比 2-3×。

      有损压缩

      变换 + 量化 + 熵编码。

      §8.3;不可逆;压缩比 10-50×。

      JPEG

      8×8 DCT + 量化表 + Huffman。

      §8.4;最广泛静态图像标准。

      JPEG 2000

      DWT + EBCOT;更高压缩比。

      §8.5;无块效应;医学 / 数字影院。

      视频压缩

      H.264 / H.265 / AV1;帧内 + 帧间。

      §8.6;网络视频标准。

      数字水印

      嵌入信息;版权 / 认证。

      §8.7;图像安全。

      二、详细笔记

      2.1 压缩基础 (Fundamentals)

      What:冗余 + 信息论。

      Why:理解压缩的本质与极限。

      How

      • 冗余类型:编码冗余 / 像素间冗余 / 心理视觉冗余。

      • 信息论:熵 H = -Σ p_i log p_i;平均码长 L = Σ l_i p_i;压缩极限 H ≤ L

      • 失真度量:MSE / PSNR / SSIM。

      When:所有压缩算法设计。

      Example:PNG 无损压缩比 2-3×;JPEG 有损 10-50×;H.265 视频 100-1000×。

      2.2 无损压缩 (Lossless Compression)

      What:Huffman / 算术 / LZW / RLE。

      Why:可逆;医学 / 文档 / 源代码。

      How

      • Huffman:变长码;高频用短码。

      • 算术编码:将整个消息编码为单个分数;压缩效率高。

      • LZW(Lempel-Ziv-Welch):字典编码;PNG / GIF 用。

      • RLE(Run-Length Encoding):连续相同值用 (值, 长度) 表示。

      When:可逆压缩;文本 / 二进制。

      Examplegzip(LZW + Huffman);bzip2(BWT + Huffman);png

      2.3 有损压缩 (Lossy Compression)

      What:变换编码 + 量化 + 熵编码。

      Why:高压缩比;图像 / 视频。

      How

      • 变换:FFT / DCT / DWT(去相关)。

      • 量化:标量 / 矢量(丢弃不重要的系数)。

      • 熵编码:Huffman / 算术。

      When:图像 / 视频;带宽受限场景。

      Example:JPEG / JPEG 2000 / WebP / HEIC。

      2.4 JPEG 标准 (JPEG Standard)

      What:8×8 DCT + 量化表 + Huffman。

      Why:1992 至今最广泛使用;浏览器 / 相机默认。

      How

      • 8×8 DCT:图像分块(8×8)→ DCT。

      • 量化表:量化 DCT 系数(亮度 / 色度不同)。

      • Z 字扫描:低频到高频排序。

      • Huffman 编码:DC / AC 系数分别。

      • YUV 4:2:0:色度下采样。

      When:图像存储 / 传输 / 网页。

      Example*:cv2.imwrite('img.jpg', img, [cv2.IMWRITE_JPEG_QUALITY, 95])

      2.5 JPEG 2000 标准 (JPEG 2000 Standard)

      What:DWT + EBCOT。

      Why:更高压缩比 / 无块效应;医学 / 数字影院。

      How

      • DWT:5/3 损失less / 9/7 有损。

      • EBCOT(Embedded Block Coding with Optimized Truncation):分层编码。

      • ROI(Region of Interest):感兴趣区域优先编码。

      When:医学影像(DICOM);数字影院(DCI);卫星图像。

      Example*:glymur / openjpeg 库;.jp2 格式。

      2.6 视频压缩 (Video Compression)

      What:H.264 / H.265 / AV1。

      Why:网络视频流(YouTube / Netflix / 抖音)。

      How

      • 帧内预测(I 帧):单帧压缩,类似 JPEG。

      • 帧间预测(P / B 帧):运动补偿 + 残差编码。

      • 变换 + 量化 + 熵编码:类似 JPEG。

      • H.264 / AVC(2003):最广泛;50% 压缩比 vs MPEG-2。

      • H.265 / HEVC(2013):再 50% 压缩;4K / 8K 视频。

      • AV1(2018):开放免授权;Netflix / YouTube 推广。

      When:网络视频流;视频会议;视频监控。

      Example*:ffmpeg 工具;libx264 / libx265 / libaom-av1 编码器。

      2.7 数字水印 (Digital Watermarking)

      What:嵌入信息到图像。

      Why:版权保护 / 内容认证 / 防伪。

      How

      • 空间域:LSB(最低有效位)替换。

      • 频率域:DCT / DWT 系数调整。

      • 可见 / 不可见

      • 鲁棒性:抗压缩 / 抗裁剪。

      When:版权保护;内容认证;防伪。

      Exampleopencv + 自定义算法;imagemagick 水印工具。

      三、关键图表

      视觉图表

      图 8-1
      Figure 1. 图 8-1:JPEG 编码流程
      图 8-2
      Figure 2. 图 8-2:JPEG 2000 vs JPEG 对比

      非可视化条目

      非可视化条目(表 / 算法)
      编号 内容摘要

      表 8.1

      压缩标准对比(JPEG / JPEG 2000 / WebP / HEIC)。

      表 8.2

      视频编码标准对比(H.264 / H.265 / AV1)。

      式 8-1 至 8-30

      Huffman / 算术 / DCT / DWT 公式。

      核心公式对照表

      核心公式对照表
      概念 公式

      信息熵

      \(H = -\sum_i p_i \log_2 p_i\)

      压缩比

      \(\text{CR} = n_1 / n_2\)

      PSNR

      \(\text{PSNR} = 10 \log_{10} \frac{L^2}{\text{MSE}}\)

      率失真

      \(R(D) = \min I(X; \hat{X}) \text{ s.t. } E[d(X, \hat{X})\) \leq D]

      四、思维导图

      mindmap
        root((第 8 章 图像压缩与水印))
          基础
            冗余
            信息论
          无损
            Huffman
            算术
            LZWRLE
          有损
            变换量化
            熵编码
          JPEG
            8x8 DCT
            量化
          JPEG2000
            DWT
            EBCOT
          视频
            H264
            H265
            AV1
          水印
            空域频域
            版权

      五、重点与易错点

      • 压缩极限是熵:理论下界;无损压缩达不到更低。

      • JPEG 是最广泛静态图像标准:1992 至今;几乎所有浏览器 / 相机支持。

      • JPEG 2000 优于 JPEG:DWT vs DCT;无块效应;更高压缩;医学影像首选。

      • HEVC (H.265) 优于 AVC (H.264):再 50% 压缩;4K / 8K 视频必备。

      • AV1 是开放免授权:Netflix / YouTube 推广;避免 H.265 专利。

      • 水印鲁棒性 vs 不可见性:两者 trade-off;DCT / DWT 频域水印更鲁棒。

      • 跨章衔接:第 4 章 DFT / 第 7 章 DWT 是压缩核心;第 5 章复原与压缩互补;第 11 章特征提取用水印技术。