第 8 章 图像压缩与水印 (Image Compression and Watermarking)
核心结论
-
压缩基础(§8.1):冗余(编码 / 像素间 / 心理视觉);信息论(熵 / 码长)。
-
无损压缩(§8.2):Huffman / 算术 / LZW / RLE;典型压缩比 2-3×。
-
有损压缩(§8.3):变换编码(FFT / DCT / DWT)+ 量化 + 熵编码;典型压缩比 10-50×。
-
JPEG 标准(§8.4):8×8 DCT + 量化表 + Huffman;最广泛使用。
-
JPEG 2000 标准(§8.5):DWT + EBCOT;更高压缩比 / 无块效应。
-
视频压缩(§8.6):H.264 / H.265 / AV1;帧内 + 帧间预测。
-
数字水印(§8.7):嵌入信息到图像;版权保护 / 认证。
|
本章主旨
本章是 DIP "压缩"——把图像从大文件压缩为小文件。理解后才能选对压缩算法 / 标准 / 工具。 |
一、核心概念
本章围绕 7 个核心概念展开:基础 → 无损 → 有损 → JPEG → JPEG2000 → 视频 → 水印。
| 概念 | 定义 + 重要性 | 实现提示 |
|---|---|---|
压缩基础 |
冗余 + 信息论(熵 / 码长)。 |
§8.1;理解压缩本质。 |
无损压缩 |
Huffman / 算术 / LZW / RLE。 |
§8.2;可逆;压缩比 2-3×。 |
有损压缩 |
变换 + 量化 + 熵编码。 |
§8.3;不可逆;压缩比 10-50×。 |
JPEG |
8×8 DCT + 量化表 + Huffman。 |
§8.4;最广泛静态图像标准。 |
JPEG 2000 |
DWT + EBCOT;更高压缩比。 |
§8.5;无块效应;医学 / 数字影院。 |
视频压缩 |
H.264 / H.265 / AV1;帧内 + 帧间。 |
§8.6;网络视频标准。 |
数字水印 |
嵌入信息;版权 / 认证。 |
§8.7;图像安全。 |
二、详细笔记
2.1 压缩基础 (Fundamentals)
What:冗余 + 信息论。
Why:理解压缩的本质与极限。
How:
-
冗余类型:编码冗余 / 像素间冗余 / 心理视觉冗余。
-
信息论:熵
H = -Σ p_i log p_i;平均码长L = Σ l_i p_i;压缩极限H ≤ L。 -
失真度量:MSE / PSNR / SSIM。
When:所有压缩算法设计。
Example:PNG 无损压缩比 2-3×;JPEG 有损 10-50×;H.265 视频 100-1000×。
2.2 无损压缩 (Lossless Compression)
What:Huffman / 算术 / LZW / RLE。
Why:可逆;医学 / 文档 / 源代码。
How:
-
Huffman:变长码;高频用短码。
-
算术编码:将整个消息编码为单个分数;压缩效率高。
-
LZW(Lempel-Ziv-Welch):字典编码;PNG / GIF 用。
-
RLE(Run-Length Encoding):连续相同值用 (值, 长度) 表示。
When:可逆压缩;文本 / 二进制。
Example:gzip(LZW + Huffman);bzip2(BWT + Huffman);png。
2.3 有损压缩 (Lossy Compression)
What:变换编码 + 量化 + 熵编码。
Why:高压缩比;图像 / 视频。
How:
-
变换:FFT / DCT / DWT(去相关)。
-
量化:标量 / 矢量(丢弃不重要的系数)。
-
熵编码:Huffman / 算术。
When:图像 / 视频;带宽受限场景。
Example:JPEG / JPEG 2000 / WebP / HEIC。
2.4 JPEG 标准 (JPEG Standard)
What:8×8 DCT + 量化表 + Huffman。
Why:1992 至今最广泛使用;浏览器 / 相机默认。
How:
-
8×8 DCT:图像分块(8×8)→ DCT。
-
量化表:量化 DCT 系数(亮度 / 色度不同)。
-
Z 字扫描:低频到高频排序。
-
Huffman 编码:DC / AC 系数分别。
-
YUV 4:2:0:色度下采样。
When:图像存储 / 传输 / 网页。
Example*:cv2.imwrite('img.jpg', img, [cv2.IMWRITE_JPEG_QUALITY, 95])。
2.5 JPEG 2000 标准 (JPEG 2000 Standard)
What:DWT + EBCOT。
Why:更高压缩比 / 无块效应;医学 / 数字影院。
How:
-
DWT:5/3 损失less / 9/7 有损。
-
EBCOT(Embedded Block Coding with Optimized Truncation):分层编码。
-
ROI(Region of Interest):感兴趣区域优先编码。
When:医学影像(DICOM);数字影院(DCI);卫星图像。
Example*:glymur / openjpeg 库;.jp2 格式。
2.6 视频压缩 (Video Compression)
What:H.264 / H.265 / AV1。
Why:网络视频流(YouTube / Netflix / 抖音)。
How:
-
帧内预测(I 帧):单帧压缩,类似 JPEG。
-
帧间预测(P / B 帧):运动补偿 + 残差编码。
-
变换 + 量化 + 熵编码:类似 JPEG。
-
H.264 / AVC(2003):最广泛;50% 压缩比 vs MPEG-2。
-
H.265 / HEVC(2013):再 50% 压缩;4K / 8K 视频。
-
AV1(2018):开放免授权;Netflix / YouTube 推广。
When:网络视频流;视频会议;视频监控。
Example*:ffmpeg 工具;libx264 / libx265 / libaom-av1 编码器。
三、关键图表
四、思维导图
mindmap
root((第 8 章 图像压缩与水印))
基础
冗余
信息论
无损
Huffman
算术
LZWRLE
有损
变换量化
熵编码
JPEG
8x8 DCT
量化
JPEG2000
DWT
EBCOT
视频
H264
H265
AV1
水印
空域频域
版权
五、重点与易错点
-
压缩极限是熵:理论下界;无损压缩达不到更低。
-
JPEG 是最广泛静态图像标准:1992 至今;几乎所有浏览器 / 相机支持。
-
JPEG 2000 优于 JPEG:DWT vs DCT;无块效应;更高压缩;医学影像首选。
-
HEVC (H.265) 优于 AVC (H.264):再 50% 压缩;4K / 8K 视频必备。
-
AV1 是开放免授权:Netflix / YouTube 推广;避免 H.265 专利。
-
水印鲁棒性 vs 不可见性:两者 trade-off;DCT / DWT 频域水印更鲁棒。
-
跨章衔接:第 4 章 DFT / 第 7 章 DWT 是压缩核心;第 5 章复原与压缩互补;第 11 章特征提取用水印技术。