第 10 章 计算摄影学 (Computational Photography)

      +

      核心结论

      • 光度标定(§10.1):辐射响应函数 / 噪声估计 / 暗角估计 / 光学模糊估计;为后续图像处理提供物理模型。

      • 高动态范围 (HDR) 成像(§10.2):多曝光融合 → HDR 重建 → 色调映射;保留高光 / 阴影细节。

      • 闪光摄影(§10.2.2):结合环境光 + 闪光;保留场景外观同时降噪。

      • 图像去噪(§10.3):BM3D / Non-local means / DnCNN(深度学习)。

      • 超分辨率(§10.4):单图像 SR(SRCNN / ESRGAN)/ 多图像 SR。

      • 图像抠图(§10.5):把前景从背景精确分离;trimap + alpha matte。

      • 纹理合成 / 风格迁移(§10.6):Image quilting / Neural Style Transfer / Diffusion。

      本章主旨

      本章是"计算摄影学"——用算法扩展相机的能力。HDR / 去噪 / 超分 / 抠图都是"图像增强 + 后期";理解后才能做专业摄影后期 / 手机相机优化。

      一、核心概念

      本章围绕 6 个核心概念展开:光度标定 → HDR → 闪光 → 去噪 → 超分辨率 → 抠图 / 风格。

      概念 定义 + 重要性 实现提示

      光度标定

      辐射响应函数 + 噪声 + 暗角 + 光学模糊;物理模型基础。

      §10.1;HDR / 去噪需要。

      HDR 成像

      多曝光融合 → 浮点 HDR → 色调映射到 8-bit。

      §10.2;保留高光 / 阴影细节。

      闪光摄影

      环境光 + 闪光结合;保留场景外观。

      §10.2.2;夜景 / 室内人像。

      图像去噪

      BM3D / Non-local means / DnCNN。

      §10.3;手机夜景必备。

      超分辨率

      单图 / 多图 SR;SRCNN / ESRGAN。

      §10.4;老照片修复 / 视频超分。

      抠图 / 风格迁移

      图像抠图(alpha matte);神经风格迁移。

      §10.5-§10.6;图像编辑 / 艺术效果。

      二、详细笔记

      2.1 光度标定 (Photometric Calibration)

      What:标定相机的辐射响应函数(CRF)、噪声模型、暗角、光学模糊。

      Why:图像处理需要物理模型——HDR / 去噪 / ISP 调优都依赖标定。

      How

      标定内容(§10.1):

      • CRF:像素值与实际辐射度的映射函数;不同相机不同。

      • 噪声模型:散粒 + 读取 + 暗电流(§2.3);SNR 与光强相关。

      • 暗角(vignetting):镜头边缘进光量减少;用多项式模型。

      • 光学模糊(PSF):点光源成像的扩散函数;用刃边法测量。

      CRF 标定的工程意义
      • 图像去噪需要噪声模型(不同光强噪声不同)。

      • HDR 需要 CRF 反函数(把像素值还原为线性辐射度)。

      • ISP(图像信号处理器)调优需要 CRF。

      When:HDR 重建;图像去噪;专业摄影后期;ISP 调优。

      Examplehdrplus / rawpy 库;OpenCV cv2.createCalibrateDebevec

      2.2 HDR 成像 (High Dynamic Range Imaging)

      What:从多曝光图像合成 32-bit 浮点 HDR;再色调映射到 8-bit 显示。

      Why:单张 8-bit 图像动态范围有限(256:1);人眼 / 自然场景是 100000:1。

      How

      HDR 流程(§10.2):

      1. 多曝光拍摄:3-9 张不同曝光(EV -3 到 +3)。

      2. 图像对齐:手持拍摄需对齐(特征匹配)。

      3. CRF 估计cv2.createCalibrateDebevec

      4. HDR 重建cv2.createMergeDebevec → 32-bit 浮点。

      5. 色调映射cv2.createTonemapDrago / Mantiuk / Reinhard → 8-bit。

      色调映射算法对比
      • Drago:对数映射;保留暗部细节。

      • Mantiuk:对比度优化;保留局部对比度。

      • Reinhard:简单易用;全局 / 局部变种。

      • Photographic:模拟胶片响应。

      When:专业摄影;手机夜景模式;游戏 / 电影 HDR 渲染。

      Examplecv2.createMergeDebevec().process([ldr1, ldr2, ldr3], times);Photoshop HDR Pro。

      2.3 图像去噪 (Image Denoising)

      What:去除图像中的随机噪声(散粒 / 读取 / JPEG 压缩)。

      Why:手机夜景 / 高 ISO / 医学影像 / 低光照都需要去噪。

      How

      去噪算法(§10.3):

      • 空间域:高斯 / 中值 / 双边 / NLM(§3.3)。

      • 变换域:小波 / DCT 阈值。

      • BM3D(2007):协同滤波;当前 SOTA(CNN 出现前)。

      • 深度学习:DnCNN(2016)/ RIDNet(2019)/ Restormer(2021);CNN SOTA。

      去噪算法的工程权衡
      • 高斯 / 中值:快但模糊。

      • 双边 / NLM:保边但慢。

      • BM3D:保边 + 强去噪;CPU 较慢。

      • DnCNN:快 + 强;需 GPU;当前主流。

      When:手机夜景;医学影像(CT / MRI);低光摄影。

      Examplecv2.fastNlMeansDenoisingpip install bm3drestormer 深度学习库。

      2.4 超分辨率 (Super-Resolution)

      What:从低分辨率图像重建高分辨率图像。

      Why:老照片修复 / 视频超分 / 监控细节增强;DL 时代的关键应用。

      How

      SR 算法(§10.4):

      • 传统:bicubic / Lanczos 插值(§3.6)。

      • 单图 SR:SRCNN(2015)/ ESRGAN(2018)/ Real-ESRGAN(2021)。

      • 多图 SR:多张低分辨率融合。

      • 扩散模型:Stable Diffusion SR / Imagen SR;最新 SOTA。

      超分辨率的工程应用
      • 老照片 / 电影修复:4K 上采样 / 去噪。

      • 视频流媒体:Netflix / YouTube 用 ML 超分提升低带宽视频。

      • 监控:增强远处人脸 / 车牌。

      When:老照片修复;视频超分;监控增强;图像放大。

      Examplerealesrgan 库;torchvision.transforms.functional.resize;Adobe Photoshop 超分。

      2.5 图像抠图 (Image Matting)

      What:把前景从背景精确分离——输出 alpha matte(前景透明度图)。

      Why:电影特效 / 直播换背景 / 抠图证件照。

      How

      抠图算法(§10.5):

      • trimap-based:用户提供前景 / 背景 / 未知区域 trimap;算法估计 alpha。

      • Closed-form matting:基于局部颜色模型。

      • KNN matting:用 KNN 估计 alpha。

      • 深度学习:MODNet(2022)/ RobustVideoMatting(2021);实时。

      抠图 vs 分割
      • 语义分割:硬分类(每个像素属于哪类)。

      • 实例分割:每个目标 mask(0/1)。

      • 抠图:alpha matte(连续值 0-1)——处理半透明 / 头发丝 / 边缘细节。

      When:电影特效;直播换背景;证件照抠图;AR 贴纸。

      Examplecv2.grabCutpymatting 库;MODNet 深度学习。

      2.6 风格迁移与纹理 (Style Transfer & Texture)

      What:把一张图的风格 / 纹理迁移到另一张图。

      Why:艺术效果;图像编辑;AI 创作。

      How

      算法(§10.6):

      • Image quilting(Efros 2001):传统纹理合成。

      • Neural Style Transfer(Gatys 2015):CNN 特征匹配。

      • CycleGAN(2017):无配对图像翻译。

      • Diffusion Models(2020+):Stable Diffusion / DALL-E 2 / Imagen;当前 SOTA。

      扩散模型改变了图像生成
      • 2020 DDPM(Denoising Diffusion Probabilistic Models):扩散过程 + U-Net 噪声预测。

      • 2022 Stable Diffusion / DALL-E 2 / Imagen:文本生成图像 SOTA。

      • 工程影响:设计师 / 营销 / 教育广泛采用。

      When:艺术创作;游戏素材;图像编辑;营销内容。

      Examplediffusers 库;stablediffusionpytorch-CycleGAN-and-pix2pix

      三、关键图表

      视觉图表

      图 10-1
      Figure 1. 图 10-1:HDR 重建流程
      图 10-2
      Figure 2. 图 10-2:色调映射对比
      图 10-3
      Figure 3. 图 10-3:BM3D 去噪

      非可视化条目

      非可视化条目(表 / 算法)
      编号 内容摘要

      表 10.1

      色调映射算法对比。

      表 10.2

      超分算法对比(SRCNN / ESRGAN / Stable Diffusion SR)。

      式 10-1 至 10-12

      HDR / CRF / 去噪公式。

      列表 10.1-10.x

      OpenCV HDR / DnCNN / MODNet 示例。

      核心公式对照表

      核心公式对照表
      概念 公式

      HDR 重建

      \(\ln E_i = \frac{\sum w_{ij} (\ln I_{ij} - \ln t_j)}{\sum w_{ij}}\)

      Reinhard 色调映射

      \(L_d = \frac{L}{1 + L}\)

      噪声模型

      \(\sigma^2 = \sigma_{\text{shot}}^2 + \sigma_{\text{read}}^2 + \sigma_{\text{dark}}^2\)

      四、思维导图

      mindmap
        root((第 10 章 计算摄影学))
          光度标定
            CRF
            噪声模型
            暗角
          HDR
            多曝光
            色调映射
          去噪
            BM3D
            DnCNN
            Restormer
          超分辨率
            SRCNN
            ESRGAN
            扩散模型
          抠图
            trimap
            MODNet
          风格迁移
            NeuralStyle
            Diffusion

      五、重点与易错点

      • HDR 是手机夜景的基础:现代手机都支持;多曝光融合 + 色调映射。

      • DnCNN / Restormer 是当前去噪 SOTA:手机夜景模式的核心组件。

      • 超分从 CNN 转向 Diffusion:Stable Diffusion SR 视觉效果更好;计算更贵。

      • 抠图用深度学习:MODNet 实时;传统方法速度慢。

      • 扩散模型重塑图像生成:DALL-E / Stable Diffusion 是 2022+ 的范式转移。

      • 专业摄影 vs 手机计算摄影:手机用算法扩展硬件能力;专业仍用大传感器 + 后期。

      • 跨章衔接:第 2 章相机模型是计算摄影基础;第 5 章深度学习是现代算法核心;第 3 章图像处理是基础工具。