附录 A 数学背景知识 (Mathematical Background)

      +

      核心结论

      • 线性代数:向量 / 矩阵 / 特征值 / SVD;AI 基础数学。

      • 概率论:概率分布 / 条件概率 / 贝叶斯;不确定性推理基础。

      • 微积分:导数 / 偏导 / 梯度;优化基础。

      • 信息论:熵 / 交叉熵 / KL 散度;信息度量。

      • 优化理论:梯度下降 / 凸优化 / Lagrange 乘子。

      本章主旨

      附录 A 是 AIMA 4e 的"数学基础速查"——AI 涉及的数学工具集合。理解后才能读懂 AIMA 各章的数学推导。

      一、核心概念

      本章围绕 5 个核心概念展开:线性代数 → 概率论 → 微积分 → 信息论 → 优化理论。

      概念 定义 + 重要性 实现提示

      线性代数

      向量 / 矩阵 / 特征值 / SVD。

      §A.1;AI / ML 基础。

      概率论

      概率 / 条件概率 / 贝叶斯。

      §A.2;不确定性推理基础。

      微积分

      导数 / 偏导 / 梯度。

      §A.3;优化基础。

      信息论

      熵 / 交叉熵 / KL 散度。

      §A.4;信息度量。

      优化理论

      梯度下降 / 凸优化 / Lagrange。

      §A.5;ML 训练核心。

      二、本章要点

      • 线性代数:向量空间 / 矩阵运算 / 特征值分解 / SVD;用于 PCA / 矩阵分解 / 神经网络。

      • 概率论:随机变量 / 概率分布 / 贝叶斯定理;用于不确定性推理 / 贝叶斯网络。

      • 微积分:导数 / 偏导 / 链式法则;用于反向传播。

      • 信息论:熵 H(p) = -Σ p log p;交叉熵用于分类损失;KL 散度度量分布差异。

      • 优化理论:梯度下降 / 凸优化 / Lagrange 乘子法;用于 SVM / 神经网络训练。

      学习建议
      • AI 涉及大量数学;初学时可先掌握直觉(公式意义),再逐步深入证明。

      • 推荐:3Blue1Brown 线性代数 / 概率论视频。

      • 工具:NumPy / SciPy 实践矩阵运算 / 优化。

      三、关键图表

      视觉图表

      图 A-1
      Figure 1. 图 A-1:线性代数 / 概率 / 微积分 / 优化关系图

      四、思维导图

      mindmap
        root((附录 A 数学背景))
          线性代数
            向量矩阵
            特征值SVD
          概率论
            贝叶斯
            分布
          微积分
            导数梯度
            链式法则
          信息论
            熵
            交叉熵
          优化
            梯度下降
            凸优化

      五、重点与易错点

      • 线性代数:内积 / 外积 / 矩阵求逆 / 特征值 / 奇异值。

      • 概率论:独立性 / 条件独立 / 贝叶斯定理 / 全概率公式。

      • 微积分:链式法则 / 多元函数偏导 / Jacobian / Hessian。

      • 信息论:熵 / 交叉熵 / KL 散度 / 互信息。

      • 优化:凸 / 非凸 / 局部最优 / 全局最优 / 拉格朗日。

      • 推荐教材:Mathematics for Machine Learning(Deisenroth 等)。

      • 跨章衔接:第 12-20 章(概率 / 决策 / 学习)需要概率 + 优化基础。