附录 A 数学背景知识 (Mathematical Background)
核心结论
-
线性代数:向量 / 矩阵 / 特征值 / SVD;AI 基础数学。
-
概率论:概率分布 / 条件概率 / 贝叶斯;不确定性推理基础。
-
微积分:导数 / 偏导 / 梯度;优化基础。
-
信息论:熵 / 交叉熵 / KL 散度;信息度量。
-
优化理论:梯度下降 / 凸优化 / Lagrange 乘子。
|
本章主旨
附录 A 是 AIMA 4e 的"数学基础速查"——AI 涉及的数学工具集合。理解后才能读懂 AIMA 各章的数学推导。 |
一、核心概念
本章围绕 5 个核心概念展开:线性代数 → 概率论 → 微积分 → 信息论 → 优化理论。
| 概念 | 定义 + 重要性 | 实现提示 |
|---|---|---|
线性代数 |
向量 / 矩阵 / 特征值 / SVD。 |
§A.1;AI / ML 基础。 |
概率论 |
概率 / 条件概率 / 贝叶斯。 |
§A.2;不确定性推理基础。 |
微积分 |
导数 / 偏导 / 梯度。 |
§A.3;优化基础。 |
信息论 |
熵 / 交叉熵 / KL 散度。 |
§A.4;信息度量。 |
优化理论 |
梯度下降 / 凸优化 / Lagrange。 |
§A.5;ML 训练核心。 |
二、本章要点
-
线性代数:向量空间 / 矩阵运算 / 特征值分解 / SVD;用于 PCA / 矩阵分解 / 神经网络。
-
概率论:随机变量 / 概率分布 / 贝叶斯定理;用于不确定性推理 / 贝叶斯网络。
-
微积分:导数 / 偏导 / 链式法则;用于反向传播。
-
信息论:熵
H(p) = -Σ p log p;交叉熵用于分类损失;KL 散度度量分布差异。 -
优化理论:梯度下降 / 凸优化 / Lagrange 乘子法;用于 SVM / 神经网络训练。
|
学习建议
|