第 22 章 强化学习 (Reinforcement Learning)
|
本章主旨
本章是 AIMA 4e 的"强化学习"——MDP / Q-learning / 策略梯度。理解后才能掌握 AI 各子领域。 |
一、核心概念
本章围绕 3 个核心概念展开:
| 概念 | 定义 + 重要性 | 实现提示 |
|---|---|---|
MDP |
环境 / 智能体 |
§22.1 |
无模型 RL |
Q-learning / SARSA |
§22.3-22.4 |
策略梯度 |
REINFORCE / Actor-Critic |
§22.5-22.6 |