一、基础概念与原理 1. 什么是强化学习(Reinforcement Learning, RL)?与监督学习、无监督学习的区别是什么? 定义 强化学习是一种通过 智能体(Agent) 与 环境(Environment) 交互,以最大化累积奖励为目标的学习方法。其核心是“试错学习”:智能体根据环境反馈调整策略,无需预先标注数据。 对比其他学习范式 维度 监督学习 无监督学习 强化学习