引言与动力学回顾
文档定位:本讲为最优控制与强化学习(OCRL)课程的力学基础模块。目标是在不依赖完整分析力学前置知识的前提下,建立从牛顿力学到现代控制标准形式(状态空间、控制仿射、操作器方程)的完整映射,并为后续线性化、MPC、强化学习等算法提供动力学层面的"接口定义"。
1.1 课程概览与应用图景
1.1.1 最优控制的现实锚点
想象一个分拣流水线:包裹从不同入口滑入,机械臂需要在不碰撞的前提下,以最短路径将它们分类到对应格口。最优控制要回答的正是:在给定物理规律(动力学)和动作范围(约束)下,如何计算一条"最优"的动作序列?
这里的"最优"可以是燃料最省(火箭着陆)、时间最短(自动驾驶避障)、能耗最低(四足机器人奔跑),或是误差最小(机械臂轨迹跟踪)。
核心结论:最优控制 = 动力学模型 + 优化目标 + 约束条件。三者缺一不可,正如分拣流水线需要知道包裹运动规律(动力学)、明确"快"还是"省"(目标)、以及不能撞墙(约束)。
