name: 强化学习技能 description: 使用仿真与仿真到现实迁移技术进行机器人控制的强化学习训练 slug: rl-robotics category: 学习 allowed-tools:
- Bash
- Read
- Write
- Edit
- Glob
- Grep
强化学习技能
概述
用于机器人控制任务的强化学习代理训练的专业技能,包括环境设计、训练流程和仿真到现实迁移。
能力
- 为机器人配置Gym/Gymnasium环境
- 设置Stable Baselines3训练(PPO、SAC、TD3)
- 实现自定义观测和动作空间
- 设计奖励塑形策略
- 配置并行环境训练
- 为仿真到现实实现域随机化
- 设置课程学习
- 配置基于视觉的强化学习(使用CNN)
- 实现策略蒸馏
- 导出策略以供部署(ONNX、TorchScript)
目标流程
- rl-robot-control.js
- imitation-learning.js
- sim-to-real-validation.js
- nn-model-optimization.js
依赖项
- Stable Baselines3
- Gymnasium
- Isaac Gym
- rsl_rl
使用场景
当流程需要基于强化学习的机器人控制、从仿真中学习或将学习到的策略迁移到真实机器人时,会调用此技能。
输出成果
- Gymnasium环境实现
- 训练配置
- 奖励函数设计
- 域随机化配置
- 训练好的策略检查点
- 可部署模型(ONNX)