Sim-to-Real は、 物理シミュレーション環境で学習した制御方策を、 現実のロボットに移したときに性能が落ちないように設計する技術領域。 安全に試行錯誤できないハードウェア領域で、 RL を実用化する鍵。
代表的な対策
- Domain Randomization: シム内で物理パラメータ (摩擦・慣性・遅延) をランダムに揺らして方策の頑健性を上げる
- Domain Adaptation: 学習途中で実機データを少量混ぜる
- System Identification: 実機を測って正確な物理パラメータをシムに反映
用例
- ANYmal / Spot などの脚式ロボットの歩行制御
- マニピュレータの把持・組立タスク