Sim-to-Real

Domain Randomization: シム内で物理パラメータ (摩擦・慣性・遅延) をランダムに揺らして方策の頑健性を上げる
Domain Adaptation: 学習途中で実機データを少量混ぜる
System Identification: 実機を測って正確な物理パラメータをシムに反映

シムトゥリアル

シミュレーションで学習したロボット方策を実機に転移させる課題と手法群。

Sim-to-Real は、物理シミュレーション環境で学習した制御方策を、現実のロボットに移したときに性能が落ちないように設計する技術領域。安全に試行錯誤できないハードウェア領域で、 RL を実用化する鍵。