← 用語集

Foundation Model

基盤モデル

大量データを自己教師あり学習で吸わせた汎用モデル。 言語・画像・動画・音声・行動など幅広い下流タスクの土台になる。

Foundation Model (基盤モデル) は、 Web 規模あるいはマルチモーダル規模のデータを自己教師ありで学習し、 さまざまな下流タスクに転用できる汎用モデルの総称。 2021 年の Stanford CRFM の論文で名付けられた。

代表例は GPT / Claude / Gemini / Llama などの LLM、 Stable Diffusion / Sora 系の生成モデル、 ロボット用途では Large Behavior Model (LBM)World Model

ロボティクス文脈での意味

  • 単一タスク向けに毎回モデルを作る時代から、 「巨大な共通モデルを fine-tune / prompt して使う」 時代への転換点
  • ハードと共に「モデル」 もプラットフォーム化されつつあり、 NVIDIA GR00T / Google RT-2 などが代表