記事の概要
米Googleの研究部門、Google DeepMindは2025年3月12日にロボット向けの新しいAIモデル「Gemini Robotics」を発表しました。
このモデルは、視覚と言語を行動に変換するVLAモデルと、高度な空間認識を実現する「Gemini Robotics-ER」の2つで構成されています。
Gemini Roboticsは「一般性」「双方向性」「器用さ」の3つの性能指標で、既存のAIよりも大幅に向上したとされています。
実際のデモでは、ロボットアームが折り紙を折ったり、ミニゲームでバスケットボールをシュートする様子が公開されました。
また、Gemini Robotics-ERは、オブジェクトの検出や安全な動作を理解する能力を強化しており、コーヒーマグの持ち方を直感的に理解できるとされています。
さらに、DeepMindは米スタートアップのApptronikと提携し、次世代ヒューマノイドロボットの開発を進めているとのことです。
記事のポイント
詳しい記事の内容はこちらから(引用元)
米Google(グーグル)の研究部門であるGoogle DeepMindは2025年3月12日、ロボット向けAI(人工…
https://xtech.nikkei.com/atcl/nxt/news/24/02279/