記事の概要
米Googleが、最先端のマルチモーダル大規模言語モデル「Gemini 2.0 Flash」をロボットAI向けに適用し、新たなAI「Gemini Robotics」を開発しました。
このAIは、ロボットの行動を生成するために、商用サービスとして提供されているGeminiの技術をロボット遠隔操作データで微調整したものです。
現在はパートナー企業に限定的に配布されています。
Googleは2022年にロボット行動生成の初の試み「SayCan」を発表するなど、この分野での先駆者として知られていますが、2024年に同社の精鋭チームが独立し、スタートアップ「Physical Intelligence」を設立したことで、今後の展開に影響を与える可能性があります。
この状況はGoogleにとって予想外の事態であり、ロボットAIにおける研究の進展が注目されています。
記事のポイント
詳しい記事の内容はこちらから(引用元)
米Google(グーグル)が自社の最先端のマルチモーダル大規模言語モデル(LLM)をついにロボットAI向けに適用した。…
https://xtech.nikkei.com/atcl/nxt/mag/rob/18/012600001/00166/