記事の概要
Google DeepMindは、8月5日に汎用ワールドモデル「Genie 3」を発表しました。
この技術は、テキストによる指示から720pの解像度でリアルタイムにインタラクティブな仮想世界を生成できることが特徴です。
ユーザーは生成された世界を自由に探索でき、例えば、ジェットスキーやヘリコプターでの体験が可能です。
デモでは、自然現象やキャラクターの生成能力が示され、歴史的な舞台の再現も実現されています。
さらに、ユーザーが天候やオブジェクトを変更できる機能もあり、ダイナミックな体験が提供されます。
ただし、アクションの制限や複数エージェント間の相互作用に関する課題も残っています。
今後、この技術は教育やロボットのトレーニングに活用されることを目指しています。
記事のポイント
詳しい記事の内容はこちらから(引用元)
ASCII.jp
Google DeepMindは8月5日(現地時間)、テキストによる指示(プロンプト)から、ユーザーが操作可能な多様性に…
https://ascii.jp/elem/000/004/311/4311430/