記事の概要
Google Researchは、1枚の人物画像からその人物が話す動画を生成するAI「VLOGGER」を開発しました。
VLOGGERは、人物画像から3Dモーションへの確率的拡散モデルと空間および時間的制御の両方でテキストから画像にモデルを強化する新しい拡散ベースのアーキテクチャで構成されています。
VLOGGERを使えば、可変長の高品質動画を生成することが可能で、口元や表情、ジェスチャーなども表現できます。
これはプレゼンテーションや教育、ナレーション、オンライン通信用のインタフェースとして活用できるとしています。
記事のポイント
詳しい記事の内容はこちらから(引用元)
ITmedia NEWS
Google Researchは、人物の1枚の画像から“音声駆動で”発話する、その人物の動画を生成するAIシステム「VL…
https://www.itmedia.co.jp/news/articles/2403/19/news138.html