記事の概要
アリババの研究グループがAIフレームワーク「EMO」を発表しました。
EMOは1枚の写真と音声データを入力することで、表情豊かな音声アバタービデオを生成することができます。
デモではオードリー・ヘップバーンが歌を歌ったりスピーチをしている動画が紹介されました。
EMOは英語や日本語、中国語などの多言語にも対応しており、さまざまな画像をリアルな動きのアニメーション化することができます。
技術的には2つのエンコーダーを組み合わせて顔の動画を生成し、さまざまな操作で動画の品質を向上させています。
アリババは2023年にも「Animate Anyone」という高品質な動画生成技術を発表する予定で、EMOも近い将来公開されることが期待されています。
記事のポイント
詳しい記事の内容はこちらから(引用元)
ASCII.jp
アリババの研究グループは2月27日、1枚の写真と歌声や話し声の音声データを入力するだけで、表情豊かな音声アバタービデオを…
https://ascii.jp/elem/000/004/186/4186761/