記事の概要
Metaはテキストから動画と音声を生成するAIモデル「Movie Gen」を発表しました。
このモデルは30Bパラメータを持ち、最長16秒の高解像度動画を生成可能です。
物体の動きやカメラの動きを自然に学習し、生成された動画ではリアルな表現が確認できます。
さらに、人物画像とテキストを組み合わせてパーソナライズされた動画も作成でき、最大45秒の音声生成にも対応しています。
Metaは、この技術がアーティストやアニメーターの仕事を代替するものではなく、新たな表現の手助けとなると強調しています。
今後は、映画制作者やクリエイターとの連携を進め、ユーザーからのフィードバックを反映させていく計画です。
記事のポイント
詳しい記事の内容はこちらから(引用元)
Impress Watch
Metaは4日(米国時間)、テキストのプロンプトから動画と音声を生成できるAIモデル「Movie Gen」を発表した。3…
https://www.watch.impress.co.jp/docs/news/1629163.html