記事の概要
Metaが開発したAI「Audiobox」は、音声や効果音の生成が可能なAIモデルである。
Audioboxはデモ版が一般ユーザーにも利用可能であり、安定した動作と使用方法の案内が特徴である。
現段階では英語のみに対応しているが、効果音やナレーションの作成に利用できる。
映画やポッドキャスト、オーディオブック、ビデオゲームなどのコンテンツ制作に活用できるほか、ASMRにも応用可能である。
Audioboxは音声忠実度の指標であるFADが従来の技術に比べて5割近く改善され、高品質な音声を生成できる。
また、指定した文章を特定の人物の声や録音した自分の声で読み上げることも可能であり、音声に関してはやや人工的な感じがするものの、サンプルレートの低さが影響している可能性もある。
Audioboxには音声を組み合わせてストーリーを作る機能もあり、映像や音声コンテンツの作成をシミュレートすることができる。
また、子供の教育にも利用できる可能性もある。
記事のポイント
詳しい記事の内容はこちらから(引用元)
ASCII.jp:MetaのAudioboxを試す、指定の効果音や音声読み上げを文章から作れる生成AI (1/2)https://ascii.jp/elem/000/004/185/4185978/