注目キーワード

ASCII.jp:OpenAI、わずか15秒のサンプルから”そっくり音声”作れるAIモデル

OpenAIが開発したAIモデル「Voice Engine」は、わずか15秒の音声サンプルから自然な発話音声を生成できる技術です。
音声合成AIがもたらす可能性や課題を考え、安全性にも配慮した運用方針を採っています。
音声の使用を保護するポリシーやAIリテラシーに関する教育も提案しています。

記事の概要

OpenAIが「Voice Engine」というAIモデルを開発し、少ない音声サンプルから合成音声を生成できることを発表しました。
このモデルは入力されたテキストから自然な発話音声を生成することができ、必要な音声サンプルの長さは15秒程度で済みます。
また、元の言語のアクセントの癖も保持されるため、フランス語話者の音声サンプルを基に生成された英語音声はフランス語のアクセントをもったものになります。
Voice Engineはすでにいくつかのサービスで活用されており、2023年末からは一部のパートナーと非公開のテストも行われています。
OpenAIは、音声合成AIの悪用リスクにも対策を実装しており、安全性に配慮した運用方針を採っています。
一般公開は予定されていませんが、社会全体で音声合成AIの可能性や課題に対応するきっかけとなることを意図しています。

記事のポイント

  1. 「Voice Engine」は少ない音声サンプルから自然な発話音声を生成できるAIモデルであり、学習に必要な音声サンプルの長さが15秒程度で済む。
  2. Voice Engineは他の言語の音声も生成可能であり、元の言語のアクセントも保持される。
  3. Voice Engineは既にOpenAIの他のサービスに活用されており、子ども向けの読書支援ツールや音声の自動翻訳、言語障害に苦しむ患者の支援などに活用されている。

詳しい記事の内容はこちらから(引用元)

ASCII.jp

OpenAIは3月29日(現地時間)、15秒程度のサンプル音声から人間の声を真似ることができる音声合成AI「Voice …

ASCII.jp:OpenAI、わずか15秒のサンプルから”そっくり音声”作れるAIモデル
https://ascii.jp/elem/000/004/192/4192115/

 

最新情報をチェックしよう!
>ビジネスを飛躍させるAIキュレーションメディア「BizAIdea」

ビジネスを飛躍させるAIキュレーションメディア「BizAIdea」

国内外の最新AIに関する記事やサービスリリース情報を、どこよりも早くまとめてお届けします。
日々BizAIdeaに目を通すだけでAIの最新情報を手軽にキャッチアップでき、
AIの進化スピードをあなたのビジネスの強みに変えます。

SNSをフォローして頂くと、最新のAI記事を最速でお届けします!
X: https://twitter.com/BizAIdea
Facebook: https://www.facebook.com/people/Bizaidea/61554218505638/

CTR IMG