注目キーワード

ASCII.jp:「あはは」も再現? 味気ないAIとのおしゃべりを豊かにする音声対話技術

東京大学の中田さん、関さんのチームが、音声対話システムの表現力を向上させるための研究に取り組んでいます。
豊かなコミュニケーションを実現するために、音声データセットの整備や大規模言語モデルの活用を行っています。
今後は、パラ言語情報や情動発声を付加することで、音声対話の自然さと豊かさを向上させることを目指しています。

記事の概要

産総研の「覚醒プロジェクト」が音声対話技術の開発に取り組んでいる。
中田亘さんと関健太郎さんのチームは、音声合成技術による表現力豊かな音声対話システムを研究している。
具体的な手法としては、大規模な日本語対話音声データセットを整備し、LLMの言語知識を活用して音声合成モデルを訓練する。
中田さんたちは、声の抑揚や感情表現などの「パラ言語情報」を付加することで、より自然で豊かな音声対話を実現することを目指している。
今後はさらに文脈を理解し、楽しく雑談ができるAIを開発することも考えている。

記事のポイント

  1. 音声対話技術の開発: 東京大学大学院の中田 亘さん、関 健太郎さんのチームが、「覚醒プロジェクト」で表現力豊かな音声合成技術の開発に取り組んでいます。
  2. 大規模な日本語の音声対話データセットの整備: 中田さんらの研究では、約7万時間規模の日本語対話音声データセットの整備を行っています。既存のデータセットでは限られたバリエーションしかなかったため、インターネット上での対話音声の収集も行っています。
  3. LLM(大規模言語モデル)の言語知識の活用: 中田さんらの研究では、LLMの言語知識を活用して音声合成モデルを訓練しています。また、LLMの隠れ層出力を使うことで、対話音声のデータセット不足を補うことも試みています。

詳しい記事の内容はこちらから(引用元)

ASCII.jp

若手ディープテック研究者の育成を支援する産業技術総合研究所(産総研)の「覚醒プロジェクト」。この連載では、2023年度の…

ASCII.jp:「あはは」も再現? 味気ないAIとのおしゃべりを豊かにする音声対話技術
https://ascii.jp/elem/000/004/210/4210686/

 

最新情報をチェックしよう!
>ビジネスを飛躍させるAIキュレーションメディア「BizAIdea」

ビジネスを飛躍させるAIキュレーションメディア「BizAIdea」

国内外の最新AIに関する記事やサービスリリース情報を、どこよりも早くまとめてお届けします。
日々BizAIdeaに目を通すだけでAIの最新情報を手軽にキャッチアップでき、
AIの進化スピードをあなたのビジネスの強みに変えます。

SNSをフォローして頂くと、最新のAI記事を最速でお届けします!
X: https://twitter.com/BizAIdea
Facebook: https://www.facebook.com/people/Bizaidea/61554218505638/

CTR IMG