記事の概要
OpenAIが新しいAIモデル「GPT-4o」を発表し、映像と音声を直接処理できることで、ボイスチャット形式の利用が進化する見込みだ。
同様にGoogleも「Gemini 1.5 Pro」を発表し、マルチモーダル化を進化させた。
さらにマイクロソフトも次世代AI PC「Copilot+ PC」の展開を発表した。
これまでのAIはテキスト処理が主だったが、GPT-4oのように音声入力による応答が可能になることで、より実用的な利用が期待される。
これにより、音声チャットがさまざまな分野で活用される可能性があり、人々の生活に大きな変化をもたらすことが期待される。
記事のポイント
詳しい記事の内容はこちらから(引用元)
Impress Watch
米国時間の5月13日、OpenAIは新しいAIモデル「GPT-4o」を発表した。映像と音声を直接処理できることで、これま…
https://www.watch.impress.co.jp/docs/series/kodera/1594119.html