記事の概要
マルチモーダルAIとは、テキスト、画像、音声、動画などの複数のデータを同時に理解し、処理し、生成する能力を持つ人工知能の一種です。
従来の生成AIは主にテキストデータを扱っていましたが、最近の大規模言語モデルの発展により、視覚や聴覚といった非構造化データの処理も可能になっています。
この進化により、マルチモーダルAIは人間に近い情報理解を実現することが期待されています。
記事は有料会員限定となっており、読者は特典として専門雑誌やオリジナル記事を広く閲覧できるサービスが提供されています。
記事のポイント
詳しい記事の内容はこちらから(引用元)
マルチモーダルAIhttps://xtech.nikkei.com/atcl/nxt/keyword/18/00020/062300059/