注目キーワード

グーグル、マルチモーダルAIモデル「Gemma 4 12B」 ノートPCで動作 – Impress Watch

グーグルの新しいAIモデル「Gemma 4 12B」は、ノートPCで動作し、画像や音声を直接扱える革新的なアーキテクチャを採用しています。
この技術により、より多くのユーザーが手軽に高度なAI機能を利用でき、社会のデジタル化を加速させる可能性があります。
オープンモデルでの提供も注目されます。

記事の概要

Google DeepMindが発表した「Gemma 4 12B」は、ノートPCで動作するマルチモーダルAIモデルです。
このモデルは、16GBのVRAMまたはユニファイドメモリーを使用してローカル実行が可能で、開発者はHugging FaceやKaggleから事前学習済みモデルをダウンロードできます。
Gemma 4 12Bは、画像、音声、テキストを直接統合するアーキテクチャを採用し、従来のモデルと比べて低遅延での処理を実現しています。
特に、音声と画像の入力はLLMバックボーンに直接取り込まれ、効率的なデータ処理が行えます。
また、日常的なハードウェアでも高度なマルチモーダル機能を利用できるよう設計されています。
利用環境としては、LM StudioやGoogle AI Edgeアプリがあり、音声入力の文字起こしや翻訳のデモも行われています。

記事のポイント

  1. マルチモーダルAIの進化: Gemma 4 12Bは音声、画像、テキストを統合的に処理できる新しいアーキテクチャを採用しています。
  2. 開発者支援: オープンモデルとして提供され、事前学習済みモデルやチェックポイントが手軽にダウンロード可能です。
  3. 日常的なハードウェアでの利用: 低遅延かつ高性能なマルチモーダル機能を日常的なノートPCで実現できることが特徴です。

詳しい記事の内容はこちらから(引用元)

Impress Watch

Google DeepMindは3日、マルチモーダルAIモデル「Gemma 4 12B」を発表した。ノートPC上で動作す…

グーグル、マルチモーダルAIモデル「Gemma 4 12B」 ノートPCで動作 – Impress Watch
https://www.watch.impress.co.jp/docs/news/2114372.html

 

最新情報をチェックしよう!
>ビジネスを飛躍させるAIキュレーションメディア「BizAIdea」

ビジネスを飛躍させるAIキュレーションメディア「BizAIdea」

国内外の最新AIに関する記事やサービスリリース情報を、どこよりも早くまとめてお届けします。
日々BizAIdeaに目を通すだけでAIの最新情報を手軽にキャッチアップでき、
AIの進化スピードをあなたのビジネスの強みに変えます。

SNSをフォローして頂くと、最新のAI記事を最速でお届けします!
X: https://twitter.com/BizAIdea
Facebook: https://www.facebook.com/people/Bizaidea/61554218505638/

CTR IMG