記事の概要
富士通は、AIサービス「Fujitsu Kozuchi」の主要技術として、大規模言語モデル「Takane」を軽量化・省電力化する「生成AI再構成技術」を開発しました。
この技術は、重みを圧縮する量子化技術と特化型AI蒸留技術から成り立っています。
量子化技術により、メモリー消費量を最大94%削減し、処理速度を3倍に向上させました。
この成果により、従来4枚のハイエンドGPUが必要だったモデルを1枚のローエンドGPUで運用できるようになります。
さらに、エッジデバイス上でのAI実行が可能になり、リアルタイムの応答性やデータセキュリティが向上します。
富士通は2025年度下期からこの技術のトライアル環境を提供し、専門特化型AIモデルの開発を進める方針です。
最終的には、生成AIの利用をより広範囲に拡大し、持続可能なAI社会の構築を目指します。
記事のポイント
詳しい記事の内容はこちらから(引用元)
ZDNET Japan
富士通は、AIサービス「Fujitsu Kozuchi」の中核技術として、大規模言語モデル(LLM)の軽量化と省電力化を…
https://japan.zdnet.com/article/35237691/