注目キーワード

NVIDIA、次世代AIインフラ「Rubin」 推論トークンコスト1/10 – Impress Watch

NVIDIAの次世代AIインフラ「Rubin」は、トレーニング時間の短縮と推論コストの大幅削減を実現します。
これにより、AI技術の普及が加速し、企業の導入が容易になることが期待されます。
社会全体におけるAI活用の進展が見込まれます。

記事の概要

NVIDIAは次世代AIインフラ「Rubin」プラットフォームを発表しました。
この新プラットフォームは、6つの新チップを連携させることで、トレーニング時間を大幅に短縮し、推論トークンのコストを従来の「Blackwell」プラットフォームの1/10に削減することができます。
Rubinは、NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink 6スイッチなど、さまざまなチップで構成されており、緊密な協調設計が実現されています。
特にRubin GPUは、MoE(Mixture of Experts)モデル向けに最適化されており、従来比で4分の1のGPU数でのトレーニングが可能です。
このプラットフォームの名称は、米国の天文学者「Vera Florence Cooper Rubin」に由来しています。
Rubinは2026年後半に登場予定で、AI導入の加速が期待されています。

記事のポイント

  1. コスト削減: NVIDIAの「Rubin」プラットフォームは、推論トークンコストを従来の1/10に削減します。
  2. トレーニング時間の短縮: 6つの新チップを使用することで、AIモデルのトレーニング時間を大幅に短縮できます。
  3. AI導入加速: 従来比1/4のGPU数でMoEモデルをトレーニング可能になり、AI導入のスピードが向上します。

詳しい記事の内容はこちらから(引用元)

Impress Watch

NVIDIAは、次世代AIインフラ「Rubin」プラットフォームを発表した。6つの新チップを協調させることで、トレーニン…

NVIDIA、次世代AIインフラ「Rubin」 推論トークンコスト1/10 – Impress Watch
https://www.watch.impress.co.jp/docs/news/2075861.html

 

最新情報をチェックしよう!
>ビジネスを飛躍させるAIキュレーションメディア「BizAIdea」

ビジネスを飛躍させるAIキュレーションメディア「BizAIdea」

国内外の最新AIに関する記事やサービスリリース情報を、どこよりも早くまとめてお届けします。
日々BizAIdeaに目を通すだけでAIの最新情報を手軽にキャッチアップでき、
AIの進化スピードをあなたのビジネスの強みに変えます。

SNSをフォローして頂くと、最新のAI記事を最速でお届けします!
X: https://twitter.com/BizAIdea
Facebook: https://www.facebook.com/people/Bizaidea/61554218505638/

CTR IMG