記事の概要
DeepSeekは、AIモデルの訓練方法を革新する新手法「Manifold-Constrained Hyper-Connections」(mHC)を発表しました。
この手法により、大規模言語モデルの構築が従来よりも少ない計算コストで可能になるとされています。
DeepSeekは、1年前に公開した「R1」モデルで注目を集め、資金やリソースが限られていても高性能なAIモデルを訓練できることを示しました。
mHCは、次世代モデル「R2」の基盤となる可能性があり、2025年半ばの発表が期待されていましたが、延期されています。
これにより、AIの進化に新たな道筋が示され、特に小規模な開発者にとっても利用しやすくなることが期待されます。
DeepSeekの取り組みは、資金力に依存しないAI開発の可能性を広げるものです。
記事のポイント
詳しい記事の内容はこちらから(引用元)
ZDNET Japan
中国のAI企業DeepSeekの研究チームは、「Manifold-Constrained Hyper-Connectio…
https://japan.zdnet.com/article/35242276/