記事の概要
2025年2月から3月にかけて、AI研究に関する注目論文がSNSで多く言及され、特に中国のDeepSeekとアリババの成果が目立ちました。
DeepSeekは、LLMの学習・推論コストを大幅に削減する新手法「Native Sparse Attention」を提案し、計算効率を飛躍的に向上させました。
この手法は、重要なトークンのみを選択的に計算することで、処理速度を向上させています。
一方、アリババは320億パラメーターを持つ新しい論理推論モデル「QwQ-32B」を発表し、従来の大規模モデルと同等の性能を示しました。
また、マルチモーダルLLM「Qwen2.5-VL」がSNSでの言及数で高評価を得ており、特にエージェント機能において高い精度を実現しています。
これらの成果は、AI研究の進展を示す重要な指標となっています。
記事のポイント
詳しい記事の内容はこちらから(引用元)
日経クロステック(xTECH)
中国DeepSeek(深度求索)の勢いが止まらない。同社は2025年1月に続き、翌2月もAI研究者の注目の的となった。…
https://xtech.nikkei.com/atcl/nxt/column/18/02801/031200016/