記事の概要
OpenAIのGPT-4とグーグルのGeminiが、高い計算・数学能力を持つ生成AIモデルとして注目されている。
生成AIはテキストや画像の生成だけでなく、計算・数学でも進化しており、その能力を測るために「GSM8K」というデータセットを用いたベンチマークテストが一般的に使われている。
近年、モデルの小型化とパフォーマンスの向上が進んでおり、軽量なモデルでも高いパフォーマンスを示すことが可能となっている。
現在の最高峰はGPT-4とGemini Ultraであり、Gemini Ultraは94.4%のスコアを記録している。
さらに、GPT-4のCode Interpreterを使用したアプローチでは、正答率が97%まで高まることも報告されている。
今後はより複雑な数学問題に対する改善が期待されている。
記事のポイント
詳しい記事の内容はこちらから(引用元)
AMP[アンプ] - ビジネスインスピレーションメディア
https://ampmedia.jp/2024/02/19/math-genai/