記事の概要
2024年には、大規模言語モデルを利用した生成AIアプリケーションが多数登場する見込みです。
しかし、これらのアプリケーションの導入や開発が増えるかどうかは、アプリケーションの安全性や正確性、中立性が確保されるかに依存します。
企業は、コンプライアンスやセキュリティの観点から、幻覚を起こさず事実を正確に生成するアプリケーションを開発・提供する必要があります。
そのため、評価ツールが需要とともに増えており、DeepchecksやContextなどの企業が競争しています。
また、Braintrust Dataは開発段階でのAI評価を効率化するツールを提供しており、多くの法人顧客を抱えています。
これにより、AIアプリケーションの安全性や正確性が改善され、信頼度が高まることが期待されています。
記事のポイント
詳しい記事の内容はこちらから(引用元)
AMP[アンプ] - ビジネスインスピレーションメディア
https://ampmedia.jp/2024/02/24/llm-evaluation/