記事の概要
生成AIのバイアス・差別と訴訟リスクについての問題が浮上しており、Anthropicが大規模言語モデルの差別抑制に有効な手法を公開しました。
大規模言語モデルの利用は重要な決定事項にも影響を与える可能性があり、訴訟リスクがあるため慎重に扱われています。
その一例として米国で起きた訴訟「Louis et al. v. SafeRent et al. (D. Mass.)」が紹介されています。
また、Anthropicは大規模言語モデルの差別傾向を評価する手法を開発し、差別的なアウトプットを減らすアプローチも考案しています。
具体的にはプロンプトエンジニアリングを活用し、差別を禁止する文言を追加することで差別の低減が示されました。
生成AIの差別をなくし、安全性を追求する取り組みが進められています。
記事のポイント
詳しい記事の内容はこちらから(引用元)
AMP[アンプ] - ビジネスインスピレーションメディア
https://ampmedia.jp/2024/02/17/anthropic-discrimination-genai/