記事の概要
Anthropicは、生成AI特化のバグバウンティプログラムを2024年8月8日に発表しました。
このプログラムでは、最高報奨金15,000ドル(約210万円)が提供され、特に「ユニバーサルジェイルブレイク」攻撃に焦点を当てています。
この手法は、AIの安全対策を回避して本来禁止されるべき反応を引き起こすもので、複数のAIモデルに対して有害な行動を引き起こす可能性があります。
また、MozillaもAI特化型のプログラム「0Day Investigative Network」を実施しています。
OpenAIやグーグルも、AIシステムの脆弱性に対するバグバウンティプログラムを展開しており、特にプロンプトインジェクションに注目しています。
これらの取り組みは、AIの安全性向上に向けた競争を加速させるものと期待されています。
記事のポイント
詳しい記事の内容はこちらから(引用元)
AMP[アンプ] - ビジネスインスピレーションメディア
https://ampmedia.jp/2024/10/10/anthropic-bug-bounty/