記事の概要
国立研究開発法人理化学研究所とCitadel AIが協力し、大規模言語モデルの安全性を高めるための日本語データセットを開発しました。
このデータセットは、有害なテキストやバイアスを含む日本語のテキストと、それに対する適切な回答例を収集し、大規模言語モデルの学習や評価に利用することができます。
これにより、モデルの偏った推論や有害な結果を防ぐことができ、安全性と信頼性を高めることが目指されています。
また、日本語のトレーニングデータが不足しているため、このデータセットは日本語ベースの大規模言語モデルの開発においても重要な役割を果たします。
AnswerCarefullyデータセットはオープンソースとして公開され、広く活用される予定です。
記事のポイント
詳しい記事の内容はこちらから(引用元)
プレスリリース・ニュースリリース配信シェアNo.1|PR TIMES
株式会社Citadel AIのプレスリリース(2024年5月13日 10時00分)Citadel AI、理化学研究所の大…
https://prtimes.jp/main/html/rd/p/000000029.000075720.html