記事の概要
グーグルは、画像を基に新しい画像を生成するAIサービス「Whisk」を、2月12日から日本を含む100以上の国で提供開始しました。
このサービスは、18歳以上のユーザーを対象としており、詳細なテキストプロンプトを必要とせず、画像をそのままプロンプトとして使用できます。
ユーザーは用意されたテンプレートに沿って画像を選択し、簡単に新しい画像を生成できます。
プロセスには、グーグルのAIモデル「Gemini」と「Imagen 3」が利用されており、Geminiが入力画像を解析してキャプションを生成し、その情報を基にImagen 3が新しい画像を作成します。
また、日本文化をテーマにした「カプセルトイ」や「お弁当」、季節に合わせた「バレンタインデー」用のテンプレートも提供されています。
試験運用版はGoogle Labsで公開されており、日本語に対応していますが、一部機能は英語での使用が推奨されています。
記事のポイント
詳しい記事の内容はこちらから(引用元)
グーグルは2月12日、画像をもとに別の画像を生成できるAIサービス「Whisk」を、日本を含む100以上の国と地域で順次…
https://ascii.jp/elem/000/004/250/4250851/