記事の概要
グーグルは、複数の画像を組み合わせて作品を生成できるAIツール「Whisk」を公開しました。
このツールは、テキストプロンプトではなく、画像をドラッグ&ドロップするだけで利用できるのが特徴です。
ユーザーは、被写体、シーン、スタイルの3種類の画像を入力することで、オリジナルのデジタルアートを作成できます。
Whiskは、グーグルのマルチモーダルAIモデル「Gemini」を活用して、入力された画像の詳細な説明文を生成し、その情報を元に画像生成AIモデル「Imagen 3」が新しい表現を作り出します。
このサービスはアイデアを迅速に検討することを目的としており、現時点では米国内でのみ利用可能です。
日本からはアクセスできません。
記事のポイント
詳しい記事の内容はこちらから(引用元)
ASCII.jp
グーグルは現地時間12月16日、複数の画像を組み合わせることで作品を生成できるAIツール「Whisk(ウィスク)」を公開…
https://ascii.jp/elem/000/004/241/4241529/