記事の概要
Google DeepMindは10月7日、新たなAIモデル「Gemini 2.5 Computer Use」を発表しました。
このモデルは、ブラウザーやウェブアプリの操作を人間の代わりに行うことを目的としており、従来の「Gemini 2.5 Pro」を基盤にしています。
AIはスクリーンショットや前の操作履歴を解析し、自動的にクリックや入力、スクロールといったアクションを生成します。
これにより、複雑なウェブ操作を実行できるようになります。
デモでは、情報の取得やCRMシステムへの登録、スケジュール設定といった作業が披露され、性能面では他社モデルを上回る精度と応答速度を示しています。
また、安全性を考慮し、危険な操作を自動実行しない「ステップごとの安全審査」機能も搭載されています。
CAPTCHAの回避や医療機器の制御など、高リスクな動作は禁止されています。
記事のポイント
詳しい記事の内容はこちらから(引用元)
Google DeepMindは10月7日、AIがパソコンを操作できる新モデル「Gemini 2.5 Computer …
https://ascii.jp/elem/000/004/325/4325554/