グーグル、「Gemini 3.5 Flash」にPC・スマホ操作の自動実行機能を標準搭載——ブラウザ横断でAIエージェント構築が可能に

米グーグルは、AIモデル「Gemini 3.5 Flash」に、画面を見て自律的に操作する「コンピューター使用(computer use)」機能を組み込みツールとして搭載したと発表した。ブラウザ、モバイル、デスクトップの各環境を横断して動作するAIエージェントを、開発者が構築できるようになる。

これまでコンピューター使用機能は、独立した「Gemini 2.5 computer use」モデルとしてのみ提供されていた。今回、主力であるFlashモデルにネイティブ統合され、開発者は3.5 Flash単体で、画面を認識し、推論し、操作を実行するエージェントを構築できる。グーグルによれば、エージェント的なコンピューター操作タスクで自社最高の性能を実現するという。

想定する用途は、継続的なソフトウェアテストや、専門アプリケーションをまたいだ知識労働といった、長期的かつ企業向けの自動化タスクである。開発者と企業は、Gemini APIおよびGemini Enterprise Agent Platform経由で利用を開始できる。

安全面では、ライブ環境で動作するエージェントのプロンプトインジェクションのリスクを軽減するため、標的型の敵対的訓練を実施した。加えて、機微または不可逆な操作にユーザーの明示的な確認を求める機能と、間接的なプロンプトインジェクションを検知した際にタスクを自動停止する機能という、2つのオプションのエンタープライズ向けセーフガードを提供する。

グーグルは「多層防御(defense-in-depth)」のアプローチを掲げ、これらの機能を安全なサンドボックス化や人間による検証、厳格なアクセス制御と組み合わせることを開発者に推奨している。

https://blog.google/innovation-and-ai/models-and-research/gemini-models/introducing-computer-use-gemini-3-5-flash/

関連記事

最新ニュース記事

  1. アンソロピック、Slackで使えるAIエージェント「Claude Tag」発表——「@Claude」で業務を委任、自社コードの65%を生成

  2. グーグル、「Gemini 3.5 Flash」にPC・スマホ操作の自動実行機能を標準搭載——ブラウザ横断でAIエージェント構築が可能に

  3. OpenAI、Codexに操作の実演で自動化する新機能「Record & Replay」——Macでの作業を一度見せるだけで再利用可能なスキルに

  4. 2025年の社名変更は2万1547社——4社に1社が英語化、「AI」冠社名も純増42社と急増 帝国データバンク調査

  5. アドビ、PhotoshopやPremiereなどCreative Cloud全体にAIエージェントを大幅拡充——ChatGPTやClaudeとの連携も

  6. newmo、北海道・札幌に進出——乗務員不足に対応、今秋開業へ新会社設立とドライバー採用を開始

  7. OpenAI、ChatGPT Enterpriseにコスト分析と支出管理機能を追加——AI投資の可視化と制御を強化

  8. Voicy、企業向けPodcast制作サービス「Voicy Podcast Studio」を開始——企画から配信・分析までワンストップ、最短4週間で配信

  9. Microsoft、AIエージェント「Copilot Cowork」を全世界で一般提供開始——数千ファイルの比較も自律実行、Fortune 500の過半数が採用

  10. 物価高と魚離れを救う。シェアNo.1企業が語る「魚肉ソーセージ」再ブレイクの理由

365AIニュースセンター最新記事

  1. 不登校からの復学へ!お子様の心を動かす7つのきっかけ

  2. 入学できないことも?「フリースクール入学拒否問題」の現実とその対処法

  3. フリースクール中学校・通信制高校生の卒業後の進路:進学以外の就職という選択肢

  4. 中学生の不登校、30万人突破 – 教育現場の危機と新たな希望

  5. 【専門家が伝える】不登校のお子様を持つ親御様の「心の荷」を軽くする5つのヒント

  6. 不登校脱出への道?フリースクールの魅力と注意点-親子で考える新たな一歩-

  7. Amazonが「プライムデー夏祭り」を六本木で開催!

  8. 甘いとうもろこしとフライドチキンの絶妙コンビ。夏限定!「もろこしチーズバーガー」新登場