インターネットを閲覧したいと思ったことはありますが、アドレス バーに URL を入力するのは面倒だと感じたことはありませんか? Google がお手伝いします。本日、同社は既存の Gemini in Chrome 機能の大幅な拡張を発表しました。そのハイライトには、AI コンパニオンの新しい外観、より統合された画像編集ツール、そしておそらく最も印象的な (しかし不気味でもある) 自動ブラウズの開始が含まれます。これにより、オンライン時に Gemini がハンドルを握ることができます。

クレジット: Google
以前は、Chrome の Gemini はブラウザーの上部にある小さなボックスに表示されていたため、特にタブ間を移動するときに使用するのが少し不便でした。 Google のアップデートにより、少し大きくなったスクロール可能なサイド パネル ビューに移動され、他のコンテンツが隠れることはありません。代わりに、表示している Web ページの右側に表示されるので、Gemini が提供する答えと表示している内容を簡単に比較したり、複数のタブ間を行き来しながら会話を続けることができます。プロンプトで開いている複数のタブを参照する機能など、以前と同じ機能がすべて保持されます。小さな変更ですが、使いやすさに役立つはずです。

クレジット: Google
Google の Nano Banana 画像生成 AI は少し問題を抱えていますが、Chrome の新しい Gemini アップデートにより使いやすくなりました。画像をダウンロードして Gemini に再アップロードする代わりに、Nano Banana を使用して右クリックするだけで画像を編集できるようになりました。または、自然言語を使用して、編集したい画像を画面上に表示し、サイド パネルで編集するように Gemini に指示することで、編集を開始することもできます。 Googleによれば、これはブラウザ上で表示できるほとんどすべての画像で機能するはずだという。
Googleはデモ中にGoogleフォトライブラリを使ってこれをジャーナリストに披露したが、自分の画像に固執しなければならないということは何もない。イーロン・マスク氏のXが、Grokを使用してソーシャルメディアプラットフォーム上で他人の画像を許可なく直接編集できるようにしたことで現在泥沼に陥っていることを考えると、これはすぐに私に警鐘を鳴らした。一部のユーザーが他人の写真から露骨なコンテンツを生成するためにこのツールを使い始めた後、そのツールは少し削減されたが、Googleは心配していないようだ。この機能の安全保護について尋ねたところ、Google の広報担当者は次のように答えました。
「当社には、AI ツールを使用して露骨な性的コンテンツを生成することを禁止する明確なポリシーがあり、当社のツールはこれらのポリシーを反映するために継続的に改良されています。当社は最初から安全性に投資し、暴力的、攻撃的、または露骨な性的コンテンツなどの問題のある出力を制限するために技術的なガードレールを追加しました。」
同社は、ユーザーが著作権を回避するためにChromeでNano Bananaをどのように使用するかについては何も述べていないが、技術的には、新しいアップデートは実際にGoogleのAI画像ジェネレーターに新機能を追加するわけではなく、アクセスしやすくするだけだ。確かに、同じことが Grok の最近のアップデートにも当てはまり、たとえ最善の意図を持っていたとしても、簡単にアクセスできるということは、水門を開けることを意味する可能性があります。

クレジット: Google
最後に重要なことは、「Agentic」は最近 AI のホットなバズワードになっており、Google は Chrome が置き去りにされることを望んでいないということです。そのため、Gemini は質問に答えるだけでなく、ブラウザーを制御できるようになりました。
現在、この機能は Google AI Pro および Ultra の加入者に限定されていますが、本日より、これらの加入者は Chrome に「自動ブラウズ」を依頼できるようになり、リサーチを完了し、さまざまな Web サイトに移動し、フォームに入力することができます。
AI が Web 上を移動する様子を観察したり、バックグラウンドで動作している間にクリックして別のタブに移動したりできます。複数のタブを同時に自動参照できるため、いくつかのタスクを同時に実行できます。 AI は、ナビゲーション中に実行するステップをサイド パネルにリスト表示して、チェックインを容易にします。
Googleは、AIが特定の製品を見つけ、そのストアページに移動し、(Googleパスワードマネージャーを使用して)購入者のアカウントに歌い込み、それをカートに追加する様子を見せて、これをジャーナリストに実証しました。同社はまた、自動参照を使用して予約をスケジュールしたり、アップロードされた PDF の情報を使用してオンライン フォームに記入したり、税務書類を収集したり、Redfin などのサイトに掲載されているアパートを比較したりできることも提案しました。まだ実際に使っていないので、これらのタスクをどれだけうまく実行できるかについては語れませんが、制御されたデモではきちんと動作しているように見えました。
自動ブラウズに関する私の懸念は主に大ざっぱな Web サイトと権限にありますが、Google はそれらについても計画されていると言いました。自動ブラウズは、Google パスワード マネージャーにアクセスする前に許可を得る必要があり、AI が正しくないと判断したリンクに遭遇すると、Chrome の既存の安全でないブラウジング保護機能を使用してそこから移動すると考えられます。 Google の広報担当者は、この機能は「可能な限り安全です」と私に言いましたが、少なくとも最初の数回のリクエストの間は監視し続けたいと思います。
この機能には、現時点では 1 つの制限もあります。一度に複数のタブで開くことはできますが、自動参照タブは相互に通信できません。つまり、自動参照の各インスタンスは分離されていますが、将来的には変更される可能性があります。
個人的には、特に「税務書類の収集」などの機密性の高いタスクではこれをあまり使用していないと思いますが、基本的なフォームに自動的に入力する機能は便利に思えます。 Googleによると、自動ブラウズは停止し、実際に商品を購入したりフォームを送信したりするなど、自動ブラウズが必要となる可能性のある作業において機密性の高い手順を引き継ぐよう求められるという。最終ステップは実行されません (または実行されるべきではありません)。そのため、動作を確認する機会が与えられます。その点では、Gemini アプリの既存のショッピング機能と似ています。
Chrome の Gemini は、Gemini の既存の機能のほとんどを使用でき、Gmail などのアプリに接続したり、ボットとのチャット履歴にアクセスしたりできます。しかし、「今後数か月間」に計画されている大きなものが 1 つあります。
最近、Gemini アプリは有料ユーザー向けに「パーソナル インテリジェンス」のベータ版を公開しました。これにより、AI は、どこを見るかを指示しなくても、過去の会話や接続されているアプリのすべてを表示できるようになります。これは基本的に、既存の接続されたアプリと履歴機能の拡張であり、その上に推論モデルが適用されます。たとえば、車の新しいタイヤを探すように指示すると、Gmail と Google フォトを調べて、所有している車のモデルと最後にタイヤを購入した時期を自動的に認識します。
この機能はまだ開発中ですが、開発中であるということは、Google が Gemini にアクセスできるさまざまな方法すべてを同等にするために急速に取り組んでいることを意味します。この記事で説明されている他の機能はすべて、すでに利用可能であるか、現在展開されています。