OpenAI、ChatGPT Agent を発表:検索・画像生成・注文まで AI が一括対応!

日本時間の 7 月 18 日、OpenAI は新機能「ChatGPT Agent」を正式に発表しました。これまでのような対話型・生成型 AI とは異なり、ChatGPT が実際に作業を“代行”してくれる本格的な AI アシスタントへと進化します。

更に面白いコンテンツを観たい人は、Instagram @applealmondjp をフォローしてください!

ChatGPT Agent とは?

ChatGPT Agent は、OpenAI が新たに提供する高度な AI アシスタントモードです。これまでのように「会話」するだけでなく、仮想 PC を操作してウェブを閲覧したり、ファイルを編集したり、プログラムを実行したり、Google Driveに接続したり、ネットショッピングをしたり、プレゼンや画像を生成したりと、複数のタスクを自動で処理することができます。

ChatGPT Agent でできること

ChatGPT Agent は、まるで自分専用のパソコンを持つアシスタントのような存在。指示を出すと、次のような操作を自動で行います:

  • テキストブラウザ:大量の Web ページを高速に読み取る
  • GUI ブラウザ:人間のようにクリックして Web 操作
  • ターミナル(Terminal):プログラム実行、データ解析、API 呼び出しなど
  • ImageGen ツール:イラストやプレゼン用ビジュアルの自動生成
  • ファイルツール:Excel 編集、PowerPoint 作成、Google Drive との連携など

例:自動で検索・比較・予約まで

たとえば、友人の結婚式に出席する準備を ChatGPT Agent に任せた場合、以下のように一連のタスクを自動で順番に処理します:

  1. 式場・日時・天気の検索
  2. ドレスコード・場所・天候に合った服装の提案
  3. GUI ブラウザでショッピングサイトにアクセス → 商品閲覧・価格比較
  4. 宿泊先の検索 → ホテルの比較と Booking.com の予約ページ提示
  5. プレゼント候補をリストアップ(リンク・価格付き)
  6. 最終的に、各ステップのスクリーンショット付きレポート形式でまとめる

このような操作はすべて ChatGPT の画面上でリアルタイムに見ることができるので、まるで自分の代わりにパソコンを操作してくれているかのような体験が可能です。

アプリとの連携でファイル操作&資料作成も

もう一つの事例として、Google Drive 内のファイルを読み取ってプレゼン資料を自動で作成するというものもあります。Agent は以下のように作業を進めます:

  1. Drive 内のドキュメントを読み込み、評価レポートを探す
  2. ターミナルでデータを分析・フィルタリング
  3. ImageGen でグラフやイラストを自動生成
  4. 最終的に PowerPoint 形式でダウンロード可能なプレゼン資料を出力

このプロセス中、ChatGPT が Google Drive にアクセスする様子や、画像生成で装飾されていく様子をリアルタイムで確認できます。

従来であれば、自分で資料を探し、内容を整理し、どんな構成にするか考え、画像まで作る必要がありましたが、それらをすべて AI が一括で実行してくれるのです。

使えるツールを自動で探し、実際に操作も

たとえば「オリジナルステッカーを作りたい」というケースでも、以下のようにChatGPT Agentが進行:

  1. ImageGen ツールでステッカー画像を作成
  2. ステッカー印刷サイト(例:Stickermule)を検索
  3. フォームにサイズ・素材・数量などを入力しカートに追加
  4. 最後の決済はセキュリティ上の理由で手動が必要

ツールを探すだけでなく、実際の操作も行うというのが大きな特徴です。

いつから使える?使用回数に制限はある?

OpenAI によると、ChatGPT Agent は米国時間 7 月 17 日に正式リリースされ、Pro プランのユーザーは 7 月 18 日中(日本時間)には使用可能になる予定とのこと。Plus/Team ユーザーも順次対応される見込みです。

プランごとの使用回数制限は以下の通り:

  • ChatGPT Proプラン:月間 400 回
  • ChatGPT Plus/Teamプラン:月間 40 回

まとめ:もう「会話だけの AI」じゃない

今回紹介した以外にも、Gmail と連携して最近のメール内容を抽出したり、Web 上で航空券を検索したりといった多用途な使い方が可能です。

要するに、これまで複数の手順が必要だった作業を、一度の指示で自動化できるのが ChatGPT Agent。

従来のように「文章を要約する」「文体を整える」だけでなく、より実務的なレベルで動ける AI へと進化しています。

これまでの GPTs のように細かい命令文を書かなくても、自然な指示でマルチステップの作業が実現できるのは、今後の AI 活用を大きく変える一歩になるでしょう。

更に面白いコンテンツを観たい人は、Instagram @applealmondjp をフォローしてください!

もっと読む

ChatGPT でピクセル風キャラを作ろう!Everskies 風ドット絵を簡単に楽しむ方法

ChatGPT のモデル、どれを選べばいい?最新「o3」「4o」「mini」など6種類の違いとおすすめ活用法まとめ

ChatGPT に「お願いします」「ありがとう」と言うと、OpenAI にコストがかかるって本当?

ChatGPT で自分の写真を「パワーパフガールズ」やアニメキャラ風に変身させる

愛麗絲