日本時間の 7 月 18 日、OpenAI は新機能「ChatGPT Agent」を正式に発表しました。これまでのような対話型・生成型 AI とは異なり、ChatGPT が実際に作業を“代行”してくれる本格的な AI アシスタントへと進化します。
更に面白いコンテンツを観たい人は、Instagram @applealmondjp をフォローしてください!
ChatGPT Agent は、OpenAI が新たに提供する高度な AI アシスタントモードです。これまでのように「会話」するだけでなく、仮想 PC を操作してウェブを閲覧したり、ファイルを編集したり、プログラムを実行したり、Google Driveに接続したり、ネットショッピングをしたり、プレゼンや画像を生成したりと、複数のタスクを自動で処理することができます。
ChatGPT Agent は、まるで自分専用のパソコンを持つアシスタントのような存在。指示を出すと、次のような操作を自動で行います:
たとえば、友人の結婚式に出席する準備を ChatGPT Agent に任せた場合、以下のように一連のタスクを自動で順番に処理します:
このような操作はすべて ChatGPT の画面上でリアルタイムに見ることができるので、まるで自分の代わりにパソコンを操作してくれているかのような体験が可能です。
もう一つの事例として、Google Drive 内のファイルを読み取ってプレゼン資料を自動で作成するというものもあります。Agent は以下のように作業を進めます:
このプロセス中、ChatGPT が Google Drive にアクセスする様子や、画像生成で装飾されていく様子をリアルタイムで確認できます。
従来であれば、自分で資料を探し、内容を整理し、どんな構成にするか考え、画像まで作る必要がありましたが、それらをすべて AI が一括で実行してくれるのです。
たとえば「オリジナルステッカーを作りたい」というケースでも、以下のようにChatGPT Agentが進行:
ツールを探すだけでなく、実際の操作も行うというのが大きな特徴です。
OpenAI によると、ChatGPT Agent は米国時間 7 月 17 日に正式リリースされ、Pro プランのユーザーは 7 月 18 日中(日本時間)には使用可能になる予定とのこと。Plus/Team ユーザーも順次対応される見込みです。
プランごとの使用回数制限は以下の通り:
今回紹介した以外にも、Gmail と連携して最近のメール内容を抽出したり、Web 上で航空券を検索したりといった多用途な使い方が可能です。
要するに、これまで複数の手順が必要だった作業を、一度の指示で自動化できるのが ChatGPT Agent。
従来のように「文章を要約する」「文体を整える」だけでなく、より実務的なレベルで動ける AI へと進化しています。
これまでの GPTs のように細かい命令文を書かなくても、自然な指示でマルチステップの作業が実現できるのは、今後の AI 活用を大きく変える一歩になるでしょう。
更に面白いコンテンツを観たい人は、Instagram @applealmondjp をフォローしてください!
もっと読む
ChatGPT でピクセル風キャラを作ろう!Everskies 風ドット絵を簡単に楽しむ方法
ChatGPT のモデル、どれを選べばいい?最新「o3」「4o」「mini」など6種類の違いとおすすめ活用法まとめ