Claude や Google Gemini の強力な追い上げを受け、OpenAI は先日、新モデル「GPT-5.2」を発表し、対抗姿勢を鮮明にしました。GPT-5.2 は全体的な性能をさらに向上させるとともに、専門知識に関する能力も強化されています。また、利用シーンごとに最適化が施されており、プログラミング、法律、金融、科学研究といった専門的な業務に、より適した ChatGPT を目指しています。加えて、誤り(いわゆるハルシネーション)を抑制し、推論能力を高めることも重要な目標とされています。
現在、GPT-5.2 は有料ユーザー向けに段階的に提供が開始されています。同時に、従来の GPT-5.1 系列モデルも引き続き利用可能です。一方で、無料ユーザーはもうしばらく待つ必要があります。
GPT-5.2 は GPT-5 アーキテクチャにおける初の大規模アップデートであり、GPT-5 の上位進化版に位置づけられています。知識のカットオフは 2025 年 8 月末まで更新されており、推論力、正確性、ツール利用、多モーダル(テキスト+画像)機能のすべてが全面的に強化されています。
OpenAI は、GPT-5.2 が社内の「コードレッド(緊急事態)」体制下で加速的に開発された成果であることを強調しています。その目的は、Google Gemini 3 など競合モデルの急速な進歩に迅速に対応し、生成系 AI 分野における主導的地位を維持することです。
GPT-5.2 Instant
速度を最優先したモデルで、質問への即時回答、メール作成、翻訳、要約、クリエイティブな文章生成など、日常的なタスクに適しています。応答速度が非常に速く、コストも比較的低いため、リアルタイム性が求められる場面に向いています。
GPT-5.2 Thinking
深い思考を重視したモデルで、プログラミング、長文資料の分析、数学問題の解決、戦略立案、複数ステップにわたるプロジェクト管理など、複雑なタスク向けに設計されています。OpenAI 社内の専門能力ベンチマーク「GDPval」では、70%以上のタスクで人間の専門家を上回り、処理速度は人間の約 11 倍に達したとされています。
GPT-5.2 Pro
GPT-5.2 の最上位モデルであり、極めて高い正確性と信頼性を重視しています。法律文書のレビュー、金融分析、医療研究支援など、誤りが許されない専門的な利用シーンを想定しています。
GPT-5.2 では、事実を捏造したり、存在しない情報を引用したりするハルシネーションが、GPT-5.1 と比較して約 38%減少しています。その結果、出力内容の信頼性と構造化が大きく向上しました。
最大 40 万トークンのコンテキストを扱うことが可能で、数百ページに及ぶ文書、複数の契約書、大規模なコードベースを同時に処理できます。これにより、高い一貫性と正確性を維持したまま作業が行えます。
特に、数十万トークンにまたがる情報を統合し、深い文書分析を行う場面では、GPT-5.2 Thinking は GPT-5.1 Thinking を大きく上回る精度を示しています。また、4-needle MRCR テストにおいて、ほぼ 100%の正答率を達成した初のモデルでもあります。
GPT-5.2 Thinking では、図表の推論やソフトウェア UI の理解における誤りが約 50%減少しました。ダッシュボード、製品のスクリーンショット、技術図表、ビジュアルレポートなどをより正確に理解でき、金融、オペレーション、エンジニアリング、デザイン、カスタマーサポートといった、視覚情報に依存する業務を強力に支援します。
数学、科学、論理推論、多段階の問題解決において顕著な進化が見られ、研究、エンジニアリング、戦略分析に適しています。検索に頼れない大学院レベルの科学 QA ベンチマーク「GPQA Diamond」では、GPT-5.2 Pro が 93.2%、GPT-5.2 Thinking が 92.4%の正答率を記録しました。
また、専門家向け数学評価である FrontierMath(Tier 1~3)では、GPT-5.2 Thinking が 40.3%を達成し、新記録を打ち立てています。
テキストと画像を同時に入力できる多モーダル機能により、図表、スクリーンショット、手書きメモなどの解析が可能です。さらに、検索、計算、データベース、API などの外部ツールを活用し、複雑なワークフローを自動で完遂できるようになり、信頼性も一段と高まっています。
OpenAI の最新フラッグシップモデルである GPT-5.2 は、多くのベンチマークテストにおいて Claude Opus 4.5 や Gemini 3 Pro を上回り、再び最強クラスの AI としての地位を確立しました。特に「ソフトウェアエンジニアリング」「抽象推論」「知識労働タスク」の分野で、その差が顕著に表れています。
一方で、高度数学テストである FrontierMath の最難関 Tier 4 では、GPT-5.2 が 14.6%であったのに対し、Gemini は 18.8%を記録しました。この結果から、タスクの種類によって各モデルに得意分野が存在することも示されています。
ChatGPT Plus、Pro、Business、Enterprise プランの有料ユーザーは、即日より GPT-5.2(Instant/Thinking/Pro)を段階的に利用できます。旧モデルである GPT-5.1 も引き続き提供されますが、無料ユーザーは今後の開放を待つ必要があります。
さらに、ディズニーは OpenAI に対して 10 億ドルを投資し、3 年間にわたる戦略的パートナーシップを締結すると発表しました。Star Wars やマーベルを含む 200 以上のキャラクターを、OpenAI の動画生成ツール「Sora」で使用することを許諾しており、OpenAI がエンターテインメントおよびクリエイティブ分野での展開を強化していることがうかがえます。
もっと読む
初心者でも編集しやすくなります:Adobe の 3 大ツールが ChatGPT に統合されました