Claude 4 シリーズが正式発表!Opus 4・Sonnet 4 が AI エージェントの性能を大幅強化

Claude 4 シリーズが正式発表!Opus 4・Sonnet 4 が AI エージェントの性能を大幅強化

AI スタートアップの Anthropic は、米国時間 5 月 22 日に初の開発者イベント「Code with Claude」を開催し、新世代の Claude 4 シリーズモデルを正式発表しました。

ラインナップには、最上位モデル「Claude Opus 4」と、強化された進化版「Claude Sonnet 4」が含まれ、コード生成、推論、インテリジェント・エージェントの分野で大幅な性能向上を実現しています。

更に面白いコンテンツを観たい人は、Instagram @applealmondjp をフォローしてください!

Claude Opus 4:最高峰の AI コードアシスタント

Anthropic によると、Claude Opus 4 は現時点で世界最強の AI コード生成モデルと位置づけられています。

実際に、SWE-bench(72.5%)や Terminal-bench(43.2%)といったベンチマークテストで他のモデルを上回る結果を記録。

主な特徴:

  • 複雑で長時間にわたるエージェントタスクへの対応力
  • ローカルメモリ機能を活用し、ユーザーの許可があれば重要ファイルの内容を記憶して継続的な開発作業を支援
  • 論理的一貫性と長期記憶を両立し、高度な推論をサポート

▲ Claude 4 在基準測試 SWE-bench Verified 處於領先地位。

Claude Sonnet 4:無料でも使える高性能モデル

Sonnet 4 は、前世代の Sonnet 3.7 からの大規模アップグレード版で、プログラミング能力と複雑なプロンプトへの対応力が大きく向上しました。
特に、GitHub からの高評価を得ており、Copilot のコアエンジンとしても活用される予定です。

無料で利用可能:

  • Claude Sonnet 4 は無料ユーザーでも利用可能となっており、開発者が高度な AI 機能に気軽にアクセスできる環境が整いました。

新機能「思考サマリー(Thinking Summaries)」:計算コストを5%に削減

▲ Claude 4 在編碼、推理、多模態功能和代理任務表現出色。

Claude 4 シリーズには、新たに「思考サマリー(Thinking Summaries)」という機能が搭載されました。

これは、大きなモデルが長時間をかけて行う推論過程を、軽量モデルがわずか 5% の計算量で要約・抽出できるというもの。

この機能により、大規模タスクにおける速度と精度の両方が向上し、コスト効率の良いAIエージェント構築が可能になります。

Opus 4 の応用例:ポケモンゲームを「プレイ」してメモと戦略を生成

Opus 4 實際玩 Pokémon 遊戲

Opus 4 は実際にポケモンゲームをプレイし、ゲームの内容を記録・要約しながら戦略を立てるといった使い方も披露。この実験では、AI が環境の変化に柔軟に対応しながらタスクを遂行できることが示されました。

複数プラットフォームに対応、価格は据え置き

Claude Opus 4 および Sonnet 4 は、以下のプラットフォームで利用可能:

  • Anthropic API
  • Amazon Bedrock
  • Google Cloud Vertex AI

利用料金(据え置き):

モデル名 入力 100万トークン 出力 100万トークン
Opus 4 $15 $75
Sonnet 4 $3 $15

また、Claude Pro/Max/Team/Enterpriseなどの各種サブスクリプションでも利用可能で、個人開発者から企業規模まで幅広く対応しています。

更に面白いコンテンツを観たい人は、Instagram @applealmondjp をフォローしてください!

もっと読む

Claude 2 完全ガイド:ChatGPT と並ぶ使い心地を体感せよ!

Google Gemini、ついに進化!AI の新機能「Canvas」と「Voice Overview」が登場

iPhone の Safari で ChatGPT をデフォルト検索エンジンに設定する方法