2026年3月7日

GPT-5.4とは？性能・料金・新機能を徹底解説

GPT-5.4の性能・料金・新機能を解説。ベンチマーク比較表・グラフ、API料金、Computer Use・Tool Search等の新機能を網羅

石塚芽衣

マーケティング

2026年3月5日、OpenAIは最新のフロンティアモデル「GPT-5.4」をリリースしました。コーディング・推論・エージェントワークフロー・コンピュータ操作を1つのモデルに統合した、同社史上もっとも高性能なモデルです。本記事ではGPT-5.4の性能、料金、新機能を解説します。

GPT-5.4の概要

GPT-5.4はOpenAIが2026年3月5日に発表したフロンティアモデルです。前モデルのGPT-5.2から推論能力・コーディング能力・エージェント機能が大幅に強化されています。

最大の特徴は、これまで別々のモデルやツールで対応していた「推論」「コーディング」「Web検索」「コンピュータ操作」を1つのモデルに統合した点です。ChatGPTのPlus、Pro、Team、Enterprise、Eduプランで利用できるほか、APIからも呼び出せます。

コンテキストウィンドウは最大100万トークンに対応しており、大規模なコードベースや長文ドキュメントの処理が可能です。入力はテキストと画像の両方に対応し、画像処理では最大1,024万ピクセルの高解像度モードが追加されています。

¥GPT-5.2からの主な性能向上

GPT-5.4はGPT-5.2と比較して、複数のベンチマークで大幅なスコア向上を示しています。

ベンチマーク	GPT-5.2	GPT-5.4	向上幅
GDPval（専門知識ワーク）	70.9%	83.0%	+12.1pt
OSWorld（デスクトップ操作）	47.3%	75.0%	+27.7pt
BrowseComp（Web検索）	65.8%	82.7%	+16.9pt
ARC-AGI-2（抽象推論）	52.9%	73.3%	+20.4pt
SWE-Bench Pro（コーディング）	55.6%	57.7%	+2.1pt
スプレッドシートモデリング	68.4%	87.3%	+18.9pt

GPT-5.4 vs GPT-5.2 ベンチマーク比較グラフ — GPT-5.2とGPT-5.4の主要ベンチマークスコアを棒グラフで比較。OSWorldとARC-AGI-2で20pt以上の大幅向上が確認できる

特筆すべきはOSWorld-Verifiedの結果です。デスクトップ環境をスクリーンショットとキーボード・マウス操作でナビゲートする能力を測るこのベンチマークで、GPT-5.4は75.0%を記録しました。人間のパフォーマンス（72.4%）を初めて上回ったモデルとなっています。

コーディング能力（SWE-Bench Pro）の向上幅は+2.1ptと控えめですが、これはGPT-5.2の時点で既に高い水準にあったためです。一方で、投資銀行のアナリストが行うようなスプレッドシートモデリングタスクでは87.3%と、GPT-5.2の68.4%から約19ポイントの大幅改善を見せています。

ハルシネーション（事実と異なる回答の生成）についても改善が報告されています。GPT-5.2と比較して、個々の主張が誤っている確率は33%低下し、回答全体にエラーが含まれる確率は18%低下しています。

GPT-5.2からの向上幅 — ベンチマークごとの向上幅。OSWorldの+27.7ptが最大で、SWE-Benchの+2.1ptが最小

これらのベンチマーク結果から、GPT-5.4はコーディング以上に「実務での知識作業」と「エージェント的な操作」で大きな飛躍を遂げたモデルと言えるでしょう。

注目の新機能

GPT-5.4では3つの注目機能が追加されています。

Computer Use（コンピュータ操作） は、AIがデスクトップ画面のスクリーンショットを認識し、キーボードやマウスを操作してタスクを実行する機能です。ファイルの整理、アプリケーション間のデータ転記、定型的なPC操作の自動化などが可能になります。前述の通り、OSWorld-Verifiedでは人間を上回る75.0%のスコアを記録しています。

OpenAI公式ブログでも、この機能が実務にどう影響するかが詳しく解説されています。

https://openai.com/index/introducing-gpt-5-4

openai.com

Tool Search は、APIで利用可能なツール定義の読み込みを最適化する仕組みです。従来のモデルでは、利用可能なすべてのツール定義をプロンプトに含める必要がありました。GPT-5.4のTool Searchでは、必要なツールだけをオンデマンドで読み込むため、トークン使用量を47%削減しながら精度を維持できます。多数のMCPサーバーやAPIを接続するエージェント開発において、コスト削減と応答速度の改善が期待されます。

Thinking（思考プレビュー） は、複雑なリクエストに対してモデルが計画を立て、その概要をユーザーに提示する機能です。ユーザーは処理の方向性を確認してから続行できるため、意図と異なる方向に長時間の処理が走るリスクを減らせます。

これらの機能は法人でのAI活用にも直結します。特にComputer UseとTool Searchは、社内業務の自動化やエージェント構築の選択肢を広げる機能と言えるでしょう。

ENSOU AIでも最新モデルへの対応を順次進めています。GPT-5.4の性能を業務で活用する方法については、以下の記事もご参照ください。

OpenAIモデル一覧と選び方【2026年1月版】 | AIエージェント活用ノウハウ | ENSOU

OpenAIモデルを順に解説。GPT-5系/音声/画像/動画/embedding/モデレーションまで一覧でご紹介します。法人向けAIエージェントサービスの導入・活用に関する実践的な情報をお届けします。

ensou.app

ChatGPT for Excelの同時発表

GPT-5.4と同時に「ChatGPT for Excel」がベータ版として発表されました。ExcelのアドインとしてChatGPTをワークブック内に直接組み込み、テキストプロンプトでモデルの構築・更新・分析を実行できます。

数式を手書きする代わりに自然言語で指示するだけでスプレッドシートを操作でき、大規模なワークブックのレビュー、シート間の接続関係の把握、数式エラーのトレースなども可能です。GPT-5.4のスプレッドシートモデリング能力（87.3%）がこの機能を支えています。

さらに、FactSet、Dow Jones Factiva、LSEG、S&P Global、Moody'sなどの金融データプロバイダーとの連携も発表されています。金融・投資領域での分析業務がChatGPT上で完結する世界に一歩近づいたと言えるでしょう。

現時点ではChatGPT Business、Enterprise、Edu、Pro、Plusユーザー向けに米国・カナダ・オーストラリアで提供されています。Google Sheets対応も近日予定とされています。

※ChatGPT for Excelの対応地域・プランは本記事執筆時点での情報です。最新の情報は各公式サイトをご確認ください。

料金とプラン

GPT-5.4のAPI料金は以下の通りです。

モデル	入力	キャッシュ入力	出力
GPT-5.4	$2.50/100万トークン	$0.25/100万トークン	$15.00/100万トークン
GPT-5.4 Pro	$30.00/100万トークン	-	$180.00/100万トークン
GPT-5.2（参考）	$1.75/100万トークン	-	$14.00/100万トークン

GPT-5.4 API料金比較 — GPT-5.2・GPT-5.4・GPT-5.4 Proの入力・出力料金を横棒グラフで比較。Proの出力料金$180が突出している

GPT-5.4の標準版はGPT-5.2と比較して入力が約43%、出力が約7%の値上がりですが、ハルシネーションの低減やエージェント機能の追加を考慮すると、実務での費用対効果は向上していると考えられます。

GPT-5.4 Proは標準版の12倍の料金設定です。ARC-AGI-2で83.3%（標準版73.3%）、BrowseCompで89.3%（標準版82.7%）と、抽象推論や高度な検索タスクではProが優位です。ただし、GDPval（専門知識ワーク）では標準版がProを上回るスコアを記録しており、すべてのタスクでProが優れているわけではありません。

一般的な業務利用であれば標準版のGPT-5.4で十分な性能が得られるでしょう。研究開発や高度な推論を必要とするユースケースに限り、GPT-5.4 Proの利用を検討する形が合理的です。

ChatGPTのプラン別では、Plus（月額$20）、Team（月額$25/ユーザー）、Pro（月額$200）、Enterprise、Eduの各プランでGPT-5.4 Thinkingが利用可能です。なお、GPT-5.2は2026年6月5日に廃止予定とされています。

※料金等は本記事執筆時点での情報です。最新の情報は各公式サイトをご確認ください。