2026年3月7日

GPT-5.4とは?性能・料金・新機能を徹底解説

GPT-5.4の性能・料金・新機能を解説。ベンチマーク比較表・グラフ、API料金、Computer Use・Tool Search等の新機能を網羅

石塚芽衣
石塚芽衣
マーケティング
カテゴリ:AIニュース
GPT-5.4とは?性能・料金・新機能を徹底解説

2026年3月5日、OpenAIは最新のフロンティアモデル「GPT-5.4」をリリースしました。コーディング・推論・エージェントワークフロー・コンピュータ操作を1つのモデルに統合した、同社史上もっとも高性能なモデルです。本記事ではGPT-5.4の性能、料金、新機能を解説します。

GPT-5.4の概要

GPT-5.4はOpenAIが2026年3月5日に発表したフロンティアモデルです。前モデルのGPT-5.2から推論能力・コーディング能力・エージェント機能が大幅に強化されています。

最大の特徴は、これまで別々のモデルやツールで対応していた「推論」「コーディング」「Web検索」「コンピュータ操作」を1つのモデルに統合した点です。ChatGPTのPlus、Pro、Team、Enterprise、Eduプランで利用できるほか、APIからも呼び出せます。

コンテキストウィンドウは最大100万トークンに対応しており、大規模なコードベースや長文ドキュメントの処理が可能です。入力はテキストと画像の両方に対応し、画像処理では最大1,024万ピクセルの高解像度モードが追加されています。

¥GPT-5.2からの主な性能向上

GPT-5.4はGPT-5.2と比較して、複数のベンチマークで大幅なスコア向上を示しています。

ベンチマーク

GPT-5.2

GPT-5.4

向上幅

GDPval(専門知識ワーク)

70.9%

83.0%

+12.1pt

OSWorld(デスクトップ操作)

47.3%

75.0%

+27.7pt

BrowseComp(Web検索)

65.8%

82.7%

+16.9pt

ARC-AGI-2(抽象推論)

52.9%

73.3%

+20.4pt

SWE-Bench Pro(コーディング)

55.6%

57.7%

+2.1pt

スプレッドシートモデリング

68.4%

87.3%

+18.9pt

GPT-5.4 vs GPT-5.2 ベンチマーク比較グラフ
GPT-5.2とGPT-5.4の主要ベンチマークスコアを棒グラフで比較。OSWorldとARC-AGI-2で20pt以上の大幅向上が確認できる

特筆すべきはOSWorld-Verifiedの結果です。デスクトップ環境をスクリーンショットとキーボード・マウス操作でナビゲートする能力を測るこのベンチマークで、GPT-5.4は75.0%を記録しました。人間のパフォーマンス(72.4%)を初めて上回ったモデルとなっています。

コーディング能力(SWE-Bench Pro)の向上幅は+2.1ptと控えめですが、これはGPT-5.2の時点で既に高い水準にあったためです。一方で、投資銀行のアナリストが行うようなスプレッドシートモデリングタスクでは87.3%と、GPT-5.2の68.4%から約19ポイントの大幅改善を見せています。

ハルシネーション(事実と異なる回答の生成)についても改善が報告されています。GPT-5.2と比較して、個々の主張が誤っている確率は33%低下し、回答全体にエラーが含まれる確率は18%低下しています。

GPT-5.2からの向上幅
ベンチマークごとの向上幅。OSWorldの+27.7ptが最大で、SWE-Benchの+2.1ptが最小

これらのベンチマーク結果から、GPT-5.4はコーディング以上に「実務での知識作業」と「エージェント的な操作」で大きな飛躍を遂げたモデルと言えるでしょう。

注目の新機能

GPT-5.4では3つの注目機能が追加されています。

Computer Use(コンピュータ操作) は、AIがデスクトップ画面のスクリーンショットを認識し、キーボードやマウスを操作してタスクを実行する機能です。ファイルの整理、アプリケーション間のデータ転記、定型的なPC操作の自動化などが可能になります。前述の通り、OSWorld-Verifiedでは人間を上回る75.0%のスコアを記録しています。

OpenAI公式ブログでも、この機能が実務にどう影響するかが詳しく解説されています。

Tool Search は、APIで利用可能なツール定義の読み込みを最適化する仕組みです。従来のモデルでは、利用可能なすべてのツール定義をプロンプトに含める必要がありました。GPT-5.4のTool Searchでは、必要なツールだけをオンデマンドで読み込むため、トークン使用量を47%削減しながら精度を維持できます。多数のMCPサーバーやAPIを接続するエージェント開発において、コスト削減と応答速度の改善が期待されます。

Thinking(思考プレビュー) は、複雑なリクエストに対してモデルが計画を立て、その概要をユーザーに提示する機能です。ユーザーは処理の方向性を確認してから続行できるため、意図と異なる方向に長時間の処理が走るリスクを減らせます。

これらの機能は法人でのAI活用にも直結します。特にComputer UseとTool Searchは、社内業務の自動化やエージェント構築の選択肢を広げる機能と言えるでしょう。

ENSOU AIでも最新モデルへの対応を順次進めています。GPT-5.4の性能を業務で活用する方法については、以下の記事もご参照ください。

ChatGPT for Excelの同時発表

GPT-5.4と同時に「ChatGPT for Excel」がベータ版として発表されました。ExcelのアドインとしてChatGPTをワークブック内に直接組み込み、テキストプロンプトでモデルの構築・更新・分析を実行できます。

数式を手書きする代わりに自然言語で指示するだけでスプレッドシートを操作でき、大規模なワークブックのレビュー、シート間の接続関係の把握、数式エラーのトレースなども可能です。GPT-5.4のスプレッドシートモデリング能力(87.3%)がこの機能を支えています。

さらに、FactSet、Dow Jones Factiva、LSEG、S&P Global、Moody'sなどの金融データプロバイダーとの連携も発表されています。金融・投資領域での分析業務がChatGPT上で完結する世界に一歩近づいたと言えるでしょう。

現時点ではChatGPT Business、Enterprise、Edu、Pro、Plusユーザー向けに米国・カナダ・オーストラリアで提供されています。Google Sheets対応も近日予定とされています。

※ChatGPT for Excelの対応地域・プランは本記事執筆時点での情報です。最新の情報は各公式サイトをご確認ください。

料金とプラン

GPT-5.4のAPI料金は以下の通りです。

モデル

入力

キャッシュ入力

出力

GPT-5.4

$2.50/100万トークン

$0.25/100万トークン

$15.00/100万トークン

GPT-5.4 Pro

$30.00/100万トークン

-

$180.00/100万トークン

GPT-5.2(参考)

$1.75/100万トークン

-

$14.00/100万トークン

GPT-5.4 API料金比較
GPT-5.2・GPT-5.4・GPT-5.4 Proの入力・出力料金を横棒グラフで比較。Proの出力料金$180が突出している

GPT-5.4の標準版はGPT-5.2と比較して入力が約43%、出力が約7%の値上がりですが、ハルシネーションの低減やエージェント機能の追加を考慮すると、実務での費用対効果は向上していると考えられます。

GPT-5.4 Proは標準版の12倍の料金設定です。ARC-AGI-2で83.3%(標準版73.3%)、BrowseCompで89.3%(標準版82.7%)と、抽象推論や高度な検索タスクではProが優位です。ただし、GDPval(専門知識ワーク)では標準版がProを上回るスコアを記録しており、すべてのタスクでProが優れているわけではありません。

一般的な業務利用であれば標準版のGPT-5.4で十分な性能が得られるでしょう。研究開発や高度な推論を必要とするユースケースに限り、GPT-5.4 Proの利用を検討する形が合理的です。

ChatGPTのプラン別では、Plus(月額$20)、Team(月額$25/ユーザー)、Pro(月額$200)、Enterprise、Eduの各プランでGPT-5.4 Thinkingが利用可能です。なお、GPT-5.2は2026年6月5日に廃止予定とされています。

※料金等は本記事執筆時点での情報です。最新の情報は各公式サイトをご確認ください。

まとめ

GPT-5.4はOpenAIの最新フロンティアモデルとして、推論・コーディング・エージェント機能・コンピュータ操作を1つに統合しました。特にデスクトップ操作(OSWorld 75.0%、人間超え)と専門知識ワーク(GDPval 83.0%)での性能向上が際立っています。

Tool Searchによるトークン削減やComputer Useの実用化は、企業でのAIエージェント活用に新たな可能性をもたらします。一方でAPI料金はGPT-5.2から若干上昇しており、ユースケースに応じてモデルを使い分ける判断が引き続き重要です。

組織で生成AIを導入するならENSOU AI

株式会社Digeon では法人向けAIエージェントのファーストステップに最適なサービスである「ENSOU AI」を提供しています。

無料ですぐに使えるフリープランのご利用開始はこちらから👇

サービス紹介資料をこちらからダウンロードいただけます👇

ご相談、無料トライアルは、以下からお問い合わせください👇

あわせて読む

フリープラン

今すぐ無料で始める

クレジットカード登録・申込不要。今すぐ始められます。

メールアドレスのみで今すぐ始められます!
無料で始める
お問い合わせ
無料でRAG構築ができる
無料で使えるプロンプトテンプレート多数
無料でGPT-5.1が使える

NEW

最新記事

GPT-5.4とは?性能・料金・新機能を徹底解説

ブログ

GPT-5.4とは?性能・料金・新機能を徹底解説

GPT-5.4の性能・料金・新機能を解説。ベンチマーク比較表・グラフ、API料金、Computer Use・Tool Search等の新機能を網羅

2026/03/07詳細を見る
Gemini 3.1 Flash-Liteとは?性能・料金を解説

ブログ

Gemini 3.1 Flash-Liteとは?性能・料金を解説

Gemini 3.1 Flash-Liteの性能・料金・活用シーンを公式情報をもとに解説。前世代比45%高速化、入力$0.25/100万トークンの低コストモデルの使いどころがわかります。

2026/03/03詳細を見る
GitHub Copilot CLIとは?機能・料金・使い方

ブログ

GitHub Copilot CLIとは?機能・料金・使い方

GitHub Copilot CLIの機能・料金プラン・インストール方法を解説。Claude Codeとの違いや、チーム規模・予算別の選び方も整理しています。

2026/03/03詳細を見る
Gemini 3.1 Pro が登場 : 推論能力とコーディング能力が大幅に向上

ブログ

Gemini 3.1 Pro が登場 : 推論能力とコーディング能力が大幅に向上

2026年2月19日にGoogleよりGeminiの新型モデルであるGemini 3.1 Proがリリースされました。何が進化したのか、実際に使用してみてどうなのかなど徹底解説します!

2026/02/21詳細を見る
Excelファイル作成比較! CopilotChat vs ENSOU AI

ブログ

Excelファイル作成比較! CopilotChat vs ENSOU AI

Microsoft社の手がけるCopilotChatとENSOU AIをどちらがより優れたExcelファイルを作成できるのかという点で徹底比較します!

2026/02/21詳細を見る
Claude Sonnet 4.6 がリリース : 実務で使えるほど優秀なのか実力検証!!

ブログ

Claude Sonnet 4.6 がリリース : 実務で使えるほど優秀なのか実力検証!!

2026年2月17日にAnthropic社よりClaudeの新モデルとしてClaude Sonnet 4.6がリリースされました。フリープランでも使用することが可能です。 Claude Sonnet 4.6の概要の説明から検証まで徹底解説します!

2026/02/21詳細を見る