2025年8月1日

ChatGPTの“トークン”とは？API料金と制限を左右するトークンについて徹底解説

ChatGPTの「トークン」とは？本記事ではトークンの仕組み、API料金や最大制限との関係、公式トークンアナライザの使い方までを徹底解説。プロンプト設計とコスト最適化に役立つ情報をお届けします。

山﨑祐太

代表取締役

カテゴリ：AIツール

ChatGPTの“トークン”とは？API料金と制限を左右するトークンについて徹底解説

はじめに

生成AIブームの中心にいるChatGPTをビジネスに活用するとき、料金やモデル制限の基準となる「トークン」の存在を正しく理解することは欠かせません。

トークンは「文字」でも「単語」でもなく、モデル独自の分割単位であり、同じ文章でも言語や記号の使い方によって大きく変動します。

ChatGPTにおける「トークン」とは

トークンとは、モデル内部でテキストを処理しやすいように細切れにした最小単位です。

単語の途中で切れることもあれば、句読点や改行が独立したトークンとして扱われることもあります。

OpenAIのGPT系モデルはBPE（Byte Pair Encoding）という手法を採用しており、この手法では頻出する文字列をまとめて１トークンに圧縮するため、英語よりも文字バリエーションの多い日本語は一般にトークン数が多くなる傾向があります。

例えば「AI」は１トークンで済む場合がありますが、「人工知能」は３～４トークンに分割されることが珍しくありません。

こうした違いを意識せずにプロンプトを設計すると、思わぬコスト増や最大トークン制限オーバーにつながるため注意が必要です。

トークンの粒度を具体的に体感するには、後述するアナライザの活用が最も手早い手段となります。

トークンがコストと制限に与える影響

ChatGPT APIの料金は「入力トークン＋出力トークン」の合計に単価を掛け合わせて算出されます。

たとえばGPT-4.1の場合、2025年8月時点で1,000,000トークンあたりおよそ2.00ドル（入力）と8.00ドル（出力）がかかります。

さらに各モデルにはコンテキストウィンドウといわれる「入力できる最大のトークン数」が設定されており、GPT-4.1なら1,000,000トークンまで入力できます。一方でこの上限を超えるとリクエストが失敗するため、長い会話履歴を送る際は要約するなどの工夫が求められます。

より具体的な料金シミュレーションは生成AIのコスト見積もり完全ガイドにて解説しています。

トークン数と応答速度への影響

トークン数は、ChatGPTがテキストを処理する際の計算量にも直結します。

入力トークンが多ければ多いほどモデルはより長くテキストをエンコードし、出力トークンが増えるほどデコーディング処理にも時間がかかります。

そのため、トークン数が増加すると応答までの待ち時間（レイテンシー）が伸びる傾向があります。

多くの生成AIチャットボットでは、そのスレッド内の会話履歴を全てモデルに入力します。したがって会話のターン数に応じて徐々に応答に時間がかかることもあるため、少しレスポンスが遅いと感じた時は、新たなスレッドで会話を始めると良いでしょう。

OpenAI公式のトークン数の計算ツール

OpenAI社が Web上で無料公開している Tokenizer を通じ、モデル別のトークン分割結果と合計数を即座に確認できる環境を用意しています。

このツールの内部では tiktoken というトークン分割のライブラリを用いたBPEエンコードが実行されており、APIと同一のロジックで計算されています。

以下の画像は GPT-4o とGPT-4o mini の場合のトークナイズの結果です。データには弊社の情報セキュリティ方針のドキュメントを入れています。479文字の日本語に対して、394トークンという結果が表示されていることが分かります。

トークンの構成要素

ChatGPTに送るテキストは、いくつかの部分に分かれてトークンとしてカウントされます。

システムプロンプト

システムプロンプトは、最初にモデルに渡す指示文で、回答の口調や動作を決める役割などを担います。

ENSOUチャットボットでは以下のような画面で編集できます。ChatGPT や Gemini などでも同様の機能が、 GPTs 、 Projects 、 Gems などの形式で提供されています。

ユーザープロンプト

ユーザープロンプトは、実際にユーザーが入力する文章です。

ENSOUチャットボットの場合はチャット画面の下部から入力するメッセージがユーザープロンプトに該当します。

会話履歴

会話履歴は、そのチャット画面上でやり取りされた、ユーザー入力と生成AIの回答のすべてのテキストの事を指します。

アプリケーションによっては過去のやり取りを要約したり、直近のいくつかのメッセージに絞って送信する機能などもありますが、過去のやり取りがそのまま使われることもあり、消費するトークン数としては非常に大きくなる可能性がある要素です。

メモリー

メモリー機能は ChatGPT などで提供されている機能であり、自身のプロフィールなどの情報を以前のやり取りを元に保存しており、必要に応じて呼び出してコンテキストに加えられ、トークンとして消費されます。

まとめ

トークンは ChatGPT の料金と性能を左右する最重要パラメータであり、言語や表現方法によって大きく変動します。

本記事で紹介した公式Tokenizerを活用すれば、プロンプト作成の段階でトークン消費を可視化しながら調整できます。

株式会社Digeon は法人向けに ChatGPT をセキュアに使えるサービスである「ENSOUチャットボット」を提供しています。

ご相談、無料トライアルは、以下からお問い合わせください👇

導入相談・無料トライアル申込み | ENSOU App

ENSOU App（エンソウアップ）は、現場のExcelファイルを渡すだけでAIエージェントがネイティブに動作するノーコードAIアプリです。アプリ設計や操作方法の習得は不要で、チャットに日本語で指示するだけで、データの登録・更新・集計・分析・PDF読み取り・レポート作成・定期業務の再実行までAIエージェントが完遂します。

ensou.app

サービス紹介資料をこちらからダウンロードいただけます👇