ChatGPTの“トークン”とは?API料金と制限を左右するトークンについて徹底解説


はじめに
生成AIブームの中心にいるChatGPTをビジネスに活用するとき、料金やモデル制限の基準となる「トークン」の存在を正しく理解することは欠かせません。
トークンは「文字」でも「単語」でもなく、モデル独自の分割単位であり、同じ文章でも言語や記号の使い方によって大きく変動します。
ChatGPTにおける「トークン」とは
トークンとは、モデル内部でテキストを処理しやすいように細切れにした最小単位です。
単語の途中で切れることもあれば、句読点や改行が独立したトークンとして扱われることもあります。
OpenAIのGPT系モデルはBPE(Byte Pair Encoding)という手法を採用しており、この手法では頻出する文字列をまとめて1トークンに圧縮するため、英語よりも文字バリエーションの多い日本語は一般にトークン数が多くなる傾向があります。
例えば「AI」は1トークンで済む場合がありますが、「人工知能」は3~4トークンに分割されることが珍しくありません。
こうした違いを意識せずにプロンプトを設計すると、思わぬコスト増や最大トークン制限オーバーにつながるため注意が必要です。
トークンの粒度を具体的に体感するには、後述するアナライザの活用が最も手早い手段となります。

トークンがコストと制限に与える影響
ChatGPT APIの料金は「入力トークン+出力トークン」の合計に単価を掛け合わせて算出されます。
たとえばGPT-4.1の場合、2025年8月時点で1,000,000トークンあたりおよそ2.00ドル(入力)と8.00ドル(出力)がかかります。
さらに各モデルにはコンテキストウィンドウといわれる「入力できる最大のトークン数」が設定されており、GPT-4.1なら1,000,000トークンまで入力できます。一方でこの上限を超えるとリクエストが失敗するため、長い会話履歴を送る際は要約するなどの工夫が求められます。
より具体的な料金シミュレーションは 生成AIのコスト見積もり完全ガイド にて解説しています。
トークン数と応答速度への影響
トークン数は、ChatGPTがテキストを処理する際の計算量にも直結します。
入力トークンが多ければ多いほどモデルはより長くテキストをエンコードし、出力トークンが増えるほどデコーディング処理にも時間がかかります。
そのため、トークン数が増加すると応答までの待ち時間(レイテンシー)が伸びる傾向があります。
多くの生成AIチャットボットでは、そのスレッド内の会話履歴を全てモデルに入力します。したがって会話のターン数に応じて徐々に応答に時間がかかることもあるため、少しレスポンスが遅いと感じた時は、新たなスレッドで会話を始めると良いでしょう。
OpenAI公式のトークン数の計算ツール
OpenAI社 が Web上で無料公開している Tokenizer を通じ、モデル別のトークン分割結果と合計数を即座に確認できる環境を用意しています。
このツールの内部では tiktoken というトークン分割のライブラリを用いたBPEエンコードが実行されており、APIと同一のロジックで計算されています。
以下の画像は GPT-4o とGPT-4o mini の場合のトークナイズの結果です。データには弊社の情報セキュリティ方針のドキュメントを入れています。479文字の日本語に対して、394トークンという結果が表示されていることが分かります。

トークンの構成要素
ChatGPTに送るテキストは、いくつかの部分に分かれてトークンとしてカウントされます。
システムプロンプト
システムプロンプトは、最初にモデルに渡す指示文で、回答の口調や動作を決める役割などを担います。
ENSOUチャットボットでは以下のような画面で編集できます。ChatGPT や Gemini などでも同様の機能が、 GPTs 、 Projects 、 Gems などの形式で提供されています。

ユーザープロンプト
ユーザープロンプトは、実際にユーザーが入力する文章です。
ENSOUチャットボットの場合はチャット画面の下部から入力するメッセージがユーザープロンプトに該当します。

会話履歴
会話履歴は、そのチャット画面上でやり取りされた、ユーザー入力と生成AIの回答のすべてのテキストの事を指します。
アプリケーションによっては過去のやり取りを要約したり、直近のいくつかのメッセージに絞って送信する機能などもありますが、過去のやり取りがそのまま使われることもあり、消費するトークン数としては非常に大きくなる可能性がある要素です。

メモリー
メモリー機能は ChatGPT などで提供されている機能であり、自身のプロフィールなどの情報を以前のやり取りを元に保存しており、必要に応じて呼び出してコンテキストに加えられ、トークンとして消費されます。
まとめ
トークンは ChatGPT の料金と性能を左右する最重要パラメータであり、言語や表現方法によって大きく変動します。
本記事で紹介した公式Tokenizerを活用すれば、プロンプト作成の段階でトークン消費を可視化しながら調整できます。
株式会社Digeon は法人向けに ChatGPT をセキュアに使えるサービスである「ENSOUチャットボット」を提供しています。
ご相談、無料トライアルは、以下からお問い合わせください👇
サービス紹介資料をこちらからダウンロードいただけます👇