2025年8月1日

ChatGPTの“トークン”とは?API料金と制限を左右するトークンについて徹底解説

ChatGPTの「トークン」とは?本記事ではトークンの仕組み、API料金や最大制限との関係、公式トークンアナライザの使い方までを徹底解説。プロンプト設計とコスト最適化に役立つ情報をお届けします。

山﨑祐太
山﨑祐太
代表取締役
カテゴリ:AIツール
ChatGPTの“トークン”とは?API料金と制限を左右するトークンについて徹底解説

はじめに

生成AIブームの中心にいるChatGPTをビジネスに活用するとき、料金やモデル制限の基準となる「トークン」の存在を正しく理解することは欠かせません。

トークンは「文字」でも「単語」でもなく、モデル独自の分割単位であり、同じ文章でも言語や記号の使い方によって大きく変動します。

ChatGPTにおける「トークン」とは

トークンとは、モデル内部でテキストを処理しやすいように細切れにした最小単位です。

単語の途中で切れることもあれば、句読点や改行が独立したトークンとして扱われることもあります。

OpenAIのGPT系モデルはBPE(Byte Pair Encoding)という手法を採用しており、この手法では頻出する文字列をまとめて1トークンに圧縮するため、英語よりも文字バリエーションの多い日本語は一般にトークン数が多くなる傾向があります。

例えば「AI」は1トークンで済む場合がありますが、「人工知能」は3~4トークンに分割されることが珍しくありません。

こうした違いを意識せずにプロンプトを設計すると、思わぬコスト増や最大トークン制限オーバーにつながるため注意が必要です。

トークンの粒度を具体的に体感するには、後述するアナライザの活用が最も手早い手段となります。

ディジョンの情報セキュリティ方針をトークナイズした例
ディジョンの情報セキュリティ方針をトークナイズした例

トークンがコストと制限に与える影響

ChatGPT APIの料金は「入力トークン+出力トークン」の合計に単価を掛け合わせて算出されます。

たとえばGPT-4.1の場合、2025年8月時点で1,000,000トークンあたりおよそ2.00ドル(入力)と8.00ドル(出力)がかかります。

さらに各モデルにはコンテキストウィンドウといわれる「入力できる最大のトークン数」が設定されており、GPT-4.1なら1,000,000トークンまで入力できます。一方でこの上限を超えるとリクエストが失敗するため、長い会話履歴を送る際は要約するなどの工夫が求められます。

より具体的な料金シミュレーションは 生成AIのコスト見積もり完全ガイド にて解説しています。

トークン数と応答速度への影響

トークン数は、ChatGPTがテキストを処理する際の計算量にも直結します。

入力トークンが多ければ多いほどモデルはより長くテキストをエンコードし、出力トークンが増えるほどデコーディング処理にも時間がかかります。

そのため、トークン数が増加すると応答までの待ち時間(レイテンシー)が伸びる傾向があります。

多くの生成AIチャットボットでは、そのスレッド内の会話履歴を全てモデルに入力します。したがって会話のターン数に応じて徐々に応答に時間がかかることもあるため、少しレスポンスが遅いと感じた時は、新たなスレッドで会話を始めると良いでしょう。

OpenAI公式のトークン数の計算ツール

OpenAI社 が Web上で無料公開している Tokenizer を通じ、モデル別のトークン分割結果と合計数を即座に確認できる環境を用意しています。

このツールの内部では tiktoken というトークン分割のライブラリを用いたBPEエンコードが実行されており、APIと同一のロジックで計算されています。

以下の画像は GPT-4o とGPT-4o mini の場合のトークナイズの結果です。データには弊社の情報セキュリティ方針のドキュメントを入れています。479文字の日本語に対して、394トークンという結果が表示されていることが分かります。

トークンの構成要素

ChatGPTに送るテキストは、いくつかの部分に分かれてトークンとしてカウントされます。

システムプロンプト

システムプロンプトは、最初にモデルに渡す指示文で、回答の口調や動作を決める役割などを担います。

ENSOUチャットボットでは以下のような画面で編集できます。ChatGPT や Gemini などでも同様の機能が、 GPTs 、 Projects 、 Gems などの形式で提供されています。

ユーザープロンプト

ユーザープロンプトは、実際にユーザーが入力する文章です。

ENSOUチャットボットの場合はチャット画面の下部から入力するメッセージがユーザープロンプトに該当します。

会話履歴

会話履歴は、そのチャット画面上でやり取りされた、ユーザー入力と生成AIの回答のすべてのテキストの事を指します。

アプリケーションによっては過去のやり取りを要約したり、直近のいくつかのメッセージに絞って送信する機能などもありますが、過去のやり取りがそのまま使われることもあり、消費するトークン数としては非常に大きくなる可能性がある要素です。

メモリー

メモリー機能は ChatGPT などで提供されている機能であり、自身のプロフィールなどの情報を以前のやり取りを元に保存しており、必要に応じて呼び出してコンテキストに加えられ、トークンとして消費されます。

まとめ

トークンは ChatGPT の料金と性能を左右する最重要パラメータであり、言語や表現方法によって大きく変動します。

本記事で紹介した公式Tokenizerを活用すれば、プロンプト作成の段階でトークン消費を可視化しながら調整できます。

株式会社Digeon は法人向けに ChatGPT をセキュアに使えるサービスである「ENSOUチャットボット」を提供しています。

ご相談、無料トライアルは、以下からお問い合わせください👇

サービス紹介資料をこちらからダウンロードいただけます👇

Excelを渡すだけでAIアプリになる

今、Excelやノーコードで管理している業務をAIエージェントで自動化します。

NEW

最新記事

Excel業務を自動化するには?転記などの定型業務を効率化する方法

ブログ

Excel業務を自動化するには?転記などの定型業務を効率化する方法

Excel業務を自動化する方法として一般的に数式を使いこなすことやマクロを使うことなどが挙げられます。この記事では一般的な自動化方法とAIを活用した自動化方法、転記、レポート作成を効率化する方法を解説します。

2026/05/08詳細を見る
業務向けノーコードツール15選|用途別の選び方と導入のポイント

ブログ

業務向けノーコードツール15選|用途別の選び方と導入のポイント

業務アプリ、フォーム、Webサイト、データベース管理に使えるノーコードツール15選を用途別に解説。選び方、導入時の注意点、AIエージェントツールとの違いまでわかりやすく紹介します。

2026/04/30詳細を見る
GPT-5.5登場 - 概要から検証まで徹底解説!

ブログ

GPT-5.5登場 - 概要から検証まで徹底解説!

OpenAIが発表したGPT-5.5について、特徴や何が進化したのか、実際の使用感まで実務目線で解説します。

2026/04/24詳細を見る
RAGとAIエージェントの違いとは?できることと違いをわかりやすく解説

ブログ

RAGとAIエージェントの違いとは?できることと違いをわかりやすく解説

RAGとAIエージェントは、どちらも生成AIの活用でよく出てくる言葉ですが、できることは同じではありません。この記事では、RAGの基本、AIエージェントとの違い、RAGだけでできること・難しいことを整理しながら業務でどう使い分けるべきかをわかりやすく解説します。

2026/05/08詳細を見る
SharePoint・Googleドライブと連携して社内問い合わせ対応を自動化する方法|情シス・人事・総務の負担を減らすAI活用を解説

ブログ

SharePoint・Googleドライブと連携して社内問い合わせ対応を自動化する方法|情シス・人事・総務の負担を減らすAI活用を解説

社内問い合わせ対応の自動化は、情シス・人事・総務の負担を減らすだけでなく、属人化の抑制や新人の自己解決の促進にもつながります。この記事では、社内問い合わせ対応を自動化する方法、RAGの活用場面、導入時の注意点、ENSOU AIを活用した進め方について解説します。

2026/04/21詳細を見る
Claude Designがリリース - 詳細から実際の使い方まで徹底解説!

ブログ

Claude Designがリリース - 詳細から実際の使い方まで徹底解説!

2026年4月18日にAnthropic社よりClaudeにデザインやスライドを自由に作成しその場で編集できる機能としてClaudeDesignをリリースしたと発表がありました。

2026/04/21詳細を見る