ENSOU Logo

生成AIのコスト見積もり完全ガイド|Azure OpenAI Service/OpenAI APIのトークン数を徹底解説

生成AIのコスト見積もり完全ガイド|Azure OpenAI Service/OpenAI APIのトークン数を徹底解説
山﨑祐太
山﨑祐太代表取締役
2025年7月30日
Azure OpenAIやOpenAI APIを使った内製型の生成AI導入において、月間トークン数・会話数はどの程度か?神戸市・横須賀市の事例を元に、利用実態と想定コストの目安を解説します。

生成AIのセキュアな環境での利用のために、 Azure OpenAI Service や OpenAI API などを使用して生成AIの活用基盤を自前で内製する企業が多くなっています。

ChatGPT Team プランや Google Workspace での Gemini の使用は、月額費用が一定であるのに対して、 内製した場合は API のトークン数に基づく従量課金という費用形態になります。

そのため、事前にどれだけの入出力トークンが予想されるのかについて、正確な見積もりを作成した上で、プロジェクトを開始する必要があります。

そこで本記事では、様々な公開されている事例に基づき、ユーザー1人あたりの月間平均利用量(会話数・トークン数)に焦点を当て、その実態を調査してまとめます。

トークンとは何か

まずはAPIの費用の単位で言及される「トークン」とは何かをご説明します。

大規模言語モデルは、入力されたテキストを「トークン」と呼ばれる単位に分割して処理を行います。トークンは単語でも文字でもなく、「Byte Pair Encoding(BPE)」などのアルゴリズムによって分割されたサブワード(語の一部や複数語の集合)単位です。必ずしも人間が理解する単語や文字の単位と一致する訳ではありませんが、トークン単位で処理することで、未知の語や長い語も効率的に扱えるようなアルゴリズムとしてこのトークンへの分割が行われています。

トークン数とコストの関係

API利用時には「1,000,000トークンあたり2ドル」などの形式で課金されることが一般的です。

トークン数が増えるほど、モデルの計算量や応答時間も比例して増大します。そのため、長い文章や大量のテキストを扱う際は、サーバーの負荷が大きくなるので、費用が多く発生するという仕組みになっています。

日本語1文字は何トークンくらい?

OpenAIのプラットフォーム上でテキストを入力するとそのトークン数をカウントしてくれる機能が提供されています。この機能を用いて簡単に試算することができます。

https://platform.openai.com/tokenizer

例えば弊社が公開している 情報セキュリティ方針 の文章でカウントしてみると、日本語479文字に対して、トークン数が394トークンとなっています。

  • 1トークンあたりの日本語の文字数:1.32
  • 日本語1文字あたりのトークン数:0.76

次に弊社の プライバシーポリシー の文章を入力してみます。文字数2,681に対してトークン数1,930です。

  • 1トークンあたりの日本語の文字数:1.39
  • 日本語1文字あたりのトークン数:0.72

これまでの結果をまとめると以下の通りです。

情報ソース

文字数

トークン数

情報セキュリティ方針

479

394

プライバシーポリシー

2,681

1,930

またこれらの結果から、日本語1文字は、約0.74トークンであることが分かりました

基本料金

OpenAI と Azure(米国リージョン) それぞれの提供する料金は、2025年7月時点で下記の通りです。

基本的に両者ほとんど差異はありませんが、キャッシュされた入力に若干の差異があります。

プロバイダー

モデル

入力(1Mトークンあたり)

キャッシュされた入力(1Mトークンあたり)

出力(1Mトークンあたり)

OpenAI API

GPT-4.1

$2.00

$0.1

$8.00

OpenAI API

GPT-4.1 mini

$0.40

$0.10

$1.60

OpenAI API

GPT-4.1 nano

$0.100

$0.025

$0.400

OpenAI API

o3

$2.00

$0.1

$8.00

Azure OpenAI Service

GPT-4.1

$2.00

$0.50

$8.00

Azure OpenAI Service

GPT-4.1 mini

$0.40

$0.10

$1.60

Azure OpenAI Service

GPT-4.1 nano

$0.100

$0.03

$0.400

Azure OpenAI Service

o3

$2.00

$0.50

$8.00

神戸市の事例

生成AIの利活用 を参考に考えます。

職員のうち133名を対象に、生成AIの試行利用に関する報告書が公開されています。

61営業日に渡る試行利用で、1人あたり1日平均で1.07回の利用があったとされています。月間平均であれば1人あたり約21回の会話が実施されていると考えられます。

後述する横須賀市の例では、職員1人あたり月間で約3回の会話が行われていることから、試行利用に興味を持っているユーザーを対象にしていることもあり、非常に積極的な活用がなされたことが分かります。

企業における生成AI活用の文脈でも先進的な技術を好む企業であるのか、先進的な技術に対して保守的な企業であるのかによって、最大10倍ほどの利用の差異がある可能性については、考慮する必要があることを示唆しているかも知れません。

一方で文字数やトークン数に対する言及はなかったため、具体的に月間でどの程度の入出力トークン数を利用していたのかは不明です。

横須賀市の事例

数字で見る横須賀市のChatGPT利用状況【2025年5月末時点】 を参考に考えます。

  • ユーザーあたりの月間平均入力トークン数:約812トークン
  • ユーザーあたりの月間平均入力トークン数:約3,626トークン
  • OpenAI API GPT-4.1 の場合のユーザーあたり月間費用:0.030632ドル(約5円)

横須賀市の事例では、1ヶ月平均12,157回の会話が実施されています。1日平均であれば421回の会話が実施されていることになります。

この会話数については、上位17%のユーザーで全体の81%の利用を占めていることもあり、ユーザーあたりの会話数にはかなりの偏りがあることが想定されます。

月間の入力文字数は平均で1,387,890文字、出力文字数は平均で6,196,923文字となっています。この文字数にはシステムプロンプトやRAGにおけるコンテキストなどの情報を含まないと言及されているため、実際に Azure などの費用を見積もる際には、もう少し文字数が大きくなることについては注意が必要です。

またAPI料金は文字数ではなくトークン数で発生するサービスが多いため、ざっくり日本語1文字が2.5トークンだと仮定すると、月間の平均的な入力トークン数は約3,469,725トークン、平均的な出力トークン数は約15,492,308トークンであることが想定されます。

そしてこのAIの利用者ですが、4,272名を対象に利用アンケートを取っていることから、利用者数を4,272名と仮定します。そうすると1名あたりの月間の入出力トークン数は、入力が812トークン、出力が3,626トークンであると考えられます。

しかし、横須賀市の職員数は約3,300名とされているため、生成AIをあまり使用しない方が1,000名ほどいる可能性もあり、実際にはこの利用量を1.3で除す程度の調整が必要かも知れません。

RAGにおけるトークンの消費量

RAGはそうでない通常のチャットと比較して、トークンの消費量が多くなります。

RAGにおけるトークン消費は、チャットにおける入出力のトークン数に加えて、システム側で付与されるプロンプトのトークン数、チャンクサイズ * 取得するチャンク数を加味しなければなりません。

例えば LangChain のチュートリアル では、チャンクサイズは1,000トークンで指定されており、 LangChain VectoreStore.similarity_search は上位4件のチャンクを取得してます。従ってシステムプロンプトのトークン数に加えて、約4,000トークンほど多く入力トークンを消費するということが計算できます。

その他の加味するべきポイント

ファイルアップロードにおいては、システム側のプロンプトに加えて、ファイル内に含まれるトークン数が追加で消費されます。また、会話のラリーが続く度にそのトークンがユーザー入力として付与されることになり、ファイルサイズや含まれる文字数については注意が必要です。

ENSOUチャットボットではじめる生成AI活用

弊社では法人向けに ChatGPT をセキュアに使えるサービスである「ENSOUチャットボット」を提供しています。

ご相談、無料トライアルは、以下からお問い合わせください👇

サービス紹介資料をこちらからダウンロードいただけます👇

資料ダウンロード
お問い合わせ