見出し画像

Azure OpenAI Service API使用料を調べてみた

ChatGPTを会社などの組織で使用する場合や開発者としてAPIを使用する場合は、API使用料という形で支払いが必要となります。API使用料が実際どのくらいの料金かかるのかを調べてみました。
ChatGPT-3.5とChatGPT-4を使うのとではまったく料金が違うと聞くのですが、どれほどの差があるのでしょうか?法人やAPIとして使用している方は参考にしていただければと思います。

使用料一覧

2024年2月現在の価格をMicrosoftのホームページから調べてみました。

MicrosoftのAzure OpenAI Serviceの価格を確認するとGPTのモデルごとの詳細な料金を確認することができます。また、確認する際にはリージョンと通貨を指定する必要があります。
日本円でも確認できますが、見積もりツールがドルしか対応していなかったので、分かりやすく合わせるためにここでもドル表示させておきます。
なお、API使用料一覧の「完了」はおそらくホームページの翻訳ミスだと思われます。APIの「応答」のことを示しているのでしょう。

リージョン:東日本
通貨:ドル($ USD)

API使用料一覧

一覧表で見ても価格が小さすぎて感覚的によくわからないので、この後で1か月使うとどのくらいの料金になるのかも見ていきます。

ただ、API使用料一覧を見ていただくとわかる通り、コンテキスト、トークンなどの言葉ができてくるので、そちらを説明いたします。

コンテキストウィンドウとトークン

試算をする際には、このコンテキスト(コンテキストウィンドウ)と、そのサイズを表す単位であるトークンという概念を知っておく必要があります。ただ、これらの概念は資産だけではなく、ChatGPTを使うこなす上でも、重要な概念なのでこの機械にぜひとも覚えていただければと思います。

コンテキストウィンドウ

ChatGPTのコンテキストウィンドウとは何ですか?
初心者にもわかりやすく教えて
------------------------------------------------------------------------------------
ChatGPTのコンテキストウィンドウは、ChatGPTが会話中に参照できる情報の範囲を指します。具体的には、ChatGPTが現在の会話の流れや内容を理解し、適切な返答を生成するために用いる、過去の会話の履歴やユーザーから提供された情報を含みます。

このウィンドウは、ChatGPTが一度に参照できるテキスト量に制限があるため重要です。この制限のため、ChatGPTは一度に特定量のテキストのみを「記憶」でき、これが会話の「文脈」や「背景」となります。つまり、このウィンドウに含まれる情報が、ChatGPTが現在の質問やコメントに対して適切に反応するための基盤となるのです。

例えば、ユーザーが初めに自己紹介をした場合、その情報はコンテキストウィンドウに保持され、後の会話で参照される可能性があります。しかし、会話が長くなると、最初の部分がウィンドウから「押し出され」、もはや参照できなくなることもあります。このように、コンテキストウィンドウはChatGPTが会話を適切に理解し続けるためのキーとなる機能です。

ChatGPT-4

なお、コンテキストウィンドウを理解するにあたり、コンテキストウィンドウのサイズを表す「トークン」という単位にも注意を行う必要があります。

トークン

コンテキストウィンドウのトークンってどういう単位ですか?
------------------------------------------------------------------------------------
コンテキストウィンドウ内の「トークン」とは、言語モデルがテキストを解析する際に用いる最小の単位です。トークンは通常、言葉や句読点といった個々の要素に分けられたテキストの一部を表しますが、必ずしも一般的な「単語」と一致するわけではありません。実際には、トークンは以下のような様々な形態をとることがあります:

単語:これは最も一般的なトークンの形態です。例えば、「犬」、「走る」、「美しい」など、個別の単語がそれぞれトークンになります。
部分的な単語:複雑な単語や長い単語は、複数のトークンに分割されることがあります。例えば、「不可能」は「不」と「可能」に、またはさらに細かく分割される場合があります。
句読点:句読点もトークンとしてカウントされます。例えば、「。」、「、」、「!」などがそれに該当します。
スペースや特殊文字:スペースやタブ、改行といった特殊文字もトークンとして扱われることがあります。

トークンは、言語モデルがテキストを理解するための基礎的な構成要素です。それぞれのトークンは、文脈の一部として、文全体の意味を解析し、応答を形成する際に重要な役割を果たします。ChatGPTのようなモデルでは、これらのトークンが連続してコンテキストウィンドウを形成し、会話の流れを追うのに用いられます。このウィンドウのサイズは限られており、一定数のトークンが埋め尽くされると、古いトークンから順に忘れられていきます。

ChatGPT-4

日本語の1000文字で入力するとどのくらいのトークンになりますか?
------------------------------------------------------------------------------------
日本語のテキストをトークン化する際、1,000文字がどのくらいのトークン数になるかは、テキストの内容によって大きく異なります。日本語は漢字、ひらがな、カタカナなど複数の文字体系を使用しており、それぞれの文字や単語の長さが異なるため、トークン化の結果も変わってきます。

一般的に、日本語のトークン化では、以下のような傾向があります:
漢字:漢字は通常、それぞれが個別のトークンとなります。しかし、複合語の場合は複数の漢字が1つのトークンとなることもあります。
ひらがなとカタカナ:これらは一文字ずつトークン化されることが多いですが、短い単語や接続詞などはまとめてトークン化されることもあります。
句読点と特殊文字:句読点や空白もトークンとしてカウントされます。

実際のトークン数は、テキストの具体的な内容に依存します。短い単語や単純な文構造を持つテキストは、トークン数が少なくなる傾向があります。一方で、複雑な文や長い単語を多用するテキストは、より多くのトークンを生成します。

結果として、1,000文字の日本語テキストがどのくらいのトークン数になるかは一概には言えませんが、おおよその目安としては、数百から数千のトークンになる可能性があります。ただし、これはあくまで大まかな推定であり、実際の数値はテキストによって異なります。

ChatGPT-4

Tokenizer

また、OpenAIより以下のツール、Tokenizerが公開されています。Tokenizerを使って文章がどのようにトークンに分割されるのかを確認することができます。

試算してみよう!

1日5,000文字を使用したとしてみましょう。
MicrosoftのWordを初期設定で使うと、A4サイズ1枚に入る文字数が1,440文字です。5,000文字というとA4用紙でほぼ3枚半程度の文章量です。

前述したとおり、日本語の場合は文字数とトークンの関係が複雑です。ですのでここでは、ざっくり1文字≒1トークンで計算してみます。トークンは1,000単位で計算されるため、1000トークン=1Kトークンとします。

1日の使用トークン: 5,000文字 ≒ 5Kトークン
1か月の業務日数: 20日

1か月の想定使用量: 5K * 20 ≒ 100Kトークン

使用量は、入力(プロンプト)した文字数と出力(APIからの応答)の文字数を足し合わせたものです。ここでは、入力と出力の比率を2:3と仮定しておきます。

プロンプト: 40Kトークン
応答: 60Kトークン

以降では料金計算ツールを使用して、上記の使い方でそれぞれのモデルによる料金の違いを確認していきます。

GPT-3.5-Turbo-4K

GPT-3.5-Turbo-4Kを使用すると$0.18 約26.7円/月です。

GPT-3.5-Turbo-4K

GPT-3.5-Turbo-16K

同じGPT-3.5でコンテキストウィンドウが4倍のモデルを使うと、金額が2倍になり$0.36になります。
約53.4円/月です。

GPT-3.5-Turbo-16K

GPT-4-8K

GPT-4-8Kでは$4.8 約712円/月です。

GPT-4-8K

GPT-4-32K

GPT-4-32Kでは$9.6 約1,425円/月です。
コンテキストウィンドウを上げると料金は2倍になりました。

GPT-4-32K

料金比較

GPT3.5とGPT-4にするとモデルにもよりますが、なんと約27倍にもなることがあります。システムとして利用する場合は、GPT-4である必要がない時はできるだけGPT-3.5を使うなどの調整を行う必要もありそうです。

料金比較

まとめ

本記事では、2024年2月のMicrosoft価格情報に基づき、Azure OpenAI Service APIのAPI利用料について説明いたしました。ChatGPTのモデルごと(ChatGPT-3.5とChatGPT-4)の料金差を検討しました。料金はモデルとコンテキストウィンドウのサイズによって大きく異なることが分かりました。法人ユーザーやAPIを使用する開発者にとって、適切なモデル選択と、料金把握のお手伝いができるのであれば幸いです。

いいね!やフォローで、ぜひ応援よろしくお願いします!
励みになります!

また、X(旧Twitter)でAIについての雑談を不定期に行っておりますのでフォローをお願いいたします。

いいなと思ったら応援しよう!