GPT-4o miniで画像分析(API)
GPT-4o miniも出たので、APIで画像分析する方法を簡単にまとめてみました。
今回はAPIをPostmanで実行してみます。
※APIKeyは生成済みを前提として書いております。
PostmanでのOpenAI APIのたたき方
リクエストを作成する
新しいリクエストを作成し、下記内容を入力します。
メソッド: POST
URL: https://api.openai.com/v1/chat/completions
Authorization(認可)にAPIKeyを設定
Authorizationにて、認証タイプは「BearerToken」を選択して、トークンの欄にOpenAIのAPIKeyを設定する
リクエストボディを設定する
私はJSONで書いてみました。
プロンプトとなる文章と、画像を2枚をリクエストに入れます。
画像データ(パラメータ:url)には画像のURL、またはBase64データがセットできます。
{
"model": "gpt-4o-mini",
"messages": [
{
"role": "user",
"content": [
{
"type": "text",
"text": "2つの画像を説明してください。"
},
{
"type": "image_url",
"image_url": {
"url": "data:image/jpeg;base64,~~~1枚目画像データ"
}
},
{
"type": "image_url",
"image_url": {
"url": "data:image/jpeg;base64,~~~2枚目画像データ"
}
}
]
}
]
}
実行してみる
送信した画像はこの2枚です。
この2枚の画像を説明してもらいます。
差分がわかりにくいと思うので、GPT-4oでやってみた場合の結果はこちらです。
文字量(情報量)がGPT-4oのほうが多いなと思うくらいで、GPT-4o miniでも十分画像の情報を読み取れているといった所感です。
※分析対象がわかりやすい画像だったからかもしれませんが……