![見出し画像](https://assets.st-note.com/production/uploads/images/118672918/rectangle_large_type_2_672e5e60fe5933627434f7319b681226.jpeg?width=1200)
【ChatGPT】ついに目を開くGPTさん【GPT-4V】
動きが早いなーGPTさん。
こういう機能はタイムリーにお知らせしていきますね。
Plusユーザーに開放された新機能「画像添付と解析」を紹介します。この機能は、GPT-4Vと呼ばれています。
※GPT-4 ヴィジョン と読みます。
「ベータ機能」ではなく、GPT-4の基本機能、すなわちメインストリームで行えるようになっています。
![](https://assets.st-note.com/img/1697073974745-MfA8gWbdao.png)
GPT-4V(ヴィジョン)って?
GPTさんが「画像ファイル」を読み取る機能です。
従来、彼らとのコミュニケーションは「プロンプト(テキスト)」のみでしたが、これからは「画像」を使えます。目が見えるようになったんですよ。
画像認識自体は、これまでも「Advanced Data Analysis」で可能でした。今回の機能追加により「Default」から「画像」を送ることができます。
なお、画像以外のファイルは引き続きAdvancedで行いましょう。
GPT-4には強力なOCR機能があるので、画像内の文字もバッチリ認識します。つまり、文字選択を禁止しているPDFでも、Webサイトでも、コンプライアンストレーニングで出されるクイズでも。です。
あとこれ、スマホでも動きます。
いつの間にかDALL-Eも実装してた。びっくり。
![](https://assets.st-note.com/production/uploads/images/119027700/picture_pc_2a977ee6e40eff583e19a6ada05482e8.png?width=1200)
できること/制限事項
新機能について尋ねてみました。あれこれ試す前にまず聞く。
![](https://assets.st-note.com/img/1697074097406-6ZTTIVDrRn.png?width=1200)
回答はこちら
できること:
画像認識: 画像の内容を認識し、それに関する情報や説明を提供することができます。
アニメーションキャラクターの識別: アニメやマンガのキャラクターを認識し、そのキャラクターに関する情報を提供することができます。
図やグラフの解析: 画像に含まれる図やグラフの内容を説明することができます。
制限事項:
実在の人物の識別: 画像内の実在の人物の識別や、その人物に関する質問には答えられません。
感じ取る能力: 画像に写る実際の人物の感情や意図、心理状態などの感じ取る能力はありません。
センシティブな情報: 画像から人物のセンシティブな情報(健康状態、宗教、性格、思想、政治的見解など)を推測することはできません。
画質: 低解像度や不鮮明な画像では、正確な認識が難しい場合があります。
以上のような制限がありますので、ご理解の上、機能をお使いください。
とのことです。
使い方
いつものやつw
GPTに課金します。
メニューでGPT-4 Default を選ぶ。
画像アイコンから対象の画像ファイルを選択し、アップロード
その画像ついて聞きたいこと/してほしい処理をプロンプトで指示
![](https://assets.st-note.com/img/1697547284559-9nB8SyEnLs.png)
クリップボードの画像もいける。すご。。。
やってみた
花道
![](https://assets.st-note.com/img/1697073957378-83GC2t1K2l.png?width=1200)
花道の姿勢を認識しているのがわかりますね。文字は読めていない模様。
グラフ
![](https://assets.st-note.com/img/1697074741390-R7MBmid1ZV.png?width=1200)
![](https://assets.st-note.com/img/1697074810008-0Oqw4yvx22.png?width=1200)
クラフから元データのCSVを作成することもできます。
サザエさん
![](https://assets.st-note.com/img/1697074861912-YbsQRG01m1.png?width=1200)
![](https://assets.st-note.com/img/1697074878027-CJsPwOBesK.png?width=1200)
きちんと画像をみてキャラクターを判定しています。付帯情報はもともと知っていたのかな。
超サイヤ人
![](https://assets.st-note.com/img/1697080701060-GgR7vjPG9G.png)
![](https://assets.st-note.com/img/1697080726757-0wkpcx0bOT.png?width=1200)
![](https://assets.st-note.com/img/1697080742658-lYYv9jZXdf.png)
![](https://assets.st-note.com/img/1697080763959-plix7q4C1G.png?width=1200)
ぱっと見同じような超サイヤ人をきちんと識別しています。すごいや。
モビルスーツ
![](https://assets.st-note.com/img/1697080915804-WmPdz43j4L.png)
![](https://assets.st-note.com/img/1697080937600-7LEJGdhCFS.png?width=1200)
フリーダムっていうかと思ったらちゃんとわかってる。。やるな。
![](https://assets.st-note.com/img/1697081110861-2kGxwa9lnL.png)
![](https://assets.st-note.com/img/1697081127936-OgY3dYVMG0.png?width=1200)
正解は「ガンキャノン・ディテクター」です。
![](https://assets.st-note.com/img/1697081170780-mgmNs9roDs.png)
![](https://assets.st-note.com/img/1697081204480-C0yYz5x4Yr.png?width=1200)
アニメは得手不得手があるようですね。
人物判定
二人ほど試したところ。。
![](https://assets.st-note.com/img/1697074968214-x1wjCzdGcS.png?width=1200)
![](https://assets.st-note.com/img/1697075021582-SuRDpgJT80.png)
気になる答えは。。。
![](https://assets.st-note.com/img/1697075051342-XMn3NFS6Jp.png)
人を調べることは許さない姿勢が全面に!!
安全ですね。
新機能のリリースはワクワクします。
グラフを読み取ることができるのはありがたいです。
最後にちょっと試してみた。
![](https://assets.st-note.com/img/1697080036913-u5IReBYLf4.png?width=1200)
![](https://assets.st-note.com/img/1697080064676-Al1gnLVv28.png?width=1200)
あってるよ!でもさ、そこじゃないんだww
と思ったら。
![](https://assets.st-note.com/img/1697080105358-LcaayaN1mX.png?width=1200)
おしまい。