
GeminiとAIStudio
Googleの生成AI、当初どこから手を付けていいかわからなかった点をメモ。実行環境が複数あって、それぞれ使える「モデル」が違う。どこにどのモデルがあるか対応関係を知っておかないと試したいことができない。
Gemini
Gemini、https://gemini.google.com/ からだと、全部日本語表示なのでとっつきやすい。

1.5Flashがデフォルトで選ばれている。他の選択肢として2.0Flash Experimentalがある。さらに課金すればAdvancedの選択肢も出るみたいだけどとりあえず無課金主義で行きたい。この環境で使えるモデルは二通り。
AIStudio
https://aistudio.google.com/ から入る。こっちは見出しやメニューが英語のせいでちょっとビビる(^_^;)けどプロンプト、音声には日本語も使える。

CreatePrompt
左側のメニューでCreatePromptを選んでいる場合

この場合、右側メニューのModelの選択肢にいろいろ出てくる。

デフォルトのGemini1.5 Flashの他にも今界隈で話題のGemini2.0 Flash Experimentalや思考モデルGemini2.0 Flash Thinking Experimentalなどもプレビュー状態で選べ、今のところは無料で使えるようです。

さらにGEMMAというのがあって、こちらはオープンのモデルらしい。ということはこっちはこの先もずっと無料なんだろうな。

Stream Realtime
チャットからプロンプトを一つずつ送信するのではなく、人と喋っているように声でやりとりしたり、画面共有して判断を求めたり・・・。
「ついに2001年宇宙の旅に出てくるHAL9000を超えたのかっ」と叫びたくなるようなやりとりをしている映える動画をYoutubeなどでみかけます。
自分でもこれやろうと思うと、左側のメニューからStreamRealtimeを選んで

Talk with Gemini liveから
Talk to gemini ・・音声会話
Show Gemini ・・音声会話+WebCam画像リアルタイム共有
Share your screen ・・音声会話+PCスクリーンリアルタイム共有
でできる。「HAL9000を超えたのかっ」
ただこの画面で、選べるModelはGemini2.0 Flash Experimentalだけでした。

結論
・普段使いにはGeminiでOK。
・リアルタイム会話、画面を常時共有した上での会話を試して、「HAL9000を超えたのかっ」と叫びたかったら、AIStudioのStreamRealtimeを使う。この場合のモデルはGemini2.0 Flash Experimental一つに限られる。
・いろいろなモデルを試したい、特に「思考モデル」のGemini2.0 Flash Thinking Experimentalを試したいとなると、AIStudioのCreatePromptから、ということになるかと思います。