自分の言葉をそのまま記事へ『Gemini 1.5 Pro 002』で音声入力執筆
今日、新モデルとして発表された、Gemini 1.5 Pro 002を触ってみたので、その感想をシェアしたいと思います。
※この記事はGemini 1.5 Pro 002で書いてます。
ChatGPTの高性能ボイスチャットの方が話題だけども
巷ではChatGPTの有料版であるチャットモードが盛り上がってますよね。僕も気になってはいるんですが、まだChatGPTは課金してないので使えてないんです。チャットモードがすごく良くて、Open AI o1がもっと制限なく使えたなら、課金しようかなとも思ってたんですけど、現状そこまで気持ちが動いてないのが正直なところ。
それよりも僕は、Gemini 1.5 Pro 002の方が気になるところ。002は価格が安くなったとか、計算能力が向上したとか、画像認識能力が上がったとか、いろいろ言われてます。
僕も実際に使ってみて、自分の手書きメモを文字起こしさせてみたんです。結構汚い殴り書きだったんですが、正確に読み取ってくれて、これはすごいなと思いました!
僕にとって重要なのは文章作成能力
僕の主な用途は、やっぱり文章作成や記事執筆なので、002がどれぐらい使えるのかっていうのが一番の関心事です。
以前のgemini-1.5-pro-exp-0827と今回の002、どっちがいいのかなって考えた時に、あくまでも僕個人の感覚としては、文章のニュアンスとか音声入力した時の自分の言葉遣いをそのまま文章化してくれるっていう点では、002の方が好みかなと感じています。
これは、音声入力や文字起こしからブログ記事を書くっていう、コンテキスト情報を大量に入力するっていう前提での話です。
ただ、タイトルをつけるとか、見出しをつけるとか、文章を構造化するっていう意味では、以前のモデルの方が記事としての整い方はいいかもしれません。この辺りは本当に好みですね。
今回の記事は002で書いてみたんですが、見出しをつけてくれなかったので、自分で文章の区切りに見出しを付けました。でも、別にこれでもいいのかなと思っています。
結局、自分で見出しを書き直したり、見出しを無しにして文章をもっとシンプルにしたりっていう手直しは、どのモデルを使っても必ずやらなきゃいけないので、そういう意味での手間はそんなに変わらないんですよね。
だったら、全体の文調とかニュアンスとか語尾の使い方とか、そういう自分のキャラクターとか文章の温かみとかを感じられる部分を正確に踏襲してくれる方が、個人的には嬉しいなと思ってます。
そういう微妙なニュアンスとか好みで言うと、002の方が僕は好きですね。
個人の好みが分かれるところ
もちろん、これは本当に個人差があるというか、個人の好みなので、何とも言えないところではあります。
「全然昔のモデルの方が好き」っていう人もいるでしょうし、「いやいや、Claudeの方がいいよ」っていう人もいると思うので、この辺りは実際にご自分で触っていただいて、好みをはっきりさせてみるのがいいんじゃないかなと思います。
gemini-1.5-pro-exp-0827、そして今回の002、どちらにしても、文字起こしとか音声入力でたくさん喋って、このしゃべり口調とかニュアンスをそのままブログ記事にしたいっていうものに関しては、完成度はやっぱり高いなと思っています。
なので、こういう使い方をするなら、僕は今のところClaudeよりもGeminiを使うかなというのが正直なところです。
今後の活用に期待!
あと、画像認識能力が上がってるっていうのも魅力的です。
手書きのメモをそのまま文字起こしさせて、それをメモとして使うとか、v0で綺麗に図解してそれを人に共有するとかっていうのは、今後もっと活用の幅が広がるんじゃないかなと期待しています。
まとめ
今回はGemini 1.5 Pro 002を実際に使ってみた感想を、個人的な視点からお話ししました。
文章作成や音声入力からの記事執筆という用途においては、以前のモデルと比べて、より自分の言葉遣いやニュアンスを反映してくれると感じました。
AI技術は常に進化しているので、これからも自分に合ったツールを見つけて、活用していきたいですね!
でわでわ、次回の記事で!