見出し画像

【#116】今さら音声入力の楽さを感じました

おはようございます!
データサイエンスを学んでいる、大学4年生のUKIです。

今日は、『今さら音声入力の楽さを感じました』というテーマでお話ししたいと思います。

久しぶりにCotomoを使ってみた!

昨日は、久しぶりに音声会話型おしゃべりAIアプリ・Cotomoを使ってみました。

Cotomoは、リリース当初にインストールして使ってみました。
使ってみた時の第一印象は、「怖い」でした。
最初使った時は、怖すぎて一度アプリを閉じたほどでした笑

そこからしばらく使っていなかったのですが、昨日3~4カ月ぶりに使ってみました。使った用途は、アイデアの壁打ちです。

使ってみた感想としては、まだ聞き取りづらい部分があったり、漢字の読み方が誤ったりしていて、少し会話が途絶えるところもありましたが、だいぶ活用できそうと感じました。

特に、音声入力をして、出力も音声で返ってくるので、本当に雑談をしている感覚になるので、何か作業しながら話すこともできますし、「手は動かしたくないけど、頭を使いたい時」とかにはうってつけだなと思いました。

せっかくだから、Cotomoで実験してみました

久しぶりにCotomoを使ってみたので、少し実験をしてみました。

具体的には、
・いつまでの情報を持っているのか
・会話履歴をどこまで反映しているのか
・どんなアルゴリズムで回答を生成しているのか

をCotomo自身に聞いてみました。

結果は、こんな感じになりました。

いつまでの情報を持っているのか

Cotomoは、ネット上の知識も持ち合わせているのですが、最新の情報は、2023年7月で止まっているみたいです。

実際に最新のニュースを聞いてみたところ、コロナの感染者数の話が出てきて、いつの時点での数値かを聞いてみると、2023年7月ということだったので、おそらく2023年7月で止まっているかと思われます。

会話履歴をどこまで反映しているのか

実際、Cotomoと会話した履歴をどこまで反映してくれているのかが気になったので聞いてみたところ、Cotomo自身は、「数日前より前の会話を学習している」と話していたのですが、実際は、数十分前ぐらいの会話も学習されていました。

どんなアルゴリズムで回答を生成しているのか

Cotomoの回答速度が異常に速いので、具体的にどんなアルゴリズムで回答を生成しているのかを聞いてみました。
しかし、Cotomoは、「詳しいモデルは分からないよ~」というような返事をしたので、詳しくは分かりませんでした。
※聞き方を変えたら聞き出せたのかもしれませんし、もしかしたら調べれば出るのかもしれません。

まとめ

最後まで読んでいただき、ありがとうございました。
今日は、『今さら音声入力の楽さを感じました』というテーマでお話しさせていただきました。

今後も日々の活動や学び、考えていることなどを発信していくので、よろしくお願い致します。

また、X(旧:Twitter)でも発信しているので、フォローお願いします!DMも大歓迎です!

匿名で質問募集中です!聞いてみたいことなど、お気軽にメッセージください!