夢かなったよドラえもん
9月になりました。何かと停滞感を覚えた8月後半だったので、清々しい気分で過ごしてゆきたいものです。
さて、普段から「こういうものがあったらいいのにな」と思うことはよくあります。それが形あるものだったら、まずは道具を買ってきて組み立て完成させるということになるでしょうが、形のないものだとすると、パソコンを使って組んでゆくということが多々あるわけです。
まあ音楽もそういったものの1つと言えますが、今回はあるサイトに出会ったことで、長年の夢のように感じていたことが実現してしまったというお話です。
生成系AI
生成系AIというものをご存知でしょうか?特に有名な物は画像生成AIですが、これは作って欲しい画像の雰囲気や画風などを言葉で伝えるだけで、それっぽいものを作り上げてくれるという素晴らしいものです。
これは今まで人間の手によって作られてきた大量の作品を読み込み、それを良い感じに何層にもジャンル分けをして、文字で頼まれた要望に近いものを混ぜ合わせて新しく作るという技術です。
画像作成以外でも、チャットでの文章のやりとりや音楽を作れたりとさまざまな事ができるようになりつつあります。そのようなわけだから、仕事が奪われるという話がよく出てくるのでしょう。
そしてえんじろうは、画像生成AIさんにはいつも大変お世話になっています。今回の記事のタイトル画像をはじめ、noteでの多くの画像はAIに作ってもらっていますから。もはやAI画伯と呼ばせてもらって重宝しています(笑)下の画像もそう。
プログラム生成AI
そしてそんなAIが遂に、こちらの要望を聞きとってプログラムを作ってくれる時代がやってきたのです。これはもはや、僕の部屋にドラえもんがやってきたと言いたくなるレベルの出来事でした。革命です!
空を自由に飛びたいなと言えば、タケコプターが出てくるのと同じく、こんなプログラムがあればいいのになあと呟いたことが現実にあらわれるのです。
本来ならば難しいプログラムの勉強をたくさんした上で、ようやくどんな事ができるのかを知るという世界なのに、何の予備知識もなしにただ話しかけて注文をするだけで、割としっかりしたものを作ってくれるのです。
お手製プログラム
それではここで、えんじろうがAIと共に作ったオリジナルプログラムをご紹介いたします。とすごそうなことを言ったところで、作ってくれたのはAIだし、元々ある便利な仕組みを組み合わせて作ったという感じです。
プログラム生成サイトでは、作ったプログラムを公開できるようになっています。そこで現在公開している2つのプログラムをご紹介しましょう。
1.お手軽メトロノーム
えんじろうは音楽家の端くれとして生きていますから、まず作ってみたかったものの1つがこのメトロノームアプリでした。
実は教室の生徒用に開発したなるべくシンプルに作ったメトロノームアプリです。特にオカリナで独奏をしたい時などには重宝するアプリです。基本となる拍子を選択し、さらにテンポを選択すれば準備OK。
あとはスタートボタンを押すだけでメトロノームが鳴り始めます。なっている間にリアルタイムに設定を変更することもできます。
特に売りの部分は、拍の打ち方を「単純」「2倍」「3倍」と切り替えられるボタンがあり、それによりテンポを計算し直さずより細かい拍での練習が行えるというのがあります。特に「3倍」は、三連符の練習をしたいときには有効です。
しばらくはこの場所で公開し続けておくつもりですので、良ければ使ってみてください。
2.日本語音声入力補助
こちらはつい先週まで何度も何度も調整をしていたアプリで、今まさにこのブログ記事を書くためにも利用しているものになります。
喋るだけで文字を入力することができたら、とっても素敵じゃないですか?そんな願いは現代ではもう実現しています。実際には20年以上前からそういうソフトも出ていたのですが、高価な上に精度もあまり良いものではなかったのです。
ところが近頃ときたら何もお金払わなくたってWindowsにもAndroidにも、普通に音声入力機能が備わっていたりするんです。しかも昔のものとはまるで違う精度で、まさに「聞き取る」という言葉がふさわしいような挙動です。
昔の音声入力がとっても耳の遠い人にゆっくりくっきりはっきりと喋っても「あんだってえ?」と伝わっていないことも多かったのが、現代の音声入力は電車の中で隣に座っている人に耳打ちするような喋り方ですら認識します。これを利用しない手はないというわけです。
中でもえんじろうはAndroidに利用されているGoogle製の音声入力がもっとも優秀だと感じており、それを利用するアプリを作ろうとしていました。でも同じアプリをWindows上で動かすと、なにやら違うものが立ち上がって認識をしているようです。つまりはAndroidが推奨でそのつもりで作ったけれど、なんかWindowsでも動くから良かったねという感じです。
長い文章を書きたい時、後からなるべく目を使った間違い探しをしなくて済むように、認識するたびに内容を音声で確認する機能を加えてあります。
音声入力機能が苦手な日本語の句読点の入力は、画面に用意したボタンからでも行えるようにしました。実はパソコンだとキーボード操作からも行えます。さらに改行やスペースにバックスペースと言ったボタンも用意して、口と手を両方使えば、かなり効率の良い文字入力ができると思います。
またGoogle音声入力では不要な半角スペースが勝手に入ることがよくあります。英数字も基本的には半角で入力されます。このため、不要なスペースを排除し数字も全角に、1文字だけの英語も全角に修正を加える「修正」機能も追加しました。
確認のための読み上げが必要ないと感じる人もいらっしゃるでしょう。読み上げ機能や日本語修正機能、連続認識機能などは右上の歯車アイコンから開く設定メニューでオンオフできるようになっています。ここでは他にも読み上げる音声速度や高さを調整できる機能など、自分が最低限欲しいと思った機能は全て取り込みました。
文章が思う存分書けたら最後に「コピー」ボタンを押せば、これまで入力された内容をクリップボードにコピーしてくれます。コントロール+Cでも同じことができます。
あとはLINEでもBlogでも、好きな位置に貼り付ければいいだけ。つかい方はあなた次第です。
このアプリもしばらくアップし続けるつもりです。よかったら試してみてください。
ブラックボックス
中身が分からない状態のことを「ブラックボックス」というそうですね。
実際にはファイルを開けば書かれたプログラムを参照できるのでブラックボックスではないのですが、えんじろうにとってはプログラムの知識がないせいで中身が見えたところで何を書いてあるのかさっぱり分からないわけです。
つまり自分で作ったといっておきながら、実際の業務はAIが行ってくれたため、結局えんじろうにとってはブラックボックスのままなのです。
だからこそ音声入力の話で書いたように、なんだか分かんないけどWindowsでも使えたからよかったね。という発言が生まれてくるわけです(笑)
とは言え、実際にファイルを開いてみると全く読めないほどぐちゃぐちゃな内容というわけではないのです。AIはこれまで人間が作ってきたプログラムを大量に学んで学習しているものなので、後からプログラマーが見返した時にわかりやすく書く方法も含めて学んでいます。だからよく見てみると注釈なんかもついていました。
教科書
そうなんです。これはある意味教科書であると考えることもできるのです。注釈つきのプログラムデータ。しかも、そのプログラムが持つ意味や何をするために作ったかというコンセプトは、それを依頼しているこちらが知っているのです。
さらにたいていの文章は英語が中心になって書かれています。知っている英単語だけでも拾い集めれば、あーこれがボタンの横幅を決めてる命令なんだなとか、こっちが音を出せっていう命令なんだなとか、そういったものが分かる時もあるのです。
まあ、虫食いのように部分的にわかる場合があるというだけの話で、プログラムというのはかっこ1つ付け忘れたりするだけでもごちゃごちゃになってしまうような繊細な世界のようですから、結局書かれているすべての文字を理解できないと扱えないのだと思います。
ですから、こういうものを組める人は本当にすごいなと尊敬しています。
夢のまた夢
それでも僕は「大きくなったらプログラマーになりたい」と思った小学3年生くらいの時期もありました。頭も目も全然足りないので、見事なまでに夢のまた夢なんですけど、何かを作り上げるということの魅力はずっと感じ続けていたのでしょう。
音楽だけでも実現できていることはとても幸せなことなんだと思います。
そして今こうして、とっくの昔にあきらめていたプログラマーっぽいことが体験できているのです。これは生まれた時代、生まれた場所にとても感謝するべき事だと思います。
まとめ
のび太君はドラえもんがいたからどうしようもないこになってしまったのかもしれません。でもドラえもんがいたから、誰よりも夢はかなうと信じることができ、やさしい心も失わないまま大人になることができたのではないでしょうか?
まだ3週間と経っていないプログラムAIとの出会いですが、果たしてえんじろうはこの先のび太君になってゆくのか?それはえんじろうがプログラムAIにお願いしてみたいことがどこまで続くのかによるのだろうって思います。