2019年の振り返り
2/21に
の成果報告会があり、発表をしました。
成果報告会が終わるまでもう2019年が終わらない……という感じだったので、ようやく一息ついています & 2020年始まったな、という気持ちです(でもひとまず少し休みたい……とも言ってられないのですが)。
自分のテーマは「文章を自動生成するWeb執筆支援ソフトウェア」です。
AIを用いて、ライター(主に小説家)の執筆作業を支援するためのシステムを開発しました。
動画は、あらすじ生成と文補完を使って、実際に自分でショートストーリーを書いてみている様子です。
副産物として
というBotを作りました。
メンションでキーワードを送ると、そこからSFっぽいあらすじを生成してリプをします。Twitterで稼働させるにあたっては色々と制限があり、出力の質は低い事が多いのですが、Twitterにはしゅうまい君などの面白いbotがあるので、それと同じように気楽な気持ちで遊んでみていただけるとありがたいです。
当日は、直前に行われたプレゼン合宿などのおかげで、自分含めてみんな良い発表ができたと思います。
結果、育成対象者4人全員がAIパスファインダーという称号をいただくことができました(未踏で全員が称号を貰うのは初とのこと)。自分はAIパスファインダー(共創)です。。来年以降どんどん()の中身が増えていくことでしょう。
振り返ると、自分にとってはなかなか壮絶な一年だったので、備忘録として書き残しておきたいと思います。
また、AIフロンティアプログラムがいったいどんな取り組みなのかわからない方も多いと思うので、来期応募しようか考えている方々の参考にもなれば幸いです。
〜2019年1月
まず、採択される前の経緯から。
自分は筑波大学の学生で、1年生の頃から研究活動をしています(この話もすると長いのですが今回は省きます)。
ただ、実は卒研配属ではそれまでいた研究室と別のラボを第一志望にしていました。
それまで応用研究を主にしている研究室にいたのですが、神経科学が好きなので、思い切って卒研ではそれを専門にしているラボに行こうと考えました。大学1年生の終わり頃にAIを学び始めたのも神経科学からの興味だったので、もう少し基礎的な研究をしてみたいという気持ちがこのときはありました。
せっかくなので好きな本を貼っておきます(アフィリエイトとかではないです)。
しかし、そのラボに配属されることはありませんでした。定員がオーバーしていたのです。基準はそのラボの先生が行っている授業の評価でした(自分はBで、他の人はAかA+だったらしい)。
事前情報を全然仕入れていなかったので、「まじか〜……」となり、落ち込みました。
そして、なんだかんだで、それまで所属していた研究室に配属になりました。
第一志望のラボにそのまま通っていたら今の研究は始めていなかったはずなので、応募することもなかったと思います。なかなか不思議なものです。
そんな折、たまたま知り合いから、AIフロンティアプログラムというものを教えてもらいました。
これまでにも未踏の先輩ですごい方が大勢いらっしゃるのは知っていましたし、自分がAIを始めた時色々教えてくれたのも、未踏スパクリを取られたラボの先輩でした(そのときはまだ未踏のプロジェクトをやられる前でしたが)。なので面白そうだと思い、応募してみることにしました。
応募したテーマは、先程にも述べたように「文章を自動生成するWeb執筆支援ソフトウェア」です。自分は趣味でたまに小説を書いているのですが、テーマを考えるのは好きだけど、ものすごく遅筆なのでそれを支援してほしいという気持ちがありました(執筆作業だけを取るなら、論文執筆の方がだいたいの型があるから楽だと思っている自分)。また、自然言語処理を全然したことがなかったので(seq2seqでTwitterのBotを作ったくらい)より深いテーマに興味があったのもあります。
その頃はちょうどこの本を読んでまとめていました。
2月
ガラッと変わりますが、量子コンピュータのハード・ソフトを開発しているベンチャーにインターンに行っていました。
インターンではゲート型・アニーリング型の基礎を教えていただきました。せっかくなので勉強したことをまとめておこうと思い、同人誌を作って技術書典で頒布することにしました(技術書典9、なくなっちゃいましたね。情勢的にどうしようもないですがかなしい)。
見ての通り、自分は興味が発散してしまうので、この頃はめちゃくちゃ進路に迷っていました。その後1年間悩み続けることになるわけですが……
また、AIフロンティアの面接がありました。
この頃GPT-2がOpenAIから発表され、生成された記事が精巧すぎて危険? と話題になっていました。
それまで違う技術を使おうと思っていたのですが、これを日本語で学習すれば文章執筆の支援に使えるのではと思い、面接のスライドをGPT-2を使うことを前提としたものに書き換えました。
そして、採択が決まりました。
3月
キックオフがありました。
また、技術書典の原稿を書いていました。
開発の方は、右も左も分からない状態だったので日本語BERTをいじったりしていました。
4月
技術書典が終わり、ようやく開発に専念し始めました。
とりあえず日本語WikipediaでGPT-2を学習させていました。
5〜7月
とりあえずGPT-2で文章生成するデモを作ったのですが、そこからどうするかいっさい思い浮かばず、迷走していました。
ラボにも行かずに、悶々とした日々を送っていました。
進路をどうするかと開発で行き詰まっていましたが、とりあえずなにかしようと、類似文検索を実装しました。
世間的にも個人的にもつらい事があったり、進路も悩んでいて、さらに開発は何も進まず、この頃が一番しんどかったです。
8月
中間報告会でボロボロに叱られ、このままではマズいと思いました。
他の方が優秀だったり作業量がすごかったので、とても惨めでした。
落ち着いたところで初心に帰って、ひたすらデータ収集と前処理をすることに決めました。
また、他大の院試を出願していたのですが、気持ち的にそれどころではなくなってしまいました。
9月
ずっと行っていなかったラボに行き始めました。
やっぱり、人に話すだけでも少し楽になります(本当に重要)。
行き詰まっている人は、自分で抱え込まずに誰かに話すことがとても重要です(人と話すことが苦手な僕が言うんだから間違いないと思います)。
また、昼はインターン(2月に行っていた会社とは別で、自然言語処理のR&D)に行っていたので、往復で計2時間通勤して8時間勤務し、帰ってきたあと自分の開発やデータ収集、前処理をしていました。
データの処理はコードとにらめっこする場面もありますが、それよりも待ち時間が長いので、必然的に作業が長引くことになります。
作業時間も多かったですが、それよりも、これで果たして前に進めているのかわからなかったのがなかなか厳しかったです。
しかし、周りに相談もせずに行き詰まっていた自業自得なので、なんとか挽回しようと必死でした。
中間報告会では一応前に進んでいるという評価で、少しホッとしました。
10月
卒研の中間発表がありました。卒研では開発したソフトの評価実験をすることにしました。
この頃英語で文補完をしているインターフェースのデモを見つけ、なかなか良いと思ったので、日本語で行えるようなデモを作り始めました。
また、インターン先で評価してもらえたようで、引き続き週1でインターンに通うことになりました。
余談ですが、それまでライブに行ってみたことがほとんどなかったのですが、バンナムフェスというライブで楽しさに目覚めました。
今は至るところでライブが中止されている状況ですが、色んな人の心のオアシスになっているのは間違いないので、どうにかなってほしいと切に願います。
11月
収集したデータの前処理がようやく終わり、学習を回し始めました。
同時に、小説データを用いてあらすじ生成をするデモを作りました。少しずつですが結果が出始めたので、この頃にはプログラミングがけっこう楽しくなってきました。
月末には最終報告会がありました。
文補完のデモをその場で使ってみたところ、なかなかおもしろい結果になったので場に笑いも生まれ、そこそこ評価をしていただけたと思います。
ただこの最終報告からがまた長かったです。
12月
色々と迷っている中で受けた夏の院試は全落ちしていました…笑(そのときは今在籍している大学は受けていませんでした)。なので冬入試でどうにかする必要があり、説明会に行ったり、出願作業をしていました。
中旬にIPAの未踏の方々と合同で合宿があり、来ていただいたOBの方々の前で発表しました。プレゼンの方をほとんど整えていなかったのもありますが、全体的には厳しい評価だったと思います。
2020年1月
卒論の評価実験と執筆を進め、それでほぼ終わりました(結局締め切り前が一番捗るタイプなので、締め切り前日に徹夜で仕上げました)。
院試は結局、筑波だけ受けました。
2月
頭にプレゼンのための合宿があり、みっちり鍛えられました。その後3週間に渡ってプレゼンを考え続けました。
この間考え続けたおかげで、どうして自分が今、なぜこのプロジェクトをやっているのか、それまで気付いてはいたものの上手く言語化できていなかったことを、ようやく言葉にできるようになったと思います。
また、卒論発表を無事終えました。
ラボの先生にあらすじ生成の結果を見せたところ高評価だったので、少し自信が湧きました。
ここで急遽Twitterであらすじ生成するbotを思いつきで作りました。半分趣味です。せっかくのTwitter botなのでトレンドワードを条件にして生成するようにしているのですが、なかなか難しいです。
院試は受かっていて一安心しました。
そして、発表前日に直前合宿が行われました。
当日の朝にようやくプレゼンの内容が固まった気がします。この時点ではけっこういい内容のプレゼンができるのではという自信がありました。
そして発表となりました。リハーサルの際に機材のトラブルが発覚しましたが、なんとか終えられてホッとしました。反応も良かったと思います。
書き並べてみるとあっさりしていますが、自分にとっては本当に濃い一年でした。
最後の方はメンターの方々の想いにも応えねばと、みんな必死だったと思います。
事務局の方々など色んな方のお世話もあり、なんとか当日を終えられたのがまず何よりホッとしています。
これからについては、ソフトの開発を進めていくのと、自分でも開発したソフトを使って文章を書いていくつもりです。
ただ自分で使って思ったこととして、ブログのように内容がカチッと定まっているものよりも、小説などの創作に使った方がランダム性が出て良いな、という感覚があります。
まだサービス化などは整っていないのでどういう形になるかはわかりませんが、いつか物書きの皆さんに使っていただけ、役立つものになるよう準備を進めていきたいです。
ではでは