ジョージア在住、学会受賞常連エンジニアが、IVERSE開発に熱狂する理由

2022年12月20日 08:20

BTC（Business・Tech・Creative）で組織を構築するのが一般的な今、個性で繋がり、繋がりから個性が見つかるIVERSEを開発するVARIETASではBTCに、Data・R&D・Brand&Humanを足した六角形で組織を構築しています。

BTCの領域（表の領域）は相対的に見てわかりやすい領域、パラダイムシフトを起こす競争優位性の構築や協調・共感を集めるためには裏の領域が必要だと考え、3年試行錯誤しながら六角形での組織運営を作り上げ、さらに磨きをかけています。

今回は、そんな組織においてR&D領域を担うメンバーを紹介します。

自然言語処理技術を、新聞社・商社に転用した特殊なキャリア

ーこれまでどのようなキャリアを歩まれてきたのか教えてください。

大学で所属した学部は物理学科でしたが、大学院から情報系の学部に移り、自然言語処理分野の研究室に入りました。そこで”自動要約”という分野の研究をしました。長い記事を入力した時に、AIが勝手に短い文に要約してくれるアルゴリズムを考える、というようなことです。

大学院でこの研究を続け、新卒では朝日新聞社に入りました。特殊な就職先だとよく言われますが、AI技術が日本の意味あるところで活用され、普及していく基盤をつくれる場だと思いました。言わずもがな新聞社なので、日本語のデータが大量にあり、しかも自然言語処理に関するR&D部署を新規立ち上げるという話をもらったので、自分がやりたいところにピッタリだと感じました。

「新聞社なので、日本語のデータが大量にある」とお伝えしましたが、大学の研究室で扱うデータって、英語データが大半だったんです。というのも国際会議で評価されるには、英語データを用いて英語の論文を書くのが定石だからです。そういう風潮を見て（このままだと日本は、AI技術が普及する基盤が整えられず、どんどん後退してしまうだろうな）と感じました。

朝日新聞社では、記事の自動要約と自動校正のR&Dを5年行いました。どんなものを作ろうとしていたかというと、こういうAPIです。研究から取り組み、既存のツールを使うだけではないオリジナルなAPIの作成に取り組みました。

自然言語処理技術を用いたR&Dは非常に面白かったのですが、機械学習が応用される領域を、”新聞社の記事”という領域からもう少し拡げたいと思い、”鉛筆からロケットまでの事業を扱う”、と言われたりする商社のDX組織にデータサイエンティストという肩書で入社しました。いろいろなトピックで機械学習を転用できる商社は、それはそれで楽しい環境でした。通常商社は、事業投資と貿易の大きく2つの事業を行なっています。そのうち、貿易業務では、さまざまな商品の将来価格の上がり下がりを把握しておくことが重要で、私は商品価格の予測などを行なっていました。

その後、IVERSEを開発するVARIETASに関わることになった形です。

AIが社会に役に立つポイントを探した結果、たどり着いた”解きたいタスク”

ー人見さんのメインの研究領域は自然言語処理領域、中でも要約領域の色が強いと思いますが、その分野を選んだ理由って何かありますか？

僕は本を読むのが好きなのですが、正直「長くてたらたら書かれている本も多いな、、」と感じたのが出発点で。ビジネス本が毎月10冊分要約されて冊子で届く、みたいなサービスもありますが、そういうことをもっと簡単に自動化できたらいいのにな、という気持ちがありました。

ー自然言語処理を扱う領域として、新聞社や商社のような”日本独自のものを生み出せる領域”をあえて選んでいる方は結構まれかと思います。その領域にどんなチャンスやチャレンジがあると思いますか？

AIが社会で役に立つポイントはたくさんありますが、人のためになるところまで到達していない領域がたくさんあります。そこに挑戦したいという純粋な気持ちがあるのと、そこに今後のビジネスチャンスがあると思っています。

例えば海外では応用段階に入っているのに、大規模な日本語のデータがないがゆえ、日本では役に立つところまで到達してないことがたくさんありました。つまり、AIが役に立っておらずまだまだ発展させられる場所がすごくあるんですよ。技術って人の役に立ってこそだと思うので、社会に役立つことをしたいと思ったときに、未踏領域である”日本語データを大量に作りこむ”ということ、それを”みんなが使える形にすること”、そしてそれを活かして”皆が使えるツールをつくること”をやってみたいと思いました。

英語、フランス語、中国語をベースにした研究って、その言語を使う人口が多いゆえ、データの量も多いですし、研究者人口も多いので良いツールが勝手に出てくるんですよね。当時僕が社会人になったばかりのころは、機械学習のの国際会議で、日本は6番目*に強い立ち位置だったのに、日本語のツールが少なく、しかも大規模なデータ整備もあまりされていない、ちょっと異常事態が起こっていました。だからこそ、そこに取り組むのは、すごく意義があると感じていました。

*参考記事

民間人としてはレアな4年連続で賞を受賞

ー日本語のデータ整備、ツールづくり、という分野に取り組まれた中で、どのような実績を残されてきたのか、ぜひ聞いてみたいです。自慢話ウェルカムです！

チームの成果になりますが、日本の情報系学会の中で質が高く、受賞率の低い言語処理学会等で4年連続、賞を受賞しました。

ー4年連続・・・？！

毎年受賞してる人はいるんですが、基本的には日々研究に励むアカデミックの方たちがメインです。私の知る限りでは、民間で研究開発をしていた方でここまで連続受賞している方はほとんどいないと思います。

ー何が評価されたんだと思いますか？

下記3点が評価されたと思います。

実アプリケーションまで意識した研究
アカデミックの方々が疑問に感じたり課題に感じることを論文内で説明したり、解決したりできていた点
大規模なデータをアカデミックコミュニティーに還元することに成功した点

国内では実アプリケーションまでの連結を意識している研究が少ないです。その上でアカデミックの方からも評価される形まで昇華されている研究も少ないです。また、日本語の言語資源を企業の外に出すのは一般的に難しくて、意義の割にあまり取り組まれていないので、その部分を網羅しながらアウトプットできたのが良かったのではと思っています。

ー4年間、一貫したトピックを扱ってどんどん論文内容を深めていったのでしょうか？

そうですね。1回目は、大規模な日本語データで要約APIをつくったデモで受賞しました。その後、要約の文字数・長さをコントロールする技術に取り組んだのですが、既存研究の手法が本当にうまく実運用にのる技術なのか分析検証して、実は結構問題があることを発表したのが2回目の受賞です。

3回目は2回目の分析で見つけた課題を解決するためのデータセットを作成し、その問題を解決した論文での受賞です。最後の受賞は、PR記事の見出しをAIに生成させる際に、特定の文言を必ず含ませる研究です。例えば、新商品の「iPhone 14」のPR記事の見出しをAIに生成させるなら、必ず「iPhone 14」が入っていて欲しいですよね。でもこれまでのAIでは「iPhone 14を必ず入れて！」って命令しても100%その文言を入れることができなかったんです。Facebook AIリサーチが取り組んで、指定した文言の約34%の確度で反映されるようになった、という論文があったり、Salesforceリサーチが約95%の確度で出せるようにできた、という論文はありました。

でも、実務で使うなら100%の精度がないと使えないじゃないですか。そこで100%の確度で指定した文章を含む見出しを生成する、という研究に取り組んで成功させました。

これは解ける、とパッと分からないタスクが面白い。そしてそれがIVERSEから生まれる

ー100%にしてしまうとは、、、
人見さんって、ある技術が世の中にどう役立つのか？というところから逆算して、クリティカルなところを問題提起したり、それが実現可能性あるかどうか、というところを研究されているところが印象的ですね。スタートアップって、自然言語処理技術をベースに、様々な問題解決を検証しているテック企業も多いと思うんですが、”自動要約”という分野以外でも、検証に取り組める領域ってまだまだあると思いますか？

取り組める領域は無限大にあると思っています。

ただ、基本的にリソースが限られているスタートアップで技術検証を進めようとした場合、”こういう課題があって、ここは今の技術をベースに解決できそうだから進めよう”という形で、まず解決イメージが見えるところから取り組むケースが一般的と思います。

それはもちろん意味があることですし、リソースに制約があるのでなおさら大切な観点だと思うのですが、個人的に最近は、”これは解けるな”と分かっちゃうものに、面白さを感じなくなってきてしまったのです、、、涙

でも、VARIETASがつくろうとしているIVERSEは、構想はもちろん、もらうタスクも面白そうだと感じますし、もらったはいいものの「どうやったらいんだろう」と悩むことが多くて。そこにとてもやりがいを感じています。

ーVARIETASの特色として、実現可能性の前に「これが解決されたら、世の中的にインパクトがあるか？」というところに優先順位がありますよね。

VALUEに”Innovation Stack”という言葉がありますが、通常技術だけでは解決できないから、最先端技術を探して組み合わせて解決する、結果イノベーションが生まれる、というケースが多い印象があります。

そうですね。良い意味で最終的に着地するか分からないところが、エンジニアとしてすごく面白いです。グラフデータベース構造という、あまり実応用で使われていないアプローチを取っていることがそもそも面白いですし、そのアプローチ方法が通常と違うからこそ、工夫の仕方や手段も全く変わってきます。タスクと機械学習を組み合わせれば無限のアプローチが出来ると思うので、工夫のし甲斐があって楽しいです。

IVERSEのTech領域の強みとしてグラフデータベースを採用していることが挙げられます。

パーパスである”Friction0”を、組織全体で実践できている場

ー「道筋が見えないこと」に良い意味で興味を持ってくれたと思いますが、それってどうなの？と思われる方もいるかもしれないので（笑）他に興味が湧いたポイントがあればぜひ教えてほしいです。

他にも色々ありますよ（笑）

VARIETASはミッションを「Friction 0」としていて、その考え方が素敵だなと思いました。その考え方をベースにした「Innovation Stack」と呼ばれる行動指針もありますが、VARIETASの場合「Fricrion0にするために、こんなこと出来たらよいよね」という机上の議論で終わらず、行動指針を実践しながら回っている組織だなと、面接しながらも入社しても感じています。僕もこれまでの人生、結構Friction感じまくってきた人生だったので、そういった意味でもカルチャーフィットしているのかなって思ったり。IVERSEのプロダクトコンセプトのベースにある”平等フィット”も共感するところが多くて。

ー具体的に、どんなところに共感されましたか？

学校って履修する科目が固定されていたり、様々なルールに則った学生生活を余儀なくされることも多いですよね。僕はそういったフリクションに耐えられずに、高校を辞めています。世の中一般的にみると、きれいにキャリアを歩めてきたというよりは、いろいろ紆余曲折ありました。なんだかんだ頑張り続けたから、今、なんとかこういう形になっていますが、これまで結構大変でした。

だからこそ、人が、学校や会社といった目の前の機会に自分を合わせに行くのではなく、機会を自分に合わせていく”平等フィット”に取り組むこと自体、僕の人生でつらかったところを解消してくれる感じに近いと思います。

あと、VARIETASの一次面接で、ドイツ出身の方と中国出身の方がいきなり出てこられて。VARIETAS（＝ラテン語でいう”多様性”）という名前そのもの、国際色豊かなところを体現していて、信憑性がある、と感じたのも良かったです。何より、僕は今ジョージアに住んでいるのですが、海外からフルリモートワークすることに快くOKしてくれるところもすごく良かったです。僕のジョージア時間に合わせて抜本的にミーテイングの時間を変えてくれる柔軟性もあって。

ージョージアの風景みたいです！

ちょっとお待ちを（笑）

ー画面越しにジョージアの風景が見えて、こちらも心が開放的になっている気がします（笑）実際入社してみて、働き方はどうでしょうか？

価値観を押し付けられたり、細かくマネジメントされたり、ということは一切ないです。日本時間で絶対活動してほしいとか、この時間からこの時間はマスト、というようなルールも一切ないです。アウトプットをちゃんと出して、ちゃんとコミュニケーションとっていたらOKというスタンスなので、なんていうか、僕は日本にいないですが働き方においてFrictionを感じたことは一切ないです。本当にミッションを実現している感じがします。

ーこちらも人見さんが入ってくれて、事業のFrictionが一気に消えてます！人見さんが入られる前は、我々であれこれ調べて学習しながら自然言語処理と画像処理を数か月かけてやっていたんですけど、その時に感じたFrictionを人見さんは1週間でなくしていて。難しそうだと社内で頭を悩ませていたのに、実作業1日ぐらいで解決の方向性見せてくれたときは感動しました。

自然言語処理は9年近くやっているので、さすがに得意分野です（笑）

ー画像処理の問題も、パパっと解決してくれたのもすごかったです。

最近ではほとんどの画像処理と音声処理の技術って、自然言語処理由来のTransformerというモデルをベースにしてます。なので、言語処理をやってる人からすると、画像処理も音声処理もめちゃくちゃ簡単に取り組めるんです。なので、特に課題解決に難しさや新しさはなかったですね。

今、自分が持っている技術で解決できることはある程度解決できた状況なので、今後、データベース技術として採用している”グラフニューラルネットワーク”と機械学習の掛け算がすごく楽しそうでわくわくしています。

ーどんな化学反応が起きるのか、こちらも楽しみです！

IVERSEのデータ戦略上、化学反応を最大限起こすためのデータが、大量に整備されていることもすごく良いところだと思ってます。というのも、データがないと機械学習エンジニアって何もできない職種なので、、！

1社目に入社したところは、データをどうつくっていくか、というところから問題だったりしました。社内データを捨てさせないようにみんなに交渉するとか、そういうところからやっていました。

VARIETASでは、意味あるデータベースにするために、プロダクトをつくる初期段階からデータを作りこんでいる部分に感動しました。エンジニアが活躍できるベース体制が整備されている感じがします。よくよく聞いてみると、入社する前にDBを整備するプロジェクトを走らせてくれていたようなのですが、その方たちのおかげだなと思います。土台を作る人、その上に建築物を建てる人がきちんと連携とれたチーム体制です。

グラフデータベース構造から始まり、無限に広がる可能性。この模索しがいを楽しむ

ーそんなチームが生み出す、IVERSEに感じる期待を教えてください。

正直、このプロダクトで平等フィットを解決できたときのインパクトはすごいと思います。そのインパクトを実現するためのプロダクトアイデアが日々アップデートされている状況です。いろいろ実験しながらゴールに近づけていく、その改善サイクルを回すすごい現場が今後用意されることも決まっています（資金調達発表時に分かります）。壮大な構想があるだけではなく、構想を社会実装に向けて落とし込むべきところに落とし込めている、そういうところがすごく良いと思います。

面接で一回IVERSEの話を聞いた時には全然理解できなくて、入ってようやく理解しました。なので、今後カジュアル面談に来られる方も理解するの大変な部分あると思います（笑）

ー伝え方、日々日々工夫していきます・・・！最後に、IVERSEの開発は、どのような人にとって面白い環境だと思いますか？

技術的に未知の領域に取り組むことに対して、楽しんで進み続けられる人だと思います。というのも、先ほどもお伝えしましたが、IVERSEは世の中にある既存ツールを使っているだけでは、タスク設計が特殊すぎて解決できないからです（笑）サービス設計がカチッと決まっている中でいろいろな可能性を探るというより、how自体が自由だから、R&D的な観点でやれることはたくさんあります。模索しがいがありますね。

特に、グラフデータベース構造になっていること自体が良い意味で特殊で、その先にグラフデータベースの構造なのに、”ハッシュタグ”という個人の特性を示す文字列情報が出てきたり、ハッシュタグを過去から現在までつむぐことで自身のポートフォリオが出現したり。さらに、人とのつながりも生み出そうとしているので、ユーザーがハッシュタグをベースにしたコミュニティとつながったときに、満足できる体験が得られるか。既存技術をツールとして使うだけでは解決できない項目が山ほどあります。

機械学習エンジニアには、”ツールを使いこなしてコスト低く利益を上げたい”という人もある一定数多いと思いますが、IVERSEで解決したいことは、設計から深く考える必要があります。人のためにちゃんと役に立ち、しかも売り上げがたつ仕組みになるか、という単純な思考ではなんとかならない問題を解いているので、考えることが好きな人には面白い環境だと思います。

人見さん、ありがとうございました。

今回のインタビューで語られた”平等フィット”という考え方や、VARIETASの働き方、誰も解き方が分かっていない未知な領域で自身の技術を活用したいと思っている皆様、ぜひカジュアル面談にてお待ちしております！

■積極採用職種
・UI/UXデザイナー
・アプリエンジニア

■会社紹介サイト
https://varietas.co.jp