エンジニア転身希望のリンギストが自然言語処理のAI SaaSで挑戦したこと
この記事は、MNTSQアドベントカレンダー2022の11日目です。
前回のPdM大野からバトンを受け取りました!
振り返り: エンジニアに転身して1年半
こんにちは!MNTSQ(モンテスキュー)の坂本です。アルゴリズム・エンジニアとして入社してから1年半が経ちました。契約業務SaaSのUXを支えられる、よいモジュール(ソフトウェアの部品)を作ることを目標に、この1年でどんなことに取り組んで来たかご紹介させてください。
もともと前職では、いわゆるリンギストの仕事をしていました。リンギストとは英語で書くとLinguistで、直訳すると「言語学者」なのですが、産業界では、言語データの作成に携わるメンバーのことを広く指す用語として使われているようです。製品のローカライゼーション(海外展開)のためにマニュアルやUIの翻訳プロジェクトを担当したり、自然言語処理や機械学習のエンジニアと組んで、辞書やコーパスといった言語データを作成したりする場面で活躍していることが多いようです。
外資系の求人だと、英語だけでなくカタカナの「リンギスト」もよく見かけます。また、日本の自然言語処理界隈だと「言語屋さん」と呼ばれているのを見聞きします。(実は、この記事は、最近Webで見かけるようになってきた「リンギスト」という言葉をもっと広めたくて書きました。)
私も2010年に社会人になった当初は、言語処理のロジックの部分を作ったり、機械学習向けのコーパスを構築したりしていました。やがて、製品上で動作させるためのソフトウェアエンジニアリング部分もできるようになりたいと思うようになりました。MNTSQはリンギストの経験も活かしながらエンジニアに挑戦させてもらえる、しかもドメインエキスパートも在籍しているアツい会社だと思い、2021年の6月に入社しました(当時のブログ)。
入社してしばらくは、エンジニアとして半人前なのに、データ作成に必要なドメイン知識がないとリンギスト時代のデータ分析スキルも活かせないという現実に直面し、焦る日もありました。
しかし、法務・契約のドメイン知識や、チームの開発に参加させてもらうための最低限のコーディング、それからなんといってもPMF(プロダクト・マーケット・フィット)を維持するための領域横断のコラボレーションに必要なコミュニケーションを頑張りました。
商談に出ているメンバーや契約の実務経験のあるメンバーにニーズをヒアリングしたり、アルゴリズム・エンジニア以外のメンバー向けに、数式を使わずに具体例で自然言語処理を説明する入門講座を開いて、製品のどの部分に言語処理の技術が使われているかを紹介しました。
相手のことを知り、また自分のことを知ってもらうための手探りの期間が長かったですが、ここ半年くらいで少しずつ、どんなコミュニケーションを取ればよいか、何をどの順で進めれば良いかについて、自分が実現したいと思ったイメージに、頭と手がついてくるようになりました。
結論: リンギスト時代の知見も役立ってます
MNTSQの自然言語処理の特徴は、ドメイン特化型であることです。社内に在籍している法務・契約分野のドメインエキスパートとの連携が必須です。
私が入社したてのころにくらべ、法務分野のドメインエキスパートの人数も約2倍となり、コーパス構築プロジェクトの数が増えました。
初期に構築したコーパスを見直したり、増設したりする動きも増えました。AIの動作を現場で役立つように調整するには、コーパスに含まれる要素のバランスを調整するのがよいのですが、ここで、以前のリンギストとしての知見を実際に役立てられるようになりました。たとえば下記のような部分です。
多義語、同義語への嗅覚が比較的鋭い
言語データを眺めると同時に文法的にも解析して全体の傾向を掴む
傾向と同時に、例外的な振る舞いをしている箇所も拾う
特定ドメインの言語データを見た時に、専門用語のオンパレードに対して心底面白いと思うことができる(分析が苦でない)
専門用語が面白いと思った事例は、下記のブログの最後にあります。
コーパス構築のプロジェクト・マネジャー的な、参加メンバー間の仕事をつなぐ役割も担当し、仕事の幅を広げられたと思います。
周囲のメンバーと話して考えて、キーボードと画面の先にあるコードに反映して、AIの処理結果を作って、再度、周囲のメンバーと考えて改善するというサイクルが、ようやく自然とできるようになってきて、嬉しいです。
来年の目標
契約業務SaaSのUXを支えられる、良いモジュールを作るため、引き続き下記の事柄を伸ばしていきたいです。
エンジニアリングを向上させる(ソフトウェア・エンジニアリングと機械学習)
ドメイン知識を増強する(法務や契約締結にまつわること)
価値仮説の検証から、予備実験、開発、効果検証、改善のサイクルを回してみること
MNTSQアドベントカレンダー2022、次回の投稿は、リーガルドメインで活躍中の阿部にバトンをお渡しします!お楽しみに!