見出し画像

FastLabelのAI研究開発組織 "AI Lab"をご紹介します!

共同創業者で現在はAI研究開発組織を統括しております鈴木です。

このnoteでは、FastLabelのAI 研究開発部署であるAI Laboratory(以下、AI Lab)についてご紹介します!

創業経緯、自己紹介等興味あればぜひこちらもご覧ください。

以下のような方に是非読んで頂けたら嬉しいです!

・FastLabelのAI研究開発に興味のある方
・AI for AIに興味のある方
・MLエンジニアとしてのキャリアを広げたい方


研究組織立ち上げ背景

FastLabelのパーパスとして、「AIインフラを創造し、日本を再び『世界レベル』へ」というのを掲げています。

パーパスの詳細については、弊社代表の上田が、下記で想いを熱く語っておりますので、是非ご一読ください。

現在、アノテーションサービスおよびツールの提供に力を入れておりますが、アノテーション領域だけをやっていても「AIインフラ」という存在からは遠いのが実情です。今後は、アノテーションサービスを軸に顧客への提供価値を拡大していく必要があります。

AI Labでは、ML(機械学習)を活用することで、既存サービスおよびツールの提供価値をより一層高めると同時に新しい機能、サービスを創造して新たな提供価値をつくっていくという役割を担っております。

AI Lab’s Mission

AI Labでは

「MLを利用して顧客への提供価値を向上かつ創造していくこと」

をミッションにしております。
具体的には、

  • Development Deptと連携して、MLモジュールをプロダクトに実装する

  • BizDev Deptと連携して、MLアプローチな事業開発を推進する

  • AI Data Operation Deptと連携して、アノテーション代行の効率を上げる

などなど、さまざまな部署にMLを活用していっています。
*開発系の部署はAI Lab以外にもDevelopment Deptがあり、Development Deptがアノテーションツールなどのプロダクトの開発を行っています。

AI Labの組織規模は現時点(2023年3月)で非常に少数精鋭(フルタイムは私と大下の2名・・)のなかで奮闘しています!

What AI Lab Team Do

では、具体的に何をやっているか、またどんな価値観(バリュー)を大切にしているかをご紹介します。

大きく分けると「研究開発」「データコンサルティング(クライアントワーク)」があります。それぞれ紹介していきます。

研究開発

自動アノテーションモデルの研究開発


アノテーションコスト削減のために、弊社では自動アノテーション機能がプロダクトに実装されています。AI Labでは、Development DeptのMLOps Unitと密に連携して、自動アノテーションモデルのラインナップ拡充を行なっております。

Deliver Results, Bet on Technology

パーパスを実現するために「成果」と「テクノロジー」にこだわって開発を進めています。

例えば、プロダクトに実装されている自動アノテーション機能ですが、まだまだ自動化できてないカテゴリが多く存在します。

アノテーションサービスを提供する中で、対応できてないカテゴリの場合、MLエンジニアが直接APIを通じて自動化をしています。

自動化に時間がかかっていてはROIが合わないため、非常にスピーディに自動化サポートをするように意識しており、モデル調査〜自動化まで最短半日で対応した実績もあります。

自動化した後も本当にコストが圧縮されたのか、Redashに蓄積した作業データを振り返り、モデルの改善や機能の改善につなげています。

突発的に対応したモデルもDevelopment Deptにスクリプトを連携してプロダクトへ組み込んでいくことで、次回からはMLエンジニア不要で自動化が行えるようにしています。

このように、

  • ROIなど測定してきちんと成果を出せたのか

  • 次回から仕組み化できているのか

など、成果とテクノロジーにこだわって開発をしています。

自動化対応後にプロダクトに組み込んだ動物キーポイントモデル

大切にしているバリューに「No buts」があります。

先が見えない中でも、自分たちで、お客様や私たち自身の可能性の限界を狭めず、成果に向けて行動し続る姿勢を表しています。

例えば、今後自動アノテーションラインナップとして、点群データなど未知の領域のデータに対応した自動アノテーションモデルの開発があります。

現状、我々の中で点群データを扱ったエンジニアはいません。

そんな時も、限界を決めずにキャッチアップをして、対応を進めております。もちろん時には専門の人を外部に求めるときもありますが、できない理由を考えるのでなく、できる理由を考えて行動することを大切にしています。

Data-centric な開発を支援するML機能の研究開発

Data-centricなアプローチが今後ML開発においては重要になります。
Data-centricなML開発について詳しくはこちらをご覧ください。


AI Labでは、データセントリックなML開発を支援するために必要なモジュールを、AIの受託開発やコンサルティングなどを通して先行開発しています。

例えば、先日リリースしたデータクラスタリング機能は、後述のデータコンサルティング事業を通じて、必要になった機能を先行開発し、その後
Development Dept により、洗練された機能としてリリースされました。

データクラスタリング機能

顧客の課題を解決する中で我々が大切にしているバリューとして、 Issue Driven があります。

これは、最短最速で成果を出すため、本質的な課題のみを解決する姿勢を表しています。データクラスタリング機能もそんなバリューが体現された開発事例になります。

通常、技術者だと自分の好きな技術や興味のある技術を使ってみようや作ってみようということになりがちですが、そのような興味ベースの技術選定は行いません。

あくまで、お客様の課題を解決するために必要な技術は何かという姿勢を大切にしています。

合成データ研究開発

今後、AIのモデルを作る上で、主流になると予想される合成データの研究をしています。

Synthetic data will become the main form of data used in AI.

Gartner,
“Maverick Research: Forget About Your Real Data – Synthetic Data Is the Future of AI,”
Leinar Ramos, Jitendra Subramanyam, 24 June 2021

3D CG(Blender, Unity, Unreal Engine)、GAN、Diffusion Modelなどの技術を活用して、不足するデータを補う機能の研究になります。

Data-centricなML開発を高速に実行できるようになるためには今後、必要不可欠な機能になるでしょう。

データコンサルティング

顧客のデータ課題を解決するコンサルティング事業を行っております。

これは、アノテーション事業を行なっている中で、精度が上がらないけどどうすればいいかなど相談を受けることが多く、BizDevチームとともに立ち上げました。

実際、データセントリックな方法でモデルの精度を短期間で向上させることができ満足いただきました。

モデルの精度改善の他にも、多すぎるデータセットの中からモデルの精度を上げるためのデータを選定したいといったニーズから、Active Learning的なアプローチでデータ選定を支援した事例もあります。

このようにお客様ニーズに対して、MLアプローチで課題解決をしています。

FastLabelでは、Customer Geekというバリューを大切にしており、MLエンジニアも率先して顧客と対話して課題を直接聞いて解決をしていきます。

ここで利用した要素技術などは汎用化してプロダクトに取り込んでいき、ML機能の強化に貢献していっております。

全方位積極採用中です!

AI Labの取り組みや大切にしているバリューをご紹介させて頂きました!

少しでもFastLabelに興味を持って頂けると方はぜひご連絡ください。
私(@tkc79)に直接DM頂いても結構です!

皆様の応募、応援お待ちしております。
採用情報はこちらから!