見出し画像

今だからこそ、Sansanで挑戦するデータ活用の最前線

はじめに

こんにちは、Sansanで働いている猿田貴之です。
2023年6月に入社し、現在は技術本部研究開発部に所属しながら、Sansanのプロダクトマネジャーも務めています。入社から1年が経ち、現在の取り組みについて少しお話ししたいと思います。

日々の業務の中で、まだあまり知られていない興味深い取り組みもあります。もしご興味があれば、コメントやメッセージでお気軽にお声がけください。

生成AI技術によるサマリー

自分自身が行なっているSansanでのデータ関連技術マネジメントについて書いています。主要テーマは海外名刺デジタル化、海外企業データ収集、名寄せ技術開発、社内横断データ基盤やSansan Labsを通じた営業DX推進です。機械学習・データエンジニアやプロダクトマネジャーを募集中です。


Sansanにおける私の役割

Sansanは、名刺・企業情報・営業活動情報を一元管理する営業DXサービスを提供しています。このサービスの核心は、人物情報・企業情報・営業活動情報を統合し、全社で共有することにあります。

私の役割は、このサービスを支えるデータ関連技術のマネジメントです。具体的には、以下の4つの主要な技術テーマに取り組んでいます:

  1. データ化する:アナログな情報をデジタルデータに変換する

  2. データを集める:多様なソースからデータを効率的に集約する

  3. データをつなぐ:異なるデータセット間のデータを関連付ける(名寄せする)

  4. データを活用する:収集・連携されたデータの効果的な利用を実現して促進する

これらの技術テーマそれぞれにおいて、現在さまざまな課題にチャレンジしています。以下では、各テーマにおける具体的な取り組みについて詳しく説明します。

1. データ化する

名刺のデジタル化は、Sansanのサービスにおいて重要な役割を果たしています。特に、日本語の名刺については内製のOCR技術を利用して、自動化を進めてきました。この内製OCR技術により、手作業による入力の手間を大幅に削減し、高精度なデータ化を実現しています。

さらに、海外の名刺に関しても同様に内製のOCR技術を適用することで、圧倒的な精度とコスト低減を図りたいと考えています。これにより、グローバル市場における競争力を高め、技術力を強みに海外展開を加速していくことを目指しています。

私は海外名刺向けのOCR開発のプロジェクトを推進しながら、提供国向けの名刺データ化フローを検討しています。市場調査などもメンバーとともに進めており新規事業開発に近い点も多く刺激的です。

先日行われたMIRUという国内学会では本プロジェクトでも利用している内製Vision & Languageモデル(Viola)のデモを行いました。技術の大きな進歩の中で事業展開はスピードを求められることを日々感じています。今後はマルチリージョンやマルチプロダクトへ提供することを検討しているので下記のような方はやりがいがあるかと思います。

  • グローバルにプロダクトを展開したい方

  • 基盤モデルを作りつつ、いち早くニーズにフィットしたモデル改善を回すような仕組みを作りたい方(機械学習エンジニア、MLOpsエンジニア)

2. データを集める

Sansanでは、多くの企業データを活用することが可能です。特に日本国内においては多くの企業データを保有しており、それを効果的に活用しています。しかし、海外の企業データに関してはまだまだ手薄な部分が多く、データ収集から行う必要があります。

海外企業データを充実させることで、以下のような効果を期待しています

  • グローバルの顧客へのプロダクト展開:より多くの海外企業データを活用することで、Sansanのプロダクトをグローバル市場に展開しやすくなります。

  • 日本からグローバルへの営業サポート:日本企業が海外市場に進出する際に、必要な企業情報を提供することで、効果的な営業活動をサポートします。

私はグローバルのメンバーと企業データを収集する国、調達先、調達するデータ項目の検討や、調達した企業データを用いた検証などを進めています。海外企業データを収集し、プロダクトへ連携するフローを確立して多くの国々の企業データを連携していく足がかりにしたいと考えています。こちらは下記のような人はやりがいがあるかと思います。

  • グローバルにプロダクトを展開したい方

  • データ収集からデータを用いた価値まで一気通貫でプロダクトマネジメントしたい人・出来る方

3. データをつなぐ

多種多様な企業データを効果的に連携させるためには、名寄せ技術が重要な役割を果たします。しかし、このプロセスには多くの難しさが伴います。異なるデータソースから収集された企業データは表記の揺れや欠損データが多いため名寄せは非常に難しいです。さらに、新規設立、合併、廃止、拠点の増設などを理由に企業データは日々変化しているため、過去から現在に渡っての企業データへの追随を求められます。

これらの課題に対処するために、以下の取り組みを行っています:

  • 高度なマッチングアルゴリズム:高度なマッチングアルゴリズムを導入し、異なるデータソース間での正確なマッチングを実現します。

  • 正規化技術の開発:異なる表記やスペルミス、略称などを正規化することで、同一企業・組織・住所などを正確に特定します。

  • 企業データの更新:企業データが日々変化する中で、常に最新の情報を提供できるようにするために、データの更新を行っています。これにより、企業の新規設立、合併、廃止、拠点増設などの情報を迅速に反映します。

私はNayoseグループのプロダクトマネジメントを主に行なっています。具体的にはNayoseグループのプロダクトバックログとプロダクトロードマップ管理を行なっています。

Nayoseグループが開発・運用している名寄せシステム(IDs)はSansan社内のほぼ全てのプロダクトが利用しているため要求も多岐にわたりますが、多くのデータを扱えるのでやりがいがある仕事です。

また、Sansan社がマルチプロダクトを展開してビジネスインフラになるというビジョンを達成するために必須の機能であります。

さらにはドメインモデルを再構築してリアーキテクチャすることにも並行して挑戦しています。技術的な課題を先日公開したのでそちらも合わせて参考にしてください。こちらは下記のような人はやりがいがあるかと思います。

  • 機械学習技術とアルゴリズム技術を組み合わせた開発を行いたい方

  • 多種多様なプロダクトやステークホルダーから利用されるサービスのプロダクトマネジメントを行いたい方

  • 複雑なビジネスドメインをモデリングしたい方

  • 大量データを高速に処理する業務を行いたい方

4. データを活用する

社内向けデータ基盤構築とデータ活用

社内横断データ基盤の構築を通じて、複数のプロダクトやサービスのデータを効率的に分析できる基盤を整備しています。社内横断データ基盤の促進に向けて積極的に社内のデータ活用やBIツールの導入にも力を入れています。
業務効率化だけではなく、アップセルなど事業価値を創出するために、各事業部に深くDiveしています。最近ではSansan事業部だけではなく、Eight事業部やBill One事業部にも深く入り込んでいます。

さらに、プロダクトの機能や施策効果を検証するためにA/Bテストを積極的に活用しています。ユーザー行動の分析や仮説検証のための実験設計を通じて、データに基づいた最適なプロダクト改善を推進し、エビデンスに基づく意思決定を支援しています。

こちらは下記のような人はやりがいがあるかと思います。

  • データドリブンで事業をドライブしたい方

  • BtoC領域(ECや広告)で多くの経験を積まれて、次はBtoB領域に挑戦したい方

  • BtoB企業においてA/Bテスト推進をドライブしたい方

参考に、社内のA/Bテストを推進リードしている小松のTech Blogと、Google Cloud Next Tokyo '24で坂口が登壇した際の発表資料を載せておきます。

Sansan Labs

社外に向けてはSansan Labsを展開しています。Sansan Labsは現在Sansanユーザーであればどなたでも使うことができる実験的な機能を提供するサービスです。すべてのアプリケーションを無料で使うことができ、Sansanに蓄積したビジネスの接点にまつわるデータが様々な切り口で分析・可視化される実験的な機能をいち早く利用できます。
最近では生成AI技術を用いたアプリケーションを多数リリースしています。

Sansan Labsもアプリ数が25個を超えて、アプリ100個を目指す中で色々な挑戦を行なっています。例えば、Sansan本体とのスムーズな連携や複数のLabsアプリを使った営業活動の変革です。また、多くのアプリケーションの運用負荷軽減やLLM Opsなど技術的な挑戦もあります。参考にSansan Labsのプロダクトマネジメントをしている西田のインタビュー記事を載せておきます。

私はデータ活用を担う多くのメンバーやチームのマネジメントを主に行なっています。複数事業部向けのデータ活用取り組みや全社データ基盤、Sansan Labsなどテーマがある中で今取り組むべきテーマなどをOKR設定やリソースマネジメントを通して行なっています。

こちらは下記のような人はやりがいがあるかと思います。

  • 生成AI技術を活用したアプリケーションをどんどん世の中に出したい方

  • データ活用によりビジネスシーンを変革したい方

  • 大量のアプリケーションのDev OpsやLLM Opsを行いたい方

採用候補者へのメッセージ

Sansanでは、技術の力で営業活動を革新することを目指しています。私たちはデータを活用して、企業の営業活動を支援するための様々な取り組みを行なっています。私たちと一緒に、新しい価値を創造し、企業の営業活動を変えていく挑戦をしてみませんか?

特に機械学習エンジニア、データエンジニアの方、名寄せやデータ活用プロジェクトを推進していただけるようなエンジニアやプロダクトマネジャーを募集しています。興味を持っていただけた方は、各種SNSで猿田に直接お声がけください。

この記事が気に入ったらサポートをしてみませんか?