ナウキャスト に新卒入社してからの一年半の成長を振り返る
自己紹介
こんにちは!ナウキャストでデータサイエンティスト / データエンジニアをしている大森です。
現在はクレジットカードデータで足元の国内消費動向を捉える「JCB消費NOW」の開発をメインで担当しています。
大学院卒業後、2021年4月にナウキャストに新卒入社してから一年半ほど経ったので、入社の経緯やこれまで学んだことなどを振り返ってみたいと思います。
大学・大学院時代の専門は全くの別分野
大学・大学院時代はロボット(主に等身大ヒューマノイド)の研究をしており、現在仕事で扱っているデータ分析や金融・経済業界とは縁遠い分野にいました。
学生時代は環境認識に基づくロボットの行動計画を行っていましたが、当時所属していた学科・研究科では機械学習の研究をしている方も多く、画像認識の他にもテーブルデータのビッグデータ分析などもよく耳にしていました。
ナウキャストを知ったのは大学4年生の夏頃に技術系の長期インターン先を探していたところ、ちょうどナウキャストでインターンをしている友人に紹介してもらったことがきっかけでした。話を聞いてみると当時「データサイエンス」とセットで流行っていた 「ビッグデータ」を扱ったインターンができるということで面白そう、というくらいの気持ちでインターンを開始しました。
入社のきっかけ
最終的にはそこから2年半ほどのインターンを経て入社をしましたが、入社のきっかけを振り返ってみると以下のような理由があげられるのではないかと思います。
扱うデータが魅力的
新卒・ジュニアでも裁量が非常に大きい
アカデミックな活躍もできる
それぞれ簡単に紹介させていただきます!
扱うデータが魅力的
ひと口にビッグデータ分析といっても扱うデータも目的も様々ですが、自社で保有しているデータの分析なども多いと思います。
ナウキャストはいわゆる自社データというものは持たず、「データホルダーからデータを受け取り、データを価値のある形に変えて利用者に届ける」といった、いわばビッグデータのハブ的な位置付けでビジネスを行っています。
そのため、クレジットカードデータ、POSデータ、位置情報データなど豊富なバリエーションのデータを扱うことができ、アウトプットとして投資家向け、エコノミスト向け、マーケティング向けといった様々なプロダクトへの活用を行っています。
このように「豊富なバリエーションのデータ」x 「様々なプロダクト」といった掛け算でデータを扱えるところに魅力を感じました。詳細は こちらの会社紹介 もぜひご覧ください!
新卒・ジュニアでも裁量が非常に大きい
昨年2021年12月に親会社のFinatextホールディングスが東証グロース市場に上場を果たしましたが、まだまだ若手の裁量も活躍機会も多いベンチャー企業です!
インターンをしている時にバディ(インターン生の面倒を見る役割)になっていただいた社員の方は僕の2-3個上で、「JCB消費NOW」のプロダクトマネージャー兼指数開発担当という多岐にわたる領域をカバーしており、データホルダーからデータ利用者まで色々と話を聞いた上でプロダクト開発をしている姿が印象的でした。
エンジニア、開発担当というと要件が固まってから仕事が降ってくるケースも多いと思いますが、何を作るかということをビジネスデベロップメントの方と並走してプロダクトを創り上げてくというところに魅力を感じました。
若手・ジュニアの活躍でいうと当時は平均年齢が20代だったので比較的若い時期から責任を持って仕事をしている社員が多かったように思います!
アカデミックな活躍もできる
ナウキャストは歴史を辿ると東京大学経済学部の渡辺努教授が研究成果をもとに創業したスタートアップということもあり、アカデミック領域とも一定の関わりがあるのがユニークなところです。
ナウキャストとして物価指数の作り方の論文を出していたり、メンバーが学会に参加・登壇する機会もあります。僕もありがたいことに渡辺先生にお誘いいただき、インターン生でありながら JCB のクレジットカードデータを使ってコロナ禍の消費行動の分析の共著論文を書く機会をいただきました。
大学院でも積極的に論文などは書いていたため、民間企業に入ってからもこうしたアカデミックな領域とも関わりを持てるのは非常に貴重であると感じました。
また、インターン中に関わらせていただいた「JCB消費NOW」も非常に公共性が高く、経済新聞やニュースで自分の作った指数が取り上げられたり、官公庁のお客様が政策の意思決定の場で用いられる資料に指数を載せていただいたりする点は入社後も社会貢献的な意味でやりがいを感じられると思いました。
一年半でやってきたこと
「JCB消費NOW」の指数開発
冒頭でも簡単に触れた通り「JCB消費NOW」というプロダクトをメインで担当し、国内の消費動向指数をクレジットカードデータを用いて作成するということを行っております。
政府統計などは実際の経済活動が行われてからデータの集計・公開まで一ヶ月以上かかりますが、クレジットカードデータを用いることにより、より早く、さらには様々な業種の動向を捉えることができるというのがこのサービスの特徴です。
ただし、クレジットカードデータはそのまま集計を行っても政府統計の先行指標にはならず、データの持つバイアスなどをできる限り排除した上で指数作成をする必要があります。
外れ値処理と言った一般的な統計加工から、クレジットカードユーザーの属性偏りの補正といったデータ固有の処理まで政府統計などをベンチマークとしながら指数をブラッシュアップしていくというものです。
インターンの頃からここの指数開発には関わっていましたが、入社後はコロナ禍の人々の移動と消費が同時にみられる指数として「From To 指数」という「どこに住む人が」「どこで」「いくら」消費したかがわかる新規の指数開発を任せていただきました。
こちらはまず「どこで」の情報を取得するため、これまでいただいていなかったカードの加盟店側の住所情報をエンジニアが BizDev と連携しながら JCB様から提供していただくところから始まり、既存の指数を見ている顧客の方々に様々なユースケースを作って持っていきフィードバックをもらうところまで責任を持って取り組みました。
指数の加工方法についてもこれまでとは違った手法を考案する必要があったり、新規にもらうデータの持ち方や加工パイプラインを整えたりと「JCB消費NOW」のサブプロダクトの開発をまるっと担当させていただきました。
インターンの頃は統計加工の手法に重きを置くことが多かったですが、この経験を通して顧客はどういう指数が見たいのか、どういうインサイトを作りたいのか、さらにはデータを見るのが専門でない方々にはどういったアウトプット形式だったら見やすいのかといった視点も持つことができるようになったところが大きな成長ポイントだったと思います。
「JCB消費NOW」のデータウェアハウス ・データパイプライン構築
入社した時点ではまだまだデータウェアハウスやパイプラインなど整っていないものも多く、社員になることでこれまで制限のかかっていた AWS のリソースなども強い権限を持って扱えるようになったため、こちらの改善も進めました。
最初に取り組んだタスクとしては、これまで地方粒度で提供していた各種指数を都道府県粒度でも提供することに伴い指数計算に用いるデータがこれまでの10倍もらえるようになったため、これまで S3 においてあった raw data をデータのスキャン効率も意識しつつ Athena から取得できるようにするといったものです。
入社時点では Data Lake や Data Ware House というデータエンジニアリングの一般的な概念すら知らない状態でしたが、DWH の構築を通して概念的な知識はもちろん、実装する経験まで積めたのは非常に成長できたポイントかと思います。
その他にも社内の他のプロジェクトで使われていたワークフロー管理ツールの導入、AWS リソースの Terraform 管理下への移行、SonarCloud を用いたユニットテストのカバレッジ上昇、CI/CD の導入といったソフトウェアエンジニアリング的な部分も取り組みました。
まだまだ勉強中のものも多いですが分析にとどまらず、データを扱う上で必要なインフラの知識や一般的なソフトウェアエンジニアリングの知識が身に付いたのも良かったです。
アカデミックな内容のアウトプット
インターン期間中に書いた論文を東大日銀カンファレンスで発表させていただいたり、日本統計学会のオルタナティブデータセッションで登壇、パネルディスカッションに参加させていただいたりとインターン時代に引き続きアカデミック領域でのアウトプットもさせていただいています!
その他にも「JCB消費NOW」で開発した指数の作成方法についても執筆して書籍になったりと成果がプロダクトという形以外でも世の中に出ていくのは面白いです。
Beyond 活動
ナウキャストの所属する Finatext グループでは、グループのカルチャーを表現した5つの Principle というものがあります。その中の「Beyond」という項目では“プロジェクトや職種の域を超えて、助け合おう”というメッセージを掲げており、メインの仕事以外にも関わることが可能です。
僕の場合は長期インターンを経て新卒入社したという経緯もあるため、短期インターンプログラムの企画や長期インターン生のメンターといった Beyond 活動を行っています。
Beyond はボランタリーな部分も多いですが、活動を通じてナウキャスト以外のメンバーと関われたり、インターン生と会話する中で色々な刺激をもらったりとプラスの側面も大きいです!
これを読んでくれている学生の方はエンジニア、ビジネスの短期インターンを夏、冬にそれぞれやっているので、グループ公式Twitterでの発信をお待ちください!
今後やりたいこと
まずはデータサイエンティスト/データエンジニアとして専門性を磨いていくこと、そして今後はよりプロダクトをどのような方向に持っていきたいのか、チームが拡大する中でチームのメンバーからマネジメントといったロールも徐々に担っていけるようになりたいです!
おわりに
最後まで読んでいただきありがとうございます!
ナウキャストも Finatext グループも積極的にメンバーを募集しているので、本ブログを読んで少しでも興味を持っていただけた方はこちらからぜひカジュアル面談しましょう!
この記事が気に入ったらサポートをしてみませんか?