見出し画像

自動運転をつくる: Turing AIディレクターとしての500日

こんにちは、Turing株式会社でAI開発の責任者をしている山口 (@ymg_aq) です。Turingは自動運転車の開発をするスタートアップなのですが、最近はその開発規模も大きくなってきました。初期からいる人間として、ここまでのTuringの自動運転開発の軌跡を振り返ってみたいと思います。
(このNoteは Turingアドベントカレンダー2023 16日目の記事です。)

1. Turing株式会社とは?

Turing株式会社は2021年創業のスタートアップです。現在社員は40名を超え、業務委託やインターンを含めると60名近くの規模になっています。事業としては「完全自動運転EV(=電気自動車)の量産」を掲げており、ソフトウェアとハードウェアの両面で日本から新しい自動車会社を立ち上げようとしています。

Turingメンバー(柏の葉オフィスで撮影)

シードラウンドとしては異例の規模で、創業から11ヶ月の2022年7月で10億円、2023年8月には5.2億円の資金調達を実施しています。また現在も次のシリーズに向けた資金調達に向けて動いています。

会社の拠点は千葉県柏市、つくばエクスプレス柏の葉キャンパス駅近くにあります。ソフトウェアエンジニアが多いこともあり、作業環境はかなり快適になっています。

また、車両を含めたハードウェア開発拠点として工場(Kashiwa Nova Factory)もあります。こちらも同じく柏の葉キャンパス駅が最寄りです。

最近ですと、2023年10月にJapan Mobility Show 2023(旧東京モーターショー)に自社開発の電気自動車を展示して話題になりました。

日経新聞のJapan Mobility Show記事のトップを飾る('23 10月)

2. Turingに入る前

私は元々、つくばにある産業技術総合研究所というところで研究者をしていました。在職中、AlphaGoの論文を読んだのをきっかけに、深層学習に興味を持ち、趣味で囲碁AIや将棋AIをつくってるうちに世界大会に出るようになりました。

流れで研究所を退職して2年ほどフリーランスの機械学習エンジニアとして働いた後、AI系の上場企業に入社して執行役員としてAI開発の責任者をやっていました。

3. 入社、機械学習チーム立ち上げ

CEO山本とは20年来の友人ということもあり、Turingには最初の社員の一人として2022年4月にJoinしました。入社当時は机も十分にない状態でまさに「スタートアップ」という感じでした。そしてこの記事を書いているちょうど500日前の2022年8月に「Director of AI」に就任し、(まずは一人から)機械学習の開発体制を立ち上げることになりました。

まだ何もないオフィスで入社式。左から2番目が筆者('22 4月)

4. 自動運転をつくる

さて、自動運転に向けた機械学習といっても、まずは何をやればいいのでしょう?自動運転にはすごくざっくりいうと「LiDAR方式」と「カメラ方式」という2つのセンサ方式があります。

LiDARはLight Detection And Ranging(光による検知と測距)の略称で、主に近赤外光を使って対象物に光を照射し、その反射光を光センサでとらえ距離を測定する計測手法です。あらかじめ取得しておいた走行エリアの地図(高精度3Dマップ)と組み合わせることで、自分の位置や周囲の移動物体を認識できます。この手法は2000年代に発達し、代表的な企業としてGoogle傘下のWaymoがいます。

出典:Waymo公式ブログ

もう一つの方法であるカメラ方式は主なセンサとして、普通のRGBカメラを使います。カメラを使った自動運転自体は昔からあったのですが、2012年からの深層学習技術の発展により、ずっと高度な画像認識ができるようになりました。カメラを使う利点として、センサの解像度が高いこと、価格が安く小型である(=車両に組み込みやすい)ことがあります。

カメラ方式を採用する代表的な企業はTeslaです。Tesla車に搭載されている自動運転システムは複数のカメラとAIモデルで周囲の状況を把握しています。そしてTuringもこのカメラ方式を採用し、AIモデルを用いた自動運転を開発しています。

AIモデルをつくる一方、Turingでは実際の車両とのつなぎこみ(カメラ/計算機/車両制御)を進めており、2022年9月には最初の公道実験を開始しました。

そして「1kmに満たないが大きな一歩です」と言った2週間後には北海道一周(約1500km)の走行実験を実施しました。(私も運転席に座る人として参加)

そして2023年3月にこの自動運転システムを搭載したTuringとして初めての車両「THE FIRST TURING CAR」を販売することができました。

5. LLMを組み込む

自動運転システムができたのでAIディレクターはお役御免…とはなりません。2023年3月のシステムはLevel2と呼ばれる自動運転のカテゴリで、人間が責任を持つ必要があります。これに対してTuringが目指すのは「Level5」、いわゆる完全自動運転です。

自動運転Level2とLevel5の間には大きな差がある

どのような状況でもシステムが責任を持つ完全自動運転では、Turingの方式も含め既存の自動運転技術の延長では難しいと考えています。なぜなら、運転環境のうち数%は稀なケースが大量にあるような典型的なロングテールな分布になっており、その全てに対応するのが難しいためです。

運転環境は典型的なロングテール(出典)

このような状況に全て対応するには、人間のように論理的・抽象的に思考し、あらゆる状況に対応できる汎用モデルが必要です。

5-1. ChatGPTの出現

入社時から高度な自動運転にはLanguage Modelが必要ではないかと考えてたのですが、2022年11月にChatGPTが公開されるとその予想は確信に変わりました。

そしてその後のGPT4やその他のLLMの登場により、とりあえずこれを車両に組み込んで動かすことにしました。

LLMを組み込むシステムの開発風景

実際の走行デモは2023年6月に行われました。このときはまだマルチモーダルモデルではなく、カメラの映像から物体検知モデルを動かし、その座標等の情報をLLMに渡して車の経路や停止・発進を判断させ、実際に車両の制御もさせていました。

ちなみにこちらの研究はちょうど今週ニューオリンズで開催されていたNeuRIPSと併催されたML4ADというシンポジウムで発表した他、論文もArXivで公開されました。

5-2. マルチモーダルモデルをつくる

LLMと自動運転を組み合わせることに成功はしましたが、課題もみえてきました。それは画像の情報を過不足なくLLMに伝えるのが難しいという点です。人間もそうであるように、運転の判断の90%以上は視覚情報によるものです。

そこでTuringではLLMに視覚を与えるマルチモーダルモデルの開発を進め、2023年9月にはマルチモーダル用の学習ライブラリ「Heron」とその学習済みモデルを公開しました。

これにより、画像認識モデル + LLMでは難しかった複雑な交通環境も理解可能になりました。将来的にはこのようなモデルをさらに学習させ、自動運転車両に搭載します。

6.「完全な」自動運転をつくる

さて、将来的な完全自動運転に向けた Director of AIの仕事は天才的な手腕を発揮して超人間的なAIをゴリゴリと完成させること…ではありません。では何かというと、自動運転用の大規模モデルを完成させるには

  1. データを集める

  2. GPUを集める

  3. 人を集める

を進めることだと考えています。

まず1つ目の「データを集める」ですが、AIを学習するには大量のデータが必要になります。そして自動運転の場合には走行データです。Turingでは軽自動車を改造して周囲にカメラを取り付け、1台あたり300km/日程度のデータ収集車両を開発し、運用しています。

また、走行データは動画で取得するので多い時で週10TB程度増加していきます。そのような大規模データを学習したりデータパイプラインを構築する、いわゆるMLOpsを大規模に整備する必要があります。

そして2番目の「GPUを集める」ですが、これはやはり大きなモデルを学習させるには避けては通れません。私はここ半年くらい、大規模なGPUリソースを確保するために奔走しています。

そして2023年5月ごろから動いていたH100 96基からなる自社GPUクラスタ「Gaggle Cluster」について、先日発表しました。この他も公的な補助金の申請なども担当して進めています。

最後に「人を集める」、これが最も重要です。完全自動運転は人類にとってのグランドチャレンジだと私は考えています。そのためには1人のスーパーマンではなく、100人のスーパーマンが必要です。

そこで、2023年6月により将来に向けた研究を進める「リサーチチーム」を新設しました。現在はインターン含め8人が所属しています。

また、個人的にはTuringの課題はKaggleをやっている方と相性がよいと思っているので、そういうコミュニティにリーチすべくイベントのスポンサーをしたり、Kaggler向けの採用導線を作ったりしています。

また、もちろん機械学習以外のエンジニアも集めなくてはいけません。TuringはなぜかTwitter認知度が異常に高く、初対面の方に9割くらい「Twitterでみてます」と言われます。これはいいことですが、Twitterだけだと技術的な詳細が伝わりにくく、エンジニアの採用には中々つながりません。

そこで2022年10月ごろからテックブログを活用することで技術発信をしていく方針を打ち出しました。

私はAI開発だけでなく、Turingのソフトウェア開発全般の責任者でもあるのですが、車のソフトウェアは組み込みからOSのような低レイヤからアプリケーション、UI、機械学習モデルなど、すごく多岐にわたります。そのような開発の内容を発信していけば、多くのエンジニアに認知されるのでは…という戦略です。

7. おわりに / 次の500日に向けて

軽くやったことを振り返る記事にするつもりが、思ったより多くて長文になってしまいました。ディレクターというと何だか偉そうですが、日々の仕事の感覚としては「球拾い」をひたすらしているという方が近いです。ただ、Turingが普通の会社と違うのは、球拾いの途中でフルスイングしてホームランを打つ必要があるところでしょうか。

Turingは会社の本社を2024年1月22日から大崎に移し、さらに多くの人を集めたいと考えています。

自動運転開発もそうですし、会社事業もこの先の500日はさらに難しい局面が待ち受けていると思いますが、しっかりと頑張っていきたいと思います。

Appendix: 車への興味

実は私はTuringに入るまでは車に1ミリも興味がなく、免許を取って以来12年間ペーパードライバーでした。しかし実際に車を所有するようになって知らないうちにいつの間にかすごく興味を持つようになりました。

ちょうど今週、4台目であるTesla Model3が納車されたので、「研究」していきたいと思います。


この記事が気に入ったらサポートをしてみませんか?