見出し画像

(Forbes 30 U30に選出いただいたので)高専で学生AI起業して2年半、AI/LLMの社会実装について思うことを書き留める

はじめまして、TAKAO AI 株式会社 代表の板橋 (@iryutab) です。

日々色々な方のNote記事を拝見し、「私も何かアウトプットしよう」と考えてはいたのですが中々タイミング無く、
しかし本日、大変名誉なことに Forbes 30 Under 30 2023に選出いただいたこともあり、このタイミングでここしばらく考えていたAI関連のことをアウトプットしようと思い、記事を執筆しました。

写真は自宅で父親に撮影してもらいました。Forbes Japan様で素敵な加工をされたものを素材として頂きました

ちなみにこのnoteのサビは後半、2.TendocとLLMの邂逅 以降です。
(逆に自己紹介はすっ飛ばして読んでも差し支えないです)
「筆者のことは良いからAIの話を!」という方はそちらだけでも、是非!

また初めてのnote執筆が故に、拙い言語化が見え隠れするかと思いますが、ご容赦ください。

0. 誰?(自己紹介)

改めまして、板橋 竜太 と申します。
友人からはよく、名前の部分文字列である「竜」+ 「さん」付けで「りゅうさん」、「硫酸」と呼ばれます。

現在はTAKAO AI 株式会社の代表をしつつ、英国・University of Southamptonに在籍しており、留学と社業を並行して取り組んでいます。
こちらの大学では情報系を専門とはせず、航空宇宙の学科 (Aero & Astro) にて勉強しております (なぜAero & Astroか、などのお話はまた別の機会に)

University of SouthamptonはLondonの南西、車で一時間半から二時間ほどの場所です

大学生となる前は東京高専 情報工学科に在籍しており、TAKAO AIは高専4年次に創業しました。

東京駅から歩いてわずか9時間56分、"都心のド真ん中" にある高専です

情報工学科なので、基本的な授業でCなども触ってはいましたが、シンプルにものづくりが好きだったので、発展的な活動を割と密に詰めていました。

メインの活動は 全国高専プロコン(プログラミングコンテスト) への出場に置き、
一年次に出場の大会で全国大会出場 (Hololensを使ったバードウォッチング支援システム、BirdFinder をチームで開発、プレゼン)、
その後三年次の大会で全国大会最優秀賞を取る(TAKAO AIの発端となった視覚障害者向け自動点字翻訳システム「:::doc」をリード、プレゼン)、
などしていました。

この「:::doc」を改良したもので DCON2020 という大会に出場、優勝したことをきっかけでTAKAO AI 株式会社を創業し、今に至っています。

なみに、高専の人たちに比較的多く言えることかと思うのですが、プロトタイピングの過程が得意で、クイックにちょっとなにか作ってみるということを(会社でも個人でも)しています。

ちなみに、クルマ、旅行、オーディオ、カメラあたりが趣味です。

1. TAKAO AIでやっていること(背景、context)

Tendoc Platform ロゴマーク

TAKAO AI のメインプロダクトとして、起業以降継続して開発・実証実験・試験導入等を続けているのが、「あらゆる情報を、アップロードするだけで視覚障害者対応できるSaaS」である、「Tendoc Platform」です。

元は先述の高専プロコンのために開発された技術をプロダクト化したもので、

  1. アップロードされたドキュメントを解析

  2. 視覚障害者が読み上げられる、文字情報のみのフォーマットに変換

  3. 高アクセシビリティにデザインされた、視覚障害者向けポータルサイトに掲載、当該サイトへのアクセスURL・QRコードを発行

とすることにより、「情報の発信者が、英語の機械翻訳を用意するのと同じくらい簡単に (合理的配慮の中で) 視覚障害者対応の情報を発信できるようにしよう」という To Bのプロダクトです。

Tendoc Platformの利用フロー。情報アップロード側、そして情報閲覧側の2つのWeb Appで構成。

起業してすぐの頃は、Platformとしてではなく、「視覚障害者Accessibleな情報に変換できるエンジン」として販売できると信じ込み、繋がりの出来た会社様に我武者羅に技術提供のお願いをして回っておりました。

しかし、情報を作れるエンジン単体で提供できる価値は極めて限られていました (今思うと当然)。

かなりの長期間迷走した後、Platform構想に至り、手軽に自身の発行する情報を視覚障害者に対応できるSaaSとして再開発。
現在は行政の方にご協力頂き実証実験をする 段階まで来ており、まもなく (まだ実験的ではあるものの) 一般販売開始をできるかという状況です。

2. TendocとLLMの邂逅

さて、そんなTendoc Platformですが、初期〜つい最近までの構想では、サービスの…というか、一番重要なAIの挙動が随分異なっています。

先程の利用フローの、以下の部分。こちらが現在の仕様。

現在のTendoc Platformの仕様。AIを用い数分で解析完了するシンプルなUX

そして、以下が今年初めくらいまでの仕様です。

旧Tendoc Platformの仕様。なんとクラウドワーカー(※1)の文字列

一目瞭然なのですが、実はTendoc Platformの機能は元々一部人力で対応する設計でした。

これは、チラシなどのドキュメント、またモダンなUIのWebページを視覚障害者対応するときに、
・画面内の要素のレイアウトの適切な並び替え
・重要な情報の優先 / 重要でない情報の切り捨て
などの処理を、ごく小さな学生スタートアップが十分に運用できるレベルで実装することが困難だったが故の策です。

そのため、弊社ではクラウドワーカー専用の「ドキュメント要素一次元化Webアプリ」を開発し、ワーカーが要素を並び替え、その並び替えたドキュメント情報を蓄積していく…まずはサービスを回して、蓄積したデータを使って LayoutLMv3 などを日本語化・高度なレイアウトに対応させた学習をして利用できたら、といったロードマップを設計していました。

※1: 実際には、初期段階では業務委託という形で人にお願いしていたので、厳密なクラウドワーカーではないのですが…構想のプレゼン資料ではキーワードとしてわかりやすく、そのように説明していました

ワーカーの人が使うために開発した、Tendoc Platform for Webの要素編集Web App

しかし現実的には、データ納期のバラつき、担当者ごとの品質のバラつき、情報変換に掛かる単価の上昇など多くの問題を抱えており、実証実験や試験利用といったコンテクストにおいてすら、気軽に「お試しください」と言えるものではない状況でした (かなり先が見えなかった)

そしてこの状況を打破したのが、GPT-3.5-Turboの登場でした。

詳細な処理のフローについては伏せますが、GPT-3.5のAPIが解放されてから暫く実験してみたところ、人力で行っていた作業の殆どを、LLMが代替できることがわかったのが、今年の3月。

いくらかの追加実験をした上で、まだ実証実験段階であったTendoc PlatformのエンジンをLLMを使う前提として改修し、人力要素を完全に撤廃しながらも、人力の処理に比較的近いクオリティ && 人力よりも高い品質一貫性 (Consistency) を得ることに成功しました。本当に感動した…。


3. Tendocの経験から気づいたAI/LLM Applicationの面白さとクセ

さて、ではこのTendocとLLMの邂逅から、LLMプロダクトに関して一体どんな学びがあったのか。

実は、このエンジンの改修と同時に、もう一件小さなものを開発・公開することとしました。それが、「Tendocデモサイト(v2)」(ネーミングセンスが…)

実は、GPT-3.5導入前から、人力作業を簡略化したライトなTendocエンジンを試せるWebサイトとして、「Tendocデモサイト」を公開していました。

これの意図は、「視覚障害者対応と言ってもイメージが沸かない健常者の方用に、どういったことができるエンジンか説明するためのもの」でして、今回GPTによる大幅な改修で大きく性能が上がったので、これも作り直しておこうという流れです。

ここで驚きだったのが、

  1. 健常者ではなく、視覚障害者の方がデモサイトを便利に利用されていた

  2. 健常者にとっても、使ってみると不思議に便利なツールとなっていた

まず1番から。

気づき1: AIは超ニッチな需要を全力で満たせる

実は初期バージョンのデモサイトを公開後、会社のお問い合わせ欄を通し、視覚障害者の方から「便利だ」というお声や、さらなる機能拡張に対するご要望、またアプリ化のご希望などを頂くようになりました。

そこで、今回のV2では視覚障害者の方のご利用も想定し、UIをTendoc Platform同様の高アクセシビリティなもので開発したところ、想定以上のフィードバックを頂いている状況です。

テレビ番組 (NHK・クローズアップ現代様) に取り上げて頂いた際にも、視覚障害者の方にこのデモサイトをお試しいただき、情報が見やすい旨のコメントを頂きました。(以下リンク先、「ChatGPT×アプリ AI搭載で性能アップ」の章)

これは非常に嬉しく開発者冥利に尽きる現象ではあるのですが、しかし事業としては少し考えねばならない状況です。

私達は、この技術をTendoc PlatformとしてTo Bで販売し、拡大していくことをメイン事業としています。ここにはいくつかの理由がありますが、最大の理由は二つで、

  1. 技術開発を会社として続けていくためには、より多くの需要を満たして売上を上げていくことが必要であり、視覚障害者の方個人だけに販売するのでは、どうしても組織の収益構造として成立しない

  2. 視覚障害者の方だけが使うプロダクトとしてしまっては、「読めない情報の存在に視覚障害者の方が気づく」ことに依存してしまう。張り紙など、そもそも情報のリーチが失敗するケースをカバーするためには、情報発信者による配慮が必要。

しかし、これらを考慮して開発したTo Bのプロダクトは時間をかけつつ進展していく一方で、視覚障害者の方の手元には、読むことの難しい情報が (少なくとも今はまだ) 多く残っています。そしてアクセシビリティに対する施策として完璧ではないながらも、Tendocデモサイトは現時点での問題を割と鮮やかに解決しているわけです。

この構図を見つめたとき、

LLMを筆頭とする高度なAIは、適切なインターフェースと組み合わせた際、そのコストの低さが故に、今までは「ニッチ過ぎて解決不可能だった問題」を解決できることがあり、それこそが絶大なバリューである

という説 (気づき) が浮上したわけです。

気づき2: AIに適切なインターフェースを与えると、意外なほどに未体験で優れたUXが生まれ得る

これは本当に全く想像していなかったのですが…

この新デモサイトが完成したとき、デバッグ用に、自室にある適当な学校の授業資料 (英語…イギリスなので) を撮影して送信してみたわけです。

すると、その資料は見事に日本語訳されただけではなく、すべての構造が整理されて、非常に見やすい形式にまとまって表示されていました。

ドキュメントをまるごと翻訳できる…のもまぁすごいのですが、しかしそれ以上に驚きだったのは、「文書の視覚的情報から『デザイン』『Fancyさ』を取り除いて読める」というのが、どうやら中々便利に使えることがありそうだ、という点なのです。

考えてみると、LLMのように自然な自然言語を吐き出してくれるエンジン最適化されたUIは、今まであまり深くは探求されていないのではないでしょうか。チャットボットは思いつきやすい例で、かつ汎用性も高いのでChatGPTは人気で当然だと思うのですが、同時に、AI技術に組み合わせるための新しいUI/UXを探求する余地はまだまだ大幅に残されていて意外なところから意外な程に優れたモノが生まれそうだと感じたのです。

というわけで、

AIに組み合わせるインターフェースにはまだまだ遥かに探求の余地があり、極めて意外なところから意外なほどに優れたUX、またアプリケーションが生まれる可能性が大いにある。

これがTendocから得た2つ目の気づきです。
(デモサイト、是非身の回りの適当な書類でお試しください。無料です。)

さて、気づきパートは以上です。

以下は、この気付きを経た今、私 (の会社) が行っているチャレンジのお話になります。


4. 気づいたので、屋台(Yatai)を建てよう

ちょっとクセの強い章タイトルですね…

さて、会社で長いことお付き合いしてきたプロダクトのおかげでLLMアプリケーションについての気づきを得た私ですが、これを踏まえて、TAKAO AIでもLLMの社会実装を促進するための何かをしたいなぁ、と思いました。

やりたいこと

やりたいと思ったことのコンセプトは以下です。

  1. ニッチなプロダクトやチャレンジを途絶えさせない
    →Tendocデモサイトで、「ニッチ需要で、マイノリティのためかもしれないけど、刺さる人には最高の問題解決になる」ことを学んだので、その価値を享受できる仕組みを作りたい。簡単に言えば、それらを最低限でも持続可能なレベルにマネタイズできる仕組みを作りたい。

  2. AI/LLM Applicationの多様性を高めたい
    まだ見ぬUI/UXの探求幅がまだまだある世界だと学んだので、「より多くの人が・よりクイックに・より大胆で個性的なプロトタイピングができる仕組み」を作りたい。

  3. (楽しく、面白く、喜びを共有できる場を作りたい)
    ほぼ2番と同じ。ちょっと雰囲気の違う言語化。

そこで、(イギリスの水温調整が難しいシャワーで3分考えた結果、) 誰でもすごく簡単に自分のAIアプリケーションを公開 & 従量課金で販売できる、また誰のAIアプリケーションでも従量課金で使えるマーケットプレイスを作ろう、と決めまして、

「Yatai」を作りました。アルファ版ですが、すでに公開中です。

特徴的な部分の根拠・理由

前提として、AIアプリケーションのプロトタイピングは、その開発の難易度に対して得られる価値の比率が極めて大きいため、個人が週末の余った時間に作ってみたようなものでも、プロトタイプ・PoCとして十分に機能する可能性が高いと思います。

つまり、基本方針としてUGC (User Generated Contents) を流通させるプラットフォームになるわけです。この場におけるContentsは任意のAIアプリケーションです。そしてこのコンテンツの生産ペースや競争性が増していくことが、先述のやりたいことにマッチすると考えました。

では、一番の目標にあるマネタイズ、”持続可能化”をどうするか?ですが、ここに置いては従量課金を採用しました。どういうことかというと、雑な例ですが、「多くて月一回しか使わない変なアプリだけど、使うときにはめちゃくちゃ重宝するもの」というものがあったとき、その価値提供のために月500円のサブスクに入るのはハードルが高く、結果的に利用しないユーザーが多いと考えられます。しかし、これをシンプルに「一回使う毎に利用単価を支払う」という構図にできれば、少ない提供価値に対して料金を支払うリスクを回避しながらも、開発者の運用コストを回収できるため、ユーザーへの価値提供を持続出来ます。またユーザーは、単価が安くなったことを受けて得られた余剰の資金を、他のニッチ需要・Fittedなアプリケーションへ消費できます。

これは視点を変えると「アプリケーション販売のバルク化」であって、これが従来のソフトウェア・マーケットプレイスであるPlay StoreやApp Storeとの大きな違いです。

また、従量課金を実現する方法として、前払式支払手段を導入しました。Yataiを利用するユーザーは、まず「トークン」というYataiサービス内の通貨を購入します。これを消費することで、開発者がYataiに掲載しているアプリケーションを利用できます。

1トークン = 1円で購入可能です。これを消費してアプリを使うと、その開発者にこのトークンが転送され、開発者はこれを現金・アマギフに引き出すことが出来ます。

また、開発者が自分のアプリケーションを配信するとき、配信するアプリケーションのプラットフォームに制限がありません。というのも、開発者は、OAuth 2.0 (OpenID Connect) を利用して、「自分の作ったアプリをYataiと連携・認証し、決済用APIを叩く」ことによって決済を実装します。イメージは、「Twitterでログイン」機能を実装する感覚です。

開発者でログインしてアプリを作ると、このように認証用の情報が生成されます。このスクショのアプリは削除済みなのでご安心を…

そのため、WebアプリであればデプロイしておいてURLをYatai上で公開すればいいですし、またPC向けのAIを活用したゲーム(ローカルで動作するソフトウェア)を開発し、そこにYataiへの認証部分を実装・Yataiで掲載することもできます。認証・決済部分さえ実装されていれば、Raspberry Piで動くエッジAIソフトウェアの配信も可能です。

Webアプリが掲載されている例。開発者は自分でWebアプリをデプロイして、そこへのURLをYatai上に張り、そして各アクションごとの単価を設定します。

こうすることによって、どんなプラットフォームで動く、どんなAIソフトウェアでもYatai上で掲載・販売・マネタイズができる、というわけです。

Yataiでは、開発者は自分の作品を開発者の好きな手段でユーザーに提供します。Yataiは情報の掲載と、前払いでユーザーが購入した「トークン』を使った利用料の決済だけを担当します。

長くなってしまいましたが、このようなマーケットプレイスを作り・まずはAIアプリケーションの開発をしている人たちを中心に盛り上げていくことで、アプリケーションの多様化と持続、探求を継続・加速させていきたいな、というのが、今の我々の (Tendocと並行した) チャレンジです。

Yataiは、「レストランを出すよりも手軽に・フレンドリーに売る場所」というメッセージから名付け、8月の頭からアルファ版サービスを開始しました。

今はTAKAO AI チーム内で作ったサンプルアプリがいくつかあるのみですが、利用側ユーザーとしてお試し頂けるよう、100円分のトークンをもらえるクーポンを配布しています。

今後、サンプルアプリにも魅力的なものを追加していくと同時に、デベロッパーな皆さんにも働きかけて行き、ぜひチョット面白いアプリケーションの屋台が出店されていけば良いなと考えています。

あと、Yatai開発者コミュニティのDiscordもあります。開発関連ヘルプ・質問などいつでもお受けしているので、ぜひお気軽に!↓


5. おわりに

というわけで最後、ほぼ宣伝な終わり方にはなってしまいましたが…

このたび大変名誉なものを頂きましたことをきっかけとし、私 (の会社) の今までの活動とこれからのチャレンジ、そして私がAIについて思うことについて書き連ねさせていただきました

最後までお読みいただいた方、本当に本当に長い記事をここまで、ありがとうございました。

何かしらの参考や助けになっていましたら幸いです。

それではまた、今後ちょこちょこNote上でもアウトプットしていきます!


この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?