『AIの未来を支える新たなビジネス:AI学習データ収集ビジネスが広まる』~【web3&AI-テックビジネスのアイディアのタネ】2024.10.28
「先進テックで未来の生活はもっと良くなる!」と信じて、Web3・AI・ガジェットなどのデイリーニュースから毎日ひとつピックアップしてご紹介しています。
新規ビジネスのアイディアのタネがほしい方、未来を想像してワクワクしたい方、読んでちょっといいなと思った方、ぜひフォロー・高評価よろしくお願いします!
■AIのために声データを提供する時給2000円のバイトが人気。学習データの枯渇に備え
インターネット上の学習データを使い尽くすデータ枯渇問題、無断学習への批判の高まりなどから、AIの学習データを作るアルバイトが生まれています。このデータ収集や整理のための人手が求められる状況は今後も続くと考えられます。
バイトダンス社やバイドゥ社のような大企業は、声データの学習による音声認識やText to Speechなど汎用的なAIのための学習データを収集しますが、小規模な企業では専門性が高くニッチな分野におけるAI学習データ収集ビジネスが広がるでしょう。
AI学習データの課題
現在、インターネット上に公開されているデータは良し悪しに関わらず、AIの学習に利用されています。
多くの倫理的な問題や「自分のデータを無断で使われたくない」という感情的な抵抗も伴います。にもかかわらず、インターネット上に存在する全てのデータがAIの学習に使用され続ける現状を止めることは、ほぼ不可能な状況です。人々がインターネットを利用しない生活を選ぶことは現実的ではなく、ネット上のデータの利用を完全に防ぐ手段はありません。
AIの学習データが枯渇する問題もAI企業にとっては深刻です。米国の研究団体エポックAIは、2026年から2032年の間にAIモデルのトレーニングに使える公開データが枯渇する可能性があると予測しています。
学習データの枯渇に対応するため、AI開発企業はアルバイトを雇い、正規の学習データを収集・生成する取り組みを増やしています。これは、データの品質を管理しつつ、法的なトラブルを回避するための手段でもあります。
ニッチなAI学習データのビジネス化
AIの大手企業は「声」など汎用的なデータをアルバイトによって整理収集していますが、今後、小規模な企業がニッチで専門性の高い分野のAI学習データを作るためにアルバイトを雇うというビジネスも増えると予想されます。
例えば、建築図面や医療診断データ、自動運転車向けのシナリオデータ、小売業における顧客行動データ、飲食店向けのメニュー推薦データなど、専門的なデータを必要とする分野での需要が高まるでしょう。
建築図面
建築設計専用のAIを学習させるためには、建築図面のデータが必要です。しかしインターネット上に公開されている建築図面は多くありません。そこで、アルバイトを雇って新たな建築物の図面を描いたり、既存の図面データを整理し、品質チェックを行います。
建築物の設計を自動化するAIに設計データを学習させることで、大幅なコストダウンとスピードアップ、そして違法設計や構造上の欠陥をなくすことができるようになるでしょう。
医療診断データ
医療AIをトレーニングするためには、過去の診断データや症例データが必要です。アルバイトは、患者の個人情報を匿名化し、症例データに適切なラベルを付けて整理します。また、医師と協力して診断内容をデータとして入力する作業も行います。
AIと人間の医師の適切なすみ分けを進められるようになることで、医師の働きすぎを少しでも緩和し、過疎地域でもAIによる診断ができるなどの効果が期待されます。
自動運転車向けシナリオデータ
自動運転AIには、さまざまな交通シナリオのデータが必要です。多くのクルマに取り付けられるようになったドライブレコーダー映像を集め、車両や歩行者の動きをラベル付けするアルバイトが考えられます。
小売業における顧客行動データ
小売業向けのAIを開発するには、顧客の行動データが重要です。現在は防犯用途で少数のカメラが取り付けられている程度ですが、カメラやセンサーを充実させたモデル店舗でデータを集め、顧客がどのように商品を手に取るか、どのルートを通るかを観察し、その行動にラベルを付けてデータ化するアルバイトが生まれそうです。これは大きくチェーン展開しているコンビニやスーパーが自社のために行う方が実現しやすそうです。
飲食店向けメニュー推薦データ
飲食店でのAIメニュー推薦を実現するために、顧客の注文傾向や季節ごとの人気メニューのデータが必要です。アルバイトは、過去の注文データを入力し、メニューごとの売れ行きや顧客の好みを整理します。
タッチパネル注文機で迷っている様子、食事中の会話などを、アルバイト代を払ったり割引クーポンを提供するなどして公式に収集させてもらうようなこともありえそうです。
AI学習データ収集ビジネスはディストピア?
こうしたAI学習データをオリジナルに作るビジネスは、データ枯渇問題に対処するため、また無断でのデータ利用に対する批判を避けるためにも、重要な役割を果たしています。さらに、AI時代の本格的な到来に伴い、スキマバイトや副業が広まっていることも、このビジネスを後押ししています。
結果として、さまざまな分野でAI化が進み、人間が従事する仕事の数は減少していくことが予想されます。さらに、長期的には人間のアルバイトを雇わなくても、AI自身がオリジナルの学習データを生成できるようになる可能性もあります。しかし、短期的にはAI学習データを作るというビジネスが急速に広まり、そこでの雇用機会も増加するでしょう。AI技術の発展と共に、データ収集や整理のための人手が求められる状況は、今後も続くと考えられます。
学習データが充実することで、専門性の高いAIが開発されたり、AIがさらなる精度向上を果たし、AIによって便利な生活が実現される一方、キービジュアルのようにAIへの奉仕者として人間が働く様子はディストピアだと映るかもしれません。
良し悪しの捉え方は人それぞれかもしれませんが、AI学習データを収集するビジネスは間違いなく広まりますし、今でも購買データログが記録され分析されている現状、今やすべての人間の活動が「データを充実させるためにある」と言えるかもしれません。集めたデータを活用するのが人間からAIに置き換わっていく変化が起きるところがこれからの変化だろうと思います。