マンガでわかるHCI: クラウドソーシングの歴史
クラウドソーシングの歴史
クラウドソーシングという言葉。おそらく既にいろいろなところで聞いたことがあるかもしれません。
クラウドソーシングという言葉自体は、「外注」という意味のアウトソーシングと、「群衆」という意味のクラウド(雲やクラウドコンピューティングのCloudではなくCrowdの方)をかけて作られた言葉で、インターネット時代における働き方の変化とともに一般にも普及されてきた気がします。
このクラウドソーシングという言葉は、最近になって使われ始めた(2005年にWired誌で初めて使われた)わけですが、クラウドソーシングに似た仕組み自体はかなり昔からやられていました。
ちなみに、世界で最初のクラウドソーシングは、インターネットが始まる遥か前の、1714年。イギリス政府が問題解決のためにかけた一般公募が最初だと言われています。当時、大航海時代を経て、貿易などで航海技術がますます重要になってきた一方、まだまだ測量技術は未発達で船に乗ることはほぼ命がけでした。そんな時、正確な測量ができれば、何百人もの船乗りの命を救えるということで、政府がこの不可能と思われた問題に懸賞金をかけました。その額、現在の価値で約3百万ポンド( = 約4億円)。結局、群衆のアイデアから生み出されたクロノメーター(時計職人が考案)により、大幅に精度が向上したと言われています。
それ以外にも、例えば、シドニー・オペラハウスのデザインコンペであったり、トヨタの初期のロゴのデザインのコンペなど、クラウドソーシングの先駆けとなるようなものはインターネット以前からやられていました。
スパム防止で本を読む
ただ、インターネットを使ったクラウドソーシングの先駆けとなるものは、少し変わった形で生まれました。
時は2000年代初期。カーネギーメロン大学のコンピュータサイエンスのPhD学生だったLuis von Ahnはインターネットのスパム問題に取り組んでいました。スパム問題というのは、例えばチケット販売などで、ボットなどによって不正にアカウントを大量に作られる問題です。当時、彼はこの問題を解決するために、グニャッとした文字を表示させる認証システムを作りました。多くの人も下のようなものを見たことがあるかも知れません。そう。CAPTCHAと呼ばれる、あれです。
↑ 初期のCAPTCHA。ちなみに、CAPTCHAは"Completely Automated Public Turing test to tell Computers and Humans Apart"(コンピュータと人間をすみわける、完全に自動化された公開チューリングテスト)の略です。
その当時、コンピュータではこうした文字認識の技術が発達していなかったため、CAPTCHAはスパム防止としてまたたく間に広がりました。その数、一日2億回。
一方で、von Ahnは「人間のリソースを無駄遣いをしてるんじゃないか」とも思ったそうです。一日に人間が10秒間考える時間を2億回とすると、実に一日で50万時間以上。もちろんスパム防止にはなっているんだけど、なにか、もう少し役に立つことに使えないものか、と。
そんな折、昔の本のデジタルスキャンするプロジェクトで、かなりの頻度でコンピュータが文字を認識できない(折れ曲がったり、古くほころびた紙はコンピュータには難しい)と知ったvon Ahnは、「自動で作ったグニャッという文字の代わりに、CAPTCHAに表示させて、人間に読んでもらえばいいのではないか?」と考えました。
↑ 当時の機械学習では非常に難しかった問題も人間だと一瞬で解ける
そうして生まれたのが、reCAPTCHA。スパム防止のために人間にコンピュータが判別できない文字を読ませるというのが、いつしか裏で「本を読む」という人類の貢献のために使われることになりました。(その数は相当なもので、2011年当時で1日1億語。一年で250万冊。一人の人間がこれをやると気の遠くなる作業です。)
↑ デジタル化できなかった文字を、人間に入力してもらうことで
スパム防止と本のデジタル化という両方の目標を達成できた
現在は、reCAPTCHAは、行動履歴から自動で推定したり、もしも認証が必要でも文字認識の代わりに画像認識(カテゴライズや物体認識など)が主ですが、やっていることは変わりません。むしろ深層学習で大量のデータが必要になるため、その重要性は増しています。
ヒューマン・コンピュテーションの幕開け
彼はカーネギーメロン大でPhDを取るわけですが、その時の博論で、彼は新しいコンピュータサイエンスの分野を作ります。その名も「ヒューマン・コンピュテーション」。
ヒューマン・コンピュテーションというのは、一言でいうと「コンピュータが解けない問題を、人間がもつコンピュータよりも優れた能力(文字の認識能力、画像認識能力、空間認識能力)を効率的に使って解こう」というアイデアです。そして、それを一人の人間に頼む代わりに、「インターネットを使って、人間の知恵を分散して処理しよう」という点が非常に画期的な点です。
reCAPTCHAのようにスパム防止として活用する以外にも、いろいろな応用例が出てきました。
↑ 様々な問題解決にヒューマン・コンピュテーションが応用される
例えば、生物学の分野において、タンパク質の立体構造推定問題(Protein Folding問題)は、今のコンピュータでも解けないほど、難しい問題です。n個のアミノ酸がある時に、立体構造の可能性が10のn乗個になるほど、可能性が膨大なのです。これを、コンピュータが解く代わりに、人間が解けばいいのではないか、というアイデアからFolditというゲームが生まれました。ユーザーにはアミノ酸の配列が渡され、そこからタンパク質の構造に近い形に折れ曲げるとポイントを貰えるというパズルゲームで、最初は答えがわかっている単純なタンパク質から始まり、そのうちに複雑なタンパク質の構造推定をパズル化することで、まだわかっていないタンパク質の構造を推定しようというゲームになっています。そして、実際にこの結果を元にNatureなどに論文が掲載されるという成果にまでなりました。このように今まで科学者が解けなかった問題を群衆の知恵(しかも彼らはただゲームで遊んでいるだけ)によって解かれたという意味で画期的でした。
↑ Folditのプレイ画面。ちなみにNatureの論文の著者には、開発した研究者だけでなく、プレイヤー57,000人もクレジットされています。
このように、「群衆(Crowd)」を使って、AIのハードプロブレムを解くというヒューマン・コンピュテーションが、元々クラウドソーシングの走りとして始まりました。
ちなみに、reCAPTCHAを作ったLuis von Ahnはその後、カーネギーメロン大学のFaculty(教授職)になり、似たような仕組みで無料で外国語を学ぶためのアプリを作りました。それがDuolingoです。(もしかしたら皆さんも聞いたことがあるかも知れません)
ちなみに、全然関係ないですが、DuolingoのCo-founderでCTOの人は正真正銘のハッカーと言われています。
というのも、彼の名前はハッカーさんなのです。笑(フルネームはSeverin Hacker。元はvon Ahnのカーネギーメロン大学のPhD学生でした)
ヒューマン・コンピュテーションからクラウドソーシングへ
上に上げた仕組みの多くは、ゲームや認証として目的を変えたり、ボランティアとして参加するものが多かったですが、一方で、「報酬をあげる代わりにタスクをやってもらう方式」に少しずつシフトしてきました。その走りは、Amazon Mechanical Turkと呼ばれるもので、画像のカテゴライズから、データの分析まで、幅広いルーティンな仕事を少額の報酬で、多くの人に並列で手伝ってもらうような仕組みができてきました。
ちなみに、そんな1タスク数円みたいなものを誰がやるんだ、と思われる方もいるかも知れませんが、仕事を引き受ける人(Turker)は、大部分がインドなどの発展途上国のユーザーだと言われています。
さらに、2000年代後半から2010年代頃になると、「シンプルな単純作業を多くの人に頼む」というものから「専門的なスキルを持つ人に仕事をお願いする」というモデルに少しずつシフトしてきました。
おそらく、クラウドソーシングと聞いて、多くの人がパッと思いつくのはこちらではないでしょうか?(アメリカだとUpWorkや99 Designsなど。日本だとランサーズやクラウドワークスといったサービスなど様々なプラットフォームがあり、Top CoderやKaggleといったプログラミングやデータサイエンスなど特化型やコンペ型など実に多くの種類があります)
↑ 様々なタスクやプラットフォームがある
HCIにおけるクラウドソーシングの研究
それに伴い、HCIにおいても、クラウドソーシングの新たな使い方なども研究として始まりました。特に2010年代は、クラウドソーシングの研究がかなりCHIやUISTといったトップカンファレンスを占めていたように思います。
↑ HCIのトップカンファレンスであるCHI 2015のキーワード。クラウドソーシングがかなり大きな割合を占めている
例えば、目の見えない人のためのリアルタイムQ&AをクラウドソーシングでやるVizWiz [UIST 2010]や、ワードで編集中の文章を裏で添削・校正してくれるようなSoylent [UIST 2010]などがあります。(UISTの中でも特に引用数が高い)
↑ 目の見えない人が写真を取って「どれがコーンの缶?」などと質問を吹き込むと、ほぼリアルタイムでクラウドワーカーが解答。ちなみに深層学習以前はこういう一般画像認識 + 質疑応答はかなり機械には難しかった。
近年になると、Amazon Mechanical Turkを使ったシンプルなものから、Upworkなどの高度なスキルを持ったタスクの方に、研究としても少しずつフォーカスが移っています。
例えば、アニメーション作りなど、異なる複数の専門性をもつクラウドワーカー(シナリオ担当、デザイン担当、アニメーション担当、音楽担当など)にどのように役割やタスクを配分するかといったFlash Teams [UIST 2014]などがあります。
今後クラウドソーシングが仕事の主流となった際に、どのように会社やプロジェクトを再構成するか、といった点が議論されていたりします。
↑ The Future of Crowd Work [CSCW 2013] (未来のクラウドワーク)という論文では、今後小さく単純なタスクから、大きく複雑な仕事へとクラウドソーシングの軸足が移ると、タスクを分割することや、ワーカー同士のコラボレーションがより重要になると議論されている。
おわりに
なんとなく、クラウドソーシングがどのように始まってどう発展してきたかがつかめたでしょうか?歴史を知ると、この先どこに向かうのかも見えてくるかも知れません。ぜひ理解の一端になってもらえれば幸いです。
さらに興味がある方は
- ネットを使った大規模共同作業: Luis von AhnのTEDトーク
このマンガについて
はじめに、で書いたように、このブログは、コンピュータサイエンスに興味を持った小中学生とかに、コンピュータサイエンスの学問の入り口があったらいいなと思って、2019年の7月にはじめました。
僕は小学生の頃マンガを通じて物理学を知り、学問に興味を持ちました。物理学にはそういうものがあったわけですが、僕が最初この分野のことを知った時、コンピュータサイエンスにそんなものはありませんでした。
そんな最初の入り口が、コンピュータサイエンスという学問にもあったら、昔の自分がもしもそんなものを知っていたら、また少し違う世界が広がってたんだと思っています。
そういった「コンピュータサイエンスの最初の入り口を提供したい」。その点だけを考えて、基本的にはやっています。(ちなみに、中の人はアメリカの大学のPhD課程の学生で、コンピュータサイエンスの研究をしています。仕事の傍ら、週末に時間できた時にやってるので、今回みたく手抜きになってしまっていますが、ご了承ください _(._.)_ ペコリ)
また、この分野に興味が持った人にとって重要な点が2つあると思います。
1. 基本的な概念や、学問全体の流れがわかっている
2. 最新の研究を追ってキャッチアップできている
1については、マンガを通じて少しずつ紹介していけたらな、と思うのですが、それだけでは足りないわけです。なので、このnoteでは、マンガの他にも、1) 最新のコンピュータサイエンスの研究を140字でゆるく解説しつつ、気になる論文には 2) こういう研究もあるよ、と2-3個似てる研究を紹介もしてコンテクストを掴む手助けをできたら、と考えています。なので、もし興味があれば、他のnoteも見てもらえると嬉しいです。 :(っ'ヮ'c):
また、小中学生のみならず、実務で忙しいんだけどコンピュータサイエンスのことを教養として知っていたいという方や、最先端でどんなことが起きてるか知りたい、という方にとっても楽しんでもらえたら、これ以上嬉しいことはないです。
---
上で述べたように、このnoteは、小中学生たちに届けたいと思ってやっているため、基本的にnoteは無料です。(そもそもクレジットカード持ってないだろうし。)
なので、「なにかお返しがしたい」という方がいらっしゃるのでしたら、Twitterでフォローしたり広めて頂けたりすると嬉しいです。:(っ'ヮ'c):
---
Twitter(@HCI_Comics)では、連載の更新以外にも、HCIや他のコンピュータ・サイエンスの最新の研究についても、動画や画像を交えながら更新していく予定です。ぜひフォローしてもらえたら嬉しいです。(ちなみに中高大生の方からすでに結構相談や連絡をもらっていますが、全然気軽に連絡してもらって大丈夫です。 :)
---
また、メールでも配信してます。Gmailだと、あとで情報の検索がラクなので、こういうストック的なものは、メルマガのがあっている気がします。というか、自分が欲しかったので作りました。(個人的には研究紹介系のメル配信を結構購読していて、日本のだとpiqcyさんの機械学習系のメルマガがかなりおすすめ。もちろん無料です。)
リンクはこちら → https://www.getrevue.co/profile/HCI_Comics
Facebookページ(@HCIComics)も合わせて「いいね」していただけたら嬉しいです。よろしくおねがいします。
中の人は、アメリカでコンピュータサイエンスの研究をしています。
Twitter(@ryosuzk)やホームページ(http://ryosuzuki.org/)も興味があれば。
コンピュータサイエンスの最新の研究(HCI、機械学習、コンピュータグラフィックス、ロボット、人工知能 など)をわかりやすく紹介します。 週一回、研究やニュースのまとめを無料で配信してます → https://www.getrevue.co/profile/HCI_Comics