見出し画像

実問題のデータサイエンスは簡単? 最先端の技術がそれほど活躍しない理由

世間で言われるほど、データサイエンスは難しくありません。いいアプリが出てきたとかいう以前に、そもそも難しい技術が必要な局面は限られているという話です。


現実の問題は難易度の幅が広い

単純化するために、問題の難易度を3段階に分けてみましょう。ゾーン1は、簡単な技術で解決できる簡単な問題。ゾーン2は、最先端の技術でしか解けない難しい問題。ゾーン3は、現時点の人類が解決策を持ち合わせていない、現状では解決不可能な問題。技術は日々発展しますので、かつてゾーン3だった問題がゾーン2に下りて来ますし、ゾーン2だった問題はゾーン1に下りて来ます。こうして人類には解決可能な問題が増えていくという構図です。

問題の難易度とゾーン

ニュースで話題になるのは、ゾーン3がゾーン2になったときです。ここ10年のAIがその典型ですが、これまで不可能と思われていた難題が扱えるようになり、人々に希望と恐怖を与えています。ゾーン2が扱えるベンダーには、高額の仕事が舞い込み羨望の的になります。

ですが、事業会社で長く働いていると、実際にはゾーン2相当の問題が多くないことが分かります。例えば売上データからレポートを自動作成するのは簡単 (ゾーン1) ですし、散らかったデスクを片付けるのは2024年現在では不可能 (ゾーン3) です。

面白いのは、特に高額なベンダーの技術者と話していると、その割合に実感がないことです。というのも、ゾーン1の仕事は事業会社が自力で解決してしまうので持ち込まれませんし、明らかなゾーン3の仕事は営業が断ってしまうので、実際の業務はゾーン2が多くを占めるからです。ですから、ベンダーがゾーン2を解決できる先進技術を声高に宣伝するのは、確かに仕事を取るためのポジショントークでもあるのですが、それが実情と信じる根拠もあるのです。個人的な経験では、議題に挙がった問題のうちゾーン3が半分、ゾーン1が40%で、ゾーン2は1割くらいな気がしています (もちろんゾーン3は高望みすれば無限にあります)。


問題を解きほぐす

ところで筆者は英語が得意ではありません。そんな筆者には、データサイエンスと英作文には共通点があると感じています。

英語が得意な人は、与えられた問題文をそのまま訳すことができます。しかし筆者のように語彙が貧困で華麗な英語が書けない人は、まず問題文の日本語を別の平易な言葉に言い換え、それから翻訳すると思います。

実はデータサイエンスも同様の構図です。アルゴリズムに秀でアプリも素早く実装できるようなデータサイエンティストであれば、与えられた問題を正面から解き切ってしまいます。しかし筆者のような二流にはそういった技術は備わっていません。そのときには、取り組むべき問題を解きほぐし、要望の妥協点を探し、急所に絞って最低限の実装を試みます。この作業と、英語が苦手な人の英作文のプロセスは非常に似ているのです。

DXにおけるこの役割は、分業するならば、ビジネスアナリストやUXデザイナーの担うところです。つまり、ビジネスアナリストやUXデザイナーが活躍すれば、ゾーン2や、一見するとゾーン3だった問題すらゾーン1として扱うことができるということです。

簡単になることの長所は、属人性が下がり、ミスが減り、データサイエンティストの人材不足が解消され (あるいはベンダーへの委託費用が下がり)、メンテナンスの負荷が下がることです。短所は、華々しく導入するはずだったAIの話題性が下がることでしょうか。実は話題性はDXの機運を高めるので馬鹿にしたものではないのですが、とはいえメリットの方が多いのは明らかです。


丸投げの問題はゾーン分け能力が身に着かないこと

「餅は餅屋」という慣用句がありますが、IT関係の業務をまるっと外注することの問題点は、問題の解きほぐし方やゾーンに対する肌感覚が育たないことです。もっと分かりやすく言えば、外部ベンダーの言いなりになってしまうことです。本当はゾーン1の問題をベンダー側がゾーン2だと言い張って高額な案件にしてしまうこともあれば、事業会社側の説明が正確でないことを恐れてベンダーがリスク分の上乗せをすることもあります。

案件の数が少ない場合には、それでも定常的に社内に人員を抱えるより安くつくかもしれませんが、ある程度本格的にDXを推進しようと思えば、いつまでも全面的に餅屋に任せる訳にはいきません。実はゾーン1なので社内のメンバーで解決できますとか、高名なベンダー以外にも委託先候補はありますとか、そういったことを判断できる感覚を、内部で身に着けた方が遥かに早くて安くて確実です。そのうえで、非常に難しいが最先端の技術でギリギリ解けそうと判断した問題を “餅屋” に頼むべきだと考えています。


ゾーン分けの話はデータサイエンスに限らない

本稿ではデータサイエンスに関して述べてきましたが、おそらくはどの専門でも似た構図なのでしょう。例えば法務であれば、法的側面の前に、まず本当の問題がどこにあるのか突き止めます。そして法律の技術的な側面に関し、明白なら自分たちで判断し、難しいケースのみ社外の弁護士に相談するでしょう。経営だってそうかもしれません。社内で判断に迷うことがあったらコンサルティングファームに相談を持ち掛けますし、簡単すぎる問題は部下に権限移譲します。経営の場合にはゾーン3でも放棄できないという違いがあるにせよ、まずゾーンの区分が必要になるのに変わりはありません。

ですから、どの専門にせよ、最低限のパフォーマンスを出すのはそれほど難しくはありません。ゾーンを仕分ける感覚を身に着け、ゾーン1を確実にこなし、ゾーン3に取り組まなければ確実に結果は出ます。それが可能になった後にゾーン2を自力で解決できるよう成長していけばいいのです。


重要なのは問題が解決すること。技術はその手段

ただ実際には、言うは易しなのかもしれません。というのも、問題解決の手段を学ぶより、ゾーンを仕分ける感覚を習得する方が難しいかもしれないからです。本稿の趣旨は、データサイエンスで実務を行う際に、技術的に高度な手法が必要なことが案外多くないというものであって、データサイエンスを用いるプロジェクトが総じて簡単だというつもりはありません。技術さえ習得すれば仕事ができるという考えを否定したいだけです。

英訳が得意な人であっても、元の文章に曖昧なところがあるときに、文意が明確になるまでひたすら差し戻すだけでは仕事ができる人の範疇には入らないでしょう。同様に、データサイエンティストであっても、自分にちょうどいい仕事が来るまでひたすら待つだけではダメだということです。自分でビジネスアナリシスを学んでみたり、UXデザイナーを連れてきたりして、成果を出すための工夫をしないといけません。その結果として思ったより技術力が要らないケースが多い、そんな現状をご紹介したかったのです。


この記事が気に入ったらサポートをしてみませんか?