![見出し画像](https://assets.st-note.com/production/uploads/images/29793580/rectangle_large_type_2_b7ee6ad03213fb50b6a1bc6b10cfa61d.png?width=1200)
Vol. 44 「眠る情報 -ダークデータ-」
開いて下さりありがとうございます。宜しくお願いします。
昨日の日経新聞に載っていた記事に、企業が持つ「ダークデータ」に関するものがありました。
その記事を要約すると、
・企業が蓄積しているデータの中で、製品開発や販売促進に活用されていない休眠データ(ダークデータ)は全体の約75%。
・ダークデータの管理費は年間約40億円。管理に人員や費用がかさみ、無駄な出費が多い。
・コロナ渦の中で、ダークデータを洗い出し、事業の立て直しに役立てる動きが盛んになっている。
このような感じです。
この記事をさっと読んだ時に、「そもそもダークデータとは何なのか」「管理に莫大な費用がかかり、しかも活用したら企業にとって有用なのになぜ今まで活用されていなかったのか」と疑問に思うことがあったので、調べてみることにしました。
【ダークデータとは】
ダークデータとは、「光が当たっていない」という意味で、企業に蓄積されたデータの内、有効活用されていないデータを指します。そもそも価値が認識されていない、また分析手法がわからないといったケースが多いです。
ダークデータの種類は、大きく3つに分けられます。
・テキスト系ダークデータ
ー Eメールや書類、通知など、主にテキストから成るデータ。データベースへの紐付けが甘かったり、効率的なツールを導入していない場合にダークデータ化する。
・リッチメディア系ダークデータ
ー 画像、防犯カメラ、音声などのデータ。
・ディープウェブ系ダークデータ
ー ウェブ上に存在するのにも関わらず検索エンジンにヒットしないデータ。Google検索で出てくる情報の約500倍がディープウェブのデータとして存在している。
これらのダークデータは、企業の全データの内、75%を占めるとされています。さらに、日経新聞社の調べによると、世界にある上場企業がダークデータの保存・管理に費やす費用は、2020年に約140兆円に及ぶという見通しだそうです。
なぜそこまで膨大な額を維持・管理費に使わないといけないほどにデータを溜め込んでしまうのでしょうか。
理由としては、データには消費期限が無いことがあげられます。データはいくら溜めても腐らない、いつか使えるかもしれないという思考で企業はデータを溜め込む傾向にあります。
しかし、それでも使えるか使えないか判らないデータのために多額の費用を使い続けるのは、非常に非効率です。ダークデータをいかに有効に活用できるかが企業には求められています。
ダークデータを活用することで、どのようなメリットがあるのでしょうか。
【ダークデータ活用におけるメリット】
まず前提として理解しておきたいことが、2つあります。
1, データは分類され構造化されて初めて価値を持つ。ダークデータとは分類・構造化がされていないデータ。
2, ダークデータなどの構造化されていないコンテンツを構造化するAIを用いたツールをコグニティブRPAと言う。
これらを踏まえた上でメリットを紹介していきます。
・手続きの自動化
ー コグニティブRPAを使うことによって、蓄積された膨大な量の書類や画像、電子メールなどのダークデータを関連づけて解析することが可能になり、業務が自動化され、今後の業務の効率化が図れます。
・業務内容の変化
ー 現在、ダークデータを分類し構造化するコグニティブRPAを取り扱う企業がスタートアップとして出てきていますが、5年以内には多くの業界で一般化されると言われています。それにより、膨大な量の事務作業に追われることが無くなり、意思決定や経営目標を達成するための業務などに注力することができるようになります。”考えること”という社員本来の業務に多くのコストを割くことが可能になります。
・損失の削減
ー 前述した通り、2020年では世界全企業でのダークデータの管理のために必要な費用は140兆円に及ぶと言われています。全データの内75%を占めるダークデータを有効活用することによって、無駄な費用を省くことができます。
ではここで、私が抱いた疑問である、「有用なダークデータがなぜ活用されないのか」を考えていこうと思います。
【ダークデータが活用されない理由】
・量が多すぎる
ー そもそも全体の75%を占めるダークデータを解析するには相当の時間とコストがかかります。
ー 企業の経営層がデータに関する理解が不足していることが、ダークデータを増やしていることに繋がっています。中小企業に多く見られますが、「データを集めたは良いが、使い道がわからない」といったケースが多いため、気づいたらダークデータが増えてしまっています。
・スキルの不足
ー 構造化されていないデータを解析し、有用か有用でないかを識別するには高度な技術が必要になります。前述したコグニティブRPAと使用できている企業はまだ少なく、スキルを持った人材の不足がダークデータを活用しきれない要因の一つです。
このように、ダークデータを活用するにはいくつかの障壁があるのは理解ができました。しかし、現在コロナの影響下で、企業のダークデータの洗い出しが盛んになっています。なぜそれが可能になったのでしょうか。
【コロナ状況下での企業の動き】
現在、アメリカの大手企業を中心に、ダークデータの洗い出し(有効活用させるための解析)をする”ROD(Retrun On Data)”の発想が盛んになっています。
今までもそれが有益だと言われていたにも関わらずやってこなかった、でもこの状況下でやり始めたのには理由があります。
それは、「コロナの影響下で自動車業などを中心に減産を迫られている中、各工場のシステムを進化させ、データを洗い出す時間と手間を確保することができたから」です。
例えばアメリカの「フォード・モーター社」は、自粛により自動車の売り上げが伸びない、製造することができない中で、データ分析のチームをパワーアップさせ、ダークデータを有効活用することによって今後の持ち直しを図ろうとしています。
自粛期間で自動車の需要が低下していた状況でも、そこで立ち止まらずに、先のことを考えて今できることをするその姿勢が、まさに世界トップだなと改めて感じました。
ダークデータの割合が高い日本の企業でも、今後どれだけダークデータを有効に活用し、企業の成長に役立てていくかが重要視されていると感じています。
今日はダークデータについて書いてきました。記事を読んでいてわからないことがあったらそれを疑問に思い、仮説を立て、検証する癖をつけていくことをこれからも続けていき、さらに思考力を上げていきたいと思います。
今日も読んで下さりありがとうございました。もし記事を気に入ってくださった方がいたら、是非フォロー、スキ、コメントを宜しくお願いします。