【新技術】AI?ML?データ分析って何?-データはあるけど分析の進め方が分からないあなたへ-(1)
こんにちは!
インテック 金融事業企画部データサイエンティストのミヤマルです!
新規事業の企画・システムアーキテクト・UI/UXデザイン・自然言語処理の研究などなど、色々やっておりますが、お客様のデータをフル活用することで課題を解決することを生業としています。
つい、からあげのデータを分析してしまうほど、からあげとデータ分析が好きです↓
これまで金融に限らず以下のようなAI・データ分析のプロジェクトに携わってきました。
・ビジネスマッチングで得られる商談情報のデータマイニング・AIモデル化
・機微な情報を特定するコンプライアンス順守AIモデルのアーキテクト
・リアルタイムに信用リスクのスコアを算出する予測モデルの構築
・プロジェクトマネジメント業務をご支援するAIモデル内蔵BIの企画・設計
・営業支援サービスのUX向上を目指したデータ分析
結果を出せたプロジェクトも悔しい思いをしたプロジェクトもありましたが、今回はその経験から得られた「データを活用するノウハウ」を二回連載で余すところなくお伝えしようと思います!
「社内にデータはあるけど、どうやって分析したらいいんだろう...」
とお困りの経営者さまや
「AIで社内の業務を効率化しろ!!お金はかけるな!1ヶ月で作れ!」
と上司からミッションを受けた情シスのあなた!(ご愁傷様です)
上に挙げたような方はもちろん、データ分析に興味のある方はぜひご覧ください!!
1.そもそもAI、機械学習とは何?データ分析って何?
話に入っていく前に、まず「AI・データ分析に関する用語」の整理をしたいと思います。
ここが整理されず話を進めると課題を持っている人と実際に解決している人と齟齬が生まれるので、概念整理をしておくことは大切です。AIに関連する用語について下記に図示してみました。
「AI」ですが、定義自体が人によって異なり一意的でない概念ではあるのですが、共通認識として
「推論、認識、判断など、人間と同じ知的な処理能力を持つ機械(情報処理システム)」
といった意見が一致していると思われます。
※ディープラーニングG検定公式テキスト参照
「機械学習(ML)」については「AI」に包含される概念であり、
「システムに大量のデータからパターンやルールを発見させ、予測や判別、分類等をする技術」
と捉えるのが妥当でしょう。データを入力として学習がなされたモデルは「学習モデル」と呼ばれシステムに組み込まれます。
「機械学習」以外にも経済学の「ゲーム理論」や心理学・生理学の「知覚・認知」といった様々なアプローチから人間の知能をシステム化していく「AI」の試みは散見されます。
「ディープラーニング」ですが、近年のAIブームの火付け役となっている分析手法です。
2021年現在、「AI」というと、この「ディープラーニング」の技術を用いて作成された「学習モデル」を指していることが多いです。
こちらについては「機械学習(ML)」に包含される概念であり、
「脳神経回路の仕組みを模した物事の特徴を機械自ら学習することが可能な分析手法」
と定義するのが妥当でしょう。メリットとして予測精度が高い反面、デメリットとして人間に理解しづらい説明性の低いモデルが出力されてしまうということがあります(このデメリットを改善する技術検証も世界的に進んでいます)
「AI」は統計的な手法を活用して作り出す「システム」であり、これを実現するためには目的となる数値や課題に大きく寄与する特徴をデータを分類・整理しながら発見、ビジネス上の課題に対して意思決定できる材料を見つけ出す「データ分析」が必要です。
次の章ではこの「データ分析の目的設定の型」についてお伝えします!
2.データ分析の目的設定とデータ分析フローについて
この章では、データ分析の目的設定とデータ分析フローについてお伝えしたいと思います!
データ分析の目的は「①データマイニング型」と「②AI・RPA型」の大きく2種類に分かれます。下記にまとめました。
①データマイニング型:ビジネス上の有用な知見の発見が目的。説明性の高い統計モデルを使うことが多い(重回帰分析・決定木など)。高度な統計分析・モデリングをせずともBIツールでの解決が可能な場合も。
②AI・RPA型:業務のシステム化が目的。近年では特徴量が明確であることが求められない場合はディープラーニングでモデル化することも多々あり。
上でも述べたように「①データマイニング型」は「ビジネス上の有用な知見」を「発見」するところにゴールがあります。
そして「②AI・RPA型」は「ビジネス上の知見」が発見されるか否かに関わらず「課題解決」ができるか否かがゴールにあります。
しかし、この「目的設定」がずれていると、分析をしてその結果をまとめたとしても、使えないという判断になってしまうので、ここは明文化したほうが良いです!
この目的設定の型によって、当然データ分析フローも変化します。
基本的な分析フローは同一なのですが、②AI・RPA型は「課題解決」に関連するトピックが必要ですので、「ビジネス課題の発見&仮説立案」と「システム化の検討」が①データマイニング型の前後に入るイメージです。下記がデータ分析のフローイメージです。
次回は、上記の「データ分析のフローイメージ」のそれぞれのトピックに対して、具体的にどう実装していけば良いか記載します!
3.おわりに
弊社ではデータ活用のコンサルテーションから、システム化・その後の運用までをご支援することができます。
お客様に合う分析ツールや、ソリューションを組み合わせてより良いシステムをご提案させていただきます。
お気軽に下記フォームよりご相談ください!
※ 記載されている会社名、製品名は、各社の登録商標または商標です。