見出し画像

ITパスポート試験勉強ノート No.7 業務分析・データ利活用 (2)-1 業務分析手法 | 大人の学び

ITパスポート という国家試験の勉強を始めました。

「試験勉強ノート」を作るつもりで、自分が新たに知ったことを書き留めていきます。

この試験、内容は大きく分けて次の3つです。
①ストラテジ(経営戦略)系
②マネジメント(管理)系
③テクノロジ(IT技術)系

シラバスの順に従って、今回は、
① ストラテジ(経営戦略)系
> 2. 業務分析・データ利活用  
> (2)-1 業務分析手法
の勉強ノートです。

シラバスで示される用語(=重要な概念)とその意味を整理します。
大学受験で言えば、山川出版の社会科用語集『一問一答』シリーズのイメージです。チェックリストとしてお使いいただけるかもしれません。

項目中の★印は、現時点での最新版(2024年10月試験)で導入されたことを表します。 
シラバス掲載ページはこちら↓

https://www3.jitec.ipa.go.jp/JitesCbt/html/about/range.html


(今回の範囲には新たに追加された項目はありません。)
下記内容のうち、用語例としてあげられたものに解説をつけていきます。

⬛︎ 業務分析・データ利活用

(2)-1 業務分析手法
・業務を分析するための代表的な手法,データの可視化手法
1 業務分析手法
・図式などの代表的な手法を用いた,業務分析や業務計画
【用語例】
パレート図
ABC分析
特性要因図(フィッシュボーンチャート)
管理図
系統図
PERT(アローダイアグラム)
クリティカルパス分析
最小二乗法
回帰分析
相関と因果
擬似相関
【活用例】
パレート図や回帰分析を使った業務改善

2 図表,グラフによるデータ可視化 <次回>
・目的に応じた適切な可視化手法の選択による,他者へのデータの説明
・不適切に作成されたグラフにだまされないこと,及びそのようなグラフを作成しないこと
・データを分析して問題解決や効率化を図るための,ツール(ソフトウェアパッケージ)の活用
【用語例】
棒グラフ
折れ線グラフ
散布図
マトリックス図
箱ひげ図
ヒートマップ
レーダーチャート
ヒストグラム
モザイク図
クロス集計表
分割表
相関係数行列
散布図行列
複合グラフ
2 軸グラフ
ロジックツリー
コンセプトマ ップ
CSV(Comma Separated Value)
シェープファイル
共起キーワード
チャ ートジャンク
【活用例】
データの図表表現(チャート化),
図表やグラフによるデータ分析,
利用目的に応じたツールの選択,
データの整理・検索・分析・加工・表現のためのツールの利用,
優れた可視化の事例(多次元の可視化,関係性の可視化,挙動・軌跡の可 視化,リアルタイム可視化,テキストデータの可視化など)


⬛︎ 業務分析・データ利活用

(2) 業務分析と業務計画
・業務を分析するための代表的な手法,データの可視化手法
1 業務分析手法
・図式などの代表的な手法を用いた,業務分析や業務計画
【用語例】
パレート図・ABC分析

パレート図
パレート図とは、全体の中で大きな影響を与えている要素を明確にし、重要な問題を特定するためのツールです。上図のように棒グラフと折れ線グラフの複合図で表され、主に改善活動における問題点の発見に活用されています。

たとえば、製造工程では一定の割合で不具合や不良品が検出されます。汚れやキズ、歪みといったさまざまな要素が不具合や不良品の発生要因として考えられるでしょう。このうち、どの要素が大きな割合を占めているかを特定することにより、不具合や不良品の発生件数を抑えるための手がかりになるのです。

QC(Quality Control)7つ道具の1つ
パレート図は、QCの7つ道具の1つとされています。QC7つ道具とは、品質管理のためにデータを整理・分析するための手法のことです。
【QC7つ道具】
・パレート図
・フィッシュボーン図(特性要因図)
・グラフ
・ヒストグラム
・散布図
・管理図
・チェックシート

このうち、パレート図は品質管理を行うにあたって「どこに問題があるのか」「どんな処置を講ずるべきか」を判断する際に用いられます。現状を客観的に俯瞰するために活用されるツールと捉えてください。<略>…影響が大きい原因を重点的に改善することにより、全体の改善を図ろうとするのがパレート図の考え方です。

ABC分析
パレート図で可視化された情報を整理するには、ABC分析を用います。ABC分析とは、累積比率をA〜Cの3ランクに分けることで優先順位づけをする分析方法のことです。

Aランク:累積比率0〜80%。全体に占める割合が高く、影響度が大きい項目群。
Bランク:累積比率81〜95%。全体への影響が無視できない項目群。
Cランク:累積比率96〜100%。全体への影響は小さいと考えられる項目群。

問題に対処していく際には、Aランクに該当する項目を最優先事項とし、Aランクへの対処が完了したらBランクの対処へと移っていくのがポイントです。

株式会社ヌーラボ
総務省 統計局 なるほど統計学園https://www.stat.go.jp/naruhodo/9_graph/jyokyu/pareto.html


パレート図の例
出典:総務省 統計局 なるほど統計学園https://www.stat.go.jp/naruhodo/9_graph/jyokyu/pareto.html


特性要因図(フィッシュボーンチャート)

特性要因図(フィッシュボーンチャート)とは

特性要因図とは以下のような図のことです。別名フィッシュボーンチャートとも呼ばれます。右側に改善したい課題(特性)を記入し、魚の骨のようにその原因となるもの(要因)を書き込んでいきます。魚の骨に見立てて、中央の線を背骨、背骨から伸びる線を大骨、次に中骨、次に小骨と呼びます。

SG fielder Co.,Ltd.
https://www.sg-fielder.co.jp/business/butsuryu/safety/fishbone_chart/


同上

実はこの特性要因図の概念を提唱したのは日本人で、経営学者・工学者の石川馨教授です。

海外では石川ダイアグラム(Ishikawa diagram)と呼ばれていると自著で明かしています。(石川馨『TQCとは何か 日本的品質管理』,1981)

特性要因図は、品質における「特性」とその「要因」を整理する図という意味です。見た目が魚の骨に似ていることからフィッシュボーンチャート・フィッシュボーンダイアグラムなどと呼ばれることもあります。

もともとは製造現場における品質管理のために開発された道具ですが、さまざまな業界で汎用的に用いることが可能です。

…特性要因図は完成した図から読み取れることはあまり多くはありません。関係者全員が議論をしながら特性要因図を作り上げていくことによって、関係者の中で「何が本当の問題か」ということのすり合わせができていきます

さらに、現場でなんらかのトラブルが起きた際に、既に出来上がっている特性要因図を見ながら今回は何が原因だったのかを確認するツールとしても使うことができます。作業者がなんらかのミスを起こしたとき、管理者として原因を追求しようとしても「不注意で破損させてしまってすみません」など、謝罪に徹する作業者の方は非常に多いです。そういった場合にも一緒に図を見ながら、まず「作業者」の不注意が原因、ということを認めつつ、他の要素について、作業手順に問題はなかったか、現場環境にミスを誘発するような要因はなかったかということを探ることでミスを引き起こしている本当の要因を聞き出すことができるかもしれません。

特性要因図に見落としがあれば、随時書き足していきましょう。新しい要因を他の要因と比較・評価することで問題の重要度・優先順位をつけることができます。

同上

管理図

管理図は、品質や工程などの管理状態を視覚的に把握するために使われます。目標値を中心線(CL)、その上下に公差を示す上方管理限界線(UCL)と下方管理限界線(LCL)を配置し、取得したデータを時系列で折れ線グラフとして表示していきます。
上限値と下限値の範囲を正常値、範囲から外れた場合をアウト(管理外れ)とします。これにより管理範囲内のデータの変化と、異常原因によるデータの変化を区別・管理することができます。

キーエンス
https://www.keyence.co.jp/ss/general/manufacture-tips/7qc-tools.jsp
同上

たとえば、工程が安定した状態にあるかどうか調べる場合、横軸には、日付や時間など一定の間隔でサンプリングを実施するタイミングを入れます。縦軸には不適合品数など品質に関わる項目を入れます。データを集計すると、その変化がどこで起きているかが見えるようになり、管理が必要な範囲を把握できます。また、アウト(管理外れ)となった時には、その際に何が起きているかを追求することで、問題の原因を発見でき、改善につなげることができます。

同上

系統図

系統図法とは、目的と手段を系統づけ、その体系を枝分かれさせてわかりやすく図式化したものです。
目標を達成するための道順を決めて対策を整理する方法です。
段階的に細かく分割・展開することで、より具体的な方策を出したり、抽象的なアイデアを広げたりします。
目的に対する手段が定まっていないときに系統図法を用いることで、新たな発見が得られ、最適な手段を見つけることができます。

系統図法を用いると、事象を系統的に展開できるので、作成の過程や結果の中から具体的な解決策を考えることができます。達成すべき目的に対して手段①を考え、さらにその手段①を目的と置き換えて、これに対する手段②を考える…というような流れ(目的-手段=目的-手段)で順番に展開していきます。この手段は実現できるものでなければならないので、実現可能な手段になるまで展開していきましょう。

株式会社エクシール
https://www.exseal.co.jp/blog/taxonomy-10/6130/
系統図の例
出典:同上

PERT(アローダイアグラム) + クリティカルパス分析

概要 アローダイアグラム(arrow diagram)とは、複数の要素の間を、それらの関係を意味する矢印で結んだ図。特に、複数の工程や手順の間の前後関係を矢印の向きによって表した図

プロジェクトマネジメントではプロジェクトを構成する工程の前後関係を一覧して把握するために作成される。このような図を用いて計画や管理を行う手法を「PERT」(Program Evaluation and Review Technique)ということから、「PERT図」(パート図)とも呼ばれる。

複数の工程からなるプロジェクトでは、工程間に「前の工程が終わらないと次の工程が始められない」という依存関係が存在する場合がある。一方で、どちらを先に行っても良い、並列に進めても良いという関係になっているものもある。

アローダイアグラムでは矢印が個々の工程を表しており、内容と所要時間を付記する。工程間に依存関係がある場合、間に丸印(◯)で表される「結合点」を挟んで矢印同士を連結する。プロジェクトの開始と終了も結合点として表す。すべての工程を配置すると、開始から終了までどの順序で工程を進めればよいか、どの工程を並列に進められるかを一覧できるようになる。

開始から終了までの間には、いくつかの経路が現れることがあるが、経路上の工程の所要時間を足し合わせていくと、それぞれの経路全体の所要時間を求めることができる。その中で最も所要時間が長い経路は、プロジェクト全体の最短工期を表しており、これを「クリティカルパス」(critical path)という

クリティカルパスに現れない工程をどんなに急いでも工期は短縮しないため、遅延を防止したり工期を短縮するにはクリティカルパス上の工程に注力する必要がある。このようにクリティカルパスに着目してマネジメント活動を行う手法を「クリティカルパス法」(CPM:Critical Path Method)という。

https://e-words.jp/w/アローダイアグラム.html
アロー図の例
https://sp-jp.fujifilm.com/future-clip/visualization/vol4.html

最小二乗法 + 回帰分析

最小二乗法は、データとそれを表す回帰直線の誤差を最小にするような直線y=ax+bの回帰係数aと切片bを決める方法のことです。

具体的には、残差の二乗和が最小になるようなもっとも当てはまりのいい回帰直線を求める方法です。
<略>
最小二乗法で求められた回帰直線をみることで、変数間の特徴を直感的に把握できるようになります。

また、たとえば「気温が○℃のとき、売上個数はこれくらいになる」という将来の予測にも使うことができます

https://kuroco.team/blog-data-least-squares-method/

◉ 回帰分析は、原因から結果を予測するときによく使われる分析方法です。

説明変数が目的変数とどのような定量的な関係があるのかを調べ、それを明らかにしたうえで将来の予測に活用していきます。
<略>
回帰分析には、単回帰分析と重回帰分析の2種類があります。

単回帰分析は、原因とみられる1つの要素から、ある結果を予測するための手法です。説明変数が一つ(単一)なので単回帰分析とよばれています。

単回帰分析では、結果を予測するとき「y=ax+b」という直線の式を用いて表します。

このxの部分が説明変数となり、yの部分が目的変数を表します。

重回帰分析は、説明変数が複数存在している場面において、結果を予測する際に用いる分析手法です。

要は、単回帰分析よりも説明変数が多い場合に使う、というイメージを持っていただければと思います。分析手法の根本的な考え方としては、単回帰分析と変わりありません。

予測する際の直線の式としては、以下の通りです。
y=a₁x₁+ a₂x₂ + ・・・・・+ anxn +b
説明変数が増えたので、a₁x₁、a₂x₂などのように複数のxが出てきています。

◉ メリット
回帰式が得られれば、式に数字を当てはめるだけで統計学に基づいた予測が出来るので、ビジネスにおいては売上予測、販売数予測など様々な場面で役立ちます。

感覚ではなく、過去のデータに基づいた予測を立てることで、「不良在庫を減らす」、「適切な人員配置ができる」などにより利益の改善につなげることもできます。ビジネスマンの方には是非覚えていただきたい分析手法の一つです。

◉ 注意点
1. 多重共線性


説明変数が複数である「重回帰分析」を実行する際の注意点として「多重共線性」というものに気をつける必要があります。

多重共線性とは、相関係数が0.9を超えるようなかなり強い相関がみられる変数を一緒に説明変数に加えることで、分析結果が不安定になり正しい結果が得られないということを指します。

多重共線性が生じないように、事前に変数間の相関を確認しておくことが大切です。

もしかなり相関が強い変数が見られた場合の対応としては、「一方の変数を取り除いて分析を実施する」か、「2つの変数をあわせて1つの変数にする」などで対応するのがよいでしょう。

2. 説明変数の数は多すぎてもよくない

重回帰分析を行うときに説明変数の数が多すぎると正確な分析結果が出なくなってしまう可能性があります。

目安としては「説明変数はデータの総数の1/15まで」と覚えておくとよいでしょう。

説明変数が多すぎる場合の対応としては、「データの総数を増やす」か「説明変数を減らして分析する」などがあります。

3.「予測」と「現実」は異なる場合がある

回帰分析で求めた回帰式に当てはめて将来の予測をすることは出来ますが、あくまでも「予測」にすぎません。

そのため、求めた直線の式を使って予測したものの、現実の結果が大きく異なるということもあります。

たとえば、回帰分析の結果、1日に商品が100個売れると予測したものの、たまたまSNSで取り上げられて、突発的に売上が増加して予測結果と大きく異なってしまったといったケースも考えられます。

そのため、あくまでも予測の1つの判断材料として活用するようにし、イレギュラーな事象がある場合には、これまでの経験をもとに臨機応変に対応していくといったことができるようにすることも大切です。

また、単回帰だと予測が不十分な場合には、重回帰分析にして説明変数を追加するなどを行い、より現実に即した予測が出来るように分析ができるよう改善するといったことも重要です。

◉ Excelを使った回帰分析の方法
<略>

https://kuroco.team/blog-data-regression-analysis-20221104/

相関と因果 + 擬似相関

◉ 相関関係とは

相関関係について知識を持っている方が多いかと思います。相関関係の定義は至って単純です。

変数Aと変数Bの間に相関関係があるということは、一言で言うと、

変数Aが増加した際、変数Bもほぼ同じ割合で増加または減少する傾向にある

つまり、変数同士の大きさに関連性があるのが相関関係です。相関関係の特徴の1つは「出来事の起こる順番は関係がない」ことです。

◉ 因果関係とは

事象Aと事象Bの間に因果関係があるとは、以下のことです。

事象A(原因)が起きたことによって事象B(結果)が変化する…①

あるいは

事象B(原因)が起きたことによって事象A(結果)が変化する…②

つまり、因果関係とは「原因と結果の関係」であり、事象A(B)が起きることは事象B(A)に正または負の影響を及ぼしています。

以下は、因果関係が”考えられる”現象です。
(注)ただし本当に因果関係があるのか、それとも見かけ上の因果関係なのは、かなり綿密に調べないとわかりません。
・スタッフを増やした(事象A)ので、仕事にかかる時間が短くなった(事象B)
・週末にセールを開催した(事象A)ので、いつもより2倍程度のお客さんが来店した(事象B)
・広告を出稿した(事象A)ので、自社のECサイトの訪問者数が増えた(事象B)

これらの例からでも想像できるように、因果関係を見つけ出すことは、収益アップに直結するなど、ビジネスにおいて重要そうですね。

因果関係の特徴
(特徴1)2つの事象の間に直接な関係がある
(特徴2)出来事の起こる順番がある

相関関係の場合、出来事の起こる順番には関係がないです、一方で、因果関係には方向性があります。上記の①と②の一方向のみ成り立ち、逆が成り立たないことがあります。

例えば、「気温が上がったので、かき氷の売り上げが上がった」において「気温上昇」が「かき氷の売上上昇」をもたらしていることは容易に想像できます。しかし、「かき氷の売り上げが上がったので、気温が上がった」はあり得ませんね。

◉ 相関関係と因果関係の区別
擬似相関と交絡因子
<略>
「気温のデータ」、「ビールの売り上げのデータ」、「アイスの売り上げのデータ」の3種類を散布図で可視化したところ、以下の2つのパターンが読み取れました。気温が上がるとビールの売り上げが上がる
気温が上がるとアイスの売り上げが上がる

今度は、「ビールの売り上げ」と「アイスの売り上げ」の2種のデータを散布図にし、一方が増えるともう一方が増える傾向が見えました。さらに、相関係数を計算したところ、両者に強い相関関係があると言えそうです。

しかし、 「ビールの売り上げ上昇が原因となって、アイスの売り上げを上昇させている」とは言えず、直感的にもおかしいとほとんどの人が思うはずです。

この例も、 相関関係があるものの、因果関係はあるとは言えないことに帰着します。一見、因果関係があるように見える2つの出来事でも、本当は、ただの相関関係でしかないことがあります。この場合、それぞれの事象は全く関係ない他の要因に影響されていることがあります。

「気温が高い」という共通の因子が「アイスの売り上げ」と「ビールの売り上げ」の両方に同じ方向の影響を及ぼしており、その結果、「アイスの売り上げ」と「ビールの売り上げ」の間に見かけ上の関係性ができているのです。

この場合、「ビールの売り上げ」と「アイスの売り上げ」は擬似相関の関係にあると言われており、「気温」がその交絡因子(Confounding factor)と呼ばれます。交絡要因とは、2項目に影響を与えて相関係数を高くするような第3の要因のことです。交絡因子は、2つの変数のそれぞれと因果関係がなり立ちます。
<略>
ビジネスの世界において、統計学的な手法に精通していなくても、データの裏にある背景、2つの要素以外がデータに影響を与えていないかを考えることが大切となります。他に、因果関係と思われるデータを見つけた時には、参考にした資料やデータの他に、同じことを述べているデータがないかを探すことも良いでしょう。

都合の良いデータを見れば因果関係がある、と考えたくなります。しかし、相関関係と因果関係はデータ上では同様のものとして表示され、擬似相関はビジネスのデータの誤解釈につながりやすいのです。まずは何が原因となっているのか、その他に何か影響を与えているものはないのか考えることが、因果関係を正しく判断する鍵となります。

◉ 数値の予測だけが目的であれば、因果関係がなくてもいい
目的が値を予測するだけであれば、説明変数と目的変数の間に実は因果関係がなくてもいいのです。

「アイスクリームの売り上げ金額」と「扇風機の販売台数」の間には因果関係があるとは思えないけれど、強い相関関係がある可能性が高いです。数値だけを考えた場合、片方の変数の値がわかれば、もう片方の変数の値を予測することが可能です。

https://gri.jp/media/entry/8670



いかがだったでしょうか。
パレート図・ABC分析・管理図・系統図などは、名前だけでは分かりにくいですが、内容としては常識的なものだな、という印象でした。

次回は、
①「ストラテジ(経営戦略)系」
>「2. 業務分析・データ利活用 」
>(1) 業務の把握
 (2)-2 図表,グラフによるデータ可視化
についての予定です。

この記事が気に入ったらサポートをしてみませんか?