見出し画像

IBM Cloud/IBM Watson Studioサービスで、ビジネスにエンジンをかける

要約


本記事は、IBM Cloud Advent Calendar 12/9の記事となります。

IBM Cloud/IBM Watson Studioサービス・インスタンス内にあるAutoAIと
Node-red(ソーシャルリスニングのツールとして使用、以降、感情推定)を組み合わせて、ビジネスにおけるデータ精度を向上させる方法について言及します。
次回(12/16)書く予定なので、今回はAutoAIそのものの使い方には言及しません。そしてデータの補正方法についても言及しません。その点はご容赦ください。

ただ、IBM Cloud/IBM Watson Studioサービスを有効に活用することで、ビジネスのエンジンをかけることができます。例えば、未来予測/トレンド分析を行う際は、この稿は有効と思われます。

[使用サービス/技術]
IBM Cloud/IBM Watson Studioサービス
AutoAI:データから予測する際に使う技術
Node-red:ソーシャルリスニングする際に使う技術 SNSデータから感情計測する際に使う技術

Node-red:2021 衆議院選挙をソーシャルリスニング


はじめに

今回の衆議院選挙(2021年衆議院選挙 10/31 投開票)で明らかになったのは、
メディアの事前調査精度にあきらかに問題がある、つまり以前のデータ(現場のカンも含む)が使えなくなったということを意味します。
これは、とくに新型コロナ渦のため、外部環境が大幅に変わり需要予測など予測そのものができなくなったことを意味し、あらゆる産業にとって大きな打撃となっています。

1.NHKの出口調査

今回の衆議院選挙(2021年衆議院選挙 10/31 投開票)の小選挙区に絞ると、NHKは、自民党は予測「上限」の180議席を上回り、立憲民主党は予測「下限」の63議席を下回りました。

NHK 予測と結果

調査方法
①期日前投票の出口調査:傾向分析。全国的に、序盤は与党が優勢から野党優勢へ。
②当日の出口調査:具体的に当落分析。

自民党 289の小選挙区について
a.公認候補 当選圏内171人(うち、敗れる可能性もある25人)/当選圏外106人。
b.NHK内で見積もり。NHK内で検討
c.下限を「145」議席、上限を「180」議席という予測に決定。

③結果
当選圏内で当選圏内は全員当選し、
a.当選圏内にあるが敗れる可能性もある:25人のうち、20人当選
b.当選圏外:106人の中から、21人当選
(1位の候補に大きく引き離されていたものの、ひっくり返したケースもあり)

2.NHKの出口調査から言えること

選挙は、候補者の当落がかかっています。とくにNHKは判断基準なので、100%の正解が要求されます。

NHK 2021衆議院選挙 予測と結果

a.敗れる可能性もある:25人のうち、20人当選
94.7%外していることになります。

b.圏外106人の中から、21人当選
80.1%正解。21人は当選しているので、約20%外していることになります。

要約すると94.7%も外している項目があるので予測として、使えない
ということなります。

とくに、

中盤から野党が勢いを持ち、投票日が近づくに連れ、その傾向は強くなっていたように見えました。

とあるので、出口調査(既存のデータ/データ取集方法)は使えない、ということになります。

3.ビジネスのエンジン、既存のデータは使えないのか?

ビジネスのエンジン=既存のデータやデータ取集方法は使えない、ということになるのでしょうか。NHKなど大手メディが外しているなか、ほぼ正解を出しているところがあります。

朝日新聞です。

4.朝日新聞の手法


朝日新聞社は、電話調査とインターネット調査を組み合わせて、選挙情勢を予測する調査を実施しました。つまり、今までの手法(電話調査)と新規(インターネット調査)を組み合わせています。

①データ補正
今までの手法(電話調査)から算出した結果を、新規(インターネット調査)をもとに補正
(図を書いた人がまちがえたのか意図的にか、は別として、新規を基準に今までの手法で補正、というアプローチは日本の企業では考えられない)

②データ分析
補正データを、過去データや現場からの取材データをもとに分析。

つまり、データ補正と分析を分離しているところがポイントです。

a.既存データからそのまま算出
b.インターネット調査をもとに補正
c.現場データをもとに分析

補正プロセスと分析プロセスを明確に分離することで、改善点が明確になります。

データが悪いの?分析が悪いの?

を明確にすれば使用可能、ということになります。

補正方法は、次回。

5.IBM Cloud/IBM Watson Studioサービスにあてはめると

a.AutoAI:既存データからそのまま予測(つまり過去データは使える、ということです)
b.インターネット調査で補正(Node-redなど、ソーシャルリスニングツール活用)
c.現場データをもとに分析

すれば使用可能、ということになります。

ビジネスにエンジンをかける

選挙でいう"風”、民意の後押しは(Node-redなど、ソーシャルリスニングツール(感情推定)では露骨に出ます。つまり今までのデータから算出した結果を補正するのは、容易です。

無風 2021 衆議院選挙

2021 衆議院選挙 まったく反応なし

大型台風直撃 2020 アメリカ大統領選

2020 アメリカ大統領選当日 アメリカ国民感情 リアルタイムに測定・可視化

2020 アメリカ大統領選のアメリカ国民の多様な感情をリアルタイムに測定・可視化した結果。

2020 アメリカ大統領選 アメリカ国民感情 リアルタイムに測定・可視化

投票日前まで、まったく差がつかない大激戦であった様子が見えます。
なお、メディアBBCをはじめ大手メディアの予想は 「ジョーバイデン氏一強」でした。世界的に、出口調査(既存のデータ/データ取集方法)そのままでは使えないことがうかがわれます。

参考



衆議院選挙 NHKの議席予測はなぜ外れたのか
https://www.nhk.or.jp/politics/articles/feature/71414.html

(世論調査のトリセツ)選挙予測でネット導入、偏り補正
https://www.asahi.com/articles/DA3S15109923.html

インターネット調査による選挙予測の可能性
http://ssrc-saitama.jp/content/files/PDF/PR_No.9_Eguchi.pdf

2021日本衆議院選でどちらが当選するか予測と結果
https://note.com/futureforecast/n/nfb8852f6f865
11/3時点の同日記録です。

Node-redを使って、2021年衆議院選挙をリアルタイムに全国の感情測定してみた
https://note.com/futureforecast/n/n4639a31ce4b5

2020 アメリカ大統領選  node-red で調査・予測してみた
https://qiita.com/miraimeisatu/items/71a870838ca57ec6b2d9
2020 アメリカ大統領選でも同じことをしています。

元ソースコードは同じで、日本語でも使用可能にしました。

#顧客 #感情測定 #感情 #感情可視化 #データ #予測 #選挙


この記事が参加している募集

よろしければサポートよろしくお願いします。いただいたサポートは、日中韓とアメリカのリアルタイム感情分析を進めるために使わせていただきます