宇崎ちゃん献血コラボの影響解析に関するご指摘への回答など
元noteは下記です。いろんな派生noteを作っていて既に自分でも追えていない。
ここでは、2020/08/09までに未回答の質問に対して回答します。
この②と③について未回答です。①や1つめの質問については、その1、その2、その3にあります。基本的にパラレル仮定について色々、書きました。
有意に増加したと言えるのか?
まず、nowhereman134さんから頂いた質問の最後の部分からです。
これらの事実を考慮しても、有意に増加したといえるのかどうかということです。(上記ツイートからの引用)
もっとも重要と思われる質問からです。
私は少なくとも下記の計算をして以降「有意に増加した」という言い方をしていません。ですので、ご質問への回答としては「列挙された事実を考慮しなかったとしても、統計学的には有意に増加したと言えない」になります。
α=0.05水準では、帰無仮説を棄却出来ないということになりました。
(2019/11/21付けの自分のnoteから引用)
なお、「帰無仮説を棄却できない」とは、「介入に効果がない(帰無仮説)」をデータを用いて、「帰無仮説は誤りだ」とまでは言えなかったということです。
一方で、帰無仮説を棄却出来ない場合でも「帰無仮説が正しい」ではなく、「判断保留」となります。
ですので、解析を行った者としての意見は「点推定値は正値であるものの、統計学的な有意性については判断保留」というところです。
ここまで「有意」の前に「統計学的な」を入れているのは、統計学的以外の有意性を念頭に置いているからです。
詳細は「③対象となっている数字の大きさに比べて増加数(+250)が小さい」の回答にて説明しようと思いますが、「実務上の有意性」については、私からはなんとも言えないため、このような書き方をしています。
複合ユニットを作ったらマズイのでは?
つぎに、こちらです(このセクションが長い)。
②「複数のグループを1つのユニットとして使用」している(?)
(上記ツイートからの引用)
この質問の元となったのは、Dr.KID先生の下記ブログだと思います。
このブログ中から引用します。
また、SCMの場合、対象とする市町村や州などのユニットは、今回のカリフォルニア州のように1つである必要があります。近年、複数のグループを1つのユニットとして使用できるか否かも評価されつつありますが、評価が定まりきっていません。
複数のグループを1つのユニットとして使用することの問題点はいくつかあります。
そのうちの1つは、複数のグループを1つのユニットとした時に、ユニット内部の均一性が失われることが上がると思います。
しかし、「ユニットを複合しない」ことも2つの意味で疑義があります。
1つめは、「単一グループのユニットって何だ?」という事です。引用いただいた例では「カリフォルニア州」を1つのユニットとしていますが、「カリフォルニア州って1つのグループで構成されたユニットか?」という疑問があります。
カリフォルニア州の中にも色々な町があり、それら複数をまとめたのがカリフォルニア州です。そして、町ごとに特性が異なっています。そう考えると「カリフォルニア州」は1つのユニットではありません。
であれば、州都サクラメントなどの町を単位として1つのユニットとすればよいでしょうか。しかし、サクラメントにも色々な街区があります。その街区を1つのユニットとしても、更に細かいユニットがあります。そうしたことを厳密に詰めていくと、個人を対象とする以外ダメそうです。
しかし、SCMを行うモチベーションの1つは、個人データが無いという事です。個人データがあるなら、SCMとかいうややこしい方法を採るまでもありません。SCMを行う以上、複合度合いの差はあれ、複合したユニットを使わざるを得ないと考えています。
もちろん、複合した際に均一性をできるだけ失わないようなユニットが良い事は言うまでもありませんが。
今回の例でいうと、茨城県と神奈川県の献血者は均一性が保たれるか?というと、均一では無さそうです。
ただ、これは関東を1ユニットとしなくても生じる問題です。例えば、東京都を単体として使った場合を考えます。この場合でも23区・多摩地区・島嶼部は均一な性質をもっているか?と言われたら、均一ではないでしょう。
そして、さらに面倒なのが、合成対照の都道府県(今回は新潟県・愛知県・大阪府・福岡県)もまた、内部で均一とは言い難いという点です。新潟県を例に取ると、上越・中越・下越・佐渡でそれぞれ均一と言えるかどうか微妙です。
あわよくば期待しているのは、関東7都県の不均一性と合成対照4府県の不均一性が良い感じに相殺されないかなぁ…ということです。
確実に相殺させるためには、各都道府県についてのできるだけ細かな情報をとってSynthetic Control Methodで重みをつけるしかありませんが、そこまではやっていません。
やるべきかもしれませんが、データが入手できません。また、やれたとしてもnoteじゃなくて、論文でやると思います(フラグ?)。
論文化を視野に頑張っていきたいと思います。
(自分のnoteから引用)
2つめの疑義は、ユニットを統合することにより、偶然誤差の影響を抑えるという利点があるという事です。
小さい数だと偶然誤差に影響を受け易いですが、統合ユニットによって数を増やせば、それを避けることが出来ます。
今回は、東京があるので、この影響は気にしなくても良かったかも知れません。
ですので、「複数のグループを1つのユニットとして使用している」という指摘への回答としては、「関東の献血者の特性が均一であるかどうか、合成対照の不均一性と相殺できるかによって問題の程度が異なるが、どのような方法を採ったとしても複数グループの問題からは逃げられないのでしょうが無い」という消極的な答えになるかと思います。
効果が小さすぎるのでは?
最後の質問はこちらですね。
③対象となっている数字の大きさに比べて増加数(+250)が小さい
(上記ツイートからの引用)
この増分差250人/都県を%で表記してみたいと思います。
関東全体で1ヶ月に約80000人の方が献血ルームで献血されています。先の解析では、約250/都県の増分差と推計していましたので、7をかけて関東7都県全体で1750人の増分差です。これは約2.19%程度ですので、、、
思ったより多いな!(演出)
え? 計算間違いじゃないの? これ?(演出) 実は、キチンとデータを解析して、効果を計算する前は+0.5%前後と思ってたんですよ。
@2020/08/12修正について
修正前:キチンと計算する前は+0.5%前後と思ってたんですよ。
修正後:キチンとデータを解析して、効果を計算する前は+0.5%前後と思ってたんですよ。
修正理由:意図が正しく伝わりにくいため。
他に、(演出)を追加しています。寒い演出ですいません。
ただ、この約2.19%の増分差が実務上意味があるのかどうか(実務上の有意性)は、日赤の中の人じゃないとわからない所でしょう。
そもそも、%を算出する時の分母を1ヶ月の実際に献血する人数の概数にしましたが、日赤的に必要なのは計画人数に対する%かも知れません。計画人数ってどこかで見れるんですかね…? 誰か知っていたら教えて下さい(教えて君1回目)
ところで、「統計学的有意性」と「実務上の有意性」は分けて考えなくてはなりません。
仮に「+1で統計学的に有意である」という結果が得られても、実務上は何ら意味をなしません。そのような施策は二度と行われないでしょう(実務上の有意性がない)。
逆に「+10000だが統計学的には有意でない」という結果は、実務上とても意味がある結果かもしれません。そのような施策は「もう一度やってみよう」という判断をするに十分な証拠です(実務上の有意性がある)。
このようなことを踏まえると、「③対象となっている数字の大きさに比べて増加数(+250)が小さい」については、「実務上の有意性についてとか、その辺のことは中の人に聞かないと分かりません」という回答になります。
【追加】他の人が解析した結果はどうだったのだろうか?
ここまでやってくると、宇崎ちゃん献血コラボについて、解析した人がどのような結果になったのか気になってきました。
他の視点で行った解析結果が私の物と類似した数値を返していれば、かなり信憑性が増すという物です。逆に、異なる結果があれば「何故、異なる結果になったのだろう?」という考察をしなければなりません(時間があれば)。
ということでググりました。
Google検索で「宇崎ちゃん 献血 コラボ 解析」「宇崎ちゃん 献血 コラボ 分析」「宇崎ちゃん 献血 コラボ 効果」でみると、私のnoteが一番上に出るのですね…。
その割に、私の財布には入ったのは500円のみ!(大切に使おう)
検索結果をめくっていきましたが、他の解析結果を見つけることは出来ませんでした。
こんなに真剣にいつまでもやっている奴は、こいつ(自分)だけってことだ。
【追加】はてブコメントへの回答
他の人の解析は見つけられませんでしたが、それはそれとしてはてブコメントを見つけました。
こういうのあったんですね。早く気づきたかった…!
気になるコメントについて幾つか反応します。
同時期にやってた乃木坂コラボ無視して数字で殴った気になってる奴、君で2人目だよ
1人目が誰なのか書いて欲しかった。上述の通り現時点(2020/07/29)では、探してもいないのです。なお、乃木坂コラボについては、別の方から頂いた下記コメントにて。
10月1日から行われた乃木坂46の企画 https://www.min-ketsu.jp/park/halloween/ は全国で3万人にランチョンマットを配布。常設の献血ルーム/センターは140個所で単純な平均だと各施設に214枚になる。この施策も無視できないのでは?
(強調箇所は筆者による)
いま(2020/07/20)検索した限り、愛知県の血液センターのページでは乃木坂コラボについて残っていました。おそらく、2019年9頃には全国の血液センターのホームページで見ることができたのでしょうが…
全国で行っていたのであれば、「乃木坂コラボの影響は、都道府県によって変わらない」という仮定が成り立っていれば(というか成り立っているという前提で解析しています)、SCMで「宇崎ちゃん献血コラボ」の影響を推定するときに、「乃木坂コラボの影響」による歪みは生じなさそうです。
仮に、「乃木坂コラボの影響は、都道府県によって変わらない」という仮定が成り立っていなかったとしても、ある程度は相殺されますので、影響は限定的と思います。
ん?そもそも宇崎ちゃんコラボって全国展開なんだっけ?もう少し状況の確認が必要。
(注:お一人のコメントを回答の都合で分割しました)
宇崎ちゃんコラボって関東限定の展開でした。「状況の確認」は日赤の中の人でないと情報が集まらないので、これ以上は情報が増えないのです。
献血って計画分人が集まったら呼び込み止めたりするしねえ。/
(注:お一人のコメントを回答の都合で分割しました)
計画人数が集まったら呼び込みを止めるのは、ありそうな話ではあるのですが、2つ気になるところがありまして。
(1)そういう状況を見たことがない。そんな状況は発生するんだろうか。
(2)計画分人が集まったのに、新たに献血者が来たらどうするんですかね? お帰り頂くのでしょうか…。
誰か知っていたら教えて下さい(教えて君2回目)。
他府県比較でか。献血ルームと献血車の割合違ったりするよ。
(注:お一人のコメントを回答の都合で分割しました)
宇崎ちゃんコラボは献血ルーム限定だったので、献血ルームの数字だけで比較しています。献血車での献血者数は考慮に入れていません。
利益相反(COI)について
宇崎ちゃん献血コラボ関係の利益相反は、2019年11月17日の記事中の通りです。
また、コメント頂いたり、ツイート等を引用させて頂いた方達との利益関係はありません。様々なご意見・ご指摘を頂きありがとうございました。
金銭・経済的なCOIはありません。ただし、金銭を頂くことを拒否している訳ではありません。何か贈りたい方は是非お願いします(ダイマ)。