見出し画像

大学入学共通テスト「情報Ⅰ」試作問題  第4問 解説


問題と正解表

問1

解説
:表1-A、表1-Bの食事時間を比較(青)することで分析できる。

:朝と夜を区別したデータではないため分析できない。

:表1-Bの学業の時間と趣味の時間を比較(赤)すると分析できる。

:表1-A、表1-Bの通学の時間を比較(緑)すると分析できる。

ポイント:仮説が正しい・間違っているかを問われているのではなく、表のデータから仮説が分析できるかできないかを問われている。


問2

解説
:420分のラインより右側を見ると表1-Aは箱ひげ図の右端まで50%強、表1-Bは75%以上になり、「表1-Aの方が表1-Bよりも多い」は誤り。

:550分のラインより右側を見ると表1-Aは箱ひげ図の右端まで25%以下になるため「半数以上」は誤り。表1-Bは550分のラインより右側にデータが存在しないので「表1-Bにおいては一つもない。」の部分は正しい。

:450分のラインから、それぞれ左側を見ると表1-Bは75%以上であるため「全体の75%以上」は正しい。表1-Aは25%くらいであるため「50%未満」は正しい

:中央値は箱ひげ図の真ん中の太線なので、睡眠の時間の分布については差の絶対値は10くらい。学業の時間の分布については差の絶対値は90くらいになるため「絶対値の差が大きいのは睡眠の時間である」は誤り。

ポイント:箱ひげ図についての基本的な知識を問われている



問3

解説
A:スマホ・PCの使用時間が短いグループが(1-A)、長いグループが(1-B)で、学業の時間について(1-A)ー(1-B)=正 ということは、スマホ・PCの使用時間が短いグループ(1-A)の方が学業の時間が長いと言えるので正しい。

B:Aと同様に考えると睡眠の時間は長くなるので誤っている。

 箱ひげ図の幅が大きいほど正の方向、負の方向それぞれに差が大きい、ということなので顕著に表れているということになる。
C正しい。
D誤っている
E誤っている。
  AとCが正しいので0番が正解。


問4

解説
:散らばりの度合いと相関については関係ないので、誤り。

:散らばりの度合いと相関については関係ないので、誤り。

:負の相関なので、正しい。

:正の相関なので、誤り。

ポイント:相関についての基本的な知識を問われている。



問5

解説
:平均値から標準偏差の2倍以上離れた値を外れ値とする基準とあるので、図の中の赤線-2σ以下、2σ以上が外れ値になるので、0番と2番の2個が該当する。

:Q県の例をみると図5では睡眠時間の予測値が406.8分で実測値が予測値より大きいので、残差は正の値になる。図6では標準偏差は約1.5となっている。同様に、P県をみると図5では睡眠時間の予測値が約430分で実測値より小さいので、残差は負の値になる。図6で睡眠の時間(推測値)が約430分で負の値をとる選択肢は1番になる。残差の絶対値はQ県のより少し大きい値なので、1番の選択肢は標準偏差-2.0 〜 -1.5にあるので裏付けになる。

:オと同様に考えると、-2σ以上(赤いラインの内側)になるので「外れ値となっていない」の1番が正解

なぜ残差を分析しているのか?

花子さんたちは散布図を描いて、回帰モデル(回帰直線)を作り、そのモデルが妥当かどうかの検証(回帰診断)をしています。

データ分析作業のリアルな話をすると、回帰分析では最良のモデルを探すため、説明変数(予測値を説明するデータ)を入れ替えたり補ったりしながら分析を進めます。

実測値と予測値(回帰モデル)の差が残差なので、残差の分布が回帰モデル(回帰直線)に沿いながら直線に近い部分で分布するほど良いといえます。

そのために、どのように残差が分布しているのか見やすくするためと、少し深い話ですが…回帰分析の残差は平均0の正規分布にしたがうことが前提になっていることから、残差を平均0、標準偏差1に変換してその分布(図6)を分析しています。


いいなと思ったら応援しよう!