見出し画像

【IT小説】データは嘘をつかない。でも人は?〜統計操作の裏に隠された闇〜

登場人物

相馬 隼人(そうま はやと)

職歴:情報系の大学を卒業後、大手IT企業「S-Tech」に入社。新卒1年目のエンジニア。

性格

  • 正義感が強く、努力家だが、時に猪突猛進になりがち。

  • 物事を理論的に考えるが、感情が先走ることもある。

  • 業務では几帳面で細かいが、私生活はズボラ。

  • IT業界の理不尽な現実と戦う純粋な青年。

真鍋 玲奈(まなべ れいな)

職歴:「S-Tech」のシニアエンジニア。データ分析を専門とし、AI・統計解析のプロ。

性格

  • クールで論理的。口調は淡々としているが、仲間想い。

  • ブラックコーヒーが好きで、オフィスの自販機の常連。

  • 不正や曖昧なデータが大嫌い。

田所 隆二(たどころ りゅうじ)

職歴:「S-Tech」プロジェクトマネージャー。行政システム案件を統括。

性格

  • 会社の利益を第一に考え、実利的な判断を下す。

  • 口が上手く、上層部との交渉が得意。

  • 数字の魔術師。データを「良い感じに」見せるスキルが異常に高い。

佐伯 誠(さえき まこと)

職歴:政府機関のIT監査官。

性格

  • 理詰めで人を追い詰めるのが得意。

  • 仕事に誇りを持ち、社会の不正を暴くことに情熱を燃やす。

  • お菓子が大好きで、デスクには常にお菓子のストックがある。

第1章:データの闇

新人エンジニア、最初の仕事

「相馬くん、このデータの統計処理、今日中に終わらせてくれる?」

プロジェクトマネージャーの田所が、軽い口調で言った。S-Techに入社してまだ数ヶ月、相馬隼人にとって初めての大きな仕事だった。

「はい! どのデータを処理すればいいですか?」

「これだよ、行政システムの利用者データだ。Excelにまとまってるから、わかりやすいだろ?」

田所が送ってきたファイルを開くと、何千行もの利用者データが詰まっていた。行政機関が運営するシステムの利用率を算出し、年度ごとの統計を作るのが今回の業務だった。

PythonのPandasを使って、ある程度の前処理をやれば楽になるな…」

隼人はブツブツと呟きながら、Jupyter Notebookを開いた。データの確認を進めるうちに、ある異変に気付く。

「…あれ? 利用者数が極端に増えてる?」

過去数年のデータと比べて、直近1年間の利用者数が不自然に増加していた。しかも、特定の月に急激な伸びが見られる。

「これ、本当に正しいデータなのか…?」

少し気になりながらも、隼人は田所の指示通りデータを整え、ビジュアライゼーションを行った。

違和感と誘惑

翌日、隼人は完成したレポートを田所に提出した。

「うん、いい感じだね。…ただ、この利用者数のグラフ、もう少し『滑らかに』ならないかな?」

田所が指摘したのは、急激に増えた部分のことだった。

「え? でも、これが実際のデータなので…」

「いやいや、そういう意味じゃなくてさ。この急激な変動があると、説明が難しいだろ? だから、もう少し移動平均とかを使って、変動を抑えてみてほしいんだよ。」

移動平均とは、データの変動を平滑化するための手法だ。確かに、グラフの見た目は良くなるが、それは「正しいデータの表現」なのだろうか?

隼人は眉をひそめ、再びJupyter Notebookを開いた。

「確かにグラフを整えれば、データの変動は抑えられるけど…」

彼は試しに異なる手法をいくつか試した。シグモイド関数を使ったスムージング、ロバスト回帰による外れ値補正など。どれも統計学的には正しいが、どれも「見せ方」に過ぎなかった。

「これって、やっていることは…見栄えの調整だよな?」

田所の言葉が頭をよぎる。

「改ざんじゃないよ。データの見せ方を調整しているだけだ。」

彼の胸がざわついた。この違和感は、無視してはいけないものだった。

「よし…もう一度、全部見直してみよう。」

隼人は深呼吸し、データの裏にある本当の意味を探り始めた。


第2章:統計操作の甘い罠

ここから先は

5,215字
この記事のみ ¥ 290
PayPay
PayPayで支払うと抽選でお得

この記事が参加している募集

この記事が気に入ったらチップで応援してみませんか?