
【IT小説】データは嘘をつかない。でも人は?〜統計操作の裏に隠された闇〜
登場人物
相馬 隼人(そうま はやと)
職歴:情報系の大学を卒業後、大手IT企業「S-Tech」に入社。新卒1年目のエンジニア。
性格:
正義感が強く、努力家だが、時に猪突猛進になりがち。
物事を理論的に考えるが、感情が先走ることもある。
業務では几帳面で細かいが、私生活はズボラ。
IT業界の理不尽な現実と戦う純粋な青年。
真鍋 玲奈(まなべ れいな)
職歴:「S-Tech」のシニアエンジニア。データ分析を専門とし、AI・統計解析のプロ。
性格:
クールで論理的。口調は淡々としているが、仲間想い。
ブラックコーヒーが好きで、オフィスの自販機の常連。
不正や曖昧なデータが大嫌い。
田所 隆二(たどころ りゅうじ)
職歴:「S-Tech」プロジェクトマネージャー。行政システム案件を統括。
性格:
会社の利益を第一に考え、実利的な判断を下す。
口が上手く、上層部との交渉が得意。
数字の魔術師。データを「良い感じに」見せるスキルが異常に高い。
佐伯 誠(さえき まこと)
職歴:政府機関のIT監査官。
性格:
理詰めで人を追い詰めるのが得意。
仕事に誇りを持ち、社会の不正を暴くことに情熱を燃やす。
お菓子が大好きで、デスクには常にお菓子のストックがある。
第1章:データの闇
新人エンジニア、最初の仕事
「相馬くん、このデータの統計処理、今日中に終わらせてくれる?」
プロジェクトマネージャーの田所が、軽い口調で言った。S-Techに入社してまだ数ヶ月、相馬隼人にとって初めての大きな仕事だった。
「はい! どのデータを処理すればいいですか?」
「これだよ、行政システムの利用者データだ。Excelにまとまってるから、わかりやすいだろ?」
田所が送ってきたファイルを開くと、何千行もの利用者データが詰まっていた。行政機関が運営するシステムの利用率を算出し、年度ごとの統計を作るのが今回の業務だった。
「PythonのPandasを使って、ある程度の前処理をやれば楽になるな…」
隼人はブツブツと呟きながら、Jupyter Notebookを開いた。データの確認を進めるうちに、ある異変に気付く。
「…あれ? 利用者数が極端に増えてる?」
過去数年のデータと比べて、直近1年間の利用者数が不自然に増加していた。しかも、特定の月に急激な伸びが見られる。
「これ、本当に正しいデータなのか…?」
少し気になりながらも、隼人は田所の指示通りデータを整え、ビジュアライゼーションを行った。
違和感と誘惑
翌日、隼人は完成したレポートを田所に提出した。
「うん、いい感じだね。…ただ、この利用者数のグラフ、もう少し『滑らかに』ならないかな?」
田所が指摘したのは、急激に増えた部分のことだった。
「え? でも、これが実際のデータなので…」
「いやいや、そういう意味じゃなくてさ。この急激な変動があると、説明が難しいだろ? だから、もう少し移動平均とかを使って、変動を抑えてみてほしいんだよ。」
移動平均とは、データの変動を平滑化するための手法だ。確かに、グラフの見た目は良くなるが、それは「正しいデータの表現」なのだろうか?
隼人は眉をひそめ、再びJupyter Notebookを開いた。
「確かにグラフを整えれば、データの変動は抑えられるけど…」
彼は試しに異なる手法をいくつか試した。シグモイド関数を使ったスムージング、ロバスト回帰による外れ値補正など。どれも統計学的には正しいが、どれも「見せ方」に過ぎなかった。
「これって、やっていることは…見栄えの調整だよな?」
田所の言葉が頭をよぎる。
「改ざんじゃないよ。データの見せ方を調整しているだけだ。」
彼の胸がざわついた。この違和感は、無視してはいけないものだった。
「よし…もう一度、全部見直してみよう。」
隼人は深呼吸し、データの裏にある本当の意味を探り始めた。
第2章:統計操作の甘い罠
この記事が参加している募集
この記事が気に入ったらチップで応援してみませんか?