SQLを勉強しはじめたら、日経の面建てが気になった話
こんにちは。先日データサイエンス入門イベントに参加してからSQLの自己勉を始めてまして、そうしたら日経の面建てが気になりましたので投稿します。
■日経の面建て
新聞の上のはじには、このページにはこんなことが書いてますよっていう「面呼称」がついてます。
主なものに…経済、政治、国際、企業、マーケット、証券、スポーツ、社会があり、このページはこの面にしようという構成を「面建て」と呼びます。
日経電子版でも似たようなものがあり「セクション」と呼んでいますが、内部的には機能的な意味をそのままに「タブ」と呼んだりします。
■日経新聞をテーブル構造で考えてみる
毎日発刊している日経新聞をひとつのデータテーブルだと考えると、以下のようなデータ群を保持していると考えることができます。
記事は、事実に周辺情報を加えたもので、どの記事にも会社名や国名など事実の主体になる言葉や商品名などのキーワードとなる情報が含まれます。なので、日経新聞というテーブルは、もう少し細かくして、以下のようにも考えることができます。
■新聞を読むという行為=外部結合?
みなさんが新聞を手に取っていただく場合、多くの方は1面からめくると思います。
このときみなさんは何らかの関心をもって興味のある記事を探すと思います。
これをデータ的にとらえると、先ほど挙げた日経新聞というテーブルと、みなさん自身の関心というテーブルが結合していると考えることができます。
★テーブル結合とは(「結合 sql」の検索トップだけあってわかり易い!)
2つの異なるテーブルを結合するにはキー情報が必要になります。
日経新聞(テーブルA)とみなさんの関心(テーブルB)を結合する際のキー情報は記事に含まれるキーワード:会社名、商品名、・・と考えることができます。
さらにこの新聞を読むという行為は外部結合:LEFT OUTER JOINしていると考えることができます。
新聞を読む際みなさんは、ご自身の関心のある記事を探そうとしていただいているわけで、新聞上にみなさんの関心を引っ張ってきているというイメージです。
■面建ては分析上必要なデータになっているのか
データを結合する理由は、2つの異なるテーブルの分析対象を増やすためです。
こう考えると、新聞を読むという行為は、読者のみなさんが日々起きていることの集合データを分析するために、新聞というテーブルにみなさんの関心を結合しているととらえることができると思いました。
となると、記事はもちろんですが、テーブルAに君臨する「面建て」というデータはとても重要に思えてきます。
以前一面の雰囲気が何十年と変わっていないことをお知らせしました。
面建ても主要なものはここ十数年、変化はありません。
面建ては、時代の変化にあわせて変わるべきか、変わらざるべきか・・・
そもそもみなさん使わなくなっているデータなのか・・・
みなさんだったら、どんな「面建て」をしますか?