パブリカの天婦羅の美味しい揚げ方について書きます。
TeradataおよびPython、R、Jupyter、Microstrategyなど、分析や可視化周辺の環境構築、セットアップで悪戦苦闘繰り返してた毎日の忘備録です
Teradata Databaseを利用した、大量データを前提として分析をする際のデータ準備と基礎統計取得の方法、サンプルSQLなどをまとめました
テキスト分析においてよく実施される手順=「ネオンで輝く大通り」を歩きます。文章データの形態素解析から単語の整理、BOWやTF-IDFの作成、ナイーブベイズテキスト分類、コサイン類似度、トピックモデルを用いた分類についてまとめました。