無償オープンデータ集
データサイエンスですから、データがないと始まらないのですけど、実際にデータがないこともあります。ちょっとデータお預かりして見てみましょうのはずが、データは収集に時間がかかる、でもサンプル出せなんて話もあったなぁ。顧客向けデモや自分の勉強、社内外向け研修の材料として欲しいこともありました。
最近はコレが役に立ってます。
もちろんうまくいっている予測分析のプロジェクトで、さらなる精度向上のために景気指標を使おうという真っ当なこともありました。その際に使うのは日本なら上記リンクにも含まれますが、最初にe-statです。
世界中のデータを集めるとなると昔はquandlってあったんですけど、今は使えなくなってるみたい。ただ、その代わりになるものも上記の100の中にありますが。
テーブルデータ(定型データ)だと、だいたいこの辺りから見ます。
あとはGoogleによる「データセット検索」サイトかRのサンプルデータを使うくらいですね。
ちなみに、とりあえず画像系のサンプルデータと言われたらMNIST
ちなみに、公益性がある場合のみ活用可、商用利用禁止のもの
データセット等のリンク集で、そこそこ使えそうなのを見つけたので追記
このくらいのサイトから2~3クリックで探せば、何かしら使えるものはあるでしょう、という感覚値です。
他の情報を見たい方は、目次ページへ
仕切り直しで収集情報の整理から|くすぐったがり|note