マガジンのカバー画像

100日でプロになるワシ

21
運営しているクリエイター

2020年8月の記事一覧

100日後にプロになるワシ19日目(python)

100日後にプロになるワシ19日目(python)

前回の続き。
結局時系列データにしないといけなかったので
datetimeを変形して週のデータに変更。

weekNumとして列に追加した。

ただ、1年間は52週あるのでfor文で対応

んで、
データがweekNumだけfloat型なのが気に入らないので型変換

ここでようやくデータ準備OK!!
学習用データと答えデータに分ける

今回は未来予測なので多分線形回帰がモデルとしてあってる。
と信

もっとみる
100日後にプロになるワシ18日目(Python)

100日後にプロになるワシ18日目(Python)

今日のまとめやらかした!

けど一応時系列的にやっていく

まずは昨日の続きから

月で計算するよりも週で計測するといい感じなると思ったので
第何週ではどれだけの数引っ越しされたのかを算出しようとした

こんな感じで第0週と引っ越し回数の頻度対照表を作成

1年で54週あるのでそれをループして作成し。
横に連結させる

こんな感じ。

んでそれにラベルをつけて・・・

なかなかそれっぽい

これで

もっとみる
100日でプロになるワシ17日目(python)

100日でプロになるワシ17日目(python)

昨日に引き続きデータ作成。

昨日は曜日ごとの引っ越し回数を抽出したのでそれをまとめます

weekの列が曜日を表しています↑

月曜から日曜日までの引っ越し回数との関係を抽出↑

連結して↑

ラベルを付与↑

曜日との関係データとしてこれで一旦OK

次は月別!と思ったんですが、3年分くらいデータがあるので
年の初めからの週をカウントしようかと思います

1年は52週!↑

諸事情あって今日は

もっとみる
100日後にプロになるワシ16日目(Python)

100日後にプロになるワシ16日目(Python)

今回は機械学習をさせるための学習データと解答データを作成する

説明変数と目的変数機械学習では学習データを説明変数。解答データを目的変数という。

今回は全データを半分半分にして前半を説明変数。
後半を目的変数として扱う。

前回作成したデータを使う

データを半々で分ける

特徴量について特徴量とは簡単にいうと答えを導くための学習のとっかかりです。

今回で言えば引っ越し回数に影響しそうな数値の

もっとみる
100日後にプロになるワシ15日目(Python)

100日後にプロになるワシ15日目(Python)

今日は前回の続き。
前回は機械学習を始めるために環境構築とデータのダウンロード
データの確認まで行いました。

今日はデータの分析を行なっていきます。

参考(https://signate.jp/competitions/269/data

データにはたまに欠損と言って値が入ってなかったりします。
今回はあらかじめデータの欠損があることがわかっていたので
まずはデータの欠損がどれくらいあるか調

もっとみる
100日後にプロになるワシ14日目(python)

100日後にプロになるワシ14日目(python)

昨日はECサイトの顧客の購入データから顧客が好みそうな商品を予想するモデルを作成した。

今日からは新しく引っ越し需要予測というのをやる

今までは、穴埋め問題という「学習」スタイルで進めていたけど、今日からはガチコンペの課題です。(解答ないやーつ)

やったことアップル引っ越しセンター、機械学習コンペティション
環境構築とデータ確認まで。

概要引っ越しの需要は3月が年間平均の2.5倍、4月が2

もっとみる
100日後にプロになるワシ13日目(python)

100日後にプロになるワシ13日目(python)

やったことSIGNATEを使った機械学習

テーマ:ECサイトにおける購買率の最適化

今日は昨日やった機械学習モデルの改善

学習データの量を調整するたくさん勉強したらいい点が取れるのと同じで
機械もデータが多いほど精度が上がるらしい

とのことで学習データを増やします。

とは言え、今は1ヶ月分のデータしかありません。
どうするのかというと

1ヶ月のデータの分配の割合を変えます

前回2週間

もっとみる
100日後にプロになるワシ12日目(python)

100日後にプロになるワシ12日目(python)

やったことpythonで機械学習。
ECサイトにおける購買率の最適化をAIで行う

参考

https://quest.signate.jp/quests/10028

前回は機械学習前の前段階。
今回は前回より作成した学習用データと予想データを使って
モデリングを作成する。

機械学習モデルへ入力するためのデータの作成する
# クエリリスト作成query_list = train_all['us

もっとみる
100日後にプロになるワシ11日目(python)

100日後にプロになるワシ11日目(python)

やったことSIGNATE
ECサイトにおける購買率の最適化
モデリングするための特徴量作成

データを学習用と検証用に分割機械学習で学ばせる学習用データと、
学習した後そのモデルにテストさせる検証用データで分ける。

1ヶ月のデータのうち前半のデータ(2週間分)を学習用データ
後半のデータを検証用データとして使う。

またさらに、
学習用データを「説明変数期間」「目的変数期間」と1週間づつ分けます

もっとみる

100日後にプロになるワシ9日目(python)

やったことSIGNATE(機械学習)

テーマ:ECサイトにおける高倍率の最適化
章:データの読み込みと確認

1. ユーザーの行動履歴データの読み込み
    1. ライブラリのインポート
    2. ファイルの読み込み
2. ユーザーの行動履歴データにおける内容の確認
    1. 読み込んだデータのカラムを確認する
    2. 各カラムのデータ型を確認する
    3. データの最初の5

もっとみる
100日後にプロになるワシ8日目(python)

100日後にプロになるワシ8日目(python)

メイン画像はYoutubeの一コマ

やったこと
次やることを決める(情報収集?)

youtubeでpythonで検索してたら
「【注目】プログラミング言語!Pythonでできること8選!」というのがあったので見てみた

pythonでできるのは以下の8つとのこと。
1. AI
2. Webサイト制作
3. ゲーム作成
4. スマホアプリ作成
5. デスクトップアプリの作成
6. ブロックチェー

もっとみる