【JKI】024_Modeling_Churn_Predictions_Part_2_01_AutoML
【JKI_024】課題を確認
Just KNIME It! (JKI)
https://www.knime.com/just-knime-it
今回の挑戦はこちら
ちなみに先週の挑戦はこちら。一見すると間違い探しのようです。
ところが急激に内容は高度化しています。
問題文をGoogle翻訳し少し加筆して以下に。
【2つのデータセット】(トレーニングとテスト)
先週のPart1と全く同じです。むしろ変えてはいけないルール。
データセット入手先:
先週と同じく処理します。
【AutoMLコンポーネント利用例】
ってもうコンポーネントをいかに見つけてくるかの一択ですよね。もはやコンポーネントはノードの一種という扱いになっています。
のVerified Component群がその代表格だと思います。そして、その中でも最初に紹介されているAutoMLコンポーネント。
使い方もKNIME Hubにいけばいろいろと見つかります。
私はこちらのKNIME workflow(WF)をダウンロードしてみました。
すごいなぁKNIMEコミュニティ。
しかしWFを開こうとしたら下記の通りちょっと大変なことに。
思い出したのはこの曲
それはさておき、詳細は略しますがYesを押して多数のextensionsを入れました。
このWFを見てAutoMLなど機械学習関連のコンポーネントの組み合わせでここまでできるのかと感心しました。しかしちょっとやっていることが高度過ぎたので、今回の課題にはレベル的に合いません。そこでもう一つもっとシンプルな下記WFを見てみました。
残念ながらこのWFはCASE Switch Startが私の使っているver.4.4.1では使えないのでSelect Example Datasetコンポーネント2つが動かせなかったです。
https://nodepit.com/node/org.knime.base.node.switches.caseswitch.any.CaseStartAnyNodeFactory
【作者の皆さまごめんなさい】
ということで、一部を抜き出して使ってみました。怒られるかもしれないとは思いつつ、4.4系ユーザーの皆さんにもとKNIME Hubに上げています。
IrisデータセットだとGradient Boosted Treesが最適解だったそうです。
…スクールウォーズやWFの作者の皆さんごめんなさい。
おかげさまでAutoMLで判別モデルを作る方法は知ることができたので、次回は提出したWFの解説へ進めます。
KNIME Hubに解答は上げています。
おまけ:
【JKI_023 感想戦】
今回の公式解答はこちら。
WFの構成は同一ですので正解だったですね。そこまではまあそうでしょう。
でも実は予測性能にかなりの差が。
公式解答:
私の解答:
もちろん理由は簡単です。
公式解答:
私の解答:
自分の未熟さが悔しいです。
「素人で悪いか。」って言える力が欲しい…。