【AutoML】AIエンジニアでなくても簡単に機械学習をする方法4選
この記事は2019年8月に更新しました。
3ヶ月以上経っている場合は書かれている情報と異なっている可能性がありますのでご注意ください
AutoMLとは
機械学習はデータの前処理やチューニングが難しいと言われています。
しかも統計や線形代数に明るみがないと、より高性能なAIを作るのは難しいです。
また、データの前処理やチューニングには基本的に正解がわからないもので、機械学習が工数通りに終えることも、素早く完成させることも難しいです。
それらの難しい処理さえも機械学習で自動化しようという試みがAutoMLです。
なぜAutoMLなのか
AutoMLが優れている点は
・ 機械学習に詳しくなくても扱うことができる
・ 専門家を雇うよりも安い
・ 時間のかかる前処理やチューニングを省略できる
・プログラミングが必要ない
といったところです。特に
・ 持っているデータでうまく行くかすぐ確認できる
・ AI開発が安価になる
という点が魅力的でしょうか
もしこれらの特徴や魅力に共感をいただいたら、以下のAutoMLサービスをご覧になられてはいかがでしょうか?
Google Cloud AutoML
・ AutoMLサービスが幅広い
・ 正解データがなくても紐付けをお願いできる(ヒューマンラベリング)
・ AutoMLで失敗しないためのガイドラインが整っている
AutoMLといえばGoogleと言われるぐらいに、AutoMLでもっとも地名度をあげています。現在はベータ版ばかりですが、以下のように幅広くモデルを提供しています。
・ 画像の識別 - 画像に移っているものが何かを識別
・ 動画の解析 - 動画中に移っているものを何か識別
・ テキストの識別 - 文章の感情分析など
・ 翻訳 - google翻訳のような性能の高い翻訳技術
・ 表形式のデータ(数値データ)
基本的にデータセットをzipファイルなどにまとめてアップロードするだけです。データを用意するだけで機械学習モデルができます。
正解データがない場合はブラウザ上で正解データを与えられます。正解データは必須ですが、正解データって何?って思いましたらこちらを一読願います
公式サイトからの引用ですが、以下のように画像が現れて正解データが与えられるようになります
また、正解データは多くないと学習に失敗しますが、自分で大量の正解データをつけるのはとても大変です。
そこで、正解データをつける作業をGoogle側にお願いすることができます。もちろん有料ですが、正解データをつける作業はとても時間がかかるのでおすすめです。
全て紹介すると長くなりますのでAutoML Vision(画像分類)の参考文献を貼っておきます。具体的な使い方はこちらが詳しくておすすめです
画像分類に関しては、用意したデータに対して正解データを与える必要があります(詳しくはこちら)が、正解データの与え方からある程度は自動で正解データを与えてくれます
公式がCloud AutoMLの正しい使い方を紹介
AutoMLを使う場合でも失敗する場合はあります。
そこで、Googleが公式で失敗しない使い方にも言及しております。使うときは是非読みましょう。
DataRobot
・ 自動でデータの統計を算出
・ 予測データに対して最適なモデルを自動で提案・作成
・ モデルごとのデータの解釈を可視化
・ 公式の解説が充実
自動でモデルを提案して、場合によっては全て並列で学習できます。
どのようなアルゴリズムを使っているかがわかるのは安心できますね。
また、AIはブラックボックス化しているという心配もよく聞きます。
しかし、DataRobotはデータがどれだけ性能に貢献しているかが可視化できます。安心して使える要素の一つでもある他、そこから性能を改善する戦略も立てられます。
DataRobotは完全に企業向けで、実際に使って調査はできませんでした。
しかし下記のように使ってみたという記事を書かれている会社様もあります。使用中の画面もありますので是非ご参考にください。
参考サイトのように表データ(csv、エクセル形式、SQLなど)のデータ分析ができるようですが、テキスト分析にも対応しているようです
DataRobotが初心者向けのwikiを無料公開
DataRobotが公式で、AI人工知能用語集という初心者向けのwikiを公開しています。
無料で機械学習の知識を学べるので、DataRobotを使いながらならおすすめです。DataRobotを使わない人にもとても有用なwikiになっています。
MatrixFlow
・ 無料試用版あり(期限なし)
・ サンプルデータがあってすぐに体験できる
・ 自動でデータの統計を算出
・ プログラミングいらずでモデルの設定可能
・ 機械学習がわからなくてもAutoMLが使える
個人でもすぐ使える無料版ありますのでおすすめです。
アカウント登録するだけですぐに使えますし、サンプルデータで準備なしで使うこともできます。
下のように統計量を自動で出力するほか、平均や中央値などの統計指標も自動計算します
また、画像やテキスト、ディープラーニングにも対応しています。
画像の場合でも学習したAIが正解する・間違えるパターンが一目でわかりやすくなっています
まだまだ始めたてのサービスなので、これからの期待大ですね
MatrixFlow社の機械学習セミナー
また、機械学習がわからない人向けにも「ビジネス活用のためのMatrixFlow講座」を行なっているようです
定期的に行なっている様子もあるので、MatrixFlowはチェックするべきだと思っております
19年4月
https://prtimes.jp/main/html/rd/p/000000005.000041251.html
19年8月
https://prtimes.jp/main/html/rd/p/000000007.000041251.html
Nanonets
・ 無料試用版あり(予測回数の制限あり)
・ データをアップロードするだけでサクッとディープラーニングできる
・ データが足りなくてもweb上のデータから引っ張ってこれる
・ モデルを自動で選んでくれる(AutoML)
こちらはディープラーニング特化ですが、ディープラーニングができなくても自動でモデルを選んで学習します。
Googleアカウントだけでアカウント登録を済ませると、下の画面に写ります。 "Create a new Model" から、ディープラーニングでやりたいことを選びましょう。
何をすればいいかわからない場合は、"Ready to use Models" に学習済みのモデルを使えます。
・ 画像から家具を探す
・ 顔認識
・ 性別識別
など事例が揃っているので何ができるか学べます
画面に現れた手順に従うだけで、しかもわかりやすいで入門者には特におすすめです。データもその場で用意できるので、試すだけなら準備なしで使えます
更にデータが足りなくても、webからデータを引っ張ってくるのでサクッと機械学習を体験できます
また、既に作られているモデルもあり、ディープラーニングで何ができるかもわかりやすいです。
データとなる画像をアップロードしたらすぐに学習が始まりますので、機械学習がわからない人にはとてもありがたいサービスとなっています。
Nanonetsは他の方も使い方をまとめています。詳しく知りたい場合は下の参考記事を読むと良いでしょう。
比較表
それでもうまくいかないときは
適切なデータが用意できていなかったり、データの統計を正しく理解していないと失敗しがちです
統計に関しては、統計学をある程度知る必要があります。下記の記事に統計学の学び方がまとまっていますので、ご参考にすると良いでしょう。
データに関しては、足りない・質が悪いとうまくいかないことが多いです。詳しくは私の書いた下記の記事をご参考にください。
有料ですが、300円買い切りですし、不明点があればコメントしてくださればお答えいたします