見出し画像

AI開発のフローについて【動画#14】

1. AI開発のフロー

スクリーンショット 2021-04-13 20.16.58

①タスクの定義:回帰/分類/機械翻訳

②データ収集

③データを蓄積:DB/CSV

④データ前処理:蓄積データを学習できるデータにする

⑤処理したデータを用いてモデル作成

⑥モデル運用


【具体的説明】

①タスクの定義:回帰/分類/機械翻訳

<教師ありの場合>
データの正解を定義(ロジックを明確にすることに注意)
・論文から、正解を定義

※正解が明確出ない場合、のちにモデル改善をする際に混乱が生じる可能性がある。例えば、レントゲン写真から病名をラベル付けるとなると、各医者で診断が異なるなどの様々な知見が生じる。故に、定義が不明瞭な場合モデル改善が困難になる。

基本的にAIを作る上で意識するべきこととして

人間ができないことはAIもできない

<教師なしの場合>
・理想的なデータ集合構造の特徴の捉え方を定義する
 ➡︎正解が分からないために、受け入れ体制の方を定義する

【例】
・ハリウッド女優顔を生成する(GANにて)
 ➡︎結果的にどのくらいのレベルを要求するかを定義


②データ収集

・データセットから取得
・クローラを作成して取得
・取得用のサイト作成
・データ取得用のデモ版作成


③データを蓄積:収集したデータを蓄積する

<保存場所>
①CSV:離散値、連続値の情報DBの知識がない場合
②DB:DBの知識がある場合
③Strage Server:画像保存等 ex) GCP/AWS(S3)
④Google Drive:画像保存等


④データ前処理:蓄積データを学習できるデータにする

➡︎基本的にデータサイエンスの仕事なため、作業として分ける

実際にモデルを作成した後、精度が悪い場合に再度、データ前処理に戻り、さらにデータを処理していく


⑤処理したデータを用いてモデル作成

<作業例>
・構造選定
・最適化
・パラメーターの決定

<意識するべき3つのポイント>
・精度
・運用時の処理速度
・運用時のサーバコスト
※上記3点を意識してモデル作成を行う。

【例】

精度が高くても処理精度が遅くてコスト高である場合
➡︎3つのポイントの妥協点を探す


⑥モデル運用:主に精度改善

モデルの運用は、永遠のタスクになる。
 ➡︎スケジュールが重要

いつ学習させて、いつモデルを改善させるのかを
計画する必要がある。



<今回の総まとめ>
AIの開発フローのイメージと各ポイントの特徴をしっかり頭に入れて、開発に取り組めるようにする。


次回、AIのモデル戦略について、簡単に整理する。



この記事が気に入ったらサポートをしてみませんか?