AI開発のフローについて【動画#14】
1. AI開発のフロー
①タスクの定義:回帰/分類/機械翻訳
②データ収集
③データを蓄積:DB/CSV
④データ前処理:蓄積データを学習できるデータにする
⑤処理したデータを用いてモデル作成
⑥モデル運用
【具体的説明】
①タスクの定義:回帰/分類/機械翻訳
<教師ありの場合>
・データの正解を定義(ロジックを明確にすることに注意)
・論文から、正解を定義
※正解が明確出ない場合、のちにモデル改善をする際に混乱が生じる可能性がある。例えば、レントゲン写真から病名をラベル付けるとなると、各医者で診断が異なるなどの様々な知見が生じる。故に、定義が不明瞭な場合モデル改善が困難になる。
基本的にAIを作る上で意識するべきこととして
人間ができないことはAIもできない
<教師なしの場合>
・理想的なデータ集合構造の特徴の捉え方を定義する
➡︎正解が分からないために、受け入れ体制の方を定義する
【例】
・ハリウッド女優顔を生成する(GANにて)
➡︎結果的にどのくらいのレベルを要求するかを定義
②データ収集
・データセットから取得
・クローラを作成して取得
・取得用のサイト作成
・データ取得用のデモ版作成
③データを蓄積:収集したデータを蓄積する
<保存場所>
①CSV:離散値、連続値の情報DBの知識がない場合
②DB:DBの知識がある場合
③Strage Server:画像保存等 ex) GCP/AWS(S3)
④Google Drive:画像保存等
④データ前処理:蓄積データを学習できるデータにする
➡︎基本的にデータサイエンスの仕事なため、作業として分ける
実際にモデルを作成した後、精度が悪い場合に再度、データ前処理に戻り、さらにデータを処理していく
⑤処理したデータを用いてモデル作成
<作業例>
・構造選定
・最適化
・パラメーターの決定
<意識するべき3つのポイント>
・精度
・運用時の処理速度
・運用時のサーバコスト
※上記3点を意識してモデル作成を行う。
【例】
精度が高くても処理精度が遅くてコスト高である場合
➡︎3つのポイントの妥協点を探す
⑥モデル運用:主に精度改善
モデルの運用は、永遠のタスクになる。
➡︎スケジュールが重要
いつ学習させて、いつモデルを改善させるのかを
計画する必要がある。
<今回の総まとめ>
AIの開発フローのイメージと各ポイントの特徴をしっかり頭に入れて、開発に取り組めるようにする。
次回、AIのモデル戦略について、簡単に整理する。
この記事が気に入ったらサポートをしてみませんか?