【プログラミング】ピンボケ補正アプリ:振り返り:「超解像処理」モデルを決める
皆さんこんばんは。タカダイです。
本日は、「ピンボケ補正アプリ」の開発を始めました。
「超解像」という機械学習の技術で、低解像度の(いわゆるピンボケした)画像を高解像にするというアプリです。
アプリは、ブラウザ上で動かしたいのと、最小限の機能を実装したいので、「Flask」というWebフレームワークを使うことにしました。
今日が1日目で、3時間をアプリ開発に費やしました。
このアプリでは、以下の3つのスクリプトを使用しています。
超解像処理は、「ESRGAN」という機械学習モデルを使うことにしました。
画像を超解像処理することに特化しているモデルであることと、他のアプリにも応用されているモデルで、ある程度信用できるモデルだと判断したからです。
フロント・バックエンドともに、円滑に実装することができましたが、テスト結果は、超改造処理がうまくいきませんでした。
ですので、明日は、原因の解明とコード修正にあたります。
それでは、本日の振り返りです。
本日の行動は、3時間をアプリ開発に充てました。
結果として、
1)プロジェクト範囲を定める
2)TensorFlowを使うことを決定
3)超解像処理は、「ESRGAN」モデルを使うことを決定
4)このアプリ用に仮想環境を構築
5)Pythonコードを作成し、バックエンドの機能を実装
6)JavaScriptコードを作成し、フロントエンドの機能追加
7)HtmlとCSSのコードを作成し、フロントエンド完成
8)テストの実施
9)出力画像の質改善のためのデバグを実施
を達成することができました。
振り返り後の新たな行動は、
● ESRGANモデルの資料でインプット用画像の要件を確認
● 代替モデルを適用することも検討
● 新たな技術を使ったアプリ開発をつづける
を実行する予定です。
それでは皆さん、本日も良い一日をお過ごしください!