Dictation 採点アプリ開発メモ vol.12

2020年11月2日 14:11

キカガクさんの講義の一環で作る自作アプリに関するメモです。

2020.10.24 (土)

アクションアイテム

・採点結果を画像に被らせない or 背景色を加えてみやすくする
・初期画面が白色なので追記する
・OK / NG の認識率をあげる方法を見つける
　→ 画像サイズごとにIoU を変更するが良いと思われる
・画像サイズによってIoU Threshold を変更する必要がある
　画像サイズ大（40 words くらい、542 x 571 pixel）IoU Threshold ??
　画像サイズ小（20 words くらい、270 x 505 pixel）IoU Threshold 0.0
・AI推論が間違っていたときにどうするのか
　→ 正解 / 不正解を変更。未推定部分を追加で自己採点機能

Xcode update

Xcode がupdate されてしまったので、iPhone 側のiOS もupdate。意外と時間がかかる。

採点結果を画像に被らせない

エンジニアなら1-2分で終わるようなところを色々触って変更した

before / after

ここ（constraints）で設定して

この場所で現在適用されている条件を確認する（多分）

画像サイズによってIoU Threshold を変更する必要がある

色々触ってみると、入力画像の縦横比がポイントだと思われる。現在入力画像はCreate ML に合うように416 x 416 の画像に変換している。その変換が方法がこちら。

//入力画像のリサイズ指定
request.imageCropAndScaleOption = VNImageCropAndScaleOption.scaleFill

scaleFill は縦横比を保持せずに入力画像を変換する。

縦に潰しすぎるとうまく認識しない雰囲気。

プレゼン資料作り

時間もなくなってきたので、最終プレゼンを作り始める。過去にキャプチャしたデータだと統一性がないので画像のキャプチャを実施。

来週の発表に備える