Dictation 採点アプリ開発メモ vol.12

キカガクさんの講義の一環で作る自作アプリに関するメモです。

2020.10.24 (土)

アクションアイテム

・採点結果を画像に被らせない or 背景色を加えてみやすくする
・初期画面が白色なので追記する
・OK / NG の認識率をあげる方法を見つける
 → 画像サイズごとにIoU を変更するが良いと思われる
・画像サイズによってIoU Threshold を変更する必要がある
 画像サイズ大(40 words くらい、542 x 571 pixel)IoU Threshold ??
 画像サイズ小(20 words くらい、270 x 505 pixel)IoU Threshold 0.0
・AI推論が間違っていたときにどうするのか
 → 正解 / 不正解 を変更。未推定部分を追加で自己採点機能

Xcode update

Xcode がupdate されてしまったので、iPhone 側のiOS もupdate。意外と時間がかかる。

採点結果を画像に被らせない

エンジニアなら1-2分で終わるようなところを色々触って変更した

before / after

画像1

ここ(constraints)で設定して

画像2

この場所で現在適用されている条件を確認する(多分)

画像3

画像サイズによってIoU Threshold を変更する必要がある

色々触ってみると、入力画像の縦横比がポイントだと思われる。現在入力画像はCreate ML に合うように416 x 416 の画像に変換している。その変換が方法がこちら。

//入力画像のリサイズ指定
request.imageCropAndScaleOption = VNImageCropAndScaleOption.scaleFill

scaleFill は縦横比を保持せずに入力画像を変換する。

画像4

縦に潰しすぎるとうまく認識しない雰囲気。

プレゼン資料作り

時間もなくなってきたので、最終プレゼンを作り始める。過去にキャプチャしたデータだと統一性がないので画像のキャプチャを実施。

来週の発表に備える


いいなと思ったら応援しよう!