日記/2018-05-18

2018-05-18 (金) 06:42:54

雑記：文字認識でゴー：試行錯誤の結果。†

トレジャーハント用アプリ(ROTR) の現状について。
現状のWindowsのOCRだけでは厳しそうなので、回避方法を検討・試行。

友瀬環境である程度の認識が可能になったので、リリースします。
→トレジャーハントアプリ Ver1.03

それに関しての簡単なメモ。

[+]→続きを読む。

先日の日記にも書いていますが、元々ROTRでは Windowsが標準で持っているOCRエンジン「Windows.Media.OCR」というのを使っています。
で、詳細はもちろん不明なのですが、事実としてこのOCRエンジンでは、今回のトレジャーハントのRO内吹き出しでの「ローマ数字」「猫顔文字」はうまく認識できない状況です。

ちょっと考えた結果、ROTR内で、RO吹き出しに対してチューニングした簡易認識の仕組みを作ることにしました。
OCRエンジンを使っていたのは、もちろん文字画像を「比較演算が容易なテキスト」にしたかったから。
その意味で、そういう変換が可能ならば、「Windowsの」「汎用的」OCRにこだわる必要もないわけです。実際、手書きでもないし『決まった解像度・決まったフォント』で出力されている文字で。
しかも「ローマ数字」「猫顔文字」だけに限定するならば、判定すべき文字種類もすごく少ないので。
従来のものも「ぬふあうえ」などで有効なので生かしたまま、そちらで認識できなかった場合に追加で別アルゴでの認識処理を行うようにしています。

で、いろいろ試行調整の結果、友瀬環境ではそれなりに高い精度での判定が行えるようになったので、リリースします。
とはいえ、いくつか不確定要素があるため。
うまく行かなかったら情報をいただきたく。

今回のバージョンでは、認識対象の画像を ROTR.exeのあるフォルダに「target.bmp」としてファイル出力するようにしてあります。
顔文字・ローマ数字でうまく認識できなかった場合、その時点での「target.bmp」を友瀬に送っていただけると助かります。

ご意見などがあれば。

TrackBack(0)

日記/2018-05-18

雑記：文字認識でゴー：試行錯誤の結果。†

検索

編集操作

ある名言。†

折りたたみ†

シェアする†

メニュー†

クイックリンク†

最新の20件

管理†