先日の日記にも書いていますが、
元々ROTRでは Windowsが標準で持っているOCRエンジン「Windows.Media.OCR」というのを使っています。
で、詳細はもちろん不明なのですが、事実としてこのOCRエンジンでは、
今回のトレジャーハントのRO内吹き出しでの「ローマ数字」「猫顔文字」はうまく認識できない状況です。
ちょっと考えた結果、ROTR内で、RO吹き出しに対してチューニングした簡易認識の仕組みを作ることにしました。
OCRエンジンを使っていたのは、もちろん文字画像を「比較演算が容易なテキスト」にしたかったから。
その意味で、そういう変換が可能ならば、「Windowsの」「汎用的」OCRにこだわる必要もないわけです。
実際、手書きでもないし『決まった解像度・決まったフォント』で出力されている文字で。
しかも「ローマ数字」「猫顔文字」だけに限定するならば、判定すべき文字種類もすごく少ないので。
従来のものも「ぬふあうえ」などで有効なので生かしたまま、そちらで認識できなかった場合に追加で別アルゴでの認識処理を行うようにしています。
で、いろいろ試行調整の結果、友瀬環境ではそれなりに高い精度での判定が行えるようになったので、リリースします。
とはいえ、いくつか不確定要素があるため。
うまく行かなかったら情報をいただきたく。
今回のバージョンでは、認識対象の画像を ROTR.exeのあるフォルダに「target.bmp」としてファイル出力するようにしてあります。
顔文字・ローマ数字でうまく認識できなかった場合、その時点での「target.bmp」を友瀬に送っていただけると助かります。
ご意見などがあれば。