メモ@inudaisho

君見ずや出版 / 興味次第の調べ物置き場

OCRして画像対校できるWindows10向のuwpアプリをつくった

 しばらく無料のOCRを試していてマイクロソフトWindows8あたりから使えるようにしてる Windows.Media.Ocr が結構すごいということがわかったのが前回までのあらすじ。
 タダOCR比較その2 - メモ@inudaisho
 自分が試した昭和10年代の本では Google 様の tesseract よりも読めていたので感動のあまり無料の Visual Studio 2015 Express をいれて、uwpアプリとして使えるようにすることにした。ただ、tesseract などのようにコマンドラインからチョロチョロと使えるような形ではないので、ある程度ユースケースを固めてソフトとして使えるようにしないと後から面倒くさい。ということで、ページ毎にOCRして書き出したテキストファイルを画像をみながら対校できるようにした。画面はこんな感じ。

 とりあえずここまで作ったので満足した。


 こんな感じでピンチイン・アウトで画像を拡大縮小したりすることもできる。たぶんマウスホイールとかでもできるんじゃないの。便利だねこりゃ。フォントサイズも同じやりかたでデカくすることができた

 uwp アプリについて調べると特定の場所以外にアプリの方からファイルをつくったりできないという話だが、ユーザが指定したフォルダならどこでも自由に読み書きできる。ということでフォルダを指定してその中にある画像を全部バリバリとOCRする方式にした。

 こんな感じで画像ファイル名に拡張子txtをつけたファイルを生成していく。既にこのファイルがあって中身が空でないものは処理をとばすので、たとえばtesseractとの併用もわりと楽にできるとおもう。

 例に出したのはページ単位で切り出したものを使ったが、見開きでもできる。ただ注意が必要なのは、見開きの場合、横書きと誤認する成分がちょっとでも多いと左ページ→右ページの順でテキスト化してしまう。位置情報がついてるのでそれでなんとかしてみた。

 これをマイクロソフトの店に出すためには開発者登録料として2000円弱程度の金を払わないといけないらしい。こんな誰でも作れるものにわざわざ金を払って配布するのもバカらしいのでそこまではしない。