2019/05/16(木) [n年前の日記]
#1 [windows] OCRを試してたり
手持ちの書籍に列挙されてるデータをテキストデータにしたいなと思ったので、OCRの類を試してたり。
昔、ソースネクストで販売されてる、本格読取というOCRを購入したことを思い出したので、試しに使ってみたけれど、これが全然認識されず。どうやら元画像がよろしくないようだなと…。デジカメで斜めから撮影した画像だもんな…。
IrfanView も、プラグインを追加することでOCR機能が使えることを思い出したので試してみたけれど。
_mieki256's diary - IrfanViewのOCR機能を試したり
IrfanView 64bit版では OCR が使えなくて。64bit版をアンインストールして32bit版をインストールしてみたものの、OCR機能についてはUnicode がどうとかエラーが出て利用できず。結局、IrfanView の言語設定を英語にしたところ、OCR機能が使えるようになった。まだこちらのほうが、本格読取より、多少は認識してくれる。
今時は、オンラインで利用できるOCRもあると知り。
_Free Online OCR - convert PDF to Word or Image to text
試用してみたところ、そこそこイイ感じで認識してくれた。
たしか、以前の OCR については、認識処理自体は技術的に頭打ちになって、画像を認識しやすくする工夫や、誤認識した際の修正作業を楽にする方向で改良する流れになっている、と聞いた記憶があるけれど。今はAIがどうとか機械学習がどうとかが使えるらしいし…。その方向で改良された OCR は存在しないのだろうか。
昔、ソースネクストで販売されてる、本格読取というOCRを購入したことを思い出したので、試しに使ってみたけれど、これが全然認識されず。どうやら元画像がよろしくないようだなと…。デジカメで斜めから撮影した画像だもんな…。
IrfanView も、プラグインを追加することでOCR機能が使えることを思い出したので試してみたけれど。
_mieki256's diary - IrfanViewのOCR機能を試したり
IrfanView 64bit版では OCR が使えなくて。64bit版をアンインストールして32bit版をインストールしてみたものの、OCR機能についてはUnicode がどうとかエラーが出て利用できず。結局、IrfanView の言語設定を英語にしたところ、OCR機能が使えるようになった。まだこちらのほうが、本格読取より、多少は認識してくれる。
今時は、オンラインで利用できるOCRもあると知り。
_Free Online OCR - convert PDF to Word or Image to text
試用してみたところ、そこそこイイ感じで認識してくれた。
たしか、以前の OCR については、認識処理自体は技術的に頭打ちになって、画像を認識しやすくする工夫や、誤認識した際の修正作業を楽にする方向で改良する流れになっている、と聞いた記憶があるけれど。今はAIがどうとか機械学習がどうとかが使えるらしいし…。その方向で改良された OCR は存在しないのだろうか。
[ ツッコむ ]
以上、1 日分です。