mieki256's diary



2019/05/16(木) [n年前の日記]

#1 [windows] OCRを試してたり

手持ちの書籍に列挙されてるデータをテキストデータにしたいなと思ったので、OCRの類を試してたり。

昔、ソースネクストで販売されてる、本格読取というOCRを購入したことを思い出したので、試しに使ってみたけれど、これが全然認識されず。どうやら元画像がよろしくないようだなと…。デジカメで斜めから撮影した画像だもんな…。

IrfanView も、プラグインを追加することでOCR機能が使えることを思い出したので試してみたけれど。

_mieki256's diary - IrfanViewのOCR機能を試したり

IrfanView 64bit版では OCR が使えなくて。64bit版をアンインストールして32bit版をインストールしてみたものの、OCR機能についてはUnicode がどうとかエラーが出て利用できず。結局、IrfanView の言語設定を英語にしたところ、OCR機能が使えるようになった。まだこちらのほうが、本格読取より、多少は認識してくれる。

今時は、オンラインで利用できるOCRもあると知り。

_Free Online OCR - convert PDF to Word or Image to text

試用してみたところ、そこそこイイ感じで認識してくれた。

たしか、以前の OCR については、認識処理自体は技術的に頭打ちになって、画像を認識しやすくする工夫や、誤認識した際の修正作業を楽にする方向で改良する流れになっている、と聞いた記憶があるけれど。今はAIがどうとか機械学習がどうとかが使えるらしいし…。その方向で改良された OCR は存在しないのだろうか。

以上、1 日分です。

過去ログ表示

Prev - 2019/05 - Next
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31

カテゴリで表示

検索機能は Namazu for hns で提供されています。(詳細指定/ヘルプ


注意: 現在使用の日記自動生成システムは Version 2.19.6 です。
公開されている日記自動生成システムは Version 2.19.5 です。

Powered by hns-2.19.6, HyperNikkiSystem Project