2002/06/04(火) [n年前の日記]
#1 コチコチと入力
コチコチと入力してます。
表を画像のままにしとけば作成作業も早いけど、容量食うんですよね。
容量食うと、1ページ内にベタベタ貼れなくなる。重くなるんで。
だからそこだけ別ページに分ける。
別ページに分けると、情報としては分断される。
それでは、まとまった情報提示をしたいとき、具合が悪い。
…ということでテキストデータにして軽くしてます。
軽ければそこそこまとめて情報提示できるので。
OCRソフトの誤認識が少なければ購入も検討するんですが。
現状では、お金出して買うほどではないかも、って印象。
元の画像のクオリティ次第で、認識率が大きく変わるのは体感できたです。
たぶんデジタルデータのまま渡せば、100%に近い認識率でしょう。
でも、網掛け使ったり、書体変えた「印刷物」を取りこむと、途端に成績悪化。
誤認識の少ない画像を作るには、各ソフトのオマケっぽい編集機能では無理。
それでいて、修正時の作業がかなり苦痛。仕様がこなれてない。
実用になるのかどうかを考えると、まだ問題が多そう>OCRソフト
表を画像のままにしとけば作成作業も早いけど、容量食うんですよね。
容量食うと、1ページ内にベタベタ貼れなくなる。重くなるんで。
だからそこだけ別ページに分ける。
別ページに分けると、情報としては分断される。
それでは、まとまった情報提示をしたいとき、具合が悪い。
…ということでテキストデータにして軽くしてます。
軽ければそこそこまとめて情報提示できるので。
OCRソフトの誤認識が少なければ購入も検討するんですが。
現状では、お金出して買うほどではないかも、って印象。
元の画像のクオリティ次第で、認識率が大きく変わるのは体感できたです。
たぶんデジタルデータのまま渡せば、100%に近い認識率でしょう。
でも、網掛け使ったり、書体変えた「印刷物」を取りこむと、途端に成績悪化。
誤認識の少ない画像を作るには、各ソフトのオマケっぽい編集機能では無理。
それでいて、修正時の作業がかなり苦痛。仕様がこなれてない。
実用になるのかどうかを考えると、まだ問題が多そう>OCRソフト
[ ツッコむ ]
以上、1 日分です。