mieki256's diary



2005/06/13(月) [n年前の日記]

#1 [nitijyou][windows] Win98+OCRでテキストデータに変換中

網点処理された印刷物だったけど、画像にフィルタをかけて弄ったらOCRの認識率が上がった。以下の手順で画像修正。
  1. 1200dpiのグレー画像でスキャン。
  2. Photoshop で「ダスト&スクラッチ」フィルタを適用。
  3. 400dpiに画像解像度を変換。<要するに縮小。
  4. コントラスト調整。
といった処理をしてから、『読んでココ』 *1 に渡したら、かなり認識率が上がった。その代わり、「。」「(」「)」「で」「が」等、今までは問題なかった文字を誤認識してしまう状態に。線が細い文字は途切れ途切れになり、濁点のある文字は濁点部分がノイズと間違われるぐらいに小さくなったせいだろうと。でもまあ、他の漢字がすんなり認識できるようになったので、これはこれで。

テキストデータに変換はできたので後は確認作業 :

音声読み上げソフトを利用して、ミスがないか確認してみないと。そのへんのソフトを調べておかないとなぁ…。

それににしてもWin98は軽いなぁ :

同じハードの上で動いてるのに、どうしてWinXPは重いのだろう。…スタイルをクラシックスタイルにすればいいのかな。でも、それだと質問されたときに答えられなくて困ってしまうか。WinXPユーザでクラシックスタイルにして使ってる人は、周囲にほとんど居ないわけだし。

*1: 『読んでココ』=OCRソフトの一つ。

以上です。

過去ログ表示

Prev - 2005/06 - Next
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30

カテゴリで表示

検索機能は Namazu for hns で提供されています。(詳細指定/ヘルプ


注意: 現在使用の日記自動生成システムは Version 2.19.6 です。
公開されている日記自動生成システムは Version 2.19.5 です。

Powered by hns-2.19.6, HyperNikkiSystem Project