2002/05/30(木) [n年前の日記]
#1 OCR
チクチクに疲れた。
フリーのOCRはないか。探したる。
フリーのは無いけど体験版があるらしい。試してみた。
読んでココは誤認識バリバリ。
もっとも、スキャナバンドル版に比べ、修正作業は容易。表も読めるし。
結局時間的には、手打ちと変わらなかったかも。修正作業が多すぎたから。
誤認識さえ少なければ、圧倒的に作業早そうだけど。
OCRのアルゴリズムって、どうなってるんだろう。
文字らしきエリアを周囲から絞っていって、その画像を何かと比較するのかな。
比較の元データは、OSのフォントデータを使うとして、何を比較する?
ドットの一致数を見る…なんてのじゃ安易過ぎて失敗するかな。
白黒の比率を見るとか、より細かくエリア分割して漢字の構成を探るとか、前処理が必要かも。
まあ、色々考えて、上手く実装できても、どうせ既に誰かが特許取ってて、訴えられるのだろうな。
文字認識でゲームが作れないだろうか。
既にあるだろうな。たぶん。
最近ゲームの情報、全然チェックしてないからなぁ…
フリーのOCRはないか。探したる。
フリーのは無いけど体験版があるらしい。試してみた。
読んでココは誤認識バリバリ。
もっとも、スキャナバンドル版に比べ、修正作業は容易。表も読めるし。
結局時間的には、手打ちと変わらなかったかも。修正作業が多すぎたから。
誤認識さえ少なければ、圧倒的に作業早そうだけど。
OCRのアルゴリズムって、どうなってるんだろう。
文字らしきエリアを周囲から絞っていって、その画像を何かと比較するのかな。
比較の元データは、OSのフォントデータを使うとして、何を比較する?
ドットの一致数を見る…なんてのじゃ安易過ぎて失敗するかな。
白黒の比率を見るとか、より細かくエリア分割して漢字の構成を探るとか、前処理が必要かも。
まあ、色々考えて、上手く実装できても、どうせ既に誰かが特許取ってて、訴えられるのだろうな。
文字認識でゲームが作れないだろうか。
既にあるだろうな。たぶん。
最近ゲームの情報、全然チェックしてないからなぁ…
[ ツッコむ ]
以上、1 日分です。