前回のWeekly SSK「ソフトのチカラ」で、文字OCRの認識率について触れました。私は認識率は9割くらいかな?というイメージを持っていたんですが、実際にはもっと認識率は高いのだそうですね。97%という表記も見つけました。
一見、とっても優秀に感じます。しかし、この数字も実際の文章に当てはめてみると突然不安になります。例えば、「ソフトのチカラ」は約2,500文字の文章ですが、97%ということはこのうち約75字が誤認識だということになります。たった75字、されど75字です。さらに言うなら、1行に2、3文字くらいは誤認識があるわけで、ポイントによっては非常に目立つことになります。同じ文字は同じように間違えることが多い…という性質も含めて、「OCRはあまり使えない」というイメージを持ってしまうんでしょうね。
コメントを残す