2010-12-01 晴れ 昨日に引き続き、英語漬け。 複合機でPDF化したらしい、画像PDFのテキストを、編集できるようにするお仕事。 画像PDFの中のテキストをOCRでデータ化して、未認識や誤認識部分を補正していくのだけれど、アルファベットなのに認識できなかったり、誤認識していたり、結構手直し部分が多く、当初の予定より、手間も時間もかかる。 そして人間は疲れる・・・。