書類をPDFでスキャンすれば「Adobe Acrobat」でテキスト化(OCR)できる
1年以上前の記事です。内容が古い可能性があります。
どういうことかというと、まずは説明したいと思います。
最近のプリンターには複合機と言ってプリンターだけの機能ではなく、スキャナやコピー、中にはファクスにまでなってしまうインクジェットプリンターもあります。
そういったプリンターの中にはスキャンしたデータをPDFもしくはJPEGにしてSDカードに保存してくれるといったものもあります。
わざわざパソコンを繋いだりしなくてもSDカードにスキャンしたデータを保存できるんです。
で、そういったプリンターを使って書類をPDFでスキャンします。
スキャンしたPDFのデータは「Adobe Acrobat」で開くことができます。
で、このAcrobatで画像データの文字をテキストデータに変換することができるというわけ。
そう、つまり、OCRの機能をいつのまにかAcrobatは持っていたんですね。
さっそく使ってみての感想です。
- ファイルでまとめて変換できるのでページで変換するよりもひとまとめにしてしまってから変換した方が楽。
- 数字での誤変換が多かった。特に縦書き内の二桁数字。
- ヌキ文字は検知できない模様。
青字に白抜き文字の例。テキストが選択できていません。
ちなみにテキストに変換する手順は以下の通りです。
- まずは、スキャンしたPDFをひとまとめにしてしまいましょう。全PDFファイルを開いて左サムネール部分をドラッグ&ドロップでひとつのファイルにまとめます。
- 次に「表示」→「ツール」→「テキスト認識」とメニューを辿ります。
- 右にメニューが表示されるので「このファイル内」をクリックし、開いたダイヤログから「すべてのページ」をチェックし「OK」をクリックします。
- 暫く待つと変換が終了します。
- 変換が終了するとドラッグ&ドロップでテキストが選択できるようになります。
- あとは、コピー&ペーストして使えばOKです。
実は、この機能知らなくて娘にアルバイトでテキスト入力やってもらっちゃいました。
一文字(2バイト)1円で計算したらなんと1万超に。
でも、OCRよりはずっと正確で助かりましたよ。
アドセンス広告メイン
関連記事
-
iPhoneでOSのバージョンを確認する方法
1年以上前の記事です。内容が古い可能性があります。カメラでズームのできる無料アプ …
-
募金額を通常より増やす裏技(見せ金作戦)
1年以上前の記事です。内容が古い可能性があります。僕も愛読しているちょっと変わっ …
-
DreamweaverとFC2ホームページで作るサイト定義(サイト公開編)
1年以上前の記事です。内容が古い可能性があります。前編 → 後編 → 公開編 最 …
-
WordPress(ワードプレス)のヘッドライン表示は「query_posts」じゃなくて「get_posts」 #wp
1年以上前の記事です。内容が古い可能性があります。プログラムのプロではないのです …
-
「Windows 7(64bit)」で「GT-7600U」を使う方法
1年以上前の記事です。内容が古い可能性があります。先日記事にした「Windows …
-
熊谷駅、上尾駅等から池袋駅、新宿駅、渋谷駅までの定期券で途中下車できる駅を増やす方法
1年以上前の記事です。内容が古い可能性があります。これ、知っておくと途中下車でき …
-
「いいね!」や「+1」はSEOには影響しないらしい
1年以上前の記事です。内容が古い可能性があります。Googleの担当者が言ってい …
-
Facebook(フェイスブック)は完全オープン?「Yahoo!リアリタイム検索」に日記がヒットする
1年以上前の記事です。内容が古い可能性があります。これ、知りませんでした。という …
-
闇金融(ヤミ金)業者に引っかからないためにすべき唯一のこと
1年以上前の記事です。内容が古い可能性があります。「お金を借りない」以上! で、 …
-
画像の下にどうしても隙間が残る場合はタグにvertical-align:bottomが正解【Webデザイン・CSS】
1年以上前の記事です。内容が古い可能性があります。これは知らなかった。。というか …