書類をPDFでスキャンすれば「Adobe Acrobat」でテキスト化(OCR)できる
1年以上前の記事です。内容が古い可能性があります。
どういうことかというと、まずは説明したいと思います。
最近のプリンターには複合機と言ってプリンターだけの機能ではなく、スキャナやコピー、中にはファクスにまでなってしまうインクジェットプリンターもあります。
そういったプリンターの中にはスキャンしたデータをPDFもしくはJPEGにしてSDカードに保存してくれるといったものもあります。
わざわざパソコンを繋いだりしなくてもSDカードにスキャンしたデータを保存できるんです。
で、そういったプリンターを使って書類をPDFでスキャンします。
スキャンしたPDFのデータは「Adobe Acrobat」で開くことができます。
で、このAcrobatで画像データの文字をテキストデータに変換することができるというわけ。
そう、つまり、OCRの機能をいつのまにかAcrobatは持っていたんですね。
さっそく使ってみての感想です。
- ファイルでまとめて変換できるのでページで変換するよりもひとまとめにしてしまってから変換した方が楽。
- 数字での誤変換が多かった。特に縦書き内の二桁数字。
- ヌキ文字は検知できない模様。
青字に白抜き文字の例。テキストが選択できていません。
ちなみにテキストに変換する手順は以下の通りです。
- まずは、スキャンしたPDFをひとまとめにしてしまいましょう。全PDFファイルを開いて左サムネール部分をドラッグ&ドロップでひとつのファイルにまとめます。
- 次に「表示」→「ツール」→「テキスト認識」とメニューを辿ります。
- 右にメニューが表示されるので「このファイル内」をクリックし、開いたダイヤログから「すべてのページ」をチェックし「OK」をクリックします。
- 暫く待つと変換が終了します。
- 変換が終了するとドラッグ&ドロップでテキストが選択できるようになります。
- あとは、コピー&ペーストして使えばOKです。
実は、この機能知らなくて娘にアルバイトでテキスト入力やってもらっちゃいました。
一文字(2バイト)1円で計算したらなんと1万超に。
でも、OCRよりはずっと正確で助かりましたよ。
アドセンス広告メイン
関連記事
-
-
Webサイトでプリント時にヘッダやメニューを消す方法
1年以上前の記事です。内容が古い可能性があります。どうも日本人は印刷にこだわる。 …
-
-
イーセットスマートセキュリティv4に変えてみた
1年以上前の記事です。内容が古い可能性があります。もともと、イーセットスマートセ …
-
-
ビープ音を消す方法
1年以上前の記事です。内容が古い可能性があります。話、横道にそれます。
-
-
OSシェア、やっと「Windows 7」が「Windows XP」を超える
1年以上前の記事です。内容が古い可能性があります。そろそろパソコン買い換えたいな …
-
-
受信はできてもメールが送信できない時にチェックすべき2つの項目
1年以上前の記事です。内容が古い可能性があります。最近のメールアドレスはセキュリ …
-
-
元カノのセクシー画像は誰のもの?
1年以上前の記事です。内容が古い可能性があります。ラブラブのときはついつい心を許 …
-
-
内部SEO(SEOコーディング)まとめ
1年以上前の記事です。内容が古い可能性があります。ここのところちょっと手を離れが …
-
-
各検索サイトの特徴
1年以上前の記事です。内容が古い可能性があります。3大検索サイトのSEOに関する …
-
-
電源ボタンが壊れたiPhoneを電源ボタンを使わず再起動させる方法
1年以上前の記事です。内容が古い可能性があります。娘の「iPhone5」の電源ボ …
-
-
CMSで使うHTML内のリンクは「絶対パス」でも「相対パス」でもなく「サイトルート相対パス」がベスト【WordPress】
1年以上前の記事です。内容が古い可能性があります。WordPressはじめ、CM …