書類をPDFでスキャンすれば「Adobe Acrobat」でテキスト化(OCR)できる
1年以上前の記事です。内容が古い可能性があります。
どういうことかというと、まずは説明したいと思います。
最近のプリンターには複合機と言ってプリンターだけの機能ではなく、スキャナやコピー、中にはファクスにまでなってしまうインクジェットプリンターもあります。
そういったプリンターの中にはスキャンしたデータをPDFもしくはJPEGにしてSDカードに保存してくれるといったものもあります。
わざわざパソコンを繋いだりしなくてもSDカードにスキャンしたデータを保存できるんです。
で、そういったプリンターを使って書類をPDFでスキャンします。
スキャンしたPDFのデータは「Adobe Acrobat」で開くことができます。
で、このAcrobatで画像データの文字をテキストデータに変換することができるというわけ。
そう、つまり、OCRの機能をいつのまにかAcrobatは持っていたんですね。
さっそく使ってみての感想です。
- ファイルでまとめて変換できるのでページで変換するよりもひとまとめにしてしまってから変換した方が楽。
- 数字での誤変換が多かった。特に縦書き内の二桁数字。
- ヌキ文字は検知できない模様。
青字に白抜き文字の例。テキストが選択できていません。
ちなみにテキストに変換する手順は以下の通りです。
- まずは、スキャンしたPDFをひとまとめにしてしまいましょう。全PDFファイルを開いて左サムネール部分をドラッグ&ドロップでひとつのファイルにまとめます。
- 次に「表示」→「ツール」→「テキスト認識」とメニューを辿ります。
- 右にメニューが表示されるので「このファイル内」をクリックし、開いたダイヤログから「すべてのページ」をチェックし「OK」をクリックします。
- 暫く待つと変換が終了します。
- 変換が終了するとドラッグ&ドロップでテキストが選択できるようになります。
- あとは、コピー&ペーストして使えばOKです。
実は、この機能知らなくて娘にアルバイトでテキスト入力やってもらっちゃいました。
一文字(2バイト)1円で計算したらなんと1万超に。
でも、OCRよりはずっと正確で助かりましたよ。
アドセンス広告メイン
関連記事
-
-
「Flash CS6」で編集したファイルは「Flash CS4」では編集できない
1年以上前の記事です。内容が古い可能性があります。盲点でした。 訓練校でFlas …
-
-
マーケティングに使えそうなツール
1年以上前の記事です。内容が古い可能性があります。Webマーケティングに使えそう …
-
-
Google Chromeの場所が奥深すぎて分からない
1年以上前の記事です。内容が古い可能性があります。Dreamweaver(ドリー …
-
-
Googleにインデックスさせないリンクの入れ方
1年以上前の記事です。内容が古い可能性があります。Googleなんでさほど問題は …
-
-
アドセンスの振込先をシティバンクのeセービングにする方法
1年以上前の記事です。内容が古い可能性があります。アドセンスの振込先をシティバン …
-
-
ワードプレス(WordPress)で公開ディレクトリを変える方法 #wp
1年以上前の記事です。内容が古い可能性があります。いつの間にやら「プロット・ファ …
-
-
「ナマポ」とは何のこと?【2ちゃんねる用語】
1年以上前の記事です。内容が古い可能性があります。政治家にもその言葉が知れ渡って …
-
-
Adsense(アドセンス) vs. Pitta!(ピッタ!)収益が高いのはどっち?
1年以上前の記事です。内容が古い可能性があります。9月9日に下記赤い部分にある広 …
-
-
DVDを入れると「ファンクションが間違っています」と言われた時の対処法
1年以上前の記事です。内容が古い可能性があります。WindowsXP(ウインドウ …
-
-
iPhoneで自分の携帯番号を確認する方法
1年以上前の記事です。内容が古い可能性があります。勢いで確認するシリーズを3つま …