書類をPDFでスキャンすれば「Adobe Acrobat」でテキスト化(OCR)できる
1年以上前の記事です。内容が古い可能性があります。
どういうことかというと、まずは説明したいと思います。
最近のプリンターには複合機と言ってプリンターだけの機能ではなく、スキャナやコピー、中にはファクスにまでなってしまうインクジェットプリンターもあります。
そういったプリンターの中にはスキャンしたデータをPDFもしくはJPEGにしてSDカードに保存してくれるといったものもあります。
わざわざパソコンを繋いだりしなくてもSDカードにスキャンしたデータを保存できるんです。
で、そういったプリンターを使って書類をPDFでスキャンします。
スキャンしたPDFのデータは「Adobe Acrobat」で開くことができます。
で、このAcrobatで画像データの文字をテキストデータに変換することができるというわけ。
そう、つまり、OCRの機能をいつのまにかAcrobatは持っていたんですね。
さっそく使ってみての感想です。
- ファイルでまとめて変換できるのでページで変換するよりもひとまとめにしてしまってから変換した方が楽。
- 数字での誤変換が多かった。特に縦書き内の二桁数字。
- ヌキ文字は検知できない模様。
青字に白抜き文字の例。テキストが選択できていません。
ちなみにテキストに変換する手順は以下の通りです。
- まずは、スキャンしたPDFをひとまとめにしてしまいましょう。全PDFファイルを開いて左サムネール部分をドラッグ&ドロップでひとつのファイルにまとめます。
- 次に「表示」→「ツール」→「テキスト認識」とメニューを辿ります。
- 右にメニューが表示されるので「このファイル内」をクリックし、開いたダイヤログから「すべてのページ」をチェックし「OK」をクリックします。
- 暫く待つと変換が終了します。
- 変換が終了するとドラッグ&ドロップでテキストが選択できるようになります。
- あとは、コピー&ペーストして使えばOKです。
実は、この機能知らなくて娘にアルバイトでテキスト入力やってもらっちゃいました。
一文字(2バイト)1円で計算したらなんと1万超に。
でも、OCRよりはずっと正確で助かりましたよ。
アドセンス広告メイン
関連記事
-
リセマラ(リセットマラソン)とは何のこと?
1年以上前の記事です。内容が古い可能性があります。そういえばちょっと前にマーケテ …
-
「カエレバ」が便利そうなので色々なアフィリエイトに手を出してみた(Yahoo!ショッピング編)
1年以上前の記事です。内容が古い可能性があります。「もしも」に引き続き、「カエレ …
-
CADデータの標準フォーマット
1年以上前の記事です。内容が古い可能性があります。印刷物関係でたまにわけのわから …
-
性的画像交換で逮捕!「セクスティング」とは何のこと?
1年以上前の記事です。内容が古い可能性があります。最近、海外の中高生の間で問題に …
-
docomo(ドコモ)のスマホ(スマートフォン)で余計なサービスを削除(解約)する方法
1年以上前の記事です。内容が古い可能性があります。最近は、大型量販店(イオン等) …
-
スマホでスパイウェアに絶対入られない方法
1年以上前の記事です。内容が古い可能性があります。スマホ怖い。 □ ア …
-
HDDは今のところ2TBが最高
1年以上前の記事です。内容が古い可能性があります。気になるハードディスクの現段階 …
-
ファンページ「いいね!ボックス」の作り方【Facebookページの作り方03】
1年以上前の記事です。内容が古い可能性があります。以下の情報は古い情報です。こち …
-
直帰率と離脱率の違い
1年以上前の記事です。内容が古い可能性があります。Google Analytic …
-
「Windows Media Player」で音楽CDをコピーする方法
1年以上前の記事です。内容が古い可能性があります。以前は、CDコピーツールを使わ …