書類をPDFでスキャンすれば「Adobe Acrobat」でテキスト化(OCR)できる
1年以上前の記事です。内容が古い可能性があります。
どういうことかというと、まずは説明したいと思います。
最近のプリンターには複合機と言ってプリンターだけの機能ではなく、スキャナやコピー、中にはファクスにまでなってしまうインクジェットプリンターもあります。
そういったプリンターの中にはスキャンしたデータをPDFもしくはJPEGにしてSDカードに保存してくれるといったものもあります。
わざわざパソコンを繋いだりしなくてもSDカードにスキャンしたデータを保存できるんです。
で、そういったプリンターを使って書類をPDFでスキャンします。
スキャンしたPDFのデータは「Adobe Acrobat」で開くことができます。
で、このAcrobatで画像データの文字をテキストデータに変換することができるというわけ。
そう、つまり、OCRの機能をいつのまにかAcrobatは持っていたんですね。
さっそく使ってみての感想です。
- ファイルでまとめて変換できるのでページで変換するよりもひとまとめにしてしまってから変換した方が楽。
- 数字での誤変換が多かった。特に縦書き内の二桁数字。
- ヌキ文字は検知できない模様。
青字に白抜き文字の例。テキストが選択できていません。
ちなみにテキストに変換する手順は以下の通りです。
- まずは、スキャンしたPDFをひとまとめにしてしまいましょう。全PDFファイルを開いて左サムネール部分をドラッグ&ドロップでひとつのファイルにまとめます。
- 次に「表示」→「ツール」→「テキスト認識」とメニューを辿ります。
- 右にメニューが表示されるので「このファイル内」をクリックし、開いたダイヤログから「すべてのページ」をチェックし「OK」をクリックします。
- 暫く待つと変換が終了します。
- 変換が終了するとドラッグ&ドロップでテキストが選択できるようになります。
- あとは、コピー&ペーストして使えばOKです。
実は、この機能知らなくて娘にアルバイトでテキスト入力やってもらっちゃいました。
一文字(2バイト)1円で計算したらなんと1万超に。
でも、OCRよりはずっと正確で助かりましたよ。
アドセンス広告メイン
関連記事
-
-
人気が出る写真の法則。人の顔はNG。背景は控えめに等
1年以上前の記事です。内容が古い可能性があります。インターネット上には数多くのデ …
-
-
「Windows Media Player」でCDの曲を吸い出す(取り込む)方法
1年以上前の記事です。内容が古い可能性があります。個別授業の生徒さんの知り合いに …
-
-
意外と気づかないSEO対策
1年以上前の記事です。内容が古い可能性があります。SEO対策の知識はかなり詰め込 …
-
-
東京ディズニーリゾートチケットはネットで購入が楽でいい【チケットプリント編】
1年以上前の記事です。内容が古い可能性があります。1. ユーザー登録編  …
-
-
エイサーASPIRE ONEが起動しなくなった
1年以上前の記事です。内容が古い可能性があります。最近は、帰ってきて一段落してか …
-
-
最近のイラストレーター(Illustrator)aiデータはAdobe Readerでプレビューできる【DTP】
1年以上前の記事です。内容が古い可能性があります。Illustratorのデータ …
-
-
CTPTマーケティングって何?
1年以上前の記事です。内容が古い可能性があります。先日、PDCAサイクルやらAI …
-
-
Flicksquareの設定を復活させる方法(foursquare→Flickr連携)
1年以上前の記事です。内容が古い可能性があります。Flicksquareの設定が …
-
-
Facebookでも通用するツイッターの常識「@」
1年以上前の記事です。内容が古い可能性があります。最近はツイッター以上にFace …
-
-
意外と知られていない共有へのアクセス方法
1年以上前の記事です。内容が古い可能性があります。社内ネットワークを組んでいる会 …