書類をPDFでスキャンすれば「Adobe Acrobat」でテキスト化(OCR)できる
1年以上前の記事です。内容が古い可能性があります。
どういうことかというと、まずは説明したいと思います。
最近のプリンターには複合機と言ってプリンターだけの機能ではなく、スキャナやコピー、中にはファクスにまでなってしまうインクジェットプリンターもあります。
そういったプリンターの中にはスキャンしたデータをPDFもしくはJPEGにしてSDカードに保存してくれるといったものもあります。
わざわざパソコンを繋いだりしなくてもSDカードにスキャンしたデータを保存できるんです。
で、そういったプリンターを使って書類をPDFでスキャンします。
スキャンしたPDFのデータは「Adobe Acrobat」で開くことができます。
で、このAcrobatで画像データの文字をテキストデータに変換することができるというわけ。
そう、つまり、OCRの機能をいつのまにかAcrobatは持っていたんですね。
さっそく使ってみての感想です。
- ファイルでまとめて変換できるのでページで変換するよりもひとまとめにしてしまってから変換した方が楽。
- 数字での誤変換が多かった。特に縦書き内の二桁数字。
- ヌキ文字は検知できない模様。
青字に白抜き文字の例。テキストが選択できていません。
ちなみにテキストに変換する手順は以下の通りです。
- まずは、スキャンしたPDFをひとまとめにしてしまいましょう。全PDFファイルを開いて左サムネール部分をドラッグ&ドロップでひとつのファイルにまとめます。
- 次に「表示」→「ツール」→「テキスト認識」とメニューを辿ります。
- 右にメニューが表示されるので「このファイル内」をクリックし、開いたダイヤログから「すべてのページ」をチェックし「OK」をクリックします。
- 暫く待つと変換が終了します。
- 変換が終了するとドラッグ&ドロップでテキストが選択できるようになります。
- あとは、コピー&ペーストして使えばOKです。
実は、この機能知らなくて娘にアルバイトでテキスト入力やってもらっちゃいました。
一文字(2バイト)1円で計算したらなんと1万超に。
でも、OCRよりはずっと正確で助かりましたよ。
アドセンス広告メイン
関連記事
-
-
Youtubeでライブ配信可能アカウントかどうか調べる方法
1年以上前の記事です。内容が古い可能性があります。YouTubeでライブ配信が可 …
-
-
有料会員じゃないと見れないCOOKPAD(クックパッド)の人気順レシビをGoogleの検索結果で見る方法
1年以上前の記事です。内容が古い可能性があります。COOKPAD(クックパッド) …
-
-
ブラインドタッチを覚えるための10のポイント
1年以上前の記事です。内容が古い可能性があります。先日より、ブラインドタッチを覚 …
-
-
湘南新宿ライン(赤羽⇔池袋間)は埼京線と並行して走っていない。山手線と並行して走ってた
1年以上前の記事です。内容が古い可能性があります。最近ダイヤ改正して上野東京ライ …
-
-
ブログのアクセス(PV)を増やす方法 【小学生編】
1年以上前の記事です。内容が古い可能性があります。さて、娘がアメーバピグをはじめ …
-
-
「iOS5」にしたらツイッター(Twitter)連携が簡単になった【iPhone】
1年以上前の記事です。内容が古い可能性があります。こんなメールが届きました。 お …
-
-
iPhone用ツイッタークライアント「TwitBird」に関して注意すること (6/26追記)
1年以上前の記事です。内容が古い可能性があります。最終的にこれに決まりそうなiP …
-
-
正規表現って便利(表組みの簡単な作り方)
1年以上前の記事です。内容が古い可能性があります。こちらの記事で使った表組みやこ …
-
-
東京ディズニーリゾートチケットはネットで購入が楽でいい【チケット購入編】
1年以上前の記事です。内容が古い可能性があります。1. ユーザー登録編  …
-
-
ローカル変数、プライベート変数、レキシカルスコープ変数【perl】
1年以上前の記事です。内容が古い可能性があります。perlのmy宣言についてさら …