書類をPDFでスキャンすれば「Adobe Acrobat」でテキスト化(OCR)できる
1年以上前の記事です。内容が古い可能性があります。
どういうことかというと、まずは説明したいと思います。
最近のプリンターには複合機と言ってプリンターだけの機能ではなく、スキャナやコピー、中にはファクスにまでなってしまうインクジェットプリンターもあります。
そういったプリンターの中にはスキャンしたデータをPDFもしくはJPEGにしてSDカードに保存してくれるといったものもあります。
わざわざパソコンを繋いだりしなくてもSDカードにスキャンしたデータを保存できるんです。
で、そういったプリンターを使って書類をPDFでスキャンします。
スキャンしたPDFのデータは「Adobe Acrobat」で開くことができます。
で、このAcrobatで画像データの文字をテキストデータに変換することができるというわけ。
そう、つまり、OCRの機能をいつのまにかAcrobatは持っていたんですね。
さっそく使ってみての感想です。
- ファイルでまとめて変換できるのでページで変換するよりもひとまとめにしてしまってから変換した方が楽。
- 数字での誤変換が多かった。特に縦書き内の二桁数字。
- ヌキ文字は検知できない模様。
青字に白抜き文字の例。テキストが選択できていません。
ちなみにテキストに変換する手順は以下の通りです。
- まずは、スキャンしたPDFをひとまとめにしてしまいましょう。全PDFファイルを開いて左サムネール部分をドラッグ&ドロップでひとつのファイルにまとめます。
- 次に「表示」→「ツール」→「テキスト認識」とメニューを辿ります。
- 右にメニューが表示されるので「このファイル内」をクリックし、開いたダイヤログから「すべてのページ」をチェックし「OK」をクリックします。
- 暫く待つと変換が終了します。
- 変換が終了するとドラッグ&ドロップでテキストが選択できるようになります。
- あとは、コピー&ペーストして使えばOKです。
実は、この機能知らなくて娘にアルバイトでテキスト入力やってもらっちゃいました。
一文字(2バイト)1円で計算したらなんと1万超に。
でも、OCRよりはずっと正確で助かりましたよ。
アドセンス広告メイン
関連記事
-
-
ファンページ「いいね!ボックス」の作り方【Facebookページの作り方03】
1年以上前の記事です。内容が古い可能性があります。以下の情報は古い情報です。こち …
-
-
WordPress(ワードプレス)の管理バーの高さを無視させたり、非表示にさせたりする方法
1年以上前の記事です。内容が古い可能性があります。WordPressでデザインを …
-
-
登録できる検索エンジンを探し出す方法
1年以上前の記事です。内容が古い可能性があります。SEO対策のひとつである被リン …
-
-
「WordPress(ワードプレス)」のプラグインをインストールする方法3つ
1年以上前の記事です。内容が古い可能性があります。新しい豊洲のお仕事はCMS「W …
-
-
みかんの早剥き動画。まずは半分に割る【和歌山剥き】
1年以上前の記事です。内容が古い可能性があります。冬はこたつにみかんです。 うち …
-
-
さくらインターネットとWordPressで不動産サイトを作った
1年以上前の記事です。内容が古い可能性があります。WordPressに不動産プラ …
-
-
[シリーズ動画#1] DVDで録画した動画をYouTubeにあげる
1年以上前の記事です。内容が古い可能性があります。DVDで録画した動画をYouT …
-
-
著作権表示についてのメモ
1年以上前の記事です。内容が古い可能性があります。ホームページの著作権は本来は制 …
-
-
今度はPowerPointが原因?書類の使い回しはプロパティをチェック
1年以上前の記事です。内容が古い可能性があります。何度も企画書を書いているうちに …
-
-
コメント付き「いいね!」ボタンを確実に作る方法
1年以上前の記事です。内容が古い可能性があります。5月以降、使えなくなる表記もあ …