書類をPDFでスキャンすれば「Adobe Acrobat」でテキスト化(OCR)できる
1年以上前の記事です。内容が古い可能性があります。
どういうことかというと、まずは説明したいと思います。
最近のプリンターには複合機と言ってプリンターだけの機能ではなく、スキャナやコピー、中にはファクスにまでなってしまうインクジェットプリンターもあります。
そういったプリンターの中にはスキャンしたデータをPDFもしくはJPEGにしてSDカードに保存してくれるといったものもあります。
わざわざパソコンを繋いだりしなくてもSDカードにスキャンしたデータを保存できるんです。
で、そういったプリンターを使って書類をPDFでスキャンします。
スキャンしたPDFのデータは「Adobe Acrobat」で開くことができます。
で、このAcrobatで画像データの文字をテキストデータに変換することができるというわけ。
そう、つまり、OCRの機能をいつのまにかAcrobatは持っていたんですね。
さっそく使ってみての感想です。
- ファイルでまとめて変換できるのでページで変換するよりもひとまとめにしてしまってから変換した方が楽。
- 数字での誤変換が多かった。特に縦書き内の二桁数字。
- ヌキ文字は検知できない模様。
青字に白抜き文字の例。テキストが選択できていません。
ちなみにテキストに変換する手順は以下の通りです。
- まずは、スキャンしたPDFをひとまとめにしてしまいましょう。全PDFファイルを開いて左サムネール部分をドラッグ&ドロップでひとつのファイルにまとめます。
- 次に「表示」→「ツール」→「テキスト認識」とメニューを辿ります。
- 右にメニューが表示されるので「このファイル内」をクリックし、開いたダイヤログから「すべてのページ」をチェックし「OK」をクリックします。
- 暫く待つと変換が終了します。
- 変換が終了するとドラッグ&ドロップでテキストが選択できるようになります。
- あとは、コピー&ペーストして使えばOKです。
実は、この機能知らなくて娘にアルバイトでテキスト入力やってもらっちゃいました。
一文字(2バイト)1円で計算したらなんと1万超に。
でも、OCRよりはずっと正確で助かりましたよ。
アドセンス広告メイン
関連記事
-
-
女子・女性の仕草で本音(好意?嫌悪?)を見抜く方法
1年以上前の記事です。内容が古い可能性があります。これは参考になる!ということで …
-
-
インバウンドマーケティングとはどんなこと?
1年以上前の記事です。内容が古い可能性があります。あるところで、インバウンドマー …
-
-
教師(講師)の能力は平均よりもちょっと上。「分からない」がわからないと務まらない
1年以上前の記事です。内容が古い可能性があります。なんか、こんなニュースが話題に …
-
-
「mention」とはどんな意味?
1年以上前の記事です。内容が古い可能性があります。最近、ツイッター(twitte …
-
-
警察や検察から身を守る(冤罪を防衛する)、不当逮捕されないための方法
1年以上前の記事です。内容が古い可能性があります。これは個人的にもまとめておきた …
-
-
「フライパン」を使うと5分でご飯が炊ける。と思ったら…
1年以上前の記事です。内容が古い可能性があります。うちの炊飯器にはタイマーがあり …
-
-
サーバー契約には「誕生日」、ドメイン取得には「登記情報」を聞くべし
1年以上前の記事です。内容が古い可能性があります。最近、ドメインの取得やサーバー …
-
-
「WordPress(ワードプレス)」で「Not Found」。原因は… #wp
1年以上前の記事です。内容が古い可能性があります。当初、URLの語尾にhtmlを …
-
-
LINE(ライン)でブロックされているかどうか分かる確実な方法
1年以上前の記事です。内容が古い可能性があります。LINE(ライン)が凄い広がり …
-
-
Googleバズとtwitter(ツイッター)の同期の方法
1年以上前の記事です。内容が古い可能性があります。やらないかもなんてコメントして …