書類をPDFでスキャンすれば「Adobe Acrobat」でテキスト化(OCR)できる
1年以上前の記事です。内容が古い可能性があります。
どういうことかというと、まずは説明したいと思います。
最近のプリンターには複合機と言ってプリンターだけの機能ではなく、スキャナやコピー、中にはファクスにまでなってしまうインクジェットプリンターもあります。
そういったプリンターの中にはスキャンしたデータをPDFもしくはJPEGにしてSDカードに保存してくれるといったものもあります。
わざわざパソコンを繋いだりしなくてもSDカードにスキャンしたデータを保存できるんです。
で、そういったプリンターを使って書類をPDFでスキャンします。
スキャンしたPDFのデータは「Adobe Acrobat」で開くことができます。
で、このAcrobatで画像データの文字をテキストデータに変換することができるというわけ。
そう、つまり、OCRの機能をいつのまにかAcrobatは持っていたんですね。
さっそく使ってみての感想です。
- ファイルでまとめて変換できるのでページで変換するよりもひとまとめにしてしまってから変換した方が楽。
- 数字での誤変換が多かった。特に縦書き内の二桁数字。
- ヌキ文字は検知できない模様。
青字に白抜き文字の例。テキストが選択できていません。
ちなみにテキストに変換する手順は以下の通りです。
- まずは、スキャンしたPDFをひとまとめにしてしまいましょう。全PDFファイルを開いて左サムネール部分をドラッグ&ドロップでひとつのファイルにまとめます。
- 次に「表示」→「ツール」→「テキスト認識」とメニューを辿ります。
- 右にメニューが表示されるので「このファイル内」をクリックし、開いたダイヤログから「すべてのページ」をチェックし「OK」をクリックします。
- 暫く待つと変換が終了します。
- 変換が終了するとドラッグ&ドロップでテキストが選択できるようになります。
- あとは、コピー&ペーストして使えばOKです。
実は、この機能知らなくて娘にアルバイトでテキスト入力やってもらっちゃいました。
一文字(2バイト)1円で計算したらなんと1万超に。
でも、OCRよりはずっと正確で助かりましたよ。
アドセンス広告メイン
関連記事
-
Flashファイル(swf)のサイズ(widthとheight)の調べ方
1年以上前の記事です。内容が古い可能性があります。バージョンアップ、仕様変更によ …
-
Cドライブがダブルクリックで開かない
1年以上前の記事です。内容が古い可能性があります。CドライブやDドライブ(MO等 …
-
Skype(スカイプ)を使ってチャットをするまで(インストール編)
1年以上前の記事です。内容が古い可能性があります。1. ID取得編 → …
-
一部のキーが壊れても大丈夫。「keyswap」を使ってキーの機能を入れ替えよう
1年以上前の記事です。内容が古い可能性があります。先日、バックスペースキー(BA …
-
ブログのアクセス(PV)を増やす方法 【小学生編】
1年以上前の記事です。内容が古い可能性があります。さて、娘がアメーバピグをはじめ …
-
ウォッシャー液の濃度を薄めると冬場危険な目にあうよ
1年以上前の記事です。内容が古い可能性があります。今年の冬は寒いですよね。 震災 …
-
カラーインクジェットプリンタでモノクロ印刷も考えている人は注意。なんと、黒インクだけじゃ印刷できないのが一般的
1年以上前の記事です。内容が古い可能性があります。この仕様はぶっちゃけ、詐欺じゃ …
-
FFFTPでサイト定義(ホストの設定)をする方法
1年以上前の記事です。内容が古い可能性があります。先日、Dreamweaverで …
-
ドコモの携帯電話の電池(バッテリー)は2年以上使っていれば無料で交換してくれる
1年以上前の記事です。内容が古い可能性があります。これ知らなかったのでこんな恥ず …
-
Skypeで複数アカウントを使い分ける方法
1年以上前の記事です。内容が古い可能性があります。どうも今ひとつ固定客で凝り固ま …