書類をPDFでスキャンすれば「Adobe Acrobat」でテキスト化(OCR)できる
1年以上前の記事です。内容が古い可能性があります。
どういうことかというと、まずは説明したいと思います。
最近のプリンターには複合機と言ってプリンターだけの機能ではなく、スキャナやコピー、中にはファクスにまでなってしまうインクジェットプリンターもあります。
そういったプリンターの中にはスキャンしたデータをPDFもしくはJPEGにしてSDカードに保存してくれるといったものもあります。
わざわざパソコンを繋いだりしなくてもSDカードにスキャンしたデータを保存できるんです。
で、そういったプリンターを使って書類をPDFでスキャンします。
スキャンしたPDFのデータは「Adobe Acrobat」で開くことができます。
で、このAcrobatで画像データの文字をテキストデータに変換することができるというわけ。
そう、つまり、OCRの機能をいつのまにかAcrobatは持っていたんですね。
さっそく使ってみての感想です。
- ファイルでまとめて変換できるのでページで変換するよりもひとまとめにしてしまってから変換した方が楽。
- 数字での誤変換が多かった。特に縦書き内の二桁数字。
- ヌキ文字は検知できない模様。
青字に白抜き文字の例。テキストが選択できていません。
ちなみにテキストに変換する手順は以下の通りです。
- まずは、スキャンしたPDFをひとまとめにしてしまいましょう。全PDFファイルを開いて左サムネール部分をドラッグ&ドロップでひとつのファイルにまとめます。
- 次に「表示」→「ツール」→「テキスト認識」とメニューを辿ります。
- 右にメニューが表示されるので「このファイル内」をクリックし、開いたダイヤログから「すべてのページ」をチェックし「OK」をクリックします。
- 暫く待つと変換が終了します。
- 変換が終了するとドラッグ&ドロップでテキストが選択できるようになります。
- あとは、コピー&ペーストして使えばOKです。
実は、この機能知らなくて娘にアルバイトでテキスト入力やってもらっちゃいました。
一文字(2バイト)1円で計算したらなんと1万超に。
でも、OCRよりはずっと正確で助かりましたよ。
アドセンス広告メイン
関連記事
-
-
最近、2ちゃんねるまとめブログ風のランディングページ(偽ブログ)が乱立しているくさい
1年以上前の記事です。内容が古い可能性があります。以前、キラキラ☆ウォーカーに騙 …
-
-
カーナビの地図更新サービスの無料期間が終わりそうなので地図データをアップデートしてみた(CD作成編)
1年以上前の記事です。内容が古い可能性があります。1. ID取得編 | …
-
-
「Outlook Express」からドコモのガラケーへ電話帳データをインポート
1年以上前の記事です。内容が古い可能性があります。iPhone(アイフォーン)を …
-
-
広告サイズによるAdsense及びAmazonアフィリエイト収益の考察【最終章】
1年以上前の記事です。内容が古い可能性があります。今まで何度か検証してきた広告サ …
-
-
今年はモテたい。女子が引く小さい男だと思われる9つの言動
1年以上前の記事です。内容が古い可能性があります。自分も最近良くかみさんに指摘さ …
-
-
使わなくなったデータCDどうする?
1年以上前の記事です。内容が古い可能性があります。「個人情報保護法」なんてのが施 …
-
-
OpenOffice「Calc」印刷前はページレイアウトをチェック
1年以上前の記事です。内容が古い可能性があります。最近では「GoogleDocs …
-
-
フォルダ名またはファイル名が一致しません
1年以上前の記事です。内容が古い可能性があります。またまたパソコン教室での話。思 …
-
-
「Google Chrome」でPDFファイルは開かないほうがいい
1年以上前の記事です。内容が古い可能性があります。もっとも、一番の原因は僕の使っ …
-
-
LINE(ライン)のタイムラインは友達ごとに公開設定可能
1年以上前の記事です。内容が古い可能性があります。LINEにツイッター(Twit …