書類をPDFでスキャンすれば「Adobe Acrobat」でテキスト化(OCR)できる
1年以上前の記事です。内容が古い可能性があります。
どういうことかというと、まずは説明したいと思います。
最近のプリンターには複合機と言ってプリンターだけの機能ではなく、スキャナやコピー、中にはファクスにまでなってしまうインクジェットプリンターもあります。
そういったプリンターの中にはスキャンしたデータをPDFもしくはJPEGにしてSDカードに保存してくれるといったものもあります。
わざわざパソコンを繋いだりしなくてもSDカードにスキャンしたデータを保存できるんです。
で、そういったプリンターを使って書類をPDFでスキャンします。
スキャンしたPDFのデータは「Adobe Acrobat」で開くことができます。
で、このAcrobatで画像データの文字をテキストデータに変換することができるというわけ。
そう、つまり、OCRの機能をいつのまにかAcrobatは持っていたんですね。
さっそく使ってみての感想です。
- ファイルでまとめて変換できるのでページで変換するよりもひとまとめにしてしまってから変換した方が楽。
- 数字での誤変換が多かった。特に縦書き内の二桁数字。
- ヌキ文字は検知できない模様。

青字に白抜き文字の例。テキストが選択できていません。
ちなみにテキストに変換する手順は以下の通りです。
- まずは、スキャンしたPDFをひとまとめにしてしまいましょう。全PDFファイルを開いて左サムネール部分をドラッグ&ドロップでひとつのファイルにまとめます。
- 次に「表示」→「ツール」→「テキスト認識」とメニューを辿ります。

- 右にメニューが表示されるので「このファイル内」をクリックし、開いたダイヤログから「すべてのページ」をチェックし「OK」をクリックします。

- 暫く待つと変換が終了します。
- 変換が終了するとドラッグ&ドロップでテキストが選択できるようになります。

- あとは、コピー&ペーストして使えばOKです。
実は、この機能知らなくて娘にアルバイトでテキスト入力やってもらっちゃいました。
一文字(2バイト)1円で計算したらなんと1万超に。
でも、OCRよりはずっと正確で助かりましたよ。
アドセンス広告メイン
関連記事
-
-
LinkShare(リンクシェア)がグラフィックとの提携を辞めてしまったのでグラフィックアフィリエイトプログラムに登録してみた
1年以上前の記事です。内容が古い可能性があります。またまたリンクシェアとの提携を …
-
-
デザインの配色に迷ったときに使えるツール
1年以上前の記事です。内容が古い可能性があります。デザイン系ブログとしてよく読ま …
-
-
各種SNSサービス連携まとめ
1年以上前の記事です。内容が古い可能性があります。色々と連携関連の記事を書いてき …
-
-
トイレやキッチンで「ゴキブリ」と遭遇したら洗剤やハンドソープで退治可能
1年以上前の記事です。内容が古い可能性があります。ネットでは「G」などと隠語化さ …
-
-
「プログラムの追加と削除」に残ってしまったアプリを消す方法
1年以上前の記事です。内容が古い可能性があります。「コントロールパネル」にある「 …
-
-
Facebookで通知がうるさい人の通知表示を無視する方法
1年以上前の記事です。内容が古い可能性があります。Facebookも楽しいですが …
-
-
Excel(エクセル)を使ってHTMLの表組みの行(横軸)と列(縦軸)を簡単に入れ替える方法
1年以上前の記事です。内容が古い可能性があります。この機能、Dreamweave …
-
-
HDD vs SSD
1年以上前の記事です。内容が古い可能性があります。Seagate製のHDDがアク …
-
-
Flickrでタグを使ったスライドショーが非常に便利
1年以上前の記事です。内容が古い可能性があります。せっかくFlickrを有料で使 …
-
-
FLASHでプルダウンメニュー(ポップアップメニュー) スクリプト編
1年以上前の記事です。内容が古い可能性があります。さてスクリプトの解説












