新・元地方の中規模印刷会社で苦悩するWebデザイナー改めWebディレクターの日記

自由な20代、窮屈な30代を経て、遂に40代になっちまったWebディレクター&パソコン講師の覚書と思う言(こと)。略称【ちほちゅう】

*

書類をPDFでスキャンすれば「Adobe Acrobat」でテキスト化(OCR)できる

   

  • このエントリーをはてなブックマークに追加

1年以上前の記事です。内容が古い可能性があります。

どういうことかというと、まずは説明したいと思います。

最近のプリンターには複合機と言ってプリンターだけの機能ではなく、スキャナやコピー、中にはファクスにまでなってしまうインクジェットプリンターもあります。
そういったプリンターの中にはスキャンしたデータをPDFもしくはJPEGにしてSDカードに保存してくれるといったものもあります。
わざわざパソコンを繋いだりしなくてもSDカードにスキャンしたデータを保存できるんです。
で、そういったプリンターを使って書類をPDFでスキャンします。

スキャンしたPDFのデータは「Adobe Acrobat」で開くことができます。
で、このAcrobatで画像データの文字をテキストデータに変換することができるというわけ。
そう、つまり、OCRの機能をいつのまにかAcrobatは持っていたんですね。

スポンサーリンク
 

さっそく使ってみての感想です。

  • ファイルでまとめて変換できるのでページで変換するよりもひとまとめにしてしまってから変換した方が楽。 
  • 数字での誤変換が多かった。特に縦書き内の二桁数字。
  • ヌキ文字は検知できない模様。
    AdobeAcrobatのOCR機能04
    青字に白抜き文字の例。テキストが選択できていません。
と言った感じでしょうか。
いずれにしても、OCRで読み取ったテキスト同様そのままでは使えないので見直しは必至だと思います。
ちなみにテキストに変換する手順は以下の通りです。

  1. まずは、スキャンしたPDFをひとまとめにしてしまいましょう。全PDFファイルを開いて左サムネール部分をドラッグ&ドロップでひとつのファイルにまとめます。
  2. 次に「表示」→「ツール」→「テキスト認識」とメニューを辿ります。
    AdobeAcrobatのOCR機能01
  3. 右にメニューが表示されるので「このファイル内」をクリックし、開いたダイヤログから「すべてのページ」をチェックし「OK」をクリックします。
    AdobeAcrobatのOCR機能03
  4. 暫く待つと変換が終了します。
  5. 変換が終了するとドラッグ&ドロップでテキストが選択できるようになります。
    AdobeAcrobatのOCR機能04
  6. あとは、コピー&ペーストして使えばOKです。

実は、この機能知らなくて娘にアルバイトでテキスト入力やってもらっちゃいました。
一文字(2バイト)1円で計算したらなんと1万超に。
でも、OCRよりはずっと正確で助かりましたよ。 

 - パソコン教室, 覚え書き

アドセンス広告メイン

Message

メールアドレスが公開されることはありません。

  関連記事

iPhoneでOSのバージョンを確認する方法

1年以上前の記事です。内容が古い可能性があります。カメラでズームのできる無料アプ …

募金額を通常より増やす裏技(見せ金作戦)

1年以上前の記事です。内容が古い可能性があります。僕も愛読しているちょっと変わっ …

DreamweaverとFC2ホームページで作るサイト定義(サイト公開編)

1年以上前の記事です。内容が古い可能性があります。前編 → 後編 → 公開編 最 …

WordPress(ワードプレス)のヘッドライン表示は「query_posts」じゃなくて「get_posts」 #wp

1年以上前の記事です。内容が古い可能性があります。プログラムのプロではないのです …

「Windows 7(64bit)」で「GT-7600U」を使う方法

1年以上前の記事です。内容が古い可能性があります。先日記事にした「Windows …

熊谷駅、上尾駅等から池袋駅、新宿駅、渋谷駅までの定期券で途中下車できる駅を増やす方法

1年以上前の記事です。内容が古い可能性があります。これ、知っておくと途中下車でき …

「いいね!」や「+1」はSEOには影響しないらしい

1年以上前の記事です。内容が古い可能性があります。Googleの担当者が言ってい …

Facebook(フェイスブック)は完全オープン?「Yahoo!リアリタイム検索」に日記がヒットする

1年以上前の記事です。内容が古い可能性があります。これ、知りませんでした。という …

闇金融(ヤミ金)業者に引っかからないためにすべき唯一のこと

1年以上前の記事です。内容が古い可能性があります。「お金を借りない」以上! で、 …

画像の下にどうしても隙間が残る場合はタグにvertical-align:bottomが正解【Webデザイン・CSS】

1年以上前の記事です。内容が古い可能性があります。これは知らなかった。。というか …

血液型オヤジ