新・元地方の中規模印刷会社で苦悩するWebデザイナー改めWebディレクターの日記

自由な20代、窮屈な30代を経て、遂に40代になっちまったWebディレクター&パソコン講師の覚書と思う言(こと)。略称【ちほちゅう】

*

書類をPDFでスキャンすれば「Adobe Acrobat」でテキスト化(OCR)できる

   

  • このエントリーをはてなブックマークに追加

1年以上前の記事です。内容が古い可能性があります。

どういうことかというと、まずは説明したいと思います。

最近のプリンターには複合機と言ってプリンターだけの機能ではなく、スキャナやコピー、中にはファクスにまでなってしまうインクジェットプリンターもあります。
そういったプリンターの中にはスキャンしたデータをPDFもしくはJPEGにしてSDカードに保存してくれるといったものもあります。
わざわざパソコンを繋いだりしなくてもSDカードにスキャンしたデータを保存できるんです。
で、そういったプリンターを使って書類をPDFでスキャンします。

スキャンしたPDFのデータは「Adobe Acrobat」で開くことができます。
で、このAcrobatで画像データの文字をテキストデータに変換することができるというわけ。
そう、つまり、OCRの機能をいつのまにかAcrobatは持っていたんですね。

スポンサーリンク
 

さっそく使ってみての感想です。

  • ファイルでまとめて変換できるのでページで変換するよりもひとまとめにしてしまってから変換した方が楽。 
  • 数字での誤変換が多かった。特に縦書き内の二桁数字。
  • ヌキ文字は検知できない模様。
    AdobeAcrobatのOCR機能04
    青字に白抜き文字の例。テキストが選択できていません。
と言った感じでしょうか。
いずれにしても、OCRで読み取ったテキスト同様そのままでは使えないので見直しは必至だと思います。
ちなみにテキストに変換する手順は以下の通りです。

  1. まずは、スキャンしたPDFをひとまとめにしてしまいましょう。全PDFファイルを開いて左サムネール部分をドラッグ&ドロップでひとつのファイルにまとめます。
  2. 次に「表示」→「ツール」→「テキスト認識」とメニューを辿ります。
    AdobeAcrobatのOCR機能01
  3. 右にメニューが表示されるので「このファイル内」をクリックし、開いたダイヤログから「すべてのページ」をチェックし「OK」をクリックします。
    AdobeAcrobatのOCR機能03
  4. 暫く待つと変換が終了します。
  5. 変換が終了するとドラッグ&ドロップでテキストが選択できるようになります。
    AdobeAcrobatのOCR機能04
  6. あとは、コピー&ペーストして使えばOKです。

実は、この機能知らなくて娘にアルバイトでテキスト入力やってもらっちゃいました。
一文字(2バイト)1円で計算したらなんと1万超に。
でも、OCRよりはずっと正確で助かりましたよ。 

 - パソコン教室, 覚え書き

アドセンス広告メイン

Message

メールアドレスが公開されることはありません。

  関連記事

おサイフケータイの機種変更手続きは契約前に旧機種でやっておこう(WAON編)

1年以上前の記事です。内容が古い可能性があります。うちのほう(田舎)ですと意外と …

パソコン起動と同時にJ-WAVEを流す方法 【radiko(ラジコ)】

1年以上前の記事です。内容が古い可能性があります。radiko(ラジコ)を使って …

LinkShare(リンクシェア)がグラフィックとの提携を辞めてしまったのでグラフィックアフィリエイトプログラムに登録してみた

1年以上前の記事です。内容が古い可能性があります。またまたリンクシェアとの提携を …

ブラインドタッチを覚えるための10のポイント

1年以上前の記事です。内容が古い可能性があります。先日より、ブラインドタッチを覚 …

油断してると刺されるゾ!11月の蚊(チカイエカ)に注意!

1年以上前の記事です。内容が古い可能性があります。まずはこちらのツイートを。 @ …

Webデザインのテンプレートは60px×12カラムで横幅960px

1年以上前の記事です。内容が古い可能性があります。これはWebデザイナーの常識な …

「イオン銀行」と「ゆうちょ銀行」、他行だったら「イオン銀行」の方がお得

1年以上前の記事です。内容が古い可能性があります。自分はメインの銀行口座が「住信 …

Flickrで「保険」と検索したらヤバい画像がたくさん出てきた

1年以上前の記事です。内容が古い可能性があります。この前の記事を書くに当たり、F …

no image
Twitter(ツイッター)でbot(ボット)を見極める方法

1年以上前の記事です。内容が古い可能性があります。ツイッターの使い方は人それぞれ …

リセマラ(リセットマラソン)とは何のこと?

1年以上前の記事です。内容が古い可能性があります。そういえばちょっと前にマーケテ …

血液型オヤジ