新・元地方の中規模印刷会社で苦悩するWebデザイナー改めWebディレクターの日記

自由な20代、窮屈な30代を経て、遂に40代になっちまったWebディレクター&パソコン講師の覚書と思う言(こと)。略称【ちほちゅう】

*

書類をPDFでスキャンすれば「Adobe Acrobat」でテキスト化(OCR)できる

   

  • このエントリーをはてなブックマークに追加

1年以上前の記事です。内容が古い可能性があります。

どういうことかというと、まずは説明したいと思います。

最近のプリンターには複合機と言ってプリンターだけの機能ではなく、スキャナやコピー、中にはファクスにまでなってしまうインクジェットプリンターもあります。
そういったプリンターの中にはスキャンしたデータをPDFもしくはJPEGにしてSDカードに保存してくれるといったものもあります。
わざわざパソコンを繋いだりしなくてもSDカードにスキャンしたデータを保存できるんです。
で、そういったプリンターを使って書類をPDFでスキャンします。

スキャンしたPDFのデータは「Adobe Acrobat」で開くことができます。
で、このAcrobatで画像データの文字をテキストデータに変換することができるというわけ。
そう、つまり、OCRの機能をいつのまにかAcrobatは持っていたんですね。

スポンサーリンク
 

さっそく使ってみての感想です。

  • ファイルでまとめて変換できるのでページで変換するよりもひとまとめにしてしまってから変換した方が楽。 
  • 数字での誤変換が多かった。特に縦書き内の二桁数字。
  • ヌキ文字は検知できない模様。
    AdobeAcrobatのOCR機能04
    青字に白抜き文字の例。テキストが選択できていません。
と言った感じでしょうか。
いずれにしても、OCRで読み取ったテキスト同様そのままでは使えないので見直しは必至だと思います。
ちなみにテキストに変換する手順は以下の通りです。

  1. まずは、スキャンしたPDFをひとまとめにしてしまいましょう。全PDFファイルを開いて左サムネール部分をドラッグ&ドロップでひとつのファイルにまとめます。
  2. 次に「表示」→「ツール」→「テキスト認識」とメニューを辿ります。
    AdobeAcrobatのOCR機能01
  3. 右にメニューが表示されるので「このファイル内」をクリックし、開いたダイヤログから「すべてのページ」をチェックし「OK」をクリックします。
    AdobeAcrobatのOCR機能03
  4. 暫く待つと変換が終了します。
  5. 変換が終了するとドラッグ&ドロップでテキストが選択できるようになります。
    AdobeAcrobatのOCR機能04
  6. あとは、コピー&ペーストして使えばOKです。

実は、この機能知らなくて娘にアルバイトでテキスト入力やってもらっちゃいました。
一文字(2バイト)1円で計算したらなんと1万超に。
でも、OCRよりはずっと正確で助かりましたよ。 

 - パソコン教室, 覚え書き

アドセンス広告メイン

Message

メールアドレスが公開されることはありません。

  関連記事

人気が出る写真の法則。人の顔はNG。背景は控えめに等

1年以上前の記事です。内容が古い可能性があります。インターネット上には数多くのデ …

「Windows Media Player」でCDの曲を吸い出す(取り込む)方法

1年以上前の記事です。内容が古い可能性があります。個別授業の生徒さんの知り合いに …

no image
意外と気づかないSEO対策

1年以上前の記事です。内容が古い可能性があります。SEO対策の知識はかなり詰め込 …

東京ディズニーリゾートチケットはネットで購入が楽でいい【チケットプリント編】

1年以上前の記事です。内容が古い可能性があります。1. ユーザー登録編&nbsp …

エイサーASPIRE ONEが起動しなくなった

1年以上前の記事です。内容が古い可能性があります。最近は、帰ってきて一段落してか …

最近のイラストレーター(Illustrator)aiデータはAdobe Readerでプレビューできる【DTP】

1年以上前の記事です。内容が古い可能性があります。Illustratorのデータ …

CTPTマーケティングって何?

1年以上前の記事です。内容が古い可能性があります。先日、PDCAサイクルやらAI …

Flicksquareの設定を復活させる方法(foursquare→Flickr連携)

1年以上前の記事です。内容が古い可能性があります。Flicksquareの設定が …

Facebookでも通用するツイッターの常識「@」

1年以上前の記事です。内容が古い可能性があります。最近はツイッター以上にFace …

no image
意外と知られていない共有へのアクセス方法

1年以上前の記事です。内容が古い可能性があります。社内ネットワークを組んでいる会 …

血液型オヤジ