新・元地方の中規模印刷会社で苦悩するWebデザイナー改めWebディレクターの日記

自由な20代、窮屈な30代を経て、遂に40代になっちまったWebディレクター&パソコン講師の覚書と思う言(こと)。略称【ちほちゅう】

*

書類をPDFでスキャンすれば「Adobe Acrobat」でテキスト化(OCR)できる

   

  • このエントリーをはてなブックマークに追加

1年以上前の記事です。内容が古い可能性があります。

どういうことかというと、まずは説明したいと思います。

最近のプリンターには複合機と言ってプリンターだけの機能ではなく、スキャナやコピー、中にはファクスにまでなってしまうインクジェットプリンターもあります。
そういったプリンターの中にはスキャンしたデータをPDFもしくはJPEGにしてSDカードに保存してくれるといったものもあります。
わざわざパソコンを繋いだりしなくてもSDカードにスキャンしたデータを保存できるんです。
で、そういったプリンターを使って書類をPDFでスキャンします。

スキャンしたPDFのデータは「Adobe Acrobat」で開くことができます。
で、このAcrobatで画像データの文字をテキストデータに変換することができるというわけ。
そう、つまり、OCRの機能をいつのまにかAcrobatは持っていたんですね。

スポンサーリンク
 

さっそく使ってみての感想です。

  • ファイルでまとめて変換できるのでページで変換するよりもひとまとめにしてしまってから変換した方が楽。 
  • 数字での誤変換が多かった。特に縦書き内の二桁数字。
  • ヌキ文字は検知できない模様。
    AdobeAcrobatのOCR機能04
    青字に白抜き文字の例。テキストが選択できていません。
と言った感じでしょうか。
いずれにしても、OCRで読み取ったテキスト同様そのままでは使えないので見直しは必至だと思います。
ちなみにテキストに変換する手順は以下の通りです。

  1. まずは、スキャンしたPDFをひとまとめにしてしまいましょう。全PDFファイルを開いて左サムネール部分をドラッグ&ドロップでひとつのファイルにまとめます。
  2. 次に「表示」→「ツール」→「テキスト認識」とメニューを辿ります。
    AdobeAcrobatのOCR機能01
  3. 右にメニューが表示されるので「このファイル内」をクリックし、開いたダイヤログから「すべてのページ」をチェックし「OK」をクリックします。
    AdobeAcrobatのOCR機能03
  4. 暫く待つと変換が終了します。
  5. 変換が終了するとドラッグ&ドロップでテキストが選択できるようになります。
    AdobeAcrobatのOCR機能04
  6. あとは、コピー&ペーストして使えばOKです。

実は、この機能知らなくて娘にアルバイトでテキスト入力やってもらっちゃいました。
一文字(2バイト)1円で計算したらなんと1万超に。
でも、OCRよりはずっと正確で助かりましたよ。 

 - パソコン教室, 覚え書き

アドセンス広告メイン

Message

メールアドレスが公開されることはありません。

  関連記事

Youtubeでライブ配信可能アカウントかどうか調べる方法

1年以上前の記事です。内容が古い可能性があります。YouTubeでライブ配信が可 …

有料会員じゃないと見れないCOOKPAD(クックパッド)の人気順レシビをGoogleの検索結果で見る方法

1年以上前の記事です。内容が古い可能性があります。COOKPAD(クックパッド) …

ブラインドタッチを覚えるための10のポイント

1年以上前の記事です。内容が古い可能性があります。先日より、ブラインドタッチを覚 …

湘南新宿ライン(赤羽⇔池袋間)は埼京線と並行して走っていない。山手線と並行して走ってた

1年以上前の記事です。内容が古い可能性があります。最近ダイヤ改正して上野東京ライ …

no image
ブログのアクセス(PV)を増やす方法 【小学生編】

1年以上前の記事です。内容が古い可能性があります。さて、娘がアメーバピグをはじめ …

「iOS5」にしたらツイッター(Twitter)連携が簡単になった【iPhone】

1年以上前の記事です。内容が古い可能性があります。こんなメールが届きました。 お …

iPhone用ツイッタークライアント「TwitBird」に関して注意すること (6/26追記)

1年以上前の記事です。内容が古い可能性があります。最終的にこれに決まりそうなiP …

正規表現って便利(表組みの簡単な作り方)

1年以上前の記事です。内容が古い可能性があります。こちらの記事で使った表組みやこ …

東京ディズニーリゾートチケットはネットで購入が楽でいい【チケット購入編】

1年以上前の記事です。内容が古い可能性があります。1. ユーザー登録編&nbsp …

ローカル変数、プライベート変数、レキシカルスコープ変数【perl】

1年以上前の記事です。内容が古い可能性があります。perlのmy宣言についてさら …

血液型オヤジ