テキストが選択できないPDFファイルからテキストを抽出する方法
1年以上前の記事です。内容が古い可能性があります。
時々、PDFファイルを渡されて「これをホームページにしてくれない」と言われることがある。
PDFだったらそのままPDFでリンクだけ張っちゃろうかい! なんて思うこともあるが
そういうわけにも行かず、PDFファイルからテキストをコピー&ペーストしてセコセコHTMLファイルにするのだが、
中にはセキュリティ上の問題かテキストが選択できないPDFファイルもある。
だからって、プリントアウトして文字入力なんて非生産的なことはできない。
そんなときに使えるツールを発見しました。
□xdoc2txt - PDF,WORD,EXCEL,一太郎などの各種バイナリ文書からテキストを抽出
「xdoc2txt」は、各種ファイルからテキストを抽出するツールです。
その中にPDFファイルも含まれていて、上記テキスト選択ができないファイルからもテキスト抽出できます。
このツール、基本的にはコマンドプロンプトでの作業になるのですが、
ちょっとした設定でファイルをドラッグ&ドロップすることでテキスト抽出させる方法もあります。
以下、その手順をお教えしましょう。
1. 上記サイトからxdoc2txtをダウンロードします。
2. 解凍後、本体「xdoc2txt.exe」のショートカットを作成します。デスクトップでいいでしょう。
3. ショートカットを右クリックでプロパティ表示にします。
4. リンク先の末尾に「-f」と入力します。

以上でOK!
PDFファイルをドラッグ&ドロップすればデスクトップに抽出されたテキストファイルができるはずです。
■3月17日追記
xdoc2txtより強力なツールの紹介です。
編集不可のPDFファイルから本文をコピーする方法を教えてください。目的は英語の論文に翻訳ソフトを使用したいのです。.. – 人力検索はてな
http://www.bravaviewer.jp/reader.htm
Brava! Reader
このビューアを使えば、編集不可のpdfから、テキストをコピーすることができます。pdfを表示した後、「編集」→「選択」の後、矩形領域を選び、CTRL-Cまたは「編集」→「コピー」により、テキストをコピーします。
つまり、セキュリティが解除された状態でPDFを開くことができるツールのようです。
これはある意味バグ?なのでは。。
xdoc2txtはdos窓のコマンドラインでないと動かないと思います。それに、少なくとも日本語のpdfでは、空白やタブが無視され、ベタのテキストになってしまいます。
pdf表示→画面コピーは解像度が低く、これまで試した限りでは、ocrでは満足する結果が出ていません。拡大表示すればよいのですが、手間がかかり過ぎて...
と、それぞれの問題点を説明しています。
アドセンス広告メイン
関連記事
-
-
GREE(グリー)を退会する方法【スマートフォン編】#2
1年以上前の記事です。内容が古い可能性があります。#1 | #2 | #3 こち …
-
-
募金額を通常より増やす裏技(見せ金作戦)
1年以上前の記事です。内容が古い可能性があります。僕も愛読しているちょっと変わっ …
-
-
WordPress(ワードプレス)でトップページ以外にブログトップを設置する方法【完全版】 #wp
1年以上前の記事です。内容が古い可能性があります。つぶくまブログの「←古い投稿」 …
-
-
パソコン教室で必ず教えること。
1年以上前の記事です。内容が古い可能性があります。昨日から新しい人が本格的に講習 …
-
-
「壁ドン」、「肩ズン」、「顎クイ」、「袖クル」、女性がときめくキュンとしてしまう男性の仕草
1年以上前の記事です。内容が古い可能性があります。今年は雑誌をもっと読もうと思い …
-
-
眠れない原因は足の裏にあった。眠れない人の足の裏の特徴とその解消法
1年以上前の記事です。内容が古い可能性があります。自分、最近は眠れないことは殆ど …
-
-
ツイッター(twitter)に同期された連絡先(電話帳)情報を削除する方法【パソコン編】
1年以上前の記事です。内容が古い可能性があります。たしかこれのFacebook版 …
-
-
失業中は働いちゃダメ(ブログもダメ)、仕事を探すことに専念しよう
1年以上前の記事です。内容が古い可能性があります。そろそろ溜まったネタを小出しに …
-
-
Googleリーダー代替のRSSリーダー「Feedly」で記事を古い順に表示させる方法
1年以上前の記事です。内容が古い可能性があります。RSSリーダー「Feedly」 …
-
-
殆どのスマホユーザーの個人情報はFacebookに握られている
そう、それがシャドープロファイルと言われているものです。
そして怖いのはこのシャドープロファイル、Facebookアカウントを作ったことのない人のものまで作られているとのことです。あるFacebookユーザーの連絡先にあなたの個人情報が書かれていたら注意。
その方がFacebookに連絡先へのアクセスを許可していたらあなたがFacebookをやっていなくてもアウトです。ではどうやったら防げるのか?
最近ではFacebookアプリがプリインストールされているスマホ(スマートフォン)も多いのでほぼ防ぐことは不可能でしょうね。つまり、
過去にFacebookのアカウントを作ったことがなく、Facebookを利用している人とアドレスなどの交換をしていないという場合のみ「あなたのシャドープロファイルは作られていません」
とのこと。
Facebookのアカウントを作ったことがない人は結構いるんじゃないかと思います。
ただ、Facebookを利用している人とアドレス交換をしていない人なんて殆どいないんじゃないでしょうか?
そもそも、その人がFacebookをやっているのかどうか調べてアドレス交換するなんてことできないでしょうし。。これから、こういった情報が一般的になってくると、自分のようにFacebookやってる感を前面に出している人なんかは逆に、嫌厭されてしまうような時代がきてしまうのかもしれません。
でもね。
結局は架空請求や先日被害にあった債権回収詐欺等、それを使う悪いやつがいなければ別に個人情報何ら問題ないんですよね。
だって、かつては電話帳(ハローページ)に普通に電話番号が載っていた時代があるんですから。
嫌な時代になっちゃいましたねぇ。。あとはFacebookの技術を信じて、そういった悪い輩に個人情報が流れないようにしてもらうしかないですね。
よく、「あとは神のみぞ知る」なんてこと言うことがありますが、Facebookもそういう意味では神の領域に入りつつあるのでしょうか?
人間が神の領域に足を踏み入れるとどうなってしまうのか? 注目して行きましょう。
- PREV
- ドコモ次世代も心配なし?
- NEXT
- 「グラン・ブルー(グレート・ブルー完全版)」のススメ








Comment
実際に、組織の展覧会は、通常、<タイトル="ナイキエアマックスskyblineは"href ="http://www.footcheap.com/nice-nike-air-max-skybline-shoes.htm 目標を持っている優秀な場所です= "_blank">ナイキエアマックスskybline a>の消費者。
大変参考になりました。
困っていたので、たすかりました。
ありがとうございました。
私が使用GTText(www.softocr.com)
それはまた、良いプログラムです。