DTPの編集作業を効率化! WordやPDFからテキストを取り出す「xdoc2txt」

  • 公開:
  • 更新:
  • 制作/編集:

 DTPの編集作業ではお客様の入力したテキストファイルをQuarkXPressIllustratorInDesignの文字ボックスに流し込むという作業があるかと思います。

 通常のプレーンテキスト形式の状態なら問題はあまりないかと思いますが(※1)、原稿のファイル形式がWord・Excel・PowerPoint・一太郎・PDFだったりすると、Wordや一太郎やAcrobatを持っていない場合、どうやってテキストを抜き出すかが問題になります。特にPowerPointは普通はあまり持っていないですよね。

 特にWordは、文字ボックスを作って文字を入力してある場合は、単純に「編集」→「すべてを選択」→「コピー」ではうまく選択されずに、テキストを取り出すのも大変です。

 そんなときには「xdoc2txt」というソフトウェアがおすすめです。Windows用のソフトウェアですが、Wordや一太郎などは必要ありません。「xdoc2txt」だけでテキストの抜き出しが可能になります。(※2)

 コマンドラインで動作するソフトウェアなのでちょっと取り付きづらいところもありますが、Wordのファイルを置いてあるフォルダにコマンドラインで移動して「xdoc2txt -f *.doc」とすれば自動的にテキストファイルに変換してくれます。ファイルを開く必要もありませんし、変換も非常に高速です。

 「xdoc2txt」を使って編集作業を効率よく進めましょう!


xdoc2txt

http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html

(※1)機種依存文字「○の中に1」など。

(※2)PDFの場合、PDFの作成方法によっては「ABCDEFG…」といった文字になる場合もあります。(PDFの仕様です)