GNU/Linux >> Linux の 問題 >  >> Linux

PDF 内のすべてのテキストをラスタライズするにはどうすればよいですか?

画像ベースの PDF も汚染されているかどうかをテストできます。最初に PDF を (マルチページ) TIFF に変換します。ゴーストスクリプトで:

gs -sDEVICE=tiffg4 -o sample.tif sample.pdf

次に、TIFF を PDF に変換します。例:

tiff2pdf -z -f -F -pA4 -o sample-img.pdf sample.tif

これにより、ページがテキストではなく画像である PDF ファイルが生成されます。

または、システムが TIFF ファイルの印刷をサポートしている場合は、直接印刷してみてください。

pdf2ps のオプションもあります PDF を PS に変換するためのもので、動作する場合はこれが望ましいでしょう。


Linux
  1. システム上のすべてのSubversionリポジトリを見つける方法は?

  2. Linux ですべてのスパース ファイルを見つける方法

  3. フォルダー階層内の個別のファイル拡張子をすべて見つけるにはどうすればよいですか?

  1. Linuxでpostscriptまたはpdfファイルの各ページの下部にフッターを追加するにはどうすればよいですか?

  2. Pythonのmatplotlibで「バックエンド」を設定するにはどうすればよいですか?

  3. nginx ですべての仮想ホストを一覧表示するにはどうすればよいですか

  1. できればターミナルを使用して、接続されたネットワーク内のすべての IP を一覧表示するにはどうすればよいですか?

  2. Linuxのviでfindによって返されたすべてのファイルを編集するにはどうすればよいですか?

  3. ディレクトリ(およびそのサブディレクトリ)内のすべてのpdfファイルを単一の出力ディレクトリに再帰的にコピーするにはどうすればよいですか?