GNU/Linux >> Linux の 問題 >  >> Linux

PDFからグラフを抽出しますか?

たくさんのPDFファイルから画像を抽出してウェブサイトに表示する必要がある状況があります。私のPDFには、「通常の」画像とたくさんのグラフがあります。

私はpdf2xmlを使用し、jpeg、ppm、pbm、vec形式で画像を引き出します。 「通常の」画像が(ほとんどの場合)jpeg / ppm / pbmとして抽出されているのがわかりますが、グラフが表示されていないので、pdf2xmlがそれらを.vecファイルとして保存していると思います。

だから問題は、グラフを取得する方法ですか? convertを使用しました .vecをjpeg/pngなどに変換するためのimagemagickが付属していますが、役に立ちません。

承認された回答:

pdf2xmlを試したことはありませんが、SourceForgeでそのファイルを参照すると、vec2svg-2.pyが見つかりました。これは、.vecファイルを.svgに変換するPythonスクリプトのようです。 SVGを必要な形式に変換するのに問題はありません。

python vec2svg-2.py -i file.vec -o file.svg

Linux
  1. Dockerイメージからファイルを抽出しますか?

  2. カメラからの写真転送の問題?

  3. ファイル内から単一のバイト チャンクを抽出するにはどうすればよいですか?

  1. ping -c から平均時間を抽出する

  2. コマンドラインでGoogleから画像をダウンロードする.

  3. LinuxでPDFからOCRでテキストを抽出するには?

  1. 巨大な tgz ファイルから単一のファイルを抽出する

  2. コマンド ライン:出力から部分文字列を抽出する

  3. /etc/shadow から日付を抽出する