たくさんのPDFファイルから画像を抽出してウェブサイトに表示する必要がある状況があります。私のPDFには、「通常の」画像とたくさんのグラフがあります。
私はpdf2xmlを使用し、jpeg、ppm、pbm、vec形式で画像を引き出します。 「通常の」画像が(ほとんどの場合)jpeg / ppm / pbmとして抽出されているのがわかりますが、グラフが表示されていないので、pdf2xmlがそれらを.vecファイルとして保存していると思います。
だから問題は、グラフを取得する方法ですか? convert
を使用しました .vecをjpeg/pngなどに変換するためのimagemagickが付属していますが、役に立ちません。
承認された回答:
pdf2xmlを試したことはありませんが、SourceForgeでそのファイルを参照すると、vec2svg-2.pyが見つかりました。これは、.vecファイルを.svgに変換するPythonスクリプトのようです。 SVGを必要な形式に変換するのに問題はありません。
python vec2svg-2.py -i file.vec -o file.svg