GNU/Linux >> Linux の 問題 >  >> Linux

複数のpdfファイルの内容を検索するには?

Recoll は、PDF を含む数十の異なる形式をサポートする Unix/Linux 用の素晴らしい全文 GUI 検索アプリケーションです。クエリの正確なページ番号と検索用語をドキュメント ビューアーに渡すこともできるため、GUI から直接結果にジャンプできます。

Recoll には、実行可能なコマンドライン インターフェイスと Web ブラウザー インターフェイスも付属しています。


pdfgrep があり、その名前が示すとおりです。

pdfgrep -R 'a pattern to search recursively from path' /some/path

単純な検索に使用しましたが、問題なく動作しました。

(Debian、Ubuntu、Fedora にパッケージがあります。)

バージョン 1.3.0 以降、pdfgrep は再帰検索をサポートしています。このバージョンは、Ubuntu 12.10 (Quantal) 以降の Ubuntu で利用できます。


ディストリビューションは pdftotext というユーティリティを提供する必要があります :

find /path -name '*.pdf' -exec sh -c 'pdftotext "{}" - | grep --with-filename --label="{}" --color "your pattern"' \;

「-」は、pdftotext をファイルではなく stdout に出力するために必要です。--with-filename--label= options は grep の出力にファイル名を入れます。オプションの --color flag は便利で、端末で色を使用して出力するように grep に指示します。

(Ubuntu では pdftotext パッケージ xpdf-utils によって提供されます または poppler-utils .)

pdftotext を使用したこのメソッド と greppdfgrepよりも有利です GNU grep の機能を使いたい場合 その pdfgrep サポートしません。 注意 :pdfgrep-1.3.x は -C をサポートします コンテキスト行を印刷するためのオプション。


Linux
  1. Linuxで複数のファイルを圧縮する方法

  2. PDFファイルをgrepする方法は?

  3. 検索を使用して複数のファイルの名前を変更するにはどうすればよいですか?

  1. シェル内の複数のファイルにパイプしますか?

  2. ファイル内の複数の文字列を見つける方法は??

  3. 複数のファイルの内容を 1 つのファイルに追加する方法

  1. Linuxで圧縮ファイルの内容を表示する方法

  2. Grepコマンドを使用してファイル内のテキストを検索する方法

  3. Ubuntuでファイルを見つける方法は?