http://ccachicago.org
を再帰的にダウンロードしようとしています 、ルートindex.html
という1つのファイルだけを取得しています 、ダウンロード。
私はwgetを使用して再帰的にダウンロードを確認し、推奨される-e robots=off
の使用を開始しました。 、ただし、それでも同じように動作します。
どのように、wget
で または他のツールで、サイトのコピーをダウンロードできますか?
承認された回答:
あなたはwget
に質問しています 再帰的を実行するには http://ccachicago.org
のダウンロード 、ただし、このURLは直接的なコンテンツを提供しません。代わりに、http://www.ccachicago.org
にリダイレクトするだけです。 (wget
には伝えていません 再帰的にフェッチする)。
wget
と言うと 正しいURLをダウンロードするには、次のように機能します。
wget -r -e robots=off http://www....