http://ccachicago.orgを再帰的にダウンロードしようとしています 、ルートindex.htmlという1つのファイルだけを取得しています 、ダウンロード。
私はwgetを使用して再帰的にダウンロードを確認し、推奨される-e robots=offの使用を開始しました。 、ただし、それでも同じように動作します。
どのように、wgetで または他のツールで、サイトのコピーをダウンロードできますか?
承認された回答:
あなたはwgetに質問しています 再帰的を実行するには http://ccachicago.orgのダウンロード 、ただし、このURLは直接的なコンテンツを提供しません。代わりに、http://www.ccachicago.orgにリダイレクトするだけです。 (wgetには伝えていません 再帰的にフェッチする)。
wgetと言うと 正しいURLをダウンロードするには、次のように機能します。
wget -r -e robots=off http://www....