如何使用wget并从网站获取所有文件?...我需要除HTML,PHP,ASP等网页文件外的所有文件
要筛选特定的文件扩展名:
wget -A pdf,jpg -m -p -E -k -K -np http://site/path/
或者,如果您更喜欢长选项名称...所有使用-k , -K , -E等选项的答案可能都没有真正理解这个问题,比如重写HTML页面来创build本地结构,重命名.php文件等等。 不相关。...要从字面上获取除 .html 之外的所有文件:
wget -R html,htm,php,asp,jsp,js,py,css -r -l 1 -nd http://yoursite.com
你可以尝试...,或只拒绝特定的扩展名:
-R html,htm,asp,php
或排除特定的区域:
-X "search*,forum*"
如果机器人(例如search引擎)忽略这些文件,则还必须添加: -e