首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >wget仅在每个文件夹中下载index.html

wget仅在每个文件夹中下载index.html
EN

Ask Ubuntu用户
提问于 2019-07-03 13:04:03
回答 2查看 11K关注 0票数 2

例如:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
wget -m https://www.kali.org

没有警告,没有错误;什么可能是错的?

更复杂的是,我使用了推荐的命令(参见下面的命令),输出并不令人满意(目前为止):

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
wget --recursive --no-clobber --page-requisites --html-extension --convert-links --domains=kali.org www.kali.org
Both --no-clobber and --convert-links were specified, only --convert-links will be used.
URL transformed to HTTPS due to an HSTS policy
--2019-07-04 14:13:38--  https://www.kali.org/
Resolving www.kali.org (www.kali.org)... 192.124.249.10
Connecting to www.kali.org (www.kali.org)|192.124.249.10|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 18714 (18K) [text/html]
Saving to: ‘www.kali.org/index.html.gz’

www.kali.org/index.html.gz      100%[=======================================================>]  18.28K  --.-KB/s    in 0.01s   

2019-07-04 14:13:38 (1.84 MB/s) - ‘www.kali.org/index.html.gz’ saved [18714/18714]

FINISHED --2019-07-04 14:13:38--
Total wall clock time: 0.3s
Downloaded: 1 files, 18K in 0.01s (1.84 MB/s)
Converting links in www.kali.org/index.html.gz... nothing to do.
Converted links in 1 files in 0 seconds.

但是..。镜像https://www.cnn.com -例如

Ubuntu19.04 代号: disco

有些页面作为“查看页面源”加载:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
<!doctype html>
<html lang="en">
<head>
  <meta charset="utf-8">
  <meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1">
  <meta name="viewport" content="initial-scale=1.0, maximum-scale=1.0" />
  <link href='./index.css' rel='stylesheet' type='text/css'>
  <title>crontab.guru - the cron schedule expression editor</title>
  <meta name="description" content="An easy to use editor for crontab schedules.">
  <meta name="google-site-verification" content="QPa8OWuMuIsXgvuvPdfSCxA4ewd2Gs5tTUh0k2crBPE" />
</head>
<body>
<a href="/"><h1>crontab guru</h1></a>
<div class="blurb">
  <div>The quick and simple editor for cron schedule expressions by <a href="https://cronitor.io?utm_source=crontabguru&utm_campaign=cronitor_top" title="Cron job monitoring and observability" rel="nofollow">Cronitor</a></div>
</div>
<div id="content">loading...</div>

树目录也没有下载。

Check after 4 years and now works fine.

EN

回答 2

Ask Ubuntu用户

发布于 2019-07-03 13:21:01

这是可行的,它将复制当地的网站。

如果这是您想要的,请使用如下命令(将domain.com更改为您想要的域):

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
wget --recursive --no-clobber --page-requisites --html-extension --convert-links --domains=domain.com domain.com
  • --recursive的意思是:下载整个网站。
  • --no-clobber的意思是:不要覆盖现有文件。
  • --page-requisites的意思是:下载页面的所有组件,包括图像。
  • --html-extension的意思是:将页面保存为.html文件。
  • --convert-links的意思是:将所有链接转换为本地运行。离线。
  • --domains=domain.com的意思是:不要遵循此域之外的链接。

通知

有些web服务器对服务页面使用压缩,wget将下载压缩文件index.html.gz,如下所示:

2019-07-04 14:13:38 (1.84 MB/s) -‘domain.com/index.html.gz’保存的18714/18714

在这种情况下,wget需要一个额外的选项--compression=auto--compression=gzip来在本地正确处理和解压缩页面。您可以这样使用这个选项的命令(将domain.com更改为您想要的域):

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
wget --compression=auto --recursive --no-clobber --page-requisites --html-extension --convert-links --domains=domain.com domain.com

欲进一步阅读,请参阅Wget -非交互式网络下载器

票数 2
EN

Ask Ubuntu用户

发布于 2020-04-11 12:50:31

我也有同样的问题。

尝试以下命令:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
wget --wait 1 -x -H -mk http://site.to.mirror/
票数 -2
EN
页面原文内容由Ask Ubuntu提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://askubuntu.com/questions/1155764

复制
相关文章
wget下载JDK
解决办法: 在chrome下,打开开发者工具(本人用的mac版本),点击所需要下载的包,看console->logs会看到一行字:
IT小马哥
2020/03/18
6.1K2
[Linux]wget 下载JDK
Oracle 收购Java之后什么都变了。嗯,不多说,先来解决我们的问题,很多时候,我们需要使用Linux 并且openjdk没办法提供某些特性,只能安装官方JDK来解决。但是服务器在国外,没办法你本地下载了再上传,或者带宽非常小,你下载了上传需要传几个小时。那么这时候wget直接在服务器上下载就很有用了。
用户2353021
2020/05/11
1.7K0
[Linux]wget 下载JDK
MODIS数据wget下载[通俗易懂]
订单完成后,点开Download后面的网页,点击页面上方的See wget Download Command,复制其下方以“wget”开头的内容。
全栈程序员站长
2022/09/02
9650
linux wget 整站下载
linux wget 整站下载 wget -r -p -np -k -nc -c  http://downloads.openwrt.org/snapshots/trunk/oxnas/ -r,  –recursive(递归)          specify recursive download.(指定递归下载) -k,  –convert-links(转换链接)      make links in downloaded HTML point to local files.(将下载的HTML页
qinyang
2018/06/05
8.1K0
python wget下载文件
-P PREFIX 将文件保存在目录(--directory-prefix=PREFIX)
py3study
2020/01/09
5.4K0
Wget 大法wget 指定路径,指定文件名下载
图片 今天用到了Wget,突然一时间想不起来wget的下载到指定目录是哪个参数了,特地把所有参数都弄来,以防又忘记了。毕竟脚本是写了之后,半年都不用改,坑! 有
用户2353021
2020/05/09
10.2K0
python使用wget下载网络文件
wget是一个从网络上自动下载文件的自由工具。它支持HTTP,HTTPS和FTP协议,可以使用HTTP代理。
py3study
2020/01/08
2.5K0
wget 批量下载文件
Linux 下使用wget批量下载文件: 方法一 wget 的 -i 参数支持下载本地或外部 FILE 中的 URLs,所以需要在Linux批量下载文件时,可将多个URL写入到一个文件中,然后使用下列命令下载这些URL对应对应资源 root@SH-Web /tmp # cat urlsfiles.txt https://www.clhuang.cn/upload/2020/07/image-7f609af751664f4486a910f54a526239-thumbnail.png https://www.
大大大黑白格子
2020/07/14
5.4K0
linux中wget并行下载文件的几种姿势
wget可以下载文件。一般使用可以同时下载一个文件,某些时候我们需要下载多个文件,这个时候为了节约时间就需要并行下载文件 使用wget下载文件 使用wget下载文件相当简单: > wget https://rumenz.com/static/v/v.mp4 这样运行一次只能下载一个文件。 不过我们可以用 shell 脚本来在一个命令中下载多个文件: #!/bin/bash while read file; do wget ${file} done < rumenz.txt rumenz.txt包
入门笔记
2022/06/02
4K0
shell命令:wget下载文件
命令格式: wget [参数] [URL地址] 实例1:使用wget下载单个文件 wget https://github.com/stedolan/jq/releases/download/jq-1.
小黑同学
2021/12/06
2.4K1
wget下载出现错误 403:Forbidden
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/119548.html原文链接:https://javaforall.cn
全栈程序员站长
2022/07/11
4.4K0
wget下载提示:无法建立SSL连接
这是因为wget在使用HTTPS协议时,默认会去验证网站的证书,而这个证书验证经常会失败。加上"–no-check-certificate"选项,就能排除掉这个错误。
一写代码就开心
2022/05/09
3.4K0
wget下载提示:无法建立SSL连接
Linux下载工具wget使用
wget http://www.minjieren.com/wordpress-3.1-zh_CN.zip 
kl博主
2023/11/18
2830
wget命令详解——批量下载等
(1)支持断点下传功能 (2)同时支持FTP和HTTP下载方式 (3)支持代理服务器 (4)设置方便简单 (5)程序小,完全免费 wget虽然功能强大,但是使用起来还是比较简单的,基本的语法是:wget [参数列表] URL。下面就结合具体的例子来说明一下wget的用法。 1、下载整个http或者ftp站点。
Qicloud
2022/01/28
12.8K0
Linux下载工具wget与curl
wget是一个专门用于从网络上下载文件的命令行工具。它支持HTTP、HTTPS和FTP等多种协议,能够自动处理下载中断,并且支持递归下载整个网站的内容。
久绊A
2025/02/18
1950
Linux使用wget命令下载网络资源
之前接触的Linux环境大多是内网,一般都是采用传统的FTP服务器统一存放常用资源,有人需要时从FTP直接下载,若公司FTP没有想要的资源,还需联系管理维护人员下载上传对应的介质。 而目前随着云ECS的普及,很多环境具备了直接连接外网的条件,我们可以使用wget命令直接从网络下载所需资源。 比如,可以用下面的命令直接下载redis-3.2.10.tar.gz这个介质:
Alfred Zhao
2020/04/23
2.2K0
在Linux及多种系统中安装Wget网络下载器
Wget是由GNU项目开发的网络下载器工具,用于从Web或FTP服务器检索或下载文件 。
用户7639835
2021/08/27
4.1K0
centos7安装wget命令_centos中wget
由于安装的centos是mini版,并且自带的软件源里也没有wget命令,只好自己下载了。
全栈程序员站长
2022/11/07
6.3K0
linux 下wget下载条不动了
如果用了ctrl+c就是直接结束,因为wget是单线程的。 2.用 wget -c url 重新下载
kirin
2020/05/09
5.2K0
Debian或Ubuntun wget下载证书无法验证
Debian或Ubuntun wget下载证书无法验证,出现如下类似错误: ERROR: cannot verify URL’s certificate, issued …….’: Unable to locally verify the issuer’s authority. 解决方案:1.增加下载附件参数 –no-check-certificate 2.更新安装根证书 $ sudo apt-get install ca-certificates 原创文章转载请注明:转载自:Debian或Ubuntun
Zach
2018/06/21
3K0

相似问题

如何允许wget递归下载整个目录而不是"index.html“文件

10

用wget下载

20

指定wget下载到

20

wget下载Ubuntu Repo

10

wget无法下载映像

20
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文