文章/答案/技术大牛

发布

社区首页 >问答首页 >wget仅在每个文件夹中下载index.html

问wget仅在每个文件夹中下载index.html
EN

Ask Ubuntu用户

提问于 2019-07-03 13:04:03

回答 2查看 11K关注 0票数 2

例如：

wget -m https://www.kali.org

没有警告，没有错误；什么可能是错的？

更复杂的是，我使用了推荐的命令(参见下面的命令)，输出并不令人满意(目前为止)：

wget --recursive --no-clobber --page-requisites --html-extension --convert-links --domains=kali.org www.kali.org
Both --no-clobber and --convert-links were specified, only --convert-links will be used.
URL transformed to HTTPS due to an HSTS policy
--2019-07-04 14:13:38--  https://www.kali.org/
Resolving www.kali.org (www.kali.org)... 192.124.249.10
Connecting to www.kali.org (www.kali.org)|192.124.249.10|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 18714 (18K) [text/html]
Saving to: ‘www.kali.org/index.html.gz’

www.kali.org/index.html.gz      100%[=======================================================>]  18.28K  --.-KB/s    in 0.01s   

2019-07-04 14:13:38 (1.84 MB/s) - ‘www.kali.org/index.html.gz’ saved [18714/18714]

FINISHED --2019-07-04 14:13:38--
Total wall clock time: 0.3s
Downloaded: 1 files, 18K in 0.01s (1.84 MB/s)
Converting links in www.kali.org/index.html.gz... nothing to do.
Converted links in 1 files in 0 seconds.

但是..。镜像https://www.cnn.com -例如

Ubuntu19.04 代号: disco

有些页面作为“查看页面源”加载：

<!doctype html>
<html lang="en">
<head>
  <meta charset="utf-8">
  <meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1">
  <meta name="viewport" content="initial-scale=1.0, maximum-scale=1.0" />
  <link href='./index.css' rel='stylesheet' type='text/css'>
  <title>crontab.guru - the cron schedule expression editor</title>
  <meta name="description" content="An easy to use editor for crontab schedules.">
  <meta name="google-site-verification" content="QPa8OWuMuIsXgvuvPdfSCxA4ewd2Gs5tTUh0k2crBPE" />
</head>
<body>
<a href="/"><h1>crontab guru</h1></a>
<div class="blurb">
  <div>The quick and simple editor for cron schedule expressions by <a href="https://cronitor.io?utm_source=crontabguru&utm_campaign=cronitor_top" title="Cron job monitoring and observability" rel="nofollow">Cronitor</a></div>
</div>
<div id="content">loading...</div>

树目录也没有下载。

Check after 4 years and now works fine.

wget

回答 2

Ask Ubuntu用户

发布于 2019-07-03 13:21:01

这是可行的，它将复制当地的网站。

如果这是您想要的，请使用如下命令(将domain.com更改为您想要的域)：

wget --recursive --no-clobber --page-requisites --html-extension --convert-links --domains=domain.com domain.com

--recursive的意思是:下载整个网站。
--no-clobber的意思是:不要覆盖现有文件。
--page-requisites的意思是:下载页面的所有组件，包括图像。
--html-extension的意思是:将页面保存为.html文件。
--convert-links的意思是:将所有链接转换为本地运行。离线。
--domains=domain.com的意思是:不要遵循此域之外的链接。

通知

有些web服务器对服务页面使用压缩，wget将下载压缩文件index.html.gz，如下所示：

2019-07-04 14:13:38 (1.84 MB/s) -‘domain.com/index.html.gz’保存的18714/18714

在这种情况下，wget需要一个额外的选项--compression=auto或--compression=gzip来在本地正确处理和解压缩页面。您可以这样使用这个选项的命令(将domain.com更改为您想要的域)：

wget --compression=auto --recursive --no-clobber --page-requisites --html-extension --convert-links --domains=domain.com domain.com

欲进一步阅读，请参阅Wget -非交互式网络下载器

票数 2

Ask Ubuntu用户

发布于 2020-04-11 12:50:31

我也有同样的问题。

尝试以下命令：

wget --wait 1 -x -H -mk http://site.to.mirror/

票数 -2

页面原文内容由Ask Ubuntu提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://askubuntu.com/questions/1155764

复制

wget下载JDK

jdk chrome cookie mac wget

解决办法：在chrome下，打开开发者工具（本人用的mac版本），点击所需要下载的包，看console->logs会看到一行字：

IT小马哥

2020/03/18

6.1K2

[Linux]wget 下载JDK

oracle jdk

Oracle 收购Java之后什么都变了。嗯，不多说，先来解决我们的问题，很多时候，我们需要使用Linux 并且openjdk没办法提供某些特性，只能安装官方JDK来解决。但是服务器在国外，没办法你本地下载了再上传，或者带宽非常小，你下载了上传需要传几个小时。那么这时候wget直接在服务器上下载就很有用了。

用户2353021

2020/05/11

1.7K0

MODIS数据wget下载[通俗易懂]

命令行工具 https 网络安全 java html

订单完成后，点开Download后面的网页，点击页面上方的See wget Download Command，复制其下方以“wget”开头的内容。

全栈程序员站长

2022/09/02

9650

linux wget 整站下载

linux

linux wget 整站下载 wget -r -p -np -k -nc -c http://downloads.openwrt.org/snapshots/trunk/oxnas/ -r, –recursive（递归） specify recursive download.（指定递归下载） -k, –convert-links（转换链接） make links in downloaded HTML point to local files.（将下载的HTML页

qinyang

2018/06/05

8.1K0

python wget下载文件

http https php 编程算法 ftp

-P PREFIX 将文件保存在目录(--directory-prefix=PREFIX)

py3study

2020/01/09

5.4K0

Wget 大法wget 指定路径，指定文件名下载

编程算法 php 网络安全 http html

图片今天用到了Wget，突然一时间想不起来wget的下载到指定目录是哪个参数了，特地把所有参数都弄来，以防又忘记了。毕竟脚本是写了之后，半年都不用改，坑！有

用户2353021

2020/05/09

10.2K0

python使用wget下载网络文件

http python

wget是一个从网络上自动下载文件的自由工具。它支持HTTP，HTTPS和FTP协议，可以使用HTTP代理。

py3study

2020/01/08

2.5K0

wget 批量下载文件

php linux

Linux 下使用wget批量下载文件：方法一 wget 的 -i 参数支持下载本地或外部 FILE 中的 URLs，所以需要在Linux批量下载文件时，可将多个URL写入到一个文件中，然后使用下列命令下载这些URL对应对应资源 root@SH-Web /tmp # cat urlsfiles.txt https://www.clhuang.cn/upload/2020/07/image-7f609af751664f4486a910f54a526239-thumbnail.png https://www.

大大大黑白格子

2020/07/14

5.4K0

linux中wget并行下载文件的几种姿势

shell unix

wget可以下载文件。一般使用可以同时下载一个文件，某些时候我们需要下载多个文件,这个时候为了节约时间就需要并行下载文件使用wget下载文件使用wget下载文件相当简单： > wget https://rumenz.com/static/v/v.mp4 这样运行一次只能下载一个文件。不过我们可以用 shell 脚本来在一个命令中下载多个文件： #!/bin/bash while read file; do wget ${file} done < rumenz.txt rumenz.txt包

入门笔记

2022/06/02

4K0

shell命令：wget下载文件

wget 后台

命令格式： wget [参数] [URL地址] 实例1：使用wget下载单个文件 wget https://github.com/stedolan/jq/releases/download/jq-1.

小黑同学

2021/12/06

2.4K1

wget下载出现错误 403：Forbidden

java https 网络安全

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/119548.html原文链接：https://javaforall.cn

全栈程序员站长

2022/07/11

4.4K0

wget下载提示：无法建立SSL连接

https

这是因为wget在使用HTTPS协议时，默认会去验证网站的证书，而这个证书验证经常会失败。加上"–no-check-certificate"选项，就能排除掉这个错误。

一写代码就开心

2022/05/09

3.4K0

Linux下载工具wget使用

linux wget 代理递归软件

wget http://www.minjieren.com/wordpress-3.1-zh_CN.zip

kl博主

2023/11/18

2830

wget命令详解——批量下载等

对象存储网络安全 http ftp php

（1）支持断点下传功能（2）同时支持FTP和HTTP下载方式（3）支持代理服务器（4）设置方便简单（5）程序小，完全免费 wget虽然功能强大，但是使用起来还是比较简单的，基本的语法是：wget [参数列表] URL。下面就结合具体的例子来说明一下wget的用法。 1、下载整个http或者ftp站点。

Qicloud

2022/01/28

12.8K0

Linux下载工具wget与curl

linux

wget是一个专门用于从网络上下载文件的命令行工具。它支持HTTP、HTTPS和FTP等多种协议，能够自动处理下载中断，并且支持递归下载整个网站的内容。

久绊A

2025/02/18

1950

Linux使用wget命令下载网络资源

ftp 网络安全 linux DNS 解析 DNSPod dns

之前接触的Linux环境大多是内网，一般都是采用传统的FTP服务器统一存放常用资源，有人需要时从FTP直接下载，若公司FTP没有想要的资源，还需联系管理维护人员下载上传对应的介质。而目前随着云ECS的普及，很多环境具备了直接连接外网的条件，我们可以使用wget命令直接从网络下载所需资源。比如，可以用下面的命令直接下载redis-3.2.10.tar.gz这个介质：

Alfred Zhao

2020/04/23

2.2K0

在Linux及多种系统中安装Wget网络下载器

centos ubuntu linux ftp ssh

Wget是由GNU项目开发的网络下载器工具，用于从Web或FTP服务器检索或下载文件。

用户7639835

2021/08/27

4.1K0

centos7安装wget命令_centos中wget

centos linux https 网络安全 ftp

由于安装的centos是mini版，并且自带的软件源里也没有wget命令，只好自己下载了。

全栈程序员站长

2022/11/07

6.3K0

linux 下wget下载条不动了

url wget

如果用了ctrl+c就是直接结束，因为wget是单线程的。 2.用 wget -c url 重新下载

kirin

2020/05/09

5.2K0

Debian或Ubuntun wget下载证书无法验证

其他

Debian或Ubuntun wget下载证书无法验证，出现如下类似错误： ERROR: cannot verify URL’s certificate, issued …….’: Unable to locally verify the issuer’s authority. 解决方案：1.增加下载附件参数 –no-check-certificate 2.更新安装根证书 $ sudo apt-get install ca-certificates 原创文章转载请注明：转载自：Debian或Ubuntun

Zach

2018/06/21

3K0

相似问题

如何允许wget递归下载整个目录而不是"index.html“文件

用wget下载

指定wget下载到

wget下载Ubuntu Repo

wget无法下载映像

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问wget仅在每个文件夹中下载index.html
EN

回答 2

Ask Ubuntu用户

通知

Ask Ubuntu用户

如何允许wget递归下载整个目录而不是"index.html“文件

用wget下载

指定wget下载到

wget下载Ubuntu Repo

wget无法下载映像

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问wget仅在每个文件夹中下载index.htmlEN

回答 2

Ask Ubuntu用户

通知

Ask Ubuntu用户

如何允许wget递归下载整个目录而不是"index.html“文件

用wget下载

指定wget下载到

wget下载Ubuntu Repo

wget无法下载映像

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问wget仅在每个文件夹中下载index.html
EN