腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
wget
未
使用
镜像
跟踪
链接
我在试着半
镜像
一个网站。我想要的是下载所有的MP3s,并确保我没有重新下载我已经拥有的那些(因此是“
镜像
”部分)。我输入了以下内容:它会下载当前页面上的所有它从来不会跟随
链接
到“下一页”或类似的
链接
。我已经用-N -c -r替换了-m,但没有成功。我还可以
使用
哪些其他选
浏览 6
提问于2018-02-22
得票数 2
1
回答
无法恢复"
wget
--
镜像
“(-c -F -B,无益)
我用"
wget
-
镜像
站点名“启动了
wget
镜像
,它运行良好,但意外地中断了这个过程。 我确实希望
wget
读取它已经下载的文件,并
跟踪
这些文件中的
链接
。上面的第一点我可以
使用
"-nc“,但我似乎不能强迫
wget<
浏览 7
提问于2012-10-26
得票数 21
1
回答
使用
Wget
只关注某些
链接
,但从这些
链接
下载每个主机
所以,假设我想用
Wget
镜像
一个站点。我希望
wget
能够
跟踪
并下载来自或的所有
链接
。我该怎么做呢?我尝试了这个命令,但是它似乎没有按照我想要的方式工作。
wget
-r --mirror -I '/example' -H -D'example.example.com' 'https://www.example.com/'
浏览 0
提问于2018-08-22
得票数 1
2
回答
使用
wget
镜像
站点并下载静态媒体
我想用
wget
镜像
一个站点,并将所有
链接
转换到我下载的本地副本。到目前为止,这很简单,我要做的就是
wget
-mk http://site.com 但是,所有的静态媒体都位于不同的域中,如果我
使用
-H选项
跟踪
所有外国主机,它将下载该静态媒体文件,但它也将下载任何外部
链接
的其他文件
浏览 0
提问于2010-02-25
得票数 2
2
回答
带有热
链接
要求的递归
wget
我经常用
wget
来
镜像
非常大的网站。包含热
链接
内容(无论是图像、视频、css、js)的站点都会造成问题,因为我似乎无法指定
wget
来获取其他主机上的页面需求,如果没有爬行器也可以
跟踪
到其他主机的超
链接
。例如,让我们看看这个页面^^获取除热
链接
图像以外的所有内容。我知
浏览 2
提问于2012-10-17
得票数 1
回答已采纳
1
回答
当
使用
--
镜像
时,
wget
跳过index.html以不以斜杠结尾的
链接
。
我
使用
wget
--
镜像
--转换--
链接
镜像
一个网站,我发现当站点包含一个子目录的
链接
时,如下所示:它将在web浏览器中显示subdir/index.html的内容,
wget
正在获取index.html中
链接
到的文档,而不是index.html本身。如果我将
链接
更改为:然后,
浏览 0
提问于2021-01-13
得票数 1
2
回答
在UNIX上创建网页的静态副本命令行/ shell脚本
、
、
、
、
我需要创建一个网页的静态副本(所有媒体资源,如CSS,图片和JS包括)在一个外壳脚本。此副本应在任何浏览器中脱机打开。有什么方法可以在Linux命令行上完成并自动将其转换为给定的URL?
浏览 31
提问于2013-04-06
得票数 2
3
回答
从网页下载所有媒体文件
、
、
任何应用程序都是可以接受的,但
wget
更可取。
浏览 0
提问于2015-07-10
得票数 4
回答已采纳
1
回答
如何
使用
浏览器
镜像
/下载完整的网站?
、
、
使用
wget
,您可以
镜像
完整的网站:
wget
-
镜像
-转换-
链接
-调整-扩展-页面-必需品网站。 有没有类似的方法来
使用
火狐或Chromium这样的浏览器并下载完整的网站(也许需要一些脚本)?或者,如果我单击一个
链接
,我将被重定向到该
链接
的本地版本。
浏览 0
提问于2018-10-24
得票数 -2
1
回答
你能用
Wget
创建干净的URL吗?
、
我试图用干净的URL创建WordPress站点的
镜像
(即而不是)。当
Wget
镜像
站点时,它为所有页面和
链接
提供一个".html“扩展(即)。是否可以为
Wget
设置选项来创建一个干净的URL结构,这样对应于页面"http:example.org/foo“的
镜像
文件将是"/foo/index.html”,到该页面的
链接
将是"http:example.org
浏览 1
提问于2014-05-10
得票数 1
回答已采纳
2
回答
wget
“
镜像
”pdf
链接
到不同的域
、
、
、
、
我可以
使用
wget
直接下载pdf,但似乎无法确定正确的
wget
命令行选项,以“
镜像
”网页,包括这个
链接
的pdf。我尝试
使用
以下选项的组合
wget
(或其他命令行工具)可以用来下载
链接
的pdf-s吗? 谢谢
浏览 4
提问于2011-09-21
得票数 1
回答已采纳
1
回答
如何
使用
wget
下载php?
、
我访问了php网站,并尝试
使用
wget
(来自ssh)下载最新的php。但似乎没有任何直接联系,只有镜子。 当我
使用
镜像
链接
下载时,它只创建一个名为
镜像
的文件。
浏览 0
提问于2011-01-19
得票数 0
回答已采纳
2
回答
在nginx中查看带问号的文件
、
、
我有一些
使用
wget
镜像
一些页面的代码,其中一些
镜像
的页面是像"“这样的
链接
。
wget
最终将这些页面保存为"somepage.php?id=1234.html”。我尝试将"autoindex on;“添加到该目录的配置中,以确保文件名正确,当我访问包含该页面的目录时,我单击了nginx生成的
链接
,但仍然得到404。
浏览 0
提问于2011-11-20
得票数 3
回答已采纳
4
回答
如何在不创建父目录的情况下
镜像
wget
目录?
、
、
、
我想通过FTP
镜像
一个文件夹,如下所示:
wget
--mirror --user=x --password=x ftp://ftp.site.com/folder/subfolder/evendeeper我知道-np选项,根据这些文档,它无法
跟踪
到父页面的
链接
(对于我通过FTP
镜像
的二进制文件来说,这是一个不存在的问题)。我会考虑选择,只要它们是基于命令行的,随时可用的Ubuntu软件包和易于自动化的
wget
。
浏览 3
提问于2011-02-18
得票数 62
回答已采纳
1
回答
我怎样才能穿越所有的符号
链接
呢?
、
、
、
问题背景 我试图备份/
镜像
所有的,并且有数以千计的符号/硬
链接
到其他文件夹和服务器。我试过
使用
wget
-N
浏览 2
提问于2017-03-04
得票数 0
回答已采纳
1
回答
在WebClient请求(Powershell)期间发生异常
我试图
使用
Powershell从我们的HTTP服务器复制目录文件夹,我想将它的全部内容(包括子文件夹)复制到当前服务器的本地驱动器中。System.Net.WebClient当我以管理员身份运行Powershell ISE中的脚本时,我会得到错误消息
使用
浏览 0
提问于2018-01-04
得票数 0
3
回答
创建http://nodejs.org/dist的专用
镜像
、
、
、
我希望创建nodejs.org的代理或本地
镜像
,以提高速度和支持构建的可重复性。Sonatype Nexus失败了,因为nodejs.org/dist并不完全是NPM
wget
-
镜像
-转换-
链接
-调整-扩展-页-必要条件-无父 如果你有什么建议
浏览 9
提问于2015-04-22
得票数 2
回答已采纳
1
回答
如何从未
链接
的网站下载页面?
我正在尝试
使用
wget
镜像
整个网站"citypaper.com“,它首先要做的就是下载index.html并停止。然后我找到了解决方案:
wget
-r -p -e robots=off 现在可以下载
链接
到index.html的页面以及
链接
到这些页面,依此类推……问题是有数以千计的页面实际上不再在这些页面上。有没有办法让
wget
也下载这些页面?
浏览 0
提问于2017-11-02
得票数 0
2
回答
跟踪
重定向
、
、
、
我试图递归
镜像
网页,从用户提供的URL开始(当然有深度限制集)。
Wget
没有捕获来自css/js的
链接
,所以我决定
使用
。/a "+*"<a HREF="onet.pl/index.html" >Page has moved</a> 没别的了是否有任何方法使to
跟踪
后重定向?目前,我只是将"ww
浏览 10
提问于2012-08-11
得票数 4
回答已采纳
3
回答
如何
使用
wget
(带有mk选项)来
镜像
站点及其外部
链接
的
镜像
?
、
、
我知道
wget
-mkp 可以
镜像
一个站点及其所有内部
链接
的文件。谢谢!
浏览 1
提问于2011-03-09
得票数 3
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券