奇怪的410 http gone使用python urllib不能在wget中重现 - 腾讯云开发者社区

文章/答案/技术大牛

发布

urllib与urllib2的学习总结(python2.7.X)

先啰嗦一句，我使用的版本是python2.7，没有使用3.X的原因是我觉得2.7的扩展比较多，且较之前的版本变化不大，使用顺手。3.X简直就是革命性的变化，用的蹩手。...urllib2支持许多的“URL schemes”（由URL中的“：”之前的字符串确定 - 例如“FTP”的URL方案如“ftp://python.org/”），且他还支持其相关的网络协议（如FTP，HTTP...我们则重点关注HTTP。　　在简单的情况下，我们会使用urllib2模块的最常用的方法urlopen。但只要打开HTTP URL时遇到错误或异常的情况下，就需要一些HTTP传输协议的知识。...我们没有必要掌握HTTP RFC2616。这是一个最全面和最权威的技术文档，且不易于阅读。在使用urllib2时会用到HTTP RFC2616相关的知识，了解即可。...默认情况下，urlib2把自己识别为Python-urllib/x.y（这里的xy是python发行版的主要或次要的版本号，如在Python 2.6中，urllib2的默认用户代理字符串是“Python-urllib

1.1K2 0

python爬虫从入门到放弃（四）之 Requests库的基本使用

什么是Requests Requests是用python语言基于urllib编写的，采用的是Apache2 Licensed开源协议的HTTP库如果你看过上篇文章关于urllib库的使用，你会发现，其实...urllib还是非常不方便的，而Requests它会比urllib更加方便，可以节约我们大量的工作。...（用了requests之后，你基本都不愿意用urllib了）一句话，requests是python实现的最简单易用的HTTP库，建议爬虫使用requests库。...请求发出后，Requests 会基于 HTTP 头部对响应的编码作出有根据的推测。当你访问 response.text 之时，Requests 会使用其推测的文本编码。...： http://www.python-requests.org/en/master/api/#exceptions 所有的异常都是在requests.excepitons中 ?

2.5K11 2

您找到你想要的搜索结果了吗？

是的

没有找到

Python：urllib2模块的URLError与HTTPError

下面的例子里我们访问了一个不存在的域名： # urllib2_urlerror.py import urllib2 requset = urllib2.Request('http://www.ajkfhafwjqh.com...如果urlopen或opener.open不能处理的，会产生一个HTTPError，对应相应的状态码，HTTP状态码表示HTTP协议所返回的响应的状态。...# urllib2_httperror.py import urllib2 requset = urllib2.Request('http://blog.baidu.com/itcast') try...410 Gone 被请求的页面不可用。 411 Length Required "Content-Length" 未被定义。如果无此内容，服务器不会接受请求。...412 Precondition Failed 请求中的前提条件被服务器评估为失败。 413 Request Entity Too Large 由于所请求的实体的太大，服务器不会接受请求。

2.9K1 0

python之requests的基本使用

关于requests基本使用方法参照中文版参考文档： http://docs.python-requests.org/zh_CN/latest/index.html 简介 Requests是用python...语言基于urllib编写的，采用的是Apache2 Licensed开源协议的HTTP库，Requests它会比urllib更加方便，可以节约我们大量的工作。...例如下面，我们试图访问知乎的登录页面（当然大家都你要是不登录知乎，就看不到里面的内容），我们试试不加header信息会报什么错。...verify=False，但是这样是可以访问到页面结果消除验证证书的警报 from requests.packages import urllib3 import requests urllib3...，详细的可以看：http://cn.python-requests.org/zh_CN/latest/_modules/requests/exceptions.html#RequestException

8392 0

python爬虫(七)_urllib2：urlerror和httperror

#urllib2_urlerror.py import urllib2 request = urllib2.Request("http://www.sdfsdfsf.com") try: urllib2...不能处理，会发出一个HTTPError，对应相应的状态码，HTTP状态码表示HTTP协议所返回的响应的状态。..._urllib2_httperror.py import urllib2 request = urllib2.Request("http://blog.baidu.com/itcast") try...410 Gone 被请求的页面不可用。 411 Length Required "Content-Length" 未被定义。如果无此内容，服务器不会接受请求。...412 Precondition Failed 请求中的前提条件被服务器评估为失败。 413 Request Entity Too Large 由于所请求的实体的太大，服务器不会接受请求。

2.9K8 0

django 1.8 官方文档翻译： 14-4-1 重定向应用

重定向应用 Django 原生自带一个可选的重定向应用。它将简单的重定向保存到数据库中并处理重定向。它默认使用HTTP 响应状态码301 Moved Permanently。...你可以子类化RedirectFallbackMiddleware 并设置 response_redirect_class 为django.http.HttpResponseRedirect 来使用302...如果找到匹配的记录而new_path 为空，它将发送一个410 (“Gone”) HTTP 头和空（没有内容的）响应。如果没有找到匹配的记录，请求将继续正常处理。...编辑这些重定向，就像编辑系统中的其它对象一样。...通过Python API class models.Redirect 重定向通过一个标准的Django 模型表示，位于django/contrib/redirects/models.py。

8181 0

使用Python下载文件的简单示例

在本教程中，您将学习如何使用不同的Python模块从Web上下载文件。还可以下载常规文件、网页、Amazon S3和其他来源。...然后，将变量的内容写入文件。使用wget 您还可以使用Python的wget模块从URL下载文件。...wget模块可以使用以下pip进行安装: pip install wget 看看以下代码，我们将下载Python的图像： import wget url = "https://www.python.org...唯一的区别在于for循环。在将内容写入文件时，我们使用了进度模块的bar方法。使用urllib下载网页在本节中，我们将使用urllib下载一个网页。...另外，您还可以使用官方文档中记录的请求模块： import requests myProxy = { 'http': 'http://127.0.0.2:3001' } requests.get("https

11.4K3 1

http状态码一览表

最后，在servlet 2.2版本（J2EE中的版本）中，sendRedirect能够处理相对路径，自动转换为绝对路径。但是你只能在2.1版本中使用绝对路径。...该状态码是新加入 HTTP 1.1中的。 410 (Gone/已经不存在) 410 (SC_GONE)告诉客户端所请求的文档已经不存在并且没有更新的地址。...410状态不同于404，410是在指导文档已被移走的情况下使用，而404则用于未知原因的无法访问。该状态码是新加入 HTTP 1.1中的。...该状态是新加入 HTTP 1.1的。奇怪的是，在servlet 2.1版本API的HttpServletResponse中并没有相应的常量代表该状态。...在这种情况下，服务器也会用该状态(417)告诉浏览器服务器不接收该附件或用100 (SC_CONTINUE)状态告诉客户端可以继续发送附件。该状态是新加入 HTTP 1.1的。

1.9K7 0

Python--状态码的简介与获取方法

一、网页HTTP状态码 HTTP状态码表示HTTP协议所返回的响应状态。 ...HTTP状态码有5种，所有状态码的第一个数字代表了响应的5种状态之一：(1)消息：1XX；(2)成功：2XX;(3)重定向：3XX;(4)请求错误：4XX;(5)服务器错误：5XX. ...没有信息能够告诉用户这个状况到底是暂时的还是永久的。假如服务器知道情况的话，应当使用410状态码来告知旧资源因为某些内部的配置机制问题，已经永久的不可用，而且没有任何可以跳转的地址。...二、Python获取HTTP状态码方法一：通过requests模块获取，这是我最常用的方法 import requests code=requests.get("https://blog.csdn.net.../qq_38251616").status_code print code 方法二：用urllib模块获取 import urllib status=urllib.urlopen("https://blog.csdn.net

2.7K2 0

如何使用Selenium WebDriver查找错误的链接？

我将演示了使用Selenium Python进行的断开链接测试。 Web测试中的断开链接简介简单来说，网站（或Web应用程序）中的损坏链接（或无效链接）是指无法访问且无法按预期工作的链接。...客户端（即浏览器）可以在服务器准备等待的时间内发送相同的请求。 410（已去） HTTP状态代码比404（找不到页面）更永久。410表示该页面已消失。...在本Selenium WebDriver教程中，我们将演示如何使用Selenium WebDriver在Python，Java，C＃和PHP中执行断开的链接测试。...使用Selenium python的错误链接测试 import requests import urllib3 import pytest from requests.exceptions import...执行我在这里使用PyUnit（或unittest），它是Python中的默认测试框架，用于使用Selenium进行的断开链接测试。

9.9K1 0

Python网页处理与爬虫实战：使用Requests库进行网页数据抓取

requests 库概述 requests 库中的网页请求函数网页请求函数 Response 对象的属性 Response 对象的方法获取一个网页内容 Python网页处理与爬虫实战：使用Requests...Python 语言提供了很多类似的函数库，包括urllib 、urllib2、urllib3、wget、scrapy、requests 等。这些库作用不同、使用方式不同、用户体验不同。...这两个步骤分别使用不同的函数库：requests 和 beautifulsoup4 安装requests 库采用pip指令安装requests库，如果在Python2和Python3并存的系统中...有关 requests 库的更多介绍请访问： http://docs.python‐requests.org requests 库中的网页请求函数 get() 是获取网页最常用的方式，在调用requests.get... json() 方法能够在HTTP响应内容中解析存在的 JSON 数据，这将带来解析HTTP的便利。

1.7K2 0

Python学习笔记_Devops_Day01

多进程编程解决效率问题程序只是存储在磁盘上的可执行文件进程可以看作是程序的一次执行，也可以说是加载到内存中的一系列指令一个进程中还会包含一到多个线程每个进程都有自己独立的运行环境线程共享所在进程的运行环境...windows系统不支持多进程 python使用os.fork()实现多进程 os.fork()的返回值是数字父进程中，这个数字是非0值（子进程的PID号）子进程中，这个数字是0 多进程编编程思路...urllib模块包含4个子模块，常用的是urllib.request和urllib.error模块 urllib.request >>> from urllib import request >>>...> html = request.urlopen(url) urllib.error.HTTPError: HTTP Error 403: Forbidden # 简书拒绝了访问，原因是请求头中，浏览器写的是...python/urllib # 改变请求头中浏览器字段为火狐 >>> headers = {'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64; rv:52.0

5292 0

用python下载文件的若干种方法汇总

这种重复性的批量作业我们应该交给python小弟去帮我们搞定，这篇文章汇总了用python下载文件的若干种方法，快点学起来吧。 1....(url) open('PythonImage.png', 'wb').write(myfile.content) 用wget: import wget url = "https://www.python.org.../static/img/python-logo@2x.png" wget.download(url, 'pythonLogo.png') requests是python实现的简单易用的HTTP库。...使用urllib获取html页面 import urllib.request # urllib.request.urlretrieve('url', 'path') urllib.request.urlretrieve...可以看出，对应下载文件的链接都在div标签下的a标签中，需要将这些链接一一获取然后就可以进行批量化下载了。

15.2K2 1

Python 下载的 11 种姿势，一种比一种高级！

原文链接：http://dwz.date/cQjK 在本教程中，你将学习如何使用不同的Python模块从web下载文件。此外，你将下载常规文件、web页面、Amazon S3和其他资源。...2、使用wget 你还可以使用Python的wget模块从一个URL下载文件。你可以使用pip按以下命令安装wget模块: 考虑以下代码，我们将使用它下载Python的logo图像。...我们已经将其设置为1024字节，接着遍历每个块，并在文件中写入这些块，直到块结束。不漂亮吗?不要担心，稍后我们将显示一个下载过程的进度条。...在将内容写入文件时，我们使用了进度条模块的bar方法。 7、使用urllib下载网页在本节中，我们将使用urllib下载一个网页。 urllib库是Python的标准库，因此你不需要安装它。...9、使用urllib3 urllib3是urllib模块的改进版本。你可以使用pip下载并安装它: 我们将通过使用urllib3来获取一个网页并将它存储在一个文本文件中。

2.3K1 0

王老板Python面试（9）：整理的最全 python常见面试题（基本必考）

POST请求：POST请求会把请求的数据放置在HTTP请求包的包体中。上面的item=bandsaw就是实际的传输数据。因此，GET请求的数据会暴露在地址栏中，而POST请求则不会。...2、传输数据的大小在HTTP规范中，没有对URL的长度和传输的数据大小进行限制。但是在实际开发过程中，对于GET，特定的浏览器和服务器对URL的长度有限制。...Python自带：urllib，urllib2 第三方：requests 框架：Scrapy urllib和urllib2模块都做与请求URL相关的操作，但他们提供不同的功能。...有urlencode,urllib2没有，因此总是urllib，urllib2常会一起使用的原因 scrapy是封装起来的框架，他包含了下载器，解析器，日志及异常处理，基于多线程， twisted的方式处理...IO密集型代码(文件处理、网络爬虫等)，多线程能够有效提升效率(单线程下有IO操作会进行IO等待，造成不必要的时间浪费，而开启多线程能在线程A等待时，自动切换到线程B，可以不浪费CPU的资源，从而能提升程序执行效率

2.1K1 0

这里有11种方法，供你用python下载文件

2、使用wget 你还可以使用Python的wget模块从一个URL下载文件。你可以使用pip按以下命令安装wget模块: 考虑以下代码，我们将使用它下载Python的logo图像。...在这段代码中，URL和路径(图像将存储在其中)被传递给wget模块的download方法。...我们已经将其设置为1024字节，接着遍历每个块，并在文件中写入这些块，直到块结束。不漂亮吗?不要担心，稍后我们将显示一个下载过程的进度条。...在将内容写入文件时，我们使用了进度条模块的bar方法。 7、使用urllib下载网页在本节中，我们将使用urllib下载一个网页。 urllib库是Python的标准库，因此你不需要安装它。...9、使用urllib3 urllib3是urllib模块的改进版本。你可以使用pip下载并安装它: 我们将通过使用urllib3来获取一个网页并将它存储在一个文本文件中。

4.5K4 0

Python3网络爬虫实战-24、req

1 基本使用本节我们首先来了解下 Requests 库的基本使用方法。 1. 准备工作在本节开始之前请确保已经正确安装好了 Requests 库，如果没有安装可以参考第一章的安装说明。 2....实例引入在 Urllib 库中有 urlopen() 的方法，实际上它是以 GET 方式请求了一个网页。那么在 Requests 中，相应的方法就是 get() 方法，是不是感觉表达更明确一些？...资源分享qun 784758214 ,内有安装包，PDF，学习视频，这里是Python学习者的聚集地，零基础，进阶，都欢迎上面的例子中我们调用 get() 方法即可实现和 urlopen() 相同的操作...是不是比 Urllib 简单太多了？其实这只是冰山一角，更多的还在后面。 3....Response 发送 Request 之后，得到的自然就是 Response，在上面的实例中我们使用了 text 和 content 获取了 Response 内容，不过还有很多属性和方法可以获取其他的信息

1K1 0

20 行代码：Serverless 架构下用 Python 轻松搞定图像分类

「图像分类」是人工智能领域的一个热门话题，我们在实际生活中甚至业务的生产环境里，也经常遇到图像分类相似的需求，如何能快速搭建一个图像分类或者内容识别的 API 呢？...使用 wget 直接安装： wget https://github.com/OlafenwaMoses/ImageAI/releases/download/1.0/squeezenet_weights_tf_dim_ordering_tf_kernels.h5...这里需要注意：其中一些依赖需要编译，因此要在 centos + python2.7/3.6 的版本下打包才可以，这很复杂，尤其对于 mac/windows 用户，伤不起。...访问命令行输出的 URL，URL 就是我们刚才复制的 +/image，通过 Python 语言进行测试： import urllib.request import base64 with open("...在线产品发布会，学习如何使用所有这些激动人心的新功能。

8175 1

怎样维护成功的开源项目

有些团队可能因为某些原因选择第一种态度，也许是因为他们觉得维护人员做的是一件吃力不讨好的工作，还要承担丢失贡献者的责任。不过先来检查一下这两种态度所带来的效果。...但只要你有足够的耐性，礼貌待人，鼓励他们为项目出力，他们就会很有斗志。说不定他们就能在项目上做出重大影响，彻底改变现状。...urllib3——带有线程安全连接池的Python HTTP类库，支持文件公布，智能友好等等。...Python，HTTP类库，线程安全，连接池，文件公布，这些都是当人们遇到要使用Python的标准HTTP类库（urllib、urllib2、httplib）的时候所需要的。...找到乐趣 Andrey Petrov从事与HTTP和urllib3相关的的工作已经数年了，但仍然坚持维护开源项目，因为他喜欢技术社区，并在开源项目中感觉到自豪。

1.4K8 0

Python 下载的 11 种姿势，一种比一种高级！

↑ 关注 + 星标，每天学Python新技能后台回复【大礼包】送你Python自学大礼原文链接：http://dwz.date/cQjK 在本教程中，你将学习如何使用不同的Python模块从web...你只需使用requests模块的get方法获取URL，并将结果存储到一个名为“myfile”的变量中。然后，将这个变量的内容写入文件。 2、使用wget ?...你还可以使用Python的wget模块从一个URL下载文件。你可以使用pip按以下命令安装wget模块: 考虑以下代码，我们将使用它下载Python的logo图像。 ?...我们已经将其设置为1024字节，接着遍历每个块，并在文件中写入这些块，直到块结束。不漂亮吗?不要担心，稍后我们将显示一个下载过程的进度条。...7、使用urllib下载网页在本节中，我们将使用urllib下载一个网页。 urllib库是Python的标准库，因此你不需要安装它。以下代码行可以轻松地下载一个网页: ?

1.6K1 0

点击加载更多

urllib与urllib2的学习总结(python2.7.X)

python爬虫从入门到放弃（四）之 Requests库的基本使用

Python：urllib2模块的URLError与HTTPError

python之requests的基本使用

python爬虫(七)_urllib2：urlerror和httperror

django 1.8 官方文档翻译： 14-4-1 重定向应用

使用Python下载文件的简单示例

http状态码一览表

Python--状态码的简介与获取方法

如何使用Selenium WebDriver查找错误的链接？

Python网页处理与爬虫实战：使用Requests库进行网页数据抓取

Python学习笔记_Devops_Day01

用python下载文件的若干种方法汇总

Python 下载的 11 种姿势，一种比一种高级！

王老板Python面试（9）：整理的最全 python常见面试题（基本必考）

这里有11种方法，供你用python下载文件

Python3网络爬虫实战-24、req

20 行代码：Serverless 架构下用 Python 轻松搞定图像分类

怎样维护成功的开源项目

Python 下载的 11 种姿势，一种比一种高级！

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐