Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >Python :请求无法满足/请求被阻止

Python :请求无法满足/请求被阻止
EN

Stack Overflow用户
提问于 2018-08-08 17:18:25
回答 1查看 1.5K关注 0票数 0

我试图使用Tor从下面的链接发出请求,但它返回错误。在没有Tor的情况下提出请求是非常好的,但是我仍然需要它们在Tor中,或者可能是随机IP中。

我做得对吗?或者有更好的解决办法。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
link = 'https://www.totallylegal.com/searchjobs/'
import requests
torport = 9050
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.84 Safari/537.36',
    'accept' : 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
}
proxies = {
    'http': "socks5h://localhost:{}".format(torport),
    'https': "socks5h://localhost:{}".format(torport)
}

print(requests.get(link,headers=headers, proxies=proxies).content)

下面是显示的错误:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<HTML><HEAD><META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<TITLE>ERROR: The request could not be satisfied</TITLE>
</HEAD><BODY>
<H1>403 ERROR</H1>
<H2>The request could not be satisfied.</H2>
<HR noshade size="1px">
Request blocked.

<BR clear="all">
<HR noshade size="1px">
<PRE>
Generated by cloudfront (CloudFront)
Request ID: iXaDPfPtyHg0TGTFJvYuAnV86unJIpBITxdBJ2w_i_bo-ToR510p2w==
</PRE>
<ADDRESS>
</ADDRESS>
</BODY></HTML>
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-08-08 22:26:56

该页面似乎封锁了Tor Ip的收件人,因此我们可以通过另一个站点,例如W3验证器,向我们显示源代码:https://validator.w3.org/nu/?showsource=yes&doc=https%3A%2F%2Fwww.totallylegal.com%2Fsearchjobs%2F来规避这一问题。

我们仍然在使用TOR,但是让其他站点为我们获取站点(并且他们的IP没有被阻止):

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from bs4 import BeautifulSoup
import requests

proxies = {
    'http': 'http://<YOUR PROXY ADDRESS>:<YOUR PROXY PORT>',
    'https': 'http://<YOUR PROXY ADDRESS>:<YOUR PROXY PORT>',
}

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.84 Safari/537.36',
    'accept' : 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
}

r = requests.get('https://validator.w3.org/nu/?showsource=yes&doc=https%3A%2F%2Fwww.totallylegal.com%2Fsearchjobs%2F', proxies=proxies, headers=headers)
soup = BeautifulSoup(r.text, 'lxml')
source_code = ''
for code in soup.select('ol.source > li > code'):
    if 'class' in code.attrs and 'lf' in code.attrs['class']:
        source_code += '\n'
    else:
        source_code += code.text

soup2 = BeautifulSoup(source_code, 'lxml')

for li in soup2.select('li.lister__item h3'):
    print(li.text)
    print('-' * 80)

指纹:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Corporate Partner
--------------------------------------------------------------------------------
Personal Injury Paralegal
--------------------------------------------------------------------------------
Healthcare Regulatory Lawyer - London
--------------------------------------------------------------------------------
Company Secretary and Corporate Governance
--------------------------------------------------------------------------------
Junior FCPA/Compliance Associate, Beijing - 14612/TTL
--------------------------------------------------------------------------------
International Project Manager, Shanghai - 14611/TTL
--------------------------------------------------------------------------------
Corporate Associate (4+ PQE) Beijing - 14610/TTL
--------------------------------------------------------------------------------
Corporate Associate (5+ PQE) Shanghai - 14609/TTL
--------------------------------------------------------------------------------
Corporate or Commercial Counsel -Pharma- Surrey
--------------------------------------------------------------------------------
Corporate/Public M&A PSL, 5+ PQE
--------------------------------------------------------------------------------
Solicitor
--------------------------------------------------------------------------------
In-house Legal Counsel - Excellent opportunity to go In-House!
--------------------------------------------------------------------------------
Real Estate Partner
--------------------------------------------------------------------------------
Child Brain Injury Solicitor
--------------------------------------------------------------------------------
Corporate/Commercial In-House Lawyer, 1+
--------------------------------------------------------------------------------
In-house Regulatory Counsel, Banking/Payments, 5+
--------------------------------------------------------------------------------
In-house Property Finance/Banking Lawyer, 1-3
--------------------------------------------------------------------------------
Hybrid Legal & Compliance Data Protection Manager
--------------------------------------------------------------------------------
Hedge Fund Legal Counsel 3-5 years PQE
--------------------------------------------------------------------------------
Corporate PSL
--------------------------------------------------------------------------------
票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51757608

复制
相关文章
短信接口被恶意调用(二)肉搏战-阻止恶意请求
作者:13 GitHub:https://github.com/ZHENFENG13 版权声明:本文为原创文章,未经允许不得转载。 前言 承接前文《短信发送接口被恶意访问的网络攻击事件(一)紧张的遭遇战险胜》,在解决了短信发送的问题后,长长地舒了口气,也就各忙各的事情去了,本以为应该是个完美的收场,哪知道只是泥泞道路的前一段,收场是收不了了,还是要去应付接下来的烂摊子,因为攻击者并没有停止攻击,虽然恶意请求已经可以被识别并且不会被业务服务器处理,也不会去触发短信发送接口,但是请求依然会源源不断的到达服
程序员十三
2018/03/15
1.8K0
短信接口被恶意调用(二)肉搏战-阻止恶意请求
python处理get请求和post请求
#处理get请求,不传data,则为get请求 import urllib from urllib.request import urlopen from urllib.parse import u
用户1220053
2018/03/29
3.4K0
Java开发笔记之%被转码为%25导致url无法请求
在使用RestTemplate(import org.springframework.web.client.RestTemplate)进行开发时候发现,
Jetpropelledsnake21
2022/05/16
2.5K0
Python - SocketIO 请求
代码保存为demoserverjs格式, 启动node   demoserver.js
py3study
2020/01/07
1.3K0
python get请求
get请求是HTTP协议中最基本、最常见的操作。我们在浏览器中直接输入网址访问网站就是一个很常见的get请求操作。
灯珑LoGin
2022/10/31
1.2K0
python post请求
post请求只需构建一个Request对象,并把参数传递给Request对象的data属性即可(也可以在urlopen方法中传递给data参数)。
灯珑LoGin
2022/10/31
1.8K0
[未解决]报错:requests post请求无法返回数据
报错代码: f={"appid":"wx0e7876190882657b","env":"production","pid":"100000568810","storeId":326081810,"templateId":2817,"wxTemplateId":2817,"zhanId":378279,"refer":"","openid":"oOPlO5U0Q56iegYMJujqP-csYt5w","source":1,"sdpSource":"ec","longitude":114.05454,"la
hankleo
2020/09/17
1.1K0
阻止HTML表单提交跳转页面,使用 Jquery Ajax 请求接口
站长源码网 1. HTML 表单 ---- <script src="https://cdn.bootcdn.net/ajax/libs/jquery/3.6.0/jquery.min.js"></script> <form action="" method="post" onsubmit="return save(this)"> 手机号 <input type="text" name="mobile" autocomplete="off"> 登录密码 <input type="text" name="p
很酷的站长
2023/01/16
3.1K0
如何防止请求的URL被篡改
如图,是我们模拟的一个从浏览器发送给服务器端的转账请求。久一的ID是 web_resource,正在操作100元的转账。
用户1093975
2018/12/05
3K0
python 异步post请求
import aiohttp headers = {'User-Agent': 'Dalvik/2.1.0 (Linux; U; Android 6.0.1; Nexus 5 Build/MMB29K) tuhuAndroid 5.24.6', 'content-type': 'application/json'} async with aiohttp.ClientSession(headers=headers) as sess:
Wyc
2021/08/13
3.5K0
Python网络请求-httpx
在 Python 众多的 HTTP 客户端中,最有名的莫过于requests、aiohttp和httpx。
码客说
2021/11/29
1.1K0
Python之并发请求
在服务端的测试中,除了考虑服务端的业务功能和API的各个兼容性外,还需要考虑的就是服务端的稳定性以及高并发请求下服务端的承载能力。关于并发多少的数量以及具体的响应时间要求,其实每个产品的形态都是不一样的,很难使用标准的说法来进行统一。这具体看被测试的组件它所面对的业务形态,如果业务形态是是很少使用的产品,其实对性能也就没什么要求了。所以关于这点还是得根据被测组件的架构设计,承载的量以及业务目标。本文章主要分享使用Python语言编写一个简单的并发请求的测试代码。
无涯WuYa
2020/11/09
4.5K0
Python之并发请求
Python网络请求-aiohttp
在 Python 众多的 HTTP 客户端中,最有名的莫过于requests、aiohttp和httpx。
码客说
2021/11/29
1.3K0
python HTTP请求--reque
python中你用什么库发送HTTP请求呢,urllib,urllib2? 下面介绍一个更简单的:requests。 使用requests,可以简洁高效的发送HTTP请求。 1.安装 ###直接使
py3study
2020/01/09
6700
面试被问:“你的项目是如何处理重复请求/并发请求的?”
原文:http://jaskey.github.io/blog/2020/05/19/handle-duplicate-request/
java进阶架构师
2020/11/23
1K0
MongoDB 集群请求连接被拒绝的分析
某运营商搭建了一套 MongoDB 集群,承载了大大小小的几十个非计费类应用,1亿左右的用户量,随着访问量的增加,业务繁忙时期偶尔出现连接拒绝的错误。
MongoDB中文社区
2018/12/27
2.3K0
MongoDB 集群请求连接被拒绝的分析
某运营商搭建了一套 MongoDB 集群,承载了大大小小的几十个非计费类应用,1亿左右的用户量,随着访问量的增加,业务繁忙时期偶尔出现连接拒绝的错误。
MongoDB中文社区
2019/04/22
2.5K0
MongoDB 集群请求连接被拒绝的分析
网络请求优化——取消请求
我们可能会遇到这样的场景:当用户切换页面时,上个页面存在pending中的请求。积少成多,如此会造成性能浪费,增加服务器压力。本文在于分享基于小程序提供的请求api及 axios 使用中如何取消不必要的请求。
s4rn
2021/01/06
2.1K0
点击加载更多

相似问题

Python HTTP请求被阻止

125

Python请求被网站阻止

181

Youtube请求被阻止

12

Heroku请求被阻止

118

axios请求被阻止

21
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文