Loading [MathJax]/jax/output/CommonHTML/config.js
社区首页 >问答首页 >无法使用请求刮取此站点。

无法使用请求刮取此站点。
EN

Stack Overflow用户
提问于 2022-04-12 21:51:56
回答 1查看 49关注 0票数 1

我正在尝试刮掉本网站的一些表。当我执行请求时,返回的html与浏览器中的html不同。

我试着检查browser Network选项卡,看看是否有任何json响应填充了信息,但找不到任何信息。我意识到请求返回的html是存在于Network选项卡中的html文档中(在浏览器检查器中),正如我所说,与元素选项卡中显示的html不同(其中一个显示了我想要的完整html代码)。

我知道我错过了一些东西,如果你能解释一下这个网站是如何运作的,我将不胜感激:

  • 为什么反应不同?
  • 如果不使用真正的浏览器,是否有可能做到这一点(我不喜欢为了提高效率而使用selenium )。

这是我的密码

代码语言:javascript
代码运行次数:0
复制
url  = 'https://coriolis.io/outfit/fer_de_lance?code=A4pktfFalfdpsff30x27272727040404040404B22b2b27m1m1.AwRj4yvI.Aw18WQ%3D%3D.H4sIAAAAAAAAA42SvS9DYRTGTz%2B1vW1v79VWBfXRi8TQNLYabKIDibGryWLoQMQi7AYRwWAwGA1GQ2OyNjEYDCL%2BCBN1jueIvmmbSu5N7pMn7%2Fm9zz335BAPEdF3BNI%2BhVgnAaLUYZLI2YNz7y0irxkkkgAvG%2FIAEtv4ErHfy0T5uzDIJwRJkPMG2oHY3qdItggyd20TFZQsNUZAhnjMkPtKPlf%2BQrKvOCzVPkQkzIsdyK7son65hKsRrpqrR5B4kkUSZw7RtLoZdbPq5tRJlDc7uJuZJypr9OjaBEox3jJJRUikjqaityl8X5uQONdNHS%2BF9Xf6oYQfyPIDJbug0H9QilcMdKWD0VNXp1N4jBNNvqQBpf1Ath8ow7UeyGpgsI6Kd5xA3eHV3vpNFEm6G4663yRPnbhdSRcDkoZ53dS3IcFCWySqG2NVMQ3nDZLTnrymrlqWFwx%2BrnEPsOmpcZDqXN03T53kfJP5frJlyJYh1YnQwOcHDPQx9E8DAAA%3D.EweloBhAOEoUwIYHMA28QgIwV3fEQA%3D%3D'
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}
s = requests.Session()
n = s.get(url,verify=False,headers=headers)
soup = BeautifulSoup(n.content,'html.parser')
tables = soup.find_all(class_='group half') # Present in the browser but not in the returned request
EN

回答 1

Stack Overflow用户

发布于 2022-04-12 22:14:42

请使用来废弃该站点。

代码语言:javascript
代码运行次数:0
复制
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager

url  = "your site url"
driver = webdriver.Chrome(ChromeDriverManager().install())
driver.get(url)
page = driver.page_source
soup = BeautifulSoup(page, 'html.parser')
....

抓取的响应可能通过头选项不同,但是selenium将响应与通过真正的浏览器打开站点一样的响应。您可以在selenium中使用option.add_argument('--headless'),而无需打开浏览器。

票数 -1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71852491

复制
相关文章
如何实现一个串行promise
1、使用数组的reduce方法,reduce里有四个参数,pre,next,index,arr,
windseek
2019/10/23
1.2K0
破解 Kotlin 协程(7) - 序列生成器篇
在 Kotlin 当中,Sequence 这个概念确切的说是“懒序列”,产生懒序列的方式可以有多种,下面我们介绍一种由基于协程实现的序列生成器。需要注意的是,这个功能内置于 Kotlin 标准库当中,不需要额外添加依赖。
bennyhuo
2020/02/20
8600
使用keras开发非串行化神经网络
我们当前所开发的网络都遵循同一个模式,那就是串行化。多个网络层按照前后次序折叠起来,数据从底层输入,然后从最高层输出,其结构如下图:
望月从良
2018/12/28
6700
使用keras开发非串行化神经网络
iOS开发中的并发、串行队列,同步、异步任务
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u010105969/article/details/69914369
用户1451823
2018/09/13
1.7K0
iOS开发中的并发、串行队列,同步、异步任务
GCD 串行队列
只要是异步就可以获取多个线程,但是串行队列,任务没有完成,不能拿任务。所以只会获取1个线程,因为加另外一个线程,没有任务。
CC老师
2023/03/23
3600
GCD 串行队列
如何破解止损难题
第一篇《币圈的盈利止损》分析了止损的本质是价格进入下降通道,为避免损失扩大而退出,与买入成本无关,并进一步把止损分为盈利止损和亏损止损。
凌帅出口
2018/08/17
4180
如何破解Excel VBA密码
首先,如果文件格式是(.xslm),需要先打开Excel文件,另存为2003版格式(.xls)。
landv
2018/09/26
6.9K0
如何破解Excel VBA密码
软件都是如何被“破解”的?开发者有办法阻止破解版的产生吗?
软件的破解属于正常流程的反向过程,破解软件主要目的在于如何最大程度的获取利益,而且大部分的破解软件都和正版收费有一定的关联,破解软件之所以有如此大的市场就是因为强烈的市场需求,特别是在国内范围很多国外的软件只要发现有收费的行为,立即寻找破解版而且基本上都能找到,这是破解市场如此火热的主要原因。
程序员互动联盟
2020/04/03
4.5K0
GDB串行协议概述
做嵌入式开发时,很多时候都会使用到GDB,从底层去理解GDB的调试过程,将更加容易的理解调试的过程。
bigmagic
2021/08/20
1.5K0
什么是Promise串行
Promise串行是指每一个由promise封装的任务都顺序执行,即上一个执行完成后再执行下一个。
用户1687375
2020/02/25
1.1K0
串行乘法器
module ade( clk,x,y,q ); input clk; input [7:0]x,y; output [15:0]q; reg [15:0]q; parameter s0=0,s1=1,s2=2; reg [2:0]count=0; reg [1:0]state=0; reg [15:0]p1,t; reg [7:0]y_reg; always @ (posedge clk) begin case(state) s0: begin y_reg<=y; sta
瓜大三哥
2018/02/24
6650
串行乘法器
AsyncTask? AsyncTask串行and并行?
AsyncTask,相信你不会陌生,也许你很幸运,早已了解了AsyncTask这个家伙挖的坑,也许你已经被坑过了,也许你没坑了,然而还没有发觉!
陈宇明
2020/12/15
1K0
AsyncTask? AsyncTask串行and并行?
快速开发必备:代码生成器
开发程序那么久了,真正使用代码生成器是近3年的事情,由衷的感觉到这东西真的是提高生产力!
崔文远TroyCui
2019/02/26
1.2K0
破解区块链应用开发难题,开发者该如何抓住区块链红利?
作为数字经济时代重要的底层支撑技术之一,区块链在推动数字经济发展和企业数字化转型中发挥着重要作用。 近年来,我国区块链顶层设计加快完善。“十四五”规划明确提出,将区块链列为数字经济七大重点产业之一,发展区块链服务平台和金融科技、供应链管理、政府服务等领域的应用方案。同时,区块链产业加速发展,产业规模不断攀升。根据赛迪区块链研究院发布的《2021 年我国区块链年度发展白皮书》显示,我国区块链产业规模由 2016 年的 1 亿元增加至 2021 年的 65 亿元。在应用层面,区块链在政务、司法存证、供应链金融、
bengbengsu
2022/07/12
9960
破解区块链应用开发难题,开发者该如何抓住区块链红利?
串行总线技术(一)-串行总线结构(以PCIe为例)
在早期的计算机系统中,多数外围设备使用并行总线结构。这些总线包括PCI和PATA(并行ATA)。当通信速率较低时,并行总线结构可以设计得非常简单和有效,可以连接大量外围设备。通过使用中央仲裁机制,可以方便地实现总线设备间的通信:然而,当速率和带宽不断增加时,并行结构的潜力不断被发掘并不再能够满足系统设计要求。
碎碎思
2021/10/18
3.4K0
串行总线技术(一)-串行总线结构(以PCIe为例)
python pyserial 串行端口编程
二、特性 在支持的平台上有统一的接口。 通过python属性访问串口设置。 支持不同的字节大小、停止位、校验位和流控设置。 可以有或者没有接收超时。 类似文件的API,例如read和write,也支持readline等。 支持二进制传输,没有null消除,没有cr-lf转换。
用户5760343
2022/05/13
9880
如何破解苹果电脑密码
一般苹果电脑有两种破解密码的方法,老款的是开机时按住command+r键进入恢复模式,另一种是针对新款的MacBook 开机键又叫(mesa)键+command进入密码恢复模式。
知识与交流
2021/04/02
3.7K0
如何破解苹果电脑密码
前端如何破解 CRUD 的循环
据说,西西弗斯是一个非常聪明的国王,但他也非常自负和狂妄。他甚至敢欺骗神灵,并把死者带回人间。为此,他被宙斯(Zeus)惩罚,被迫每天推着一块巨石上山,但在接近山顶时,巨石总是会滚落下来,他不得不重新开始推石头,永远困在这个循环中…
_sx_
2023/10/20
3411
前端如何破解 CRUD 的循环
串行通信(USART/UART)「建议收藏」
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/144690.html原文链接:https://javaforall.cn
全栈程序员站长
2022/08/30
6900
串行通信(USART/UART)「建议收藏」
看大佬如何破解智能门锁
上一篇文章的分析中,我们发现Yale智能门锁的通信中存在两个问题,本篇文章将分为两个部分描述如何利用这两个问题:
物联网安全小编
2020/05/29
2.5K0
看大佬如何破解智能门锁

相似问题

PHP暴力破解密码生成器

31

串行读/写/开发/tty检查

24

如何破解IAsyncResult?

15

如何破解$.each

31

如何破解__NSAutoreleaseNoPool

56
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档