腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
屏幕
抓取
JS
页面
、
、
我正在尝试
抓取
这个
页面
,但它不工作。我试过了 $html->load_file($url); 但是对于我想要
抓取
的问题(.trivia- found )却找不到。
浏览 3
提问于2013-07-03
得票数 3
回答已采纳
2
回答
浏览器中的Html与Python中请求的Html不同
、
、
、
PapaGordsmack/", headers=headers)print(html_contents) 我试图从特定用户的sky.lea.moe网站上
抓取
网页,但当我请求并打印html时,它与浏览器中显示的不同(在chrome上,查看
页面
源代码)。
浏览 20
提问于2020-02-09
得票数 0
1
回答
从html
页面
不显示数据的url读取数据
、
我正在尝试以下代码:if __name__ == '__main__': import requests r = s.get(link) print(sou
浏览 1
提问于2020-02-05
得票数 0
1
回答
有没有可能用NodeJS
抓取
任何给定的网址?
、
我已经阅读了一些关于
抓取
的文章,似乎NodeJS、ExpressJS、Request和Cheerio是我作为一个熟悉
JS
/jQuery的前端人员的首选方法。到目前为止,我读过的所有文章都集中在没有API的情况下从特定网站上
抓取
数据,而我想要实现的是一个工具,它可以获取任何给定的URL,并返回true/false来列出正在使用的通用库和链接的社交网络。由于CSS选择器,我选择的设置(如上)是合适的,还是仅限于
抓取
特定
页面
?
浏览 0
提问于2014-08-07
得票数 0
1
回答
是否更容易
抓取
AMP版本的网页?
、
、
、
、
我知道AMP协议要求Javascript的精简版本,我也知道Javascript (在一定程度上)使网站管理员能够检测/防止
抓取
。因此,从逻辑上讲,我认为
抓取
AMP网站会更容易一些。
浏览 11
提问于2019-04-08
得票数 0
2
回答
抓取
使用javascript注入html的网站
、
我试图用Node.
JS
抓取
一个网站,但当
抓取
html文件时,出现的东西是注入JavaScript的脚本标签,在查看有问题的JavaScript文件时,我似乎是正确的,因为我发现了我试图
抓取
的文本。在这个脚本被注入到html之后,我如何
抓取
文档?有什么办法吗?谢谢
浏览 22
提问于2020-11-04
得票数 0
回答已采纳
1
回答
使用Python从web xhr提要中
抓取
数据
、
、
、
我有两个问题: #these all return empty element sets 如何加载所有可见结果的
页面
编辑:在建议使用selenium之后,我构建了一个函数,它将使用Selenium/Chrome加载
页面
,然后将ht
浏览 1
提问于2017-01-17
得票数 1
回答已采纳
2
回答
木偶人爬行器大规模爬行
、
、
我们正在使用Puppeteer编写一个网络爬虫。我们写的木偶爬虫执行和爬行网站的网址没有问题的网页,如约1,500 - 5,000,但是,当我们执行的网站超过5,000,如果它在中间由于一些错误或崩溃而中断,那么它需要重新开始。如果出现任何错误,如何使基于Puppeteer的网络爬虫从爬行的最后状态恢复?在Puppeteer中有没有内置的函数?如何让这个木偶手无头的chrome web爬行通过一个队列系统?
浏览 14
提问于2020-12-05
得票数 2
1
回答
使用VBA从Yahoo拉取季度股票数据- 2020更新
、
、
因此,我已经能够编写一个脚本,能够从Excel中提取股票基本面数据。耶。我知道这个更新已经难倒了很多人。这是我当前的代码。我希望与网页互动,以便我可以拉资产负债表和现金流数据以及。此外,我希望从季度而不是年度的角度来看待这些数据。为了便于参考:https://finance.yahoo.com/quote/AAPL/financials?p=AAPL 这将需要我按下屏幕上的一个按钮;但是,我不确定如何进行这项工作。 Sub importData() Chart.Delete Dim
浏览 21
提问于2020-12-28
得票数 0
1
回答
如何在colly上启用
Js
、
我正在尝试从一个网站中刮取数据,但它返回以重新获得访问,请确保在重新加载
页面
之前启用了cookie和JavaScript。fmt.Println("item is already crawled") }) 我在文档“自动cookie和会话处理”中看到了,所以问题可能是
js
首先,可以尝试如何在colly中启用
js
?
浏览 5
提问于2020-10-04
得票数 1
1
回答
从
页面
抓取
时遇到麻烦
、
、
、
参考我的一个,我必须
抓取
一个酒店的评论(所有评论),例如这个我已经使用Selinium
抓取
了评论,但我的客户不想使用Selinium,因为它加载了整个
页面<
浏览 0
提问于2014-11-28
得票数 1
2
回答
除非启用了Javascript,否则使用php函数
、
、
我有一个网站,将
抓取
新的数据在第一页访问。我想使用AJAX来做这件事,这样我就可以在
抓取
过程中向用户提供至少一些loading.gifs,但这只有在启用了Javascript的情况下才能实现。我的站点使用了一个PHP模板引擎,所以我想把
抓取
函数放在html模板的<noscript>标记中。因为这将在所有PHP代码之后发生,所以我必须重新加载
页面
,以便可以使用PHP呈现/解析
抓取
的数据。
浏览 0
提问于2011-01-16
得票数 1
1
回答
Bootstrap下拉菜单仅有效一次
我使用的是Bootstrap 3下拉菜单CSS和
JS
。下拉菜单仅有效一次。<li><%= link_to("Contacts", contacts_path) %></li> </li>
JS
CDN Include
浏览 5
提问于2013-09-30
得票数 5
1
回答
在R中使用`read_html`时缺少元素
、
、
、
例如,如果我试图读取出现在
页面
上的底部表格,我将使用以下代码:html_content <- read_html("https://projects.fivethirtyeight.com其中包括
页面
上的一些表元素,但不是我感兴趣的元素。 如果您对我的错误之处有任何建议,将不胜感激!
浏览 17
提问于2016-08-31
得票数 3
回答已采纳
1
回答
先进的网页刮除
我想刮一个网站的一部分,让我们说: www.mywebsite.com/x1/x2您需要先打开x1,然后单击按钮,x2将作为弹出窗口打开。如果关闭x1,则无法访问x2。该网站支持JavaScript。
浏览 3
提问于2015-07-20
得票数 0
1
回答
解析Javascript生成HTML的链接?
、
、
、
但是,我遇到了一些网页,其中链接出现在浏览器中,而不是在
页面
源中。 ...
浏览 5
提问于2013-02-15
得票数 0
2
回答
如何使用ajax
抓取
页面
?
、
、
、
我有两个
页面
(A和B),它们是使用django + jquery编写的。它们的urls是:http://127.0.0.1:8082/temp2/ (pageB) $("#tmp_button1").click(function(tmp_event
浏览 0
提问于2013-10-14
得票数 1
2
回答
从网页中提取内容数据
我希望从网页urls获得结构化文章数据。到目前为止,我已经找到了这两个服务和。有没有更好的替代方案,或者自己写代码来做这件事值得吗?
浏览 2
提问于2014-10-07
得票数 0
1
回答
使用AJAX请求
抓取
页面
、
、
、
我正在使用带有jsDOM的Node.
js
来
抓取
网页并在其中执行JavaScript。但是,如果
页面
包含AJAX请求,则不会执行这些请求。 是否有在
抓取
的
页面
中执行AJAX调用的选项?
浏览 1
提问于2011-05-27
得票数 4
回答已采纳
1
回答
Python网络驱动程序
、
Isoup = BeautifulSoup(IR.text, "html5lib") 假设
页面
上的项不需要javascript (如果条目需要的话),这个解决方案可以工作--它只会在文档准备好之前检索初始
页面
。我意识到我可以使用python驱动程序,但我想知道这个问题是否还有其他的解决方案,可以让web
抓取
工具更容易自动化。
浏览 3
提问于2017-07-17
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
爬虫抓取页面图片
如何吸引百度蜘蛛来抓取页面,蜘蛛抓取页面的因素
爬虫抓取页面图片 update
批量抓取页面图片 up!
JS技法-页面悬浮导航
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券