腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用AJAX
请求
抓取
页面
、
、
、
我正在使用带有jsDOM的Node.
js
来
抓取
网页并在其中执行JavaScript。但是,如果
页面
包含AJAX
请求
,则不会执行这些
请求
。 是否有在
抓取
的
页面
中执行AJAX调用的选项?
浏览 1
提问于2011-05-27
得票数 4
回答已采纳
2
回答
不加载附加了innerHTML的脚本?
、
、
我将一个完整的超文本标记语言
页面
附加到一个div (
抓取
)。如何阻止它
请求
script和css文件?我尝试立即删除这些节点,但它们仍然被
请求
。 这是一个浏览器插件,我正在
抓取
JS
浏览 0
提问于2015-01-06
得票数 0
1
回答
Web
抓取
返回URI,而不是图像的URL。(Javascript Cheerio)
、
、
我正在使用Cheerio和
请求
网络
抓取
图像URL,当我想要获取URL时,我会一直获取URI。我能做些什么来修复这个问题?
浏览 47
提问于2020-04-04
得票数 0
回答已采纳
1
回答
如何以编程方式查看网站正在发出哪些
请求
(例如API或资源
请求
)
、
、
在Chrome中,您可以访问developer > network,查看该网站提出的所有
请求
。有更简单的方法吗?
浏览 1
提问于2022-03-14
得票数 -2
1
回答
如何判断
请求
是否来自facebook?
、
、
我们有一个要求,不发送一个特定的ajax
请求
到我们的服务器,如果
页面
是由facebook scraper
请求
的(我们在facebook墙上共享到我们的
页面
的链接),我们试图检查基于的javascript5.0 (Windows NT10.0;Win64;x64) AppleWebKit/537.36 (KHTML,像Gecko) Chrome/71.0.3578.98Safari/537.36“)的
请求
浏览 1
提问于2019-01-23
得票数 0
2
回答
由google bot (或冒充googlebot的东西)引起的Rails3上的奇怪异常
昨晚我在我的网站上收到了一个异常,是由一个代理的
请求
引起的:googlebot。
浏览 0
提问于2010-10-02
得票数 5
回答已采纳
1
回答
Googlebot尝试提交表单中的每个选择选项,在网站管理员工具中创建118,000个404
、
、
、
、
我在我的网站的每个
页面
上都有一个表格,你需要从下拉列表中选择4个选项,然后才能提交(由jquery验证)。这是我得到的404类型的一个例子。网站上有javascript表单验证,它会阻止你实际提交表单,直到你选择了所有4个选项,也许googlebot会忽略
js
?
浏览 1
提问于2013-05-09
得票数 0
1
回答
C#爬虫程序无法加载动态内容
、
、
、
我正在使用Abot库来
抓取
网页。爬虫可以正确地
请求
页面
,但问题是几乎所有内容都是通过knockout.
js
动态加载的。爬虫程序目前无法
请求
此内容,这导致只加载了
页面
的一小部分。我试着让程序等待,希望动态的
请求
无论如何都会被发送,但这似乎不起作用。如何才能使crawler
请求
所有数据? 谢谢!
浏览 12
提问于2019-07-09
得票数 0
1
回答
Next.
js
与CRA相比如何提高SEO?
、
、
我是这个框架的新手,在通过互动学习之后,我有一些关于Next.
js
如何处理SEO问题的问题。Next.
js
粗体功能是它在服务器端呈现React组件的能力,然而,据我所知,它只在服务器端呈现 first
请求
,而其他
请求
将在客户端呈现,那么它如何在第一个假设为SEO friendly?Based、像google这样的爬虫器访问我们的站点、然后作为完整的HTML
页面
返回第一个响应,但是对于接收到的
页面
内的其他连续链接,它如何做得更好呢?它应该使用Javascript(这是SEO的主要致命弱点
浏览 3
提问于2020-02-09
得票数 3
回答已采纳
1
回答
如何发出多个Node.
js
请求
(使用
请求
模块)
、
、
、
的主要目的:--我正在尝试使用Node.
js
从大约10,000个不同的
页面
中
抓取
数据。此代码复制了我的问题: });
浏览 0
提问于2016-03-01
得票数 0
1
回答
Html中有java脚本。如何从中提取HTML标签
、
、
、
、
root"></div> <script type="text/javascript" src="/github-user-search/app.bundle.562f293b75a96de878ab.
js
浏览 3
提问于2019-07-07
得票数 0
4
回答
Phantom.
js
能捕获所有AJAX吗?
、
、
(每个
页面
加载会导致5-6个ajax调用),因为我在这些视图中有很多视图和内部视图, 如果我运行Phantom.
js
,我能得到最终的html结果吗?
浏览 4
提问于2013-02-07
得票数 25
回答已采纳
1
回答
LESS:当前颜色上的darken()
我想对当前颜色调用LESS的darken()函数(我没有任何变量中的当前颜色)。这有可能吗?
浏览 1
提问于2014-08-23
得票数 5
1
回答
谷歌搜索引擎
、
、
很多搜索内容有用的
页面
都是用backbonejs显示的,所以所有的搜索信息都是用
js
添加的。据我所知,谷歌搜索只使用html响应来
抓取
内容,并且它不能在
js
页面
下爬行。在这种情况下,谷歌搜索引擎是否可以接受和有效地创建html
页面
,与'
js
‘
页面
中的内容相同,并且只允许google bot
请求
。其他
请求
将重定向到适当的'
js
‘
页面
吗?
浏览 2
提问于2012-07-17
得票数 0
2
回答
NodeJS HTTP
请求
队列
、
、
我已经使用puppeteer & node
js
(express)创建了scraper。这个想法是,当服务器收到http
请求
时,我的应用程序将开始
抓取
页面
。问题是,如果我的应用程序一次收到多个http
请求
。
抓取
过程将一遍又一遍地开始,直到没有http
请求
命中。如何只启动一个http
请求
并将另一个
请求
排队,直到第一个
抓取
过程完成?port = process.env.PORT || 8080; app.us
浏览 1
提问于2019-03-16
得票数 6
回答已采纳
2
回答
抓取
GWT中网页的内容
抓取
要处理的文本的最简单方法是什么? 谢谢。
浏览 0
提问于2010-01-21
得票数 0
回答已采纳
2
回答
onload
JS
DOM注入后的
抓取
页面
、
、
、
我正在构建一个从
页面
获取主图像(基于Content-Length )的
抓取
器。它遍历所有<img>元素并发出HEAD
请求
。但某些
页面
,特别是移动,在
页面
加载后插入图像。我使用的是node.
js
。
浏览 0
提问于2012-03-15
得票数 0
回答已采纳
2
回答
怎样才能用PHP curl
抓取
一个无限滚动的网页?
、
、
我想知道如何在循环中进行
抓取
(第1页,第2页等...)一个有无限循环(如imgur)的网页,例如...?<?
浏览 1
提问于2013-01-20
得票数 3
回答已采纳
1
回答
推特的网址爬虫会执行JavaScript吗?
、
当Twitter
抓取
URL以呈现Twitter卡(通过元标记配置)时,Twitter将首先执行您的JavaScript,还是要求直接从服务器发送这些标记?我问的原因是现在是2016年,所以我正在开发一个单一
页面
的应用程序。无论您
请求
什么URL,我都将返回/index.html,它获取我的
JS
,并在客户机上动态加载您
请求
的
页面
(包括元标记)。我知道Google会运行你的
JS
,但Twitter会吗?
浏览 2
提问于2016-03-09
得票数 6
回答已采纳
3
回答
如何通过哈希获取URL的内容?
、
、
我正在尝试使用file_get_contents()获取url的内容,如下所示:这很好用,但我还必须获得如下所示的
页面
内容
浏览 2
提问于2012-11-11
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Selenium抓取HTTPS请求
爬虫抓取页面图片
springboot从控制器请求至页面时js失效的解决方法
如何吸引百度蜘蛛来抓取页面,蜘蛛抓取页面的因素
爬虫抓取页面图片 update
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券