腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
C#
爬虫
程序无法
加载
动态
内容
、
、
、
爬虫
可以正确地请求页面,但问题是几乎所有内容都是通过knockout.
js
动态
加载
的。
爬虫
程序目前无法请求此内容,这导致只
加载
了页面的一小部分。我试着让程序等待,希望
动态
的请求无论如何都会被发送,但这似乎不起作用。如何才能使crawler请求所有数据? 谢谢!
浏览 12
提问于2019-07-09
得票数 0
1
回答
在同构React上处理SEO
、
、
、
、
我正在使用React & Node
JS
来构建通用应用程序()。我也使用反应头盔作为库来处理页面标题,元,描述等,但我有一些问题,当我使用ajax
动态
加载
内容时,谷歌
爬虫
无法正确获取我的网站,因为内容将被
动态
加载
。有什么建议来解决这个问题吗?谢谢!
浏览 1
提问于2016-09-26
得票数 0
1
回答
爬行url \如何在node.
js
中获取
动态
链接
、
我正在使用
js
爬虫
来抓取网站,现在我遇到了CNN,的那一部分(基于某种原因
动态
生成的urls)。事情是
爬虫
,不要真正接触脚本-我应该如何解决它?除了我的node.
js
爬虫
之外,我还应该编写自己的代码吗?是否有先进的
爬虫
知道如何处理这种
动态
行为?
浏览 1
提问于2016-07-23
得票数 2
回答已采纳
1
回答
对于
动态
参数的前端路由,像
动态
seo这样的情况,prerender.io能帮上忙吗?
、
、
、
、
详细问题可在此链接中找到- 现在,在这种情况下,为不同的categoryId做搜索引擎优化似乎是不可能的,因为谷歌机器人不会在爬行时等待我的服务器响应。
浏览 1
提问于2016-04-29
得票数 0
1
回答
我可以在我的网站中只呈现元标签作为SSR吗?
、
、
、
、
我的需求是拥有一个特定路由的
动态
OG (Open图)标记,这是由特定组件使用的。因为我很难将这个组件转换成SSR,因为它是一个
动态
组件,它也用于另一个页面,比如实时组件(随着用户输入而改变),所以我不认为它应该与SSR相关联,所以我想出了一个想法,我不知道它是否可行,它只将元标记呈现为
浏览 4
提问于2021-01-13
得票数 1
1
回答
在
Python
中执行网页上的Javascript方法
、
、
我正在为一个特定的网页写一个网页抓取器,我正在用"urllib2.Request( MyURL )“和"BeautifulSoup”来做这件事,但问题是在myURL中有一个页面分页,下一个页面通过点击一个链接
加载
现在,如果不从
Python
执行这个Javascript函数,我就无法获得完整的页面清单。如何从
Python
中调用此Javascript方法,以便获取该网页所有页面?
浏览 2
提问于2012-11-19
得票数 8
回答已采纳
1
回答
有没有一种HTML5方法可以有条件地在无头浏览器上排除脚本标签?
、
、
我们使用prerender类型的软件为
爬虫
呈现我们的单页面应用程序,我们想要排除所有按印象付费的第三方script标签。使用writeln或通过创建dom元素在
JS
中
动态
加载
它们意味着等待
JS
被解析以导入非常重要的库(比如Optimizely --我们希望尽可能早地
加载
它,以避免dom闪现)。 有没有类似于<!
浏览 2
提问于2017-10-11
得票数 0
2
回答
如何
加载
外部.
js
调用产生的超文本标记语言?
、
、
、
如果内容是从
JS
文件
动态
生成的(见上图),则Googlebot查看内容的方式与访问者不同(根本不对其进行索引)。/></body><body> <p>Date: timestamp by
JS<
浏览 3
提问于2017-02-15
得票数 0
3
回答
Google crawl ajax /
动态
生成的内容- SEO
、
、
、
我有一个电子商务模块,是
动态
加载
/嵌入到第三方网站,没有iframe直接的JSON到web客户端的内容。除了我的javascript文件从它们的页面
加载
并
动态
生成内容之外,我根本无法访问这些第三方站点。 我知道#!方法,但这在这里不好,我的
JS
确实在嵌入式平台中生成"urls“,但它们是假的,并且仅用于地址栏,我不相信google
爬虫
能到达这么远。所以我的问题是,有没有一个元可以设置为指向url之外的地方,即返回到我的服务器上的静态
爬虫
内容。例如,将
浏览 0
提问于2013-03-02
得票数 2
回答已采纳
3
回答
scrapy能像Selenium一样控制和显示浏览器吗?
、
、
当我使用Selenium时,我可以看到浏览器GUI,是否可以使用scrapy或严格基于scrapy命令行?
浏览 4
提问于2015-11-03
得票数 1
回答已采纳
1
回答
这是一个搜索引擎优化错误,没有
加载
谷歌-搞笑
js
的
爬虫
?
、
不会为
爬虫
加载
google-analitics
js
会导致问题吗?这对SEO不好吗?
浏览 0
提问于2017-09-19
得票数 1
1
回答
在性能方面,为什么facebook不一次
加载
所有的
JS
文件?
、
登录后,我查看了facebook中的html代码,他们似乎对
JS
文件做了很多请求(根据firebug,多达20个)。所以,虽然我知道facebook需要
加载
许多
JS
和CSS文件(而不是一个
JS
和一个CSS文件),但我的问题是更通用的网站和网络
爬虫
的状态。我们应该担心这些技术(通过ajax
加载
主要内容)会影响网络
爬虫
(googlebot和朋友)吗?我想提高性能,
加载
“稍后需要”的内容(text/
js
/css)似乎是个
浏览 2
提问于2013-03-18
得票数 3
2
回答
如何使用java或
Python
动态
读取网页中的流式/推送数据?
、
、
、
、
由于网站每5秒通过JavaScript更新一次表,因此无法为此编写
爬虫
程序,它是
动态
加载
的。 我想要这个网页中的数据表,但我不知道如何使用Java或
Python
来实现。我已经搜索了很多,大多数答案都是关于“如何从服务器流式传输数据”这样的问题,但我想要的恰恰相反,我如何从网页读取
动态
流式/推送的数据?
浏览 19
提问于2016-08-26
得票数 0
4
回答
如何延迟google爬行直到页面准备就绪
、
、
在页面
加载
之后,我在jQuery.ready(...)上有一个jQuery.ajax({}),然后我使用一些json数据填充内容。
浏览 0
提问于2012-03-23
得票数 1
回答已采纳
4
回答
如何通过
爬虫
php获取悬停数据(Ajax)
、
、
、
有没有可能用任何
爬虫
。 我使用PHP和来解析/抓取页面。
浏览 3
提问于2012-03-30
得票数 3
回答已采纳
3
回答
为什么搜索引擎
爬虫
不运行javascript?
、
、
、
我想知道为什么
爬虫
不运行javascript来获得呈现的页面和索引。这背后有什么原因?或者这是搜索引擎未来可能会出现的一个缺失的特性?
浏览 4
提问于2013-10-10
得票数 17
回答已采纳
1
回答
使用javascript对SEO友好的条件
加载
、
、
、
、
使用Javascript
加载
桌面或大屏幕HTML 不过,我在这里有个问题。据我所知,我将使用javascript
加载
的HTML内容不会被搜索引擎读取?谁能告诉我,是否可以做SEO友好的条件
加载
使用Javascript?或者,我是否需要查看服务器端语言即PHP/ASP来使用设备检测
加载
内容?
浏览 6
提问于2012-10-18
得票数 4
回答已采纳
1
回答
如果只对注册帐户可见内容,如何抓取网站?
、
我正在阅读关于网络蜘蛛的攻击和防御策略。假设我在我的网站上有敏感的信息,这些信息应该受到第三方网络蜘蛛的保护。Me:我将敏感数据设置为只对注册用户帐户可见的。游客帐户看不见他们,因此不能爬行。用例2:攻击者:注册(或购买)多个帐户,使用多个帐户以分布式和自动的方式爬行,因此单个帐户看起来不那么可疑。在这两个用例中,攻击者的方法实用吗? 防止这两次攻击的重要秘诀是什么?
浏览 0
提问于2019-08-02
得票数 3
回答已采纳
1
回答
动态
内容和
爬虫
搜索引擎
爬虫
会使用Javascript和API调用来索引
动态
加载
的内容吗?或者我必须通过服务器端编程(PHP、ASP等)
加载
此内容。
浏览 7
提问于2012-09-03
得票数 1
回答已采纳
1
回答
爬虫
不读取我的javascript附加的meta标签
、
、
、
爬虫
在我的头中没有通过脚本附加的meta标签:有没有合适的
JS
代码格式可以不阻止
爬虫
抓取我的脚本?
浏览 1
提问于2020-12-15
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python爬虫——利用PhantomJS下载动态加载图片
Python新手写爬虫!尝试动态加载的电影网站爬虫
Python爬虫入门7 分类爬取豆瓣电影,解决动态加载问题
动态网页常用的两种数据加载方式ajax和js动态请求
Python中使用selenium进行动态爬虫
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券