腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
爬行url \如何在node.
js
中获取
动态
链接
、
我正在使用
js
爬虫
来抓取网站,现在我遇到了CNN,的那一部分(基于某种原因
动态
生成的urls)。事情是
爬虫
,不要真正接触脚本-我应该如何解决它?除了我的node.
js
爬虫
之外,我还应该编写自己的代码吗?是否有先进的
爬虫
知道如何处理这种
动态
行为?
浏览 1
提问于2016-07-23
得票数 2
回答已采纳
1
回答
爬虫
不读取我的javascript附加的meta标签
、
、
、
爬虫
在我的头中没有通过脚本附加的meta标签:有没有合适的
JS
代码格式可以不阻止
爬虫
抓取我的脚本?
浏览 1
提问于2020-12-15
得票数 1
1
回答
C#
爬虫
程序无法加载
动态
内容
、
、
、
爬虫
可以正确地请求页面,但问题是几乎所有内容都是通过knockout.
js
动态
加载的。
爬虫
程序目前无法请求此内容,这导致只加载了页面的一小部分。我试着让程序等待,希望
动态
的请求无论如何都会被发送,但这似乎不起作用。如何才能使crawler请求所有数据? 谢谢!
浏览 12
提问于2019-07-09
得票数 0
2
回答
getStaticProps + fallback:true和getServerSideProps到底有什么不同?
、
、
{ id: '1' } }, { params: { id: '2' } }]} 但是,如果我们将fallback:true放在函数返回处,并且在构建时没有生成对页面的请求,那么Next.
js
据我所知,如果我们使用Next.
js
,getServerSideProps将预先呈现每个请求。但为什么我们需要它,当我们可以使用getStaticProps获得最新的数据,我认为这是更好的TTPB?
浏览 2
提问于2021-02-09
得票数 2
回答已采纳
2
回答
元标记不应该使用
JS
动态
更改吗?
、
、
如果我想要更改数据,我可以使用
JS
来完成,而无需重新加载页面。百事大吉。 但是,现在,我了解到元标签不能使用
js
更改,应该让它重新加载/刷新page...is,这是正确的吗?
浏览 14
提问于2019-08-18
得票数 2
1
回答
水疗网站,做一个HTML版本的搜索引擎优化是值得的吗?
、
、
、
我做了一个Vue.
js
SPA,因为它可能会影响搜索引擎优化(特别是因为我的大部分客户群不使用谷歌),我在想:为什么不为它提供一个HTML版本呢?
浏览 0
提问于2018-11-26
得票数 1
1
回答
Angular
js
动态
爬虫
不工作
、
、
og:title" content="The post title" /> 但是使用
动态
数据的时候是行不通的
浏览 0
提问于2017-09-26
得票数 0
1
回答
我可以在我的网站中只呈现元标签作为SSR吗?
、
、
、
、
我的需求是拥有一个特定路由的
动态
OG (Open图)标记,这是由特定组件使用的。因为我很难将这个组件转换成SSR,因为它是一个
动态
组件,它也用于另一个页面,比如实时组件(随着用户输入而改变),所以我不认为它应该与SSR相关联,所以我想出了一个想法,我不知道它是否可行,它只将元标记呈现为
浏览 4
提问于2021-01-13
得票数 1
2
回答
颤振网络: SPA:开放图形:
动态
分配og:图像元标记
、
、
、
、
试图创建
动态
og:图像标签,供
爬虫
捕捉适当的缩略图。我有一个
JS
脚本,生成适当的og:image url,但是
爬虫
在搜索时似乎没有运行任何
JS
。有更好的方法吗?
浏览 0
提问于2020-08-11
得票数 3
回答已采纳
1
回答
在同构React上处理SEO
、
、
、
、
我正在使用React & Node
JS
来构建通用应用程序()。我也使用反应头盔作为库来处理页面标题,元,描述等,但我有一些问题,当我使用ajax
动态
加载内容时,谷歌
爬虫
无法正确获取我的网站,因为内容将被
动态
加载。有什么建议来解决这个问题吗?谢谢!
浏览 1
提问于2016-09-26
得票数 0
3
回答
scrapy能像Selenium一样控制和显示浏览器吗?
、
、
当我使用Selenium时,我可以看到浏览器GUI,是否可以使用scrapy或严格基于scrapy命令行?
浏览 4
提问于2015-11-03
得票数 1
回答已采纳
4
回答
如何通过
爬虫
php获取悬停数据(Ajax)
、
、
、
有没有可能用任何
爬虫
。 我使用PHP和来解析/抓取页面。
浏览 3
提问于2012-03-30
得票数 3
回答已采纳
1
回答
对于
动态
参数的前端路由,像
动态
seo这样的情况,prerender.io能帮上忙吗?
、
、
、
、
详细问题可在此链接中找到- 现在,在这种情况下,为不同的categoryId做搜索引擎优化似乎是不可能的,因为谷歌机器人不会在爬行时等待我的服务器响应。
浏览 1
提问于2016-04-29
得票数 0
2
回答
LinkedIn crawler可以读取SPA页面吗?
、
、
、
、
我在使用的同时使用了PhantomJS。我能做些什么来解决这个问题呢?
浏览 2
提问于2013-10-20
得票数 7
1
回答
如果只对注册帐户可见内容,如何抓取网站?
、
我正在阅读关于网络蜘蛛的攻击和防御策略。假设我在我的网站上有敏感的信息,这些信息应该受到第三方网络蜘蛛的保护。Me:我将敏感数据设置为只对注册用户帐户可见的。游客帐户看不见他们,因此不能爬行。用例2:攻击者:注册(或购买)多个帐户,使用多个帐户以分布式和自动的方式爬行,因此单个帐户看起来不那么可疑。在这两个用例中,攻击者的方法实用吗? 防止这两次攻击的重要秘诀是什么?
浏览 0
提问于2019-08-02
得票数 3
回答已采纳
1
回答
如何设置支持一系列
动态
URL的AdSense
爬虫
登录?
、
、
我有一个网站,主要功能
动态
内容。每一段
动态
内容都有自己的网址,如"www.example.com/page/\*/\*“ 我遇到的问题是,其中许多页面都需要用户登录。我读过关于AdSense
爬虫
登录的文章,并试图实现它。但是,我发现没有提到通配符或URL的正则表达式。据我所知,AdSense
爬虫
登录只支持静态URL。是否有任何方法来设置支持一系列
动态
URL的AdSense
爬虫
登录?
浏览 0
提问于2015-02-03
得票数 3
1
回答
检测
爬虫
程序并从服务器加载模板
、
、
、
对于社交共享,将会有元标签的
动态
值,例如og:title或og:image。我可以设置meta标记值。但当我查看facebook调试器时,它接受了旧的/默认的元内容。但是我们如何在VUE
JS
中做到这一点呢?提前谢谢。
浏览 6
提问于2018-11-05
得票数 0
2
回答
如何加载外部.
js
调用产生的超文本标记语言?
、
、
、
如果内容是从
JS
文件
动态
生成的(见上图),则Googlebot查看内容的方式与访问者不同(根本不对其进行索引)。假设我有以下代码:<div>Bunch of Content</div> <p>Date: timestam
浏览 3
提问于2017-02-15
得票数 0
3
回答
Google crawl ajax /
动态
生成的内容- SEO
、
、
、
我有一个电子商务模块,是
动态
加载/嵌入到第三方网站,没有iframe直接的JSON到web客户端的内容。除了我的javascript文件从它们的页面加载并
动态
生成内容之外,我根本无法访问这些第三方站点。 我知道#!方法,但这在这里不好,我的
JS
确实在嵌入式平台中生成"urls“,但它们是假的,并且仅用于地址栏,我不相信google
爬虫
能到达这么远。所以我的问题是,有没有一个元可以设置为指向url之外的地方,即返回到我的服务器上的静态
爬虫
内容。例如,将规范指向我的服务器...但我再说一次
浏览 0
提问于2013-03-02
得票数 2
回答已采纳
4
回答
如果我通过JavaScript在页面中添加内容,它会被搜索引擎蜘蛛爬行吗?
、
、
、
、
如果我通过JavaScript在页面中添加内容,它会被搜索引擎蜘蛛爬行并通过屏幕阅读器访问吗?var tip = "<p>Most computers will open PDF documents ";tip += "need to download <a title='Link to Adobe website-opens in a new window'"; tip +=" href='http://www.
浏览 2
提问于2010-06-22
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python新手写爬虫!尝试动态加载的电影网站爬虫
Python中使用selenium进行动态爬虫
Python爬虫——利用PhantomJS下载动态加载图片
爬虫之旅(2)——网页知识储备html、css及js
JS实现QQ空间自动给好友动态点赞
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
腾讯会议
活动推荐
运营活动
广告
关闭
领券