腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
搜索引擎在ASP.NET上的角度应用程序爬行
、
、
、
、
我使用角
js
作为我的web前端,ASP.NET作为我的后端。我正看着和,这两个看起来都像个卵子(对我来说)。
浏览 4
提问于2013-09-17
得票数 0
回答已采纳
1
回答
Kentico 12智能搜索页面爬网程序索引不起作用
我有一个Kentico 12 MVC站点,其中的cms和我猜“客户端”站点在同一服务器中,但独立的IIS条目。一个叫做admin.site.com,另一个叫做dev.site.com。页面容器>页面类型"Product“如果我使用Pages Index和search,它只抓取站点的内容小部件
浏览 19
提问于2020-05-08
得票数 0
1
回答
如何在PHP中构建一个搜索引擎来搜索多个站点的实时内容?
、
、
、
我是一个相对新手的程序员,对PHP有很好的理解,但更多的是阅读,理解和复制我需要的部分,而不是从头开始开发。我已经查看了cURL,但似乎没有提供我正在寻找的东西,除非我遗漏了什么?
浏览 5
提问于2013-02-21
得票数 0
3
回答
为什么搜索引擎
爬虫
不运行javascript?
、
、
、
我想知道为什么
爬虫
不运行javascript来获得呈现的页面和索引。这背后有什么原因?或者这是搜索引擎未来可能会出现的一个缺失的特性?
浏览 4
提问于2013-10-10
得票数 17
回答已采纳
2
回答
GWT应用程序和从服务器返回的响应
、
、
但是正如您所知道的,GWT返回
纯
空的HTML页面,其中包含.
js
文件中包含的数据。 那么,Ping服务将无法提取预定义的关键字,这是真的吗??
浏览 1
提问于2010-11-04
得票数 1
回答已采纳
1
回答
使用Qt作为
纯
终端应用的Web
爬虫
、
、
我在GUI环境中使用Qt创建了一个用于特定任务的简单web
爬虫
。现在,我想将它自动化(使用cron),并使用
纯
非GUI环境所必需的。我试图将代码移植到一个非GUI应用程序,但没有成功。我有一些问题: 如果仍然不可能,您建议获得和解析HTML页面的库是什么?(多平台和C
浏览 0
提问于2012-09-20
得票数 1
2
回答
哪种开源
爬虫
是最好的?
、
我想有一些可扩展的
爬虫
,可以抓取一个网站的列表,如果需要可以修改。
浏览 1
提问于2011-12-07
得票数 5
1
回答
我可以使用hashbang (#!)将自定义标题添加到ajax支持的网站吗?URL?
、
、
、
我使用的是ajax驱动的WordPress主题,它有像www.example.com/#!/page这样的hashbang URL。我想知道我可以为每个页面添加自定义标题和描述,因为搜索引擎优化?该网站还没有索引,所以我看不到谷歌如何看到带有hashbang URL的页面,但我假设它将具有与主页相同的标题?顺便说一句,这个网站是www.jsomedia.com
浏览 0
提问于2012-10-28
得票数 1
回答已采纳
1
回答
爬行url \如何在node.
js
中获取动态链接
、
我正在使用
js
爬虫
来抓取网站,现在我遇到了CNN,的那一部分(基于某种原因动态生成的urls)。事情是
爬虫
,不要真正接触脚本-我应该如何解决它?除了我的node.
js
爬虫
之外,我还应该编写自己的代码吗?是否有先进的
爬虫
知道如何处理这种动态行为?
浏览 1
提问于2016-07-23
得票数 2
回答已采纳
2
回答
爬虫
能解码html实体吗?
、
、
、
我想知道
爬虫
和机器人是否可以解码html实体,例如,在我的html中,我有如下内容:他们是这样读的吗?
浏览 1
提问于2010-09-02
得票数 3
回答已采纳
6
回答
如何检查文件是否为
纯
文本?
、
、
在我的程序中,用户可以加载带有链接的文件(它是一个text
爬虫
),但是我需要验证用户选择的文件是
纯
文本还是其他什么(只允许
纯
文本)。 有可能这样做吗?
浏览 15
提问于2011-07-02
得票数 8
回答已采纳
1
回答
向机器人隐藏代码
、
、
、
、
有没有一种方法只对
爬虫
隐藏页面的特定部分?那么,有没有办法对机器人隐藏某些部件,但在未来不会对用户隐瞒?不是整页,只是部分。但没有理由不让智能
js
阅读
爬虫
来隐藏它。麦芽酒
浏览 6
提问于2014-10-16
得票数 0
回答已采纳
1
回答
服务端渲染如何帮助
爬虫
?服务器端渲染和客户端渲染哪个更好?
、
、
、
我正在阅读angular的服务器端渲染文档,因为它们提到服务器端渲染是帮助
爬虫
。我知道在服务器端渲染
爬虫
可以获得整个dom,但
爬虫
也可以与组件交互,那么它如何帮助
爬虫
呢?
浏览 18
提问于2019-09-15
得票数 0
1
回答
如何在node.
js
中发出https请求
、
、
我要做个
爬虫
。对于http请求,我曾经这样做过。', function () { }); http.request(options, callback).end(); throw er; // Unhandled 'error' eventError: getaddrinfo ENOTFO
浏览 2
提问于2015-01-18
得票数 1
回答已采纳
1
回答
在性能方面,为什么facebook不一次加载所有的
JS
文件?
、
登录后,我查看了facebook中的html代码,他们似乎对
JS
文件做了很多请求(根据firebug,多达20个)。所以,虽然我知道facebook需要加载许多
JS
和CSS文件(而不是一个
JS
和一个CSS文件),但我的问题是更通用的网站和网络
爬虫
的状态。我们应该担心这些技术(通过ajax加载主要内容)会影响网络
爬虫
(googlebot和朋友)吗?我想提高性能,加载“稍后需要”的内容(text/
js
/css)似乎是个好主意,但如果
爬虫
不能使用(当然是内
浏览 2
提问于2013-03-18
得票数 3
1
回答
apache服务器上的Backbone.
js
应用程序SEO - phantom.
js
和node.
js
?
、
、
、
、
我正在工作的Backbone.
js
/木偶网站,需要搜索引擎优化(SEO)。我们使用的是java/spring RESTful后端和Apache2.2 We服务器。到目前为止我想出的解决方案是: 对于启用javascript浏览器的普通用户,使用
纯
客户端骨干实现。使用Apache的mod_rewrite将所有路径路由到我们的index.html页面,路径完好无损,以便backbone.
js
返回正确的页面,url保留其形式。使用Apache的httpd.conf文件嗅探机器人/
爬虫
,并创建重写
浏览 5
提问于2013-03-08
得票数 6
1
回答
Symfony DomCrawler如何单击执行
js
代码的链接
、
、
、
、
如何使用
爬虫
来点击执行
js
代码的链接,这个链接没有HREF属性。
爬虫
可以通过客户端在页面上执行
js
代码吗?
浏览 82
提问于2021-02-03
得票数 0
1
回答
这是一个搜索引擎优化错误,没有加载谷歌-搞笑
js
的
爬虫
?
、
不会为
爬虫
加载google-analitics
js
会导致问题吗?这对SEO不好吗?
浏览 0
提问于2017-09-19
得票数 1
1
回答
使Angular网站的AMP版本可爬行
、
、
、
、
问题是
爬虫
找不到规范的站点,因为它是通过Angular动态加载的。有没有可能绕过这个限制,比如在Angular项目的索引站点中放置对所有对象的引用?更清楚地说:object的详细视图: mysite.com/#/ detail /object1 如果我根据当前显示的对象动态添加对amp页面的引用,
爬虫
将找不到amp
浏览 1
提问于2017-09-18
得票数 0
1
回答
React / Express -服务器端呈现如何使用我的动态页面工作
、
、
、
、
我的问题是: SSR将如何与搜索引擎
爬虫
工作,以了解我的文章存在?所以,如果我要搜索“我的网站条款”或“我的网站条款栏”,它如何知道这些不同的文章存在?
浏览 2
提问于2017-03-01
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
纯前端js分页效果实现
纯python爬虫实现框架scrapy安装
Python爬虫抓取纯静态网站及其资源
Python 爬虫抓取纯静态网站及其资源
NPM酷库:jsdom,纯JS实现的DOM
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券