腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
Robots.txt和Coldfusion
、
、
我知道您可以禁止
爬虫
中的: /page1.cfm,但是如果我只想禁止该页面的一部分,比如该页面上存在的链接或联系人表单,该怎么办?这种功能有可能实现吗?根据我最近读到的一些论坛,"nofollow“功能不再有效,因为
爬虫
变得更智能了。(我不知道那个论坛的可信度如何,所以如果有人有更好的来源,请分享) 有什么建议吗?
浏览 2
提问于2012-06-02
得票数 1
回答已采纳
1
回答
您能使用AWS摄取
加密
的S3对象(文本文件)吗?
、
、
、
、
我在S3中有一个
加密
的文本文件。我希望使用AWS Glue将这些数据加载到RDS Aurora。 如果不是,什么最好的方式来摄取
加密
的数据到AWS胶,而不解密它。
浏览 0
提问于2019-04-30
得票数 1
回答已采纳
3
回答
高效网络
爬虫
的语言建议
、
、
、
我正在寻找一种语言来编写一个高效的网络
爬虫
。我所看重的东西:我试过node.
js
。
浏览 6
提问于2010-12-03
得票数 2
1
回答
解密不适用于使用
加密
值进行查询的记录
、
、
、
我有一个用户表,我需要在其中存储
加密
格式的电子邮件。我可以通过在用户模型中将值encrypted设置为true来做到这一点。但当我试图根据电子邮件id获取数据时。我正在传递没有
加密
值的纯文本格式的电子邮件id,并试图找到具有该值的记录。但我无法发现值始终为空。 有没有办法用解密的值和以
加密
格式存储的值来查询记录?? 下面是我正在尝试做的代码片段。
浏览 15
提问于2020-08-17
得票数 0
2
回答
抓取图像、整个Web页面并缓存它们
我正在开始一个项目,想知道图像中的人物和图像所在的整个网页之间的关系。
浏览 0
提问于2010-06-16
得票数 0
2
回答
基于PHP的Web
爬虫
或基于
JAVA
的Web
爬虫
、
、
我对基于PHP的网络
爬虫
有些怀疑,它能像基于
java
线程的
爬虫
一样运行吗?我之所以问这个问题,是因为在
java
中,线程可以一次又一次地执行,我不认为PHP有类似线程的功能,你们能说一下,哪个网络
爬虫
更能充分利用吗?基于PHP的
爬虫
还是基于
Java
的
爬虫
浏览 1
提问于2010-07-27
得票数 0
回答已采纳
1
回答
如何使用PHP从另一个网站获取数据并将其存储在MySQL数据库中?
、
、
我需要使用PHP从网站中获取数据,并将其保存在MySQL数据库中。我还想获取图像并将它们保存在我的服务器中,以便在我的站点中显示它们。我听说可以使用API,但是我想知道我是否可以使用CURL来完成这个任务。我想每天获取大量的数据,那么使用CURL会消耗大量的服务器端资源吗?还有哪些其他方法可以获取数据?
浏览 5
提问于2011-08-17
得票数 1
3
回答
为搜索引擎爬网程序创建窗体身份验证cookie
、
、
问题是,整个intranet都在使用表单身份验证,因此
爬虫
必须在没有实际用户凭证(例如用户名和密码)的情况下访问每个应用程序。因此,我的想法是让
爬虫
创建一个cookie,该cookie将
爬虫
标识为具有每个应用程序的所有角色。
浏览 1
提问于2011-11-28
得票数 0
回答已采纳
3
回答
用字体对密文进行视觉解密是否可行?
、
目的是避免容易被Web
爬虫
复制的文章。生成一个字体,以抵消替换和传输到Web前端.(这是通过让文本字符呈现代替它们的实际字符来实现的。)
爬虫
者看到的是胡言乱语。目标已实现。
浏览 0
提问于2017-09-05
得票数 2
6
回答
谷歌在我的网站上索引了我的测试文件夹:(我如何限制网络
爬虫
!
、
、
救命救命!谷歌在我的网站上索引了一个测试文件夹,除了我应该知道的以外,没有人知道:(!如何限制google索引链接和某些文件夹。
浏览 0
提问于2009-06-11
得票数 2
回答已采纳
5
回答
如何阻止
爬虫
(如spyder/Nutch-2 )访问特定的页面?
、
、
、
、
在这个php页面中,我将返回一个
加密
的json。同样在这个页面中,我有一段代码来跟踪哪个in正在访问这个php页面,并且我注意到有一个spyder/Nutch-2
爬虫
正在访问这个页面。我在想,一个
爬虫
怎么可能找到一个没有在任何搜索引擎中发布的页面。我有办法阻止
爬虫
访问这个特定的页面吗? 我应该使用.htaccess文件来配置它吗?
浏览 7
提问于2014-04-15
得票数 1
1
回答
使用
加密
JS
实现
Java
到
JS
和
JS
到
Java
加密
、
、
、
、
几周前,我在这个岗位上工作得很好:javax.crypto.BadPaddingException: Given final block(CipherCore.
java
:824)at javax.crypto.Cipher.doFinal编辑
加密
字符串如下:{"company_name":
浏览 5
提问于2015-05-21
得票数 8
回答已采纳
1
回答
爬行url \如何在node.
js
中获取动态链接
、
我正在使用
js
爬虫
来抓取网站,现在我遇到了CNN,的那一部分(基于某种原因动态生成的urls)。事情是
爬虫
,不要真正接触脚本-我应该如何解决它?除了我的node.
js
爬虫
之外,我还应该编写自己的代码吗?是否有先进的
爬虫
知道如何处理这种动态行为?
浏览 1
提问于2016-07-23
得票数 2
回答已采纳
1
回答
学习多线程
Java
爬虫
的良好开端
、
、
我正在用
Java
开发一个网络
爬虫
。我正在寻找一个很好的项目开发这个
爬虫
的基础上。然而,实际上有超过几百个用
Java
编写的
爬虫
程序。我要找的是一个相当简单的
爬虫
,它有: 基于最新的
Java
构建和新的functionalityGood performanceImplemented好documentationNot的多线程documentationNot
浏览 1
提问于2012-04-16
得票数 0
回答已采纳
2
回答
使用用户登录从其他网站导入用户帐户数据
、
、
、
到目前为止,我能够发现网络
爬虫
/蜘蛛可以用来从网页上删除数据。但我不确定网络
爬虫
在我们需要用户登录并且页面urls是
加密
的,或者至少是动态生成的urls的情况下是否有用。如果
爬虫
是这个问题的解决方案,请提供一些我可以在我的.net应用程序中使用的web
爬虫
API的链接。Atif
浏览 4
提问于2011-09-09
得票数 0
回答已采纳
1
回答
向机器人隐藏代码
、
、
、
、
有没有一种方法只对
爬虫
隐藏页面的特定部分?那么,有没有办法对机器人隐藏某些部件,但在未来不会对用户隐瞒?不是整页,只是部分。但没有理由不让智能
js
阅读
爬虫
来隐藏它。麦芽酒
浏览 6
提问于2014-10-16
得票数 0
回答已采纳
2
回答
如何用
java
读取网站的源代码
、
我正在尝试用
Java
编写一个web
爬虫
,到目前为止,它主要是起作用的,尽管我在使用JavaScript或PHP动态获取内容的网站上有问题,例如,如果我尝试抓取一个tumblr博客,而不是通过链接和所有我只获得
浏览 0
提问于2012-12-20
得票数 2
1
回答
服务端渲染如何帮助
爬虫
?服务器端渲染和客户端渲染哪个更好?
、
、
、
我正在阅读angular的服务器端渲染文档,因为它们提到服务器端渲染是帮助
爬虫
。我知道在服务器端渲染
爬虫
可以获得整个dom,但
爬虫
也可以与组件交互,那么它如何帮助
爬虫
呢?
浏览 18
提问于2019-09-15
得票数 0
1
回答
创建AWS Glue Crawler时拒绝访问
、
、
、
我试图在AWS中创建一个
爬虫
,但是它给出了错误:{"service":"AWSGlue","statusCode":400,"errorCode":"AccessDeniedException","requestId这就是我到目前为止所做的: accountChoose 在AWS 中创建一个数据库,在数据库中使用
爬虫
名称--
爬虫
--选择AmazonS3作为数据存储,并在我的中指定一个存储桶内的csv文件的路径,这是我在我已经将Adm
浏览 3
提问于2022-08-02
得票数 1
回答已采纳
1
回答
如何在node.
js
中发出https请求
、
、
我要做个
爬虫
。对于http请求,我曾经这样做过。', function () { }); http.request(options, callback).end(); throw er; // Unhandled 'error' eventError: getaddrinfo ENOTFO
浏览 2
提问于2015-01-18
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
【Java爬虫】测测面相
IPIDEA干货|Java爬虫与Python爬虫的区别
js加密学习之有道字典
Java 爬虫遇上数据异步加载
学习分享Java爬虫伪代码
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券