腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
HtmlUnit与HttpUnit的性能比较
、
我想
写
爬虫
,支持cookie存储操作和会话。
java
无头浏览器有两种不同的实现方式。HtmlUnit对javascript和html解析有更好的支持。但是,有什么理由使用HttpUnit来提高
爬虫
的性能呢?
浏览 1
提问于2011-08-28
得票数 2
1
回答
Crawler登录到gmail电子邮件帐户
、
我想
写
一个
爬虫
在
Java
中自动登录到gmail帐户。我的
爬虫
将获得登录Id和密码,并将登录到电子邮件帐户,并显示输出页面。我不清楚该怎么做。谁能告诉我如何编写
爬虫
登录到gmail电子邮件帐户?任何回应都将不胜感激。 提前谢谢。
浏览 2
提问于2010-08-27
得票数 1
2
回答
一个数组能容纳多少个字符串?
、
、
、
我正试着
写
一个网络
爬虫
。当我浏览一个大页面时,我的arraylist变量无法保存所有数据。它被抛到了异常之下。线程
java
.lang.StackOverflowError".中的异常" thread -0“ 保存这些urls的最佳方法是什么,因为我需要访问那些urls和子urls等等。我想保存到数据库或写入文件,但这些机制可能会减慢
爬虫
性能。
浏览 0
提问于2015-11-19
得票数 0
0
回答
rocketmq_exporter
采集
不到retry topic得消息堆积?
image.png image.png
浏览 372
提问于2020-01-06
1
回答
import.io和portia正则表达式url模式
、
、
我使用的是数据
采集
器: Import.io & Portia。我该如何解释结尾的"pdi-medical"?
浏览 16
提问于2016-09-09
得票数 0
5
回答
如何使jar文件在启动时运行&以及何时退出?
、
、
、
更多详情:
爬虫
是用
java
编写的,因此现在它是一个jar。此外,我希望它继续运行,即使当我注销。我不确定这是可能的,但大多数时候我都是注销的,而且我仍然希望它能够爬行。 有什么想法吗?
浏览 0
提问于2012-01-28
得票数 29
回答已采纳
3
回答
高效网络
爬虫
的语言建议
、
、
、
我正在寻找一种语言来编写一个高效的网络
爬虫
。
浏览 6
提问于2010-12-03
得票数 2
3
回答
用
Java
创建web索引器?
、
、
我应该用
Java
写
一个网络
爬虫
。爬行部分很容易,但索引部分很难。我需要能够查询索引器,并让它返回匹配(多个单词查询)。做这样的事情最好的数据结构是什么?
浏览 2
提问于2009-12-02
得票数 0
1
回答
为什么我的Crawler会得到错误的HTML代码?
、
我想用
java
写
一个
爬虫
来做一些学校练习。实际上,用jsoup库实现的
爬虫
代码可以工作,因为我的请求的结果是一些HTML代码,但是当我搜索一个明确写在网站上的单词时,没有找到它,因为一些div的来自于空的
爬虫
。
浏览 0
提问于2019-09-12
得票数 1
回答已采纳
1
回答
如果要编写多线程爬行器,应选择哪个web服务提供商
如果我想
写
一个多线程
爬虫
,我想知道哪个是最好的best服务提供商。Appengine,ec2.... Appengine
java
显然有一些限制..此外,一个免费将是伟大的,因为我只是测试应用程序。
浏览 2
提问于2009-12-17
得票数 0
1
回答
如何使用PHP从另一个网站获取数据并将其存储在MySQL数据库中?
、
、
我需要使用PHP从网站中获取数据,并将其保存在MySQL数据库中。我还想获取图像并将它们保存在我的服务器中,以便在我的站点中显示它们。我听说可以使用API,但是我想知道我是否可以使用CURL来完成这个任务。我想每天获取大量的数据,那么使用CURL会消耗大量的服务器端资源吗?还有哪些其他方法可以获取数据?
浏览 5
提问于2011-08-17
得票数 1
3
回答
如何在
java
中使用HTTP代理
、
、
我正在
写
一个代码,连接到网站,并检查一些代码,如
爬虫
。但我需要通过代理连接并更改IP地址(这样它就不会在服务器日志中显示客户端的IP )。 如何通过
java
做到这一点呢?
浏览 0
提问于2011-01-05
得票数 22
1
回答
Java
/1.7.0_07作为用户代理
、
几乎每天都有东西(应该是一个机器人)访问我网站上的所有页面(除其他外,它不能正确处理urls中的空间),以
Java
/1.7.0_07 (或不同的
java
版本)作为参考。谢谢
浏览 0
提问于2012-10-17
得票数 2
回答已采纳
4
回答
jQuery日期时间格式化程序
、
我找到了一些,但它们是: 当然,我可以实现它,但最好是重用它。我寻求类似于
Java
的的功能
浏览 5
提问于2010-08-14
得票数 3
回答已采纳
3
回答
数据
采集
硬件的
java
驱动程序?
、
、
我需要进行一些数据
采集
,我想使用
Java
来编写我的数据
采集
应用程序。现在,我使用的是一个LabJack,它的驱动程序有一个
Java
包装器&对于简单的东西,它工作得很好,但是我需要升级到真正的东西。谁知道有可用的
Java
设备驱动程序的数据
采集
平台(NI或测量计算或其他平台之一)?
浏览 0
提问于2009-01-06
得票数 2
1
回答
如何在PHP中构建一个搜索引擎来搜索多个站点的实时内容?
、
、
、
我是一个相对新手的程序员,对PHP有很好的理解,但更多的是阅读,理解和复制我需要的部分,而不是从头开始开发。我已经查看了cURL,但似乎没有提供我正在寻找的东西,除非我遗漏了什么?
浏览 5
提问于2013-02-21
得票数 0
1
回答
编写可与任何服务器保持登录状态的crawler
、
、
、
、
我正在
写
一个
爬虫
。一旦
爬虫
登录到一个网站,我想使
爬虫
“停留-始终登录”。我该怎么做呢?客户端(如浏览器、
爬虫
等)使服务器遵守此规则吗?当服务器在一天内允许有限的登录时,可能会出现这种情况。
浏览 0
提问于2009-11-26
得票数 0
回答已采纳
2
回答
在网站和独立应用程序中使用Django框架
、
我计划为它
写
一个网络
爬虫
和一个基于网络的前端(或者至少是它找到的信息)。我想知道是否可以使用Django框架让网络
爬虫
使用与网站相同的MySQL后端(而不是让网络
爬虫
本身成为“网站”)。
浏览 1
提问于2009-06-04
得票数 1
回答已采纳
2
回答
基于PHP的Web
爬虫
或基于
JAVA
的Web
爬虫
、
、
我对基于PHP的网络
爬虫
有些怀疑,它能像基于
java
线程的
爬虫
一样运行吗?我之所以问这个问题,是因为在
java
中,线程可以一次又一次地执行,我不认为PHP有类似线程的功能,你们能说一下,哪个网络
爬虫
更能充分利用吗?基于PHP的
爬虫
还是基于
Java
的
爬虫
浏览 1
提问于2010-07-27
得票数 0
回答已采纳
2
回答
抓取图像、整个Web页面并缓存它们
我正在开始一个项目,想知道图像中的人物和图像所在的整个网页之间的关系。
浏览 0
提问于2010-06-16
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据采集之爬虫、反爬虫、反反爬虫
Python数据采集-开始爬虫
不用写代码,现成的网络爬虫帮你采集大众点评商家数据及联系方式
微信好友信息采集-python爬虫
爬虫架构师/数据采集总监
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券