腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
import.io和portia正则表达式url模式
、
、
我使用的是数据
采集
器: Import.io & Portia。我该如何解释结尾的"pdi-medical"?
浏览 16
提问于2016-09-09
得票数 0
3
回答
数据
采集
硬件的
java
驱动程序?
、
、
我需要进行一些数据
采集
,我想使用
Java
来编写我的数据
采集
应用程序。现在,我使用的是一个LabJack,它的驱动程序有一个
Java
包装器&对于简单的东西,它工作得很好,但是我需要升级到真正的东西。谁知道有可用的
Java
设备驱动程序的数据
采集
平台(NI或测量计算或其他平台之一)?
浏览 0
提问于2009-01-06
得票数 2
2
回答
基于PHP的Web
爬虫
或基于
JAVA
的Web
爬虫
、
、
我对基于PHP的网络
爬虫
有些怀疑,它能像基于
java
线程的
爬虫
一样运行吗?我之所以问这个问题,是因为在
java
中,线程可以一次又一次地执行,我不认为PHP有类似线程的功能,你们能说一下,哪个网络
爬虫
更能充分利用吗?基于PHP的
爬虫
还是基于
Java
的
爬虫
浏览 1
提问于2010-07-27
得票数 0
回答已采纳
2
回答
抓取图像、整个Web页面并缓存它们
我正在开始一个项目,想知道图像中的人物和图像所在的整个网页之间的关系。
浏览 0
提问于2010-06-16
得票数 0
1
回答
TSF微服务无法查看JVM监控,显示空白?
、
、
们在利用TSF开发微服务的时候,特别是在Spring Cloud框架下,为了使更好应用服务在各种条件之下能够稳定持久的运行,需要对运行服务程序的底层相关资源、JVM虚拟机的堆栈信息进行监控。
浏览 522
提问于2021-01-20
1
回答
学习多线程
Java
爬虫
的良好开端
、
、
我正在用
Java
开发一个网络
爬虫
。我正在寻找一个很好的项目开发这个
爬虫
的基础上。然而,实际上有超过几百个用
Java
编写的
爬虫
程序。我要找的是一个相当简单的
爬虫
,它有: 基于最新的
Java
构建和新的functionalityGood performanceImplemented好documentationNot的多线程documentationNot
浏览 1
提问于2012-04-16
得票数 0
回答已采纳
2
回答
对于涉及使用自然语言处理的数据密集型算法的应用程序来说,
Java
或Python是更好的选择吗?
、
、
、
、
我是一个专业的
java
开发人员,有9年的经验。我从未使用过Python,但是,我没有学习它的任何限制。利用机器学习、人工智能和自然语言处理算法对
采集
的数据进行后端处理。在探索可用的选项时,我发现Python和
Java
都有广泛的支持,框架/库/模块可以用来利用机器学习实现。然而,与
Java
一起工作给我一种强类型编程的感觉,它可以通过其健壮的多线程API来利用底层
浏览 0
提问于2017-10-03
得票数 3
回答已采纳
2
回答
需要web爬网帮助
我想知道是否有人知道他们使用过的一个像样的健壮的开源网络
爬虫
?新手应该很容易安装和使用。 感谢您没有搜索网络
爬虫
和粘贴列表。
浏览 2
提问于2010-02-21
得票数 4
1
回答
抓取的html与浏览器中的html不同
html中的几个数字被一个破折号(-)替换成了用web
采集
爬行的HTML中的数字。 HTML的所有其他内容都是相同的。即使我用
Java
代码替换web
采集
的http语句来请求HTML,这仍然不起作用。我保证我的浏览器中的URL和web
采集
中的http请求中的URL是相同的。我怎么才能让它工作呢?
浏览 0
提问于2014-09-23
得票数 1
1
回答
什么是spring mvc中的数据
采集
层和结构?
、
我有一个从设备接收数据的webapp,我有一个来自我的客户的需求,具有以下规范-数据
采集
层应该在基于开源MQ的交付机制上工作。a)数据
采集
层必须是平台无关的,能够在Linux或windows .etc.operating系统上运行,并且应该用
java
Gdk6开发)。我不知道什么是数据
采集
层请帮助我理解这个结构,我应该如何实现它
浏览 7
提问于2016-12-28
得票数 0
2
回答
与
java
集成的最佳开源图形API
建议我一个最好的开源图形API与
java
应用程序集成。从根本上说,它
采集
和存储一些data.This
采集
的数据应该绘制成一个类似于月平均数据流的图形,每周平均API应该支持广泛的图形类型,如条形图,饼图,自定义图表等。
浏览 0
提问于2009-11-25
得票数 4
回答已采纳
1
回答
支持windows增量爬行的Web
爬虫
、
、
、
、
我需要一个开源的web
爬虫
在
java
开发的增量爬行支持。 Crawl4j是一个很好的网络
爬虫</
浏览 4
提问于2014-09-22
得票数 1
回答已采纳
1
回答
java
web
爬虫
嗨,谁能推荐一个简单的
java
网络
爬虫
,爬行一个网站,并返回一个链接列表的网站?不,我不需要解析器。感谢您的关注。
浏览 2
提问于2011-03-01
得票数 0
1
回答
用于
爬虫
应用的数据库系统
、
我在一个基于
java
的
爬虫
上工作。我想在我的
爬虫
恢复功能,用户可以在任何时候暂停
爬虫
,在他想要的情况下,
爬虫
崩溃的情况下,他应该能够开始从
爬虫
停止的点上一次爬行。
浏览 2
提问于2012-01-06
得票数 1
回答已采纳
1
回答
识别搜索爬行器
、
、
、
我有一个网站,统计有多少人访问了这个特定的网页,但我不想计数什么时候搜索
爬虫
访问他们。
java
是否有任何方法来识别它是
爬虫
还是真正的用户?使用
Java
7和tomcat 谢谢
浏览 2
提问于2015-10-21
得票数 1
回答已采纳
1
回答
Web Crawler的功能
、
、
网络
爬虫
是否只从网页中返回提取的文本?例如,如果web服务器中也存储了一些pdf/doc文件。网络
爬虫
可以爬行它们并返回它们的内容吗?不管怎样,对于一个好的开源
Java
网络
爬虫
有什么建议呢? 谢谢!
浏览 2
提问于2011-06-26
得票数 0
回答已采纳
2
回答
有没有可以下载整个网站的网络
爬虫
?
、
需要知道是否有一个
爬虫
/下载器,可以抓取和下载和整个网站的链接深度至少为4页。我正在尝试下载的站点有
java
script超链接,这些超链接只能由浏览器呈现,因此
爬虫
程序无法抓取这些超链接,除非
爬虫
程序自己呈现它们!
浏览 4
提问于2010-09-30
得票数 0
回答已采纳
5
回答
Googlebot是用哪种编程语言编写的(或任何其他高效的网络
爬虫
)?
、
或者,更普遍的是,高效的网络
爬虫
是用哪种语言编写的? 我见过很多
Java
语言,但在我看来,它不是最适合开发网络
爬虫
的语言,因为它产生了太多的开销(尝试使用Heritrix网络
爬虫
,它非常重)。
浏览 0
提问于2009-10-29
得票数 1
回答已采纳
1
回答
如何解析/抓取/抓取站点以获取特定信息?
、
、
、
我最近承担了一项令我大吃一惊的任务。我的俱乐部想通过网站找到和我们一样的人。所以460个城市X 5个站点X 5个关键词=11500个不同的搜索=让人麻木的单调。问题是:我是否可以修改一些网络爬行器(在该站点或任何其他站点上)来执行搜索,并只返回关键字返回true的结果?我不关心
浏览 0
提问于2011-04-08
得票数 0
回答已采纳
1
回答
网络
爬虫
会遇到什么危险?
我刚写完一个
爬虫
,一直在想为什么爬行某个网站会很糟糕。我知道现代浏览器的风险主要是由javascript造成的。因此,我的问题是,web
爬虫
(用PHP或
Java
编写)是否能够刮起可能会对
爬虫
造成损害的站点?
浏览 3
提问于2014-11-08
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据采集之爬虫、反爬虫、反反爬虫
Python数据采集-开始爬虫
微信好友信息采集-python爬虫
爬虫架构师/数据采集总监
Python爬虫实现多线程数据采集
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券