腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
5
回答
URL中的^符号是什么意思?
、
、
我需要从网页中抓取一些链接数据,我使用了一个简单的
手写
PHP
爬虫
。
爬虫
通常工作得很好;然后我找到了一个URL,如下所示:此URL在浏览器中键入时工作正常,但我的
爬虫
程序无法检索此页面
浏览 1
提问于2010-02-25
得票数 5
回答已采纳
2
回答
基于python的Twitter社交网络
爬虫
、
、
我很抱歉问这个问题,但我是新
手写
爬虫
。对于教程之类的起点,有什么建议吗? 非常提前感谢您。
浏览 0
提问于2012-01-01
得票数 1
回答已采纳
2
回答
基于PHP的Web
爬虫
或基于
JAVA
的Web
爬虫
、
、
我对基于PHP的网络
爬虫
有些怀疑,它能像基于
java
线程的
爬虫
一样运行吗?我之所以问这个问题,是因为在
java
中,线程可以一次又一次地执行,我不认为PHP有类似线程的功能,你们能说一下,哪个网络
爬虫
更能充分利用吗?基于PHP的
爬虫
还是基于
Java
的
爬虫
浏览 1
提问于2010-07-27
得票数 0
回答已采纳
2
回答
抓取图像、整个Web页面并缓存它们
我正在开始一个项目,想知道图像中的人物和图像所在的整个网页之间的关系。
浏览 0
提问于2010-06-16
得票数 0
1
回答
从图像中获取
手写
文本
、
、
、
如何在
Java
中从图像中提取
手写
文本,如银行表单图像?我尝试使用Tesseract,OCR,GOCR,但对我不起作用。在
Java
中,有没有其他方法可以从图像中提取
手写
文本,其工作效率至少为80-90%?
浏览 17
提问于2017-05-30
得票数 1
1
回答
学习多线程
Java
爬虫
的良好开端
、
、
我正在用
Java
开发一个网络
爬虫
。我正在寻找一个很好的项目开发这个
爬虫
的基础上。然而,实际上有超过几百个用
Java
编写的
爬虫
程序。我要找的是一个相当简单的
爬虫
,它有: 基于最新的
Java
构建和新的functionalityGood performanceImplemented好documentationNot的多线程documentationNot
浏览 1
提问于2012-04-16
得票数 0
回答已采纳
2
回答
手写
识别
Java
、
大多数帖子的问题是,人们要么发表关于在屏幕上书写的软件,要么发表还不能识别
手写
的软件。我更喜欢用
java
写的东西,但是用另一种语言写的简单的东西也行。
浏览 2
提问于2012-10-31
得票数 9
回答已采纳
3
回答
将
手写
扫描文档转换为.txt文件?
、
、
有没有
JAVA
API或工具可以将
手写
扫描的文档转换为txt文件? 我已经尝试了google tesseract和其他一些工具,但是对于
手写
扫描的文档,我没有得到满意的结果。
浏览 4
提问于2012-01-04
得票数 1
回答已采纳
1
回答
C++解析代码(
手写
)
、
我需要解析一种类似于
Java
的最小化版本的语言。因为效率是最重要的因素,所以我选择
手写
解析器,而不是LRAR解析器生成器,如GOLD、bison和yacc。有没有人知道
手写
解析的好类或教程?
浏览 2
提问于2012-12-13
得票数 3
2
回答
需要web爬网帮助
我想知道是否有人知道他们使用过的一个像样的健壮的开源网络
爬虫
?新手应该很容易安装和使用。 感谢您没有搜索网络
爬虫
和粘贴列表。
浏览 2
提问于2010-02-21
得票数 4
1
回答
关于OCR产品的
手写
体测试的疑问?
、
、
、
、
在OCR产品开放的SDK中没有发现可以调用
手写
体OCR的接口,而且在
手写
体OCR页面上没有提供常用语言(比如python、
java
)的调用demo,请问可以提供一下调用demo吗?
浏览 337
提问于2019-04-25
1
回答
支持windows增量爬行的Web
爬虫
、
、
、
、
我需要一个开源的web
爬虫
在
java
开发的增量爬行支持。 Crawl4j是一个很好的网络
爬虫</
浏览 4
提问于2014-09-22
得票数 1
回答已采纳
1
回答
java
web
爬虫
嗨,谁能推荐一个简单的
java
网络
爬虫
,爬行一个网站,并返回一个链接列表的网站?不,我不需要解析器。感谢您的关注。
浏览 2
提问于2011-03-01
得票数 0
1
回答
用于
爬虫
应用的数据库系统
、
我在一个基于
java
的
爬虫
上工作。我想在我的
爬虫
恢复功能,用户可以在任何时候暂停
爬虫
,在他想要的情况下,
爬虫
崩溃的情况下,他应该能够开始从
爬虫
停止的点上一次爬行。
浏览 2
提问于2012-01-06
得票数 1
回答已采纳
2
回答
标识字符串中的名称
、
、
、
是否有任何NLP库或这些列表的
爬虫
可以利用Soundx,成熟的NLP,拼写错误等功能?我可以
手写
,但我更愿意利用一些成熟的东西。谢谢。
浏览 0
提问于2013-01-30
得票数 3
回答已采纳
1
回答
Tesseract不能用
手写
的文字识别图像,我能做什么?
、
、
、
正如我在我的中所问的那样,我面临的问题是我有数百张
手写
笔记的图片。它们是从不同的人编写的,但它们是按顺序编写的,因此您知道,例如,person1编写了img1.jpg -> img100.jpg。
浏览 8
提问于2019-10-16
得票数 0
1
回答
识别搜索爬行器
、
、
、
我有一个网站,统计有多少人访问了这个特定的网页,但我不想计数什么时候搜索
爬虫
访问他们。
java
是否有任何方法来识别它是
爬虫
还是真正的用户?使用
Java
7和tomcat 谢谢
浏览 2
提问于2015-10-21
得票数 1
回答已采纳
1
回答
Web Crawler的功能
、
、
网络
爬虫
是否只从网页中返回提取的文本?例如,如果web服务器中也存储了一些pdf/doc文件。网络
爬虫
可以爬行它们并返回它们的内容吗?不管怎样,对于一个好的开源
Java
网络
爬虫
有什么建议呢? 谢谢!
浏览 2
提问于2011-06-26
得票数 0
回答已采纳
2
回答
有没有可以下载整个网站的网络
爬虫
?
、
需要知道是否有一个
爬虫
/下载器,可以抓取和下载和整个网站的链接深度至少为4页。我正在尝试下载的站点有
java
script超链接,这些超链接只能由浏览器呈现,因此
爬虫
程序无法抓取这些超链接,除非
爬虫
程序自己呈现它们!
浏览 4
提问于2010-09-30
得票数 0
回答已采纳
5
回答
Googlebot是用哪种编程语言编写的(或任何其他高效的网络
爬虫
)?
、
或者,更普遍的是,高效的网络
爬虫
是用哪种语言编写的? 我见过很多
Java
语言,但在我看来,它不是最适合开发网络
爬虫
的语言,因为它产生了太多的开销(尝试使用Heritrix网络
爬虫
,它非常重)。
浏览 0
提问于2009-10-29
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python新手写爬虫!尝试动态加载的电影网站爬虫
【Java爬虫】测测面相
IPIDEA干货|Java爬虫与Python爬虫的区别
Java 爬虫遇上数据异步加载
Java爬虫入门篇(一)
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券