腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
Jsoup
对
数据
进行
web
抓取
、
q=handsworth我想知道我将
如何
从它的网络刮图像,标题和描述,因为下面的代码,我能够获得网页的标题。StringBuilder newsContent = new StringBuilder(); Document page =
Jsoup
.connect
浏览 17
提问于2021-01-30
得票数 0
2
回答
以编程方式设置已解析的
jsoup
网页的值
、
我
使用
JSOUP
解析了页面,并了解了输入文本字段。我
使用
了以下代码: for (Iterator<Element> iterator = elements.iterator
浏览 7
提问于2013-08-16
得票数 0
回答已采纳
1
回答
使用
Selenium和Java从网站中
抓取
数据
、
我试图刮
数据
从板球网站,并已经写了一个方法,接受一个球员的名字,并显示他们的相应
数据
。 如果您看到此方法,则取一个播放机名称并显示其所有
数据
。我的要求是显示所有球员的完整记分卡,而不是只显示一个球员的
数据
。
浏览 0
提问于2020-03-04
得票数 0
6
回答
读取JSON内容
、
、
我正在
使用
jsoup
来
抓取
一些HTML
数据
,它工作得很好。现在我需要提取一些JSON内容(只提取JSON,不提取HTML)。我能用
jsoup
很容易做到这一点吗?还是必须用另一种方法来做?
jsoup
执行的解析是
对
JSON
数据
进行
编码,因此它不能
使用
Gson正确解析。
浏览 2
提问于2011-06-15
得票数 17
回答已采纳
2
回答
用
Jsoup
初学者
抓取
网站
、
、
、
、
我正在尝试
使用
jsoup
来
抓取
一个网站。我
使用
源超文本标记语言中的".eventTableRow“类将表行提取到Elements对象中,但我不确定
如何
访问单个单元格。我正在尝试获取单元格中的
数据
,如下图中用框突出显示的
数据
:System.out.println(row); //prints,
对
我来说很难理解,我也找不到任何基本的教程。学
浏览 1
提问于2013-06-09
得票数 0
1
回答
如何
使用
Jsoup
登录网站
进行
web
抓取
、
、
我有问题,登录到网站
使用
jsoup
。 我几乎什么都试过了。阅读不同的博客/教程,但都没有帮助。以下是我到目前为止编写的代码 Connection.Response res =
Jsoup
.connect(url) .execute(); Connection.Response login =
Jsoup
.connect(url)""
浏览 12
提问于2019-04-18
得票数 0
1
回答
Groovy中的爬虫(
JSoup
与Crawler4j)
、
、
我希望在Groovy中开发一个
web
爬虫(
使用
Grails框架和MongoDB
数据
库),它能够
抓取
网站,创建站点URL及其资源类型、内容、响应时间和重定向次数的列表。我正在就
JSoup
对
Crawler4j的问题
进行
辩论。我读过他们的基本做法,但我不明白两者之间的区别。有人能建议哪一个更适合上面的功能吗?或者将两者
进行
比较是完全不正确的? 谢谢。
浏览 2
提问于2014-06-23
得票数 8
回答已采纳
3
回答
Web
抓取
只有一半的时间可以
使用
Jsoup
、
、
我最近一直在尝试
使用
Java
Jsoup
库,试图更好地理解
web
抓取
(从网站上提取
数据
)。但看起来我拼凑起来的代码只在部分时间内实现了功能。是我的代码有问题,还是有可能某些站点有措施来阻止
web
抓取
?下面是完成所有“魔术”的类:import org.
jsoup
.*;
浏览 1
提问于2011-08-11
得票数 0
1
回答
如何
抓取
不在html源中但在浏览器中可见的
数据
?
、
、
、
、
我想要的
数据
在浏览器中是可见的,但我无法从html源代码中找到它。我怀疑
数据
是由脚本生成的。我想
对
这样的
数据
进行
评分。可以
使用
Jsoup
吗?我知道
Jsoup
不会执行Javascript。以学院为例,我想要
抓取
学院和学校下的所有学院和学校。我想要获取所有学院和学校下的学院和学校。
浏览 0
提问于2012-12-02
得票数 0
回答已采纳
10
回答
使用
Java
进行
Web
抓取
、
、
我找不到任何好的基于Java的
web
抓取
API。我需要
抓取
的站点也不提供任何API;我想
使用
一些pageID遍历所有网页,并在它们的DOM树中提取HTML标题/其他内容。除了网络
抓取
之外,还有其他方法吗?
浏览 1
提问于2010-07-08
得票数 72
回答已采纳
1
回答
Selenium Chrome错误:您
使用
的是不受支持的命令行标志:--忽略证书错误
、
、
、
、
好的,我正在学习
Web
抓取
,并且
对
Java很满意,所以我选择了
Jsoup
,这是一个
web
抓取
库。我计划
抓取
(这只是一个编码问题),但我发现很难
抓取
所有显示的内容,这是不可能的,因为大部分内容是动态源。因此,我
使用
selenium来呈现JavaScript并获得简单的HTML页面,然后将其提供给
JSOUP
。因此,我尝试打印呈现的HTML页面以
进行
验证,但在运行代码时会出现以下错误:
浏览 1
提问于2018-03-03
得票数 4
1
回答
Jsoup
抓取
网站
数据
麻烦
、
对
Java和
Jsoup
来说是全新的。我正在尝试创建一个简单的程序,它可以在
web
上
抓取
数据
,并在Java中提供股票市场的
数据
。我想从道琼斯股票开始,让它打印52周的区间
数据
。我知道错误: 线程“主”org.
jsoup
.select.Selector$SelectorParseException:中的异常无法解析查询'table.W(100%)':意外令牌在'(100%)‘我
如何
使这个代码工作?我首先从苹果
浏览 2
提问于2016-11-25
得票数 0
回答已采纳
1
回答
使用
Jsoup
对
YouTube页面
进行
抓取
、
、
我正在尝试刮YouTube视频流页面以获取视频的元
数据
。我以这 YouTube页面为例。为此,我
使用
了
Jsoup
(一个Java解析器)。我得到了我想要的内容,但我只想知道这是正确的方法吗?public VideoData getVideoData(String videoUrl) throws IOException { Document doc =
Jsoup
.connect(
浏览 0
提问于2018-03-06
得票数 0
回答已采纳
4
回答
外部库是否会使应用程序变慢?
、
、
、
我正在构建一个从网页上
抓取
信息的应用程序。为此,我选择
使用
名为的html刮板,因为它
使用
起来非常简单。
Jsoup
也依赖于Apache Commons Lang libray。因此,
Jsoup
将用于下载页面并
对
其
进行
解析。 我的问题是,
使用
这些简化库,而不是
使用
Androids内置库,是否会使我的应用程序变慢?(在下载
数据
和解析方面)。我在想,内部库应该针对Android
进行
优化。
浏览 14
提问于2010-08-11
得票数 5
回答已采纳
1
回答
如何
通过servlet获取
web
浏览器上的html代码?
、
、
我需要
使用
JSoup
获取html。我现在有: .connect("http://~~~")问题:动态网站,网页延迟加载图像当我通过
jsoup
连接到站点时,该站点代码& resource & html还没有完成。延迟加载图像:未完成代码-> ~/White.png更改为已完成代码-> something.png
如何</e
浏览 5
提问于2016-02-17
得票数 0
回答已采纳
3
回答
如何
在GWT中
使用
外部服务器端jar?
、
、
我想在GWT服务器端代码上
使用
jSoup
,以便能够
抓取
网页。GWT的文档
对
安装外部jars没有帮助。谁能告诉我
如何
在
jSoup
中安装GWT (从官方
jSoup
站点下载)并在服务器端代码中
使用
它?
浏览 1
提问于2013-01-09
得票数 5
回答已采纳
1
回答
Android:解析webservices响应并存储在本地变量中
、
、
在我的
web
服务程序中,我将以字符串值的形式获得
对
logcat的响应。如果成功,则值为1;如果失败,则值为0;如果字段为空,则值为-1。{} {} 显示警报是多么容易,但由于我是
web
服务的新手,我不知道
如何
解析结果并将其存储在局部变量中。
浏览 0
提问于2011-06-30
得票数 1
回答已采纳
2
回答
android:
使用
webview仅显示页面的一部分
、
(这部分包含我想要显示的网页上的
数据
框架)提前感谢!
浏览 5
提问于2012-05-17
得票数 0
2
回答
如何
检查网页是静态的还是动态的
、
、
我正在做一些
web
抓取
和
使用
Jsoup
来解析html文件,我的理解是
Jsoup
不能很好地处理动态网页。有没有一种方法可以检查网页是否是动态的,这样我就不用费心
使用
Jsoup
来解析它了?
浏览 0
提问于2015-08-02
得票数 1
1
回答
从html <body>元素中
抓取
数据
、
、
、
我正在
使用
JSoup
,这是一个纯Java的超文本标记语言解析器库,用来从互联网上拉取和解析纯超文本标记语言页面(好吧,
使用
非常少的JS)。到目前为止,如果我想要
抓取
的
数据
被附加到一个非常冗长的HTML元素(如<a href="...."我可以很容易地在
JSoup
中获得<body>标记,但是这个标记中的文本通常是乱七八糟的,并且不可能在我需要
抓取
的许多网页(大约250个左右)中概括它里面的内容。所以我的问题是,我
如何
浏览 0
提问于2015-05-06
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何对大数据进行抓取
如何有效地使用网页操作器进行数据抓取?
使用 Spring Boot 如何快速进行 Web 微服务开发?
go使用kafka对网页浏览数据进行统计
如何使用TTS进行数据复制
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券