腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
JSOUP
获取
实际
页面
和
URL
中
的
最后
一个
页面
、
、
、
、
我正在尝试
获取
实际
页面
和
最后
一页,有人能帮我吗?我
的
代码: public void conectarSite(String
url
) throws IOException, InterruptedException { page =
Jsoup
.connect(
url
).data("query", "Java").userAgent("Agent").cooki
浏览 30
提问于2020-08-26
得票数 1
2
回答
Android :从
URL
下载内容,返回mp3文件
经过两天
的
研究,我没有找到任何解决我
的
问题
的
方法:http://wscompany.name.com/downloadws/getDlFile/mdkHdKy97RppVWOsIOdDBuG因此,如果我将这种
URL
浏览 1
提问于2013-05-14
得票数 2
1
回答
使用
jsoup
读取HTML
、
、
因此,我试图从
使用
Jsoup
.connect(
url
)
的
网站上
获取
元素,但是与我在网站上
使用
检查器获得
的
HTML相比,我从获得
的
HTML还没有完成。编辑:,这是我正在
使用
的
链接更新: 因此,我发现我想要
的
元素不会
使用
jsoup</e
浏览 0
提问于2018-08-16
得票数 1
1
回答
用于读取javascript生成
的
内容
的
java解析器
、
、
、
我
使用
jsoup
通过以下函数读取网页。public Document getDocuement(String
url
){ try { } catch (Exception e) {return null;
浏览 0
提问于2014-05-07
得票数 2
回答已采纳
2
回答
在文档
中
只找到了一半
的
~9000个<a>标记
、
我正在
使用
JSoup
解析一组来自HTML
页面
的XML链接。IOException e) { }它正在查找
页面
,并加载<a>文档链接
的
不到一半
的
当我
使用
IntelliJ并试图查看列表
中
的
最后
一个
xml链接时,我看到
的
是:
浏览 4
提问于2013-09-02
得票数 1
回答已采纳
1
回答
java.nio.charset.IllegalCharsetNameException:'ISO-8859-1‘
、
、
、
、
Jsoup
.connect("http://www.design.cmu.edu/community.php?
浏览 5
提问于2012-09-01
得票数 2
回答已采纳
1
回答
java解析器多页表
、
、
我
使用
Jsoup
作为html解析器,从这个中
的
表
中
获取
所有细节。
使用
下面的代码,只能获得第一页上
的
数据。有什么建议吗?String html = "http://www.fifa.com/worldranking/rankingtable/index.html#"; try { Document doc =
Jsoup
.connect
浏览 13
提问于2014-04-17
得票数 2
1
回答
如何
获取
crawler4j
中
的
url
是404还是301
是否可以在crawler4j
中
获取
URL
是404还是301?@Override String
url
= page.getWebURL().getURL();System.out.println("
URL
: " +
url
); if (page.getParseData() instanceof HtmlParseData) {System.out.println(
浏览 3
提问于2013-02-04
得票数 1
1
回答
如果网页很大,
JSOUP
不会下载完整
的
html。有什么办法可以替代这个或任何解决办法吗?
、
、
、
我试图
获取
HTML
页面
并解析信息。我刚刚发现有些
页面
没有
使用
Jsoup
完全下载。我在命令行上查看了curl命令,然后下载了整个
页面
。起初我认为它是特定于网站
的
,但后来我尝试
使用
Jsoup
随机解析任何
一个
大
的
网页,发现它没有下载完整
的
网页。我尝试指定用户代理
和
超时属性,但下载失败。System.out.println("ARTICLE 2 : "
浏览 2
提问于2015-01-22
得票数 4
回答已采纳
1
回答
Jsoup
替换给定
的
URL
、
、
我
使用
了spring boot
和
Jsoup
来解析html
页面
。我按如下方式连接
页面
: doc =
Jsoup
.connect(SOME_
URL
) } catch (IOException e) { }
Js
浏览 12
提问于2018-01-03
得票数 0
3
回答
如果网页已更新,则发出警报
、
、
、
、
我正在用Java创建
一个
应用程序,检查网页是否已更新。我真的需要一些帮助,因为我想不出
一个
万无一失
的
方法。 有什么想法吗?
浏览 0
提问于2011-09-17
得票数 1
1
回答
如何修复返回null
的
Jsoup
查询
、
、
我正在尝试
使用
loggedin从
一个
WebView
中
检索
一个
元素
的
值,我确信它存在于我正在加载
的
网页
中
,但我一直获得nullDocument doc =
Jsoup
.parse(webView.getUrl());Elements loggedin = doc.select("#lo
浏览 0
提问于2019-04-03
得票数 1
回答已采纳
2
回答
如何从网页中提取源码html?
、
、
、
我正在尝试提取此
页面
的html源代码我试着在java
中
做到这一点,先
使用
bufferedreader,然后再
使用
jsoup
。我也尝试过用python来做这件事,但是我一直收到下面的消息:最终目标是提取主表
中
的
值。
浏览 1
提问于2012-06-02
得票数 1
回答已采纳
2
回答
如何显示Web页
的
样式表
、
、
、
除了像这样
获取
每个元素
的
每个样式之外,有没有什么方法可以显示网页
的
完整CSS样式表:CSS可以在外部文件
中
,也可以在<style>标签
中
。
浏览 3
提问于2013-02-13
得票数 0
回答已采纳
2
回答
我能得到我下载
的
页面
的
url
吗?
、
、
、
、
有没有办法让我得到我刚刚下载
的
页面
的
url
?不是包含在html
页面
中
的
链接,而是
实际
html
页面
本身
的
url
?我试过这么做,string
url
= doc.location();System.o
浏览 2
提问于2015-03-09
得票数 2
3
回答
与我
的
浏览器相比,
Jsoup
给出了
一个
不同
的
HTML文档
、
、
、
我确保
使用
了浏览器
的
用户代理,但它仍然给出了
一个
不同
的
HTML。我还尝试
使用
Jsoup
.parse(
Url
,int)代替
Jsoup
.connect(String)。Intel Mac OS X 10_12_6)AppleWebKit/605.1.15 (KHTML, like Gecko) Version/11.1.1Safari/605.1.15")
和
5D=Brand%20N
浏览 38
提问于2018-07-16
得票数 3
1
回答
JSOUP
-如何
使用
JSOUP
爬行“所需登录”
页面
、
、
、
、
我在爬行
一个
坚定
的
网站有困难,我希望爬行。问题是:在成功登录到该网站后,我无法访问需要有效登录
的
链接。ioe) { } 然后我发布到登录验证
url
,它在登录后返回主页;
最后
,我尝试在登录到主
页面
后访问所需
的
登录
url
,但该请求会返回登录
页面
,就好像会话已
浏览 2
提问于2016-05-18
得票数 2
回答已采纳
1
回答
获取
url
的
Jsoup
错误
、
我只需下载最新版本
的
jsoup
(1.7.1)并遵循官方代码(更改了
url
)。然后我得到了"http错误
获取
url
"public void onCreate(BundleR.menu.activity_main, menu);} Documen
浏览 2
提问于2012-11-26
得票数 8
1
回答
Jsoup
(connect) Java需要很长时间
、
、
、
我正在尝试从许多html
页面
中
获取
几行代码。这是正常
的
吗?
使用
另
一个
解析器会有什么不同吗? Document doc =
Jsoup
.connect(
Url
).timeout(10*1000).
浏览 1
提问于2011-07-15
得票数 3
1
回答
工作
页面
上
的
Java HtmlUnit 301状态代码
、
、
当尝试通过htmlUnit加载
页面
时,我总是得到
一个
301 error,即使在浏览器中加载完全相同
的
页面
也是如此。给我错误
的
代码是 try { // webClient.getOptions().setTimeout();
浏览 0
提问于2015-07-21
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
一款快速、全面、易用的页面信息提取工具,可快速发现和提取页面中的JS、URL和敏感信息。
Java爬虫框架WebMagic的使用总结
2018 年俄罗斯世界杯之Java数据爬虫(一)
爬虫之Jsoup
Java爬虫入门篇(一)
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券