首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >Java爬虫框架:jsoup

Java爬虫框架:jsoup

作者头像
逍遥子大表哥
发布2021-12-17 13:53:45
发布2021-12-17 13:53:45
1.5K0
举报
文章被收录于专栏:kali blogkali blog

jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。

代码语言:javascript
复制
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;


public class Lcy {
    public static void main(String[] args) {
        String html = "<a href=\"http://bbskali.cn">kali论坛</a>";
        Document doc = Jsoup.parse(html);
        Elements link = doc.getElementsByTag("a");
        Element a = link.get(0);
        System.out.println(a.attr("href"));
    }
}

版权属于:逍遥子大表哥

本文链接:https://cloud.tencent.com/developer/article/1920546

按照知识共享署名-非商业性使用 4.0 国际协议进行许可,转载引用文章应遵循相同协议。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档