from bs4 import BeautifulSoup
html = '''
<html>
<head>
<title>获取节点信息</title>
</head>
<body>
<div>
<ul>
<li class="item1" value1="1234", value2="hello world"><a href="https://www.xxx.com">ruochen</a></li>
<li class="item2"><a href="https://www.xxx.com">若尘</a></li>
</ul>
<button id="button1">确定</button>
<ul>
<li class="item3"><a href="https://www.taobao.com">淘宝</a></li>
<li class="item4"><a href="https://www.microsoft">微软</a></li>
<li class="item5"><a href="https://www.google.com">谷歌</a></li>
</ul>
</div>
<body>
'''
soup = BeautifulSoup(html, 'lxml')
print(soup.title.name)
print(soup.title.text)
print(soup.li.attrs)
print(soup.li.attrs['value2'])
print(soup.li['value1'])
print(soup.a['href'])
print(soup.a.string)
print(soup.a.text)
title
获取节点信息
{'class': ['item1'], 'value1': '1234', 'value2': 'hello world'}
hello world
1234
https://www.xxx.com
ruochen
ruochen
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有