在bs4中选择id,无论是数字还是其他类型的id,可以使用find()
或find_all()
方法结合CSS选择器来实现。
如果id是一个数字,可以使用以下方式选择:
from bs4 import BeautifulSoup
# 假设HTML代码如下
html = """
<div id="123">...</div>
"""
soup = BeautifulSoup(html, 'html.parser')
# 通过find()方法选择id为数字的元素
element = soup.find(id="123")
print(element)
输出结果为:
<div id="123">...</div>
如果需要选择多个id为数字的元素,可以使用find_all()
方法:
from bs4 import BeautifulSoup
# 假设HTML代码如下
html = """
<div id="123">...</div>
<div id="456">...</div>
<div id="789">...</div>
"""
soup = BeautifulSoup(html, 'html.parser')
# 通过find_all()方法选择所有id为数字的元素
elements = soup.find_all(id=True)
for element in elements:
if element.get('id').isdigit():
print(element)
输出结果为:
<div id="123">...</div>
<div id="456">...</div>
<div id="789">...</div>
在上述代码中,id=True
表示选择所有具有id属性的元素,然后通过isdigit()
方法判断id是否为数字。
关于bs4的更多用法和详细介绍,可以参考腾讯云的相关产品文档:Beautiful Soup 4.9.0 文档。
领取专属 10元无门槛券
手把手带您无忧上云