如何使用Beautiful soup从没有类名或id的嵌套<li>访问<i>标记

Beautiful Soup 是一个用于解析 HTML 和 XML 文档的 Python 库。它提供了一种方便的方式来遍历、搜索和修改文档树，使得从没有类名或id的嵌套 <li> 访问 <i> 标记变得简单。

要使用 Beautiful Soup 解析文档，首先需要安装该库。可以通过以下命令使用 pip 进行安装：

pip install beautifulsoup4

安装完成后，可以按照以下步骤使用 Beautiful Soup 进行解析：

导入库：

from bs4 import BeautifulSoup

创建 Beautiful Soup 对象：

soup = BeautifulSoup(html_doc, 'html.parser')

其中，html_doc 是要解析的 HTML 文档。

使用 Beautiful Soup 对象进行文档遍历和搜索：

# 遍历文档树
for tag in soup.find_all('li'):
    # 处理每个 <li> 标记
    # ...
    
# 搜索文档树
tag = soup.find('i')
# 处理找到的 <i> 标记
# ...

在遍历文档树时，可以使用 find_all 方法来查找所有符合条件的标记。在搜索文档树时，可以使用 find 方法来查找第一个符合条件的标记。

Beautiful Soup 还提供了其他一些方法和属性，用于获取标记的文本内容、属性值等信息。具体使用方法可以参考 Beautiful Soup 的官方文档：Beautiful Soup 官方文档

腾讯云相关产品中，与 Beautiful Soup 相关的可能是与爬虫、数据采集等相关的产品。例如，可以使用腾讯云的云服务器（CVM）来部署爬虫程序，使用腾讯云的对象存储（COS）来存储爬取的数据等。具体推荐的产品和产品介绍链接地址可以参考腾讯云的官方网站。

如何使用Beautiful soup从没有类名或id的嵌套<li>访问<i>标记

、

我想使用漂亮的汤从链接访问‘R’列我的代码： rupees= job.ul.find('li').find('i',class_='material-icons rupee') 结果:无预期:卢比1.10

浏览 20提问于2021-07-13得票数 0

回答已采纳

3回答

BeautifulSoup -如何单独查找特定的类名

、

如何找到具有特定类名而不是其他类名的li标记？例如：<li class="a"> not his one </li> <li class="a z"> neither this one <&

浏览 0提问于2018-03-06得票数 5

3回答

使用BeautifulSoup4查找包含文本的所有终端节点。

、、

我是Python和BeautifulSoup4的新手以下是我的尝试： content = soup.find_all("b", "div", "p", text=True, recursive=Fa

浏览 1提问于2019-01-19得票数 5

回答已采纳

2回答

美丽的汤:从没有id的<ul>访问<li>元素

、、、

en.wikipedia.org/wiki/"+"january"+"_"+"1"page = urllib2.urlopen(req)这一切都很好，我得到了整个HTML页面，但我想要特定的数据，我不知道如何使用没有id的</

浏览 0提问于2013-07-17得票数 2

回答已采纳

2回答

递归迭代div - BeautifulSoup中的嵌套标记

、

我想使用Beautiful Soup浏览div标记来提取一些数据。<li> Item 2 </li> </ul></div> 原始

浏览 9提问于2020-04-08得票数 0

1回答

我想在多个div中的嵌套元素中刮取文本。

、、、、

使用BeautifulSoup4 for python3，我想在div中的嵌套元素中刮取文本。但是首先，我想提取也嵌套在div中的元素中的链接。我将如何获取链接LINK-I-WANT.COM和嵌套在以下内容中的图像IMAGE-I-WANT.JPG： <div class="LINK_CL

浏览 1提问于2015-12-23得票数 1

回答已采纳

3回答

可以提取div data-app数据吗？

、、、

当我检查html源代码时，它嵌套在这个div data-app中，如下所示： <div data-app="true" id="app" class="application application--/div><ul data-uid="669" class="

浏览 55提问于2021-11-03得票数 0

2回答

如何在div标记子元素中调用onclick事件

、、

需要从没有ID或名称的div标签的子元素中调用onclick方法。在我的网站上有很多div标签。我想要遍历特定的div标记，它有类名，并获取它的子元素，一个也有id的标记，并调用其中包含的onclick方法。HTML：新事件我在c#中使用了web浏览器控件，但无法访问该标签并调用该方法，因

浏览 3提问于2014-07-16得票数 0

3回答

以li为目标的CSS

我是css的新手，有人能告诉我如何用子弹瞄准这个类吗？"><a href="#">Employment Law</a></li> <&#x

浏览 0提问于2012-08-31得票数 0

1回答

用Python中的Selenium，美观汤刮光盒覆盖

、、

我有一点困难，让我的代码，以解决问题。我正在尝试使用selenium、漂亮的汤和python来抓取覆盖层或灯箱的内容。我不太清楚覆盖是如何创建的，但我认为它的ajax 当我运行下面的python2.7代码时，火狐浏览器打开，导航到页面，点击正确的链接并显示覆盖到用户，我可以检查它的标签和标记使用火狐，但我不知道如何让python访问覆盖。#Imp

浏览 1提问于2015-11-24得票数 3

回答已采纳

3回答

访问无序列表中嵌套子列表中的父li

、、

我有以下嵌套的无序列表结构。我现在得到了子选择器的句柄。在子选择器中，我想要将top parent li的类名从静态折叠更改为静态扩展。下面是示例，我可以有任意数量的嵌套子对象。<li class="static collapsed"> <li class

浏览 1提问于2017-02-03得票数 1

2回答

如何获得一个重复多次的ul标签内的a标签的href？

、、

我想要做的是在一个重复多次的ul中获取a标签的href :例如： <div class="contain"> <ul class="drop"><li><a href="some_link"></a></li> <li<

浏览 25提问于2019-09-16得票数 0

回答已采纳

3回答

从jquery代码中获取类名

在这里，我使用jquery代码中的ul标记创建了列表......我想使用类名访问这些列表如何才能获得它.....下面是java脚本代码...我想使用类名访问这些列表项...... var listItem = "<ul class='list-style' id="+"'"+eId+&qu

浏览 3提问于2016-12-08得票数 0

3回答

jquery访问嵌套div

、、、、

这是我的问题。我有这个简单的菜单。<div id="menu"> <li> <a id="home" href="home.html"> home </a> </li><li> <a id="profile"

浏览 7提问于2011-03-02得票数 0

回答已采纳

4回答

Selenium Web抓取没有ids或类名的嵌套div

、、、、

我正在尝试使用selenium从嵌套的HTML表中获取产品名称和数量。我的问题是有些div没有任何id或类名。我要访问的表是关键产品列表。这是我所做的，但我似乎对如何获得嵌套的div感到迷惑不解。options, executable_path=r'/usr/local/bin/chromedri

浏览 5提问于2020-09-02得票数 0

2回答

JavaScript:无法访问nodeList的一个迭代的childNode

、、

给定此标记： <li><a onClick="someFunction();" href="#">Link</a></li> for(i=0;i<nav

浏览 0提问于2012-02-25得票数 1

回答已采纳

2回答

MaterializeCSS Sidenav JQuery不工作

、

我正在尝试实现响应导航栏，实现CSS提供的物化。我在实现这个特性的JQuery方面遇到了困难。我不知道为什么，但是用于实现该功能的JQuery不能正常工作。 <a href="#" class="sidenav-toggle" data-target="testSidenav"><iclass="m

浏览 4提问于2020-04-22得票数 0

回答已采纳

19回答

如何按类查找元素

、、、

我在使用Beautifulsoup解析带有"class“属性的HTML元素时遇到了问题。代码如下所示mydivs = soup.findAll('div') if (div["class_getAttrMap()[key]我如何摆脱这个错误？

浏览 6提问于2011-02-18得票数 532

回答已采纳

3回答

如何识别哪些HTML标记或类指定何时从网页抓取？

、、、

我想在一个网站上抓取新闻链接(在下面的截图中突出显示)：当我inspect页面时，我看到我想要的链接包含在标签h5下的类col-sm-5中。我想刮掉div类col-sm-5中的所有4个链接(使用标记col-sm-5)。= BeautifulSoup(page.text, "html.parser") li_box = soup.find('h5', attrs={'clas

浏览 0提问于2018-05-23得票数 1

回答已采纳

1回答

使用BeautifulSoup从<cite>标记中抓取URL

、、、

我试图从谷歌抓取网址使用请求和美丽的汤网络抓取库。for URL in soup.find_all('cite'):我以前试图通过搜索链接，然后获得链接的href来获取URL，但这种方法的问题似乎是这些URL被Google缓存，当试图访问URL时，链接经常被破坏。我注意到Google使用cite标签来保存URL。虽然这适用于绝大多数URL，但有时页面上的其他文本也包含在引用标记</e

浏览 4提问于2017-08-25得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何使用Beautiful soup从没有类名或id的嵌套<li>访问<i>标记

相关·内容

如何使用Beautiful soup从没有类名或id的嵌套<li>访问<i>标记

BeautifulSoup -如何单独查找特定的类名

使用BeautifulSoup4查找包含文本的所有终端节点。

美丽的汤:从没有id的<ul>访问<li>元素

递归迭代div - BeautifulSoup中的嵌套标记

我想在多个div中的嵌套元素中刮取文本。

可以提取div data-app数据吗？

如何在div标记子元素中调用onclick事件

以li为目标的CSS

用Python中的Selenium，美观汤刮光盒覆盖

访问无序列表中嵌套子列表中的父li

如何获得一个重复多次的ul标签内的a标签的href？

从jquery代码中获取类名

jquery访问嵌套div

Selenium Web抓取没有ids或类名的嵌套div

JavaScript:无法访问nodeList的一个迭代的childNode

MaterializeCSS Sidenav JQuery不工作

如何按类查找元素

如何识别哪些HTML标记或类指定何时从网页抓取？

使用BeautifulSoup从<cite>标记中抓取URL

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐