迭代BS4标记元素列表以删除指定的文本

文章/答案/技术大牛

发布

1回答

python、list、beautifulsoup

所以我做了一些抓取，结果是一个列表的列表，列表中的每个元素都是BS4标记类型，但我找不到从列表中删除<li>和</li>的方法。</li>]]print(type(match[0])) <class

浏览 8提问于2021-06-09得票数 0

回答已采纳

1回答

selenium，如何按顺序打印此html的元素？

javascript、python、selenium、selenium-webdriver、automation

如果这是whatsapp消息的html (“你好吗？")，那么如何迭代该消息的元素并按照selenium的顺序打印它们(打印它们)？style="background-position: -40px -40px;"></span> how 或者输出也可以是这样的break print(messag

浏览 4提问于2021-08-20得票数 0

回答已采纳

2回答

使用BeautifulSoup从多个XML列表中提取文本数据

python、xml、beautifulsoup

texttag> </tag> <tag1> </tag1>我有两千种这样的元素由于根标记不在这里，所以我根据每个元素的主标记将其拆分，因为它是相同的，并转换为列表(

浏览 1提问于2017-08-26得票数 1

回答已采纳

1回答

python - web抓取BeautifulSoup和urllib

python-3.x、web-scraping、beautifulsoup、urllib

我正在使用python3.4，我的脚本如下所示：from urllib.request import Request, urlopenfrom bs4 import BeautifulSoup html = response.read()上面的代码导致一个

浏览 1提问于2016-03-05得票数 0

2回答

BeautifulSoup findAll在选择类时返回空列表

python、html、web-scraping、beautifulsoup

findall()在指定class时返回空列表指定标记可以正常工作 import urllib2 print(data.text) 我正在尝试

浏览 3提问于2019-04-23得票数 1

2回答

是否有一个选择器可以用来选择没有标记的元素(在Python中)？

web-scraping、css-selectors、python-3.6

我尝试使用基本的Python选择器来获取文本，但我无法解决。我主要想知道是否有一个选择器可以通过Beautiful select()方法来选择<div>中的元素，而不是<table>中的元素。我对HMTL知之甚少，所以我对上述代码示例中的任何错误或混淆表示歉意。

浏览 3提问于2020-03-31得票数 0

回答已采纳

2回答

使用BeautifulSoup获取标记名

python、beautifulsoup

from bs4 import BeautifulSoupsoup = BeautifulSoup#find the object name 使用上面显示的代码，我试图打印锚标记'name‘，即linkName，但我不确定我将使用哪个模块或对象，我已经尝试过contents、name和ta

浏览 2提问于2013-10-24得票数 2

回答已采纳

2回答

如何用beautifulsoup4提取html？

python、beautifulsoup

我的代码：html = """<td class='Thistd'><a><img /></a>Here is some text.= soup.findAll('td', {'class': 'Thistd'}) print td print '==========

浏览 1提问于2015-10-14得票数 1

回答已采纳

2回答

用python漂亮汤把文字输入div

python、beautifulsoup

我正在学习python和lib beatifulsoup来做一些爬虫，我想从html代码中提取一个文本，但是文本不是一个标记。看代码for p in soup.find_all("div", class_="description__container-text"): for

浏览 0提问于2018-02-22得票数 0

回答已采纳

1回答

清理Python中的HTML解析

python、html、parsing、web-scraping、beautifulsoup

下面的代码从( )中抓取tr中的td元素，对齐=‘中间’标记，用逗号分隔每个元素，并将结果写入文本文件：import requests stack.append(td.text.strip()) 但是，当写入文本文件时，有大量

浏览 3提问于2014-10-21得票数 1

回答已采纳

2回答

如何在获得美丽汤元素的.string时忽略标记？

python、dom、html-parsing、beautifulsoup

我正在处理具有子标记的HTML元素，我希望“忽略”或删除这些标记，以便文本仍然存在。刚才，如果我尝试使用标记来.string任何元素，我所得到的就是None。import bs4 <div id="main"> <p>This is a paragraph.

浏览 2提问于2013-08-16得票数 3

回答已采纳

2回答

如何使用python查找所有相同类型的元素

python、csv、web-scraping、beautifulsoup、python-requests

import requestsimport csv print(soup.prettify())print(games.text) 这个特定的代码只找到一个结果状态元素我正在寻找的</em

浏览 5提问于2021-04-22得票数 0

回答已采纳

1回答

用于web抓取的Python循环

python

我写的代码是我得到的

浏览 4提问于2017-05-22得票数 2

回答已采纳

1回答

Java LibGDX删除子弹问题

java、android、libgdx

当(bullet.plaction.y <= 0)时，我试图删除创建的子弹。但游戏会带来错误。我无法移除创造出来的子弹。我怎么才能修好它？我使用了一个纹理(64x64)，这些是我的类：package com.outlook.anil136.game1; import com.badlogic.gdx.ApplicationAdapter

浏览 0提问于2016-08-30得票数 0

回答已采纳

1回答

如何使用<td>遍历BS4标记？

python、beautifulsoup

使用BS4提取特定元素时遇到一些问题。。 print (table)

浏览 0提问于2017-03-29得票数 1

回答已采纳

1回答

仅使用BeautfulSoup提取特定文本

python、html、beautifulsoup、latex

我有一个很大的html文件的课堂讲稿，我想用不同的定义，定理等来分割它。我已经做到了，但是当我使用.get_text()函数时，它同时得到了unicode和LaTeX代码，有没有一种(优雅的)方法来分割它们？恒等元的存在性：∃e∈G\存在e\in G，∀x∈G\forall x\in G：∃∈e.定义1.1.1 (组:第一个定义)。最初，我将文本<

浏览 0提问于2021-01-17得票数 0

1回答

BeautifulSoup:提取不存在于给定标记中的文本

python、html、python-3.x、web-scraping、beautifulsoup

我有以下变量，header等于：<strong>Daily Stormer</strong><br/>我只想从这个变量中提取日期February 11, 2017。我如何在python中使用BeautifulSoup实现它呢？

浏览 3提问于2017-02-11得票数 3

回答已采纳

1回答

搜索电子邮件并打开取消订阅链接

python、python-3.x

我目前正在做一个项目，来自Automate the them，我应该写一个程序，扫描我的电子邮件，找到取消订阅的链接，并在浏览器中打开它们。import imapclientimport webbrowseruser_email = input('Enter

浏览 0提问于2018-07-17得票数 2

1回答

为特定文本抓取嵌套的网页

python、python-2.7、python-3.x、web-scraping、beautifulsoup

我有困难，没有执行嵌套循环通过美丽的汤。我相信有一个更容易的方法，但为了记录，我只需要姓，名，姓，最后三行，即道布，年龄和性别。下面是我的代码，它返回整个tr。from bs4 import BeautifulSoupimport re scraped

浏览 3提问于2017-08-26得票数 3

回答已采纳

2回答

如何使用BeautifulSoup获取选项文本

python、html-parsing、beautifulsoup

我想使用BeautifulSoup来获取以下html中的选项文本。例如:我想得到2002/12,2003/12等。2009/12</option><option value="9">2011/12</option>获取内容的最佳方式是什么现在我使用下

浏览 0提问于2012-11-26得票数 7

回答已采纳

点击加载更多