腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
BeautifulSoup
提取
span
中
不带
类
名
的
文本
、
、
、
我正在尝试
使用
BeautifulSoup
从求职网站
提取
数据。我已经能够
提取
所需
的
所有数据,但显示
的
薪水除外。 该网页为https://mx.indeed.com/jobs?q=operador&l=Ciudad%20de%20M%C3%A9xico 我遇到
的
问题是,薪水是在一个没有
类
名
或标题
的
<
span
>
中
。class="
浏览 26
提问于2021-10-26
得票数 0
回答已采纳
1
回答
从
BeautifulSoup
中
不带
类
的
span
标签中
提取
文本
、
、
我正在尝试从一个网站中
提取
数据,目的是完成一个小型数据分析项目。下面是我正在处理
的
HTML源代码(我要从中
提取
数据
的
所有div都具有完全相同
的
结构)。= "https://www.rystadenergy.com/newsevents/news/press-releases/"soup =
BeautifulSoup
,我成功地
提取
了文
浏览 34
提问于2020-12-03
得票数 0
回答已采纳
1
回答
使用
单个
类
名
从html标记
中
获取
文本
,html标记将包含多个
类
。
、
、
、
我有一个html行,标签里面有标签,我
的
一个标签包含多个
类
。我需要用单个
类
名
提取
文本
(我只知道一个
类
名
) <p class="Body1"><
span
class="style3"></
span
><
span
class="style1">W</
span</em
浏览 3
提问于2014-07-10
得票数 0
回答已采纳
2
回答
使用
BeautifulSoup
获取
span
类
名
、
我正在
使用
BeautifulSoup
刮一个网站。检索
的
结果集如下所示:在这里,我想检索
类
名
&quo
浏览 13
提问于2022-02-14
得票数 0
回答已采纳
3
回答
如何在python中
使用
BeautifulSoup
提取
span
中
没有
类
名
的
文本
、
、
、
我正在制作一本字典,它用西班牙语查找这个单词,并给我相应
的
英文翻译。我对
BeautifulSoup
非常陌生,所以我利用这个机会学习网络抓取。soup.find_all(name='div
浏览 10
提问于2019-10-22
得票数 3
回答已采纳
1
回答
使用
Java
中
的
Jsoup从HTML行获取
类
名
的
Get元素(重写)
、
、
、
我有一个html行,标签里面有标签,我
的
一个标签包含多个
类
。我需要
提取
带有单个
类
名
的
文本
(我只知道标签中有一个
类
名
,这可能也会覆盖另一个
类
)。<p class="Body1"><
span
class="style3"></
span
><
span
class="sty
浏览 2
提问于2014-07-17
得票数 0
回答已采纳
1
回答
使用
beautifulSoup
Python进行解析?
、
from
BeautifulSoup
import
BeautifulSoup
problem = soup.findAll('problem')网页上
的
problem是
文本
,但这不是print.What是这里
的
问题吗?
浏览 6
提问于2016-10-24
得票数 0
2
回答
Beautifulsoup
无法从具有隐藏属性
的
标记
中
获取内容
、
" data-book-button="book-EY-EC-Car" target="_self" class="ember-view btn btn-secondary btn-action"><
span
class="btn-label"> <
span
class="visuallyhidden"&
浏览 0
提问于2017-03-09
得票数 0
1
回答
使用
“美汤发现”
提取
单引号之间
的
文本
、
、
、
、
我
使用
的
是“美丽汤”,我想用findall方法
提取
“”
中
的
文本
。content = urllib.urlopen(address).read()soup.prettify()从汤中
提取
的
一个例子: <td clas
浏览 3
提问于2015-12-19
得票数 2
回答已采纳
1
回答
使用
REGEX在Python
中
的
行间匹配元素
、
我希望
使用
REGEX从购物网站中
提取
数量。在下面的例子
中
,我想得到"12.5公斤“。然而,第一个跨度内
的
数量并不总是以公斤为单位,它可以是磅、盎司等。<
span
> <
span
class="strike">$619.06</
span
> <
span
class="price">$523.91</
span
>
浏览 1
提问于2014-03-25
得票数 1
回答已采纳
2
回答
使用
python正则表达式
的
HTML解析
、
、
我
使用
python正则表达式来解析html文件,现在我需要从html标记中
提取
一个数字,这个数字可以是整数,也可以是浮点数。以下是两个例子:<
span
class='addr-bbs'>2 baths</
span
><
span
class='addr-bbs'>3.5 baths</
span
>bath = re.fi
浏览 2
提问于2016-07-11
得票数 0
回答已采纳
2
回答
html解析器有时会剥离普通
的
符号和符号。
、
、
、
有些导入
的
内容是HTML
的
,我需要前后一致地剥离这些内容并转换成纯
文本
,但是内容并不是100%一致
的
。特别是,特殊字符有时是未转义
的
,有时我以转义HTML代码
的
形式得到它们。我已经成功地
使用
了漂亮汤来实现这个目标,但是现在我遇到了一个边缘情况,一个未转义
的
密码被神秘地从代码
中
剥离出来。例如,这段代码:
BeautifulSoup
('R&D', features="html.par
浏览 4
提问于2019-11-08
得票数 0
回答已采纳
2
回答
无法从python
中
的
html页面
提取
文本
、
、
我读到了关于
BeautifulSoup
的
文章,并试图
使用
它。但我无法
提取
具有给定
类
名
“company-desc-and-排序容器”
的
文本
。我甚至不能从html页面中
提取
标题。这是我尝试过
的
代码:import requests url= 'http://fortune.c
浏览 5
提问于2016-12-20
得票数 1
回答已采纳
3
回答
如何
使用
BeautifulSoup
查找第一个锚标签
的
文本
、
我有一个这样
的
HTML结构 <a href="abc.com"> </a> <ahref="xyz.com">comments</a></p> 我想
提取
第一个锚标签<em
浏览 1
提问于2016-04-28
得票数 1
1
回答
为什么
BeautifulSoup
匹配某些
类
名
而不匹配其他
类
名
、
、
我很难理解为什么
BeautifulSoup
不能匹配HTML源
中
存在
的
一些
类
名
。原始HTML代码包含要匹配
的
以下行: <
span
class="Trsdu(0.3s) Fw(b) Fz(36px) Mb(-4px) D(ib)" data-reactid="34">1,148.52以下是我
的
代码: # ref: https://www.crummy.com/software
浏览 21
提问于2019-03-02
得票数 0
2
回答
如何
使用
漂亮
的
汤4从
span
标记中
提取
文本
?
、
、
如何
使用
漂亮
的
汤在
span
标记
中
刮取
文本
?from bs4 import
BeautifulSoup
r = requests.get("http://www.uoj.ac.ae/ContentBan.aspx?m=15&p=4&sm=4")for tag in s
浏览 4
提问于2016-05-19
得票数 2
回答已采纳
4
回答
从包含其他标签
的
“a”标签中
提取
文本
的
漂亮问题
、
我想从下面显示
的
HTML 'a‘标签中
提取
“气候8/17/2019下午2:00”。我编写了一些代码,我认为这些代码将从'a‘标记中
提取
所有
文本
,稍后,我将
使用
字符串操作来
提取
所需
的
子字符串。data3="Hi" date="Monday, August 17" time="2:00 PM" topic="climate 8/17/2019 2
浏览 22
提问于2019-10-11
得票数 1
回答已采纳
2
回答
用BS4 - Python排除
span
、
、
因此,我试图排除(而不是
提取
)包含在
span
中
的
信息。下面是HTML:这是我
的
密码: print(description_el.text.replace(' ',
浏览 0
提问于2022-03-11
得票数 0
回答已采纳
2
回答
使用
BeautifulSoup
拉取标签值
、
、
、
有人能告诉我如何
使用
BeautifulSoup
拉取标签
的
值吗?我阅读了文档,但很难浏览它。例如,如果我有:我怎么才能
使用
BeautifulSoup
/Python拉出"Funstuff编辑:我正在
使用
版本3.2.1
浏览 1
提问于2012-07-24
得票数 6
回答已采纳
2
回答
BeautifulSoup
的
Python内存
使用
率过高:无法删除对象
、
、
我基本上和这里的人有同样
的
问题: url = entry.link graphical_abstract = None soup =
BeautifulSoup
他们说问题可能来自这样一个事实:只要您<
浏览 1
提问于2015-04-24
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用多个Python库开发网页爬虫(一)
享学课堂浅谈Python3中BeautifulSoup的使用方法
学习Python,没有小姐姐怎么可以?
用python爬取一整站的小图
爬虫抓取深住房租金数据
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券