腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
了解
如何
使用
beautifulsoup
find
()
来
提取
特定
div
中
的
html
中
的
所有
元素
、
、
、
这是我正在
使用
的
the URL。 ? 我正在尝试
使用
soup.
find
()从这个
html
中
获取Username下
的
所有
值。我不知道
如何
引用这个
div
作为我找到
的
最后一个
div
,它是一个is soup.
find
("
div
", {"id": "sort-by"}).contents,
浏览 154
提问于2021-04-24
得票数 1
回答已采纳
1
回答
Python
BeautifulSoup
findAll没有返回
所有
元素
吗?
、
、
我正试图从这个url 中
提取
数据。我
的
问题是,行print(len(soup.findAll('
div
')))只返回23,行print(soup.
find
尽管存在多个实例,且
div
元素
嵌套在
html
页面
中
,但
find
命令并不
浏览 1
提问于2018-09-21
得票数 0
回答已采纳
1
回答
无法抓取注释Python
BeautifulSoup
之后
的
内容
、
、
、
、
我正在尝试从下面的页面
中
抓取表格: 当我到达击球表
的
html
时,我遇到一个非常长
的
注释,其中包含击球表
的
html
。--和-->之间
的
所有
内容都是一个注释,恰好包含下面table_outer_container类
中
的
表
的
一个副本。问题是,当我将页面源代码读入漂亮
的
汤
中
时,它不会读取包含
所有
内容
的
table_wrapper类
浏览 3
提问于2018-02-19
得票数 1
1
回答
使用
Beautifulsoup
4获取父标记
中
的
特定
标记
、
、
我正在
使用
beautifulsoup
4与Python一起从web上抓取内容,用它我试图从
特定
的
html
标记中
提取
内容,而忽略了其他
的
内容。我有以下
html
: <p> </p>content
浏览 4
提问于2016-06-24
得票数 1
回答已采纳
2
回答
如何
使用
BeautifulSoup
提取
HTML
元素
的
嵌套层?
、
、
我目前正在
使用
BeautifulSoup
来
提取
HTML
元素
和属性。 </li> </
div
> </
html
> 我想要获取路径列
中
输出<
浏览 1
提问于2012-12-04
得票数 2
回答已采纳
1
回答
解析具有给定内容
的
元素
后
的
HTML
元素
、
、
我正在尝试从一个
HTML
元素
中
提取
内容,该
元素
跟在一个具有
特定
内容"ID“
的
元素
之后。例如,在下面的data-tip属性
的
content
中
,我希望在
所有
情况下都从ID标记后面的
元素
中
提取
内容1886G。我在python中
使用
beautifulsoup
4进行解析,一次是根据id识别内容,另一次是将数据提示内容字符串解析回
html<
浏览 16
提问于2017-03-17
得票数 0
回答已采纳
1
回答
用
BeautifulSoup
存储超文本标记语言
元素
供以后
使用
的
最好方法是什么?
、
、
、
、
我
的
目标是
使用
BeautifulSoup
,
提取
特定
的
超文本标记语言
元素
(在本例
中
,这些
元素
包含字母表),存储它们,然后
使用
javascript在原始网站上识别它们(例如。我
使用
以下Python代码
提取
HTML
元素
:import re def parse_
h
浏览 4
提问于2021-06-25
得票数 1
2
回答
用Python和
BeautifulSoup
抓取数据-无法
提取
div
属性内容
、
我一直试图
使用
从网站中
提取
一些数据。我似乎找不到
提取
div
属性内容
的
方法。="e" width="f" alt="g">我想
提取
标题并得到结果:我试过用这个: for all_data in soup.
find
_all('
div
', {'class': 'someCla
浏览 0
提问于2018-02-14
得票数 1
回答已采纳
1
回答
使用
BeautifulSoup
查找具有相同CSS类
的
多个
元素
、
、
我尝试
使用
BeautifulSoup
的
find
_all()
来
搜索具有标签"
div
“和类"wisbb_name”
的
元素
。我要抓取
的
超文本标记语言来自。我
的
最终目标是根据该网站记录当天开始
的
所有
投手
的
名字。投手姓名
的
HTML
如下 <
div
class="wisbb_name&qu
浏览 19
提问于2017-07-22
得票数 1
回答已采纳
1
回答
bs4获取标记
的
值
、
这是我正在处理
的
html
代码。<
div
class="input-group m-b"> $ <input class="form-text$" id="edit-transfer--3" maxlength="128" name="transfer_d" s
浏览 4
提问于2021-04-15
得票数 0
回答已采纳
1
回答
添加到
特定
关键字
的
链接
、
我试图添加到某些关键字
的
内部链接,如链接
所有
的单词index到我
的
网站主页。这就是我想要
的
。<
div
>You can
find
the content from the index page</
div
><
div
>You can
fi
浏览 0
提问于2015-11-23
得票数 1
2
回答
如何
使RegEx适合于Python
、
我
的
最终目标是能够在title="之后从引号
中
取出一个或多个单词。我有一个文本文件,里面有一长串
的
HTML
,每一行都有一个title="some place"。不过,我还有另一个例子,但它
提取
了整个title="thing",如果它在引号
中
包含多个单词,它就会结束:现在我遇到
的
问题是,我不知道
如何
在我
的
脚本
中
获得它。它有太多
浏览 3
提问于2014-08-01
得票数 0
回答已采纳
2
回答
BeautifulSoup
提取
不含
div
的
div
文本
、
、
从有
div
(没有
div
)
的
div
中
提取
文本有点困难。所以就是这样: <
div
class="status_p"> </
div
></
div
> 我想
提取
没有活动
的
div
<
浏览 1
提问于2020-08-11
得票数 1
1
回答
如何
利用美丽
的
汤刮起整个网站
、
尽管如此,我还是试图为网络爬行编写一个非常简单
的
蜘蛛。这是我
的
第一个方法:首先,我在页面源上做了一个视图
来
查找
HTML
元素
?。() # Searching for tags by class and id 注意: CSS
使用
类和ID
来
确定要应用某些样式
的
HTML
元素
。我们还可以在刮擦时
使用
它们
来
指定要刮
的
特
浏览 0
提问于2018-01-29
得票数 5
3
回答
使用
优美汤,
提取
元素
的
标记,但指定
的
标记除外
、
、
我
使用
Beutifulsoup 4和Python
提取
3.5+。现在,我正在
使用
以下方法,这些方法大多数情况下都能工作:content = soup.
find
('
div
', class现在,在一些实例
中
,除了<p>标记之外,还有其他
元素
,这些标记
的
内容在上下文上对主要内容非常重要,例如列
浏览 2
提问于2016-07-21
得票数 2
回答已采纳
2
回答
在
BeautifulSoup
中
使用
过滤器时获取内部标记文本
我有:<
div
id="price">$199.00</
div
>我怎么才能得到$199.00
的
文本。
使用
不起作用,因为我从整个文档
中
获得了
所有
的innet文本。
浏览 1
提问于2013-11-27
得票数 0
2
回答
使用
没有类、名称或id
的
Beautifulsoup
拉出
div
元素
、
、
我开始用
BeautifulSoup
介绍自己,并尝试从网站中
提取
数据,在
提取
数据之后,我需要得到一个"
div
“
元素
,但是
div
元素
没有类。例:
使用
<
div
grea><
div
>在BeautifulShoup文件
中
查找BeautifulShoup
中
的
文本。当它被捕获时,它应该从
HTML
的
下方返回&
浏览 7
提问于2021-12-05
得票数 -1
回答已采纳
1
回答
Python:字符串过滤器
、
我需要在这里找到我
的
代码--> <
div
class="name">Name</
div
> <span
浏览 13
提问于2018-06-02
得票数 -1
回答已采纳
1
回答
用
BeautifulSoup
导航
、
、
、
、
对于
如何
使用
BeautifulSoup
导航
HTML
,我有点困惑。(url)soup =
BeautifulSoup
(source.content, "
html
.parser") for a in soup.findAll('a'): 是否有办法通过标签找到
特定</em
浏览 5
提问于2015-10-29
得票数 8
回答已采纳
0
回答
遍历结果集bs4
、
我在bs4
中
使用
了bs4
来
提取
这个结果集。<
div
>Content 1Content 2我正在尝试
提取
这两个
元素
。forums.hardwarezone.com.sg/eat-drink-man
浏览 5
提问于2017-01-02
得票数 0
点击加载更多
相关
资讯
Python爬虫从入门到精通(3):BeautifulSoup用法总结及多线程爬虫爬取糗事百科
爬虫入门——详解Python是如何进行网页抓取!
如何利用Python爬取网络小说
Python爬虫实例之——小说下载
使用Python进行网页抓取的介绍
热门
标签
更多标签
云服务器
ICP备案
实时音视频
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券