腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
我
在
Beautiful
soup
中
基于
一个
属性
使用
find_all
创
建了
一个
列表
。
如何
返回
我
想要
的
节点
?
、
、
我
有
一个
MS word文档模板,它有结构化
的
文档标签,包括重复
的
部分。
我
正在
使用
Python脚本提取重要
的
部分,并将它们发送到数据帧。
我
的
脚本
在
我
尝试过
的
80%
的
文档上都能正常工作,但我经常失败。问题是,当我找到第
一个
重复
的
部分时,
我
一直在做以下事情: from bs4 import Beautiful
浏览 10
提问于2019-06-29
得票数 0
回答已采纳
1
回答
非类型错误/没有
使用
python
的
漂亮汤打印
的
元素
、
、
、
所以我尝试
使用
python比较两个
列表
,其中
一个
包含
我
从网站获取
的
1000个链接。另
一个
包含一些单词,这些单词可能包含在第
一个
列表
中
的
链接
中
。如果是这样的话,
我
想得到
一个
输出。
我
打印了第
一个
列表
,它确实起作用了。i in sticker: print("found"
浏览 10
提问于2020-11-28
得票数 0
回答已采纳
1
回答
BeautifulSoup
在
find_all
之后获得href
、
我
在
一个
供应商链接目录中进行抓取。
我
已经创
建了
一个
汤&
使用
find_all
方法隔离了
我
想要
的
所有数据。但是,
我
需要
的
字符串是
在
汤中进一步嵌套
的
。
我
知道
find_all
返回
一个
列表
,但我需要进一步提取
列表
才能得到我所
浏览 4
提问于2017-10-30
得票数 1
回答已采纳
2
回答
如何
使用
Beautiful
soup
从HTML锚标记
返回
目的地
、
我
正在
使用
python2和
Beautiful
soup
来解析通过requests模块检索到
的
HTMLfrom bs4 import BeautifulSoup HTML = site.text<e
浏览 0
提问于2014-10-10
得票数 0
5
回答
如何
在python中用漂亮
的
汤从div中提取
find_all
(id)
、
我
想从
一个
有唯一类
的
页面
中
打印出所有的ID。url12346.hu" /> </div>
我
试过
使用
这个python代码,但它不起作用。(pag
浏览 0
提问于2019-07-02
得票数 6
回答已采纳
2
回答
漂亮汤还错了href值
、
、
、
我
使用
下面的代码为SERP做一些SEO,但是当我尝试读取href
属性
时,
我
得到了显示页面
中
其他有线URL
的
不正确结果,但没有显示预期
的
结果。
我
的
密码怎么了?q=
beautiful
+
soup
&rlz=1C1GCEB_enIN922IN922&oq=
beautiful
+
soup
&aqs=chrome..69i57j69i60l3.2455j0j
浏览 5
提问于2021-11-16
得票数 0
回答已采纳
4
回答
如何
在维基百科页面
中
抓取
一个
页面的多个表格?
、
、
、
我
正在尝试将下面页面的所有表合并到
一个
大表
中
;提前谢谢。from bs4 import BeautifulSoup<e
浏览 0
提问于2019-02-16
得票数 4
1
回答
如何
循环遍历
Beautiful
Soup
元素以获取
属性
值
、
、
我
需要遍历
Beautiful
Soup
元素并获取
属性
值:对于XML文档: </Chunk></Doc
浏览 0
提问于2012-06-02
得票数 1
回答已采纳
2
回答
把注意力集中
在
特定
的
结果上,同时用Python和
Beautiful
4抓取Twitter?
、
、
、
、
这是
我
的
帖子
的
后续。
我
想从每条推文中收集特定
的
数据。name和handle正在检索
我
正在寻找
的
内容,但我
在
缩小其余元素范围时遇到了困难。data-long-form="true" data-time="1443518016" data-time-ms=
浏览 4
提问于2016-01-26
得票数 3
回答已采纳
2
回答
美丽
的
Soup
find_all
()
返回
奇怪
的
标签而不是结果
、
、
我
正在
使用
Beautiful
从XML文件
中
获取一些信息,如下所示:<link>example.com/rss</link>这是
我
目前正试图读取
的
整个XML文件,用于测试目的。当我尝试
使用
find_all
('link'
浏览 5
提问于2014-10-05
得票数 2
回答已采纳
2
回答
使用
Python &
Beautiful
Soup
,是否可以获取根据是否设置了background attr过滤
的
标签
列表
?
、
、
我
想从设置了background
属性
的
html文档
中
获取标签
列表
。举个例子: <div></div> </table>result =
soup
.
浏览 4
提问于2012-11-07
得票数 2
回答已采纳
5
回答
BeautifulSoup父标记
、
、
我
有一些html,
我
想从中提取文本。下面是html
的
一个
示例:现在,很明显,这个文档中有很多<p>标记。因此,find('p')不是获取
我
想要
提取
的
文本
的
好方法。但是,<i>标记是文档
中
唯一
的
标记。所以,
我
想
浏览 3
提问于2014-02-25
得票数 21
回答已采纳
2
回答
在
BeautifulSoup中
使用
过滤器时获取内部标记文本
我
有:<div id="price">$199.00</div>
我
怎么才能得到$199.00
的
文本。
使用
不起作用,因为
我
从整个文档
中
获得了所有的innet文本。
浏览 1
提问于2013-11-27
得票数 0
1
回答
BeautifulSoup
在
select标记上不识别名称
的
值
、
、
、
、
我
试图从
一个
网站
中
检索一些下拉
列表
选项,但我无法使BeautifulSoup读取select标签上
的
名称
属性
的
值。ComboMunicipio" onchange="ExecMunicipio()" style="color:#003366; background:#cccccc; font-size:10px">
我
的
代码试图从第
一个
列表
<e
浏览 0
提问于2020-05-01
得票数 1
1
回答
并非所有从Beautifulsoup
find_all
方法
返回
的
HTML元素
、
、
尝试
使用
Beautiful
soup
从website.However中提取数据当我
使用
find_all
函数时,
我
只得到目标元素( li )
的
一个
子集,所以
在
本例
中
,不是获得24个li项,而是只
返回
12个= BeautifulSoup(reqs.text, 'lxml') ul_search_results=
soup
.find_all("li&quo
浏览 14
提问于2021-03-08
得票数 1
回答已采纳
7
回答
如何
使用
BeautifulSoup查找
节点
的
子
节点
、
、
我
想要
获取<li>
的
子级
的
所有<a>标记<li class="test"> <ul> <a>link2</a> </ul></di
浏览 2
提问于2011-06-09
得票数 153
回答已采纳
7
回答
使用
BeautifulSoup根据名称
属性
获取
属性
值
、
我
想打印
一个
基于
其名称
的
属性
值,例如
我
想做这样
的
事情for meta_tag in
soup
("meta"): if meta_tag[&q
浏览 0
提问于2012-06-26
得票数 108
回答已采纳
2
回答
为什么BeautifulSoup
在
第二次解析时工作,而不是第一次解析?
、
、
这是运行ResultSet
的
soup
[0].
find_all
('div', {'class':'font-160 line-110'}): [<div class="font-160 line-110"之后提取title,
我
无法
使用
a[0].find('div')['title] (其中a是上面的BeautifulSoup ResultSet)。但是,如果
我
将该HTML复制
浏览 1
提问于2016-10-11
得票数 2
回答已采纳
2
回答
用Python和BeautifulSoup抓取数据-无法提取div
属性
内容
、
我
一直试图
使用
从网站中提取一些数据。
我
似乎找不到提取div
属性
内容
的
方法。<div class="a" title="b"> </div>b <em
浏览 0
提问于2018-02-14
得票数 1
回答已采纳
1
回答
一种
使用
BeautifulSoup提取特定<p>标签
的
方法?
、
、
我
遇到了
使用
BS4从p标记中提取文本的当前问题。
我
需要提取
的
是包含文本
的
p标记,但也存在其他p标记。
我
目前拥有的是:div =
soup
2.find("div", {"id": "body"
浏览 8
提问于2017-03-31
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
干了这碗汤,你也可以愉快地爬虫了
Python爬取:Python教程并制作成pdf
Python常用库二:Beautiful Soup
Python爬虫库-BeautifulSoup的使用
Python爬虫之BeautifulSoup详解
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券