腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
BS4
中
使用
find_all
的
困难
、
、
、
我正在
使用
Beautiful Soup4从网页
中
抓取一些文本到一个不和谐
的
机器人中。运行该命令,这将返回"ThaIIen“(这是应该
的
)。如果我简单地将find更改为
find_all
,它将返回"Not found!“为什么?它不应该返回文档中所有字体大小为4
的
文本吗?
浏览 4
提问于2017-02-12
得票数 0
3
回答
用Python 3网络抓取youtube
、
、
、
我正在做一个项目,我需要在youtube上存储一个视频发布
的
日期。问题是,我
在
HTML源代码
中
查找这些数据时遇到了一些
困难
import requestsresponse.close() dia = soup.find_all('span',{'class':'date
浏览 7
提问于2017-09-07
得票数 1
回答已采纳
4
回答
使用
BeautifulSoup从抓取
的
页面中提取文本
、
、
新手编程和网络抓取,并有一些
困难
,让BeautifulSoup只从一个给定
的
网页上拉出文本。这是我现在正在做
的
事情: import requests players = soup.find_all('td').text File "/home/debian
浏览 69
提问于2019-05-11
得票数 0
回答已采纳
2
回答
BeautifulSoup -查找父子标记上
的
所有内容
、
、
、
我正在
使用
bs4
。<li><strong>some text</strong></li> 我想做一个能找到它
的
find_all
。当然,
find_all
('li')可以工作,但必须有一种方法来指定查找父子组合。
浏览 1
提问于2014-08-02
得票数 2
1
回答
图形用户界面应用程序Py2EXE中出现BeautifulSoup4错误
、
、
、
我构建了一个
使用
BeautifulSoup4
的
图形用户界面应用程序。经过反复尝试,最终让它打开,应用程序不能工作,并抛出一个信息框,当我关闭它时,说要检查日志。日志是这样写
的
: File "main.py", line 16, in newessay File "
bs4
\element.pyc", line 1146,
浏览 1
提问于2013-05-16
得票数 0
回答已采纳
1
回答
Python语言中
BS4
find_all
()语句中
的
过滤函数问题
、
、
、
、
我
在
Mac机上
使用
Python库(4.6.0)和BeautifulSoup (3.7)。 在其他东西
中
,我看到了一堆'div‘标签,它们有class属性。一些'div‘标签带有多个class属性值。现在我想根据标记名和class属性值进行过滤,例如,我想找到class='a‘但没有class='b’
的
' div‘标记(是的,有些div标记带有class='a b')。为了获得这些标记,我尝试
使用
BS4
文档()中提到<e
浏览 103
提问于2018-07-09
得票数 -1
1
回答
如何从我
的
函数调用导入库
的
函数?
在
尝试
使用
BeautifulSoup从某些网页获取信息时,有许多重叠
的
代码,因此我想将其作为一个函数,但我想在bs
中
调用一个函数,比如
find_all
和select。我该怎么做呢?import requests result = requests.getsoup = BeautifulSoup(result.text, "lxml&quo
浏览 4
提问于2022-07-01
得票数 0
回答已采纳
1
回答
使用
熊猫/美丽汤(而不是慢硒?)刮表数据,BS实现不起作用。
、
、
、
、
我试图在这个网站上抓取网络数据,我唯一能够访问这些数据
的
方法是遍历表
中
的
行,将它们添加到列表
中
(然后将它们添加到熊猫数据帧/写入到csv
中
),然后单击下一页并重复这个过程--每次搜索大约有50页,我
的
程序进行它非常慢/效率很低,我想知道是否有一种方法可以有效地
使用
熊猫或漂亮汤来添加所有数据,而不是迭代每一行/列。my_csv.csv', mode='a', header=False)
浏览 0
提问于2018-06-30
得票数 3
2
回答
Python美汤如何在ul中找到李?
、
attrs={"class":"clearfix"}): print(durum) 我想用BeautifulSoup
在
ul中
使用
li,所以我写了这个命令,但是我得到了一个错误
的
'NavigableString' object has no attribute '
find_all
'。
浏览 25
提问于2021-01-16
得票数 0
回答已采纳
1
回答
find_all
()函数和BeautifulSoup包
的
SoupStrainer有什么区别?
、
以下代码用于
在
屏幕上打印html_doc
的
标签,它是一个包含html代码
的
变量:下面的代码返回相同
的
结果: print(BeautifulSoup(html_doc, "
浏览 1
提问于2017-11-10
得票数 1
1
回答
使用
beautifulsoup4获取img将返回一个空数组响应。
、
、
我试图从下面的html
中
获取url src出于某种原因,当我试图打印徽标url时,我会得到[]作为响应。我
的
代码如下:from
bs4
import BeautifulSoup company_data = co
浏览 6
提问于2022-07-04
得票数 1
回答已采纳
1
回答
当我
使用
的
更新版本
的
库
使用
不同
的
函数名时,如何解析硬编码?- python
、
、
、
当我
使用
的
库
使用
函数
的
不同名称时,是否有更好
的
方法来解决硬编码兼容代码
的
问题?try: from <
浏览 4
提问于2013-11-26
得票数 0
回答已采纳
3
回答
BeautifulSoup -查找徽标
、
、
我正在开发一个
使用
BeautifulSoup和Python3来识别网站徽标的自动化程序。第一步,我正在寻找图像名称中有“徽标”一词
的
图像。它实际上工作得很好。但是,我想将其扩展到可能包含术语image
的
图像,或者包含在带有类/id/属性
的
链接
中
的
图像,或者甚至更深地隐藏在包含“logo”类
的
div
中
的
链接。22595" width="122" height="72"
浏览 1
提问于2014-11-02
得票数 2
2
回答
如何按顺序顺序获取所有元素文本
、
、
、
我正在
使用
bs4
从表
中
获取文本table = soup.find("table", attrs={"class":"table_class"}) 但我怎么能按顺序找到两个呢?我试过在下面 headings = [i.get_t
浏览 6
提问于2016-01-22
得票数 1
回答已采纳
2
回答
BeautifulSoup: RuntimeError:超过最大递归深度
、
、
、
我无法避免
使用
RuntimeError
使用
BeautifulSoup
的
最大递归深度。<div><code><code><code><code>Code in here</code></code></code></code><
浏览 9
提问于2015-07-21
得票数 11
回答已采纳
1
回答
Python:从返回额外字符
的
网页中提取电子邮件地址
、
、
Here是包含电子邮件地址
的
示例web地址。下面是我
使用
的
代码: from
bs4
import BeautifulSoupimport re url = 'https://viterbi.usc.edu/directory
浏览 10
提问于2019-02-11
得票数 0
回答已采纳
1
回答
如何循环遍历Beautiful Soup元素以获取属性值
、
、
="Times-Roman" style="font-size:22pt">O</Word> </Page>我想要获取“x1”元素
的
Wordsoup.page.chunk.word['x1']for i in soup.page.chunk:从元素
浏览 0
提问于2012-06-02
得票数 1
回答已采纳
3
回答
为什么ResultSet对象没有属性“查找”?
、
我试图
在
维基百科头版“维基百科
的
其他领域”部分
中
删除文本。但是,我遇到了错误ResultSet object has no attribute 'find'。我
的
代码有什么问题,我如何让它工作?import requestsurl = 'https://en.wikipedia.org/' response = requests.get
浏览 4
提问于2020-07-15
得票数 1
回答已采纳
3
回答
如何
使用
BeautifulSoup删除嵌套标记
中
的
内容?
、
、
、
如何
使用
BeautifulSoup删除嵌套标记
中
的
内容?这些帖子显示了反向检索嵌套标记
中
的
内容:和>>> from
bs4
import BeautifulSoup as bs&
浏览 0
提问于2014-02-13
得票数 3
回答已采纳
1
回答
美汤4混淆
我正在编写一个小python程序,以进入web抓取:import requests print('\nWeak Against:\n') for champ in soup.find(class_='weak-block').
find_all
# find 'strong against' her
浏览 2
提问于2015-02-11
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
声门上气道装置在困难气道管理中的应用
Go中的并发是困难的
OpenColorIO在AE中的基础使用
DNSLOG在渗透测试中的使用技巧
Redis在大数据中的使用技巧
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券