腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
BeautifulSoup
webscraping
find_all
( ):
作为
最后
一个
元素
追加
的
排除
元素
python
、
web-scraping
、
beautifulsoup
我正在尝试从reuters.com检索财务信息,特别是公司
的
长期增长率。我想要抓取
的
元素
并不是出现在所有网页上,在我
的
示例中,不是针对Ticker 'AMCR'。所有抓取
的
信息都应附加到列表中。我已经知道如果
元素
不存在就
排除
它,但是不是将它附加到列表中应该存在
的
位置,而是将"NaN"附加为
最后
一个
元素
,而不是添加到它应该位于
的
位置。impor
浏览 6
提问于2019-07-10
得票数 2
回答已采纳
1
回答
我如何从一篇文章中抓取所有段落,而不仅仅是
一个
段落?
html
、
python-3.x
、
beautifulsoup
我认为它这么做
的
原因是因为它抓住了第
一个
标签,就像我告诉它
的
那样,并且打印相同
的
标签,和它
的
名字一样
的
其他标签。我试图用.find替换.
find_all
,但是我得到了
一个
属性错误。我如何抓住所有的段落,而不仅仅是
一个
段落?文章:import requests 'User-Agent'
浏览 11
提问于2021-01-02
得票数 0
回答已采纳
1
回答
如何在dataframe中检索和存储第2行和第3行
元素
python
、
pandas
、
beautifulsoup
、
python-requests
我对Python中
的
Pandas、
Webscraping
和
BeautifulSoup
都很陌生。当我正在学习使用requests和
BeautifulSoup
进行一些基本
的
网页抓取时,我对将html表
的
第2和第3
元素
分配到熊猫数据框架中
的
任务感到困惑。假设我有一张桌子: 到目前为止,我
的
代码如下:from bs4 import
BeautifulSoup
import re
浏览 0
提问于2021-10-19
得票数 1
2
回答
检索Python网页中
的
所有字符串
python
、
beautifulsoup
我试图使用
BeautifulSoup
从网页中检索所有字符串,并返回所有检索到
的
字符串
的
列表。 查找所有具有非空文本
的
元素
,将文本
追加
到结果列表并返回它。我很难实现这一点,因为我无法在
BeautifulSoup
中找到任何方法来实现它。使用
BeautifulSoup
的
"
find_all
“方法查找我正在寻找
的
所有属性,如"p”表示段落,"a“表示链接
浏览 2
提问于2021-11-24
得票数 0
回答已采纳
2
回答
如何在python脚本中导入.py
python
、
beautifulsoup
我试图在python脚本中直接导入
BeautifulSoup
库,但我无法安装它,因为我在语法DS213+中使用它,所以我尝试这样做: soup =
BeautifulSoup
(html) for link in soup.find_all('a'):line 17, in <module> sou
浏览 3
提问于2014-02-24
得票数 0
回答已采纳
1
回答
同时尝试刮两个页面时出错- Python,bs4
python
、
python-3.x
、
web-scraping
我试图从
一个
(主要)网站
的
一些电影
的
链接,然后,从这些链接
的
内容刮刮。from bs4 import
BeautifulSoup
as soup文件跟踪(最近一次调用):文件"/Users/calinap/Pyc
浏览 1
提问于2020-04-15
得票数 0
1
回答
Python抓取fetech href链接
python
、
beautifulsoup
gr-hyperlink" href="/genres/art">Art</a>,这是我
的
密码import numpy as npfrom urllib import urlopen from bs4 import
Beauti
浏览 2
提问于2020-07-12
得票数 0
回答已采纳
3
回答
url分割与美汤
python
、
python-3.x
、
web-scraping
、
beautifulsoup
fiyat:asc&stoktakiler=1&tp=1"html_icerigi = response.content</div>] 我需要
的
只是
最后
一行中
的
数字13 (
最后
一个</
浏览 3
提问于2022-07-04
得票数 1
回答已采纳
2
回答
在美丽
的
汤中打印
最后
一次<td>
python
、
beautifulsoup
、
html-table
、
html-parsing
我必须从
一个
复杂
的
HTML文档中读取,其中
一个
表没有ID,每个表都有未定义
的
tr标记数。我想在
最后
一个
<tr>标记
的
td中打印文本。在解析树时,我找不到打印
最后
一个
子文件
的
任何内容。bgcolor="#FFFFFF"> <td>4.1</td> <td>4
浏览 5
提问于2014-03-28
得票数 2
回答已采纳
1
回答
标识下
一个
循环周期
元素
名称
python
、
beautifulsoup
我想用
BeautifulSoup
遍历html
元素
的
列表,但对于每个
元素
,我还想检查树中下
一个
元素
的
name<<html> <p>1</p> <p>2</
浏览 2
提问于2014-08-04
得票数 0
1
回答
BeautifulSoup
获取href
python
、
tags
、
beautifulsoup
</span>如果我只有
一个
标签,我可以这样做,但是这里有两个标签。我也可以得到文本'next',但这不是我想要
的
。另外,有没有
一个
很好
的
API
的
描述和例子。我正在使用,但我在寻找更有条理
的
东西。
浏览 8
提问于2011-04-28
得票数 279
1
回答
TypeError:“str”对象不可调用
python
、
beautifulsoup
、
bs4
我在我
的
程序中添加了几行代码,以便使用
BeautifulSoup
将html转换为json,但是这些添加
的
代码行出现了错误。import httplib, urllibimport json x = json.dumps(dict(htmldata))我收到<e
浏览 0
提问于2015-09-26
得票数 1
1
回答
Python -从HTML页面捕获所有表
python
、
html
、
email
、
beautifulsoup
我有带有嵌入HTML表格
的
电子邮件,还有使用
BeautifulSoup
提取表和表中数据
的
代码,我
的
问题是有时只有当有更多
的
表时,它才能成功捕获
一个
表。 table = bs4.
BeautifulSoup
(html).() for cell in row.find_all("td")] for row in
浏览 3
提问于2017-06-06
得票数 0
回答已采纳
1
回答
使用
BeautifulSoup
查找具有相同CSS类
的
多个
元素
python
、
web-scraping
、
beautifulsoup
我尝试使用
BeautifulSoup
的
find_all
()来搜索具有标签"div“和类"wisbb_name”
的
元素
。我要抓取
的
超文本标记语言来自。Fiers</div>print(el.g
浏览 19
提问于2017-07-22
得票数 1
回答已采纳
1
回答
BeautifulSoup
- find_all-订单保存
python
、
beautifulsoup
我正在尝试解析
一个
具有相同名称
的
不同类
的
网站。我想要学习第
一个
类
的
元素
(如网页所示)。但是,
find_all
或find不会保留解析
的
顺序。下面是我
的
find_all
实现import urllib.request searchQueryFK = "https://www.flipkart.comq
浏览 1
提问于2018-03-13
得票数 3
1
回答
在Python语言中使用
BeautifulSoup
进行网络抓取
python
、
web-scraping
、
beautifulsoup
countryId=IND').read()div = crawler.find('div', {"id": "standardRates"}) 使用上面的代码,它列出了您可以在图像中看到
的
所有标记/
元素
。td'),如下所示: div = crawler.find('div', {"id
浏览 3
提问于2017-02-25
得票数 0
2
回答
用美汤从span中提取
元素
python
、
html
、
web-scraping
、
beautifulsoup
我正在尝试从这个网站中提取在下面的图片中用红色圈起来
的
元素
:但是,它仍然给出了
一个
错误:"ResultSet对象没有属性'find‘。您可能把
一个
元素
列表当作
一个
单独
的
元素
来处理。当您要调用find()时,您调用了
find_all
()吗?“ 我
的
想法是将搜索范围缩小到"td“标记,并使用find从"span”标记中获取
元素
,但我无法让它工作。我尝试
浏览 4
提问于2021-10-02
得票数 1
回答已采纳
3
回答
BeautifulSoup
-获取类型
的
第n个标记
python
、
beautifulsoup
当我使用soup.findAll('table')时,会得到
一个
错误:是否有一种方法可以在某些代码中获取n标记,或者另一种不需要遍历所有表
的
方法编辑我正在将对象解压缩为两个值,这时有更多
的
值。我以为这只会给我列表中
的
前两件事,但当然,它一直给我上面提到
的
错误。我不知道返回值是
一个
列表,并认为它是
一个
特殊
的
浏览 3
提问于2012-12-30
得票数 16
回答已采纳
2
回答
Python /
Beautifulsoup
:当前
元素
的
HTML路径
python
、
beautifulsoup
对于
一个
班级项目,我
的
工作是提取网页上
的
所有链接。这就是我到目前为止所拥有的。from bs4 import
BeautifulSoup
, SoupStrainer soup =
BeautifulSoup
复杂之处在于:对于每个<a>
元素
,我
的
项目都需要知道当前链接
的
整个“树结构”。换句话说,我想知道所有以前
的
元
浏览 19
提问于2020-04-11
得票数 0
2
回答
无法从python中
的
html页面提取文本
python
、
beautifulsoup
、
html-parsing
我读到了关于
BeautifulSoup
的
文章,并试图使用它。但我无法提取具有给定类名“company-desc-and-排序容器”
的
文本。我甚至不能从html页面中提取标题。这是我尝试过
的
代码:import requests r = requests.ge
浏览 5
提问于2016-12-20
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券