腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
使用
BeautifulSoup
解析
html
表
、
、
、
我正在尝试从这个时间
表
中获取给定一天的数据:from
BeautifulSoup
import
BeautifulSoup
html
= input_file.read() so
浏览 2
提问于2011-12-04
得票数 2
回答已采纳
2
回答
为什么
BeautifulSoup
没有找到所有的标签?
、
当我
使用
BeautifulSoup
4
解析
,然后查找
表
标记时,它会找到2。当我查看页面的
html
时,我会看到10个
表
。为什么
BeautifulSoup
不返回全部10个?from bs4 import
BeautifulSoup
s
浏览 3
提问于2014-01-15
得票数 0
回答已采纳
2
回答
使用
pandas读取下载的
html
文件
、
、
、
作为标题,我尝试
使用
read_
html
,但出现以下错误: File "<string>", line unknown我做错了什么?更新01 <e
浏览 2
提问于2014-07-31
得票数 8
回答已采纳
1
回答
Python/lxml:如何捕获
HTML
表
中的行?
、
、
、
对于我的股票筛选工具,我必须在脚本中从
BeautifulSoup
切换到lxml。在我的Python脚本下载了我需要处理的网页之后,
BeautifulSoup
能够正确地
解析
它们,但是过程太慢了。
解析
一只股票的资产负债
表
、损益
表
和现金流量表只需要
BeautifulSoup
大约10秒,考虑到我的脚本有5000多只股票要分析,这是不可接受的慢。根据一些基准测试(),lxml比
BeautifulSoup
快近100倍。因此,lxml应该能够在10分钟内完成一个需要
浏览 0
提问于2012-11-29
得票数 0
3
回答
为什么只读取网页中的前两行
html
表
?
、
、
、
我试图从网页上的
html
表
中抓取数据。我尝试了几种基于这里发布的答案的不同方法,但总是有一个问题:结果大致与我所期望的一样,但只适用于
表
的前两行。我对
html
和漂亮的汤几乎没有经验,但是从url中的
表
的
html
文件中,我看不到前两行和
表
的其余部分之间有什么区别。有人能帮我找出我做错了什么吗?import numpyimport urllib url
浏览 5
提问于2020-12-14
得票数 0
回答已采纳
2
回答
使用
python语言将
html
转换为文本
我想用Python从
HTML
文件中提取文本。我想要的输出基本上与从浏览器复制文本并将其粘贴到记事本中得到的输出相同。我想要一些比
使用
正则表达式更健壮的东西,因为正则表达式在格式不佳的
HTML
上可能会失败。我看到很多人推荐Beautiful Soup,但我在
使用
它时遇到了一些问题。而且,它不能解释
HTML
实体。例如,我希望将
HTML
源中的'转换为文本中的撇号,就像我将浏览器内容粘贴到记事本中一样。 更新:
html
2text看起来很有前途。它正确地处理<em
浏览 0
提问于2010-08-19
得票数 2
回答已采纳
2
回答
python中的
HTML
表格抓取-在某些页面上查找表格时出现问题
、
、
、
我正在尝试从这个网站上的价格
表
中提取数据:https://www.letsrecycle.com/prices/textiles/textile-prices-2012/ 我无法同时
使用
read_
html
和
BeautifulSoup
找到
表
,这很奇怪,因为我可以在其他类似页面(例如https://www.letsrecycle.com/prices/metals/steel-cans/st
浏览 15
提问于2020-07-22
得票数 1
回答已采纳
1
回答
如何
使用
BeautifulSoup
从
表
中获得第一个和第三个td?
、
、
、
、
我目前正在
使用
Python和
BeautifulSoup
来抓取一些网站数据。我试图从格式化如下的
表
中提取单元格:上面的
HTML
的问题是,
BeautifulSoup
将它作为一个标记读取如何让
BeautifulSoup
读取<
浏览 0
提问于2013-08-14
得票数 6
回答已采纳
2
回答
BeautifulSoup
:'lxml‘和'
html
.parser’和'
html
5lib‘
解析
器有什么区别?
、
、
、
、
使用
美丽汤'lxml‘和’
html
.parser‘和’
html
5lib‘有什么区别?soup =
BeautifulSoup
(response.text, 'lxml')
浏览 3
提问于2017-08-03
得票数 30
回答已采纳
3
回答
需要
使用
python清理web刮取的数据
、
import pandas as pd 但是结果是一些不想要的数据,我只想要
表
中的数据。
浏览 3
提问于2020-06-14
得票数 2
回答已采纳
2
回答
BeautifulSoup
.find_all没有检索网页的元素
、
、
我
使用
BeautifulSoup
从一个随机的网站中提取数据。我试图找到所有类名为simpleList的div标记。但这些数据并没有被收集。它只是显示一个空列表。from bs4 import
BeautifulSoup
q=Rock+Spring&v=0#r=10&a
浏览 14
提问于2017-10-09
得票数 1
回答已采纳
1
回答
从
表
中通过网络抓取链接
、
、
、
我想从网上抓取的链接和他们各自的文本从一个
表
。我计划
使用
正则表达式来完成此任务。 假设在这个页面中我有多个<a href="url_i">text_i</a>标记。*><a .*>(.*)</a></table>, web_text)' 正则表达式在
HTML
表
中找到任何类的所有锚标记,并返回文本,对吗?这需要非常长的时间。这是正确的做法吗?
浏览 15
提问于2020-09-16
得票数 1
1
回答
Python
BeautifulSoup
-从网页中
解析
表格时出现问题
、
、
、
、
我想
解析
来自以下站点的
表
数据:,并创建一个包含所有
表
值(vCPU、内存、存储、价格)的数据帧。但是,
使用
下面的代码,我似乎找不到页面上的
表
。有人能帮我找出如何
解析
这些值吗?
使用
pd.read_
html
时,会出现找不到
表
的错误。from bs4 import
BeautifulSoup
import csv url = "http
浏览 59
提问于2018-07-18
得票数 0
1
回答
风车没有得到所有的
html
内容
、
、
、
、
我正在尝试
使用
python Windmill框架从网页上抓取数据。但是,我在从页面上获取
HTML
表
内容时遇到问题。该
表
是由Javascript生成的-因此我
使用
Windmill来获取内容。但是,内容不返回
表
-如果我
使用
BeautifulSoup
尝试
解析
内容,这会导致错误。= client.commands.getPageText() as
浏览 3
提问于2012-03-09
得票数 0
回答已采纳
1
回答
在一行附近缺少<tr>的
表
:我可以
解析
它吗?
、
我正试图
解析
如下所示的
表
: <tr> <th> header1 </th> <th> header2 </th> </tr> <th> missing1 </th> <th这个
表
在浏览器中呈现得很好,所以我希望
BeautifulSoup
能够找到它,但是b.findAll('tr')没有找到它。编辑:一个具体的、复杂得多的
浏览 0
提问于2014-07-15
得票数 1
回答已采纳
1
回答
Python web从asx抓取-无法获取公告
表
、
我试图从asx页面中抓取公告
表
,然而,当我
使用
BeautifulSoup
解析
html
时,这个
表
不在那里。import requestsfrom bs4 import
BeautifulSoup
page
浏览 17
提问于2021-02-26
得票数 0
1
回答
BeautifulSoup
不读取请求获得的整个
HTML
、
、
我试图
使用
BeautifulSoup
和请求库从一个体育统计数据
表
中抓取数据。我在Python3.5上运行它们。我似乎成功地通过请求获得了
HTML
,因为当我显示r.content时,我尝试刮取的网站的完整
HTML
就会显示出来。但是,当我将它传递给
BeautifulSoup
时,
BeautifulSoup
会删除大量的
HTML
,即统计数据本身的
表
。 如果您查看问题中的,就会删除“得分过程”中的
HTML
。我尝试过用于
B
浏览 5
提问于2016-03-16
得票数 5
回答已采纳
1
回答
删除注释标记,但不满足于
BeautifulSoup
、
、
我正在
使用
BeautifulSoup
练习一些网络抓取,特别是我正在查看NFL的游戏数据,更具体的说是这个页面上的"Team“
表
()。当查看表的
HTML
时,我看到如下所示:<div class="placeholder"></div> </div&g
浏览 1
提问于2018-10-18
得票数 1
回答已采纳
1
回答
使用
BeautifulSoup
从
HTML
中
解析
表
、
、
我正在尝试从多个
html
文件中获取
表
。理想情况下,我在列表中有行和列,所以我可以进一步处理它。我是
BeautifulSoup
的新手,但我不能让它起作用。我现在的代码是:table_dict = {} soup =
BeautifulSoup
(text, "lxml") table = soup.find(&
浏览 0
提问于2019-07-18
得票数 0
回答已采纳
1
回答
使用
BeautifulSoup
逐列
解析
HTML
表
、
我需要
使用
BeautifulSoup
解析
一个超文本标记语言表格。该
表
有两列,其中第二列的数据类型为number。我需要找出Column2中所有数字的总和。我能够提取
表
数据,但我被困在这一点上。import urlliburl = raw_input('Enter URL- ')soup =
BeautifulSoup
浏览 1
提问于2015-11-09
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python爬虫之BeautifulSoup解析之路
BeautifulSoup常用解析库-爬虫干货系列5
Python3使用BeautifulSoup解析百度关键词搜索结果
node中使用cheerio爬取并解析html网页
送上一碗鸡汤——BeautifulSoup网页解析
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券