腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
python
中
修
复用
BS4
提取
的
损坏
的
html
表
、
、
我正在从管理文件
中
解析
html
表格。这是棘手
的
,因为
html
经常被破坏,这导致构造不佳
的
表
。下面是我加载到pandas数据帧
中
的
表
的
示例:0 NaN NaN NaNPresident, Chief People Officer an... 7 Senior Vice Pre
浏览 12
提问于2019-08-09
得票数 1
回答已采纳
1
回答
BS4
破坏了试图修复它
的
超文本标记语言
、
、
、
、
BS4
纠正错误
的
html
。通常这不是问题。我尝试解析、更改和保存此页面的
html
: ulisses-regelwiki.de/index.php/sonderfertigkeiten.
html
在
本例
中
,修复操作更改了表示。由于我必须处理所述页面的
损坏
的
html
,所以我不能简单地修复
html
代码。 如何防止
bs4
修复
html
或以某种方式修复“更
浏览 14
提问于2021-01-24
得票数 0
回答已采纳
1
回答
使用“导入
bs4
”或“从
bs4
导入BeautifulSoup”时出错如下
、
使用import
bs4
或from
bs4
import BeautifulSoup时输出错误如下所示Traceback (most recent call last): File "D:\
Python
\Anaconda2\lib
浏览 1
提问于2014-10-20
得票数 1
回答已采纳
3
回答
如何在多表网页上调用特定
表
、
、
、
我正在尝试从这个网站上
的
特定表格中
提取
信息。到目前为止,这是我
的
代码。我是
python
的
新手,如果它不是显而易见的话。我只想
提取
Bonds
表
中
的
信息。我可以索引
表
,这样我就可以通过索引#调用特定
的
表
了吗?from selenium import webdriverimport requests brow
浏览 0
提问于2019-07-06
得票数 1
1
回答
如何从承载
HTML
之外
的
表
数据
的
网站
中
刮
表
?
、
、
、
、
我正在尝试从这个
表
URL:
中
抓取
表
数据
在
之前
的
测试
中
,我使用了以下
Python
包:从
bs4
导入BeautifulSoup导入请求导入mysql.connector作为pd从sqlalchemy导入create_engine 有人能告诉我用这种
HTML
设置使用
python</em
浏览 3
提问于2022-04-02
得票数 -1
回答已采纳
1
回答
在
Python
中将
HTML
表格转换为Pandas数据框
、
、
、
、
在这里,我试图从
Python
代码中指定
的
网站中
提取
一个
表
。我能够得到
HTML
表
,而且我无法使用
Python
转换为数据帧。以下是代码# import librariesfrom
bs4
import BeautifulSoup url = 'http://my-trade.in/' pa
浏览 10
提问于2019-07-10
得票数 7
回答已采纳
2
回答
从维基百科表格(剧集标题)中
提取
数据
、
、
、
、
我正在尝试使用BeautifulSoup和
Python
从维基百科
的
表格中
提取
电视剧
的
标题。为了解释我到目前为止所做
的
事情,我使用了两个
表
:2: 现在,
在
表
中
,每一集都包含在一个<td class="summary">
中
。
在
第一个
表
中
,<td>还具有一个<a>TitleName</a&g
浏览 0
提问于2014-09-17
得票数 4
回答已采纳
2
回答
Python
:如何从文本中
提取
数据?
、
、
我使用beautifulsoup库从一个网页
中
获取数据 from
bs4
import BeautifulSoup现在,soup如下所示(我只展示了其中
的
一部分):[<table>\n<tr class="theme-cells" id="profile_indicators\n<tr class="i
浏览 2
提问于2018-01-18
得票数 1
回答已采纳
5
回答
基于tbodyclass和Beautifulsoup
的
数据
提取
、
、
、
、
使用BeautifulSoup和
Python
3使用tbody类进行
提取
。我知道我可以使用前面的
表
{ .However :datatable}来
提取
我想使用tbody类尝试
提取
的
表
类 如何使用tbodycla
浏览 0
提问于2019-06-01
得票数 1
4
回答
使用
python
访问网站
、
、
我试图获得所有的网址
在
一个网站上使用
python
。目前,我只是将网站
的
html
复制到
python
程序
中
,然后使用代码来
提取
所有的urls。有没有一种方法,我可以直接从网络上做这件事,而不必复制整个
html
?
浏览 2
提问于2015-07-31
得票数 1
1
回答
如何使用Beautiful Soup从网页中
提取
表
中
的
数据
、
我想从'https://statisticstimes.com/demographics/india/indian-states-population.php‘
中
给出
的
表
中
提取
数据,并将其放入列表或字典
中
我是
Python
的
初学者。到目前为止,我所学到
的
就是: import urllib.request , urllib.error , urllib.parse from
bs4</e
浏览 21
提问于2021-04-09
得票数 1
2
回答
不刮掉整个
html
和
表
、
、
、
、
我试图从这个网站上
提取
表
时,我正在抓取,它没有给出完整
的
html
脚本。此外,
表
标记
中
没有类或id。有人能建议如何
提取
吗?url:from
bs4
import BeautifulSoupfrom
bs4
import BeautifulSoup # to view about the tag nature a
浏览 4
提问于2022-07-21
得票数 -2
1
回答
如何从标记内
的
属性
中
获得作为int
的
值?
我有一个汤一样
的
东西:price_3 = price_2/x 我有: TypeError: /
的
不受支持
的
操作数类型:'str‘和'int’
浏览 1
提问于2021-12-07
得票数 0
回答已采纳
1
回答
使用ffmpeg录制MP4时突然关闭电源
、
、
现在我用C语言和ffmpeg实现了一个多路实时音视频到MP4文件
的
程序,一切工作正常,但是
在
突然停电
的
复用
过程
中
,录音被MP4文件
损坏
,VLC不能播放这个文件。调用
损坏
的
文件,发现了两个不同
的
点: 1.文件头框
中
损坏
的
文件号值不对2。文件
损坏
后
的
文件没有结束。 现在我想
修
电源后,我
的
程序可以自动修复
损坏
浏览 6
提问于2016-03-21
得票数 2
1
回答
漂亮
的
汤只
提取
桌子
的
头
、
、
我想使用
python
3.5
中
的
漂亮汤从下面的网站中
提取
信息。我必须先保存网页,因为我
的
程序需要离线工作.from
浏览 5
提问于2016-07-31
得票数 1
回答已采纳
1
回答
BeautifulSoup (
bs4
)并不能找到所有的标记
、
、
、
我使用
Python
3.5和
bs4
import requests link = "http://www.pro-football-reference.com/players/B/BradTo00.
浏览 3
提问于2016-12-12
得票数 0
回答已采纳
1
回答
使用熊猫read_
html
在网页上抓取多个
表
并将其转换为dataframe & csv
、
、
、
我正试图从BLS网站上
提取
多个表格,并遇到了一些障碍。我可以
提取
表
,我查看了其他这样
的
帖子- ()。但是,我
提取
的
表格式不正确,数据到处都是。以下是我到现在为止所做
的
事情;import pandas as pd def new_func():(str(sp), flavor="
bs4
",thousands=',
浏览 5
提问于2022-06-24
得票数 1
回答已采纳
1
回答
是否删除
HTML
代码而只保留内容?(
html
2text错误)
、
、
我有一个csv文件从抓取
的
数据,这是
在
HTML
格式
的
价格。我只想保留数字和欧元符号,我正尝试使用
html
2text来做到这一点。(如果你有更好
的
选择,请说出来!)csv
中
的
一个单元格如下所示: </p
浏览 21
提问于2019-11-03
得票数 0
1
回答
额外
的
HTML
导致
bs4
出现问题
、
、
我试图从网站上
的
一个
表
中
获取一些信息--特别是,我想从“按姓氏代表目录”
表
中
获得有关代表
的
信息。到目前为止,我能够从站点下载
HTML
并将其写入文件,但是当使用
bs4
解析和抓取我想要
的
特定
表
时,它只是抓取每个
表
的
第一行。这是因为
HTML
表
的
每一行都有一个额外
的
标记:<td>&l
浏览 4
提问于2017-04-29
得票数 0
回答已采纳
1
回答
无法使用BeautifulSoup找到特定
表
、
我一直
在
使用BeautifulSoup从"https://www.huaweicloud.com/pricing.
html
#/ecs“
中
抓取价格信息。 我想
提取
该网站
的
表
信息,但什么也得不到。我使用
的
是Windows10,最新
的
BeautifulSoup,Request和
Python
3.7 import requests from
bs4
import Beautif
浏览 7
提问于2019-06-19
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
顺序表数据结构在python中的应用
在一个经常动态增加的 Excel 表中,如何始终自动提取出倒数 9 行?
Python萌新在九九乘法表中栽过的跟头
如何利用Python爬取网络小说
利用Python和BeautifulSoup进行网页爬取
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券