用BeautifulSoup抓取Json表太多熊猫_用BeautifulSoup实现Web抓取表 - 腾讯云开发者社区

、、、

它看起来像是一个json结构。有没有可能用BeautifulSoup得到它？网址：from bs4 import BeautifulSoupsoup = BeautifulSoup

浏览 13提问于2021-06-05得票数 1

回答已采纳

1回答

用BS4进行网络抓取:无法获取表

、

当您选择此图标(“复制”)时，您将实现一个完整的表，您可以粘贴到Excel中。如何将此表作为Python中的输入？我的代码在下面，它没有显示任何内容：from bs4 import BeautifulSoupresult = requests.get(url) soup = Beautiful

浏览 1提问于2018-03-19得票数 0

回答已采纳

1回答

用蟒蛇熊猫和beautifulSoup抓取分页网页表

、、

我是蟒蛇熊猫的初学者，我试着用漂亮的汤包废弃一个分页的桌子，数据被刮掉了，但是每个单元格的内容都是一行的，我无法得到一个连贯的csv文件。这是我的代码：import urllib.requestimport os thepage=urllib.reque

浏览 1提问于2018-07-01得票数 2

回答已采纳

1回答

不能刮桌子

、

我试图从以下网站上的一个表中抓取数据：from bs4 import BeautifulSoup r = requests.get(url)drought_table我试着用

浏览 4提问于2021-12-29得票数 1

回答已采纳

1回答

用python读取复杂的html表

、、、

我正试图把变成一只熊猫DataFrame。我试过使用熊猫read_html，我试过使用请求和bs4。我想像我们看到的那样抓取整个表，但是在html代码中，表被分成了3个块。下面是一个起始代码：import pandas as pd res

浏览 1提问于2018-08-28得票数 1

回答已采纳

2回答

从维基百科上用漂亮的汤刮掉整张桌子，然后装进熊猫里

、、、、

我目前正在抓取下面的维基页面：，只有一个表开始于比较。我正试着把整张桌子都刮掉，然后把它输出给熊猫。我知道如何添加初始列，飞机，但在从卷开始抓取列时遇到问题。import requests page = requests.get('https

浏览 0提问于2019-12-18得票数 1

1回答

如何从beautifulSoup中拉取多个html标签？

、、

我正在尝试使用beautifulSoup从html页面中提取几个标记。该页面包含一个从1到100的排名列表，所以我想为每个项目提取所有的和标签。

浏览 10提问于2019-09-05得票数 2

回答已采纳

1回答

如何使用多个表从网页中刮取特定的表？

、、、

然而，当我运行dfs = pd.read_html(url)时，我只收到了来自网页的前两个表，即Team和。page = requests.get(url) row = [i.text for i

浏览 2提问于2020-05-26得票数 0

回答已采纳

1回答

使用python从维基百科中刮表？

、、、

我试着从维基百科的页面上抓取表格数据：，我试过使用pd.read_html语法，但它不适用于我试图刮的表(尼泊尔按地区分列的新冠肺炎确诊病例)。我试着用“美丽汤”和“熊猫”来收集数据，但是它不起作用soup = BeautifulSoup(r.text,&#x

浏览 0提问于2020-04-06得票数 1

回答已采纳

1回答

如何从有加载表的网站上抓取网页？

、、、

我试着用Python2.7从一个网站上抓取网页，那里有一个必须加载的表。如果我试图在网络上抓取它，我只得到它：“加载”或“对不起，我们没有关于它的任何信息”，因为它必须先加载。我的密码：import urllib2, sysimport json site= "https://www.flightradar24User-Agent': &#x

浏览 2提问于2017-07-25得票数 0

回答已采纳

1回答

我如何自动扩展整个网页，以便与熊猫(蟒蛇)擦拭？

、、

我正在尝试从中抓取html表。在页面上，有一个“加载更多”按钮。单击此命令时，会显示更多行，但URL不会更改。当我使用pd.read_html(url(将这个URL传递给熊猫时，它会拉出前100行，而没有其他任何内容。如何通过URL或命令自动加载所有表？任何帮助都是非常感谢的。代码：import requestsfrom bs4 import BeautifulSoupimport

浏览 73提问于2022-05-19得票数 -1

2回答

我试图从spotrac.com网站上抓取表格，并将数据保存到熊猫的数据中。无论出于什么原因，如果我正在抓取的表超过100行，则对象只会抓取表的前100行。只有前100行包含在BeautifulSoup对象和dataframe中。import pandas as pdfrom bs4 import BeautifulSoup # Begin requests sessionrunning-back

浏览 5提问于2020-07-01得票数 0

回答已采纳

1回答

用BeautifulSoup抓取多个表

、、

如何从这个url 的“目标时间”表中获得数字目标？我能找到那张桌子，但当我试图得到数据时，没有任何变化。-de-belgrano', headers=headers) soup = BeautifulSoup(response.text

浏览 2提问于2022-03-23得票数 0

1回答

用Beautifulsoup复制的元素

、

这是url：soup.find_all('span', class_="sidearm-roster-player-height")我不明白为什么会这样。

浏览 0提问于2021-04-19得票数 0

1回答

Python:将网站从行中刮取的数据转换为内嵌套循环中的列

、、、

我相信用一个形象来解释比用我自己的话更容易。我用熊猫和xlsxwriter来存储，以达到最好的效果。我成功地将所有数据导出到excel，但我似乎无法将每个值的值转换为列。第一行是时间。

浏览 0提问于2019-02-04得票数 0

回答已采纳

1回答

用漂亮汤将硒html表格放入熊猫数据

、、

我已经成功地使用selenium来抓取一个html表，它需要在抓取之前点击按钮。不过，我很难把这个解析成熊猫的数据。import pandas as pdfrom bs4 import BeautifulSoup browser = webdriver.Firefoxbrowser.find_element_by_css_selector("

浏览 1提问于2020-04-03得票数 2

回答已采纳

1回答

使用Python在具有单个URL的网站多个页面上浏览表

表被分成不同的页面，但是所有的页面都使用相同的url。我使用熊猫和BeautifulSoup来解析HTML代码，并且我只能够抓取最初的表，但是我想要所有表中的全部数据。

浏览 5提问于2021-09-02得票数 0

回答已采纳

1回答

抓取JSON数据

、、、

我试图用BeautifulSoup4抓取https://understat.com/team/Arsenal/2019 (和其他英超球队页面)，以获得所有球员页面的链接，并最终抓取这些页面以获取单个球员的数据，但由于我不熟悉JSON数据，因此陷入了困境。我已经追踪到了我感兴趣的网页部分，但是我当前的输出看起来像这个var playersData = JSON.parse('\x5B\x7B\x22id\x22\x3A\x2

浏览 33提问于2019-09-12得票数 0

回答已采纳

1回答

用BeautifulSoup抓取TradingView上的数据

、

 但是，返回的项长度始终为0。requests.get('https://www.tradingview.com/symbols/INDEX-MMTW/')nmmtw_data = bs4.BeautifulSoup

浏览 33提问于2020-05-18得票数 1

1回答

使用BeautifulSoup找不到深度嵌套标记ID

、

我试图从中抓取NBA数据，但我遇到了BeautifulSoup抛出深度嵌套标记的问题。我试着用soup.find(id='opponent-stats-per_game')来抓取“对手每个游戏统计”表。然而，我得到了None的结果。我对使用BeautifulSoup进行网络抓取相当陌生。

浏览 1提问于2019-04-03得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云