Loading [MathJax]/jax/output/CommonHTML/config.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >从htmlTable下载/抓取表

问从htmlTable下载/抓取表
EN

Stack Overflow用户

提问于 2019-02-11 00:32:38

回答 1查看 41关注 0票数 0

我正在尝试从下载csv

https://oceanwatch.pifsc.noaa.gov/erddap/griddap/goes-poes-1d-ghrsst-RAN.html

或者我试图从这里找到的网站上抓取html表格输出的数据帧。

[https://oceanwatch.pifsc.noaa.gov/erddap/griddap/goes-poes-1d-ghrsst-RAN.htmlTable?analysed_sst[(2019-02-09T12:00:00Z):1:(2019-02-09T12:00:00Z)][(-6.975):1:(42.025)][(179.025):1:(238.025)],analysis_error[(2019-02-09T12:00:00Z):1:(2019-02-09T12:00:00Z)][(-6.975):1:(42.025)][(179.025):1:(238.025)],mask[(2019-02-09T12:00:00Z):1:(2019-02-09T12:00:00Z)][(-6.975):1:(42.025)][(179.025):1:(238.025)],sea_ice_fraction[(2019-02-09T12:00:00Z):1:(2019-02-09T12:00:00Z)][(-6.975):1:(42.025)][(179.025):1:(238.025)]](https://oceanwatch.pifsc.noaa.gov/erddap/griddap/goes-poes-1d-ghrsst-RAN.htmlTable?analysed_sst[(2019-02-09T12:00:00Z%29:1:(2019-02-09T12:00:00Z%29][(-6.975%29:1:(42.025%29][(179.025%29:1:(238.025%29],analysis_error[(2019-02-09T12:00:00Z%29:1:(2019-02-09T12:00:00Z%29][(-6.975%29:1:(42.025%29][(179.025%29:1:(238.025%29],mask[(2019-02-09T12:00:00Z%29:1:(2019-02-09T12:00:00Z%29][(-6.975%29:1:(42.025%29][(179.025%29:1:(238.025%29],sea_ice_fraction[(2019-02-09T12:00:00Z%29:1:(2019-02-09T12:00:00Z%29][(-6.975%29:1:(42.025%29][(179.025%29:1:(238.025%29])

我已经尝试用以下方法抓取数据：

library(rvest)
url <- read_html("https://oceanwatch.pifsc.noaa.gov/erddap/griddap/goes- 
  poes-1d-ghrsst-RAN.htmlTable?analysed_sst[(2019-02-09T12:00:00Z):1:(2019- 
  02-09T12:00:00Z)][(-7):1:(42)][(179):1:(238)],analysis_error[(2019-02- 
  09T12:00:00Z):1:(2019-02-09T12:00:00Z)][(-7):1:(42)][(179):1: 
  (238)],mask[(2019-02-09T12:00:00Z):1:(2019-02-09T12:00:00Z)][(-7):1:(42)] 
  [(179):1:(238)],sea_ice_fraction[(2019-02-09T12:00:00Z):1:(2019-02- 
  09T12:00:00Z)][(-7):1:(42)][(179):1:(238)]")

test <-  url %>%
  html_nodes(xpath='table.erd.commonBGColor.nowrap') %>%
  html_text()

我试着用以下命令下载csv

download.file(url, destfile = "~/Documents/test.csv", mode = 'wb')

但这两种方法都不起作用。download.file函数下载了一个带有节点描述的csv。rvest方法在我的macbook上给了我一个巨大的字符串，在我的windows上给了我一个空的数据框。我也尝试过使用selectorgadget (chrome扩展)来获取我需要的数据，但是selectorgadget似乎不能在htmlTable上工作

云直播特惠9.9元起

基于腾讯云多年音视频能力积淀，支持超低延迟、超高画质、超大并发访问量的直播需求，满足客户的多样化直播需求

EN

回答 1

Stack Overflow用户

发布于 2019-02-11 04:14:25

我设法使用htmltab包找到了解决方案，但不确定它是否是最优的，它是一个网页的大数据框架，需要一段时间才能加载到数据框架中。table2用于实际的表格，因为在你给出的链接中有2个html表格。

url1 <- "https://oceanwatch.pifsc.noaa.gov/erddap/griddap/goes-poes-1d-ghrsst-RAN.htmlTable?analysed_sst[(2019-02-09T12:00:00Z):1:(2019-02-09T12:00:00Z)][(-6.975):1:(42.025)][(179.025):1:(238.025)],analysis_error[(2019-02-09T12:00:00Z):1:(2019-02-09T12:00:00Z)][(-6.975):1:(42.025)][(179.025):1:(238.025)],mask[(2019-02-09T12:00:00Z):1:(2019-02-09T12:00:00Z)][(-6.975):1:(42.025)][(179.025):1:(238.025)],sea_ice_fraction[(2019-02-09T12:00:00Z):1:(2019-02-09T12:00:00Z)][(-6.975):1:(42.025)][(179.025):1:(238.025)]"
tbls <- htmltab(url1,which = "//table[2]")
rdf <- as.data.frame(tbls)

如果有帮助，请告诉我。

票数 0

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/54622580

复制

相关文章

图表绘制之RepeatNode的妙用

最近接到许多大屏项目，其中有一个智慧大楼的项目，大致是由3d场景+数据图表组成，需要能监控实时数据、安防

用户3158888

2020/12/18

5950

使用 plotly 绘制数据图表

数据可视化大数据

不少小伙伴在开发过程中都有对模块进行压测的经历，压测结束后大家往往喜欢使用Excel处理压测数据并绘制数据可视化视图，但这样不能很方便的使用web页面进行数据展示。本文将介绍使用python-plotly模块来进行压测数据的绘制，并且生成静态html页面方便结果展示。

邵靖

2018/01/15

4K0

使用 plotly 绘制数据图表

canvas绘制虚线图表

其实该图表，就是一个圆圈外面在套一个圆弧的效果，主要的难点在于不知道怎么绘制圆圈的虚线效果。其实canvas本身已经支持了虚线的绘制，就是一个api调用的事情，api是setLineDash。

用户3158888

2022/03/22

1.5K0

Excel图表技巧02：绘制动态图表

data excel offset 图表

当图表数据区域中的单元格数据增加或减少时，图表会自动相应变化，这就是我们所说的动态图表。本文介绍Excel中两种基本的制作动态图表的方法。

fanjy

2021/01/06

1.5K0

使用plot绘制实时图表

先上图片 var dataObj = []; var dataLength = 60; var updateInterval = 3000; var options = { series: { shadowSize: 0,lines: { show: true },points: { show: true } }, grid: { hoverable: true}, yaxis: {

liulun

2022/05/09

9900

Python 实现图表绘制总结

python matlab numpy

Numpy是Python开源的数值计算扩展，可用来存储和处理大型矩阵，比Python自身数据结构要高效；

王瑞

2022/12/28

6940

Python 实现图表绘制总结

笔记：使用python绘制常用的图表

bash bash 指令

参考链接： Python | 使用openpyxl模块在Excel工作表中绘制图表 1

用户7886150

2020/12/23

1.4K0

甘特图绘制（Excel绘制图表系列课程）！

谈到甘特图，很多人最先想到的是项目经理，想到项目经理，最先想到的就是嗯！这两个字就是形容包括我在内的所有项目管理人员的！回归正轨，是这样的，项目经理呢，最重要的就是进度管控，俗话说就是在指定时

用户1332619

2018/03/08

1.8K0

甘特图绘制（Excel绘制图表系列课程）！

matplotlib: 绘制平面图/表格

基本架构 import matplotlib.pyplot as plt plt.figure() ... plt.show() 窗口 plt.figure() plt.figure(num=None, figsize=None, dpi=None, facecolor=None, edgecolor=None, frameon=True, FigureClass= """ 示例： """ # 编号为3；大小为(8, 5). plt.figure(num=3, figsize=(10, 5)

JNingWei

2018/09/27

2.6K0

常见图表绘制（汇总版）

各位亲，分享了这么多期图表，打算做个汇总版的，方便各位以后查询。点击标题可以直接链接至对应的文章！第一节：巧妙设置目标红线第二节：帕累托图绘制第三节：复合饼图绘制第四节：金字塔图绘制第五

用户1332619

2018/03/08

7960

【说站】python中Excel图表的绘制

以上就是python中Excel图表的绘制，希望对大家有所帮助。更多Python学习指路：python基础教程

很酷的站长

2022/11/23

1.6K0

【说站】python中Excel图表的绘制

Python-matplotlib 商业图表绘制01

python axes label matplotlib 图表

在绘制学术图表之余，我们也会进行商业图表的绘制，毕竟学术图表的配色有点单调和严谨啊

DataCharm

2021/02/22

5660

Python-matplotlib 商业图表绘制01

Python-matplotlib 商业图表绘制04

python matlab numpy

本期还是推出Python-matplotlib "小清新"商业图表的绘制推文，在发现ax.plot()绘图函数的多类别图表功能后，经过不断和点、文本等尝试搭配后，所能构建的图表也就多了起来，下面就直接上教程。

DataCharm

2021/02/22

9780

Python-matplotlib 商业图表绘制04

如何运用Python绘制NBA投篮图表

翻译｜丁雪丁一席雄芬校对｜姚佳灵我在本文中将介绍如何获取一个选手的投篮数据并通过matplotlib 和 seaborn制成图表。 In [1]: %matplotlib inline import requests importmatplotlib.pyplot as plt import pandas aspd import seabornas sns 获取数据从stats.nba.com获取的数据是非常简单的。虽然NBA没有提供公共的API ，我们实际上可以通过requests 库

大数据文摘

2018/05/22

2.6K0

如何使用Excel绘制图表？

excel 配色设计数据图表

通过使用Excel进行数据分析，我们已经学会了从原始数据中得到分下面的分析结果：统计出每个城市的数据分析师招聘数量。

猴子数据分析

2023/09/27

6830

Django 配合Echarts绘制图表

python django json tcp/ip 网站

在前面我总结了关于DjangoAdmin的使用技巧，利用DjangoAdmin这个后台管理功能，自己定制页面可以完成非常多的功能，下面我们将重点研究主机图形的绘制，展示和报表等功能的具体实现步骤，这里也算是个人的一点点经验。

王瑞

2022/12/28

1.3K0

Django 配合Echarts绘制图表

绘制图表（1）：初次实现

python http 编程算法

今天介绍如何用Python创建图表。具体地说，你将创建一个PDF文件，其中包含的图表对从文本文件读取的数据进行了可视化。虽然常规的电子表格软件都提供这样的功能，但Python提供了更强大的功能。当你再次实现这个项目并从网上自动下载数据时，就意识到这一点。

不可言诉的深渊

2019/07/26

2.2K0

掌握 PlantUML：以代码的形式绘制 UML 图表

uml 对象工具软件开发图表

如果你是一名软件开发人员，项目经理，或者与软件系统设计和开发相关的专业人员，那么你可能已经知道统一建模语言 (UML) 图的价值。UML 图是强大的视觉工具，它们可以帮助我们更好地理解，设计和沟通复杂的软件系统。然而，手动绘制和更新 UML 图可能会非常耗时，并且难以维护。这就是 PlantUML 发挥作用的地方。

运维开发王义杰

2023/08/10

1.2K0

掌握 PlantUML：以代码的形式绘制 UML 图表

Python-matplotlib 商业图表绘制03

python ls marker matplotlib plot

本篇推文为python-matplotlib 商业图表绘制的第三篇文章，主要内容为圆润柱状图的绘制，这也是我之前一直想做的事情，在浏览Matplotlib官网时，发现了一个方法，就试着进行绘制，效果还不错。接下来，我们开始

DataCharm

2021/02/22

6360

Python-matplotlib 商业图表绘制03

Python-seaborn 基础图表绘制-散点图

python matlab numpy

上期推文推出第一篇基础图表绘制-R-ggplot2 基础图表绘制-散点图的绘制推文，得到了很多小伙伴的喜欢，也是我更加想使这个系列做的更加完善和系统，我之前也有说过，会推出Python和R的两个版本绘制教程，接下来我们就推出基础散点图的Python绘制版本。本期主要涉及的知识点如下：

DataCharm

2021/02/22

1.2K0

Python-seaborn 基础图表绘制-散点图

相似问题

Pandas:如何在月度计数时绘制条形图

113

绘制返回的记录计数图表

14

跟踪每个人的月度呼叫计数- MySQL还是XML？

20

每个员工的月度结果

17

用熊猫绘制每个国家的图表

11

交个朋友

加入腾讯云官网粉丝站

蹲全网底价单品享第一手活动信息

活动推荐

iOA 零信任安全管理系统