如何在谷歌BigQuery中创建熊猫数据帧时执行na_values

文章/答案/技术大牛

发布

2回答

、、

我曾经使用过pd.read_csv(my_csv, na_values=['N/A', '--'])，这样字符串'N/A‘和'--’会被解释为NULL、NaN等。但如果我使用BigQuery客户端，我不知道如何实现同样的壮举。我读了.to_dataframe()的快速帮助，它“从QueryJob返回一个熊猫DataFrame”，但它似乎没有接受任何额外的参数。这个是可能的吗？

浏览 28提问于2019-05-30得票数 0

回答已采纳

1回答

Bigquery python中的多行

如何在bigquery中插入5k行的python字典？我在上使用了文档，但只能一次插入1行。如何一次在字典中插入所有5k行？如果我使用熊猫数据插入，我会得到错误的NotImplementedError: Google's libraries do not support Python 3 yet。projectId='na-sem',datasetId='Rules',tableId='my_table',body=

浏览 0提问于2015-09-21得票数 3

1回答

如何从Cloud Datalab中将数据框导出到BigQuery表？

、、

我在谷歌云数据实验室工作，我想导出一个熊猫数据帧作为一个新的BigQuery表。我正在尝试遵循Cloud Datalab附带的在线帮助笔记本，尽管我看到没有导出到BigQuery的示例，只导出到谷歌云存储。无论如何，我知道如何在BigQuery中用正确的模式创建表，但是我不知道如何将实际数据放入表中！因此，这将输出：[{'type'

浏览 1提问于2015-12-17得票数 1

1回答

Google Cloud Function + bigquery:内部服务器错误

、、、

我用python创建了一个Google云函数，它向API请求数据，执行ETL，最后将得到的熊猫数据帧放入一个大的查询表中。部署是正确的，但是当我触发函数(HTTP触发器)时，我得到这个错误：The server encountered an internal error and以下是我的代码的简化版本：from google.cloud import big

浏览 4提问于2020-12-28得票数 0

2回答

如果表通过保留期被删除，Bigquery会收费吗？

我有大约150 GB的数据，我想使用DML语句将其存储在bigquery中。根据他们的说法，他们将收取通过DML删除表的费用。如果我创建了一个保留期的表，我会为此收费吗？考虑到我总是会插入数据。我并不担心插入数据的成本。

浏览 1提问于2018-12-05得票数 0

回答已采纳

1回答

执行google数据流作业时获取HTTP传输错误

在执行数据流作业时，我得到了一个持续的错误：它并没有给出<e

浏览 4提问于2016-08-29得票数 1

回答已采纳

2回答

如何从一行开始我的excel标题(第10行是数据开始的地方)

、、、

如何在使用熊猫创建数据帧时，将标题从第9行移动到顶部。我不想从0-8行中删除数据。下面是我所拥有的数据的屏幕截图，我的数据在第9行之后开始，在第9行中，您可以看到实际的标题。我使用了drop来删除行，但是我想探索保留数据然后执行相同操作的选项。提前感谢！

浏览 1提问于2020-05-27得票数 0

回答已采纳

2回答

熊猫阅读格式%D:%H:%M:%S与python

、、、、

目前，我正在一个数据帧中阅读，其时间戳来自电影00(天)：00( 24小时到24天)：00(分钟)：00(秒)或者，使用timedelta，我将如何在数据帧中将DD输入HH，这样熊猫就可以使其成为"1天HH:MM:SS“。数据样本 00:00:

浏览 12提问于2022-03-09得票数 0

回答已采纳

1回答

使用Javascript将传感器生成的数据推送到Google Cloud Function

、、、、

这个设备有自己的接口来读取生成的数据，我有它用来做这件事的代码。我需要帮助使用代码获取生成的数据，并将其发送到云上。我是一个初学者，我不知道如何去解决这个问题，所以任何类型的方向都将非常感谢。下面是用于获取数据并将其打印到HTML表上的代码。

浏览 1提问于2021-02-22得票数 0

1回答

BigQuery中时间分区表的自动模式

、

我正在尝试将数据追加到时间分区表中。我们可以创建一个时间分区的表，如下所示：# client = bigquery.Client() table.table_id, table.time_partitioning.field)) 然而，我想知道如何在没有预定义模式的情况下执

浏览 1提问于2019-02-18得票数 0

2回答

Composer $$$ (使用> Cloud > BigQuery* >少量Python / SQL查询的更好/更便宜的选项)*

、、、、

用例/过程>> --我有一个流程设置，遵循以下步骤：有一个使用Firebase构建的站点，该站点具有文件删除/上传( CSV )功能，可以将数据导入GoogleStorage，该文件删除触发一个云功能，该功能启动Composer DAG将CSV从云存储移动到BigQuery，同时使用Python / SQL查询对数据集执行一系列修改。

浏览 8提问于2020-12-17得票数 2

1回答

Google Analytics数据到Pandas Dataframe

、、、、

我正在尝试使用谷歌分析api将谷歌分析数据发送到熊猫数据帧。我遵循了官方文档中提供的代码示例，现在我有了设法打印出所需数据的代码。我需要帮助弄清楚如何将数据发送到熊猫数据帧，而不仅仅是打印出来。一旦我执行了查询，这就是我得到的原始输出： {'kind': 'analytics#gaData', 'id': 'ht

浏览 10提问于2020-01-21得票数 2

回答已采纳

1回答

谷歌BigQuery结果不显示

、、、

我创建了一个python脚本，用于将熊猫数据帧推送到Google BigQuery中，看起来我可以直接从GBQ查询表。但是，当另一个用户从我在GBQ上生成的同一个表中进行查询时，他们无法查看结果。这似乎是一个大查询问题，因为当他们尝试连接到GBQ并使用pandas间接查询表时，(pd.read_gbq("SELECT * FROM ...", project_id))似乎工作得很好。

浏览 0提问于2019-09-13得票数 1

2回答

使用数据流处理来自BigQuery的数据

、、、

我希望从每小时到达的BigQuery中检索数据，并在新的BigQuery表中进行一些处理并提取新的计算变量。事情是，我从来没有与gcp工作过，现在我必须为我的工作。我已经在python中使用我的代码来处理数据，但是它只适用于“静态”数据集

浏览 0提问于2020-06-29得票数 0

回答已采纳

1回答

在数据流中创建新的BigQuery数据集

、、

如何在数据流中创建新的BigQuery数据集以将数据保存在？我希望dataset名称使用dataflow程序中的version标记进行版本化。我正在使用python，并尝试使用BigQuery客户机在beam.io.BigQuerySink之外执行此操作，但是在gcp上运行流时，我会得到以下错误：ImportError: No modulenamed cloud，它引用了bigquery<

浏览 5提问于2017-03-13得票数 0

回答已采纳

1回答

BigQuery + PlayStore +应用程序历史记录数据

我们正在努力将我们的应用程序数据集成到BigQuery中。作为其中的一部分，我们使用BigQuery传输服务来引入应用商店数据。我认为计划传输的工作方式是，从我们设置它的那一天起，它就会开始从那里引入任何新的增量数据，这些数据适用于未来的数据集。我们还拥有要与latest+future数据一起使用的现有数据。当我在这里使用“计划回填”选项时，我可以去引入任何以前的数据，除了当我使

浏览 16提问于2019-12-17得票数 0

1回答

性能注意事项pandas concat append

、

我创建了一个熊猫数据帧。现在，我必须不断地向该数据帧中添加行。我应该使用concat，append还是任何其他的？我要求在执行此操作时考虑到性能因素。使用concat或append操作时需要考虑的经验法则是什么？

浏览 0提问于2016-03-12得票数 1

2回答

使用云函数(从google云存储到bigquery* )实现批处理自动化--缺少一些东西*

、、、、

我想要实现的：每次我上传一个文件到云存储，它将自动被写入BigQuery。但是他们不一起工作。如何让云函数触发来激活数据流部分？这是一个脚本，还是只是一些设置，我错过了？缺少一些东西把它们连接起来。

浏览 7提问于2021-03-03得票数 0

回答已采纳

1回答

通过读取Python的dask模块中的pickle文件来创建dask数据帧

、

当我尝试通过读取pickle文件来创建dask数据帧时，我得到了一个错误ds_df = dd.read_pickle("D:\test.pickleAttributeError: 'module' object has no attribute 'read_pickle' 在大熊猫身上，它一如既往地成功了。所以，如

浏览 1提问于2015-12-14得票数 7

1回答

合并功能不适用于单个记录

、

我现在正在学习熊猫。对于赋值，我必须合并到数据帧。这对于我需要的前15个记录来说是成功的，除了一个记录，那就是伊朗。当我执行“外部”合并时，它会显示以下内容：combined2 = pd.merge(combined1, energy, how='outer', on='Country')

浏览 9提问于2017-01-09得票数 0

回答已采纳

点击加载更多