如何生成大型BigQuery表的有序导出？

文章/答案/技术大牛

发布

1回答

、、

我想在Google Cloud Storage中生成一个大型BigQuery表的有序CSV导出。目前，我们从一个未排序的表开始，然后对另一个表执行SELECT * FROM table ORDER BY col1, col2操作，然后将该表导出到GCS。这很有效，因为导出似乎使用了第二个表的插入顺序。但是，正如和所讨论

浏览 9提问于2016-08-11得票数 3

1回答

如何将防火墙子集合导出到bigquery表？

、、、、

我们需要将Fi还原数据导出到Bigquery以进行数据工作室报告。我们的Firestore有许多子集合，我们无法导出子集合。需要专家建议--如何将防火墙子集合导出到bigquery表(理想情况下，将不同的子集合导出到不

浏览 1提问于2019-06-19得票数 3

回答已采纳

1回答

BigQuery对Simba驱动程序有任何数据限制吗？

我计划使用Simba驱动程序从BigQuery加载数据。在浏览常见问题时，我发现下面的陈述阻止了我继续前进。这些驱动程序利用BigQuery的查询接口，而不提供利用BigQuery的大规模摄取机制或导出功能的功能。使用ODBC驱动程序从BigQuery表导出完整数据是可行的，还是对数据大小(行数或卷数)有任何限制？

浏览 4提问于2020-06-08得票数 0

1回答

不使用防火墙导出集合对BigQuery扩展进行分区的大查询表

、

我使用Export Collections to BigQuery扩展和防火墙将数据导出到大型查询，我可以将数据导出到大型查询，但是即使在创建时配置扩展时已经启用了带有扩展的表，表也没有被分区

浏览 1提问于2021-03-22得票数 1

1回答

从BigQuery导出不工作

、、、

我正在尝试从BigQuery导出一个大型CSV数据集。该文件超过90000行，因此BigQuery提示我将表导出到出口格式: CSV，：my_bucket/2015/feb.csv我哪里出问题了吗？如何正确下载和打开此文件？

浏览 1提问于2016-01-22得票数 1

回答已采纳

5回答

将数据从防火墙导入到bigQuery中

、、

我已将我的帐户升级为烈火，这是先决条件之一。我已经尝试遵循链接BigQuery到Firebase。仍然无法看到从消防站或消防基地-实时数据库到bigQuery的任何数据。我在bigQuery中看到了创建数据集的选项。但是，在创建dataset之后，它允许我从文件、云存储、bigQuery、google上传数据。但不是火药库数据库。请帮帮忙。

浏览 22提问于2017-11-16得票数 8

回答已采纳

3回答

将大查询导出到Google云存储

、

我喜欢将大查询导出到Google云存储。除了导出查询之外，还有任何其他选项可以这样做。我的数据大约是2GB，在导出查询中，它在不同的文件中分割，数据作为数据很大。所以我只能在一个文件中导出。所以请帮我同样的忙。

浏览 9提问于2022-05-19得票数 0

1回答

我想访问Heroku上python的google BigQuery公共数据集。基本上，在下面的示例中，我想访问莎士比亚数据集，而不是雅虎天气api。我可以使用我生成的API_KEY作为它的公共数据集来访问它吗?或者我需要OAuth身份验证吗？根据上面的链接，我可以看到“如果您只调用不需要用户数据的API，比如，那么API键的使用可能比OAuth 2.0访问令牌更简单。”我尝试了许多GAE的变体，并且遇到了一些问题，项目id变成null

浏览 3提问于2017-02-12得票数 0

回答已采纳

2回答

将原始“事件”数据从火基导出到大查询？

、、、

我有一个在firebase控制台中显示事件的应用程序，我已经完成了与大查询的链接项目，但是在大查询中只显示dataset firebase_crashlytics和firebase_messaging。如何将event数据检索到大型查询？大查询中的数据集

浏览 5提问于2020-08-14得票数 0

2回答

BigQuery

、

可以将仪表板上的数据加载到BigQuery，然后运行一些查询并导出它。我知道有一个从大型查询导出数据的选项，但我现在面临的问题是如何访问BigQuery中的仪表板数据。任何对此的洞察力都会很有帮助。

浏览 0提问于2014-10-13得票数 3

回答已采纳

1回答

错误:无法在BigQuery中访问类型为ARRAY<STRUCT<element STRING>>的值上的字段元素

、、、、

我将一个df从pyspark导出到BigQuery。df包含包含数组元素的列，如何将数组转换为连接字符串？每当我尝试查询导出的BigQuery表的数组列时，都会得到以下错误。Error: Cannot access field element on a value with type ARRAY<STRUCT<element STRING>> 下面是导出到BigQuery<

浏览 48提问于2020-06-03得票数 2

1回答

如何在BigQuery中最大限度地减少每次执行SQL查询的成本

、、

我是BigQuery和GCP的新手。我正在使用BigQuery中可用的(大型)公共数据集，运行一个SQL查询--它基于一个简单的where子句从dataset中的一个表中选择一组数据。然后，我将对获得的数据执行额外的操作。我只需要每月运行一次这个查询，其他操作就需要更频繁地运行(每小时)。我的问题是，每次我这样做，都会导致BigQuery处理4+百万行数据，而运行这个查询的

浏览 3提问于2019-12-30得票数 2

回答已采纳

1回答

在使用通配符选项从BigQuery导出到GCS时，是否有方法获取从大型表生成的文件列表？

、、

我使用通配符*导出，以便将大型BigQuery表导出到GCS中的单独文件中。我使用了GCP文档中提供的代码示例：client = bigquery.Client() destination_uri = "gs://{}&#x

浏览 12提问于2022-03-03得票数 0

1回答

为什么BigQuery要将Firebase user_property转换为int？

、、

我们有移动平台(iOS和Android)和网络平台，将事件流传输到Firebase，然后将其导出到BigQuery。然而，BigQuery对待user_properties的方式在移动平台和web平台之间是不同的。我理解在Firebase中，所有的用户属性都是字符串。在移动平台中，一个特定的user_property显示为字符串，而在web平台上，它被转换为整数(user_property.value.string_value vs user_property.value.int_val

浏览 1提问于2020-07-02得票数 0

回答已采纳

1回答

大查询不接受表情符号

、、

我有这种格式的表情符号-- \U0001f924 --为什么BigQuery(Google )不显示它们，即使我看到这种格式对其他人有用的例子？示例：-秒Emoji格式的\u2614 参考文献：更新1.0: 如果我使用""，那么\U2714以这种格式显示表情符号，这个\U0001f680仍然与文本U0001f680如果我使用''，那么\U2714格式的表情符号以及\U0001f680只显示值U2714 and U0001f

浏览 5提问于2018-09-06得票数 1

回答已采纳

1回答

导入Google Analytics到Redshift

、

我正在尝试如何将Google Analytics数据导入AWS Redshift。到目前为止，我已经能够设置一个导出作业，以便将数据导入到谷歌的BigQuery，然后将表导出到谷歌的云存储。BigQuery以特定的方式存储数据，因此当您将其导出到文件时，它会为您提供一个多级嵌套的JSON结构。因此，为了将其导入Redshift，我必须将JSON“分解”为表或CSV文件。我还没能找到

浏览 4提问于2018-11-09得票数 0

2回答

如何检索100+GB大小为R的BigQuery表

、、

我目前在BigQuery中有一个大小为100+GB的表，我想检索到R中。我在R中使用bigrquery包中的list_tabledata()函数，但这需要大量的时间。有没有人建议在R中处理如此大量的数据，以及如何提高性能？有没有什么包、工具？

浏览 0提问于2016-01-07得票数 1

2回答

如何查询从导出到BigQuery的日志消息中的特定文本？

、

我使用Google平台日志记录部分中的“Create”将日志条目导出到大型查询中进行分析下面是记录日志条目的BigQuery表结构的一部分我想搜索包含此用户id 14994838999176的条目。在BigQuery中，我发出以下查询(以标准SQL方言表示)， ARRAY&

浏览 0提问于2018-03-23得票数 3

1回答

如何在BigQuery中从分区表中删除列

、、

在BigQuery中，不能对分区表使用create or replace table语句。我可以将表导出到GCS，但是BigQuery会生成多个无法一次性导入到表中的JSON文件。有没有一种从分区表中删除列的安全方法？我使用BigQuery的web界面。

浏览 1提问于2020-09-23得票数 0

3回答

以高效的方式从BigQuery读取到Spark？

、、、

当使用从BigQuery读取数据时，我发现它首先将所有数据复制到Google Cloud Storage。然后将这些数据并行读取到Spark中，但当读取大表时，复制数据阶段需要很长时间。那么有没有更有效的方法将数据从BigQuery读取到Spark中呢？另一个问题:从BigQuery阅读由2个阶段组成(复制到GCS，从GCS并行阅读)。复制阶段是否受Spark簇大小的影响，还是需要固定的时间？

浏览 6提问于2017-01-04得票数 7

回答已采纳

点击加载更多