腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
从
BigQuery
读取
数据
并
将其
写入
云
存储
上
的
avro
文件格式
java
、
google-bigquery
、
google-cloud-storage
、
google-cloud-dataflow
、
avro
我
的
目标是
从
BigQuery
表中
读取
数据
,
并
使用Java
将其
写入
云
存储
上
的
Avro
文件。如果有人提供代码片段/想法来编写
BigQuery
表
数据
,
并
使用Cloud Dataflow
将其
写入
avro
格式
的
数据
,那将是
浏览 16
提问于2019-09-11
得票数 0
2
回答
读取
Avro
文件并
将其
写入
BigQuery
表
google-bigquery
、
google-cloud-storage
、
google-cloud-dataflow
、
apache-beam
我
的
目标是
从
云
存储
中
读取
avro
文件
数据
,
并
使用Java
将其
写入
BigQuery
表。如果有人提供代码片段/想法来
读取
avro
格式
的
数据
并
使用
将其
写入
BigQuery
表,那就太好了。
浏览 1
提问于2019-02-05
得票数 5
回答已采纳
2
回答
BigQuery
-
从
驱动器创建表格时,谷歌工作表
文件格式
不再可用
google-bigquery
、
google-drive-api
自9月15日以来,当
从
驱动器创建
数据
库表时,
BigQuery
不再建议使用GOOGLE_SHEET
文件格式
。取而代之
的
是新
的
格式类型:
Avro
、JSONL、CSV、Parquet、ORC和
云
数据
存储
备份。通过粘贴CSV或
Avro
格式
的
电子表格
的
URL来创建表时,
BigQuery
会发送错误消息:Failed to create table: Und
浏览 40
提问于2021-09-16
得票数 0
3
回答
如何
从
云
数据
存储
迁移到
云
Spanner?
google-cloud-platform
、
google-cloud-datastore
、
database-migration
、
google-cloud-spanner
我正在查看
数据
流,以尝试将
数据
从
Datastore导出到Spanner。扳手似乎只接受通过
数据
流连接器
的
avro
文件。我能找到
的
唯一
数据
流模板是
从
数据
存储
到文本文件。并且
数据
存储
区导出服务仅导出为levelDB格式。任何线索都会很有帮助,谢谢!
浏览 59
提问于2019-05-03
得票数 0
回答已采纳
1
回答
BigQuery
中浮动
数据
类型中
的
值问题,同时将
AVRO
和parquet中
的
数据
加载到
Bigquery
表中
apache-spark
、
google-cloud-platform
、
google-bigquery
、
avro
、
parquet
我在
BigQuery
中使用bq加载作业或
从
AVRO
/Parquet文件中加载
数据
时,遇到了一个奇怪
的
问题。源文件具有值22.54
的
浮点
数据
类型,但在
将其
加载到
BigQuery
之后,它将自动更改为22.540000915527344。我尝试使用其他
文件格式
,
并
使用直接bq加载作业和使用火花
数据
格式,但问题仍然存在。加载后,我将添加
AVRO
文件
数据<
浏览 3
提问于2021-12-17
得票数 -1
2
回答
BigQuery
中不同
文件格式
加载
的
比较
google-cloud-platform
、
google-bigquery
我们目前通过csv或直接通过流式API将大部分
数据
加载到
BigQuery
中。然而,我想知道是否有可用
的
基准(或者Google工程师可以在答案中告诉我)加载不同格式
的
效率如何比较。例如,如果我们有相同
的
100行
数据
,
BigQuery
是否显示与加载它有任何性能差异: 我相信其中一个答案将是“为什么你不测试它”,但我们希望,在架构转换器或重写我们
的
应用程序之前,工程师可以与我们分享(如果有的话)上
浏览 1
提问于2018-03-14
得票数 1
回答已采纳
1
回答
BigQuery
数据
仓库设计?
google-bigquery
、
google-cloud-dataflow
、
dataflow
、
bigtable
HDFS::着陆区->级1区->级2区我在Google
浏览 0
提问于2018-08-14
得票数 0
回答已采纳
1
回答
直接创建
Avro
文件到
python
、
google-cloud-storage
、
avro
我想跳过在本地创建
avro
文件并
将其
直接上传到
的
步骤。import csvimport jsonimport
avro
.schema import
avro<
浏览 1
提问于2019-12-02
得票数 2
1
回答
从
BigQuery
导出
的
Firebase事件
firebase
、
google-cloud-platform
、
analytics
、
data-export
是否有一种将火基事件导出到(例如Parquet格式)
的
推荐方法?如果我将
数据
导出到
BigQuery
,那么将
数据
一致推送到
的
最佳方法是什么?原因是我有处理
云
存储
中
的
拼花文件
的
daraproc作业,我希望我
的
防火墙
数据
能够以同样
的
方式访问。
浏览 2
提问于2020-05-13
得票数 1
回答已采纳
3
回答
如何在
BigQuery
中备份
数据
集?
google-bigquery
、
backup
我们希望创建
BigQuery
数据
集
的
备份副本,以防表被意外删除,因为它只是可恢复
的
。 是否有办法延长恢复期
的
持续时间?如果没有,我们如何在
BigQuery
中创建保留期为30天
的
数据
集
的
备份?
浏览 5
提问于2018-11-21
得票数 2
1
回答
云
存储
中
的
数据
格式,同时使用
数据
流
从
PubSub流式传输PubSubmessage(json字符串)?
google-cloud-platform
、
google-cloud-dataflow
、
apache-beam
、
dataflow
我们希望使用
数据
流
从
Pub-Sub流式传输PubSubmessage(json字符串),然后
写入
云
存储
。我想知道在将
数据
写入
云
存储
时,什么是最好
的
数据
格式?我进一步
的
用例可能还涉及使用Dataflow再次
从
云
存储
读取
数据
,以便根据需要继续操作到
数据
湖。我在想
的</em
浏览 3
提问于2018-08-02
得票数 0
1
回答
在Firebase JS中记录用户操作
firebase
、
firebase-realtime-database
我想在我
的
Firebase应用程序
上
记录以下用户操作: 时间(毫秒):动作但是,我不会访问
存储
在用户日志位置
的
数据
,所以我相信这不会降低
数据</e
浏览 0
提问于2018-04-15
得票数 1
1
回答
将蜂巢表迁移到Google
BigQuery
hadoop
、
hive
、
google-bigquery
、
google-cloud-platform
我正在设计一种
数据
管道,以便将我
的
Hive表迁移到
BigQuery
中。Hive运行在前提集群
上
的
Hadoop
上
。这是我目前
的
设计,其实很简单,只是一个shell脚本: 使用distcp将生成
的
avro
文件移动到google
云</em
浏览 6
提问于2017-10-26
得票数 4
1
回答
将
数据
上载到
BigQuery
的
Google函数
的
服务帐户角色
google-cloud-platform
、
google-bigquery
、
google-cloud-functions
、
google-cloud-storage
、
google-cloud-iam
我有一个
云
函数,它从
云
存储
中
读取
文件并将
数据
上传到
BigQuery
。我想为这个函数创建一个要运行
的
服务帐户。对于完成这些操作
的
功能,应该向服务帐户赋予哪些特定和适当
的
角色?
浏览 8
提问于2022-10-10
得票数 0
回答已采纳
3
回答
与
BigQuery
兼容
的
Spark
AVRO
apache-spark
、
hive
、
google-bigquery
、
avro
我正在尝试在Hive中创建一个外部表,并在
BigQuery
中创建另一个表,使用与Spark编写
的
Avro
格式
存储
在Google Storage中
的
相同
数据
。我使用
的
是带有Spark 2.2.0、Spark-
avro
4.0.0和Hive 2.1.1
的
Dataproc集群
Avro
版本/包之间有相同
的
差异,但如果我使用Hive创建表,然后使用Spark编写文件但对于
BigQuery<
浏览 30
提问于2017-12-18
得票数 1
2
回答
如何使用java
数据
流导出csv文件到一个大
的
查询表?
export-to-csv
、
google-cloud-dataflow
我想从
云
存储
桶中
读取
一个csv文件,
并
使用java中
的
dataflow
将其
写到一个包含列
的
bigquery
表中。如何在
写入
bigquery
时设置csv文件
的
标头?
浏览 0
提问于2019-06-12
得票数 0
1
回答
是否有一种快速将
数据
从
BigQuery
加载到Clickhouse
的
好方法?
google-bigquery
、
clickhouse
我正在开发一个工具,它将把
BigQuery
查询
的
结果加载到Clickhouse中,以便进行进一步
的
分析。是否有一种快速将
BigQuery
表中
的
数据
导入Clickhouse
的
通用模式?到目前为止,我
的
最佳选择似乎是编写一个自定义工具,使用google
存储
api
从
查询结果表中
读取
数据
,
将其
作为
AVRO
写入
磁盘,然后加载到clickh
浏览 4
提问于2022-08-02
得票数 0
2
回答
Google
数据
融合无法访问来自另一个项目的
数据
,即使授予了访问权限
google-cloud-platform
、
google-bigquery
、
access-control
、
google-cloud-data-fusion
我已经启用了
云
数据
融合API,并在
BigQuery
中
的
项目A中创建了一个实例。项目A将包含我们
的
数据
仓库,并从
BigQuery
上
的
其他项目中加载和转换
数据
。当我试图
从
表B.X
上
的
项目B创建一个具有源
BigQuery
的
管道时,我会得到关于
BigQuery
表
的
详细信息:访问被拒绝:表B.X。在表B
浏览 5
提问于2021-10-06
得票数 0
回答已采纳
2
回答
如何计算将
数据
从
蔚蓝
数据
转移到google
BigQuery
时
的
成本
azure
、
google-cloud-platform
、
google-bigquery
我们在Azure中有一个
数据
存储
管道,可以将一个前提下
的
SQL表移动到Azure blob
存储
的
Gen2中。我认为大部分费用都来自Azure仓库,对吧?现在,我们希望将这些
数据
移动到
BigQuery
。由于我们
的
安全策略,我们仍然需要
数据
表管道
从
SQL表中
读取
。因此,我们创建了一个
数据
库笔记本,以
读取
拼花文件,
并
移动到
BigQuery</e
浏览 5
提问于2021-01-21
得票数 0
回答已采纳
2
回答
bigquery
存储
API:可以直接将
AVRO
文件流/保存到吗?
python
、
google-cloud-platform
、
google-bigquery
、
google-cloud-storage
、
avro
我想导出一个90 TB
的
BigQuery
表到。根据
的
说法,
BigQuery
存储
API (beta)应该是因为与其他方法相关联
的
导出规模配额(例如ExtractBytesPerDay)。该表是按日期划分
的
,每个分区占300 GB.我有一个运行在GCP
上
的
Python笔记本,它通过这个
从
改编
的
脚本运行分区(并行)。=
bigquery
_storage_v1.enums.DataForm
浏览 4
提问于2020-05-20
得票数 1
点击加载更多
相关
资讯
深入理解Kafka Connect:转换器和序列化
Apache Spark 2.4 内置的 Avro 数据源实战
带着目的去阅读——Hadoop权威指南
Spark 2.4 原生支持了avro,别再引用第三方库了
过去一年,Spotify最大一次数据流优化实践
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券