腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
0
回答
BigQuery
插入
作业
而
不是
流式
处理
、
我目前正在使用
BigQuery
的stream选项将数据加载到表中。但是,具有日期分区的表不会显示任何分区...我意识到这是流的影响。我使用的Python代码:
bigquery
_client =
bigquery
.Client() table = dataset.table(table_name)
浏览 9
提问于2016-12-30
得票数 1
回答已采纳
2
回答
通过加载
作业
(非
流式
处理
)
插入
到
BigQuery
、
我希望使用数据流将数据加载到使用的
BigQuery
表中,
而
不是
流式
处理
(对于我们的用例,
流式
处理
的成本太高)。我看到Dataflow SDK内置了对通过BQ流
插入
数据的支持,但我在Dataflow SDK中找不到任何开箱即用的支持加载
作业
的功能。以下是一些问题:2)如果我需要自己滚动
浏览 0
提问于2015-06-17
得票数 3
1
回答
使用AVRO格式的BiqQuery流
插入
、
、
、
有没有办法使用
流式
插入
将AVRO格式的数据
插入
到
BigQuery
中?如果是,我们使用的是,但似乎不支持。仅支持json类型。我是
不是
遗漏了什么?有没有一种方法可以使用
流式
插入
插入
AVRO格式的数据,你能链接我到任何示例吗?如果无法使用
流式
插入
插入<
浏览 14
提问于2017-01-31
得票数 2
回答已采纳
1
回答
使用BigQueryIO写入大(>20KB)记录
是否可以配置非流
BigQuery
写入,以支持更大(1MB)的行大小?我的DataFlow
作业
是批
处理
作业
,
而
不是
流
作业
,
BigQuery
流
不是
必需的,在本例中也不需要,因为它限制了我导入数据。如果没有,那么将大行导入
BigQuery
的推荐工作流程是什么?
浏览 1
提问于2015-04-14
得票数 2
2
回答
对于数据流,BigqueryIO.write()和
bigquery
.insertAll()方法哪个更好
、
、
、
我正在开发java代码,以便从GCS读取记录并
插入
到BQ表中,从成本和性能的角度来看,哪个BigqueryIO.write()或
bigquery
.insertAll()方法更好。
浏览 0
提问于2019-03-05
得票数 1
1
回答
使用数据流在
BigQuery
表之间进行
流式
更新
、
、
正在尝试在云数据流
作业
中启用
流式
处理
,该
作业
需要从一个
BigQuery
表中读取数据,然后使用附加模式将其写入另一个
BigQuery
表。<TableRow>into(FixedWindows.of(Duration.standardMinutes(1)))); 最后使用BigQueryIO(如下代码)将数据写入
BigQuery
表。但是,如果您在第一个表中
插入
新数据,则第二个表不会得到反映。
作业
似乎已完成,状态为成功,但<em
浏览 0
提问于2019-03-06
得票数 0
2
回答
从HTTP请求API拉取数据到Google Cloud
、
、
、
、
我有一个应用程序,从API发送数据给我。数据是半结构化的(json数据) 我想把这个数据发送到Google Big Query,以便储存所有的信息。 但是,我不知道如何才能正确地做到这一点。 到目前为止,我已经在自己的服务器上使用Node通过POST请求获取数据。 你能帮帮我吗?特纳克。
浏览 17
提问于2019-10-15
得票数 0
1
回答
如何截断临时表?
为了保持列的唯一性,我的几个客户将数据
流式
传输到BQ中的临时表(如果不存在于主表中,则重试2次,间隔10分钟),并使用另一个cron
作业
每隔几分钟将临时表合并到一个列分区表中。如果临时表被合并到主表中,我需要截断它,但似乎我的客户端一直都在
流式
传输数据。这里有什么推荐吗?
浏览 2
提问于2018-07-22
得票数 1
0
回答
如何在
BigQuery
插入
错误时崩溃/停止DataFlow发布/订阅摄取
、
、
如果从PubSub接收的事件/行中的字段
不是
目标
BigQuery
表中的列,则DataFlow
作业
会在运行时记录IOExceptions,声明它无法
插入
行,但似乎会确认这些消息并继续运行。至少,我希望确保那些无法
插入
到
BigQuery
中的发布/订阅消息不会被确认,这样我就可以修复问题,重新启动数据流
作业
,并再次使用这些消息。我知道这里描述了一个用于
处理
错误输入的建议解决方案: 我还知道Apache Beam上的这个PR,它允许
浏览 5
提问于2017-06-10
得票数 5
回答已采纳
2
回答
从数据流在
BigQuery
中
插入
数据
、
、
以前,我有PCollection formattedResults;,我使用以下代码在大型查询中
插入
行:PCollection<TableRow.withWriteDisposition(BigQueryIO.Write.WriteDisposition.WRITE_APPEND));PCollection<KV<String, Iterable<TableRo
浏览 3
提问于2016-08-05
得票数 0
1
回答
如何
处理
大查询错误403:配额超过?
、
、
、
、
因此,我们每天都会将1440个
作业
附加到GCP设置的略低于1500日限制的大型查询表中。如果我们有更多的设备,这种方法肯定会失败。有没有人有实时监控传感器和在云中存储数据的经验?你用的是什么工具?
浏览 2
提问于2021-12-21
得票数 0
回答已采纳
2
回答
数据流:我可以用批
处理
作业
连续写入/流写入
BigQuery
吗?
、
、
我有一个apache管道,它接收一些信息,将其格式化为TableRows,然后写入
BigQuery
。直到数据流
作业
完成后,才会将行写入
BigQuery
。如果我有一个需要很长时间的数据流
作业
,我希望能够看到
插入
到
BigQuery
中的行,谁能给我指明正确的方向? 提前感谢
浏览 0
提问于2018-06-08
得票数 1
2
回答
发布/订阅到不使用DataFlow的
Bigquery
、
、
、
我想使用pubsub将数据
插入
到
bigquery
表中。数据已经
处理
过了,所以我不需要数据流。我该怎么做呢?提前感谢
浏览 0
提问于2018-07-03
得票数 2
0
回答
BigQuery
覆盖
作业
期间的
流式
插入
我有一个
BigQuery
表,我想通过writeDisposition WRITE_TRUNCATE使用一个
作业
,用它的行子集覆盖这个表。假设在
作业
运行时,我同时尝试将行
流式
传输到表中。是否可以在
作业
运行时
插入
行,从而在
作业
完成时覆盖行?或者,是否有一种锁定机制可以防止在
作业
完成之前
插入
行?
浏览 6
提问于2016-07-13
得票数 3
回答已采纳
1
回答
使用Java将JSON
流式
传输到
BigQuery
中
、
、
我正在尝试使用类似于教程的Java驱动程序将数据
流式
传输到
BigQuery
,该教程将数据从地图
插入
到
BigQuery
表中。支持在
插入
时将行指定为JSON,所以我想知道是否可以使用JSON驱动程序将JSON
流式
传输到
bigquery
,
而
不必使用如下示例所示的映射。;InsertAllResponse response =
bigqu
浏览 6
提问于2017-08-01
得票数 0
回答已采纳
1
回答
Apache横梁使用多个表时的写入次数
、
、
、
我正在使用Apache Beam从PubSub读取消息,并将它们写入
BigQuery
。我正在尝试做的是根据输入中的信息写入多个表。为了减少写操作,我对来自PubSub的输入使用了窗口。
浏览 0
提问于2019-12-21
得票数 0
1
回答
将数据从RDBMS加载到
Bigquery
我有一个App Engine调度
作业
,它每天运行,并在PostgreSQL表(托管在gcp中,
而
不是
cloudsql中)中查找满足归档条件的行。如果满足条件,它将连接到
BigQuery
并将数据
流式
传输到大型查询。每天,有资格归档的记录很少,我们会写信给
BigQuery
。这是一种经济有效的方法吗?https://cloud.google.com/solutions/performing-etl-from-relational-database-int
浏览 10
提问于2020-01-31
得票数 0
1
回答
BigQuery
上的增量
作业
缺少记录
、
、
我正面临一个奇怪的问题,一个小的增量任务,它是我在一个流
BigQuery
表上用Apache光束实现的。我正在将数据
流式
传输到
BigQuery
表中,并且每小时我都会运行一个
作业
,将该
流式
传输表中的任何新记录复制到一个协调表中。增量是建立在我在流表中介绍的CreateDatetime列之上的。因此,增量自然会获取到批
处理
运行的当前时间之前CreateDatetime比上次更新的所有记录。当我检查时间戳时,我发现它们远离批
处理
运行,当我检查Google Datflow日志时,
浏览 0
提问于2017-10-09
得票数 0
1
回答
BigQuery
支持还是高效地与同一个表并行写入?
、
我的工作流程将运行多个
作业
,所有这些
作业
都将尝试将数据
插入
到同一个表中,可能是同时进行的。集中精力只写部分(
而
不是
阅读部分)。
浏览 3
提问于2021-01-07
得票数 0
1
回答
当数据从谷歌数据存储流向
BigQuery
时,多次更新一行
、
、
、
我们正在尝试将数据存储实体更新作为流输入推送到
BigQuery
,以提供实时数据分析。 数据存储中的每个实体将在一天内多次更新。当我们推送实体时,我需要确保
bigquery
记录中只有最新的数据。
浏览 3
提问于2018-07-23
得票数 2
点击加载更多
相关
资讯
使用Kafka,如何成功迁移SQL数据库中超过20亿条记录?
从Lambda到无Lambda,领英吸取到的教训
BigQuery如何结合数据与AI实现企业转型
新老手都值得看的Flink关键技术解析与优化实战
什么是流式计算 另一个世界系列
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券