腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(2190)
视频
沙龙
1
回答
在
数据流
工作流
时间
戳
上
执行
BigQuery
to
Postgre
失败
、
、
、
我能得到关于
时间
转换格式的帮助吗?Causes: S01:QueryTableStdSQL+Writing to DB/ParDo(_WriteToRelationalDBFn) failed.,
BigQuery
executionxxxxxxxx` \source_config = relational_db.SourceConfiguration(
bigquery
浏览 14
提问于2020-12-05
得票数 0
2
回答
PubSub水印不前进
、
、
,
bigquery
.CREATE_NEVER) 我使用事件
时间
戳
作为我的
时间
戳
属性,它是PubsubMessage中属性键ts的值。这与我
在
.timestampBy中使用的
时间
戳
完全相同,在对我的数据进行窗口化之前。我期望的是,一旦水印超过sessionGap (默认30分钟),输出触发器就会触发。使用
数据流
运行器和DirectRunner,触发器永远不会触发,即使我模拟
时间
戳
间隔超过30分钟的数
浏览 3
提问于2018-06-05
得票数 2
2
回答
增量地将数据从GCP数据存储转移到
BigQuery
的最佳实践
、
我们希望
在
预定义的
时间
间隔内将新插入/更新/删除的数据存储实体加载到
BigQuery
中进行分析。
在
执行
操作时发布所有新的/更新/删除的实体,并使
数据流
订阅和TL到
BigQuery
。
在<
浏览 0
提问于2018-07-30
得票数 0
1
回答
BigQueryIO.write()使用SQL函数
、
、
、
、
我有一个
数据流
的工作。我正在使用BigqueryIO.write库
在
BigQuery
表中插入行。BQ表中有一列,它应该存储行创建
时间
戳
。我不能使用java的任何库(比如Instant.now())来获取当前的
时间
戳
。因为这将在作业
执行
期间派生该值。我正在使用一个
BigQuery
加载作业,它的触发频率是10分钟。因此,如果我使用任何java库来派生
时间
戳
,那么它将不会返回预期的输出。 我
在</
浏览 21
提问于2021-08-10
得票数 0
1
回答
DataFlow管道:项目配额不足
、
我正在按照这个来创建一个
数据流
管道https://codelabs.developers.google.com/codelabs/modern-data-pipeline-firestore-
bigquery
-dataflow-templates/index.html#9,但是我的
数据流
由于我的配额而
失败
。我收到此错误消息:“
工作流
失败
。原因: Project XXXX配额不足,无法
在
区域us-Causes 1中使用1个
浏览 21
提问于2020-09-28
得票数 1
1
回答
bgiquery - zeppelin
时间
戳
未呈现为日期
、
我正在使用
Bigquery
解释器
在
zeppelin
上
运行
Bigquery
查询,查询是
在
一个表
上
运行的,该表的字段类型为
时间
戳
。行为: 1.
在
google控制台上
执行
查询时,
时间
戳
字段被视为日期,这是有效的默认行为,因为它是可读的。对于任何SQL数据库也是如此。2.当使用
bigquery
解释器
在
zeppelin
上
执行</e
浏览 1
提问于2017-12-14
得票数 0
1
回答
用Dataflow API
执行
Dataprep模板包含流配方中包含的
时间
戳
。
、
、
、
该菜谱基本上清理了一些JSON对象,将它们转换为CSV格式,并添加了一个
时间
戳
列来获取
BigQuery
数据库中的所有内容。其主要思想是对我们平台的某些信息进行快照。我成功地从dataflow API运行了作业,数据正确地插入到
bigquery
表中,但是
在
时间
戳
字段中,
时间
戳
的值总是相同的,它对应于我从其中获取模板的作业的
执行
时间
(DataPrep模板)。当我从dataprep接口运行作业时,这个<e
浏览 1
提问于2018-06-05
得票数 2
1
回答
从
数据流
插入到
BigQuery
之前验证行
、
根据,在从
数据流
将数据加载到
BigQuery
时,目前无法设置maxBadRecords配置。建议
在
将
数据流
作业中的行插入
BigQuery
之前验证它们。这些对象包含了许多在
BigQuery
中不需要的信息,还包含一些甚至不可能在模式中描述的部分(基本
上
是自由的JSON有效负载)。像
时间
戳
这样的东西也需要格式化,以便与
BigQuery
一起工作。我或多或少只是循环处理一个属性名称列表,从源对象中提取值,查看一个配置,看看是否
浏览 3
提问于2016-02-03
得票数 10
回答已采纳
1
回答
如何作为流从
BigQuery
读取
、
、
我正在为Java2.0.1-快照使用Java + Apache 还是可以设置 BatchLoads ,以便不时插入大量数据?
浏览 5
提问于2017-07-20
得票数 1
3
回答
解析时,
BigQuery
不识别时区。
、
、
、
、
摘自 然后,通过ApacheBeam Python作业,将该条目写入
BigQuery
并生成以下错误: There w
浏览 0
提问于2021-09-15
得票数 2
回答已采纳
1
回答
基于
时间
戳
的
数据流
有界数据过滤
、
在
我的
数据流
管道中,我将从PCollections<TableRow>表中读取两个
BigQuery
。我计划将这两个PCollections合并成一个带有的PCollection。因为
BigQuery
仅仅是附加的,所以目标是用一个新的PCollection
在
BigQuery
中编写第二个表。 我已经阅读了文档,这是我困惑的中间步骤。使用我的新PCollection,计划使用Comparator DoFn查看最大的
上
一次更新日期并返回给定的行。--我不确定是否应该
浏览 9
提问于2016-06-11
得票数 0
回答已采纳
1
回答
当多个PubSub主题使用DataFlow从多个主题流到
BigQuery
时,消息卡在GBP中?
、
、
、
、
在
发送几十条测试消息之后,我让它运行了几个小时,但是没有任何东西写入
BigQuery
。我发现了以下三种工作(每一种工作与其他工作不同) 这些消息不是故意加盖
时间
戳
的--只使用
BigQuery
时间
戳</e
浏览 0
提问于2018-08-23
得票数 1
回答已采纳
1
回答
调试复杂NiFi
数据流
的理想方法
、
、
据我所知,
在
使用NiFi构建了一些DB摄取PoCs之后,整个
数据流
作为流文件运行。并且在任何特定
时间
,
执行
控制可以同时
在
一个或多个处理器
上
。因此,我真的很困惑如何调试一个复杂的
数据流
,以防止任何故障。当我们使用生产用例时,它可能会变得比这复杂得多。所以我有几个问题要问。 如何了解
数据流
的状态。假设10个分叉的流文件中有4个因为数据库池错误而在GenerateTableFetch
上</e
浏览 80
提问于2018-09-13
得票数 2
3
回答
如何从oracle数据库中提取数据并保存到Google云平台
、
需要从oracle数据库中提取数据并存储
在
Google云平台中。数据大小约为10 TB。有没有可能通过Spark?数据必须每月传输一次。
在
GCP中存储和处理的数据如下: Oracle数据库到云存储(不必做CSV导出),然后它将是干净的,并准备
在
Dataprep中,这将通过
数据流
进一步处理,最后它将被存储
在
Big Query下(从大查询数据科学家将使用数据来创建他们的模型我正在考虑从spark中提取数据(通过将DataProc用于spark作业),并将其存储
在
GCP (任何一个云存储或大表
浏览 2
提问于2019-11-17
得票数 0
1
回答
在
GCP
数据流
作业中使用或REPLACE模型
、
因此,我试图
在
BigQuery
表
上
使用GCP模型,并且需要定期更新该模型,并针对新的数据集运行它。我使用Dataflow对数据进行预处理,并想知道是否也可以使用它来创建模型。当我尝试使用在
BigQuery
中测试的Create时,会弹出以下错误: 我是做错了什么,还是模型创建不支持Dataflow?
浏览 12
提问于2022-01-12
得票数 1
回答已采纳
1
回答
气流DAG -如何首先检查BQ (必要时删除),然后运行
数据流
作业?
、
、
、
、
在
我的DAG中,我有两个任务: 如果文件ID已经出现在
bigq
浏览 0
提问于2019-01-09
得票数 3
回答已采纳
2
回答
BigQuery
中不同文件格式加载的比较
、
我们目前通过csv或直接通过流式API将大部分数据加载到
BigQuery
中。然而,我想知道是否有可用的基准(或者Google工程师可以
在
答案中告诉我)加载不同格式的效率如何比较。例如,如果我们有相同的100行数据,
BigQuery
是否显示与加载它有任何性能差异: 我相信其中一个答案将是“为什么你不测试它”,但我们希望,
在
架构转换器或重写我们的应用程序之前,工程师可以与我们分享(如果有的话)上述格式中,什么将是最具表现力的数据从一个平面文件加载到烧烤。注意:上述所
浏览 1
提问于2018-03-14
得票数 1
回答已采纳
2
回答
我能否实时地将数据从CloudSQL加载到
BigQuery
?
、
、
、
这些数据呈指数增长,我需要一种高效的方法来
执行
查询。数据库以~3GB/天的速度增长,我希望将数据保存至少3个月。因此,我把我的CloudSQL连接到
BigQuery
..。下面是我
在
BigQuery
上
运行的一个查询示例,但我对此表示怀疑。不确定查询是
在
Postgres还是
BigQuery
中
执行
的。date_trunc('day', created_at) d, variable1, AVG(variable2) FROM
浏览 1
提问于2020-06-03
得票数 1
回答已采纳
1
回答
DataFlow工作者
BigQuery
权限错误
、
我一直试图
在
我的项目中
执行
Dataflow管道(Python),其中我的GCP帐户分配了"Owner“角色。
BigQuery
执行</
浏览 1
提问于2021-08-20
得票数 0
1
回答
数据流
作业
失败
,“无法培养足够的工人”,配额没有问题,更改机器类型和区域不会改变任何事情。
、
、
我们开发了一个基于Google平台的应用程序,它使用Cloud将数据写入
BigQuery
。我现在试图
在
另一个组织的新GCP项目
上
设置这个应用程序。我正在体验这个 作业是从创建
浏览 0
提问于2019-08-12
得票数 1
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券