腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
用
Python
测试
Beam
管道()?
、
、
我已经理解了我们应该
如何
使用
Google
DataFlow
(基于
Apache
)
Python
来测试管道。上面的链接仅适用于Java。我很困惑为什么Google会指向Java测试。我希望能够在两个p
集合
上查看CoGroupByKey
连接
的
结果。我来自
Python
背景,我很少或根本没有
使用
Beam
/
Dataflow
的
经验。 可能真的需要任何帮助。我知
浏览 2
提问于2017-11-21
得票数 7
1
回答
Apache
的
BigQuery
授权视图
、
、
、
我试图
使用
Apache
在
BigQuery
中查询一个视图。 at org.
apache
.<
浏览 2
提问于2020-08-12
得票数 2
回答已采纳
1
回答
Apache
Beam
|
Python
|
Dataflow
-
如何
使用
不同
的
键
连接
BigQuery
的
集合
?
、
、
我正在尝试
使用
内部
连接
和两个来自谷歌
Python
的
BigQuery
(
Python
)表,用于特定
的
情况。然而,我还没有找到一种本地
的
方法来轻松地处理它。这个查询输出我将在谷歌
BigQuery
上填充第三个表,对于这种情况,我真的需要在谷歌数据流上查询它。第一个表(客户)
键
是"id“列,第二个表(购买)
键
是"client_id”列。1 | 1 | 15
浏览 20
提问于2021-09-18
得票数 0
回答已采纳
1
回答
数据流管道上
的
Apache
梁StatusRuntimeException
、
、
、
、
我正在
使用
apache
_
beam
==2.24.0编写一个用
python
2.7编写
的
数据流管道。该管道
的
工作是
使用
beam
的
ReadFromPubSub批量
使用
订阅中
的
pubsub消息,对消息进行一些处理,然后将结果数据持久化到两个
不同
的
bigquery
表中。有很多我正在消费
的
数据。在运行管道之后,一切正常,但几个小时后,我开始得
浏览 1
提问于2021-03-31
得票数 0
1
回答
使用
Apache
光束/数据流从
BigQuery
读取数据时
使用
fastavro
、
、
我
的
项目运行
的
是
Python
2.7(是的,我知道...)Google
Dataflow
上
的
Apache
Beam
2.19。我们
连接
到
BigQuery
的
方式与
Apache
光束教程中指定
的
方式相同: p | 'Get data from
BigQuery
' >>
beam
.io.Read(
beam
.
浏览 0
提问于2020-03-19
得票数 0
2
回答
使用
Python
处理
Apache
光束管道中
的
异常
、
、
、
我用
python
(在GCP
Dataflow
上)做了一个简单
的
管道,用来读PubSub和写大查询,但不能处理管道上
的
异常来创建替代流。在一个简单
的
WriteToBigQuery示例中: output = json_output | 'Write to
BigQuery
' >>
beam
.io.WriteToBigQuery('some-project_flush_batch() File "/usr
浏览 14
提问于2019-01-30
得票数 5
回答已采纳
1
回答
从
BigQuery
函数中写入ParDo
、
、
我想从一个
beam
.io.Write(
beam
.io.BigQuerySink(..))函数中调用一个ParDo操作,为PCollection中
的
每个
键
生成一个单独
的
BigQuery
表(我正在
使用
python
下面是两个类似的线程,不幸
的
是它们没有帮助:2) 当我执行以下代码时,第一个
键
的
行被插入到
BigQuery
中,然后管道失败,出现下面的错误。非常感谢你对我做错了什么
浏览 3
提问于2016-09-24
得票数 4
回答已采纳
1
回答
如何
使用
PipelineOptions告诉数据流"use_unsupported_
python
_version“?
、
、
我正在尝试
使用
Google
Dataflow
将数据从一个
BigQuery
表传输到另一个表: import
apache
_
beam
as
beam
from
apache
_
beam
.options.pipeline_options import PipelineOptions import
浏览 25
提问于2021-11-14
得票数 1
回答已采纳
3
回答
显示RuntimeException
的
Apache
Beam
-
Bigquery
流插入: ManagedChannel分配站点
、
、
我在Google
Dataflow
中运行了一个
Apache
beam
流水线。它从Kafka中读取数据并将其流式插入到
Bigquery
。$DoFnInvoker.invokeFinishBundle (Unknown Source) at org.
apache
.
beam
.runners.
dataflow
.worker.repackaged.org.
apache
.
beam
.runners.core.SimpleDoFnRunner.fin
浏览 7
提问于2021-06-01
得票数 5
1
回答
Dataflow
sql、
Beam
SQL (Zeta sql或方解石SQL)之间有什么区别?
、
、
、
在浏览时,我看到了
Dataflow
SQL。它和beamSQL有什么
不同
吗?
浏览 12
提问于2020-02-17
得票数 1
回答已采纳
1
回答
从大查询读取
Apache
波束管道中
的
浮点转换为字符串
、
、
如何
在从Big Query读取
apache
beam
管道中将from类型转换为字符串?我正在编写一段代码,以便从GCP中
的
一个名为
的
列中读取
BigQuery
表,然后从
BigQuery
表中查找字符串中
的
正则表达式。然而,我似乎在我
的
管道中遇到了一个TypeERROR。/Frameworks/
Python
.framework/Versions/3.7/lib/<
浏览 0
提问于2021-02-02
得票数 1
2
回答
如何
在数据流中从google中读取csv文件,并结合,对数据流中
的
数据进行转换,然后将其转储到
bigquery
中?
、
、
、
我必须在
python
中编写一个
Dataflow
作业,它将从GCS读取两个
不同
的
.csv文件,执行一个
连接
操作,对
连接
数据
的
结果执行转换,然后最后将其发送到
BigQuery
表?我对此非常陌生,我知道在经过大量
的
研发之后,我们可以从
apache
.
beam
完成所有的流水线操作,我终于找到了一个模板,但在给定
的
点上仍然有很多
的
混乱。import logging impor
浏览 1
提问于2020-06-21
得票数 4
2
回答
我可以在多个
键
(
连接
条件)上
连接
数据流(
Apache
Beam
)中
的
两个表吗?
、
、
、
我想在多个
键
(
连接
条件)上
使用
Cloud
Dataflow
(
Apache
光束)
连接
这两个表,即ID和Name都是公共列。我
如何
做到这一点呢?我尝试
使用
一个
键
(一个公共列)
连接
它,但我不知道
如何
使用
多个
键
def add_key_details(self, row, key
浏览 0
提问于2019-07-22
得票数 0
1
回答
如何
在Mongodb中
使用
Where条件到
bigquery
数据流模板?
、
、
、
我已经
使用
apache
beam
(
Dataflow
Runner)编写了mongodb到
bigquery
数据管道
的
python
代码。Mongodb有两列(id和name)
的
类似mysql
的
简单表,没有复杂
的
structure.My代码,如下所示。######################################### import
apache
_
beam
浏览 11
提问于2021-01-15
得票数 1
回答已采纳
1
回答
结合
BigQuery
和Pub/Sub
Apache
梁
、
、
我试图
使用
DataFlowRunner执行以下操作: 我对
Apache
非常陌生,所以我不能百分之百地确定我想要做
的
事情是可能
的
。当我尝试
连接
两行时,我
的<
浏览 0
提问于2018-09-05
得票数 3
1
回答
数据流:从Pubsub RuntimeException导出到
Bigquery
、
、
、
我正在
使用
pubsub中
的
“”特性,通过数据流将一个常规
的
JSON传递给
bigquery
。 但是,它工作了一秒钟,这意味着一些条目可以正确地传递到
bigquery
。”、“原因”:“无效”},“索引”:0}] org.
apache
.
beam
.sdk.io.gcp.
bigquery
.StreamingWriteFn.flushRows(StreamingWriteFn.javaorg.
apache
.
beam
.sdk.io
浏览 1
提问于2018-03-27
得票数 1
回答已采纳
2
回答
NameError:未定义名称“存储”
的
python
3.8
、
、
、
、
我正在尝试设置一个数据流作业,用于将json文件转换为csv,并
使用
下面的
python
脚本将其写入桶中。(我在3.8.13中尝试了这一点),因为我
使用
的
是
apache
。我尝试过改变许多版本
的
python
和google云存储。在不
使用
存储库
的
情况下,有什么替代方法吗?' >>
beam
.Create([None]) File "/home/myprject/
浏览 6
提问于2022-07-06
得票数 0
回答已采纳
1
回答
触发云存储-数据流
、
、
、
、
我现在开始工作,我需要一些帮助,我有一个自定义模型,我
使用
apache
beam
创建了一个管道,该管道从存储桶内
的
文件夹中获取来自csv文件
的
数据,然后将数据抛到
bigquery
表中,这个表已经按照我
的
要求工作模板数据流import os from
apache
_
beam
.options.pipeline_options im
浏览 7
提问于2022-04-28
得票数 1
1
回答
启动
Dataflow
Flex模板时镜像引用不正确
、
我们正在
使用
Dataflow
Flex模板,并遵循本指南(https://cloud.google.com/
dataflow
/docs/guides/templates/using-flex-templates这在我们
的
环境中是有效
的
。但是,当我通过SSH
连接
到数据流VM并运行docker ps时,我发现它引用
的
docker镜像与我们在模板中指定
的
镜像(绿色下划线)
不同</e
浏览 17
提问于2020-07-22
得票数 2
回答已采纳
1
回答
从同一个云函数执行多个批处理数据流作业
、
、
、
、
我已经创建了一个自定义模板,它
使用
BigQuery
I/O
连接
器从ReadFromBigQuery读取。我就是这样用
的
:from
apache
_
beam
.options.pipeline_options import PipelineOptions如果我只发布一条关于该主题
的
消息,管道就会完成,不会出现任何错误。但是,如果我从同一个云函数执行中启动多个
浏览 1
提问于2021-08-13
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
谷歌推出Bigtable联邦查询,实现零ETL数据分析
使用Java部署训练好的Keras深度学习模型
过去一年,Spotify最大一次数据流优化实践
大数据平台架构方法论、模型与实践深度观察
Java近期新闻:JDK 21 序列集合、JDK 20 向量API、Gen ZGC、Hilla 2.0
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券