腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(410)
视频
沙龙
1
回答
如
何在
Apache
beam
中
读取
带有
起始
日期
的
pubsub
消息
、
、
、
我有一个简单
的
工作,从
pubsub
读取
历史数据与
日期
限制例如,我想
读取
消息
从
日期
2020-04-10到2020-04-20,然后将
消息
保存在google存储桶
中
的
单个文件
中
的
每一天
浏览 4
提问于2020-06-10
得票数 0
2
回答
如何使用BigQuery处理数据流管道
中
的
插入错误?
、
、
、
、
我正在尝试用Dataflow创建一个流管道,它从
PubSub
主题中
读取
消息
,最终将它们写入BigQuery表
中
。我不想使用任何数据流模板。目前,我只想在从Google实例执行
的
Python3脚本
中
创建一个管道,以执行来自
Pubsub
的
每条
消息
的
加载和转换过程(解析其中包含
的
记录并添加一个新字段),最终将结果写入BigQuery表。import
pubsub
_v1, import
浏览 0
提问于2019-11-14
得票数 3
回答已采纳
1
回答
当
消息
到达
PubSub
时,有没有一种方法可以用数据流删除SQS
中
的
消息
?
、
、
、
、
我有以下基础设施: Dataflow用于将
消息
从AWS SQS发送到Google Cloud
的
Pub/Sub。
消息
是用java和
Apache
Beam
(SqsIO)
读取
的
。有没有一种方法可以在AWS SQS
中
的
消息
到达/在
PubSub
中被
读取
时删除它们,这是什么样子
的
?这可以在java中用
Apache
Beam</e
浏览 25
提问于2020-09-22
得票数 1
2
回答
如何从
PubSub
主题中
读取
数据并将其解析到束流管道
中
并打印出来
、
、
、
、
我有一个在
pubSub
中
创建主题并将
消息
发布到该主题
的
程序。我还有一个自动
的
数据流作业(使用模板),它将这些
消息
保存到我
的
BigQuery表
中
。现在我打算用python管道替换基于模板
的
作业,我
的
需求是从
PubSub
读取
数据,应用转换,并将数据保存到BigQuery/发布到另一个
PubSub
主题。代码如下所示: import
apache</em
浏览 3
提问于2019-09-16
得票数 0
1
回答
耗尽从
PubSub
读取
并写入
的
数据流作业时
的
数据丢失
、
、
当将固定数目的字符串(用于测试
的
80万1KB )放入
PubSub
主题并在Dataflow
中
运行以下
Apache
(2.1.0)作业时,完全按照预期保持一次语义。import org.
apache
.
beam
.sdk.Pipeline;import org.
apache
.
beam
.sdk.io.gcp.
pubsub
.Pubsu
浏览 0
提问于2017-11-17
得票数 0
回答已采纳
2
回答
如何标记数据流
中
的
已读文件?
、
、
、
、
我正在使用数据流从GCS存储桶
中
读取
文件,并对其进行一些转换。为此,我使用了
beam
.io.ReadFromText()方法。标记已经
读取
的
文件
的
最佳方式是什么,以便相同
的
文件不会被数据流重复
读取
?
浏览 5
提问于2020-07-02
得票数 1
1
回答
如何实现零停机升级和低延迟流GCP DataFlow?
、
、
我已经设置了一个用Python编写
的
自定义DataFlow作业,它只从一个桶复制一个图像(由一个
pubsub
消息
触发),然后发送一个HTTP。']) valid_imagesBucket' >>
apache
_<em
浏览 7
提问于2022-04-15
得票数 0
2
回答
Apache
:无法从GCP
PubSub
读取
消息
。错误是AttributeError:“SubscriberGrpcTransport”对象没有属性“通道”
、
、
我正在开发一个POC,它是方法评估所必需
的
。我
的
Mac
中
安装了python、venv、
apache
beam
和gcloud。我还登录了gcloud傀儡。下面的代码创建订阅我
的
PubSub
并
读取
来自
Pubsub
的
消息
。步骤:但是没有
浏览 5
提问于2021-02-08
得票数 2
1
回答
PubSub
流作业在本地运行程序
中
不工作
、
、
、
;import org.
apache
.
beam
.sdk.options.Default;import org.
apache
.
beam
.sdk.options.PipelineOptions; importorg.
apache</e
浏览 12
提问于2022-02-03
得票数 0
1
回答
PubSub
到BigQuery -数据流/波束模板在Python
中
?
、
、
、
、
是否有任何Python模板/脚本(现有的或路线图)供数据流/光束从
PubSub
读取
和写入BigQuery?根据GCP文档,这里只有一个Java模板..。 谢谢!
浏览 88
提问于2021-02-21
得票数 1
回答已采纳
1
回答
束流管道(PY)输出不写入本地主机磁盘
、
、
我正在学习
Apache
中
的
窗口&触发概念,目的是: 尝试了两种方法:DirectRunner,和DataFlowRun
浏览 0
提问于2019-01-02
得票数 2
1
回答
未启动Mi GCP数据流步骤
、
、
、
我有一个简单
的
GCP数据流,它从
pubsub
读取
,然后打印一个日志,指示到达
的
消息
。import loggingimport
apache
_
beam
as
beam
(
浏览 1
提问于2022-09-27
得票数 0
1
回答
从多个pubusb
读取
数据到同一个bigquery
、
、
这个问题与理解
apache
beam
中
连接gcp管道
的
语法有关。) | 'read pubusb' >>
apache
_
beam
.io.ReadFromPubSub=
apache
_
beam
.io.BigQueryDisposition.CREATE_IF_NEEDED,
浏览 1
提问于2020-03-27
得票数 0
回答已采纳
1
回答
Apache
束流管道和毒丸
、
、
、
、
我正在使用管道将
消息
从
PubSub
写到BigQuery。在管道
中
,当将
PubSub
消息
转换为TableRow时,我使用
的
是FailsafeElement<PubsubMessage, String>,并且在BigQuery
中
也有死信表,这样我就可以在转换后
的
消息
中
写入失败
的
消息
但是,从我所读到
的
关于Poison Pills
的
文章来看,
浏览 8
提问于2022-09-15
得票数 0
1
回答
PubsubIO在使用DataflowRunner和数据流服务运行时不将自定义时间戳属性输出为context.timestamp
、
、
我正在处理一个
Apache
项目,该项目涉及Dataflow服务和与自定义时间戳属性相关
的
PubsubIO问题。目前版本
的
Beam
是2.7.0。第二个管道(从
PubSub
读取
数据) 在第二个管道(
读取
管道)
中
,我们已经尝试了PubsubIO.readMessagesWithAttributes().withTimestampAttribute
消息
从
PubSub
订阅
中
读取
并输出到
浏览 0
提问于2018-10-08
得票数 0
1
回答
是否可以使用数据流将重复
的
pubsub
消息
删除回
pubsub
?
、
、
、
我有一个将数据写入Google Cloud
pubsub
的
应用程序,根据
pubsub
的
文档,由于重试机制而导致
的
重复是偶尔会发生
的
事情。还有失序
消息
的
问题,这在
pubsub
中
也没有保证。我想让这些
消息
在
消息
队列(即云
pubsub
)
中
可用,以供服务使用,并且云数据流似乎确实有一个pubsubio编写器,然而,您不会回到写入
pubsub</e
浏览 46
提问于2019-03-12
得票数 2
3
回答
如
何在
Python3.x上获取数据流GCP
的
apache
波束
、
、
、
、
我是GCP和数据流
的
新手。但是,我想开始测试和部署一些利用GCP上数据流
的
流。根据文档和有关数据流
的
所有内容,必须使用
Apache
项目梁。不过,我想知道是否有人知道如
何在
python版本
中
运行
beam
和GCP数据流。 我看到了这个,以及这个牧师是如何完成这个奇妙
的
里程碑
的
,显然它运行在Python3.5上。在python
中
,有一些关于版本3
的
约束,这几乎是当前
的
标准。另一方面,ja
浏览 0
提问于2019-01-24
得票数 7
回答已采纳
2
回答
用TableRowJsonCoder将
PubSub
消息
转换成TableRow
、
、
、
、
我使用Dataflow 1.9 (JAVA )
读取
Pubsub
消息
和无缝流到BigQuery
中
,而不显式地设置TableRow
中
的
每个列。下面是转换
的
代码片段。当我试图在
Apache
中
模拟同样
的
情况时,我无法为一个TableRowJsonCoder
消息
设置
PubSub
,因为
Beam
的
PubSubIO缺少方法withCoder()。在
Bea
浏览 3
提问于2017-08-08
得票数 2
2
回答
如何使用
Apache
Beam
从Google Pub/Sub访问
消息
id?
、
、
我一直在Python 2.7.16上使用2.13.0 SDK测试
Apache
Beam
,以流模式从Google Pub/Sub订阅中提取简单
消息
,并写入Google Big Query表。作为此操作
的
一部分,我正在尝试使用发布/订阅
消息
id进行重复数据删除,但是我似乎根本无法获取它。和建议应该将生成
的
服务KV(
如
id_label )作为attributes属性
的
一部分返回,但是它们似乎没有返回。 请注意,只有在使用数据流运行器时才支
浏览 2
提问于2019-07-24
得票数 2
1
回答
通过代码从
Apache
应用程序验证Google
、
、
、
我试图在
中
运行一个
Apache
应用程序,它使用
Apache
作为运行时。管道使用连接器。我正在尝试,因为Kinesis不允许导出环境变量,导出环境变量似乎不是一种选择。: 403禁止POST {”代码“:403,”错误“:{”域“:”全局“,”
消息
“:”请求缺少有效
的
API键“、”原因“:”禁止“}、”
消息
“:”请求缺少有效
的
API键“
中
的
异常。:339) at org.
apache
.
beam
.ru
浏览 4
提问于2021-08-13
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
替代 Kafka?Pinterest 推出高效可扩展云原生系统 MemQ
Java近期新闻: JReleaser 1.2、Spring Batch、PrimeFaces、Quarkus、JobRunr与Apache Beam
JavaWeb项目架构之Kafka分布式日志队列
想成为大数据开发工程师,你必须掌握的开发流程图是这样的
9012年了,我不允许你还不会玩IPFS!
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券