腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
处理
流经
发布
订阅
到
Bigquery
的
记录
的
unique_id
和
时间
戳
特性
python-3.6
、
google-cloud-pubsub
我正在尝试构建一个流/批
处理
管道,它从
发布
/
订阅
中读取事件,并使用python3.6将它们写入
BigQuery
根据文档,云
发布
/
订阅
会为每条消息分配唯一
的
message_id
和
timestamp,用于检测
订阅
者收到
的
重复消息(https://cloud.google.com/pubsub/docs/faq) 要求如下: 1)消息可以以任
浏览 13
提问于2019-10-16
得票数 0
2
回答
增量地将数据从GCP数据存储转移到
BigQuery
的
最佳实践
google-bigquery
、
google-cloud-datastore
我们正在从Datastore数据源构建我们
的
数据仓库解决方案。我们希望在预定义
的
时间
间隔内将新插入/更新/删除
的
数据存储实体加载到
BigQuery
中进行分析。似乎有几种选择: 进行完整
的
备份,并将数据加载到
BigQuery
中。并在
BigQuery
中报道。这在概念上非常简单,但是每次加载/
处理
所有数据对我来说都是非常低效
的
。在执行操作时
发布
所有新
的
&
浏览 0
提问于2018-07-30
得票数 0
1
回答
使用主题模式
的
PubSub &
BigQuery
订阅
google-bigquery
、
google-cloud-pubsub
随着2022年7月新
的
直接PubSub
到
BigQuery
的
发布
,我们现在可以创建直接从PubSub获得数据
的
BigQuery
订阅
。 文档似乎没有指定,所以忽略这一点。使用Avro逻辑字段时,创建
订
浏览 5
提问于2022-08-02
得票数 3
回答已采纳
3
回答
如何检测Pubsub
到
Bigquery
订阅
的
延迟?
google-cloud-platform
、
google-bigquery
、
google-cloud-dataflow
、
publish-subscribe
、
google-cloud-pubsub
当使用pub/sub对
bigquery
订阅
(而不是通过数据流)时,如何计算
发布
子
发布
时间
和
到达
bigquery
之间
的
延迟?我希望只检查
时间
戳
的
差异,但注意
到
current_timestam
浏览 9
提问于2022-11-24
得票数 0
回答已采纳
1
回答
通过仅下载更改来更新集合
meteor
在我们
的
应用程序中,我们使用了一些非常大
的
集合(>25万个文档)。应用程序必须脱机使用,因此需要将整个集合存储在客户端上。 网络一出现,两个包
和
就会同步整个集合。本着节省带宽和为用户提供良好性能
的
精神,我正在寻找一种方法,以避免每次应用程序连接到服务器时都下载整个集合。
浏览 0
提问于2014-05-02
得票数 0
1
回答
Google中
的
时间
戳
倾斜
google-cloud-dataflow
我正在尝试运行一个管道,该管道从公共主题中读取并写入
bigquery
。从主题消息中解析
时间
戳
。但是,我收到了一个关于允许
时间
戳
倾斜
的
错误,引用了下面的文档。getAllowedTimestampSkew公共
时间
戳
getAllowedTimestampSkew()返回允许
的
时间
戳
偏移持续
时间
,这是
时间
戳
可以在DoFn.Context.outputW
浏览 1
提问于2016-01-26
得票数 3
2
回答
确定
订阅
在事务性复制中何时变得不活跃。
sql-server
、
sql-server-2012
、
replication
、
transactional-replication
当我试图在一些出版物上发送一个跟踪令牌以获得延迟时,我会得到以下错误-也有与这些
发布
相关联
的
订阅
。我可以通过重新初始化\重建复制来修复这个问题,但是我想知道是否有一种方法可以判断
订阅
何时停止接收到任何信息?我想确定这已经有多长
时间
没起作用了。正在复制
的
表上没有
时间
戳
,因此我无法在此基础上计算出来。我检查了复制监视器,在分
浏览 0
提问于2017-11-08
得票数 -1
0
回答
如何在
BigQuery
插入错误时崩溃/停止DataFlow
发布
/
订阅
摄取
google-bigquery
、
google-cloud-dataflow
、
google-cloud-pubsub
如果从PubSub接收
的
事件/行中
的
字段不是目标
BigQuery
表中
的
列,则DataFlow作业会在运行时
记录
IOExceptions,声明它无法插入行,但似乎会确认这些消息并继续运行。相反,我想要做
的
是停止接收来自
发布
/
订阅
的
消息
和
/或使数据流作业崩溃,以便警报可以基于最早
的
未确认消息
的
时间
。至少,我希望确保那些无法插入
到<
浏览 5
提问于2017-06-10
得票数 5
回答已采纳
1
回答
VCP Google Cloud Platform
的
数据流
发布
/
订阅
主题
到
BigQuery
,而不是从
订阅
中提取数据
google-cloud-platform
、
google-bigquery
、
google-cloud-dataflow
、
google-cloud-pubsub
、
private-cloud
我正在使用GCP
处理
和
存储从模拟IoT设备发送
的
数据。数据(应该)在以下路径中流动: 带有mqtt客户端
的
模拟IoT设备-> IoT核心设备-> IoT核心注册表->
发布
/
订阅
主题->
发布
/
订阅
订阅
->云数据流
发布
/
订阅
订阅
BigQuery
模板->
BigQuery
表 我所在<em
浏览 21
提问于2021-10-01
得票数 0
回答已采纳
1
回答
适用于具有自动递增id
的
原始JSON事件
的
Google Cloud数据存储选项
google-bigquery
、
google-cloud-sql
、
bigtable
、
google-cloud-bigtable
、
google-cloud-logging
这些事件是由用户在响应非常大
的
电子邮件广播时生成
的
,因此在短
时间
内吞吐量可能非常低,最高可达每秒约25,000个事件。这些事件
的
JSON表示可能只有1kb左右 我想简单地将这些事件存储为原始
和
未
处理
的
JSON字符串,仅附加,并为插入
的
每个
记录
使用单独
的
连续数字标识符。我正在利用Google Cloud Logging聚合来自计算引擎节点
的
事件流,从这里我可以直接流到
BigQuery
浏览 2
提问于2016-03-29
得票数 0
2
回答
MQTT Broker - Mosquitto事件日志
mongodb
、
logging
、
mqtt
、
database
是否可以使用Ubuntu12.04上
的
MQTT Broker 来
记录
所有事件,例如
发布
到
所有通道
的
消息、
订阅
、客户端连接/断开连接
和
错误,并将其
记录
到带有
时间
戳
的
日志文件中,然后让程序将其插入
到
数据库Mongodb
浏览 3
提问于2014-01-26
得票数 3
2
回答
如何测量paho-mqtt网络
的
时延
python
、
c++
、
mqtt
、
latency
、
paho
我正在尝试测量MQTT网络中从我
的
发布
者到我
的
订阅
者
的
延迟。我本来希望使用on_message()函数来衡量这段旅程需要多长
时间
,但我不清楚这个回调是在代理收到消息之后还是在
订阅
者收到消息之后进行
的
? 还有其他人对如何测量整个网络
的
延迟有任何其他
的
建议吗?
浏览 1
提问于2018-07-16
得票数 2
2
回答
/Sub如何避免时钟倾斜
google-cloud-platform
、
publish-subscribe
、
google-cloud-pubsub
我正在研究从/sub订购消息列表
的
方法。说: 有一种方法从它目前已经收到
的
所有消息中确定是否有它尚未收到
的
消息需要首先
处理
。
订阅
者将临时将所有消息放入某个持久存储中并对消息进行包装。它将定期检查最古老
的
未加标记消息年龄,并检查存储中消息
的
发布
时间
戳
。在最老
的
未加标记消息之前
发布
的
所有消息都保证已经收到,因此可以从持久存储中删除这些消息,并按顺序进行<e
浏览 0
提问于2019-03-29
得票数 3
回答已采纳
2
回答
SQL复制按照什么顺序写入数据
sql-server
、
t-sql
、
replication
我使用数据库
的
单向复制。在数据库中,我有一个带有数据类型“
时间
戳
”(而不是日期
时间
)
的
列。那么,
订阅
服务器
的
表中
的
时间
戳
是否也可以像在
发布</
浏览 0
提问于2020-12-17
得票数 0
回答已采纳
1
回答
异步还是同步拉出以计数pub子pub/sub中
的
流数据?
publish-subscribe
、
google-cloud-pubsub
我想计数最后一小时
的
消息数量(最后一小时指消息数据中
的
一个
时间
戳
字段)。 我目前有一段代码可以同步计算消息(我正在使用Google /Sub同步拉),但我注意
到
这需要很长
时间
。我
的
代码将反复轮询预定义
的
订阅
次数(我将其设置为100+),因此我确信在最后一小时内不会有更多
的
消息出现故障。这是一个不可接受
的
设计,因为它意味着用户必须等待5-10分钟
的
服务,以计数消息时,他们想
浏览 1
提问于2019-10-01
得票数 1
1
回答
没有快照
的
事务复制
sql-server
、
transactional-replication
在UI中
的
订阅
选项中将“允许从备份文件初始化”更改为“true”。我选择“添加
订阅
服务器”并将其指向报表服务器。代理计划设置为“位置:分发服务器”
和
“计划:持续运行”。命令(S)已经交付‘ 现在看看今天早上
的
日志,我看到
浏览 0
提问于2014-02-06
得票数 1
1
回答
获取最新
的
时间
戳
值
sql
、
google-bigquery
我有一个管道,它从
BigQuery
表中读取数据,对数据执行一些
处理
,并将其保存到新
的
BigQuery
表中。这是通过cron每周执行
的
批
处理
过程。源表中不断添加条目,因此我希望每当我启动ETL进程时,它都只
处理
自上次启动ETL作业以来添加
的
新行。 为了实现这一点,我已经考虑对我
的
接收表进行查询,请求它包含
的
最新
时间
戳
。然后,作为数据源,我将对源表执行另一个查询,过滤并请求具有比我刚刚
浏览 27
提问于2021-07-06
得票数 0
回答已采纳
1
回答
我应该使用pub/sub吗
google-cloud-platform
我正在尝试编写一个使用GCP服务
的
摄取应用程序。每天可能有大约1TB
的
数据以流
的
方式到来(即每小时100 TB,甚至在特定
时间
一次)。我正在尝试设计一个摄取应用程序,我首先认为在cron作业中编写一个简单
的
Python脚本来顺序读取文件(甚至在两个三线程中),然后将它们作为消息
发布
到
pub/sub是一个好主意。此外,我需要有一个数据流作业运行,始终从
发布
/
订阅
读取数据,并将它们保存到
BigQuery</em
浏览 4
提问于2019-02-15
得票数 1
1
回答
MQTT Broker - Mosquitto消息日志
记录
logging
、
mqtt
、
mosquitto
是否可以将MQTT Broker Mosquitto事件(如
发布
到
所有通道
的
消息、
订阅
、客户端连接/断开
和
带有
时间
戳
的
日志文件中
的
错误)
记录
下来,然后让程序将其插入数据库(任何SQL都是加密形式
的
SQL我
订阅
了主题$SYS/ broker /#,它只能获得连接日志,我在这里
的
查询是如何获得从代理发送
和
接收到
的
浏览 0
提问于2019-08-02
得票数 2
1
回答
通过数据流SQL实现云
发布
/
订阅
到
BigQuery
google-bigquery
、
google-cloud-dataflow
、
gcloud
、
google-cloud-pubsub
我想了解数据流管道
的
工作原理。 在我
的
例子中,我有一些定期
发布
到
云
发布
/
订阅
的
内容,然后Dataflow将其写入
BigQuery
。通过
的
消息量数以千计,所以我
的
发布
者客户端有1000条消息
的
批
处理
设置,1mb
和
10秒
的
延迟。问题是,在批
处理
中
发布
时,Dataflow SQL是接收批<
浏览 35
提问于2021-11-23
得票数 0
回答已采纳
点击加载更多
相关
资讯
CDP中的Kafka概览
使用Kafka,如何成功迁移SQL数据库中超过20亿条记录?
从Lambda到无Lambda,领英吸取到的教训
Apache Kafka核心概念入门
聊聊reactive streams的processors
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券