腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Apache
Flink
-
检查点
数据
大小
在一段时间内不断增加
、
、
我在我的
Flink
应用程序(版本1.11.1)中使用了事件时间语义,该应用程序在AWS - kinesis分析中运行。此应用程序的源为kinesis stream,宿为Postgres。
检查点
间隔
为10秒,因为在notifyCheckpointComplete()上触发了DB接收器。我使用多个CoProcessFunction
和
ValueState来连接不同的流,然后再将其发送到Postgres。 观察到,
检查点
数据
大小
在一段时间内不断增长,而线程计数
和
堆内存利用率保持
浏览 20
提问于2021-03-02
得票数 0
1
回答
Flink
增量CheckPointing压缩
、
、
、
、
我们有一个永远运行的
flink
作业,从kafka读取,创建滑动时间窗口(流
间隔
:1小时,2小时到24小时)
和
(幻灯片
间隔
:1分钟,10分钟到1小时)。基本上是its : KafkaSource.keyBy(keyId).SlidingWindow(stream,幻灯片).reduce.sink 我最近启用了rocksDB后端
和
incremental=true以及hdfs持久存储的
检查点
。从最后的4/5天开始,我正在监控工作及其运行情况,但我担心的是
检查点
的<e
浏览 6
提问于2022-11-07
得票数 0
1
回答
Flink
检查点
间隔
和
状态
大小
、
我们正在运行一些
flink
作业,所有这些作业都有一个kafka源
和
多个cassandra接收器。我们在很大程度上依赖于具有reduce功能的时间窗口
和
键控数据。我们的tps目前在100-200左右。我有几个关于
检查点
和
保存的
状态
大小
的问题: 1.由于我们使用的是reduce函数,
状态
大小
是否只受打开的窗口数量的影响?如果每小时窗口
和
分钟窗口都有相同的累加器,我们是否应该期望类似的
状态
大小</
浏览 46
提问于2019-05-03
得票数 1
1
回答
Flink
,
检查点
的基本规则?
、
我有两个关于
Flink
检查点
策略的问题, 非常感谢。
浏览 2
提问于2019-03-07
得票数 1
回答已采纳
1
回答
链接映射
状态
大小
和
键数
我想知道是否有一种方法可以检索存储在
状态
后端的总
状态
大小
。 我目前使用的是
flink
1.3,高于emr
和
rocksdb后端,带有异步
检查点
和
增量
检查点
。" checkpoints“下的
flink
仪表板显示
状态
大小
,但我假设由于我使用的是增量
检查点
,所以我在checkpoint history页面中看到
状态
大小
的波动。我目前使用的唯一方
浏览 2
提问于2017-08-18
得票数 4
1
回答
Apache
Flink
-增量
检查点
- CPs的意外
大小
在处理过程中添加了一些托管
状态
之后,我们发现尽管在RocksDb中使用了增量
检查点
,但
检查点
的
大小
和
持续时间却出现了令人担忧的增长。 为了隔离这个问题,我们用源、映射操作符
和
接收器创建了简单的拓扑。使用上面描述的设置,我们发送了1200个事件,
检查点
间隔
和
最小暂停设置为5秒。当事件以恒定的速度
和
相同的
状态
出现时,我们预计
检查点
的
大小
或多或少是恒定的。然而,我们观察
浏览 0
提问于2018-10-31
得票数 1
回答已采纳
1
回答
动态数据分析
Flink
:不断增加
检查点
大小
、
、
我正在使用AWS (KDA)服务运行
Flink
应用程序。我的KDA
Flink
应用程序上一个
检查点
的
大小
似乎随着时间的推移而稳步增长。当我将更改推送到应用程序时,您可以在附加的图形中看到
检查点
大小
的突然下降,导致它获取快照、更新,然后从快照恢复。我担心的是,一旦应用程序不再被积极开发,更改就不会像以前那样定期部署,
检查点
的
大小
最终可能会增长到太大。 有人知道是什么导致
检查点
的
大小
不断增长吗?我正在对所有重要
状
浏览 1
提问于2020-09-21
得票数 4
1
回答
使用FsStateBackend存储的
Flink
太昂贵
、
目前,我使用FsStateBackend作为
检查点
状态
。我使用的是区间10,如下面的代码。但是我看到使用
检查点
的传输桶的成本大约是20美元/天,而aws传输s3的价格是:$0.005/1000请求=> (我使用的是~4000000请求/天@@)。我有7份工作,其中: 并在AWS EMR上运行
flink
。每个<em
浏览 4
提问于2020-10-27
得票数 0
回答已采纳
1
回答
如何控制
Flink
检查点
的
大小
、
、
、
、
我正在运行一个简单的
Flink
聚合作业,它从Kafka消耗,并应用多个窗口(1小时、2小时hr...upto )
和
特定的滑动
间隔
,并在窗口上进行聚合。为了克服这一问题,我们启用了
检查点
,并且我看到
检查点
的
大小
正在增加( HashMapStateBackend具有Hdfs存储)。对于一个永久运行的
Flink
作业来说,什么是最好的检查方法?我们能控制
检查点
的
大小
吗?几天后它会很大吗? 尝试启用带有Hdfs存储的HashMapStateBa
浏览 10
提问于2022-11-03
得票数 0
2
回答
Apache
Flink
:将DataStream写入Postgres表
、
rows.writeUsingOutputFormat(jdbcOutput);119 env.execute();121 }我现在的问题是,只有当我的作业停止时(准确地说,是当我从apache
flink
浏览 52
提问于2017-07-19
得票数 2
回答已采纳
2
回答
如何将HDFS设置为
flink
的
状态
后端
、
、
、
我希望将
flink
store存储在HDFS中,以便在崩溃后可以从HDFS恢复
flink
状态
。我计划每隔60秒将
状态
写入HDFS。我如何才能做到这一点?这是我需要遵循的配置吗?https://ci.apache.org/projects/
flink
/
flink
-docs-release-1.4/ops/state/state_backends.html#setting-default-state-backen
浏览 129
提问于2021-11-01
得票数 0
回答已采纳
1
回答
作为持久存储的
Flink
、
Flink
文档表明Ceph可以用作
状态
的持久存储。 考虑到Ceph是一个事务性数据库,它不会对
Flink
的性能产生不利影响吗?
浏览 6
提问于2017-12-05
得票数 3
回答已采纳
1
回答
如何为
Flink
广播
状态
检查点
启用压缩
我使用的是
Flink
1.14.4,对于广播
状态
有一个很大的
检查点
。说: 是我错过了什么,还是这是有意的限制,还是代码中的遗漏?
浏览 6
提问于2022-11-16
得票数 0
1
回答
如果我已经将自动提交设置为true,那么行为是什么?
我在读书启用
检查点
:如果启用了
检查点
,则
Flink
消费者将在
检查点
完成时提交存储在
检查点
状态
中的偏移量。这确保了Kafka代理中提交的偏移量与
检查点
状态
中的偏移量一致。如果我在10秒
间隔
内启用
检查点
,也可以将have setCommitOffsetsOnCheckpoints设置为true,并在Kafka使用者属性中设置enable.auto.commit=true
和
一次从
fl
浏览 0
提问于2021-06-25
得票数 0
回答已采纳
1
回答
Flink
中保存点与
检查点
的差异
我认为checkpoint仅在
Flink
中用于运行应用程序时的容错,即应用程序本身正在运行,但是任务或其他事情可能会失败,也就是说,
Flink
将使用checkpoint进行
状态
恢复?
浏览 3
提问于2019-02-04
得票数 2
2
回答
创建
检查点
/保存点失败后,
Flink
任务管理器停止工作(100% cpu使用率)
、
、
--通过将
状态
后端从文件系统更改为rocksdb解决了问题-- 在AWS EMR上运行
Flink
1.9。
Flink
app使用kinesis流作为输入数据,使用另一个kinesis流作为输出。最近,
检查点
大小
已增长到1 to (由于数据更多)。有时,在尝试获取
检查点
期间,应用程序开始利用整个处理器资源(一天发生几次) 指标: LA (emr ec2 core node with job/task managers) Run Loop Time{"level"
浏览 238
提问于2020-08-28
得票数 2
回答已采纳
2
回答
Apache
Flink
:当我重新启动应用程序时,它不能从
检查点
恢复
、
我有一个
Flink
作业,其中我正在读取文件夹中的文件,并将其转储到数据库中。每天都会有新文件进入该文件夹。我已经启用了
检查点
,以便如果由于任何原因
Flink
作业停止并且我需要重新启动,
Flink
作业不应该读取已经读取的文件。我在代码中添加了以下代码行,但当我重新启动作业时,
Flink
作业再次读取所有文件。
浏览 44
提问于2019-01-23
得票数 5
1
回答
flink
检查点
时间与缓冲区对齐
大小
或对齐时间有何关系?
、
、
我的流式
flink
作业的
检查点
时间平均为2-3s(15-20%的时间)
和
3-4分钟(8-12%的时间)
和
2分钟。我们有两个操作符,它们是有
状态
的。这两种方法使保存点的
状态
约为1-1.5 3gb,
检查点
的
状态
约为800MB-6 3gb(平均为3 3gb)。我们有30秒的翻滚处理窗口。
检查点
持续时间
和
两个
检查点
之间的最小停顿时间为3分钟。对于
flink
来说,有足够的cpu
和</
浏览 1
提问于2020-03-12
得票数 0
1
回答
flink
检查点
如何帮助故障恢复
、
我的
flink
作业使用FlinkKafkaConsumer010从kafka consumer读取数据,并使用CustomBucketingSink接收到hdfs。
检查点
持续时间
和
两个
检查点
之间的最小停顿是3分钟,我使用的是FsStateBackend。以下是我的假设:
Flink
从kafka消耗一些固定数量的事件(一次从多个分区获得多个偏移量),并等待,直到它到达接收器,然后是
检查点
。在失败的情况下,
flink
转到以前的
检查点
状态
,
浏览 0
提问于2020-03-12
得票数 0
2
回答
对
检查点
做出反应的
Flink
StatefulFunction?
我的有
状态
函数是将数据写入数据库,但它是不确定的,因此从
检查点
恢复可能会导致数据库包含不一致的数据。我的想法是在
Flink
的持久化
状态
下“缓冲”数据,只有在
检查点
完成后才将数据写入数据库。我想我可以通过使用context.sendAfter(Duration duration, Address address, Object input);来实现这一点,通过设置高于
检查点
间隔
的持续时间。有没有更好的解决方案可以让函数显式地对
检查点
做出反应?
浏览 61
提问于2020-08-24
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Flink 如何实现 exactly-once 语义?
Flink概念:编程模型下
Flink 的容错机制是什么?
Flink 的基本概念是什么?
Pinterest是如何基于Flink做实时分析的?
热门
标签
更多标签
云服务器
ICP备案
即时通信 IM
云直播
实时音视频
活动推荐
运营活动
广告
关闭
领券