腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(80)
视频
沙龙
1
回答
PyFlink性能与Scala的比较
、
、
、
如何将PyFlink性能与
Flink
+ Scala进行比较?因此,Apache是纯
流
的,而不是Spark的微
批
,我倾向于选择Apache。但我唯一关心的是PyFlink的性能。PySpark
流
的延迟会更少吗?它比Scala编写的
Flink
代码慢吗?在什么情况下更慢? 提前谢谢
浏览 3
提问于2021-11-05
得票数 1
回答已采纳
1
回答
当
流
不重要时
、
最近,我一直在比较火花和
Flink
的一个全新的项目。在这个项目中,
流
功能不是那么重要。对~(90) is数据进行批量分析是最重要的。稍后,我将在数据分析中应用ML和数据挖掘。在搜索时,我发现很多文章,演示和视频声称
Flink
是下一代的分析解决方案。没有多少文章能为火花辩护。另一方面,星火是(或曾经?)非常流行,并广泛部署在非常大的生产系统。我的问题是:对于我的用例来说,
流
并不重要,我是拥抱
Flink
还是从Spark2开始?更新,2018年4月,:我们最终选择
浏览 5
提问于2017-05-19
得票数 3
回答已采纳
1
回答
风暴式间歇加工
、
、
我对风暴的用例是
流
处理和批处理。用例2:风暴拓扑应该将元组作为一
批
元组进行处理。 我使用Kafka作为队列机制来提供Storm拓扑。是否Storm不是这样做的正确框架,因为它是用于
流
处理的(用例1)。风暴三叉戟对用例#2有帮助吗?
浏览 3
提问于2015-09-22
得票数 0
1
回答
如何保留apache
flink
任务并在重启jobmanager时提交记录
我正在使用apache
flink
1.10
批
量计算我的
流
数据,今天我将我的apache
flink
kubernetes(v1.15.2) pod从机器1移动到机器2,发现所有提交任务记录和任务列表都消失了重启apache
flink
的kubernetes pod时,如何保存提交记录和任务列表?我只发现checkpoint persistant,但没有关于任务的。
浏览 4
提问于2020-04-30
得票数 0
1
回答
Flink
卡夫卡
流
相对于星火卡夫卡
流
的好处?卡夫卡流过弗林克?
、
、
、
、
在火花
流
中,我们设置了几乎实时的微批处理的批处理间隔。在
Flink
(DataStream)或Storm中,
流
是实时的,所以我想没有这样的批处理间隔的概念。在卡夫卡,消费者在拉,我想象星火使用
批
参数从卡夫卡经纪人提取消息,那么
Flink
和Storm是如何做到的呢?我设想
Flink
和Storm在一个快速循环中拉出Kafka消息形成实时
流
源,如果是这样的话,如果我将火花批处理间隔设置为100 as、50 as甚至更小,那么我们是否与
Flink
或Storm之
浏览 5
提问于2016-10-24
得票数 7
回答已采纳
1
回答
Apache
Flink
存储
在处理了这数百万的事件/数据之后,哪里是保存信息的最佳地方?我看到一个关闭的提到了Parquet格式,但是,默认的是HDFS吗?我关心的是储蓄后(哪里?)如果它是容易的(快!)才能检索到数据?
浏览 3
提问于2015-08-11
得票数 5
1
回答
如何在Hadoop中可视化日志文件?
、
、
、
在四处搜索之后,我可以想出一些解决方案:2/
流
数据处理:
流
Spark或Apache
Flink
我是不是遗漏了什么?Spark和
Flink
我应该使用哪一个?我有一个机器集群,我已经安装了Ambari,HDP 2.4.2,HDFS 2.7,YARN 2.7,Spark 1.6,Kafka。如果可能的话,你们能给我看一些构建这样一个应用程序的
教程
吗?有什么书或课程吗?P&
浏览 0
提问于2016-07-07
得票数 0
1
回答
使用Apache
Flink
进行数据
流
、
我正在构建一个要求低于要求的应用程序,我刚刚开始使用
flink
。您认为
flink
最适合我的用例吗?还是应该使用Storm、Spark
流
或任何其他
流
平台?我是否需要在google数据
流
中编写数据管道来执行
flink
上的步骤序列,还是有其他方法来执行实时
流
的步骤序列?假设我的每一次计算花费大约20毫秒,我如何更好地使用
flink
来设计它并获得更好的吞吐量。 我可以使用Redis或Cassandra为每次计算在
flink
中获取一些数据吗
浏览 2
提问于2016-06-10
得票数 3
2
回答
我怎么知道我已经吃掉了所有的卡夫卡话题?
、
我使用的是
Flink
v1.4.0。我使用如下代码所示的Kafka
FLink
Consumer来使用Kafka主题中的数据:properties.setProperty
浏览 6
提问于2018-01-25
得票数 3
回答已采纳
1
回答
流在Hadoop中的应用
、
、
、
、
在这个例子中,我确实看到他们创建了一个单独的应用程序(类似于
流
应用程序),该应用程序生成和消费数据,并在数据上应用模式匹配。他们现在还没有在.Till(如卡夫卡)之间放置一个
流
层,单应用程序就足以满足这一目的,这使得它非常优化。我有几个问题我没有得到回答: 如果像卡夫卡/动态
浏览 2
提问于2016-06-13
得票数 0
1
回答
流
处理和批处理
、
、
、
、
由于批处理的延迟是在累积特定数目的数据时产生的,我是否可以将“一的大小”的批处理视为
流
处理?或者当运算符进行计算时还有其他的区别吗?例如,如果我将基于火花的程序的批处理大小设置为1,是否可以使其延迟降低到
flink
?我的一种想法是:对于
流
处理,如果处理了前一个操作符,一个数据
流
就会从前一个操作符流到后一个操作符,但是对于批处理过程,只有在操作符处理完一个数据之后,它才能接受另一个数据。
流
处理中的流水线似乎是加速的关键。 我的解释正确吗?如果错了,对我的问题有什么适当的解释。
浏览 9
提问于2022-11-14
得票数 0
1
回答
Flink
流
,“sum”到底是做什么的?
、
、
我很难理解
流
,以工作计数为例,对于卡夫卡这样的无限源,“和”到底是做什么的?Types.LONG)) .sum(1); 我的意思是,用keyBy(0).
浏览 1
提问于2019-03-06
得票数 0
回答已采纳
1
回答
Apache中的DataStream和KeyedStream有什么区别?
、
、
我在使用
Flink
连接两个
流
的上下文中查看,并希望了解这两个
流
之间的区别以及影响
Flink
处理它们的方式。
浏览 2
提问于2021-02-17
得票数 1
回答已采纳
1
回答
Flink
:支持多个执行环境吗?
、
、
、
在
Flink
程序中创建多个ExecutionEnvironments可以吗?更具体地说,在相同的主方法中创建一个ExecutionEnvironment和一个StreamExecutionEnvironment,这样就可以处理批处理,然后再传输到
流
,而不会出现问题?
Flink
为这种情况做好准备了吗?所有这些看起来都很好,但当join在一个公共索引上运行两个
流
并使用window(TumblingProcessingTimeWindows.of(Time.seconds(1)))时,我的输出出现了问题因为它完成的非常快,这两个
浏览 6
提问于2019-10-10
得票数 1
回答已采纳
1
回答
StreamTableEnvironment能够针对批处理
流
运行吗?
然而,可以使用
流
执行模式在那里处理有界
流
,但效率较低。这是否意味着StreamTableEnvironment可以处理批处理
流
,但效率较低,因为不能将StreamTableEnvironment配置为在批处理模式下运行?
浏览 8
提问于2021-07-29
得票数 0
回答已采纳
1
回答
以字符串值表示的Apache
Flink
表查询结果
、
、
我正在从
flink
表api编写一个查询来检索一条记录。然后检查是否找到一条记录,如果找到,则获取该记录的每个列值的字符串值。name | phone || 01| sam | 23354 || 03| kim | 23351 | Visitor.id = foundRecord.id throw exception按照
flink</e
浏览 4
提问于2020-05-30
得票数 0
回答已采纳
1
回答
Flink
:实现DataStream和“规则集”之间的“连接”
、
我们需要将
流
与一组“规则”相匹配,这些“规则”本质上是一个
Flink
DataSet概念。对此“规则集”的更新是可能的,但并不频繁。每个
流
事件必须对照“规则集”中的所有记录进行检查,而且每次匹配都会将一个或多个事件生成到接收器数据
流
中。规则集中的记录数在6位范围内。为了加快迭代速度,我们还可以将列表分成几个
批
,实质上是创建一个列表列表,并创建一个单独的线程来迭代每个子列表(使用Java或Scala中的Futures或Scala)。如果不是,在
Flink
已经在做的基础上,在每个flatMa
浏览 1
提问于2018-06-04
得票数 0
回答已采纳
2
回答
在
Flink
中按顺序读取两个
流
(主流和信任
流
)
、
我有两个
流
,一个是主流,比如说在欺诈检测的例子中,我有事务
流
,然后我有第二个
流
,这是信任,在我们的例子中它是规则。因此,我将主流连接到配置
流
,以便进行处理。但是,当
flink
第一次启动时,当我们添加作业时,它开始从事务中消费,并并行地信任
流
;当需要进程事务时,它有时会看到没有配置,我们不得不将事务发送到死信队列。长话短说,是否有办法告诉
flink
,当第一次作业开始尝试消耗一个
流
,直到没有新的值,然后开始处理主流流?我怎么能把它们按顺序排列呢?
浏览 13
提问于2022-04-14
得票数 1
2
回答
Flink
Scala缺失导入
、
、
在我的
Flink
项目中,我找不到连接器的某些库(具体来说,我需要吃一次CSV,在批处理或
流
模式下读取几个块数据的TBs )。>
flink
-connector-filesystem_${scala.binary.version}</artifactId>我是否需要一个与Java不同的Scala导入路径?我希望
Fli
浏览 26
提问于2022-11-14
得票数 0
1
回答
用于无状态处理的
Flink
、
、
、
我是
flink
的新手,我们的用例处理无状态计算。读取事件、处理事件并保存到数据库中。但是
Flink
文档从来没有提到过无状态处理。任何示例存储库,用于查找无状态示例或文档。最后,对于这个用例,哪个
Flink
模型有效?
流
应用程序或事件驱动应用程序。
浏览 21
提问于2020-12-09
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Flink on Hive构建流批一体数仓
Flink1.11+Hive批流一体数仓
基于Flink+Hive构建流批一体准实时数仓
深度解读:Flink 1.11 SQL流批一体的增强与完善
Flink基础教程(一):流处理技术的演变
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
腾讯会议
活动推荐
运营活动
广告
关闭
领券