Flink1.17前几天刚刚发布。我们简单聊一下几个主要的更新:
Batch部分这次有三个比较重要的FLIP:
第二和第三点是当前对大家开发影响最大的,Flink Batch的能力现在已经比较完善和稳定,很多离线导数的批任务很多大厂已经从原来的类似DataX这样的工具切换到Flink Batch SQL。例如下面的2个场景:
以上2个场景在一些大厂已经开始做强制要求。
至于Streaming Warehouse API,离开发者还暂时较远,可以等功能再继续完善,并且周边的批流一体生态更加完善后在考虑接触。
而且,今天Flink Table Store宣布项目独立运作,并且用Apache Paimon的名字进入到了Apache孵化器,这个后面我们在关注,大家不用着急去跟风。
这部分涉及到的主要改动如下:
这部分没有什么好说的,Flink Streaming的能力现在大家有目共睹,针对高流量,高RPS环境下的如Checkpoint和StateBackend的增强和优化一直是各大公司投入的重点。
可以预见到的是,实时计算和真正实现批流一体的场景(之前的各大公司分享的所谓批流一体就是个噱头)在2023年还会继续大踏步向前,这个对开发者提出了不小的要求,赶紧把已经比较完善的功能掌握掉,数据开发领域是这几年各开发领域中发展最快,成果最多的领域之一。
大家加加油,不要被时代抛弃了。