首页
学习
活动
专区
圈层
工具
发布

Flink DataStream API

Function Function是Flink中我们所有自定义操作的接口(包括Flink自己实现的一些操作),该接口没有任何方法,只是用来声明实现该接口的类可以用做算子的处理逻辑。...DataStreamSource source = env.fromElements(WORDS); // 步骤3 source.flatMap(new Tokenizer()).keyBy...从上面的使用可以看出,Flink DataStream AP整个的核心就是代表流数据的DataStream对象,我们整个逻辑运算都是围绕DataStream对象进行操作然后产生新的DataStream...对象,对于DataStream 单条记录我们可以进行filter、map等操作,或者基于window对多条记录进行操作,同时我们也可以将单条流(DataStream)进行拆分,也可以对多条流进行合并,如下图...: 在Flink中,最基础的流是DataStream,但是经过上面的操作以后可能会产生各种各样的流类型,目前Flink中的流的转换关系图如下: 在上面各式各样的流中,每个流都有自己独特的特点及操作,

35620
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【flink番外篇】1、flink的23种常用算子介绍及详细示例(2)- keyby、reduce和Aggregations

    2、Flink基础系列本部分介绍Flink 的基础部分,比如术语、架构、编程模型、编程指南、基本的datastream api用法、四大基石等内容。...import org.apache.flink.api.java.tuple.Tuple2;import org.apache.flink.streaming.api.datastream.DataStreamSource...;import org.apache.flink.streaming.api.datastream.KeyedStream;import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator...;import org.apache.flink.streaming.api.datastream.KeyedStream;import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator...;import org.apache.flink.streaming.api.datastream.DataStream;import org.apache.flink.streaming.api.datastream.DataStreamSource

    89210

    Flink算子使用方法及实例演示:union和connect

    :map、filter、flatMap Flink基于Key的分组转换:keyBy、reduce和aggregations 签名.png 很多情况下,我们需要对多个数据流进行整合处理,Flink为我们提供了多流转换算子...按照Key进行分组,数据是随机分配在各个TaskSlot上的,而绝大多数情况我们是要对某个Key进行分析和处理,Flink允许我们将connect和keyBy或broadcast结合起来使用。...import org.apache.flink.streaming.api.TimeCharacteristic import org.apache.flink.streaming.api.functions.co.RichCoFlatMapFunction...import org.apache.flink.streaming.api.functions.source.RichSourceFunction import org.apache.flink.streaming.api.functions.source.SourceFunction.SourceContext...import org.apache.flink.streaming.api.scala._ import org.apache.flink.util.Collector import scala.util.Random

    7.1K110

    flink之DataStream算子1

    1、按键分区(keyBy) 对于Flink而言,DataStream是没有直接进行聚合的API的。因为我们对海量数据做聚合肯定要进行分区并行处理,这样才能提高效率。...所以在Flink中,要做聚合,需要先进行分区;这个操作就是通过keyBy来完成的。...KeyedStream也继承自DataStream,所以基于它的操作也都归属于DataStream API。...Flink为我们内置实现了一些最基本、最简单的聚合API,主要有以下几种: · sum():在输入流上,对指定的字段做叠加求和的操作。 · min():在输入流上,对指定的字段求最小值。...所以可以这样理解:keyBy和聚合是成对出现的,先分区、后聚合,得到的依然是一个DataStream。而且经过简单聚合之后的数据流,元素的数据类型保持不变。

    38100
    领券