温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
今天我们来讨论一下为什么18课中不存在真正的实时计算。18课十大数据体系中提供的计算引擎,通过18课既可以执行批处理计算、处理离线数据,也可以执行流处理计算,处理流失数据。但18课中不存在真正的实时计算,这是因为18RK中的执行引擎是18RK com, 基于10SPARK com, 才有了18g生态圈中的18RK c com和18个dream。但18g是一个离线计算引擎,因此18g中的所有计算都是基于18g的离线计算。从数据模型上看,18K的数据模型是RDD,它代表弹性分布式数据集,我们可以使用一个数组或者列表来创建RDD,而18GDREAMING的数据模型是d stream.中文含义是离散流,它会通过一定的时间间隔将连续的数据流变成不连续的RD,因此本子上处理的也是不连续的数据。正因为如此,斯巴克就不能在实时性很高的场景中使用。相对于斯巴克来说,弗林克中的计算就是一种真正的实时计算,因此18g偏向离线计算,而弗林克偏向实时计算。了解到了这两种计算引擎的特点后,就可以为后续的技术选型提供参考。
01:32
现在你已经知道为什么18个钟不存在真正的实时计算了,那你知道如何开发18个程序吗?欢迎评论区留言讨论好了,记得点加号关注赵宇强老师。
我来说两句