spark.cassandra.connection.host", "127.0.0.1")
val conf = new SparkConf().setMaster("local[2]").setAppName("kafkaspark").set("spark.streaming.concurrentJobs
我们有一个在YARN集群上运行的Spark Streaming application。实际上,我们的处理时间超过了批处理间隔。Processing Time : 5 Minutes我们使用Direct Streaming approach从Kafka主题中获取数据。
我应该使用Window based操作吗?例如,如果我有Window length as 5 M