Spark 学习笔记之 Streaming Window

2021-07-19 16:25

阅读：1251

标签：obj res gpo print mina rdd ons object log

Streaming Window:

技术分享图片

上图意思：每隔2秒统计前3秒的数据

slideDuration: 2

windowDuration: 3

例子:

import org.apache.kafka.common.serialization.StringDeserializer
import org.apache.spark.SparkConf
import org.apache.spark.streaming.dstream.DStream
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.streaming.kafka010.ConsumerStrategies.Subscribe
import org.apache.spark.streaming.kafka010.KafkaUtils
import org.apache.spark.streaming.kafka010.LocationStrategies.PreferConsistent

object WindowStreaming {

  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setAppName("KafkaDirect").setMaster("local[1]")
    val ssc = new StreamingContext(conf, Seconds(1))
    val kafkaMapParams = Map[String, Object](
      "bootstrap.servers" -> "192.168.1.151:9092,192.168.1.152:9092,192.168.1.153:9092",
      "key.deserializer" -> classOf[StringDeserializer],
      "value.deserializer" -> classOf[StringDeserializer],
      "group.id" -> "g1",
      "auto.offset.reset" -> "latest", //earliest|latest
      "enable.auto.commit" -> (false: java.lang.Boolean)
    )
    val topicsSet = Set("ScalaTopic")
    val kafkaStream = KafkaUtils.createDirectStream[String, String](
      ssc,
      PreferConsistent,
      Subscribe[String, String](topicsSet, kafkaMapParams)
    )

    val finalResultRDD: DStream[(Int, String)] = kafkaStream.flatMap(row => row.value().split(" "))
      .map((_, 1)).reduceByKeyAndWindow((x: Int, y: Int) => x + y, Seconds(3), Seconds(2))
      .transform(rdd => rdd.map(tuple => (tuple._2, tuple._1))
        .sortByKey(false).map(tuple => (tuple._1, tuple._2))
      )

    finalResultRDD.print()

    ssc.start()
    ssc.awaitTermination()
  }


}

运行结果：

技术分享图片

Spark 学习笔记之 Streaming Window

标签：obj res gpo print mina rdd ons object log

原文地址：http://www.cnblogs.com/AK47Sonic/p/8052451.html

上一篇：windows10版本1709 在桌面和文件中点击右键刷新，会引起卡顿

下一篇：UVa 11054 - Wine trading in Gergovia

文章来自：搜素材网的编程语言模块，转载请注明文章出处。
文章标题：Spark 学习笔记之 Streaming Window
文章链接：http://soscw.com/index.php/essay/106343.html

亲，登录后才可以留言！

Spark 学习笔记之 Streaming Window

评论

热门文章

推荐文章

最新文章

置顶文章