1.一種基于Spark平臺的Spark Streaming異常溫度數(shù)據(jù)報警方法,其特征在于:利用kafka作為消息隊列服務(wù)器,不斷地接受物聯(lián)網(wǎng)傳感器傳遞來的數(shù)據(jù)流,SparkStreaming把接收的數(shù)據(jù)流分成數(shù)據(jù)塊存放在Spark Streaming的數(shù)據(jù)塊隊列中,并且在一定的批處理時間間隔對數(shù)據(jù)塊隊列中的數(shù)據(jù)進行批處理,Spark通過任務(wù)調(diào)度器對批處理的數(shù)據(jù)塊進行計算,篩選出異常溫度數(shù)據(jù),并把計算結(jié)果存入數(shù)據(jù)庫中;
其處理數(shù)據(jù)具體流程如下:
步驟1:初始化——創(chuàng)建一個StreamingContext對象,該對象中的參數(shù)包括:SparkContext和批處理時間兩個,對批處理時間這個參數(shù)進行設(shè)置,具體包括:
1)StreamingContext中的批處理時間設(shè)置為8s;
2)如果提交的數(shù)據(jù)流未被快速處理,數(shù)據(jù)滯留,減少批處理時間;
3)如果提交的數(shù)據(jù)流很快被處理,當(dāng)前又沒有數(shù)據(jù)流進入,處理時間過快,增加批處理時間;
4)重復(fù)步驟2)和步驟3)操作,直到數(shù)據(jù)流進入Spark中,Spark剛好處理結(jié)束上一個作業(yè),從而找出合理的批處理時間;
步驟2:加載溫度數(shù)據(jù);
創(chuàng)建createStream,Receiver被調(diào)起執(zhí)行;
連接ZooKeeper,讀取相應(yīng)的Consumer、Topic配置信息,通過consumerConnector連接到kafka集群,收取kafka隊列中相應(yīng)topic的數(shù)據(jù);
創(chuàng)建KafkaMessageHandler線程池來對溫度數(shù)據(jù)進行處理,通過ReceiverInputDStream中的方法,將數(shù)據(jù)轉(zhuǎn)換成BlockRDD,供后續(xù)計算;
步驟3:異常溫度數(shù)據(jù)檢測:
Spark Streaming把從kafka隊列中的topic數(shù)據(jù)的每行字符串解析出的溫度數(shù)據(jù),轉(zhuǎn)換為Double型,分而治之,將同一個topic中的溫度放入一個組中,設(shè)定一個溫度閾值,統(tǒng)計每組出現(xiàn)的大于和小于溫度閾值的異常溫度數(shù)據(jù)的次數(shù),如果出現(xiàn)異常數(shù)據(jù),就向外發(fā)出異常警報;
步驟4:數(shù)據(jù)存儲:
使用創(chuàng)建的SparkContext對象中的saveAstextFile()函數(shù)將獲取的異常溫度數(shù)據(jù)和次數(shù)存入到Orancle數(shù)據(jù)庫中,以方便web端的查詢和訪問。
2.根據(jù)權(quán)利要求1所述的基于Spark平臺的Spark Streaming異常溫度數(shù)據(jù)報警方法,其特征在于,所述溫度閾值設(shè)置為25~40攝氏度。