本發(fā)明涉及航道、水運領域,尤其涉及一種混合型航標報警智能檢測方法。
背景技術:
:基于物聯(lián)網(wǎng)、大數(shù)據(jù)分析的航標遙測遙控系統(tǒng),綜合運用無線數(shù)字通信gprs技術、北斗和gps定位技術、微處理器技術、嵌入式系統(tǒng)等現(xiàn)代信息處理技術,實現(xiàn)了航標燈工作情況的自動監(jiān)測與分析、高精度航標位移定位的自動監(jiān)測與分析、航標附屬設備工作情況的自動監(jiān)測與分析。在航標遙測遙控系統(tǒng)中,遠程終端單元(rtu)能夠?qū)崟r采集航標狀態(tài),并定時返回給控制中心。然而,由于能耗、傳輸成本等因素,遠程終端單元無法實現(xiàn)高頻率的實時數(shù)據(jù)傳輸,一般只針對低頻定時數(shù)據(jù)以及報警數(shù)據(jù)進行傳輸。由于遠程終端單元在傳輸上的限制,使得對航標的報警判斷均集中在rtu端實現(xiàn)。在傳統(tǒng)的rtu報警判斷中,主要以基于規(guī)則的判斷為主。僅在rtu端使用基于規(guī)則的方法進行報警存在較大問題。首先,一些航標的異常具有區(qū)域性,而在rtu端的計算,無法結(jié)合相鄰rtu的數(shù)據(jù)進行判斷。其次,一些航標的異常是一個逐漸變化的過程(如航標位置偏移),但基于規(guī)則的方法靈活性較差,在此類場景下報警效果較差。技術實現(xiàn)要素:由于航標上負責采集數(shù)據(jù)的傳感器采集的時間粒度較大,且針對航標報警的判斷主要是基于規(guī)則的判斷,以致于航標報警效率較低,本發(fā)明提供一種混合型航標報警智能檢測方法,以提高報警判斷的準確率。為達上述目的,本發(fā)明所采用的技術方案為:一種混合型航標報警智能檢測方法,其步驟包括:1)根據(jù)歷史定時數(shù)據(jù)和歷史報警數(shù)據(jù)發(fā)現(xiàn)相似站點,得到相似站點劃分及相似站點數(shù)據(jù);2)根據(jù)上述相似站點劃分及相似站點數(shù)據(jù)、歷史報警數(shù)據(jù)及該報警時刻向前一段時間的歷史定時數(shù)據(jù)進行報警模型訓練,生成二次報警的模型;3)將實時報警數(shù)據(jù)及該報警時刻向前一段時間的歷史定時數(shù)據(jù)輸入所述二次報警的模型,進行報警結(jié)果判斷;4)根據(jù)上述報警結(jié)果及人工反饋的報警結(jié)果,對步驟2)中所述報警模型進行修正。進一步地,步驟1)包括:1-1)將每個站點作為聚類的一個元素,選取每個站點的基本信息特征和歷史定時數(shù)據(jù)特征,并根據(jù)選取的特征,計算每個站點對應的各個特征的數(shù)值或數(shù)值組;1-2)將歷史報警數(shù)據(jù)按站點進行劃分,選取每個站點的歷史報警數(shù)據(jù)特征,并根據(jù)選取的特征,計算每個站點對應的歷史報警數(shù)據(jù)特征的數(shù)值;1-3)根據(jù)步驟1-1)及步驟1-2)計算得到的結(jié)果進行相似站點的發(fā)現(xiàn),并輸出相似站點劃分及相似站點數(shù)據(jù)。更進一步地,步驟1-1)中所述基本信息特征包括但不僅僅包括站點的經(jīng)度、緯度、歷史水位、歷史溫度;所述歷史定時數(shù)據(jù)特征包括但不僅僅包括<時間/時間范圍,偏移量>、<時間/時間范圍,燈質(zhì)>、<時間/時間范圍,電壓>。更進一步地,步驟1-2)中所述歷史報警數(shù)據(jù)特征包括但不僅僅包括<時間/時間范圍,報警總量>、<報警類型,報警次數(shù)>;步驟1-3)采用聚類方法進行相似站點的發(fā)現(xiàn),其中所述聚類方法是指k-means、knn、層次聚類。進一步的,步驟2)包括:2-1)對于每一條歷史報警數(shù)據(jù),提取歷史報警數(shù)據(jù)特征;2-2)以每一條歷史報警數(shù)據(jù)報警的時間作為基礎時間,從歷史定時數(shù)據(jù)中提取該報警時刻向前一段時間的歷史定時數(shù)據(jù)以及歷史定時數(shù)據(jù)特征;2-3)根據(jù)步驟2-1)提取的歷史報警數(shù)據(jù)特征、步驟2-2)提取的歷史定時數(shù)據(jù)特征、步驟1)獲取的相似站點劃分及相似站點數(shù)據(jù)、歷史處置情況給出報警正確、錯誤的標簽特征,并進行報警模型訓練,生成二次報警的模型。更進一步地,步驟2-3)中所述歷史處置是指歷史報警發(fā)生后,相關人員進行的具體處置,以及給出的該報警是否為正確報警的結(jié)論;所述報警模型訓練采用支持向量機(svm)或隨機森林傳統(tǒng)機器學習方法。進一步地,所述該報警時刻向前一段時間根據(jù)歷史報警數(shù)據(jù)或?qū)崟r報警數(shù)據(jù)上報頻率、實際場景確定。進一步地,步驟3)包括:3-1)提取實時報警數(shù)據(jù)特征;3-2)根據(jù)實時報警數(shù)據(jù)發(fā)生的時間,獲取該報警時刻向前一段時間的歷史定時數(shù)據(jù),并提取該歷史定時數(shù)據(jù)特征;3-3)將步驟3-1)提取的實時報警數(shù)據(jù)特征和步驟3-2)提取的歷史定時數(shù)據(jù)特征輸入步驟2)生成的二次報警的模型進行匯聚,得到二次報警結(jié)果。進一步地,步驟3-1)中所述實時報警數(shù)據(jù)特征包括但不僅僅包括<時間/時間范圍,報警總量>、<報警類型,報警次數(shù)>。進一步的,步驟4)包括:4-1)根據(jù)上述報警結(jié)果及人工反饋的報警結(jié)果,輸出報警結(jié)果反饋數(shù)據(jù);其中所述人工反饋的報警結(jié)果是指:在報警發(fā)生后,工作人員對報警的嚴重級別進行評估,并進行現(xiàn)場處置的結(jié)果;4-2)將上述報警結(jié)果反饋數(shù)據(jù)作為輸入,再次反饋到上述步驟2)中所述報警模型進行訓練,以修正報警模型。本發(fā)明的有益效果在于:本發(fā)明提供一種混合型航標報警智能檢測方法,該方法能夠在充分利用領域知識的前提下,結(jié)合數(shù)據(jù)挖掘方法和人工反饋,實現(xiàn)對航標異常進行報警。相較傳統(tǒng)僅基于規(guī)則或僅基于數(shù)據(jù)挖掘方法的報警系統(tǒng),本發(fā)明方法在準確性和結(jié)果的可解釋性上更具優(yōu)勢。附圖說明圖1為本發(fā)明提供的一種混合型航標報警智能檢測方法流程圖。圖2為本發(fā)明提供的一種混合型航標報警智能檢測方法的具體流程圖。具體實施方式為使本發(fā)明的上述特征和優(yōu)點能更明顯易懂,下文特舉實施例,并配合所附圖作詳細說明如下。本發(fā)明提供一種混合型航標報警智能檢測方法,請參考圖1和圖2,其步驟包括:1.根據(jù)歷史數(shù)據(jù)進行相似站點發(fā)現(xiàn);其具體包括以下步驟:1.1針對歷史定時數(shù)據(jù),將每個站點作為聚類的一個元素,選取每個站點的基本信息特征和歷史定時數(shù)據(jù)特征,并根據(jù)選取的特征,計算每個站點對應的各個特征的數(shù)值(或數(shù)值組)。其中所述基本信息特征包括站點的經(jīng)度、緯度、歷史水位、歷史溫度等信息。所述歷史定時數(shù)據(jù)特征包括<時間/時間范圍,偏移量>、<時間/時間范圍,燈質(zhì)>、<時間/時間范圍,電壓>等信息。在具體實施時,一方面,為保證歷史定時數(shù)據(jù)應用在相似站點發(fā)現(xiàn)的合理性,根據(jù)場景選取合適的特征;另一方面,為降低特征緯度,可以將特征進行聚合計算。如表1所示,該表為某一站點的歷史定時數(shù)據(jù)。所述歷史定時數(shù)據(jù)是指由傳感器采集后,定時傳送到服務器端的數(shù)據(jù)。表1:某一站點的歷史定時數(shù)據(jù)站點名時間偏移量燈質(zhì)電流電壓s12016-01-01-10-00-0010單閃3秒2403.8s12016-01-01-11-00-0015單閃3秒2603.7s12016-01-01-12-00-0016雙閃6秒2553.75………………針對站點s1的歷史定時數(shù)據(jù),其一種歷史定時數(shù)據(jù)特征計算的結(jié)果如表2所示。對于每一條歷史定時數(shù)據(jù),在實現(xiàn)時,作為向量的一個元素進行計算。表2:站點s1的某一歷史定時數(shù)據(jù)特征計算結(jié)果1.2針對歷史報警數(shù)據(jù),將報警信息首先按站點進行劃分,選取每個站點的歷史報警數(shù)據(jù)特征,并根據(jù)選取的特征,計算每個站點對應的歷史報警數(shù)據(jù)特征的數(shù)值。其中所述歷史報警數(shù)據(jù)特征包括<時間/時間范圍,報警總量>、<報警類型,報警次數(shù)>等信息。在具體實施時,為實現(xiàn)更便捷的聚類,時間/時間范圍的選取請參考1.1的選取。如表3所示,該表為某一站點的歷史報警數(shù)據(jù)。表3:某一站點的歷史報警數(shù)據(jù)站點名時間報警類型上報方式s12016-01-02-10-00-00燈質(zhì)異常gprss12016-02-02-11-00-00航標偏移gprss12016-02-20-23-00-00上報數(shù)據(jù)異常gprs…………針對站點s1的歷史報警數(shù)據(jù),其一種歷史報警數(shù)據(jù)特征計算的結(jié)果如表4所示。對于每一條歷史報警數(shù)據(jù),在實現(xiàn)時,作為向量的一個元素進行計算。表4:站點s1的某一歷史報警數(shù)據(jù)特征計算結(jié)果1.3在相關特征選取并計算完畢后,使用聚類方法進行相似站點的發(fā)現(xiàn)。在聚類方法的選取上,可以選擇k-means,、knn、層次聚類等不同的聚類方法,最終輸出相似站點的劃分,如表5所示。之后將發(fā)現(xiàn)的相似站點數(shù)據(jù)進行保存,并作為支持后續(xù)訓練報警模型的數(shù)據(jù)集。表5:相似站點的劃分輸入站點輸出相似站點s1,s2,s3,s4,s5,s6,s7,s8,s9,s10(s1,s3,s6),(s2,s7),(s4,s10),(s5,s8,s9)2.根據(jù)上述相似站點劃分及相似站點數(shù)據(jù)、歷史報警數(shù)據(jù)及該報警時刻向前一段時間的歷史定時數(shù)據(jù),訓練報警模型生成二次報警的模型;其中所述二次報警的模型針對的是第二次報警。對于第一次報警,是從航標根據(jù)傳統(tǒng)規(guī)則返回的報警數(shù)據(jù),也可以理解為是本發(fā)明方法的一個輸入。其具體包括以下步驟:2.1根據(jù)歷史報警數(shù)據(jù),對歷史報警數(shù)據(jù)特征進行提取。對于每一條歷史報警數(shù)據(jù),提取其歷史報警數(shù)據(jù)特征,所述歷史報警數(shù)據(jù)特征包括<時間/時間范圍,報警總量>、<報警類型,報警次數(shù)>等信息。2.2以每一條歷史報警數(shù)據(jù)報警的時間作為基礎時間,從歷史定時數(shù)據(jù)中提取該報警時刻向前一段時間(該時間可根據(jù)歷史報警數(shù)據(jù)上報頻率、實際場景等因素確定)的歷史定時數(shù)據(jù)以及歷史定時數(shù)據(jù)特征,所述歷史定時數(shù)據(jù)特征包括<時間/時間范圍,偏移量>、<時間/時間范圍,燈質(zhì)>、<時間/時間范圍,電壓>等信息。下面以報警類型為例,表示對報警類型的特征計算(python語言)。該代碼主要的功能是根據(jù)不同的報警類型進行初始的標簽標注。例如,首先對報警類型的文字進行歸類,整理為航標偏移報警分類、燈質(zhì)異常報警分類、黑夜不亮報警分類、電壓電流異常分類、定時上報異常分類、離線六類,然后將航標偏移報警分類、燈質(zhì)異常報警分類、黑夜不亮報警分類、電壓電流異常分類、定時上報異常分類、離線分別映射為1、2、3、4、5、6。2.3根據(jù)步驟2.1提取的歷史報警數(shù)據(jù)特征、步驟2.2提取的歷史定時數(shù)據(jù)特征、步驟1獲取的相似站點劃分及相似站點數(shù)據(jù)、歷史處置情況給出報警正確、錯誤的標簽特征,使用機器學習方法對歷史報警數(shù)據(jù)進行分類模型訓練。在該過程中,可以使用支持向量機、隨機森林等傳統(tǒng)機器學習方法進行模型訓練。其中所述歷史處置是指歷史報警發(fā)生后,相關人員進行的具體處置,給出的該報警是否為正確報警的結(jié)論。2.4通過報警模型訓練后生成二次報警的模型,將該二次報警的模型的結(jié)果進行保存,并作為支持后續(xù)二次報警判斷的模型。3.針對rtu的實時報警數(shù)據(jù),在控制中心進行再次報警判斷。在傳統(tǒng)航標報警系統(tǒng)中,一般都嵌入了實時報警模塊。在rtu根據(jù)規(guī)則判斷,產(chǎn)生報警后,實時報警模塊將實時報警數(shù)據(jù)發(fā)送到控制中心。在此時,步驟2訓練的二次報警模型,從實時報警數(shù)據(jù)中提取實時報警數(shù)據(jù)特征,并根據(jù)該報警時刻向前一段時間(該時間可根據(jù)實時報警數(shù)據(jù)上報頻率、實際場景等因素確定)的歷史定時數(shù)據(jù)選取的歷史定時數(shù)據(jù)特征,代入二次報警模型,產(chǎn)生報警結(jié)果的判斷,報警結(jié)果將返回當前報警為有效或無效的判斷。其具體步驟包括:3.1在實時報警發(fā)生后,對實時報警數(shù)據(jù)特征進行提取,其提取方法與步驟1.1相同,且實時報警數(shù)據(jù)特征與步驟1.2的歷史報警數(shù)據(jù)特征相同。提取的實時報警數(shù)據(jù)特征將作為二次報警判斷的輸入數(shù)據(jù)。3.2根據(jù)實時報警數(shù)據(jù)發(fā)生的時間,獲取該報警時刻向前一段時間的歷史定時數(shù)據(jù),并對該歷史定時數(shù)據(jù)特征進行提取,其提取方法與步驟2.2中歷史定時數(shù)據(jù)特征提取方法相同。提取的歷史定時數(shù)據(jù)特征將作為二次報警判斷的輸入數(shù)據(jù)。3.3將步驟3.1提取的實時報警數(shù)據(jù)特征和步驟3.2提取的歷史定時數(shù)據(jù)特征輸入步驟2.4生成的二次報警的模型進行匯聚,得到二次報警結(jié)果。4.根據(jù)人工反饋的報警結(jié)果,對報警模型進行修正。在報警發(fā)生后,一般場景下,工作人員會對報警的嚴重級別進行評估,并進行現(xiàn)場處置。在此步驟中,將現(xiàn)場處置的結(jié)果,反饋到二次報警的模型。二次報警的模型將再次執(zhí)行步驟2,實現(xiàn)對模型的修正。其具體步驟包括:4.1將報警發(fā)生后的二次報警結(jié)果進行輸出,結(jié)合人工判斷及處置,輸出報警結(jié)果反饋數(shù)據(jù)。其中所述報警結(jié)果反饋數(shù)據(jù)是指人工反饋的報警結(jié)果的數(shù)據(jù)化。其一般形式是一條具體的數(shù)據(jù),包括報警標識(可能具有時間、報警類型等)、人工處置結(jié)果(可能反饋為數(shù)字表示的是否有效或正確報警)。4.2將報警結(jié)果反饋數(shù)據(jù)作為輸入,再次反饋到報警模型進行訓練,以修正報警模型。表6:傳統(tǒng)方法與本發(fā)明方法準確率對比正樣本比例(有效報警數(shù)據(jù)所占比例)本發(fā)明方法準確率傳統(tǒng)方法準確率0.50000.84800.50000.66670.86520.66670.75000.88700.75000.80000.89390.80000.83330.90310.83330.85710.92370.85710.87500.92340.87500.88890.93100.8889為驗證本發(fā)明方法能夠提高報警判斷的準確率,針對某數(shù)據(jù)集,分別采用本發(fā)明方法及傳統(tǒng)方法進行了報警判斷的準確率對比,如表6所示。其中由于傳統(tǒng)方法將第一次報警后數(shù)據(jù)均當作有效報警,因此其準確率與正樣本比例相同。由表6可知,本發(fā)明方法相較于傳統(tǒng)方法能夠極大的提高報警判斷的準確率,且正樣本比例越高,采用本發(fā)明方法報警判斷的準確率越高。以上實施僅用以說明本發(fā)明的技術方案而非對其進行限制,本領域的普通技術人員可以對本發(fā)明的技術方案進行修改或者等同替換,而不脫離本發(fā)明的精神和范圍,本發(fā)明的保護范圍應以權利要求書所述為準。當前第1頁12