異常檢測(或“離群值檢測”)是一種用于識別與其他數(shù)據(jù)顯著不同的數(shù)據(jù)的技術。這些不同的數(shù)據(jù)常常被稱為“異?!被颉爱惓V怠?。
背景技術:
1、異常檢測在許多應用中都受到關注。一些應用使用可以被配置為實現(xiàn)異常檢測的微控制器。
2、由微控制器實現(xiàn)的異常檢測使得能夠使用由物理系統(tǒng)中至少一個傳感器獲取的數(shù)據(jù)實時監(jiān)視以檢測這個系統(tǒng)中的異常行為。這種技術可以用在諸如汽車、航空航天、能源、制造生產(chǎn)、健康監(jiān)視及許多其它的各種領域中。
3、有幾種異常檢測技術。一些方法基于機器學習。這些方法使用機器學習算法來識別與學習模型不對應的任何數(shù)據(jù)。
4、在異常檢測的上下文中,微控制器一般使用表示系統(tǒng)的正常行為的模型來分析由系統(tǒng)中至少一個傳感器收集的數(shù)據(jù)。
5、特別地,該模型被用于將由至少一個傳感器收集的當前數(shù)據(jù)與正常行為的數(shù)據(jù)進行比較。如果當前數(shù)據(jù)與預期數(shù)據(jù)相差太多,那么這可以指示系統(tǒng)中的異?;蛘`動。在這種情況下,可以觸發(fā)警報以警告系統(tǒng)的操作者。
6、因此,實現(xiàn)的異常檢測使得能夠警告系統(tǒng)的損壞和故障。這使得能夠提高系統(tǒng)的可靠性和安全性。
7、用于檢測異常的模型可以使用機器學習算法獲得。計算機服務器可以用來實現(xiàn)用于獲得該模型的機器學習算法。
8、特別地,機器學習算法被配置為使用表示系統(tǒng)的正常行為的數(shù)據(jù)來生成異常檢測的模型。使用這樣的機器學習算法具有避免向機器學習算法供給異常數(shù)據(jù)來生成模型的優(yōu)點。這是因為故意在系統(tǒng)中生成異常以獲得異常數(shù)據(jù)會是是困難且昂貴的。
9、可以由此類機器學習算法生成的已知模型一般具有包括大量參數(shù)并且占用微控制器的大量存儲器空間的缺點,這些參數(shù)涉及微控制器對數(shù)據(jù)的相對復雜的處理。
10、因此,需要提出一種易于由微控制器實現(xiàn)的用于獲得用于異常檢測的模型的解決方案。
技術實現(xiàn)思路
1、根據(jù)一個方面,提出了一種由計算機實現(xiàn)的用于生成物理系統(tǒng)中的異常檢測的模型的方法,該方法包括:
2、-獲得與系統(tǒng)的正常操作對應的學習數(shù)據(jù)的矩陣,
3、-將學習數(shù)據(jù)矩陣分解成奇異值,以便獲得正交輸入矩陣、對角矩陣和正交輸出矩陣,
4、-從對角矩陣確定具有高于閾值的能量的學習數(shù)據(jù)矩陣的秩,
5、-計算由根據(jù)所確定的秩選擇的正交輸入矩陣的列形成的新的基,
6、-定義表示系統(tǒng)的正常操作的極限的最大馬氏(mahalanobis)
7、距離閾值,
8、-從新的基并從最大馬氏距離閾值定義異常檢測模型。
9、這種方法它使用分解成奇異值和最大馬氏距離閾值來定義異常檢測模型。分解成奇異值使得能夠獲得對噪聲和干擾穩(wěn)健的異常檢測模型。
10、分解成奇異值還使得能夠系統(tǒng)地獲得投影的學習數(shù)據(jù)的可逆矩陣。因此總是能夠從這個可逆矩陣計算馬氏距離。
11、所獲得的模型然后可以集成在系統(tǒng)的微控制器中,以便實現(xiàn)對這個系統(tǒng)的操作期間的異常的檢測。這種模型具有占用相對小的存儲器空間的優(yōu)點。
12、在有利的實施例中,定義最大馬氏距離閾值包括:
13、-將學習數(shù)據(jù)投影到新的基上,
14、-為每個學習數(shù)據(jù)計算馬氏距離,
15、-從計算出的馬氏距離定義最大馬氏距離閾值。
16、有利地,該方法還包括從投影的學習數(shù)據(jù)并從投影的學習數(shù)據(jù)的均值計算協(xié)方差矩陣和精度矩陣,馬氏距離的計算是從投影的學習數(shù)據(jù)、從精度矩陣并從計算出的均值進行的,并且其中定義的異常檢測模型還包括精度矩陣和均值。
17、在變形例中,定義最大馬氏距離閾值包括從卡方表定義最大馬氏距離閾值。
18、在變形例中,在有利的實施例中,該方法還包括對新的基進行變換,這個變換適用于將投影的學習數(shù)據(jù)標準化,然后異常檢測模型包括新的變換后的基和最大馬氏距離閾值。
19、這種變換使得能夠避免將精度矩陣存儲在異常檢測模型中,因為然后精度矩陣與單位矩陣對應。因此,異常檢測模型僅包括新的變換后的基和最大馬氏距離閾值。
20、根據(jù)另一方面,提出了一種由計算機實現(xiàn)的用于物理系統(tǒng)中的異常檢測的方法,包括:
21、-獲得異常檢測模型,該異常檢測模型從與系統(tǒng)的正常操作對應的學習數(shù)據(jù)根據(jù)如前所述的生成方法而生成,
22、-獲得表示系統(tǒng)的操作的數(shù)據(jù),
23、-將表示系統(tǒng)的操作的數(shù)據(jù)投影到異常檢測模型的基上,
24、-從投影的數(shù)據(jù)計算馬氏距離,
25、-將計算出的馬氏距離與異常檢測模型中定義的最大馬氏距離閾值進行比較,
26、-如果計算出的馬氏距離大于最大馬氏距離閾值,那么檢測到異常。
27、這種方法具有能夠由實現(xiàn)的優(yōu)點。這是因為微控制器只實現(xiàn)兩個操作,將表示系統(tǒng)的操作的數(shù)據(jù)投影到模型的基上,以及計算馬氏距離。
28、有利地,馬氏距離的計算是使用投影的數(shù)據(jù)、精度矩陣和異常檢測模型的均值來進行的。
29、根據(jù)另一方面,提供了一種包括指令的計算機程序產(chǎn)品,當該程序由計算機執(zhí)行時,該指令使得計算機實現(xiàn)如前所述的用于生成異常檢測模型的方法。
30、根據(jù)另一方面,提供了一種包括指令的計算機程序產(chǎn)品,當該程序由計算機執(zhí)行時,該指令使得計算機實現(xiàn)如前所述的異常檢測方法。
31、根據(jù)另一方面,提出了一種微控制器,包括:
32、-非暫態(tài)存儲器,其中記錄了如前所述的用于檢測異常的計算機程序,
33、-處理單元或處理器,被配置為執(zhí)行這個計算機程序。
1.一種由計算機實現(xiàn)的用于生成物理系統(tǒng)中的異常檢測模型的方法,該方法包括:
2.根據(jù)權利要求1所述的方法,其中生成最大馬氏距離閾值包括:
3.根據(jù)權利要求2所述的方法,還包括從投影的學習數(shù)據(jù)并從投影的學習數(shù)據(jù)的均值計算協(xié)方差矩陣和精度矩陣,計算單獨的馬氏距離包括從投影的學習數(shù)據(jù)、從精度矩陣并從均值計算單獨的馬氏距離,并且生成的異常檢測模型還包括精度矩陣和均值。
4.根據(jù)權利要求1所述的方法,其中生成最大馬氏距離閾值包括從卡方表生成最大馬氏距離閾值。
5.根據(jù)權利要求2所述的方法,還包括對新的基進行變換以將投影的學習數(shù)據(jù)標準化,異常檢測模型包括變換后的新的基和最大馬氏距離閾值。
6.根據(jù)權利要求1所述的方法,還包括:
7.根據(jù)權利要求6所述的方法,其中計算投影的馬氏距離是使用投影的操作數(shù)據(jù)、精度矩陣和異常檢測模型的均值來執(zhí)行的。
8.一種非暫態(tài)計算機可讀介質,存儲用于生成物理系統(tǒng)中的異常檢測模型的計算機指令,該計算機指令在由處理器執(zhí)行時使得處理器執(zhí)行以下步驟:
9.根據(jù)權利要求8所述的非暫態(tài)計算機可讀介質,其中使得處理器生成最大馬氏距離閾值的計算機指令包括使得處理器執(zhí)行以下步驟的另外的計算機指令:
10.根據(jù)權利要求9所述的非暫態(tài)計算機可讀介質,存儲使得處理器執(zhí)行以下步驟的另外的計算機指令:
11.根據(jù)權利要求8所述的非暫態(tài)計算機可讀介質,其中使得處理器生成最大馬氏距離閾值的計算機指令包括使得處理器執(zhí)行以下步驟的另外的計算機指令:
12.根據(jù)權利要求9所述的非暫態(tài)計算機可讀介質,存儲使得處理器執(zhí)行以下步驟的另外的計算機指令:
13.根據(jù)權利要求8所述的非暫態(tài)計算機可讀介質,存儲使得處理器執(zhí)行以下步驟的另外的計算機指令:
14.一種微控制器,被配置為生成物理系統(tǒng)中的異常檢測模型,該微控制器包括:
15.根據(jù)權利要求14所述的微控制器,其中處理器執(zhí)行指令以生成最大馬氏距離閾值包括處理器執(zhí)行指令以:
16.根據(jù)權利要求15所述的微控制器,還包括處理器執(zhí)行指令以:
17.根據(jù)權利要求14所述的微控制器,其中處理器執(zhí)行指令以生成最大馬氏距離閾值包括處理器執(zhí)行指令以從卡方表生成最大馬氏距離閾值。
18.根據(jù)權利要求15所述的微控制器,還包括處理器執(zhí)行指令以對新的基進行變換以將投影的學習數(shù)據(jù)標準化,異常檢測模型包括變換后的新的基和最大馬氏距離閾值。
19.根據(jù)權利要求14所述的微控制器,還包括處理器執(zhí)行指令以:
20.如權利要求19所述的微控制器,其中處理器執(zhí)行指令以計算投影的馬氏距離包括處理器執(zhí)行指令以使用投影的操作數(shù)據(jù)、精度矩陣和異常檢測模型的均值。