相關(guān)申請(qǐng)的交叉引用本申請(qǐng)要求2014年9月10日提交的美國(guó)臨時(shí)申請(qǐng)序列號(hào)62/048,577的權(quán)益,上述美國(guó)臨時(shí)申請(qǐng)通過(guò)引用并入本文中。本發(fā)明涉及對(duì)在發(fā)電網(wǎng)絡(luò)中使用的燃?xì)鉁u輪機(jī)的監(jiān)管以及用于識(shí)別渦輪機(jī)中的允許部署預(yù)防性維護(hù)操作的故障前狀況的方法。
背景技術(shù):
:有效利用化石燃料在保持穩(wěn)定的電力網(wǎng)絡(luò)方面是至關(guān)重要的。將這種類(lèi)型的燃料轉(zhuǎn)化為電能的一種特別有效的手段是燃?xì)鉁u輪機(jī)。燃?xì)鉁u輪機(jī)部件在非常高的溫度環(huán)境下以及在各種負(fù)載條件下操作。由于熱疲勞和磨損而引起的部件劣化是實(shí)際問(wèn)題。執(zhí)行維護(hù)以檢測(cè)和控制磨損,以及根據(jù)需要修理或更換磨損的部件以持續(xù)確保有效的操作。雖然已經(jīng)(并將繼續(xù))開(kāi)發(fā)各種數(shù)據(jù)驅(qū)動(dòng)技術(shù)以在對(duì)維護(hù)事件的調(diào)度中提供統(tǒng)計(jì)輔助,但是仍然具有改進(jìn)的余地。例如,由于燃?xì)鉁u輪機(jī)的故障而引起的意外被迫關(guān)機(jī)持續(xù)發(fā)生。渦輪機(jī)的完全故障必然引起關(guān)機(jī)從而擾亂正常發(fā)電操作,并且很可能引起比計(jì)劃的維護(hù)關(guān)機(jī)更昂貴的修理事件。技術(shù)實(shí)現(xiàn)要素:本發(fā)明解決了現(xiàn)有技術(shù)中仍然存在的需求,本發(fā)明涉及對(duì)在發(fā)電網(wǎng)絡(luò)中利用的燃?xì)鉁u輪機(jī)的監(jiān)管以及用于識(shí)別渦輪機(jī)中的允許部署預(yù)防性維護(hù)操作的故障前狀況并降低意外的強(qiáng)行渦輪機(jī)關(guān)機(jī)的概率的方法。根據(jù)本發(fā)明,對(duì)特定燃?xì)鉁u輪機(jī)的時(shí)間序列數(shù)據(jù)集合(表現(xiàn)為傳感器讀數(shù)的形式)進(jìn)行檢查和注釋以包括指示潛在故障已發(fā)生的時(shí)間/事件的標(biāo)簽。將在一段時(shí)間(例如3天至5天)內(nèi)的選定數(shù)目的“事件前”傳感器讀數(shù)整合并且與已知的穩(wěn)態(tài)正常操作的傳感器讀數(shù)進(jìn)行比較,以確定在事件前數(shù)據(jù)中是否有將預(yù)測(cè)到渦輪機(jī)故障(或正在檢查的任何其他特定的“事件”)發(fā)生的任何簽名。也就是說(shuō),在數(shù)天內(nèi)的引起渦輪機(jī)故障(或任何其他事件)的傳感器讀數(shù)中是否存在任何可察覺(jué)的“征兆”。使用“快速框(fastboxes)”算法(或其他適當(dāng)類(lèi)型的機(jī)器學(xué)習(xí)方法)將事件前數(shù)據(jù)與“正常操作狀態(tài)”數(shù)據(jù)進(jìn)行比較,并且確定是否可以識(shí)別征兆。接著,將落入在分析中形成的邊界內(nèi)的傳感器讀數(shù)用作有關(guān)可能即將發(fā)生故障的警告。在本發(fā)明的優(yōu)選實(shí)施方式中,在分析中僅納入燃?xì)鉁u輪機(jī)傳感器的總數(shù)目的子集,優(yōu)選地是其讀數(shù)對(duì)燃?xì)鉁u輪機(jī)性能的變化高度敏感的傳感器。由于所收集的“事件前”數(shù)據(jù)和“正常操作”數(shù)據(jù)二者的讀數(shù)形成不平衡的數(shù)據(jù)集合(即,所關(guān)注的數(shù)據(jù)相對(duì)于數(shù)據(jù)的其余部分而言是非常小的集合),所以快速框算法非常適合用于研究所述數(shù)據(jù)。首先將事件前數(shù)據(jù)(正數(shù)據(jù)類(lèi))界定在相對(duì)較少量的群中,然后相對(duì)于較大量的正常操作數(shù)據(jù)(負(fù)數(shù)據(jù)類(lèi))對(duì)事件前數(shù)據(jù)(正數(shù)據(jù)類(lèi))進(jìn)行評(píng)估,以確定使正數(shù)據(jù)類(lèi)與負(fù)數(shù)據(jù)類(lèi)劃分開(kāi)的最優(yōu)邊界狀況(在此情況下為“框”)。一旦劃分為這兩種類(lèi)別,則采用度量來(lái)確定事件前數(shù)據(jù)與正常操作數(shù)據(jù)之間的區(qū)別是否足夠大到使得事件前數(shù)據(jù)可以接下來(lái)用作“征兆”指標(biāo)。雖然在燃?xì)鉁u輪機(jī)“故障”事件方面進(jìn)行了討論,但是本發(fā)明的方法適用于研究會(huì)引起燃?xì)鉁u輪機(jī)或其他主要機(jī)器部件的性能的非期望中斷的其他類(lèi)型事件。本發(fā)明的具體實(shí)施方式涉及一種用于預(yù)測(cè)發(fā)電設(shè)備中的燃?xì)鉁u輪機(jī)的故障事件的方法,所述方法包括以下步驟:獲得與正在研究的燃?xì)鉁u輪機(jī)的被識(shí)別的故障事件相關(guān)聯(lián)的歷史時(shí)間序列數(shù)據(jù)集合,所述歷史數(shù)據(jù)包括在所述被識(shí)別的事件之前的一段時(shí)間內(nèi)收集的傳感器讀數(shù)集合,在所述被識(shí)別的事件之前的所述一段時(shí)間被定義為事件前時(shí)間段;選擇傳感器的子集以進(jìn)行分析,并且將事件前數(shù)據(jù)集合限定為來(lái)自所選擇的傳感器的子集的在事件前時(shí)間段期間收集的傳感器讀數(shù);將事件前數(shù)據(jù)與正常操作數(shù)據(jù)集合進(jìn)行比較;確定事件前數(shù)據(jù)與正常操作數(shù)據(jù)之間的區(qū)別水平,并且確定區(qū)別水平是否高于給定閾值;以及將事件前數(shù)據(jù)標(biāo)識(shí)為征兆模式以用于預(yù)測(cè)正在研究的燃?xì)鉁u輪機(jī)的未來(lái)故障。在本發(fā)明的另一個(gè)實(shí)施方式中,非暫態(tài)計(jì)算機(jī)可用介質(zhì)其上存儲(chǔ)有計(jì)算機(jī)可讀指令,所述計(jì)算機(jī)可讀指令供處理器執(zhí)行以實(shí)施如上所述的方法。本發(fā)明的其他和另外的方面和特征將在下面的討論過(guò)程中通過(guò)參考附圖而明顯。附圖說(shuō)明現(xiàn)在參照附圖,圖1是示例性燃?xì)鉁u輪機(jī)發(fā)電設(shè)備的簡(jiǎn)化圖,其示出了用于測(cè)量渦輪機(jī)性能的傳感器被包括在其中,并且還示出了根據(jù)本發(fā)明形成的示例性性能預(yù)測(cè)器部件;圖2是根據(jù)本發(fā)明的用于預(yù)測(cè)燃?xì)鉁u輪機(jī)故障的監(jiān)督式學(xué)習(xí)方法的流程圖。圖3是示出通過(guò)根據(jù)本發(fā)明的快速框算法來(lái)執(zhí)行的使事件前數(shù)據(jù)聚類(lèi)的步驟的狀態(tài)空間圖。圖4是包括正常操作數(shù)據(jù)和在圖3的示圖中經(jīng)聚類(lèi)的事件前數(shù)據(jù)的狀態(tài)空間圖。圖5是示出將挑戰(zhàn)過(guò)程納入在數(shù)據(jù)位置獲知中使用的快速框算法的流程圖;以及圖6包含與挑戰(zhàn)過(guò)程相關(guān)聯(lián)的評(píng)估結(jié)果的受試者操作特性曲線(xiàn)(roc)的一對(duì)繪圖。具體實(shí)施方式圖1是典型的燃?xì)鉁u輪機(jī)發(fā)電設(shè)備1的簡(jiǎn)化描繪,該燃?xì)鉁u輪機(jī)發(fā)電設(shè)備1具有向設(shè)備電負(fù)載3供電的發(fā)電機(jī)2。發(fā)電機(jī)2由軸4來(lái)驅(qū)動(dòng),軸4由燃?xì)鉁u輪發(fā)動(dòng)機(jī)5提供動(dòng)力。燃?xì)鉁u輪發(fā)動(dòng)機(jī)5本身由大量獨(dú)立的部件構(gòu)成,包括壓縮機(jī)5.1、燃燒部5.2、渦輪5.3,并且可能包括一組可調(diào)入口葉片5.4。燃料經(jīng)由閥6被供給至燃燒部5.2。為了保持燃?xì)鉁u輪機(jī)發(fā)電設(shè)備1的操作可接受,使用大量傳感器7來(lái)監(jiān)測(cè)各種部件的操作,將所測(cè)量的傳感器讀數(shù)傳送至獨(dú)立的控制模塊8??刂颇K8可以與燃?xì)鉁u輪機(jī)發(fā)電設(shè)備1共同定位在一起,或者可以位于渦輪機(jī)本身的外部。在圖1中的示圖中,傳感器7包括燃燒器進(jìn)氣傳感器7.1、燃燒溫度傳感器7.2和葉片通道溫度傳感器7.3。應(yīng)當(dāng)理解的是,存在有用于監(jiān)測(cè)燃?xì)鉁u輪機(jī)性能的更多個(gè)傳感器,用于測(cè)量如溫度、壓力、旋轉(zhuǎn)、振動(dòng)等狀況。事實(shí)上,可能情況是,給定的燃?xì)鉁u輪機(jī)發(fā)電設(shè)備可以利用將近200個(gè)不同的傳感器??刂颇K8接收來(lái)自傳感器7的輸入,并且將控制信號(hào)發(fā)送至本領(lǐng)域中已知的閥、電機(jī)和執(zhí)行器。控制器可以在一個(gè)或更多個(gè)位置包括具有本領(lǐng)域中已知的關(guān)聯(lián)的硬件和軟件的一個(gè)或更多個(gè)處理器。如上所述,在預(yù)測(cè)燃?xì)鉁u輪機(jī)故障的問(wèn)題中仍然存在的挑戰(zhàn)之一是缺乏注釋數(shù)據(jù)。也就是說(shuō),通過(guò)檢查從各種傳感器收集并存儲(chǔ)在控制模塊8內(nèi)的數(shù)據(jù),不能辨別機(jī)器是否正常操作(即使機(jī)器啟動(dòng)并以某種方式運(yùn)作)。換句話(huà)說(shuō),在機(jī)器的操作中可能已經(jīng)發(fā)生了故障,但該故障本身表現(xiàn)為機(jī)器性能的某種“故障”可能需要一些時(shí)間。根據(jù)本發(fā)明,控制模塊8的功能被擴(kuò)展成通過(guò)包括性能預(yù)測(cè)器系統(tǒng)10來(lái)解決該問(wèn)題,如下面詳細(xì)討論的,該性能預(yù)測(cè)器系統(tǒng)10可以用于分析所收集的傳感器讀數(shù)并且尋找傳感器讀數(shù)中的任何能夠說(shuō)明問(wèn)題的變化,所述傳感器讀數(shù)的變化可合理預(yù)測(cè)某個(gè)事件(如渦輪機(jī)故障)很可能會(huì)在未來(lái)數(shù)天內(nèi)發(fā)生。如將在下面詳細(xì)討論的,性能預(yù)測(cè)器系統(tǒng)10包括所有歷史傳感器讀數(shù)的數(shù)據(jù)庫(kù)12(其可以追溯到過(guò)去數(shù)年);事實(shí)上,該數(shù)據(jù)庫(kù)可以形成傳統(tǒng)的控制模塊8的一部分。性能預(yù)測(cè)器系統(tǒng)10包括處理器部件14,該處理器部件14具有存儲(chǔ)器16和處理器18,這些元件用于執(zhí)行對(duì)傳感器讀數(shù)數(shù)據(jù)的實(shí)際評(píng)估,并且確定是否可以通過(guò)歷史的事件前數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)故障事件。然后將來(lái)自性能部件14的輸出存儲(chǔ)在征兆簽名數(shù)據(jù)庫(kù)20中以供發(fā)電設(shè)備人員持續(xù)使用,所述輸出表現(xiàn)為特定的“事件前”數(shù)據(jù)集合的形式,其在滿(mǎn)足此標(biāo)準(zhǔn)之后可以用于識(shí)別在渦輪機(jī)發(fā)生故障之前的故障狀況。如圖1所示的性能預(yù)測(cè)器系統(tǒng)10的特定架構(gòu)被認(rèn)為僅是示例性的,硬件部件和軟件部件的各種其他配置可以被配置為執(zhí)行如下面詳細(xì)描述的本發(fā)明的方法。本發(fā)明的方法通過(guò)研究與正在研究的特定燃?xì)鉁u輪機(jī)(或其他機(jī)器)相關(guān)聯(lián)的歷史數(shù)據(jù)而開(kāi)始。對(duì)這些數(shù)據(jù)(表現(xiàn)為傳感器讀數(shù)的形式)進(jìn)行研究以確定“故障”(或一些其他類(lèi)型的臨界事件)發(fā)生的可能時(shí)間。然后對(duì)在被識(shí)別的事件之前的給定時(shí)間段內(nèi)的傳感器數(shù)據(jù)進(jìn)行注釋以指示該“事件前”狀況。將獨(dú)立的數(shù)據(jù)集合注釋為“正常操作”數(shù)據(jù),其中該數(shù)據(jù)是從被識(shí)別的事件相當(dāng)之前的一段時(shí)間中選擇,其中該數(shù)據(jù)可以可靠地推定燃?xì)鉁u輪機(jī)正在以正常的方式運(yùn)作。然后使用合適的機(jī)器學(xué)習(xí)算法(例如“快速框”)來(lái)相對(duì)于正常操作(事件后)數(shù)據(jù)的位置獲知事件前數(shù)據(jù)的位置,從而在聚類(lèi)的事件前數(shù)據(jù)的位置周?chē)纬闪诉吔纭H绻梢允褂萌魏慰闪炕倪吔鐏?lái)以可接受的方式將事件前數(shù)據(jù)與事件后數(shù)據(jù)區(qū)別開(kāi)來(lái)(以便然后將事件前數(shù)據(jù)標(biāo)識(shí)為“征兆”),則可以將該事件前數(shù)據(jù)模式繼續(xù)用作機(jī)器存在潛在故障的指標(biāo)。事實(shí)上,如由性能預(yù)測(cè)器系統(tǒng)執(zhí)行的本發(fā)明的處理可以用于監(jiān)測(cè)燃?xì)鉁u輪機(jī)性能的健康狀況并且更好地在發(fā)生大事件(例如渦輪機(jī)故障)之前預(yù)測(cè)該大事件。如圖2的流程圖中所示,本發(fā)明的處理開(kāi)始于:首先注釋與所研究的機(jī)器相關(guān)聯(lián)的給定的時(shí)間序列數(shù)據(jù)(傳感器讀數(shù))集合(步驟100)。該數(shù)據(jù)是關(guān)于特定機(jī)器的歷史數(shù)據(jù)集合,并且可以在時(shí)間上追溯到過(guò)去數(shù)年。假定在過(guò)去已經(jīng)發(fā)生了強(qiáng)行關(guān)機(jī)(或正在研究的其他事件),并且對(duì)歷史數(shù)據(jù)的初始研究將很容易地識(shí)別這樣的事件。在此基礎(chǔ)上,對(duì)在所識(shí)別的事件之前的數(shù)天時(shí)間范圍內(nèi)的數(shù)據(jù)進(jìn)行注釋?zhuān)詫⒋藬?shù)據(jù)標(biāo)記為潛在地指示已發(fā)生問(wèn)題。一旦被注釋?zhuān)瑒t清洗原始數(shù)據(jù)以去除明顯的離群值(步驟110),以及去除會(huì)干擾正在執(zhí)行的這種分析的任何偽值。偽值包括在事件緊之前記錄的數(shù)據(jù)。例如,如果主傳感器(mw)讀數(shù)大幅下降(達(dá)到0),則這明確地指示了機(jī)器出現(xiàn)故障,但不是出于本發(fā)明的目的所關(guān)注的“故障前”型的這種差別不明顯的數(shù)據(jù)。事實(shí)上,期望的是在mw功率的這樣的大幅下降開(kāi)始之前獲知數(shù)據(jù)模式,以便提高機(jī)器的性能??赡茉跀?shù)據(jù)不規(guī)則中出現(xiàn)的這些“征兆”在本質(zhì)上比較隱含,并因此要辨別就更具挑戰(zhàn)性。接著,選擇合適的傳感器集合以進(jìn)行分析處理(步驟120),其中所選擇的傳感器集合是用于對(duì)正在研究的機(jī)器的性能進(jìn)行監(jiān)測(cè)的完整一套傳感器的子集。如上所述,給定的渦輪機(jī)可以具有超過(guò)150個(gè)的不同傳感器的集合,用于監(jiān)測(cè)其各方面性能(例如測(cè)量所生成的輸出功率、在不同的位置的溫度、壓力、振動(dòng)、旋轉(zhuǎn)等)。這些傳感器中的一些傳感器提供了具有很強(qiáng)區(qū)別能力的數(shù)據(jù),而來(lái)自其他傳感器的數(shù)據(jù)是更差別不明顯的。為了出于本發(fā)明的目的而選擇最優(yōu)的傳感器,期望的是選擇以下傳感器:所述傳感器的數(shù)據(jù)最強(qiáng)烈地表明與正在研究的被識(shí)別的事件(例如,渦輪機(jī)故障)相關(guān)聯(lián)的事件前數(shù)據(jù)與事件后數(shù)據(jù)之間的值的變化??梢栽趥鞲衅鬟x擇過(guò)程中使用的一個(gè)工具是對(duì)來(lái)自每個(gè)傳感器的讀數(shù)的“受試者操作特性曲線(xiàn)下的面積”(auroc)圖的評(píng)估。auroc可以被定義為其中分類(lèi)器將向隨機(jī)選擇的正例分配的分?jǐn)?shù)高于向隨機(jī)選擇的負(fù)例分配的分?jǐn)?shù)的概率。換句話(huà)說(shuō),roc繪圖是真正率(靈敏度)與假正率(1-敏感度)之間的關(guān)系的曲線(xiàn)圖。0.50的roc“下的面積”意味著猜測(cè)正確的幾率與猜測(cè)錯(cuò)誤的幾率是一樣的。所述猜測(cè)與roc的匹配度越高,則面積越接近于一致(這表示所述分類(lèi)與實(shí)際數(shù)據(jù)之間的完美匹配)。出于本發(fā)明的目的,將事件前數(shù)據(jù)定義為正例,以及將事件后(正常操作狀況)數(shù)據(jù)定義為負(fù)例。因此,可以針對(duì)每個(gè)傳感器通過(guò)將其事件前數(shù)據(jù)與其事件后數(shù)據(jù)進(jìn)行比較來(lái)計(jì)算auroc的值,其中,auroc的值越高(很明顯,極值為1.0),則傳感器的性能越容易區(qū)別??梢詫⒕哂斜阮A(yù)定值(例如,0.6)大的auroc的傳感器集合指定為適于本發(fā)明的事件前數(shù)據(jù)獲知方法。然后,將在被識(shí)別的事件之前的數(shù)天時(shí)段內(nèi)的所選擇的傳感器集合的歷史的、事件前傳感器讀數(shù)(例如,與事件之前的3天時(shí)間段相關(guān)聯(lián)的數(shù)據(jù))進(jìn)行整合(圖2的流程圖中步驟130)。該第一數(shù)據(jù)集合即事件前數(shù)據(jù)還被稱(chēng)為“正類(lèi)”數(shù)據(jù),這是因?yàn)樵摂?shù)據(jù)是出于本發(fā)明的預(yù)測(cè)目的所關(guān)注的數(shù)據(jù)。當(dāng)已知燃?xì)鉁u輪機(jī)正常運(yùn)作時(shí),在此情況下還將在被識(shí)別的事件相當(dāng)之后的延長(zhǎng)的一段時(shí)間內(nèi)收集的與正常操作狀況相關(guān)聯(lián)的第二數(shù)據(jù)集合進(jìn)行整合。該第二數(shù)據(jù)集合(事件后數(shù)據(jù))還被稱(chēng)為“負(fù)類(lèi)”數(shù)據(jù)。關(guān)于許多其他真實(shí)世界分類(lèi)問(wèn)題,與正類(lèi)相關(guān)聯(lián)的數(shù)據(jù)(事件前數(shù)據(jù))遠(yuǎn)少于其余數(shù)據(jù)(事件后類(lèi)數(shù)據(jù),或“負(fù)類(lèi)”數(shù)據(jù))。這種類(lèi)型的不平衡數(shù)據(jù)最好使用諸如以下針對(duì)考慮較大“正?!鳖?lèi)數(shù)據(jù)的更常規(guī)算法所描述的“快速框”算法等方法來(lái)分析。(如圖2中的步驟140所示的)快速框算法在分析給定的數(shù)據(jù)集合時(shí)使用“表征,然后區(qū)別”的方法。根據(jù)本發(fā)明的目的,該方法采取以下形式:首先表征事件前數(shù)據(jù),然后研究如何可以將該數(shù)據(jù)與“正常”的事件后數(shù)據(jù)區(qū)別開(kāi)來(lái)(包括初始確定:這樣的區(qū)別是否甚至可行)。因此,如果可以將事件前數(shù)據(jù)與正常傳感器讀數(shù)區(qū)別開(kāi)來(lái),則可以接下來(lái)使用該事件前信息來(lái)幫助在燃?xì)鉁u輪機(jī)故障(或其他重大事件)發(fā)生相當(dāng)之前識(shí)別“征兆”。如圖2的流程圖中特別所示,快速框方法中的第一步驟142是將事件前數(shù)據(jù)聚類(lèi)成給定的k個(gè)群的集合(其中,k是可調(diào)參數(shù))。這些群的判定邊界最初設(shè)置為包圍每個(gè)群的緊密平行邊框。圖3示出了該初始聚類(lèi)步驟的結(jié)果,在圖中以“十字”形式示出了事件前數(shù)據(jù)(即,所選傳感器讀數(shù)的被標(biāo)準(zhǔn)化為落入特定范圍內(nèi)的時(shí)間序列數(shù)據(jù)),以及示出了形成包圍每個(gè)群的周邊的緊密矩形框。在此情況下,創(chuàng)建了五個(gè)獨(dú)立的數(shù)據(jù)群。在創(chuàng)建了群之后,將事件后數(shù)據(jù)(負(fù)類(lèi)數(shù)據(jù))引入到分析中,如圖4所示。然后檢查示圖中的整個(gè)空間(步驟144),其中,識(shí)別與上述限定的框邊界最接近的負(fù)類(lèi)數(shù)據(jù)點(diǎn),并且由于這些負(fù)數(shù)據(jù)點(diǎn)對(duì)五個(gè)群框中的每個(gè)群框的邊界的位置有較大的影響,所以給出了在下一步驟的獲知過(guò)程中使用的附加的加權(quán)因子c。在各個(gè)框上并行地執(zhí)行該步驟,從而使總的計(jì)算時(shí)間減少。一旦負(fù)數(shù)據(jù)點(diǎn)的加權(quán)完成時(shí),則執(zhí)行快速框算法中的最后步驟(步驟146)。該步驟被稱(chēng)為“邊界擴(kuò)展”步驟,其中,針對(duì)每個(gè)框的每個(gè)邊界(在垂直和水平這兩個(gè)方向)識(shí)別一維分類(lèi)器,并且執(zhí)行一組數(shù)值計(jì)算以最佳地限定邊界,使用c作為特定負(fù)數(shù)據(jù)點(diǎn)的權(quán)重以及使用β作為使框擴(kuò)展的正則化參數(shù)。與此邊界擴(kuò)展過(guò)程相關(guān)的詳細(xì)數(shù)學(xué)法以及一般的快速框算法可以在s.goh等人的標(biāo)題為“boxeddrawingswithlearningforimbalanceddata”的參考文獻(xiàn)中找到,該文獻(xiàn)出現(xiàn)在2014年第20屆關(guān)于知識(shí)發(fā)現(xiàn)和數(shù)據(jù)挖掘(kdd)的acmsigkdd會(huì)議(20thacmsigkddconferenceonknowledgediscoveryanddatamining(kdd))的論文集中,所述文獻(xiàn)的全部?jī)?nèi)容通過(guò)引用并入本文。對(duì)邊界擴(kuò)展過(guò)程的描述在本文中還作為附錄被包括在內(nèi)。因而定義為快速框算法的輸出的最后邊界被認(rèn)為是“正常”操作狀況數(shù)據(jù)(事件后數(shù)據(jù)、負(fù)類(lèi)數(shù)據(jù))與可指示燃?xì)鉁u輪機(jī)故障(或任何正在研究的事件)開(kāi)始的數(shù)據(jù)之間的邊界。也就是說(shuō),快速框算法已經(jīng)獲知事件前數(shù)據(jù)的邊界。為了接下來(lái)成功地使用該信息來(lái)預(yù)測(cè)潛在的故障事件,在此過(guò)程中的下一步驟(如圖2的流程圖中的步驟150所示)是分析快速框算法的結(jié)果,以確定事件前數(shù)據(jù)與事件后數(shù)據(jù)之間的區(qū)別水平是否足夠高。應(yīng)當(dāng)理解的是,向與所選擇的每個(gè)傳感器相關(guān)聯(lián)的數(shù)據(jù)分別應(yīng)用如上所述的以快速框算法為基礎(chǔ)的數(shù)據(jù)位置獲知處理。也就是說(shuō),該算法被應(yīng)用于許多數(shù)據(jù)集合,針對(duì)每個(gè)傳感器進(jìn)行一次。作為結(jié)果,可能只有少數(shù)選定的傳感器事實(shí)上產(chǎn)生足以將其事件前數(shù)據(jù)與其事件后數(shù)據(jù)區(qū)別開(kāi)來(lái)的結(jié)果。在不平衡數(shù)據(jù)學(xué)習(xí)過(guò)程中,不能使用常規(guī)度量如“準(zhǔn)確度”來(lái)進(jìn)行該確定,原因在于這些常規(guī)度量都集中于確定與“多數(shù)類(lèi)”(這里為負(fù)類(lèi))數(shù)據(jù)的配合。相反地,根據(jù)本發(fā)明的機(jī)器學(xué)習(xí)的目的是識(shí)別事件前(少數(shù)類(lèi))數(shù)據(jù)的屬性,這可能在經(jīng)典的度量中被忽略。因此,如何良好地將事件前數(shù)據(jù)與事件后數(shù)據(jù)區(qū)別開(kāi)來(lái)的可替選措施之一利用“roc曲線(xiàn)的凸包下的面積”或auh。為了計(jì)算auh,計(jì)算用于權(quán)重參數(shù)c的各個(gè)值的分類(lèi)器,原因在于已知c用于控制正類(lèi)和負(fù)類(lèi)的相對(duì)重要性。c的每次設(shè)置對(duì)應(yīng)于roc曲線(xiàn)上的單個(gè)點(diǎn),該roc曲線(xiàn)具有真-正和假-正的計(jì)數(shù)。計(jì)算由roc曲線(xiàn)上的點(diǎn)形成的auh,然后通過(guò)將該結(jié)果除以正例與負(fù)例的乘積來(lái)將auh歸一化。因此,最好的可能結(jié)果是:auh為1.0。出于本發(fā)明的目的,期望auh值為至少0.5,其中auh值越高,則關(guān)于可以獲知事件前數(shù)據(jù)的模式并識(shí)別這兩個(gè)類(lèi)之間的差異的指示就越大。所述獲知這兩個(gè)數(shù)據(jù)類(lèi)之間的差異的能力因而允許發(fā)電設(shè)備操作者識(shí)別可能的燃?xì)鉁u輪機(jī)故障的征兆,并且相應(yīng)地計(jì)劃定期維護(hù)。實(shí)驗(yàn)測(cè)試結(jié)果為了評(píng)估本發(fā)明的方法識(shí)別數(shù)據(jù)模式以及預(yù)測(cè)燃?xì)鉁u輪機(jī)故障事件的能力,對(duì)來(lái)自已知的燃?xì)鉁u輪機(jī)的數(shù)據(jù)集合進(jìn)行了研究。從2009年至2013年的這段時(shí)間內(nèi)的歷史數(shù)據(jù)可用于研究。出于評(píng)估“故障”事件的目的,假定主指示器為mw(兆瓦)傳感器。顯然,如果該傳感器的讀數(shù)為“零”(0),則表示該機(jī)器沒(méi)有運(yùn)行并且已經(jīng)發(fā)生了故障。出于本發(fā)明的目的,選擇閾值為20%與該傳感器數(shù)據(jù)相關(guān)聯(lián),這意味著比標(biāo)稱(chēng)值的20%低的任何mw讀數(shù)作為“離群值”被去除。在偽值方面,在事件之后的15天內(nèi)的數(shù)據(jù)也被去除(這是因?yàn)闄C(jī)器的重新啟動(dòng)被認(rèn)為在延長(zhǎng)的一段時(shí)間內(nèi)產(chǎn)生了不穩(wěn)定的傳感器讀數(shù))。在原始數(shù)據(jù)中還發(fā)現(xiàn)了一些重疊事件(也就是說(shuō),某些事件被一個(gè)以上的傳感器記錄)?!扒逑础睌?shù)據(jù)以去除重復(fù)的信息。關(guān)于所研究的數(shù)據(jù)集合,確定了如包含在以下表中的可供分析的被識(shí)別事件的列表:表i與步驟120(參照?qǐng)D2)相關(guān)聯(lián)地使用以上討論的auroc過(guò)程,選擇了71個(gè)傳感器的集合來(lái)用于創(chuàng)建事件前數(shù)據(jù)。下面的列表標(biāo)識(shí)了具有最高auroc值的20個(gè)傳感器(來(lái)自所選擇的71個(gè)):表ii排名傳感器idauroc值排名傳感器idauroc值1a0.71253611k0.6198972b0.64573212l0.6181433c0.63773713m0.6129384d0.63688414n0.0686545e0.63306815o0.6085756f0.62548916p0.6005877g0.62323617q0.6058508h0.62294318r0.6048299i0.62125219s0.60273810j0.62095720t0.602596利用所確定的這一集合,在所選擇的事件日期之前的三天內(nèi)的數(shù)據(jù)被整合定義為“少數(shù)類(lèi)”數(shù)據(jù)或事件前數(shù)據(jù)。然后定義了“多數(shù)類(lèi)”數(shù)據(jù)(即,與正常渦輪機(jī)操作狀況相關(guān)聯(lián)的傳感器讀數(shù))。如以上所討論的,在渦輪機(jī)重新啟動(dòng)緊之后的一段時(shí)間內(nèi)的傳感器讀數(shù)可能是不穩(wěn)定的,使得數(shù)據(jù)被認(rèn)為是偽值并且在“多數(shù)類(lèi)”中不被使用。例如,在事件日期之后的15天的時(shí)段內(nèi)的傳感器讀數(shù)可以被忽略。在事件日期之后的20天至25天內(nèi)的數(shù)據(jù)被定義為“多數(shù)類(lèi)”數(shù)據(jù)。然后應(yīng)用快速框算法來(lái)獲知事件前數(shù)據(jù)相對(duì)于事件后數(shù)據(jù)的位置,使得可以判斷是否接下來(lái)可以將該事件前數(shù)據(jù)與正常數(shù)據(jù)區(qū)別開(kāi)來(lái),從而預(yù)測(cè)潛在的燃?xì)鉁u輪機(jī)故障事件。如以上與圖2的流程圖中的步驟142相關(guān)聯(lián)地描述的那樣,快速框算法開(kāi)始于:通過(guò)(使用處理器例如圖1中所示的元件18)使事件前數(shù)據(jù)聚類(lèi),從而創(chuàng)建該少數(shù)類(lèi)數(shù)據(jù)的k個(gè)群的集合。在該特定情況下要在快速框算法中使用的群的數(shù)目(k)被選擇為在值1與值4之間的范圍內(nèi)。擴(kuò)展參數(shù)β也被選擇為在該相同值范圍內(nèi),并且用于負(fù)數(shù)據(jù)的權(quán)重c被選擇為在0.1與1.0之間的范圍內(nèi)。使用10個(gè)不同的參數(shù)集合(k,β,c)將該算法應(yīng)用于所述數(shù)據(jù),并且執(zhí)行如步驟144和步驟146中概述的步驟以生成關(guān)于“事件前的3天”研究和“事件前的5天”研究二者的結(jié)果。出于本發(fā)明的目的,然后執(zhí)行通過(guò)使用auh措施所執(zhí)行的結(jié)果分析,以判斷是否有任何事件指標(biāo)存在于少數(shù)類(lèi)數(shù)據(jù)中,也就是說(shuō),是否可以將任何事件前數(shù)據(jù)與正常操作數(shù)據(jù)區(qū)別開(kāi)來(lái)。另外,為了研究本發(fā)明的處理的準(zhǔn)確度,隨機(jī)選擇被標(biāo)識(shí)為“a”和“f”的這兩個(gè)事件作為測(cè)試數(shù)據(jù),并且將表i中列出的剩余的四個(gè)事件用作訓(xùn)練數(shù)據(jù)。十組初始狀況中的每組初始狀況的auh值如下所示:事件前的三天的結(jié)果:訓(xùn)練測(cè)試0.94770.91890.94770.89050.85371.00000.94770.91890.94770.91550.94770.91920.94770.91650.94770.88720.94770.91880.94770.9155訓(xùn)練平均值:0.9389(標(biāo)準(zhǔn)偏差0.0297)測(cè)試平均值:0.9201(標(biāo)準(zhǔn)偏差0.0306)事件前的五天的結(jié)果:訓(xùn)練平均值:0.8861(標(biāo)準(zhǔn)偏差0.0247)測(cè)試平均值:0.6981(標(biāo)準(zhǔn)偏差0.0414)因而,在生成大于0.5的auh值的情況下,這些結(jié)果表明了:注釋數(shù)據(jù)并使用快速框算法來(lái)分析數(shù)據(jù)的步驟允許將機(jī)器學(xué)習(xí)方法用于可靠地預(yù)測(cè)可能導(dǎo)致機(jī)器的最終故障的燃?xì)鉁u輪機(jī)故障的那些“征兆”。因?yàn)楸景l(fā)明的方法基于個(gè)體地應(yīng)用于每個(gè)獨(dú)立的燃?xì)鉁u輪機(jī),使用該機(jī)器自身的傳感器讀數(shù)的歷史,所以本發(fā)明的方法有利地獲知會(huì)影響該設(shè)備性能的最適當(dāng)?shù)氖录皵?shù)據(jù)。返回再次參照?qǐng)D1的系統(tǒng)圖,被認(rèn)為是即將發(fā)生的故障的可行征兆的任何特定事件前數(shù)據(jù)模式被存儲(chǔ)在征兆簽名數(shù)據(jù)庫(kù)20中,以供發(fā)電設(shè)備人員在監(jiān)測(cè)該機(jī)器時(shí)使用。出于驗(yàn)證這些快速框預(yù)測(cè)結(jié)果的目的,對(duì)數(shù)據(jù)進(jìn)行分類(lèi)的傳統(tǒng)方法可以形成為“挑戰(zhàn)者”。這示于圖5的流程圖中,在該流程圖中,將挑戰(zhàn)者過(guò)程200與快速框算法并行使用來(lái)檢查和比較事件前數(shù)據(jù)和事件后數(shù)據(jù)。在此情況下,事件前數(shù)據(jù)和事件后數(shù)據(jù)選自經(jīng)清洗的集合以供分析。特別地,在步驟210中執(zhí)行主要分量分析(pca)并且使用pca來(lái)從原始傳感器數(shù)據(jù)中提取特征。在示例性過(guò)程中,選擇前九(9)個(gè)主要分量以在接下來(lái)的邏輯回歸過(guò)程中使用(步驟220)。在步驟300的比較結(jié)果過(guò)程中,使用配合測(cè)試優(yōu)度(goodness-of-fittest)和個(gè)體系數(shù)來(lái)針對(duì)快速框結(jié)果評(píng)估挑戰(zhàn)者模型。在比較這兩種方法時(shí),邏輯回歸的結(jié)果表明,該現(xiàn)有技術(shù)并不優(yōu)于快速框方法。事實(shí)上,邏輯回歸在區(qū)別事件前的測(cè)試數(shù)據(jù)方面不如快速框。在圖6(a)和圖6(b)所示的圖表分別示出了關(guān)于該組的訓(xùn)練事件和檢測(cè)事件的與挑戰(zhàn)者方法相關(guān)聯(lián)的roc曲線(xiàn)。如圖所示,在創(chuàng)建圖6(a)時(shí)使用的訓(xùn)練事件表現(xiàn)出約0.79783的auroc值。針對(duì)測(cè)試數(shù)據(jù)的auroc值被示為約0.64900。相比之下,針對(duì)訓(xùn)練數(shù)據(jù)使用快速框方法得到的auroc值在0.8861至0.9389的范圍內(nèi),以及在0.6981至0.9201的范圍內(nèi)。顯然,本發(fā)明的快速框方法產(chǎn)生了更好的預(yù)測(cè)結(jié)果。上述方法可以如上所述通過(guò)由計(jì)算機(jī)執(zhí)行的程序模塊來(lái)實(shí)現(xiàn)。一般而言,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類(lèi)型的例程、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等。本文中所使用的術(shù)語(yǔ)“程序”可以指單個(gè)程序模塊或一起作用的多個(gè)程序模塊。本公開(kāi)內(nèi)容可以在以下各種類(lèi)型的計(jì)算機(jī)上實(shí)現(xiàn):個(gè)人計(jì)算機(jī)(pc)、手持式裝置、多處理器系統(tǒng)、基于微處理器的可編程消費(fèi)電子產(chǎn)品、網(wǎng)絡(luò)pc、小型計(jì)算機(jī)、大型計(jì)算機(jī)等。本公開(kāi)內(nèi)容還可以在分布式計(jì)算環(huán)境中被采用,在該分布式計(jì)算環(huán)境中由通過(guò)通信網(wǎng)絡(luò)鏈接的遠(yuǎn)程處理裝置來(lái)執(zhí)行任務(wù)。在分布式計(jì)算環(huán)境中,模塊可以位于本地的和遠(yuǎn)程的存儲(chǔ)器存儲(chǔ)裝置中。用于實(shí)現(xiàn)上述方法的示例性處理模塊可以硬連線(xiàn)在或存儲(chǔ)在分立的存儲(chǔ)器中,所述示例性處理模塊從計(jì)算機(jī)可讀介質(zhì)——如rom或其他類(lèi)型的硬磁驅(qū)動(dòng)器、光存儲(chǔ)器,磁帶或閃速存儲(chǔ)器——中被讀入一個(gè)或多個(gè)處理器的主存儲(chǔ)器。在程序存儲(chǔ)于存儲(chǔ)器介質(zhì)中的情況下,模塊中的指令序列的執(zhí)行會(huì)使處理器執(zhí)行本文所描述的處理步驟。本公開(kāi)內(nèi)容的實(shí)施方式并不限于任何硬件和軟件的特定組合,并且為了實(shí)現(xiàn)上述內(nèi)容所需的計(jì)算機(jī)程序代碼可以由本領(lǐng)域普通技術(shù)人員來(lái)開(kāi)發(fā)。如本文所采用的術(shù)語(yǔ)“計(jì)算機(jī)可讀介質(zhì)”指的是向一個(gè)或更多個(gè)處理器提供指令或者參與向一個(gè)或更多個(gè)處理器提供指令的任何有形機(jī)器編碼介質(zhì)。例如,計(jì)算機(jī)可讀介質(zhì)可以是一個(gè)或更多個(gè)光或磁存儲(chǔ)盤(pán)、閃存驅(qū)動(dòng)器和卡、只讀存儲(chǔ)器、或通常構(gòu)成主存儲(chǔ)器的隨機(jī)存取存儲(chǔ)器如dram。這樣的介質(zhì)不包括無(wú)形的傳播信號(hào)。緩存的信息被認(rèn)為要被存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上。計(jì)算機(jī)可讀介質(zhì)的常見(jiàn)手段是本領(lǐng)域公知的,而無(wú)需在這里詳細(xì)地描述。前面的詳細(xì)描述應(yīng)當(dāng)被理解為在各個(gè)方面均是說(shuō)明性和示例性的而不是限制性的,并且在本文中本公開(kāi)內(nèi)容的范圍不是從說(shuō)明書(shū)來(lái)確定,而是從根據(jù)專(zhuān)利法所允許的廣度解釋的權(quán)利要求來(lái)確定。應(yīng)當(dāng)理解的是,本領(lǐng)域技術(shù)人員將在不脫離本公開(kāi)的范圍和精神的情況下實(shí)現(xiàn)各種修改。附錄:快速框算法中的邊界擴(kuò)展輸入:框(群)的數(shù)目k,權(quán)重c和β,以及數(shù)據(jù)集{xi,yi}i輸出:框的邊界(限定事件前數(shù)據(jù)的限度)lf,j,k和uf,j,k,其中,“l(fā)”表示下邊界,“u”表示上邊界,下標(biāo)“f”表示最終邊界,下標(biāo)“j”表示第j維,以及下標(biāo)“k”表示第k個(gè)框1.將傳感器讀數(shù)數(shù)據(jù)歸一化為在-1與+1之間。2.將少數(shù)(事件前)數(shù)據(jù)聚類(lèi)為k個(gè)群。3.通過(guò)計(jì)算起始邊界ls,j,k和us,j,k來(lái)構(gòu)造每個(gè)群的最小封閉框(下標(biāo)“s”表示起始邊界)。4.基于以下來(lái)構(gòu)造局部分類(lèi)器的數(shù)據(jù)xl,j,k和xu,j,k:其中,p表示額外的維度(不同于j)5.針對(duì)步驟4的分類(lèi)器來(lái)計(jì)算“正則化的”指數(shù)損失,其表示為并且被定義如下:其中,下標(biāo)“+”表示群內(nèi)的事件前數(shù)據(jù)點(diǎn),下標(biāo)“-”表示群以外的所有數(shù)據(jù)點(diǎn),是第k個(gè)群內(nèi)的事件前數(shù)據(jù)點(diǎn)集合,并且是第k個(gè)群之外的所有數(shù)據(jù)點(diǎn)集合6.基于以下來(lái)計(jì)算lr,j,k和ur,j,k:7.基于以下來(lái)執(zhí)行邊界擴(kuò)展:其中,下標(biāo)“f”表示最終邊界,以及是小數(shù)字。8.通過(guò)將傳感器讀數(shù)數(shù)據(jù)重新調(diào)整回到有意義的值范圍來(lái)進(jìn)行非歸一化。當(dāng)前第1頁(yè)12