亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

預(yù)計(jì)算模型的結(jié)果的檢索的制作方法

文檔序號(hào):11458621閱讀:142來源:國知局
預(yù)計(jì)算模型的結(jié)果的檢索的制造方法與工藝

本發(fā)明涉及計(jì)算機(jī)程序和系統(tǒng)領(lǐng)域,并且更具體地涉及用于在事件過程中對(duì)模型結(jié)果進(jìn)行檢索的方法、系統(tǒng)以及程序。



背景技術(shù):

推薦用于在工程中做出決策。例如,在正在進(jìn)行的衛(wèi)星發(fā)射中,需要推薦緊急行動(dòng)以使得事故風(fēng)險(xiǎn)的函數(shù)(例如,控制燃料箱的溫度、燃料消耗、發(fā)射器的速度……)最小化。推薦不限于對(duì)設(shè)備進(jìn)行控制,而是也可以在設(shè)備的構(gòu)思和制造期間使用推薦,例如,cad系統(tǒng)可以針對(duì)設(shè)備的設(shè)計(jì)提供推薦,從而使得所設(shè)計(jì)的設(shè)備發(fā)生故障的風(fēng)險(xiǎn)最小化。

存在若干已知類別的推薦系統(tǒng)。第一類別包括所謂的推薦者系統(tǒng),該推薦者系統(tǒng)是訪問者接收基于已訪問內(nèi)容的內(nèi)容建議的系統(tǒng)。例如,搜索引擎基于已訪問頁面的個(gè)人歷史記錄對(duì)搜索結(jié)果進(jìn)行排序。在markoandyoavshoham.″fab:content-based,collaborativerecommendation.″communicationsoftheacm40.3(1997):66-72中討論了這樣的系統(tǒng)的示例,或者在sarwar,badrul,etal.″item-basedcollaborativefilteringrecommendationalgorithms.″proceedingsofthe10thinternationalconferenceonworldwideweb.acm,2001中也討論了這樣的系統(tǒng)的示例。

然而,這些推薦者系統(tǒng)在集中大量用戶的歷史的應(yīng)用中起作用。例如,搜索擁有超過10億用戶。托管在公司服務(wù)器上的系統(tǒng)不具有如此大量的決策制定者來向其學(xué)習(xí)。決策制定者典型地使用最佳的商業(yè)實(shí)踐或管理咨詢公司來得到基于在相似情況下其同行所積累的經(jīng)驗(yàn)的建議。但是,商業(yè)、操作以及設(shè)備數(shù)據(jù)與不同公司的相對(duì)隔離使得難以通過計(jì)算機(jī)程序來自動(dòng)化該學(xué)習(xí)過程。所以,決策制定者基于描述觸發(fā)對(duì)決策的需求的情況的數(shù)據(jù)(例如,描述其自身操作和設(shè)備的變量)對(duì)情況進(jìn)行評(píng)定,而不是考慮其同行的決策歷史。因此,這些推薦者系統(tǒng)并不適合于這樣的情況。

第二類別包括基于由專家寫入并自動(dòng)應(yīng)用的規(guī)則的、使得與某個(gè)問題有關(guān)的決策制定自動(dòng)操作的專家系統(tǒng)。當(dāng)選項(xiàng)的數(shù)量少,并且輸入變量可由人員管理或被處理為歸總在可管理的可區(qū)分變量的集合中時(shí),則專家可能指定將在大多數(shù)情況下產(chǎn)生最優(yōu)行動(dòng)的規(guī)則。第一種方法被稱為“僅專家規(guī)則”,其中規(guī)則由該系統(tǒng)將被應(yīng)用到的技術(shù)領(lǐng)域的專家手動(dòng)寫入。第二種方法被稱為“與經(jīng)驗(yàn)?zāi)P徒Y(jié)合的專家規(guī)則”,其中基于學(xué)習(xí)處理可用輸入并返回可管理數(shù)量的輸入的機(jī)器來構(gòu)建經(jīng)驗(yàn)?zāi)P?。這樣的模型將典型地返回估計(jì)的概率。因?yàn)榻档土颂峁┙o人為寫入規(guī)則的輸入的復(fù)雜度,所以減少了人為錯(cuò)誤的空間。

然而,該第二類別遭受許多缺點(diǎn);值得注意的是,當(dāng)獨(dú)立因素的數(shù)量和選項(xiàng)的數(shù)量導(dǎo)致不可由人類專家來管理的問題時(shí),第一種方法不起作用。第二種方法需要大量的硬件資源來訓(xùn)練經(jīng)驗(yàn)?zāi)P?。?shí)際上,典型地由新數(shù)據(jù)觸發(fā)對(duì)決策的需求。并且典型地必須迅速采用決策。因此進(jìn)一步限制可用資源的數(shù)量和可以使用這些系統(tǒng)的情況的數(shù)量。

作為經(jīng)驗(yàn)?zāi)P偷氖纠?,?jīng)驗(yàn)規(guī)則生成系統(tǒng)例如delmia這些系統(tǒng)示出了處理這種現(xiàn)象所需要的復(fù)雜度。經(jīng)驗(yàn)規(guī)則生成系統(tǒng)通過大量的變量對(duì)所描述的現(xiàn)象進(jìn)行建模。這些系統(tǒng)通過以下操作起作用:產(chǎn)生許多具有單獨(dú)的低召回和低精度的規(guī)則(并且因此可能相互矛盾),使用投票來解決它們的不同的結(jié)果,并且輸出投票的結(jié)果,該投票結(jié)果被用作描述情況的新的合成變量。這些系統(tǒng)典型地同時(shí)實(shí)現(xiàn)高召回和高精度(各自高于80%),但是這樣做會(huì)產(chǎn)生可能還未由專家創(chuàng)作的不可管理的數(shù)量的規(guī)則(對(duì)于幾十個(gè)變量來說,達(dá)到數(shù)萬到數(shù)百萬的量級(jí))。

在具有許多輸入?yún)?shù)和兩個(gè)決策替代方案的情況下,這樣的系統(tǒng)可以成功地用在“與經(jīng)驗(yàn)?zāi)P徒Y(jié)合的專家規(guī)則”方法中。

然而,這樣的經(jīng)驗(yàn)?zāi)P筒辉试S決策制定者考慮在訓(xùn)練系統(tǒng)和寫入專家規(guī)則時(shí)不存在或未被考慮的數(shù)據(jù)。此外,經(jīng)驗(yàn)?zāi)P涂赡苄枰罅康挠布Y源來訓(xùn)練。實(shí)際上,典型地由新數(shù)據(jù)觸發(fā)對(duì)決策的需求。并且典型地必須快速采用決策。因此進(jìn)一步限制可用資源的數(shù)量和可以使用這些系統(tǒng)的情況的數(shù)量。

第三類別包括可理解的模型、表示以及交互界面,通過以使得可以由決策制定者或其助手對(duì)其進(jìn)行管理的形式表示相關(guān)信息來幫助做出決策。例如,商業(yè)智能工具提供用于選擇變量并可視化其交互的模塊,例如,借助于散點(diǎn)圖。分析人員挑選相關(guān)的可視化結(jié)果、生成靜態(tài)報(bào)告并將其發(fā)送給決策制定者。

所謂的“白盒模型”依賴于給出變量之間關(guān)系的可視化或解釋的經(jīng)驗(yàn)(已訓(xùn)練的)模型。例如,在訓(xùn)練決策樹(例如,如在quinlan,j.ross.″inductionofdecisiontrees.″machinelearning1.1(1986):81-106.[1]中所討論的)、規(guī)則構(gòu)建引擎或貝葉斯網(wǎng)絡(luò)(例如,如在heckerman,david,dangeigeranddavidm.chickering″learningbayesiannetworks:thecombinationofknowledgeandstatisticaldata.″machinelearning20.3(1995):197-243中所討論的)之后,有可能理解以某種概率將目標(biāo)變量鏈接到描述現(xiàn)象的變量之中的若干前提的規(guī)則。

當(dāng)可以以圖表形式來表示輸入數(shù)據(jù)時(shí),存在以這樣的方式將圖表映射到2維繪圖中的技術(shù):2d圖上的兩個(gè)實(shí)體之間的距離表示它們?cè)趫D表中的連接性。這些技術(shù)使得能夠定性地表示對(duì)情況進(jìn)行描述的元素之間的交互的程度。這些技術(shù)還可以應(yīng)用于在2d圖上對(duì)復(fù)雜觀測(cè)進(jìn)行映射,以使得相似的觀測(cè)(在n維中接近,其中維度是描述觀測(cè)的變量)在2圖上最終彼此接近,例如,如在balasubramanian,mukund,andericl.schwartz.″theisomapalgorithmandtopologicalstability.″science295.5552(2002):7-7中所討論的。

在jain,anilk.,m.narasimhamurty,andpatrickj.flynn.″dataclustering:areview.″acmcomputingsurveys(csur)31.3(1999):264-323中討論了聚類技術(shù),并且這樣的聚類技術(shù)允許將在n維中相似的觀測(cè)以可管理數(shù)量的組分組在一起。

在wall,michaele.,andreasrechtsteiner,andluism.rocha.″singularvaluedecompositionandprincipalcomponentanalysis.″apracticalapproachtomicroarraydataanalysis.springerus,2003.91-109中討論了降維技術(shù),并且該降維技術(shù)使得能夠發(fā)現(xiàn)數(shù)據(jù)沿其最大程度變化的維度或維度的組合。

存在其它技術(shù)來發(fā)現(xiàn)什么樣的維度(描述變量)對(duì)給定目標(biāo)變量的值有最高影響。

然而,“白盒模型”遭受若干缺點(diǎn)。值得注意的是,這些系統(tǒng)仍然不提供完全自動(dòng)操作的決策,并且因此允許由于人為錯(cuò)誤(例如,遺漏了重要因素或不準(zhǔn)確地估計(jì)了所考慮的因素的實(shí)際影響)的次優(yōu)決策。

另一個(gè)問題在于該第三類別需要大量的硬件資源來訓(xùn)練。實(shí)際上,典型地由新數(shù)據(jù)觸發(fā)對(duì)決策的需求。并且典型地必須快速采用決策。因此進(jìn)一步限制可用資源的數(shù)量和可以使用這些系統(tǒng)的情況的數(shù)量。

更具體地,當(dāng)直接用于對(duì)涉及復(fù)雜系統(tǒng)的現(xiàn)實(shí)事件進(jìn)行建模時(shí),直接使用經(jīng)驗(yàn)?zāi)P驮馐芤韵滦阅軉栴}。

第一個(gè)性能問題與存儲(chǔ)器占用問題有關(guān)。相關(guān)參數(shù)的數(shù)量典型地大,以描述涉及復(fù)雜系統(tǒng)的情況。因此,使用模型的輸入變量整體地對(duì)情況進(jìn)行描述將導(dǎo)致輸入變量激增,這將使得在事件的過程期間對(duì)模型進(jìn)行訓(xùn)練不現(xiàn)實(shí)。

隨著變量的激增,訓(xùn)練數(shù)據(jù)中所必需的觀測(cè)的數(shù)量也激增。簡(jiǎn)而言之,訓(xùn)練數(shù)據(jù)中的觀測(cè)必須表示為了使所訓(xùn)練的模型正確執(zhí)行而可以實(shí)際出現(xiàn)的變量的所有可能的組合。

大多數(shù)可用的機(jī)器學(xué)習(xí)方法是通過假定訓(xùn)練數(shù)據(jù)適合隨機(jī)存取存儲(chǔ)器而設(shè)計(jì)的。隨機(jī)存取存儲(chǔ)器的可用大小典型地對(duì)可以被考慮用于描述情況的參數(shù)加以限制。

第二個(gè)性能問題是可縮放性的問題。一些精確的機(jī)器學(xué)習(xí)算法無法很好地縮放。例如,使用提升技術(shù)就是這種情況。對(duì)于召回和精度來說,提升技術(shù)當(dāng)前屬于最強(qiáng)大的機(jī)器學(xué)習(xí)技術(shù),但提升技術(shù)在本質(zhì)上是有順序的。這表示它們不能分布在多個(gè)服務(wù)器上。一個(gè)服務(wù)器將忙于運(yùn)行計(jì)算,而其它的服務(wù)器將保持空閑。運(yùn)行順序算法的時(shí)間將不會(huì)隨著服務(wù)器數(shù)量的增加而減少。

當(dāng)在事件的過程期間對(duì)模型進(jìn)行重新訓(xùn)練時(shí),相同的存儲(chǔ)器占用和可縮放性問題適用。

此外,由于時(shí)間有限,所以延遲也成為問題。取決于模型、取決于訓(xùn)練數(shù)據(jù)的大小以及取決于可用的硬件資源,訓(xùn)練模型花費(fèi)幾秒到幾周的時(shí)間。當(dāng)對(duì)涉及復(fù)雜系統(tǒng)的現(xiàn)實(shí)情況進(jìn)行建模時(shí),在大多數(shù)情況下,訓(xùn)練模型必須花費(fèi)至少幾十秒的時(shí)間。因此,在事件的過程期間對(duì)模型進(jìn)行訓(xùn)練的機(jī)會(huì)將很小。

在這樣的背景下,仍然需要一種用于在事件過程中對(duì)模型結(jié)果進(jìn)行檢索的改進(jìn)的方法。



技術(shù)實(shí)現(xiàn)要素:

因此,提供了一種用于在事件過程中對(duì)模型結(jié)果進(jìn)行檢索的計(jì)算機(jī)實(shí)現(xiàn)的方法。該方法包括:

-提供相似事件的觀測(cè)的第一集合的變量;

-提供多個(gè)模型;

-使用觀測(cè)的第一集合的變量對(duì)多個(gè)模型進(jìn)行索引;

-根據(jù)一個(gè)或多個(gè)變量對(duì)模型進(jìn)行查詢;

-作為查詢的結(jié)果,返回模型。

該方法可以包括以下操作中的一個(gè)或多個(gè):

-基于觀測(cè)的第一集合的變量對(duì)多個(gè)模型進(jìn)行訓(xùn)練;使用用于訓(xùn)練每個(gè)模型的變量對(duì)多個(gè)模型進(jìn)行索引;

-訓(xùn)練多個(gè)模型還包括:通過對(duì)觀測(cè)的第一集合的變量應(yīng)用過濾來計(jì)算第一集合的觀測(cè)的子集;關(guān)于第一集合的觀測(cè)的子集中的一個(gè)子集對(duì)多個(gè)模型中的每個(gè)模型進(jìn)行訓(xùn)練;以及使用用于訓(xùn)練所述每個(gè)模型的觀測(cè)的變量的值來對(duì)多個(gè)模型中的每個(gè)模型進(jìn)行索引。

-確定兩個(gè)或更多個(gè)模型被返回;以及對(duì)所返回的兩個(gè)或更多個(gè)模型進(jìn)行排序,排序基于所返回的兩個(gè)或更多個(gè)模型的變量;

-通過基于模型的變量的值與查詢中相應(yīng)的一個(gè)或多個(gè)變量的值之間的接近度度量針對(duì)每個(gè)返回的模型計(jì)算距離,來對(duì)所返回的兩個(gè)或更多個(gè)模型進(jìn)行排序;

-構(gòu)建觀測(cè)的第一集合還包括根據(jù)仿真生成至少一個(gè)觀測(cè)的結(jié)果;

-隨機(jī)生成第一集合的至少一個(gè)觀測(cè);

-收集表示與第一集合的事件相似的事件的觀測(cè)的第二集合,第二集合的觀測(cè)至少包括與第一集合相同的變量;并且其中根據(jù)觀測(cè)的第二集合中的一個(gè)或多個(gè)變量來執(zhí)行對(duì)模型的查詢;

-提供一個(gè)或多個(gè)觀測(cè),所提供的一個(gè)或多個(gè)觀測(cè)的每個(gè)變量設(shè)定有值;針對(duì)一個(gè)或多個(gè)觀測(cè)中的每一個(gè)觀測(cè)計(jì)算結(jié)果,通過對(duì)設(shè)定有所提供的一個(gè)或多個(gè)觀測(cè)的值的變量應(yīng)用所返回的模型來執(zhí)行該計(jì)算;

-提供至少兩個(gè)觀測(cè),并且該方法還包括對(duì)針對(duì)所提供的一個(gè)或多個(gè)觀測(cè)而計(jì)算的結(jié)果進(jìn)行排序;以及選擇與具有最高排序的結(jié)果相關(guān)聯(lián)的所提供的至少兩個(gè)觀測(cè)中的一個(gè)觀測(cè);

-該模型是仿真模型或機(jī)器學(xué)習(xí)模型;

-用于對(duì)模型進(jìn)行查詢的一個(gè)或多個(gè)變量是緩慢移動(dòng)的變量;

-使用隨機(jī)變量生成器來生成觀測(cè)的第一集合的一個(gè)或多個(gè)變量;

-通過選擇在變量的定義范圍內(nèi)的離散值來生成觀測(cè)的第一集合的一個(gè)或多個(gè)變量;

-如果所返回的模型的響應(yīng)是數(shù)值,則通過對(duì)所返回的模型的單獨(dú)響應(yīng)取平均來計(jì)算針對(duì)所提供的一個(gè)或多個(gè)觀測(cè)而計(jì)算的結(jié)果;

-通過取響應(yīng)于所返回的模型最頻繁發(fā)現(xiàn)的值來計(jì)算針對(duì)所提供的一個(gè)或多個(gè)觀測(cè)而計(jì)算的結(jié)果;

-在通過對(duì)觀測(cè)的第一集合的變量應(yīng)用過濾來計(jì)算第一集合的觀測(cè)的子集時(shí),子集的觀測(cè)屬于觀測(cè)的共同聚類;

-所返回的模型具有在模型的元數(shù)據(jù)與在查詢中所指定的值之間的準(zhǔn)確匹配;

-由與第二集合的觀測(cè)的離散變量匹配的離散變量來近似在查詢中輸入的變量的值;

-查詢?cè)试S基于模型的元數(shù)據(jù)與在查詢中所指定的變量的值之間的近似匹配來對(duì)模型進(jìn)行檢索;

-對(duì)多個(gè)模型進(jìn)行索引還包括,針對(duì)多個(gè)模型中的每個(gè)模型,在多個(gè)模型中的所述每個(gè)模型的元數(shù)據(jù)中增加用于訓(xùn)練所述每個(gè)模型的所有觀測(cè)的值;

-對(duì)模型進(jìn)行索引還包括,將用于訓(xùn)練模型的觀測(cè)的函數(shù)(例如,其質(zhì)心的坐標(biāo))增加到要被索引的模型的元數(shù)據(jù)。

還提供了一種計(jì)算機(jī)程序,該計(jì)算機(jī)程序包括用于執(zhí)行以上方法的指令。

還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上記錄有計(jì)算機(jī)程序。

還提供了一種系統(tǒng),該系統(tǒng)包括耦合到存儲(chǔ)器的處理器,該存儲(chǔ)器上記錄有計(jì)算機(jī)程序。

服務(wù)器可以與客戶端計(jì)算機(jī)連接,在客戶端計(jì)算機(jī)上生成關(guān)于索引的查詢。

附圖說明

現(xiàn)在將借助于非限制性示例并參考附圖來描述本發(fā)明的實(shí)施例,其中:

-圖1示出了對(duì)模型進(jìn)行訓(xùn)練的示例的流程圖;

-圖2示出了觀測(cè)的集合的示例;

-圖3示出了計(jì)算機(jī)的示例。

具體實(shí)施方式

參考圖1的流程圖,提出了一種用于在事件過程中對(duì)模型結(jié)果進(jìn)行檢索的計(jì)算機(jī)實(shí)現(xiàn)的方法。該方法包括提供相似事件的觀測(cè)的第一集合的變量。該方法還包括提供多個(gè)模型。該方法還包括使用觀測(cè)的第一集合的變量來對(duì)多個(gè)模型進(jìn)行索引。該方法還包括根據(jù)一個(gè)或多個(gè)變量來對(duì)模型進(jìn)行查詢。所查詢的模型是所提供的模型中的一個(gè)模型。另外,該方法包括作為查詢的結(jié)果而返回模型。

這樣的方法改進(jìn)了在事件過程中對(duì)模型結(jié)果進(jìn)行檢索的方式。實(shí)際上,執(zhí)行預(yù)處理任務(wù)以使得在事件期間剩余計(jì)算易于處理。這通過以下操作來執(zhí)行:將在事件發(fā)生時(shí)的處理時(shí)間和存儲(chǔ)器占用轉(zhuǎn)變?yōu)槭录l(fā)生之前的較長(zhǎng)(但是較便宜且較不重要)的處理時(shí)間、額外的(但是便宜的)存儲(chǔ)需求)、對(duì)存儲(chǔ)器的較低占用。通過存儲(chǔ)預(yù)計(jì)算的分析的結(jié)果并且隨后在事件期間對(duì)它們進(jìn)行查詢來使得該轉(zhuǎn)變成為可能。分析在于使用數(shù)據(jù)對(duì)模型進(jìn)行預(yù)訓(xùn)練,并且結(jié)果是已預(yù)訓(xùn)練的模型。已預(yù)訓(xùn)練的模型與條件相關(guān)聯(lián),其中已預(yù)訓(xùn)練的模型是相關(guān)的(相關(guān)性條件是已預(yù)訓(xùn)練的模型的元數(shù)據(jù))?;谶@些條件的查詢?cè)试S在事件的過程期間檢索適當(dāng)?shù)哪P鸵粤⒓从糜谧龀鲱A(yù)測(cè)。

當(dāng)訓(xùn)練單個(gè)模型時(shí),模型必須適用于該模型將被使用的事件的每個(gè)可能的展開。當(dāng)如本發(fā)明中的情況那樣準(zhǔn)備多個(gè)模型時(shí),每個(gè)模型可以對(duì)應(yīng)于關(guān)于事件展開的具體假設(shè)。這些假設(shè)將典型地轉(zhuǎn)化為描述事件的變量的具體值。這使得能夠減少訓(xùn)練每個(gè)模型所需要的觀測(cè)的數(shù)量。在使用單個(gè)模型的情況下,表示關(guān)于事件的可能展開的所有假設(shè)的所有觀測(cè)都應(yīng)當(dāng)被保留在訓(xùn)練數(shù)據(jù)中。如本發(fā)明中的情況,在準(zhǔn)備了多個(gè)模型的情況下,僅應(yīng)當(dāng)保留對(duì)應(yīng)于與對(duì)應(yīng)于每個(gè)模型的具體假設(shè)相一致的事件的觀測(cè)來對(duì)模型進(jìn)行訓(xùn)練,該具體假設(shè)與每個(gè)模型相對(duì)應(yīng)。這些觀測(cè)共享關(guān)于變量的與描述相應(yīng)假設(shè)的值相同或相似的值。由于訓(xùn)練數(shù)據(jù)基本上對(duì)在訓(xùn)練模型期間的隨機(jī)存取存儲(chǔ)器的占用負(fù)責(zé),因此準(zhǔn)備與具體假設(shè)相對(duì)應(yīng)的多個(gè)模型使得能夠顯著地減少用于訓(xùn)練每個(gè)模型的存儲(chǔ)器占用。因此本發(fā)明解決了存儲(chǔ)器占用問題。

通過上面那樣做,生成用于訓(xùn)練的許多較小的模型,而不是一個(gè)大模型。如果使用順序的(不可并行的)算法來訓(xùn)練選擇模型,則以此方式將其分解使得能夠運(yùn)行利用許多處理器的多個(gè)較小的計(jì)算,而不是運(yùn)行僅占用一個(gè)處理器而使其它處理器空閑的一個(gè)大的計(jì)算。因此本發(fā)明解決了可縮放性問題。大型并行服務(wù)器或集群是如今最常見的超級(jí)計(jì)算基礎(chǔ)架構(gòu)。

基于最可能的(或大多數(shù)游戲改變)假設(shè)來預(yù)訓(xùn)練多個(gè)模型允許在游戲期間使用假設(shè)結(jié)果為真的一個(gè)模型來更新模型。這允許在事件的過程期間基于在游戲期間出現(xiàn)的新數(shù)據(jù)而改變正被使用的模型的行為,并且這不需要對(duì)模型進(jìn)行重新訓(xùn)練,僅通過切換正被使用的模型。因此,本發(fā)明解決了關(guān)聯(lián)到在事件的過程期間對(duì)模型進(jìn)行訓(xùn)練的延遲問題。與通過輸入與新一輪事件相對(duì)應(yīng)的值來改變模型的行為相比,對(duì)模型進(jìn)行切換允許使用特別設(shè)計(jì)以處理新一輪事件的模型,因?yàn)樵撃P褪轻槍?duì)該新一輪事件特別準(zhǔn)備(并訓(xùn)練)的。

這種方法也適用于增量和在線學(xué)習(xí)算法。如果選定了增量或在線學(xué)習(xí)算法,則本發(fā)明允許針對(duì)事件的具體展開而準(zhǔn)備多個(gè)這樣的增量或在線算法。一旦選擇了增量或在線算法,就有可能隨著事件展開而連續(xù)地對(duì)它進(jìn)行訓(xùn)練。甚至有可能在事件的過程期間對(duì)可用于未來選擇的所選擇的、或所有在線的、或增量的算法進(jìn)行連續(xù)地訓(xùn)練,即使它們當(dāng)前未被選擇用于進(jìn)行預(yù)測(cè)。那些稍后被選擇的算法將受益于這種連續(xù)的訓(xùn)練。

該方法是計(jì)算機(jī)實(shí)現(xiàn)的。這表示該方法的步驟(或基本上所有步驟)由至少一個(gè)計(jì)算機(jī)或相似的任何系統(tǒng)來執(zhí)行。因此,該方法的步驟由計(jì)算機(jī)可能完全自動(dòng)地或者半自動(dòng)地執(zhí)行。在示例中,可以通過用戶-計(jì)算機(jī)交互來執(zhí)行該方法的步驟中的至少一些步驟的觸發(fā)。所需要的用戶-計(jì)算機(jī)交互的等級(jí)可以取決于自動(dòng)化預(yù)見的等級(jí),并且與實(shí)現(xiàn)用戶愿望的需求達(dá)到平衡。在示例中,該等級(jí)可以是用戶定義的和/或預(yù)定義的。

該方法的計(jì)算機(jī)實(shí)現(xiàn)的典型示例是使用適于該目的的系統(tǒng)來執(zhí)行該方法。該系統(tǒng)可包括耦合到存儲(chǔ)器的處理器,該存儲(chǔ)器上記錄有計(jì)算機(jī)程序,計(jì)算機(jī)程序包括用于執(zhí)行該方法的指令。存儲(chǔ)器還可以存儲(chǔ)數(shù)據(jù)庫。存儲(chǔ)器是適于這樣的存儲(chǔ)的任何硬件,其可能包括若干物理不同的部分(例如,一部分用于程序,并且可能一部分用于數(shù)據(jù)庫)。該系統(tǒng)可以包括圖形用戶界面。

“數(shù)據(jù)庫”表示被組織以用于搜索和檢索的數(shù)據(jù)(即信息)的任何集合(例如關(guān)系數(shù)據(jù)庫,例如基于預(yù)確定的結(jié)構(gòu)化語言,例如sql)。當(dāng)存儲(chǔ)在存儲(chǔ)器上時(shí),數(shù)據(jù)庫允許由計(jì)算機(jī)進(jìn)行快速搜索和檢索。數(shù)據(jù)庫實(shí)際上被構(gòu)造為結(jié)合各種數(shù)據(jù)處理操作來促進(jìn)對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)、檢索、修改以及刪除。數(shù)據(jù)庫可以由可以被分解為記錄的文件或文件的集合組成,記錄中的每一個(gè)由一個(gè)或多個(gè)字段組成。字段是數(shù)據(jù)存儲(chǔ)的基本單位。用戶可以主要通過查詢來檢索數(shù)據(jù)。使用關(guān)鍵字和排序命令,用戶可以對(duì)許多記錄中的字段進(jìn)行快速搜索、重新排列、分組以及選擇,以根據(jù)正被使用的數(shù)據(jù)庫管理系統(tǒng)的規(guī)則來檢索或創(chuàng)建關(guān)于特定的數(shù)據(jù)集合的報(bào)告。

該方法一般對(duì)觀測(cè)的集合進(jìn)行操作。觀測(cè)是變量的集合,其中每個(gè)變量與值相關(guān)聯(lián)。變量表示系統(tǒng)或系統(tǒng)的一部分的狀態(tài),或者與系統(tǒng)或系統(tǒng)的一部分相關(guān)或?qū)ο到y(tǒng)或系統(tǒng)的一部分有影響的元件的狀態(tài)。例如,汽車的觀測(cè)的變量可以是汽車的溫度、油壓、瞬時(shí)燃料消耗、比賽期間的平均燃料消耗、輪胎的種類、空氣的溫度、天氣(雨、晴、雪)……變量與量化變量的狀態(tài)的值相關(guān)聯(lián)。觀測(cè)表示在給定時(shí)間點(diǎn)時(shí)系統(tǒng)的狀態(tài)。因此,觀測(cè)的集合是在不同時(shí)間點(diǎn)時(shí)變量的值。實(shí)際上,該系統(tǒng)可以屬于各種且無限制的工業(yè)領(lǐng)域,包括:航空航天、建筑、建造、消費(fèi)品、高科技設(shè)備、工業(yè)設(shè)備、運(yùn)輸、海洋和/或海上石油/天然氣生產(chǎn)或運(yùn)輸。因此,該方法所使用的觀測(cè)的集合可以包括與工業(yè)系統(tǒng)有關(guān)的變量,工業(yè)系統(tǒng)可以是任何機(jī)械系統(tǒng),例如,地面交通工具的系統(tǒng)或其一部分(例如,包括汽車和輕型卡車設(shè)備、賽車、摩托車、卡車和汽車設(shè)備、卡車和公共汽車、火車);空中交通工具的系統(tǒng)或其一部分(例如,包括機(jī)身設(shè)備、航空航天設(shè)備、推進(jìn)設(shè)備、國防產(chǎn)品、航空設(shè)備、空間設(shè)備);海軍交通工具的系統(tǒng)或其一部分(例如,包括海軍設(shè)備、商業(yè)船舶、海上設(shè)備、游艇和工作船只、航海設(shè)備);通用機(jī)械系統(tǒng)或機(jī)械系統(tǒng)的一部分(例如,包括工業(yè)制造機(jī)械、重型移動(dòng)機(jī)械或設(shè)備、安裝設(shè)備、工業(yè)設(shè)備產(chǎn)品、金屬制品、輪胎制品);機(jī)電或電子系統(tǒng)或其一部分(例如,包括消費(fèi)電子產(chǎn)品,安全和/或控制和/或儀器產(chǎn)品、計(jì)算和通信設(shè)備、半導(dǎo)體、醫(yī)療裝置和設(shè)備);消費(fèi)品(例如,包括家具、家庭和園藝產(chǎn)品、休閑用品、時(shí)尚產(chǎn)品、耐用品零售商的產(chǎn)品、非耐用品零售商的產(chǎn)品);包裝(例如,包括食品和飲料和煙草、美容和個(gè)人護(hù)理、家用產(chǎn)品包裝)。

圖2示出了觀測(cè)的示例。每行12表示觀測(cè),每列14(為了清楚起見,在圖2中僅用虛線表示出了一列)對(duì)應(yīng)于變量,并且每個(gè)矩形18表示觀測(cè)的變量的值。在該示例中,觀測(cè)的集合存儲(chǔ)在矩陣10上。每個(gè)觀測(cè)用其關(guān)于所謂的“描述變量”,也被稱為“輸入變量”的值來描述(因?yàn)樗鼈冏鳛橐延?xùn)練的模型的輸入被提供以描述觀測(cè))。有趣的是,集合中的每個(gè)觀測(cè)包括與集合中的其它觀測(cè)相同的變量。應(yīng)當(dāng)理解,對(duì)于每個(gè)觀測(cè)來說,一個(gè)或多個(gè)變量可以為空,即不與值相關(guān)聯(lián)。每個(gè)觀測(cè)與關(guān)于所謂“目標(biāo)變量”(也被稱為“輸出變量”)的相應(yīng)值相關(guān)聯(lián)。目標(biāo)變量是已訓(xùn)練的模型必須針對(duì)新的觀測(cè)而進(jìn)行評(píng)估的變量。對(duì)于模型的用戶,目標(biāo)變量在以下含義上來說是有意義的:目標(biāo)變量提供信息,該信息幫助模型的用戶理解和/或預(yù)測(cè)系統(tǒng)的行為和/或?qū)ο到y(tǒng)的行為做出反應(yīng)。在該示例中,目標(biāo)變量也存儲(chǔ)在矩陣16中。應(yīng)當(dāng)理解,每個(gè)觀測(cè)的值和目標(biāo)變量可以存儲(chǔ)在包括矩陣10和16的單個(gè)矩陣中。觀測(cè)和目標(biāo)變量形成(并且被稱為)標(biāo)簽數(shù)據(jù)的集合。應(yīng)當(dāng)理解,每個(gè)目標(biāo)變量都伴隨著所謂目標(biāo)值的值。

圖3示出了系統(tǒng)的示例,其中該系統(tǒng)是客戶端計(jì)算機(jī)系統(tǒng),例如,用戶工作站。

該示例的客戶端計(jì)算機(jī)包括:連接到內(nèi)部通信總線1000的中央處理單元(cpu)1010,同樣連接到總線的隨機(jī)存取存儲(chǔ)器(ram)1070。客戶端計(jì)算機(jī)還設(shè)置有圖形處理單元(gpu)1110,圖形處理單元(gpu)1110與連接到總線的視頻隨機(jī)存取存儲(chǔ)器1100相關(guān)聯(lián)。在本領(lǐng)域中視頻ram1100也被稱為幀緩沖器。大容量存儲(chǔ)設(shè)備控制器1020管理對(duì)大容量存儲(chǔ)設(shè)備(例如,硬盤驅(qū)動(dòng)器1030)的訪問。適合于有形地體現(xiàn)計(jì)算機(jī)程序指令和數(shù)據(jù)的大容量存儲(chǔ)設(shè)備包括所有形式的非易失性存儲(chǔ)器,舉例來說,包括諸如eprom、eeprom以及閃存存儲(chǔ)設(shè)備的半導(dǎo)體存儲(chǔ)設(shè)備;諸如內(nèi)部硬盤和可移動(dòng)磁盤的磁盤;磁光盤;以及cd-rom磁盤1040。前述內(nèi)容中的任一項(xiàng)可以由專門設(shè)計(jì)的asic(專用集成電路)補(bǔ)充或并入其中。網(wǎng)絡(luò)適配器1050管理對(duì)網(wǎng)絡(luò)1060的訪問。客戶端計(jì)算機(jī)還可以包括諸如光標(biāo)控制裝置、鍵盤等的觸覺裝置1090。在客戶端計(jì)算機(jī)中使用光標(biāo)控制裝置以允許用戶選擇性地將光標(biāo)定位在顯示器1080上的任何期望的位置。此外,光標(biāo)控制裝置允許用戶選擇各種命令并輸入控制信號(hào)。光標(biāo)控制裝置包括用于向系統(tǒng)輸入控制信號(hào)的若干信號(hào)生成設(shè)備。典型地,光標(biāo)控制裝置可以是鼠標(biāo),鼠標(biāo)的按鍵用于生成信號(hào)。替代地或另外地,客戶端計(jì)算機(jī)系統(tǒng)可包括靈敏板和/或靈敏屏。

計(jì)算機(jī)程序可以包括可以由計(jì)算機(jī)執(zhí)行的指令,該指令包括用于使得上文中的系統(tǒng)執(zhí)行該方法的模塊??梢詫⒊绦蛴涗浽谌魏螖?shù)據(jù)存儲(chǔ)介質(zhì)上,包括系統(tǒng)的存儲(chǔ)器。例如,可以以數(shù)字電子電路,或者以計(jì)算機(jī)硬件、固件、軟件,或者以它們的組合來實(shí)現(xiàn)程序。程序可被實(shí)現(xiàn)為裝置,例如有形地體現(xiàn)在用于由可編程處理器執(zhí)行的機(jī)器可讀存儲(chǔ)設(shè)備中的產(chǎn)品。方法步驟可以由執(zhí)行指令的程序的可編程處理器來執(zhí)行,以通過對(duì)輸入數(shù)據(jù)進(jìn)行操作并生成輸出來執(zhí)行該方法的功能。因此,處理器是可編程且耦合的,以從數(shù)據(jù)存儲(chǔ)系統(tǒng)的至少一個(gè)輸入設(shè)備接收數(shù)據(jù)和指令,并且向數(shù)據(jù)存儲(chǔ)系統(tǒng)的至少一個(gè)輸出設(shè)備傳送數(shù)據(jù)和指令??梢砸愿呒?jí)過程語言或面向?qū)ο蟮木幊陶Z言來實(shí)現(xiàn)應(yīng)用程序,或者如果期望的話則以匯編語言或機(jī)器語言來實(shí)現(xiàn)應(yīng)用程序。在任何情況下,語言都可以是編譯語言或解釋語言。程序可以是完全安裝程序或更新程序。在任何情況下對(duì)系統(tǒng)應(yīng)用程序都會(huì)產(chǎn)生用于執(zhí)行該方法的指令。

現(xiàn)在參考圖1來討論本發(fā)明的示例。

在步驟s10處,本領(lǐng)域的技術(shù)人員識(shí)別相似事件的觀測(cè)的集合的變量。相似事件表示事件具有共同的特性。實(shí)際上,每個(gè)觀測(cè)與一個(gè)或多個(gè)變量相關(guān)聯(lián)。事件之間的共同特性可以是變量。因此,并且參考圖2,觀測(cè)的集合中的每個(gè)觀測(cè)描述與相同變量相同的事件,只是兩個(gè)觀測(cè)之間的變量可能具有不同的值。

觀測(cè)的集合可以是自然的觀測(cè)的集合(s104)。自然表示已經(jīng)關(guān)于現(xiàn)實(shí)事件對(duì)變量的值進(jìn)行了測(cè)量,現(xiàn)實(shí)事件也就是說在現(xiàn)實(shí)世界中發(fā)生的事件,例如,航天飛機(jī)的發(fā)動(dòng)機(jī)的溫度。因此收集到觀測(cè)和每個(gè)這樣的觀測(cè)的變量。

觀測(cè)的集合可以是合成的觀測(cè)的集合(s102)。合成表示已經(jīng)對(duì)變量的值進(jìn)行了計(jì)算。例如,它們已經(jīng)被生成。存在多個(gè)用于生成合成變量的方法。在下文中我們描述兩種方法。

兩種方法都從識(shí)別觀測(cè)的集合的變量所能取的值的范圍開始。一些變量?jī)H可以取離散值。這樣的變量是離散變量。其它的變量可以取連續(xù)值。這樣的變量是連續(xù)變量。

兩種方法都涉及生成關(guān)于觀測(cè)的每個(gè)變量的值,并對(duì)這些值進(jìn)行組合以形成合成觀測(cè)。例如,如果變量a取值[1,2,3]而變量b取值[1,2],則組合是(1,1)、(1,2)、(2,1)、(2,2)、(3,1)、(3,2)。也就是說|a|*|b|組合。在該示例中,可以創(chuàng)建六個(gè)新的觀測(cè),每個(gè)觀測(cè)都由其關(guān)于變量a和b的值來定義,并與a和b的可能值的六個(gè)組合相對(duì)應(yīng)。

兩種方法都可以涉及針對(duì)每個(gè)觀測(cè)生成目標(biāo)值。目標(biāo)值是關(guān)聯(lián)到觀測(cè)的目標(biāo)變量的值。典型地當(dāng)給定輸入中的觀測(cè)的變量時(shí)由仿真模型來生成目標(biāo)值。目標(biāo)變量是當(dāng)使用與其相應(yīng)的目標(biāo)值相關(guān)聯(lián)的觀測(cè)對(duì)機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練時(shí),機(jī)器學(xué)習(xí)算法所學(xué)習(xí)產(chǎn)生的變量。通過這種學(xué)習(xí)過程(機(jī)器學(xué)習(xí)的現(xiàn)有技術(shù)中所已知的),響應(yīng)于與用來對(duì)該機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練的那些觀測(cè)相似的新的觀測(cè),機(jī)器學(xué)習(xí)算法將學(xué)習(xí)產(chǎn)生與用來對(duì)其進(jìn)行訓(xùn)練的觀測(cè)的目標(biāo)值一致的目標(biāo)值。

這兩種方法的不同之處在于用于生成關(guān)于每個(gè)變量的值的方法。

第一種方法可以在于使用隨機(jī)變量生成器來生成關(guān)于變量的定義的范圍的值,可能在分布范圍內(nèi)服從均勻分布,或者根據(jù)需要服從不同的概率分布(例如,如果本領(lǐng)域的技術(shù)人員希望模型是針對(duì)觀測(cè)特別良好地訓(xùn)練的,該觀測(cè)針對(duì)具體變量取相似于值v的值,則本領(lǐng)域的技術(shù)人員可以決定針對(duì)該變量使用將有利于接近v的值的概率分布,例如以v為中心的正態(tài)分布)。

第二種方法可以在于在其可能值的范圍內(nèi)針對(duì)變量來枚舉可能值,可能在用離散變量對(duì)該變量進(jìn)行了近似之后,也就是說,對(duì)變量取離散值。可以通過使用離散變量的最接近的離散值來近似每個(gè)值來完成該近似。例如,離散值可以被定義為四舍五入到指定精度等級(jí)的值。實(shí)際上,表示物理事件的變量只在有邊界的定義范圍內(nèi)取值:存在下邊界和上邊界。典型地可以通過查看過去的數(shù)據(jù)來找到這些邊界。離散變量將在有邊界的定義范圍內(nèi)取有限數(shù)量的值。這使得有可能枚舉離散近似的所有可能的值,如果這是人本領(lǐng)域的技術(shù)人員想要實(shí)現(xiàn)的。

觀測(cè)的集合可以是自然觀測(cè)和合成觀測(cè)的混合。例如,如果自然觀測(cè)的數(shù)量太少并且因此不足以表示事件,則可以使用合成觀測(cè)來完成觀測(cè)的集合,從而觀測(cè)的集合統(tǒng)計(jì)地表示可能的觀測(cè)的集合(將針對(duì)其使用模型)。

然后,在步驟s20處,基于在步驟s104處所收集的觀測(cè)或在步驟s102處所生成的觀測(cè)來訓(xùn)練多個(gè)模型。

可以針對(duì)觀測(cè)的子集來訓(xùn)練每個(gè)模型。子集可以通過過濾獲得。過濾基于觀測(cè)的變量的值??梢杂貌煌姆椒▉磉x定確定過濾的值。

一種方法可以用于獲得觀測(cè)的一部分,每個(gè)觀測(cè)用于訓(xùn)練一個(gè)且僅一個(gè)模型。在對(duì)模型進(jìn)行檢索的本發(fā)明的稍后的步驟中檢索單個(gè)模型的情況下,該方法可能是相關(guān)的。該方法的特定情況可以是將觀測(cè)分組為聚類,其中觀測(cè)在聚類內(nèi)盡可能彼此接近,并且盡可能遠(yuǎn)離其它聚類的觀測(cè)(關(guān)于任意定義的距離,根據(jù)用戶的需求)。例如,在該方法的背景下現(xiàn)有技術(shù)中已知的聚類技術(shù)可以用于指定用于過濾的值。該方法可以有利于關(guān)于結(jié)果的質(zhì)量使得系統(tǒng)的資源的消耗最小化。

不同的方法可以是使得觀測(cè)的集合重疊以便訓(xùn)練對(duì)于每個(gè)新觀測(cè)來說冗余的模型。在這樣的情況下該方法可能相關(guān):在對(duì)模型進(jìn)行檢索的本發(fā)明的稍后的步驟中檢索多個(gè)模型,并且通過對(duì)由多個(gè)模型所產(chǎn)生的結(jié)果取平均(或在其之間進(jìn)行投票)來計(jì)算新觀測(cè)的結(jié)果。例如,每次過濾可以通過接受其關(guān)于指定變量的值低于或高于變量的中值的觀測(cè)而接受一半的觀測(cè)。關(guān)于系統(tǒng)的資源消耗,該方法可以有利于使得結(jié)果的質(zhì)量最小化。

作為步驟s20的結(jié)果,步驟s102和/或s104中被存儲(chǔ)并表示為矩陣的觀測(cè)的集合已經(jīng)產(chǎn)生若干較小的矩陣。如果所有的觀測(cè)都已經(jīng)被包括,如果所有的觀測(cè)都已經(jīng)用于指定用于對(duì)模型進(jìn)行訓(xùn)練的集合中(這是在兩種過濾方法中所描述的情況),則可能不存在來自原始矩陣的信息的丟失。有趣的是,當(dāng)用于對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練時(shí),該集合的每個(gè)矩陣都具有較小的存儲(chǔ)器占用(因?yàn)樗^小)。此外,可以對(duì)該矩陣的集合并行進(jìn)行隨后的獨(dú)立計(jì)算操作(例如,使用每個(gè)矩陣來對(duì)模型進(jìn)行訓(xùn)練)。

接下來,在步驟s30處,對(duì)多個(gè)模型進(jìn)行索引。以模型的元數(shù)據(jù)的形式來對(duì)用于訓(xùn)練每個(gè)模型的觀測(cè)的變量進(jìn)行索引。這表示模型是能夠基于用于訓(xùn)練模型的觀測(cè)的變量的值來搜索的。在已索引的模型的元數(shù)據(jù)中所列出的值的選擇方面存在多種方法。

一種方法在于在模型的元數(shù)據(jù)中包括用于訓(xùn)練模型的所有觀測(cè)的所有變量的值,從而每個(gè)變量作為索引中的模型的屬性被引用,并且關(guān)于與用于訓(xùn)練模型的觀測(cè)相對(duì)應(yīng)的該變量的每個(gè)值被列在該屬性的值中。這樣的索引結(jié)構(gòu)將典型地允許使用與在查詢中所指定的值相同或相似的值來檢索使用最大數(shù)量的觀測(cè)而訓(xùn)練的模型。由于索引中使用的反向列表結(jié)構(gòu),這種索引所需要的存儲(chǔ)空間將僅隨著觀測(cè)的矩陣的大小而線性增長(zhǎng)。

另一種方法可以用于在每個(gè)模型的元數(shù)據(jù)中增加觀測(cè)的變量,每個(gè)變量與關(guān)于該變量的聚類的質(zhì)心的坐標(biāo)相關(guān)聯(lián),在針對(duì)基于觀測(cè)屬于相同的聚類的事實(shí)而過濾的觀測(cè)對(duì)模型進(jìn)行訓(xùn)練的情況下該方法是特別相關(guān)的。指定若干變量的查詢將導(dǎo)致對(duì)針對(duì)觀測(cè)的聚類而訓(xùn)練的模型進(jìn)行檢索,該觀測(cè)的聚類的質(zhì)心關(guān)于指定的變量具有相同或相似的值。

為了支持基于變量的確切值的搜索,模型的索引包含對(duì)(模型id,模型)的列表和針對(duì)該變量的反向列表。

與變量相對(duì)應(yīng)的反向列表是對(duì)(value,[模型id1,...,模型idn])的列表,其中[模型id1,...,模型idn]是已訓(xùn)練的模型id的列表,已訓(xùn)練的模型id與訓(xùn)練集的特征在于關(guān)于變量的值value的模型相對(duì)應(yīng)(例如,這可以表示取決于方法,其質(zhì)心具有關(guān)于變量的坐標(biāo)值,或者其觀測(cè)中的一個(gè)觀測(cè)具有關(guān)于變量的值value,或者其它)。此結(jié)構(gòu)使得在指定變量的值的查詢時(shí)能夠更快地對(duì)模型進(jìn)行檢索。實(shí)際上,對(duì)反向列表進(jìn)行排序,因此與查看所有模型并檢查其相應(yīng)的相關(guān)聯(lián)的值相比,在已排序的反向列表中找到指定值更快。

為了支持在具有反向列表的索引中搜索相似值,一種方法是在將值增加到反向列表之前對(duì)值進(jìn)行離散化,并搜索在查詢中指定的值的距離內(nèi)的所有離散值。在這種情況下,對(duì)值進(jìn)行離散化表示以小于該距離的精度等級(jí)使用四舍五入后的值對(duì)它們進(jìn)行近似。

步驟s10至s30形成本發(fā)明的構(gòu)建時(shí)間。構(gòu)建時(shí)間也被稱為預(yù)處理任務(wù)。在上文中討論了預(yù)處理任務(wù)。

現(xiàn)在討論步驟s40至s80,并且步驟s40至s80形成本發(fā)明的運(yùn)行時(shí)間。

在步驟s40處,收集與一個(gè)或多個(gè)觀測(cè)的第二集合有關(guān)的數(shù)據(jù)。觀測(cè)的第二集合表示與步驟s10的觀測(cè)中所存儲(chǔ)的事件相似的事件。第二集合的觀測(cè)至少包括與步驟s10的觀測(cè)集合相同的變量。為了進(jìn)行解釋,相似的事件表示事件具有共同的特性。實(shí)際上,所收集的數(shù)據(jù)是相似事件的觀測(cè),每個(gè)觀測(cè)與一個(gè)或多個(gè)變量相關(guān)聯(lián)。事件之間的共同特性可以是變量。因此,觀測(cè)的第二集合中的每個(gè)觀測(cè)都描述與相同變量相似的事件,只是兩個(gè)觀測(cè)之間的變量可能具有不同的值。

以與步驟s10的觀測(cè)的集合相同的方式來執(zhí)行數(shù)據(jù)的收集;然而,僅對(duì)該值進(jìn)行測(cè)量,也就是說,觀測(cè)的第二集合僅包括已經(jīng)關(guān)于現(xiàn)實(shí)事件進(jìn)行了測(cè)量的變量的值。優(yōu)選地將已測(cè)量的變量的已測(cè)量的值實(shí)時(shí)地發(fā)送到執(zhí)行該方法的系統(tǒng)。這可以借助于經(jīng)由任何通訊信道以及訂閱或消息傳遞協(xié)議來訂閱來自數(shù)據(jù)提供方或傳感器的實(shí)時(shí)推送通知來完成。應(yīng)當(dāng)理解,信道典型地取決于數(shù)據(jù)提供方或傳感器所提供的接口。這里,術(shù)語實(shí)時(shí)表示傳送所收集的數(shù)據(jù)的時(shí)間是預(yù)確定的時(shí)間段;傳送所需要的時(shí)間不應(yīng)當(dāng)超過預(yù)確定的時(shí)間段。

觀測(cè)的集合可以包括關(guān)于過去的相似事件的觀測(cè),而觀測(cè)的第二集合包括關(guān)于當(dāng)前相似事件的觀測(cè)。

然后,在步驟s50處,對(duì)被索引的至少一個(gè)已訓(xùn)練的模型進(jìn)行查詢。根據(jù)在步驟s40處收集的一個(gè)或多個(gè)變量來執(zhí)行查詢。

查詢中包括的變量是典型地緩慢移動(dòng)的變量,即在連續(xù)觀測(cè)中值緩慢變化的變量。對(duì)于針對(duì)觀測(cè)模型適用于對(duì)結(jié)果進(jìn)行估計(jì)的所有觀測(cè)來說,模型都應(yīng)當(dāng)是相關(guān)的。如果針對(duì)相似的觀測(cè)對(duì)模型進(jìn)行訓(xùn)練,則該模型是適當(dāng)?shù)摹H绻罱挠^測(cè)關(guān)于一些變量共享相似的值,則選擇針對(duì)關(guān)于相同的變量也共享相似的值的觀測(cè)而訓(xùn)練的模型是個(gè)好主意。例如,如果每10分鐘改變(查詢)正被使用的模型并且每秒收集事件,則已經(jīng)在600個(gè)過去收集的事件上示出相對(duì)穩(wěn)定的值的變量是將被包括在針對(duì)下一個(gè)模型的查詢中的好的候選。

作為查詢的結(jié)果,返回至少一個(gè)已訓(xùn)練的模型。然而,可能多于一個(gè)模型與請(qǐng)求匹配,并且因此可能返回兩個(gè)或更多個(gè)已訓(xùn)練的模型。因此,在步驟s60處,確定是否多于一個(gè)已訓(xùn)練的模型匹配查詢。

在下面將討論的步驟s90處,在僅返回一個(gè)已訓(xùn)練的模型的情況下,已訓(xùn)練的模型用于生成結(jié)果。在返回兩個(gè)或更多個(gè)已訓(xùn)練的模型的情況下,確定如何根據(jù)多個(gè)模型生成結(jié)果。

可以如下執(zhí)行對(duì)要保留的已訓(xùn)練的模型的選擇。,存在至少兩種響應(yīng)于查詢而選擇模型的方法。在第一種方法中,僅選擇一個(gè)模型?;谄湓獢?shù)據(jù)中的變量的值與查詢(典型地,查詢表示當(dāng)前事件)中的相應(yīng)的變量的值之間的接近度度量,所挑選的模型具有最高排序(s70)。

在第二種方法中,選擇多個(gè)模型。在該方法中,也可以基于其元數(shù)據(jù)中的變量的值與查詢(典型地,查詢表示當(dāng)前事件)中的相應(yīng)的變量的值之間的接近度度量來選擇模型。例如,基于上文所描述的接近度測(cè)量選擇n個(gè)最高排序的模型。替代地,例如,選擇與查詢的接近度的測(cè)量低于或高于某一閾值的模型。

然后,在步驟s80處,將一個(gè)或多個(gè)觀測(cè)輸入到選擇的模型中。每個(gè)觀測(cè)包括具有值的至少一個(gè)輸入變量。實(shí)際上,觀測(cè)的輸入變量(一個(gè)或多個(gè))是所收集的觀測(cè)的第二集合的所選擇的變量的觀測(cè)值。

接下來,在步驟s90處,針對(duì)輸入到模型的觀測(cè)對(duì)結(jié)果進(jìn)行計(jì)算。每個(gè)所選擇的模型都返回輸出,也被稱為目標(biāo)值。目標(biāo)值典型地用于對(duì)觀測(cè)進(jìn)行評(píng)定。例如,目標(biāo)值可以是對(duì)給定觀測(cè)的未來事件的預(yù)測(cè),或者是觀測(cè)的分類,以將所輸入的觀測(cè)與其它觀測(cè)區(qū)分開。目標(biāo)值可以是描述觀測(cè)的度量。

如果在步驟s60-s70處僅選擇一個(gè)模型,觀測(cè)的結(jié)果是其輸出響應(yīng)于接收輸入中的觀測(cè)的函數(shù)。典型地,觀測(cè)的結(jié)果是響應(yīng)于接收輸入中的觀測(cè)的模型的輸出。

如果在步驟s60處選擇了多個(gè)模型,觀測(cè)的結(jié)果是模型的輸出響應(yīng)于接收輸入中的觀測(cè)的函數(shù)。例如,如果每個(gè)模型的輸出是一類(如果模型提供觀測(cè)的分類),則結(jié)果可以是在所選擇的模型的輸出中表示最多的類,即結(jié)果是模型投票的結(jié)果??梢酝ㄟ^在步驟s60處所計(jì)算的模型與查詢之間的相似性度量的函數(shù)對(duì)每個(gè)投票進(jìn)行加權(quán),以使得越相關(guān)的模型對(duì)投票貢獻(xiàn)越多。如果每個(gè)模型的輸出是數(shù)值,則結(jié)果可以是所輸出的模型的度量的平均值。相似地,可以通過如步驟s60中所計(jì)算的模型的相應(yīng)的相關(guān)性對(duì)平均值進(jìn)行加權(quán)。

現(xiàn)在討論本發(fā)明的示例,其幫助任務(wù)控制小組和機(jī)上小組在操作用于衛(wèi)星發(fā)射的軌道器期間做出決策。

在這些操作中真實(shí)的是,根據(jù)自動(dòng)操作的程序和計(jì)劃的程序來進(jìn)行大多數(shù)行動(dòng):準(zhǔn)則和已計(jì)劃的事件的集合在飛行數(shù)據(jù)文件中。飛行數(shù)據(jù)文件包括機(jī)組活動(dòng)計(jì)劃、有效載荷手冊(cè)以及在精密的飛行計(jì)劃過程期間合并在一起的其它文件。出于預(yù)見每種類型的問題的目的,提前對(duì)問題的類型進(jìn)行分割并對(duì)行動(dòng)進(jìn)行計(jì)劃。

然而,任務(wù)控制小組和機(jī)上小組仍然需要隨時(shí)做出決策。例如,nasa聲明:在所有中止模式中,在可能時(shí)中止軌道是優(yōu)選模式,并且一個(gè)原因是這樣做會(huì)給予控制器和飛行機(jī)組對(duì)情況進(jìn)行評(píng)定、并決定著陸或如計(jì)劃地繼續(xù)、以及如何解決這個(gè)問題的時(shí)間。然而,這個(gè)時(shí)間是昂貴的,因?yàn)槿蝿?wù)被擱置、資源正被消耗、并且問題可能正在加劇。當(dāng)中止軌道不可能時(shí),決策的速度和質(zhì)量甚至更重要。

可以針對(duì)航天飛機(jī)測(cè)量若干變量:每個(gè)發(fā)動(dòng)機(jī)的發(fā)動(dòng)機(jī)節(jié)流閥、每個(gè)發(fā)動(dòng)機(jī)的燃料等級(jí)、客艙壓力(如果是減壓的問題)、軌道器冷卻系統(tǒng)的狀態(tài)(如果損失一個(gè)的問題)、高度、飛行路徑角度、航向、重量、速度/范圍、運(yùn)載工具表面上的壓力、電氣系統(tǒng)狀態(tài)、當(dāng)前程序(倒計(jì)時(shí)/第一階段/第二階段/返回到發(fā)射區(qū)/跨大西洋中止著陸/重返調(diào)整/中止軌道/應(yīng)急中止/艙外活動(dòng))等等。仍然在該示例中,可操作的變量包括:每個(gè)發(fā)動(dòng)機(jī)系統(tǒng)的發(fā)動(dòng)機(jī)節(jié)流閥、燃料水平(燃料可以被傾倒)、重量(材料可以被傾倒)、操縱的選擇(改變高度、姿態(tài)、飛行角度、航向等)、程序的選擇以及軌道的選擇。

在這種情況下,本發(fā)明可以應(yīng)用于對(duì)事件的估計(jì)結(jié)果進(jìn)行檢索,例如,估計(jì)將衛(wèi)星放置在正確軌道上、當(dāng)返回地球時(shí)無風(fēng)險(xiǎn)地著陸、最小化任務(wù)的總成本(例如,通過最小化對(duì)材料的損壞,并且最小化容易導(dǎo)致機(jī)組成員受傷或傷亡的機(jī)艙內(nèi)部的事故)的機(jī)會(huì)。生成或收集若干觀測(cè),并且使用這些觀測(cè)的子集對(duì)若干機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練并對(duì)其進(jìn)行索引。上面列出的所有變量形成機(jī)器學(xué)習(xí)算法的輸入變量,并且機(jī)器學(xué)習(xí)算法的輸出對(duì)觀測(cè)的結(jié)果進(jìn)行估計(jì)。

索引中的每個(gè)模型對(duì)應(yīng)于完全由上面定義的變量及其值描述的情況。為了根據(jù)索引對(duì)模型進(jìn)行查詢,將這些變量及其值增加到關(guān)聯(lián)到相應(yīng)的模型的元數(shù)據(jù)。例如,使用其元數(shù)據(jù)中的這些屬性對(duì)適用于以下情況的模型進(jìn)行索引:在飛行8分鐘之后冷卻系統(tǒng)的組件發(fā)生故障,此時(shí)高度為60英里并且飛行速度為16697mph。這允許根據(jù)情況查詢正確的模型。再次說明,所索引的模型可以是仿真模型或機(jī)器學(xué)習(xí)模型。關(guān)于通過仿真而評(píng)估的選項(xiàng)對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練并對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行索引而不是對(duì)仿真模型進(jìn)行索引的優(yōu)點(diǎn)在于,與完全仿真相比機(jī)器學(xué)習(xí)模型一般將更快地執(zhí)行(以評(píng)定可能的選項(xiàng))。對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行預(yù)計(jì)算和索引的優(yōu)點(diǎn)在于,不一定必須在行動(dòng)的過程中對(duì)模型進(jìn)行訓(xùn)練(因此節(jié)省了時(shí)間)。

例如,在多個(gè)中止模式是可能的情況下,這可以用于回答諸如“對(duì)于中止軌道模式來說優(yōu)選軌道是哪條?”或者“優(yōu)選的中止模式是哪種?”的問題。

例如,被訓(xùn)練為評(píng)定中止模式的模型將接受指定中止模式(在一個(gè)變量中)和在該中止模式被選擇的背景(在其它變量中)的輸入觀測(cè)。背景使得中止模式相關(guān)或不相關(guān),并且當(dāng)接收輸入中的相應(yīng)的觀測(cè)時(shí),通過模型的結(jié)果來評(píng)定每個(gè)中止模式在其相應(yīng)的背景中的相關(guān)性。響應(yīng)于對(duì)指定當(dāng)前情況(飛行階段、高度、速度等,所有這些變量都在索引的元數(shù)據(jù)中以允許查詢)的索引的自動(dòng)操作的查詢,將選擇產(chǎn)生該結(jié)果的最相關(guān)的模型,并且將關(guān)于表示其共同背景中的中止模式的多個(gè)選擇的觀測(cè)來執(zhí)行,以對(duì)模型的結(jié)果進(jìn)行估計(jì)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1