亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

模式識別的制作方法

文檔序號:6484655閱讀:280來源:國知局
模式識別的制作方法
【專利摘要】一種用于由物理計算系統(tǒng)(100)來執(zhí)行模式識別的方法包括,用物理計算系統(tǒng)(100),構(gòu)造數(shù)據(jù)為二分圖(200),所述圖(200)內(nèi)的一組實例節(jié)點(214)表示所述數(shù)據(jù)內(nèi)的實例以及所述圖(200)內(nèi)的一組屬性節(jié)點(216)表示所述實例的屬性,所述實例節(jié)點(214)和所述屬性節(jié)點(216)之間的邊(218)表示所述屬性的值,用物理計算系統(tǒng)(100),給每個實例節(jié)點(214)和每個屬性節(jié)點(216)分配轉(zhuǎn)移概率函數(shù)(302、402),對所述圖(200)應(yīng)用隨機游走,所述隨機游走利用所述轉(zhuǎn)移概率函數(shù)(302、402)。
【專利說明】模式識別
[0001]相關(guān)申請的交叉引用
本申請要求在2011年2月23日以Michal Aharon等人名義提交的第13/033,443號美國專利申請的優(yōu)先權(quán)。
【背景技術(shù)】
[0002]各種行業(yè)通常在大量有關(guān)現(xiàn)實生活問題的數(shù)據(jù)中尋找模式。例如,學(xué)習(xí)醫(yī)學(xué)的人可能尋找指示患者的兩個物理屬性之間的相關(guān)性的模式。特別地,分析大型集合的患者數(shù)據(jù)可能指示共享某些特性和過去經(jīng)驗的個體面對特定類型疾病或其它不利情況的風(fēng)險。在數(shù)據(jù)中找到這些模式給科學(xué)家提供能夠幫助發(fā)現(xiàn)因果關(guān)系并從而找到治療這類疾病的方法的附加工具。
[0003]諸如要素分析和主成分分析(PCA)之類的各種技術(shù)能夠被用于將一組數(shù)據(jù)內(nèi)的大量的可觀測變量減少為較少數(shù)量的影響可觀測變量的未觀測到變量。觀察這些未觀測到變量有助于在數(shù)據(jù)內(nèi)找到模式。但是,這類技術(shù)僅找到存在于大部分數(shù)據(jù)內(nèi)的模式。在一些情況中,模式可能存在于較小百分比的數(shù)據(jù)內(nèi)。這類模式不會被各種要素分析方法獲得。
【專利附圖】

【附圖說明】
[0004]附圖圖示本文描述的原理的各種實施例,且是說明書的一部分。圖示的實施例僅是示例而不限制權(quán)利要求的范圍。
[0005]圖1是示出根據(jù)本文描述的原理的一個示例的說明性的物理計算系統(tǒng)的示圖。
[0006]圖2是示出根據(jù)本文描述的原理的一個示例的說明性的二分圖的示圖。
[0007]圖3是示出根據(jù)本文描述的原理的一個示例的在二分圖內(nèi)屬性節(jié)點的轉(zhuǎn)移概率函數(shù)的使用的示圖。
[0008]圖4是示出根據(jù)本文描述的原理的一個示例的在二分圖內(nèi)實例節(jié)點的轉(zhuǎn)移概率函數(shù)的使用的示圖。
[0009]圖5A和5B是不出根據(jù)本文描述的原理的一個不例的指不兩個不同屬性之間的相關(guān)性的說明性圖表的示圖。
[0010]圖6是示出根據(jù)本文描述的原理的一個示例的用于模式識別的說明性方法的流程圖。
[0011]貫穿圖表,相同的附圖標記指定類似的但不一定是相同的元素。
【具體實施方式】
[0012]如上面提到的,諸如要素分析和主成分分析(PCA)之類的各種技術(shù)能夠被用于將一組數(shù)據(jù)內(nèi)大量的可觀測變量減少為較少數(shù)量的影響可觀測變量的未觀測到變量。觀察這些未觀測到變量有助于在數(shù)據(jù)內(nèi)找到模式。但是,這類技術(shù)僅找到存在于大部分數(shù)據(jù)內(nèi)的模式。在一些情況中,模式可能存在于較小百分比的數(shù)據(jù)內(nèi)。這類模式不會被各種要素分析方法獲得。[0013]根據(jù)這點和其它問題,本說明書公開了用于大量數(shù)據(jù)中的模式識別的方法和系統(tǒng)。特別地,本文描述的方法將允許系統(tǒng)檢測存在于可用數(shù)據(jù)的較小子集內(nèi)的模式。模式是共享類似屬性的類似值的一組不可忽略的實例。
[0014]根據(jù)某些說明性示例,要針對模式進行搜索的數(shù)據(jù)被構(gòu)造為二分圖。二分圖是一種數(shù)據(jù)結(jié)構(gòu)。數(shù)據(jù)結(jié)構(gòu)是存儲和表示數(shù)據(jù)以使得數(shù)據(jù)能被高效地使用的方式。二分圖數(shù)據(jù)結(jié)構(gòu)包括兩組節(jié)點。第一組中的節(jié)點能夠連接到第二組中的任何數(shù)量的節(jié)點,且反之亦然。節(jié)點之間的連接被稱為邊。
[0015]為了構(gòu)造數(shù)據(jù)以允許針對模式的高效搜索,二分圖數(shù)據(jù)結(jié)構(gòu)內(nèi)的第一組節(jié)點被用于表示數(shù)據(jù)內(nèi)的實例。這些節(jié)點將被稱為實例節(jié)點。數(shù)據(jù)結(jié)構(gòu)內(nèi)的第二組節(jié)點被用于表示那些實例可能表現(xiàn)出的屬性。這些節(jié)點將被稱為屬性節(jié)點。特定實例節(jié)點和特定屬性節(jié)點之間的邊被分配與該特定實例關(guān)聯(lián)的那個屬性的值。例如,如果實例節(jié)點表示參與調(diào)查的人,并且屬性節(jié)點表示在該調(diào)查中的問題,那么實例節(jié)點和屬性節(jié)點之間的邊表示與該實例節(jié)點關(guān)聯(lián)的人對與該屬性節(jié)點關(guān)聯(lián)的問題所給出的答案。
[0016]然后給每個屬性節(jié)點分配轉(zhuǎn)移概率函數(shù)。分配給特定屬性節(jié)點的轉(zhuǎn)移概率函數(shù)是基于與該屬性節(jié)點關(guān)聯(lián)的屬性的性質(zhì)。此外,每個實例節(jié)點被分配基于連接到該實例節(jié)點的屬性節(jié)點而變化的轉(zhuǎn)移概率函數(shù)。
[0017]然后對二分圖應(yīng)用隨機游走。隨機游走被設(shè)計成從實例節(jié)點跳到屬性節(jié)點,并然后從該屬性節(jié)點回到實例節(jié)點。此過程持續(xù)特定的時間段。隨機游走選擇穿過的邊將根據(jù)計算的轉(zhuǎn)移概率函數(shù)而被隨機地選擇。轉(zhuǎn)移概率函數(shù)將使隨機游走比起其它邊更可能會穿過某些邊。通過考慮更頻繁地被穿過的邊,數(shù)據(jù)中的模式能夠被揭示。
[0018]在以下描述中,為了解釋的目的,闡述了許多具體細節(jié)以便提供本系統(tǒng)和方法的透徹理解。但是對于本領(lǐng)域的技術(shù)人員將是顯而易見的是,本裝置、系統(tǒng)和方法可以在沒有這些具體細節(jié)的情況下而被實現(xiàn)。說明書中提到的“實施例”、“示例”或類似的語言意思是,與實施例或示例有關(guān)地描述的特定特征、結(jié)構(gòu)、或特性被包括在至少那一個實施例中,但在其它實施例中不是必需的。在說明書中短語“在一個實施例中”或在各種地方中的類似短語的各種實例不一定都指的是相同的實施例。
[0019]現(xiàn)在參考附圖,圖1是示出可用于模式識別的說明性的物理計算系統(tǒng)(100)的示圖。根據(jù)某些說明性示例,物理計算系統(tǒng)(100)包括使模式識別軟件(104)和數(shù)據(jù)(106)存儲在其上的存儲器(102 )。物理計算系統(tǒng)(100 )也包括處理器(108 )和用戶接口( 110 )。
[0020]存在許多類型的可用存儲器。諸如固態(tài)驅(qū)動器的一些類型的存儲器被設(shè)計用于存儲。這些類型的存儲器通常具有大存儲容量但是相對慢的性能。諸如那些用于隨機存取存儲器(RAM)的其它類型的存儲器關(guān)于速度被最優(yōu)化而通常被稱為“工作存儲器”。各種形式的存儲器可以以軟件(104)和數(shù)據(jù)(106)的形式存儲信息。
[0021]物理計算系統(tǒng)(100)也包括用于運行軟件(104)和使用或更新存儲在存儲器(102)中的數(shù)據(jù)(106)的處理器(108)。軟件(104)可以包括操作系統(tǒng)。操作系統(tǒng)允許其它應(yīng)用與移動計算系統(tǒng)的硬件合適地交互。其它應(yīng)用可以包括模式識別應(yīng)用。
[0022]用戶接口(110)可以給用戶(112)提供與物理計算系統(tǒng)(100)交互的手段。用戶接口可包括用于與人類用戶(112 )交互的任何設(shè)備的集合。例如,用戶接口( 110 )可以包括諸如鍵盤或鼠標之類的輸入設(shè)備和諸如監(jiān)視器之類的輸出設(shè)備。[0023]圖2是示出說明性二分圖(200)的示圖。如上面提到的,數(shù)據(jù)能被構(gòu)造為二分圖(200)。貫穿本說明書且在附加的權(quán)利要求中,術(shù)語“二分圖”指的是數(shù)據(jù)結(jié)構(gòu)而不是視覺顯示。圖(200)內(nèi)的第一組節(jié)點會將被稱為實例節(jié)點(214)。圖內(nèi)的第二組節(jié)點將被稱為屬性節(jié)點(216)。邊(218)存在于實例節(jié)點(214)和屬性節(jié)點(216)之間。這些邊(218)能夠被分配值。
[0024]二分圖(200)內(nèi)的每個實例節(jié)點(202)表示數(shù)據(jù)內(nèi)的一個實例。例如,在數(shù)據(jù)表示由若干人參與的調(diào)查的結(jié)果的情況中,每個實例節(jié)點將表示該調(diào)查的一個參與者。
[0025]二分圖(200)內(nèi)的每個屬性節(jié)點(216)表示能夠與實例關(guān)聯(lián)的特定屬性。例如,在上面提到的數(shù)據(jù)表示來自由若干人參與的調(diào)查的結(jié)果的示例中,每個屬性節(jié)點可表示在該調(diào)查中問的一個問題。
[0026]二分圖(200)內(nèi)的邊(218)被用于指示與特定實例關(guān)聯(lián)的每個屬性的值。在一些情況中,數(shù)據(jù)可能不是完整的,因此每個實例節(jié)點(202)可能不一定具有連接到每個屬性節(jié)點(216)的邊(218)。根據(jù)邊所連接到的實例節(jié)點和屬性節(jié)點,邊被分配值。例如,實例I(202-1)和年齡屬性節(jié)點(204)之間的邊(218)被分配值32。這指示與實例I (202-1)關(guān)聯(lián)的人是32歲。同樣地,連接在實例2 (202-2)和年齡屬性節(jié)點(204)之間的邊(218)被分配值47。這指示與實例2 (202-2)關(guān)聯(lián)的人是47歲。而且,邊的值可以包括多于一個值。例如,邊可以表示成對的值。該對中的一個值能夠表示調(diào)查參與者所給出的答案而另一個值能夠表示該參與者給出該答案所花費的時間。
[0027]其它屬性節(jié)點(216)表示各種其它屬性。特別地,是/否問題屬性節(jié)點(206)可表示人對是或否問題的回答。等級屬性節(jié)點(208)可以表示人對要求人把特定經(jīng)驗分為一到五級的問題的回答?;ㄙM屬性節(jié)點(210)可以表示人對關(guān)于在特定日子他或她花費多少錢的問題的回答。區(qū)域?qū)傩怨?jié)點(212)可以指示人居住的地理區(qū)域。本文描述的模式識別原理將在這些各種屬性之中找到模式。
[0028]在圖2中和剩下的圖中示出的二分圖(200)是簡單的示例。表示一組實際數(shù)據(jù)的實際的二分圖通常會大得多。因此,本文描述的模式識別原理將能在大量復(fù)雜數(shù)據(jù)中檢測模式。
[0029]由屬性節(jié)點(216)所表示的各種屬性可以用不同的方式來測量。例如,一些屬性可以包含人可能屬于的一大組離散值。例如,如果年齡用年和月來測量,則存在相對大的一組離散值來表示該年齡。相反地,一些屬性能夠在相對小的一組離散值中被測量。例如,是/否問題屬性節(jié)點(206)可以表示諸如對簡單的是或否問題的回答之類的能夠用兩個離散值之一來回答的問題。在一些情況中,邊的值本質(zhì)上可以是連續(xù)的。若連接到那條邊的屬性是能夠呈現(xiàn)連續(xù)值的屬性,則會是這種情況。
[0030]圖3是示出在二分圖內(nèi)屬性節(jié)點的轉(zhuǎn)移概率函數(shù)的使用的示圖。如上面提到的,隨機游走被應(yīng)用到二分圖。隨機游走將從實例節(jié)點跳到屬性節(jié)點且反之亦然。但是它不會從實例節(jié)點跳到另一個實例節(jié)點。而且它不會從屬性節(jié)點跳到另一個屬性節(jié)點。當隨機游走處于特定的屬性節(jié)點上時,它會沿著從該屬性節(jié)點連接到實例節(jié)點(202)之一的邊的其中之一隨機地跳躍。但是對于連接到該屬性節(jié)點的每條邊來說,它將沿著特定邊跳躍的概率不一定是相同的。分配給該節(jié)點的轉(zhuǎn)移概率函數(shù)將確定隨機游走將沿著連接到該屬性節(jié)點的每條邊(218)跳躍的概率。[0031]概率函數(shù)被用于定義在一個集合內(nèi)元素的隨機選擇將選擇特定元素的概率。例如,如果一個集合包含五個要被隨機地選擇的元素,那么概率函數(shù)將描述那五個元素中的每個將被選擇的概率。特定元素將被選擇的概率通常被分配在O和I之間的值。分配給該集合內(nèi)的每個元素的概率相加將共計為I。例如,如果集合內(nèi)的五個元素中的每個具有相等的被選擇機會,那么概率函數(shù)會定義每個元素為具有0.2的概率,每個元素的總和為I。但是概率函數(shù)不必必須給每個元素分配相等的被選擇概率。
[0032]分配給特定屬性節(jié)點的轉(zhuǎn)移概率函數(shù)把每條連接到該屬性節(jié)點的邊看作集合內(nèi)的元素。每條邊根據(jù)轉(zhuǎn)移概率函數(shù)被給予概率。分配給每個元素的概率是基于隨機游走所來自的邊的值。轉(zhuǎn)移概率函數(shù)將使得隨機游走更可能會選擇具有與到達邊的值類似的值的邊。
[0033]例如,如果隨機游走從實例節(jié)點I (202-1)跳到年齡屬性節(jié)點(204),那么分配給年齡屬性節(jié)點(204)的轉(zhuǎn)移概率函數(shù)(302)將確定隨機游走將沿著連接到年齡屬性節(jié)點(204)的每條邊(218)跳躍的概率。隨機游走將沿著連接到實例2 (202-2)的邊、或連接到實例3 (202-3)的邊、或連接到實例4 (202-4)的邊之一跳躍。因為隨機游走從有值32的邊到達年齡屬性節(jié)點(204),它更可能將在有更接近32的值的邊(218)上離開年齡屬性節(jié)點(204)。因此,最可能被穿過的邊(218)是連接到實例4 (202-4)的邊。這是因為數(shù)字28比數(shù)字47或數(shù)字13更接近數(shù)字32。然而,隨機游走仍然可能會跳到實例2 (202-2)或?qū)嵗? (202-3),但是隨機游走不太可能會這樣做。
[0034]每個屬性節(jié)點(216)可被分配唯一的轉(zhuǎn)移概率函數(shù)。分配給特定屬性節(jié)點的轉(zhuǎn)移概率函數(shù)依賴于該屬性節(jié)點的性質(zhì)。例如,由于關(guān)于數(shù)據(jù)中的年齡屬性的值的范圍,連續(xù)轉(zhuǎn)移概率函數(shù)(302-1)可能更適合于年齡屬性節(jié)點(204)。但是,在其它情況中,屬性可能僅呈現(xiàn)小離散范圍的值。例如,等級屬性節(jié)點(206)可以表示要求調(diào)查中的參與者基于特定經(jīng)驗是多令人愉快的而把該經(jīng)驗從一到五分級的問題。因為連接到等級屬性節(jié)點(208)的邊(218)將僅呈現(xiàn)小范圍的值,離散轉(zhuǎn)移概率函數(shù)(302-2)可能更適合于等級屬性節(jié)點(208)。但是,連續(xù)轉(zhuǎn)移概率函數(shù)也可以被使用。
[0035]使用離散轉(zhuǎn)移概率函數(shù),當隨機游走在等級屬性節(jié)點(208)上時,隨機游走將最可能跳到通過與它來自的邊具有類似的值的邊而連接的實例節(jié)點。例如,如果隨機游走從實例節(jié)點2 (202-2)沿著有值4的邊到達,比起連接到實例4 (202-4)的邊,它更可能將在連接到實例3 (202-3)的邊上離開等級屬性節(jié)點(208)。這是因為值5比值2更接近值4。
[0036]在一些情況中,關(guān)于特定屬性的值的離散集合可能不具有數(shù)值次序。例如,如果屬性是人的行業(yè),那么回答的可能集合不會是數(shù)值有序的。在這種情況中,回答可能根據(jù)行業(yè)的類型被分組。然后轉(zhuǎn)移概率函數(shù)可能使下述情況更可能,即隨機游走將跳到有相同組中的行業(yè)的邊。
[0037]圖4是示出在二分圖內(nèi)實例節(jié)點的轉(zhuǎn)移概率函數(shù)的使用的示圖。根據(jù)某些說明性示例,當隨機游走到達實例節(jié)點時,與該實例節(jié)點關(guān)聯(lián)的實例轉(zhuǎn)移概率函數(shù)(402)確定隨機游走將穿過哪條邊(218)以到達連接到該實例節(jié)點(202)的屬性節(jié)點(216)之一。為了使隨機游走在數(shù)據(jù)中找到模式,與每個實例節(jié)點關(guān)聯(lián)的實例轉(zhuǎn)移概率函數(shù)被配置成使下述情況更可能,即隨機游走將跳到與它所來自的屬性節(jié)點相關(guān)的屬性節(jié)點。這是通過確定在特定值處一個屬性與另一個屬性的相關(guān)性如何來完成的。用于確定一個屬性與另一個的相關(guān)性如何的機制在下文與圖5A和5B關(guān)聯(lián)的文字中將被更詳細地描述。
[0038]例如,如果隨機游走從年齡屬性節(jié)點(204)到達實例節(jié)點3 (202-3),那么與實例節(jié)點3 (202-3)關(guān)聯(lián)的實例概率函數(shù)(402)將使下述情況更可能,即隨機游走將跳到與在13歲的年齡屬性的相關(guān)性良好的屬性。在這個示例中,模式識別系統(tǒng)可能預(yù)先已確定在13歲附近的年齡范圍存在與花費屬性(210)的相關(guān)性。這可能是因為通常13歲每天不花費許多錢,因此13歲左右的許多人每天會花費類似數(shù)量的錢。對于其他年齡范圍,可能不是這種情況。因此,實例概率函數(shù)將使得,當隨機游走從連接到實例3 (202-3)的屬性節(jié)點中選擇時,比起與年齡屬性節(jié)點(204)相關(guān)性不好的另一個節(jié)點,它將更可能跳到花費屬性節(jié)點(210)。對于隨機游走來說將仍然可能跳到相關(guān)性不好的屬性節(jié)點。但是它不太可能會這樣做。
[0039]圖5A和5B是示出指示兩個不同屬性之間的相關(guān)性的說明性圖表的示圖。根據(jù)某些說明性示例,在應(yīng)用隨機游走函數(shù)之前模式識別系統(tǒng)可以確定每個屬性與其它屬性的相關(guān)性如何。圖5A圖示相關(guān)性不好的兩個屬性之間的比較??商娲兀瑘D5B圖示示出在特定范圍的值的相關(guān)性的兩個屬性之間的比較。沿著每幅圖(500、510)的橫軸的每一組條表示數(shù)據(jù)內(nèi)的實例(504)。每幅圖(500、510)的垂直長度指示特定屬性的值。白條表示第一屬性,而陰影條表示第二屬性。
[0040]為了確定兩個屬性的相關(guān)性如何,模式識別系統(tǒng)基于連接到該屬性節(jié)點的每條邊來排序第一屬性。邊表示共享該屬性的每個實例的值。邊可以基于邊的值以各種方式被排序。在此例中,邊被從最小值到最大值排序。圖5A中的圖(500)示出10個不同實例。這些實例被不出基于由白條(506)表不的第一屬性的它們的值來排序。然后模式識別系統(tǒng)能考慮由陰影條(508)表示的每個實例的第二屬性的值。在圖5A中,可以看到在由陰影條(508)表示的第二屬性的值中不存在模式。第二屬性的值是隨機的。因此,在這兩個屬性之間幾乎不存在相關(guān)性。
[0041]圖5B圖不兩個不同屬性之間的比較。再一次,實例(504)被基于由白條(506)表示的第一屬性的值而排序。這里在實例的特定范圍(512)存在第二屬性的值的穩(wěn)定性。因此模式識別系統(tǒng)能夠確定在發(fā)現(xiàn)穩(wěn)定性的實例范圍(512)的值范圍處這兩個屬性之間存在相關(guān)性。此相關(guān)性能夠被用于確定隨機游走將相對于一個屬性選擇跳到另一個屬性有多大可能。
[0042]在一些情況中,在隨機游走函數(shù)被應(yīng)用之前整個二分圖中的每個屬性之間的相關(guān)性能夠被預(yù)先確定。在隨機游走函數(shù)被應(yīng)用之前關(guān)于實例節(jié)點和屬性節(jié)點這二者的轉(zhuǎn)移概率函數(shù)也能夠被確定。在一些情況中,轉(zhuǎn)移概率函數(shù)能夠用轉(zhuǎn)移矩陣表示。轉(zhuǎn)移矩陣通常用在隨機系統(tǒng)建模中以確定不同結(jié)果之間的概率。在一些示例中,模式能夠通過考慮隨機系統(tǒng)的平穩(wěn)向量而找到。平穩(wěn)向量能夠通過轉(zhuǎn)移概率矩陣上的各種數(shù)學(xué)計算的應(yīng)用來確定。這些計算在本領(lǐng)域中是已知的,因此在這里不會給出它們的詳細描述。
[0043]圖6是示出用于模式識別的說明性方法的流程圖。根據(jù)某些說明性示例,該方法包括,用物理計算系統(tǒng),構(gòu)造(塊602)數(shù)據(jù)為二分圖,該圖內(nèi)的一組實例節(jié)點表示數(shù)據(jù)內(nèi)的實例以及圖內(nèi)的一組屬性節(jié)點表示實例的屬性,實例節(jié)點和屬性節(jié)點之間的邊表示屬性的值,給每個實例節(jié)點和每個屬性節(jié)點分配(塊604)轉(zhuǎn)移概率函數(shù),和對該圖應(yīng)用(塊606)隨機游走,所述隨機游走利用轉(zhuǎn)移概率函數(shù)。[0044]總之,通過使用與本文描述的模式識別有關(guān)的方法和系統(tǒng),存在于不可忽視的數(shù)量的實例中的模式可以被揭示。這能夠允許研究與數(shù)據(jù)有關(guān)的主題的人找到以前未知的模式和關(guān)系。這些模式和關(guān)系能夠引導(dǎo)進一步的新因果關(guān)系的研究和發(fā)現(xiàn)。
[0045]之前的描述被提出僅用以說明和描述所描述原理的實施例和示例。此描述不意為窮盡的或限制這些原理為公開的任何確切形式。根據(jù)以上教導(dǎo),許多修改和變形是可能的。
【權(quán)利要求】
1.一種用于由物理計算系統(tǒng)(100)來執(zhí)行模式識別的方法,該方法包括:用所述物理計算系統(tǒng)(100),構(gòu)造數(shù)據(jù)為二分圖(200),所述圖(200)內(nèi)的一組實例節(jié)點(214)表示所述數(shù)據(jù)內(nèi)的實例以及所述圖(200)內(nèi)的一組屬性節(jié)點(216)表示所述實例的屬性,所述實例節(jié)點(214)和所述屬性節(jié)點(216)之間的邊(218)表示所述屬性的值;用所述物理計算系統(tǒng)(100),給每個所述實例節(jié)點(214)和每個所述屬性節(jié)點(216)分配轉(zhuǎn)移概率函數(shù)(302、402);以及用所述物理計算系統(tǒng)(100),對所述圖(200)應(yīng)用隨機游走,所述隨機游走利用所述轉(zhuǎn)移概率函數(shù)(302、402)。
2.權(quán)利要求1的方法,進一步包括,用所述物理計算系統(tǒng)(100),通過確定所述邊(218)中的哪條更頻繁地被所述隨機游走穿過,來確定所述數(shù)據(jù)中的模式。
3.權(quán)利要求1的方法,其中被分配給所述組的屬性節(jié)點(216)內(nèi)的屬性節(jié)點的轉(zhuǎn)移概率函數(shù)(302、402)包括以下之一:基于與該屬性節(jié)點關(guān)聯(lián)的屬性的連續(xù)轉(zhuǎn)移概率函數(shù)和基于與該屬性節(jié)點關(guān)聯(lián)的屬性的離散轉(zhuǎn)移概率函數(shù)。
4.權(quán)利要求3的方法,其中被分配給所述屬性節(jié)點的所述傳遞概率函數(shù)(302、402)使得所述隨機游走更可能在值方面更接近的邊(218)之間轉(zhuǎn)移。
5.權(quán)利要求1的方法,其中被分配給所述組的實例節(jié)點(214)內(nèi)的特定實例節(jié)點的轉(zhuǎn)移概率函數(shù)(302、402)包括被配置成使所述隨機游走在連接到相關(guān)屬性的邊(218)之間轉(zhuǎn)移的轉(zhuǎn)移概率函數(shù)。
6.權(quán)利要求5的方法,其中所述相關(guān)屬性在連接到所述特定實例節(jié)點的到達邊(218)的值處相關(guān)。
7.權(quán)利要求5的方法,其 中通過以下動作來確定兩個屬性的相關(guān)性如何:按照值對連接到第一屬性的每條邊(218)進行排序;基于連接到所述第一屬性的所述邊(218)的所述排序,對連接到第二屬性的每條邊(218)進行排序;和確定在連接到所述第二屬性的所述邊(218)內(nèi)的任何范圍是否存在值的穩(wěn)定性。
8.一種物理計算系統(tǒng)(100),包括:處理器(108);和通信地耦合到所述處理器(108)的存儲器(102);其中所述處理器(108)被配置成:構(gòu)造數(shù)據(jù)(106)為二分圖(200),所述圖(200)內(nèi)的一組實例節(jié)點(214)表示所述數(shù)據(jù)(106)內(nèi)的實例以及所述圖(200)內(nèi)的一組屬性節(jié)點(216)表示所述實例的屬性,所述實例節(jié)點(214)和所述屬性節(jié)點(216)之間的邊(218)表示所述屬性的值;給每個所述實例節(jié)點(214)和每個所述屬性節(jié)點(216)分配轉(zhuǎn)移概率函數(shù)(302、402);以及對所述圖(200)應(yīng)用隨機游走,所述隨機游走利用所述轉(zhuǎn)移概率函數(shù)(302、402)。
9.權(quán)利要求8的系統(tǒng),其中所述處理器(108)被進一步配置成通過確定所述邊(218)中的哪條更頻繁地被所述隨機游走穿過,來確定所述數(shù)據(jù)(106)中的模式。
10.權(quán)利要求8的系統(tǒng),其中被分配給所述組的屬性節(jié)點(216)內(nèi)的屬性節(jié)點的轉(zhuǎn)移概率函數(shù)(302、402)包括以下之一:基于與該屬性節(jié)點關(guān)聯(lián)的屬性的連續(xù)轉(zhuǎn)移概率函數(shù)和基于與該屬性節(jié)點關(guān)聯(lián)的屬性的離散轉(zhuǎn)移概率函數(shù)。
11.權(quán)利要求8的系統(tǒng),其中被分配給所述屬性節(jié)點的所述轉(zhuǎn)移概率函數(shù)(302、402)使得所述隨機游走更可能在值方面更接近的邊(218)之間轉(zhuǎn)移。
12.權(quán)利要求8的系統(tǒng),其中被分配給所述組的實例節(jié)點(302、402)內(nèi)的特定實例節(jié)點的轉(zhuǎn)移概率函數(shù)(302、402)包括被配置成使所述隨機游走在連接到相關(guān)屬性的邊(218)之間轉(zhuǎn)移的轉(zhuǎn)移概率函數(shù)。
13.權(quán)利要求12的系統(tǒng),其中所述相關(guān)屬性在連接到所述特定實例節(jié)點的到達邊(218)的值處相關(guān)。
14.權(quán)利要求12的系統(tǒng),其中為了確定兩個屬性的相關(guān)性如何,所述處理器被進一步配置成: 按照值來對連接到第一屬性的每條邊(218)進行排序; 基于連接到所述第一屬性的所述邊(218)的所述排序,對連接到第二屬性的每條邊(218)進行排序;和 確定在連接到所述第二屬性的所述邊(218)內(nèi)的任何范圍是否存在值的穩(wěn)定性。
15.一種用于模式識別的計算機程序產(chǎn)品,所述計算機程序產(chǎn)品包括: 體現(xiàn)有計算機可讀代碼的計算機可讀存儲介質(zhì)(102),所述計算機可讀程序代碼包括: 被配置成構(gòu)造數(shù)據(jù)(106)為二分圖(200)的計算機可讀程序代碼,所述圖(200)內(nèi)的一組實例節(jié)點(214)表示所述數(shù)據(jù)(106)內(nèi)的實例以及所述圖(200)內(nèi)的一組屬性節(jié)點(216)表示所述實例的屬性,所述實例節(jié)點(214)和所述屬性節(jié)點(216)之間的邊(218)表示所述屬性的值; 被配置成給每個所述實例節(jié)點(214)和每個所述屬性節(jié)點(216)分配轉(zhuǎn)移概率函數(shù)(302,402)的計算機可讀程序代碼;和 被配置成對所述圖(200)應(yīng)用隨機游走的計算機可讀程序代碼,所述隨機游走利用所述轉(zhuǎn)移概率函數(shù)(302、402)。
【文檔編號】G06F19/00GK103477339SQ201180070347
【公開日】2013年12月25日 申請日期:2011年3月1日 優(yōu)先權(quán)日:2011年2月23日
【發(fā)明者】M.亞哈倫, I.科亨, R.伯格曼, D.謝克德 申請人:惠普發(fā)展公司,有限責(zé)任合伙企業(yè)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1