專(zhuān)利名稱(chēng):模式分類(lèi)方法
技術(shù)領(lǐng)域:
本發(fā)明通常涉及模式分類(lèi)的方法和實(shí)現(xiàn)該方法的系統(tǒng)。
背景技術(shù):
模式分類(lèi)在很多現(xiàn)實(shí)應(yīng)用中是眾所周知的,例如,語(yǔ)音識(shí)別、車(chē)輛座位乘員分類(lèi)、數(shù)據(jù)挖掘、風(fēng)險(xiǎn)預(yù)測(cè)、診斷分類(lèi)等。模式分類(lèi)器的首要目標(biāo)是將測(cè)試模式指定到預(yù)定義的類(lèi)別組中的一個(gè)或多個(gè)類(lèi)別??梢詫⒃摐y(cè)試模式認(rèn)為是特征矢量,或者更準(zhǔn)確地,可以將該測(cè)試模式認(rèn)為是量化這些特征的數(shù)字。對(duì)于給定的輸入模式,統(tǒng)計(jì)分類(lèi)器計(jì)算不同類(lèi)別的條件概率(以下也將其稱(chēng)為“類(lèi)別成員概率”)。這些類(lèi)別成員概率與1的偏差通常被解釋為錯(cuò)誤分類(lèi)的風(fēng)險(xiǎn)。
模式分類(lèi)中的挑戰(zhàn)是減少誤分類(lèi)。作為解決這一問(wèn)題的第一方案,已知的是提供具有“拒絕”選項(xiàng)的分類(lèi)器。對(duì)于給定的輸入模式,只要沒(méi)有一個(gè)不同類(lèi)別的條件概率超過(guò)所需的最小閾值,分類(lèi)器就可以使用該拒絕選項(xiàng)。另外,分類(lèi)器將輸入模式指定到具有最高條件概率的類(lèi)別。因此,接近于由分類(lèi)器隱含定義的決策邊界(decision boarder)的測(cè)試模式傾向于被拒絕,而遠(yuǎn)離該邊界的測(cè)試模式將被指定到類(lèi)別。對(duì)于該技術(shù)的詳細(xì)描述,感興趣的讀者可參考1970年1月,第一期,IT-16冊(cè),IEEE信息理論學(xué)報(bào),作者為C.K.Chow,標(biāo)題為“On Optimum Recognition Error and RejectTradeoff(識(shí)別錯(cuò)誤和拒絕之間的最優(yōu)折中)”的文章。
誤分類(lèi)問(wèn)題的另一方面是類(lèi)別成員概率的不確定性的估計(jì)。通常,在訓(xùn)練過(guò)程期間,通過(guò)訓(xùn)練模式對(duì)分類(lèi)器進(jìn)行訓(xùn)練。優(yōu)選地根據(jù)分類(lèi)器應(yīng)該能夠區(qū)分的不同類(lèi)型(類(lèi)別)的情形來(lái)選擇這些訓(xùn)練模式。將要被分類(lèi)的測(cè)試模式的類(lèi)別成員概率以訓(xùn)練過(guò)程中使用的訓(xùn)練模式為基礎(chǔ)。理想地,應(yīng)該準(zhǔn)備用于可能發(fā)生的所有類(lèi)型的情形的分類(lèi)器。在現(xiàn)實(shí)應(yīng)用中,這通常是不可能實(shí)現(xiàn)的,例如,由于“不可預(yù)料的”情形和有限的資源。因此,特征空間,即由所有可能模式跨越的空間,無(wú)法類(lèi)似地與訓(xùn)練模式相對(duì)應(yīng)。直觀地,如果測(cè)試模式周?chē)挠?xùn)練模式的密度很高,則對(duì)給定的測(cè)試模式做出響應(yīng),由該分類(lèi)器輸出的類(lèi)別成員概率的不確定性將很小。同樣地,如果該測(cè)試模式周?chē)挠?xùn)練模式的密度很低,則不確定性將很高。在美國(guó)專(zhuān)利5,335,291(Kramer等人)中詳細(xì)解釋了該方案背后的思想,該專(zhuān)利描述了神經(jīng)網(wǎng)絡(luò),為了驗(yàn)證分類(lèi)是否可靠,該神經(jīng)網(wǎng)絡(luò)考慮在將要被分類(lèi)的測(cè)試模式附近的訓(xùn)練數(shù)據(jù)的局部數(shù)量。神經(jīng)網(wǎng)絡(luò)輸出的有益部分被表示為置信區(qū)間。
由于分類(lèi)器允許將測(cè)試模式標(biāo)記為“未知”和/或在類(lèi)別成員概率的不確定性太高時(shí)使用拒絕選項(xiàng),因此在例如車(chē)輛座位乘員分類(lèi)、診斷分類(lèi)等安全性重要的情況中,提供類(lèi)別成員概率的確定性(或不確定性)的分類(lèi)器是很有吸引力的。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種以改進(jìn)方式計(jì)算類(lèi)別成員概率的模式分類(lèi)方法。
通過(guò)如權(quán)利要求1所述的方法實(shí)現(xiàn)該目的。
為了將測(cè)試模式指定到從預(yù)定義的類(lèi)別組中所選擇的類(lèi)別,已知的是計(jì)算對(duì)于該測(cè)試模式的類(lèi)別成員概率,并且基于在特征空間中測(cè)試模式的相鄰位置上訓(xùn)練模式的數(shù)量而計(jì)算對(duì)于類(lèi)別成員概率的置信區(qū)間。根據(jù)本發(fā)明的重要方面,通過(guò)計(jì)算訓(xùn)練模式的密度函數(shù)與集中于測(cè)試模式的高斯平滑函數(shù)的卷積,而得到在測(cè)試模式的相鄰位置中訓(xùn)練模式的數(shù)量,其中訓(xùn)練模式的密度函數(shù)表示為高斯函數(shù)的混合(疊加)。在該方法中非常感興趣的是相鄰位置中訓(xùn)練模式的數(shù)量并不是通過(guò)對(duì)位于距所述測(cè)試模式一定距離內(nèi)的訓(xùn)練模式進(jìn)行實(shí)際計(jì)數(shù)而得到。事實(shí)上,這將需要龐大的計(jì)算能力,此外,這將預(yù)示著要將訓(xùn)練模式全部存儲(chǔ)在存儲(chǔ)器中。為了實(shí)現(xiàn)本方法,將定義訓(xùn)練模式的密度函數(shù)與高斯平滑函數(shù)的卷積的參數(shù)保存在存儲(chǔ)器中。基于訓(xùn)練模式的數(shù)量,這些參數(shù)可能僅需要對(duì)于存儲(chǔ)相應(yīng)的訓(xùn)練模式組所必需的存儲(chǔ)器空間的一小部分。
此外,本領(lǐng)域技術(shù)人員將很容易理解,可通過(guò)采用以下解析等式計(jì)算平滑函數(shù)的卷積和高斯函數(shù)的混合 (等式1) 其中x表示測(cè)試模式,NN(x)表示在x的相鄰位置中訓(xùn)練模式的數(shù)量,K是整數(shù),μk是特征空間中的矢量,S′k是矩陣并且N′k是實(shí)數(shù)。
具體地,K可以表示在混合中高斯函數(shù)的數(shù)量,μk是第k階高斯函數(shù)的中心,S′k是矩陣并且N′k是實(shí)數(shù),S′k和N′k依賴(lài)于平滑函數(shù)和第k階高斯函數(shù)。由于這個(gè)等式僅依賴(lài)于在訓(xùn)練過(guò)程期間可以離線(xiàn)計(jì)算的參數(shù)μk,S′k(或等效地,S′k-1)和N′k(k=1,....,K),因此本方法的實(shí)現(xiàn)僅需要知道這些參數(shù)以計(jì)算在該測(cè)試模式附近訓(xùn)練模式的數(shù)量。因此,通過(guò)對(duì)上述等式(1)的估計(jì)能夠簡(jiǎn)單地計(jì)算在測(cè)試模式的相鄰位置中訓(xùn)練模式的數(shù)量。
如果假設(shè)訓(xùn)練數(shù)據(jù)的密度函數(shù)可以按照如下方式表示為高斯函數(shù)的混合,則上述等式(1)可被更好地理解 (等式2) 其中K表示混合中高斯函數(shù)的數(shù)量,x′是特征空間中的變量,ρ(x′)是在x′處的訓(xùn)練模式的密度,μk是第k階高斯函數(shù)的中心,Sk是描述第k階高斯函數(shù)的寬度的矩陣,d是特征空間的尺寸并且其中Nk表示歸一化因數(shù),用來(lái)進(jìn)行如下計(jì)算 (等式3) 其中,Ntot是特征空間中訓(xùn)練模式的總數(shù)量。優(yōu)選地使用例如期望最大化算法而離線(xiàn)計(jì)算參數(shù)μk,Sk(和Sk-1)和Nk。后者在作者為M.Figueiredo等的“Unsupervised learning of finite mixture models(有限混合模式的無(wú)監(jiān)督知識(shí))”(2002年3月,第3期,24冊(cè),1-16頁(yè),IEEE模式分析和機(jī)器智能學(xué)報(bào))中進(jìn)行了解釋。
為了計(jì)算在測(cè)試模式的相鄰位置中訓(xùn)練模式的數(shù)量,通常計(jì)算訓(xùn)練模式密度函數(shù)在該相鄰位置上的積分 (等式4) 其中,通過(guò)以x為中心r為半徑的空間S(x,r)給出了該相鄰位置。發(fā)明人已經(jīng)提出由密度函數(shù)ρ(x′)與集中于該測(cè)試模式的高斯平滑函數(shù)(也被稱(chēng)為“核(kernel)”)的卷積來(lái)代替密度ρ(x′)在相鄰位置S(x,r)上的的積分 NN(x)=∫ρ(x′)g(x′,x,r)dx′,(等式5) 其中,在整個(gè)特征空間上進(jìn)行該積分。
該平滑函數(shù)可以表示為 (等式6) 其中,x表示測(cè)試模式,x′表示特征空間中的變量,d表示特征空間的尺寸,C表示定義特征空間上的度量(metric)的對(duì)稱(chēng)矩陣(例如,訓(xùn)練模式的協(xié)方差矩陣),并且r表示該相鄰位置相對(duì)于該度量的半徑。采用如在等式(2)中定義的ρ(x′)和如在等式(6)中定義的g(x′,x,r),可以將等式(5)寫(xiě)成與等式(1)相同,其中下述符號(hào)表示為 在計(jì)算了測(cè)試模式的相鄰位置中訓(xùn)練模式的數(shù)量NN之后,可以基于以下等式計(jì)算置信區(qū)間 (等式7) 其中pe表示對(duì)于測(cè)試模式的類(lèi)別成員概率(或該類(lèi)別成員概率的估計(jì)值)(通過(guò)對(duì)用于測(cè)試模式的類(lèi)別成員概率函數(shù)的估計(jì)而得到),P+表示置信區(qū)間的上限而P-表示置信區(qū)間的下限,并且λ表示預(yù)定義的置信水平。可以根據(jù)應(yīng)用來(lái)設(shè)置該置信水平。在本發(fā)明中,術(shù)語(yǔ)“置信區(qū)間”不應(yīng)該被解釋為局限于區(qū)間〔P-,P+〕;而其也應(yīng)該被解釋為包括區(qū)間〔0,P+〕和〔P-,1〕。因此,將所提供的P-和P+中的至少一個(gè)看作是本發(fā)明意義上的置信區(qū)間。
該相鄰位置的半徑選擇得越大,在該相鄰位置訓(xùn)練模式的數(shù)量也就越多。因此,隨著相鄰位置半徑的增加,置信區(qū)間在收縮。換句話(huà)說(shuō),等式(7)暗含地假設(shè)所估計(jì)的類(lèi)別成員概率pe接近于該相鄰位置上類(lèi)別成員概率的平均值。這適用于將該相鄰位置的半徑選擇得足夠小,以使得在測(cè)試模式的相鄰位置中類(lèi)別成員概率的變化也很小的情況。因此,對(duì)于選擇相鄰位置的半徑的可能規(guī)則是將其定義為至少大致是不同類(lèi)別的訓(xùn)練模式的幾何中心之間最小距離的一半。也可以將該相鄰位置的半徑選擇為不同類(lèi)別的最小半徑。因此,將相對(duì)于通過(guò)矩陣C給出的度量來(lái)計(jì)算有關(guān)的半徑和距離。例如,可以將適配到某一類(lèi)別的訓(xùn)練模式的密度的高斯寬度作為該類(lèi)別的半徑。
根據(jù)本發(fā)明的優(yōu)選實(shí)施例,計(jì)算對(duì)于該測(cè)試模式的多個(gè)類(lèi)別成員概率并且計(jì)算對(duì)于該類(lèi)別成員概率中最高的一個(gè)的置信區(qū)間。只有當(dāng)該置信區(qū)間的下限超出預(yù)定義的閾值時(shí),才可以隨后將該測(cè)試模式指向到其類(lèi)別成員概率最高的類(lèi)別。在相反的情況中,可以將該測(cè)試模式分類(lèi)為未知或?qū)⒃摐y(cè)試模式指定到其它類(lèi)別。在測(cè)試模式序列的例子中(例如,在作為乘員分類(lèi)系統(tǒng)中),如果基于類(lèi)別成員概率的給定測(cè)試模式的分類(lèi)被認(rèn)為不可靠,則可以將該模式指定到與最后的前述測(cè)試模式相同的類(lèi)別。
上述方法也可以用于對(duì)測(cè)試模式序列的測(cè)試模式進(jìn)行分類(lèi)。在這種情況下,該序列的每一個(gè)測(cè)試模式都被指定到從預(yù)定義的類(lèi)別組中選擇的類(lèi)別,并且將各自模式已經(jīng)被指定的該類(lèi)別返回作為初始分類(lèi)。對(duì)于每一個(gè)測(cè)試模式,接著基于類(lèi)別成員概率的置信區(qū)間或基于所考慮的測(cè)試模式的相鄰位置中訓(xùn)練模式的數(shù)量而確定與各個(gè)初始分類(lèi)相關(guān)聯(lián)的品質(zhì)因數(shù)。采用該品質(zhì)因數(shù)以過(guò)濾掉那些不滿(mǎn)足與該品質(zhì)因數(shù)相關(guān)的特定標(biāo)準(zhǔn)的初始分類(lèi)。例如,該品質(zhì)因數(shù)可以是置信區(qū)間寬度倒數(shù)的對(duì)數(shù),或者是訓(xùn)練模式的數(shù)量,在最易懂的實(shí)施例中將其與閾值進(jìn)行比較??蛇x擇地,也可根據(jù)其它合適的規(guī)則來(lái)推導(dǎo)該品質(zhì)因數(shù)。例如,可以通過(guò)Kalman濾波技術(shù)進(jìn)行濾波,其中可采用該品質(zhì)因數(shù)來(lái)加權(quán)不同的初始分類(lèi)。
根據(jù)本發(fā)明的最優(yōu)選實(shí)施例,本發(fā)明在車(chē)輛座位乘員分類(lèi)系統(tǒng)中實(shí)現(xiàn),并且本方法包括提供與乘員相關(guān)的傳感器數(shù)據(jù)并且使用該傳感器數(shù)據(jù)作為要被指定到特定乘員類(lèi)別的測(cè)試模式。
參考附圖并根據(jù)下面對(duì)一些非限制性實(shí)施例的詳細(xì)描述,本發(fā)明的進(jìn)一步細(xì)節(jié)和優(yōu)點(diǎn)將變得清楚,其中 圖1示出了具有表示屬于兩個(gè)不同類(lèi)別的訓(xùn)練模式的數(shù)據(jù)點(diǎn)的兩個(gè)云圖的2D特征空間的示意圖; 圖2示出了通過(guò)決策載體將圖1的特征空間分割為兩個(gè)區(qū)域的劃分; 圖3示出了類(lèi)別成員概率的置信區(qū)間的下邊界的輪廓線(xiàn); 圖4示出了根據(jù)本發(fā)明的方法的優(yōu)選實(shí)施例的流程圖;以及 圖5示出了測(cè)試模式序列分類(lèi)的示意圖。
具體實(shí)施例方式 圖1示出了具有表示屬于兩個(gè)不同類(lèi)別的訓(xùn)練模式的數(shù)據(jù)點(diǎn)14的兩個(gè)云圖10,12的二維特征空間的示例。在所示的例子中,可以將特征空間的模式明顯地表示為以相應(yīng)數(shù)據(jù)點(diǎn)14的坐標(biāo)作為陣列元素的陣列。例如,可以通過(guò)對(duì)其分類(lèi)已知的情形設(shè)置一個(gè)或多個(gè)傳感器來(lái)實(shí)現(xiàn)訓(xùn)練模式的收集,該傳感器的輸出將被指定到不同的類(lèi)別。在當(dāng)前例子中,所收集的模式的表示產(chǎn)生與第一分類(lèi)和第二分類(lèi)相對(duì)應(yīng)的兩個(gè)云圖10,12。
一旦已經(jīng)收集了訓(xùn)練模式,在該特征空間上生成類(lèi)別成員概率函數(shù)。這可以通過(guò)文獻(xiàn)中清楚記載的各種方法實(shí)現(xiàn)。圖2示出了通過(guò)使用圖1所示的數(shù)據(jù)并且根據(jù)下述方法進(jìn)行訓(xùn)練的第二階判別函數(shù)而進(jìn)行的特征空間的分隔,該方法在John Wiley和Sons,紐約(1990)并且作者為J.Schürmann的文章“Pattern ClassificationStatistical and Neural Network basedApproaches(模式分類(lèi)基于統(tǒng)計(jì)和神經(jīng)網(wǎng)絡(luò)的方案”)中有所描述。輪廓線(xiàn)16顯示了類(lèi)別成員概率函數(shù)從云圖10,12向決策邊界18的減小,正如Chow在以上參考的論文中所提到的。在決策邊界18本身處,對(duì)于任何一個(gè)類(lèi)別,概率都為0.5。類(lèi)別成員概率函數(shù)沒(méi)有對(duì)特征空間中存在沒(méi)有選擇訓(xùn)練數(shù)據(jù)的區(qū)域的事實(shí)進(jìn)行說(shuō)明。例如,假設(shè)在坐標(biāo)分別為(0.6,0.6)和(0.2,0.6)的點(diǎn)P1和P2處具有兩個(gè)測(cè)試模式。這些測(cè)試模式具有大致相同的類(lèi)別成員概率。P1位于屬于普通類(lèi)別的訓(xùn)練模式的云圖12中,而P2基本位于訓(xùn)練模式的任一云圖之外。因此,直觀上很清楚P2的類(lèi)別成員概率的不確定性高于P1的類(lèi)別成員概率的不確定性。
因此,本方法建議基于在將要被分類(lèi)的測(cè)試模式附近的訓(xùn)練模式的數(shù)量而計(jì)算給定測(cè)試模式的類(lèi)別成員概率的置信區(qū)間。為所謂的柏努利(Bernoulli)處理很好地建立對(duì)于估計(jì)概率的置信區(qū)間的概念,該柏努利處理在統(tǒng)計(jì)上遵循二項(xiàng)式分布。該二項(xiàng)式分布給出了準(zhǔn)確地獲得N個(gè)Bernoulli試驗(yàn)的n個(gè)成功的離散概率分布P(n|N)(其中每一個(gè)Bernoulli試驗(yàn)的結(jié)果為真的概率是p,而該結(jié)果為假的概率是q=1-p)。該二項(xiàng)式分布由下式給出 該二項(xiàng)式分布的均值是μn=Np,并且方差是σ2=Npq。在N>>1/(p(1-p))的限制條件下,該二項(xiàng)式分布接近于高斯分布。從N次采樣中提取的概率p的估計(jì)值p估計(jì)=n/N的方差為 對(duì)于p的估計(jì)值pe,置信區(qū)間的寬度由下式給出 其中,λ由已經(jīng)選擇的置信水平確定。由所謂的erf函數(shù)(erf-function)給出λ與置信水平之間的關(guān)系,通常采用查找表進(jìn)行估計(jì) 例如,可在網(wǎng)址http://mathworld.wolfram.com/ConfidenceInterval.html上找到關(guān)于置信區(qū)間的更多細(xì)節(jié)。
現(xiàn)在在統(tǒng)計(jì)分類(lèi)器的例子中使用等式(10)p表示實(shí)際的類(lèi)別成員概率,并且N表示在測(cè)試點(diǎn)的相鄰位置中的采樣數(shù)量(標(biāo)記為NN)。
為了得到置信區(qū)間(1)的邊界p-和p+,需要解算以下等式 其中,pe是類(lèi)別成員概率的估計(jì)值,即,在測(cè)試模式處估計(jì)的類(lèi)別成員概率函數(shù)的值。結(jié)果為等式(7) 其中, 圖3示出了估計(jì)的類(lèi)別成員概率的置信區(qū)間的下限(p-)的輪廓線(xiàn)20。在該例子中,訓(xùn)練模式的密度已經(jīng)通過(guò)兩個(gè)高斯函數(shù)近似表示,每一個(gè)高斯函數(shù)對(duì)應(yīng)于每一個(gè)云團(tuán)10,12。在具有高訓(xùn)練模式密度的區(qū)域(例如P1附近)中,置信區(qū)間的尺寸很小,從而最終的下限p-約等于估計(jì)的后驗(yàn)概率pe本身。在具有較低訓(xùn)練模式密度的區(qū)域中,例如P2附近,置信區(qū)間的寬度增加,并且置信區(qū)間的下限趨近于0。在圖3中,位于外部輪廓線(xiàn)20.1外側(cè)的區(qū)域?qū)?yīng)于低于0.1的置信區(qū)間的下限。對(duì)于被指定到類(lèi)別的測(cè)試模式,如果要求置信水平的下限至少為0.1,則可以將這些區(qū)域中的測(cè)試模式檢測(cè)為“未知”并且拒絕這些測(cè)試模式,以避免錯(cuò)誤分類(lèi)。
圖4示出了用于模式分類(lèi)的方法的優(yōu)選實(shí)施例的流程圖。該方法包括優(yōu)選為離線(xiàn)執(zhí)行的一定數(shù)量的步驟以及在已經(jīng)確定將要被分類(lèi)的測(cè)試模式之后在線(xiàn)執(zhí)行的一定數(shù)量的步驟。
在流程圖的左側(cè)中表示離線(xiàn)步驟。這些步驟基本上包括訓(xùn)練分類(lèi)器、設(shè)置參數(shù)以及將在線(xiàn)步驟所需的那些數(shù)據(jù)存儲(chǔ)到存儲(chǔ)器中。作為示例,假設(shè)以一個(gè)或多個(gè)傳感器的傳感器輸出的形式提供將要被分類(lèi)的測(cè)試模式。為了收集訓(xùn)練模式(步驟42),可以將該一個(gè)或多個(gè)傳感器設(shè)置在分類(lèi)系統(tǒng)的操作期間期望遇到的情形中,并且收集該傳感器輸出??蛇x擇地或額外地,也可以根據(jù)傳感器輸出的仿真而獲得訓(xùn)練模式。
在已經(jīng)記錄訓(xùn)練模式之后,計(jì)算類(lèi)別成員函數(shù)(步驟44)。稍后,這些類(lèi)別成員函數(shù)將測(cè)試模式作為輸入,并輸出屬于不同類(lèi)別的該測(cè)試模式的估計(jì)概率。另外,使用訓(xùn)練模式以生成用于計(jì)算訓(xùn)練模式密度與高斯平滑函數(shù)的卷積的函數(shù)(步驟46,47和48)。在步驟46中,采用高斯混合模型近似訓(xùn)練模式的密度,該高斯混合模型即有限數(shù)量高斯函數(shù)的疊加。在步驟47中,固定用于確定測(cè)試模式的相鄰位置和可以離線(xiàn)設(shè)置或計(jì)算的那些參數(shù),例如相鄰位置的寬度和/或形狀??梢允褂玫仁?2)表示卷積,并且存儲(chǔ)用于確定該等式的參數(shù)以使其在要計(jì)算測(cè)試模式的相鄰位置中訓(xùn)練模式的數(shù)量時(shí)可用(步驟48)??梢岳斫獾氖窃跍y(cè)試模式的分類(lèi)期間,無(wú)需重復(fù)高斯混合模型(步驟46)和類(lèi)別成員函數(shù)(步驟44)的耗時(shí)的計(jì)算。為了完整而應(yīng)該說(shuō)明的是,類(lèi)別成員函數(shù)的計(jì)算48也可以基于訓(xùn)練模式密度的高斯混合模型。
本方法的實(shí)施例的在線(xiàn)步驟包括首先從一個(gè)或多個(gè)傳感器獲取50測(cè)試模式。從存儲(chǔ)器中獲取類(lèi)別成員函數(shù),并且計(jì)算測(cè)試模式的不同類(lèi)別成員概率(步驟52)。在步驟54中,從存儲(chǔ)器中獲取定義等式(2)并且因而定義將要計(jì)算的卷積的參數(shù),并且確定測(cè)試模式的相鄰位置中訓(xùn)練數(shù)據(jù)的數(shù)量。
根據(jù)置信水平(在離線(xiàn)步驟49中設(shè)置),計(jì)算對(duì)于在52中發(fā)現(xiàn)的最高類(lèi)別成員概率的置信區(qū)間(步驟56)。在步驟58中,輸出測(cè)試模式已經(jīng)被指定到的類(lèi)別。在類(lèi)別成員概率的不確定性被認(rèn)為太高而不能命名分類(lèi)的情況中,輸出可以是“未知”。
圖5示出了本方法如何對(duì)與現(xiàn)實(shí)場(chǎng)景60、62、64、66相對(duì)應(yīng)的測(cè)試模式序列的測(cè)試模式進(jìn)行分類(lèi)。為了說(shuō)明,假設(shè)已經(jīng)訓(xùn)練了該分類(lèi)系統(tǒng),使其根據(jù)對(duì)象(類(lèi)別2)來(lái)識(shí)別面部(本示例中的類(lèi)別1),從而將從相片中提取的特征用作輸入。表示面部的特征可以包括嘴、眼睛、耳朵等。沿著時(shí)間軸68的場(chǎng)景60,62,64,66的描繪略圖表示在吹口香糖氣泡的小孩。對(duì)于每一個(gè)測(cè)試模式,計(jì)算類(lèi)別成員概率,并且將具有最高概率的類(lèi)別返回作為初始分類(lèi)。對(duì)于每一個(gè)測(cè)試模式,基于類(lèi)別成員概率的置信區(qū)間或基于在所考慮的測(cè)試模式的相鄰位置中的訓(xùn)練模式的數(shù)量,確定與各自初始分類(lèi)相關(guān)聯(lián)的品質(zhì)因數(shù)Q。例如,品質(zhì)因數(shù)接近100%表示初始分類(lèi)的不確定性低,并且該分類(lèi)應(yīng)該用作輸出69。如果系統(tǒng)在訓(xùn)練期間遇到不期望出現(xiàn)的情景(如情景64),則初始分類(lèi)可能是錯(cuò)誤的。但在相同的時(shí)間內(nèi),低品質(zhì)因數(shù)表示初始分類(lèi)是不可靠的。因此,在存在未知情景64時(shí),系統(tǒng)不認(rèn)為初步分類(lèi)是有效的并且將其丟棄(如附圖標(biāo)記70所示)。在該例子中,系統(tǒng)采用最終有效分類(lèi)作為輸出,在該例子中是情景62的分類(lèi)。
權(quán)利要求
1、一種用于將測(cè)試模式指定到從預(yù)定義的類(lèi)別組中選擇的類(lèi)別的方法,包括
計(jì)算對(duì)于所述測(cè)試模式的類(lèi)別成員概率;
基于特征空間中所述測(cè)試模式的相鄰位置中訓(xùn)練模式的數(shù)量而計(jì)算對(duì)于所述類(lèi)別成員概率的置信區(qū)間;
其特征在于,通過(guò)計(jì)算所述訓(xùn)練模式的密度函數(shù)與集中于所述測(cè)試模式的高斯平滑函數(shù)的卷積而獲得所述測(cè)試模式的所述相鄰位置中所述訓(xùn)練模式的數(shù)量,所述訓(xùn)練模式的所述密度函數(shù)被表示為高斯函數(shù)的混合。
2、如權(quán)利要求1所述的方法,其中,通過(guò)以下函數(shù)計(jì)算所述訓(xùn)練模式的所述密度函數(shù)與所述第一平滑函數(shù)的所述卷積
其中,x表示所述測(cè)試模式,NN(x)表示在x的相鄰位置中所述訓(xùn)練模式的數(shù)量,K表示所述混合中高斯函數(shù)的數(shù)量,μk表示第k階高斯函數(shù)的中心,S′k表示矩陣并且N′k表示實(shí)數(shù),S′k和N′k依賴(lài)于所述平滑函數(shù)和所述第k階高斯函數(shù)。
3、如權(quán)利要求2所述的方法,其中,所述訓(xùn)練模式的所述密度函數(shù)可表示為
其中,K表示所述混合中所述高斯函數(shù)的數(shù)量,x′表示所述特征空間中的變量,ρ(x′)表示在x′處所述訓(xùn)練模式的密度,μk表示所述第k階高斯函數(shù)的中心,Sk表示描述所述第k階高斯函數(shù)的寬度的矩陣,d表示所述特征空間的尺寸,并且其中Nk表示歸一化因數(shù),該歸一化因數(shù)用于進(jìn)行以下計(jì)算
其中,Ntot是所述特征空間中所述訓(xùn)練模式的總數(shù)量。
4、如權(quán)利要求3所述的方法,其中,所述平滑函數(shù)可表示為
其中,x表示所述測(cè)試模式,x′表示所述特征空間中的變量,d表示所述特征空間的尺寸,C表示在所述特征空間上定義度量的對(duì)稱(chēng)矩陣,r表示所述相鄰位置相對(duì)于所述度量的半徑。
5、如權(quán)利要求4所述的方法,其中,所述N′k通過(guò)下述等式給出
并且其中S′k通過(guò)下述等式給出
其中Tk通過(guò)下述等式定義
6、如權(quán)利要求4或5所述的方法,其中,C是所有訓(xùn)練模式的協(xié)方差矩陣。
7、如權(quán)利要求1-6中的任意一項(xiàng)所述的方法,其中,基于以下等式計(jì)算所述置信區(qū)間
其中,NN表示所述測(cè)試模式的所述相鄰位置中所述訓(xùn)練模式的數(shù)量,pe表示對(duì)于所述測(cè)試模式的所述類(lèi)別成員概率,P+表示所述置信區(qū)間的上限,P.表示所述置信區(qū)間的下限,并且λ表示預(yù)定義的置信水平。
8、如前述權(quán)利要求的任意一項(xiàng)所述的方法,其中,計(jì)算對(duì)于所述測(cè)試模式的多個(gè)類(lèi)別成員概率,其中對(duì)于所述類(lèi)別成員概率中最高的一個(gè)計(jì)算所述置信區(qū)間;并且其中只有在所述置信區(qū)間的下限超出預(yù)定義的閾值時(shí),才將所述測(cè)試模式指定到其類(lèi)別成員概率最高的類(lèi)別。
9、如權(quán)利要求8所述的方法,其中,如果所述置信區(qū)間的下限沒(méi)有超出預(yù)定義的閾值,則將所述測(cè)試模式分類(lèi)為未知。
10、一種用于將測(cè)試模式指定到從預(yù)定義的類(lèi)別組中選擇的類(lèi)別的方法,包括
計(jì)算對(duì)于所述測(cè)試模式的類(lèi)別成員概率;
基于特征空間中所述測(cè)試模式的相鄰位置中訓(xùn)練模式的數(shù)量而計(jì)算對(duì)于所述類(lèi)別成員概率的置信區(qū)間;
其特征在于,根據(jù)以下等式獲得所述測(cè)試模式的所述相鄰位置中所述訓(xùn)練模式的數(shù)量
其中,x表示所述測(cè)試模式,NN(x)表示在x的相鄰位置中所述訓(xùn)練模式的數(shù)量,K表示整數(shù),μk表示所述特征空間中的矢量,S′k表示矩陣并且N′k表示實(shí)數(shù)。
11、一種用于對(duì)測(cè)試模式序列的測(cè)試模式進(jìn)行分類(lèi)的方法,包括
按照前述權(quán)利要求的任意一項(xiàng)所述的方法,將所述序列的每一個(gè)測(cè)試模式指定到從預(yù)定義的類(lèi)別組中選擇的類(lèi)別,并且將其中所述各自模式已經(jīng)被指定到的類(lèi)別返回作為初始分類(lèi);
基于所述置信區(qū)間或基于所述各自測(cè)試模式的相鄰位置中所述訓(xùn)練模式的數(shù)量,對(duì)于所述序列的每一個(gè)測(cè)試模式,確定與所述初始分類(lèi)相關(guān)聯(lián)的品質(zhì)因數(shù);
基于所述相關(guān)聯(lián)的品質(zhì)因數(shù)而過(guò)濾出初始分類(lèi)。
12、一種用于對(duì)車(chē)輛座位乘員進(jìn)行分類(lèi)的方法,包括
提供與所述乘員相關(guān)的傳感器數(shù)據(jù),
按照前述權(quán)利要求的任意一項(xiàng)所述的方法而使用所述傳感器數(shù)據(jù)作為測(cè)試模式。
全文摘要
用于將測(cè)試模式指定到從預(yù)定義的類(lèi)別組中選擇的類(lèi)別,計(jì)算對(duì)于所述測(cè)試模式的類(lèi)別成員概率,并且基于特征空間中所述測(cè)試模式的相鄰位置中訓(xùn)練模式的數(shù)量來(lái)計(jì)算對(duì)于所述類(lèi)別成員概率的置信區(qū)間。通過(guò)計(jì)算訓(xùn)練模式的密度函數(shù)與集中于所述測(cè)試模式的高斯平滑函數(shù)的卷積而得到所述測(cè)試模式的相鄰位置中所述訓(xùn)練模式的數(shù)量,其中所述訓(xùn)練模式的密度函數(shù)表示為高斯函數(shù)的混合。能夠分析地表示所述平滑函數(shù)與所述高斯函數(shù)的混合的卷積。
文檔編號(hào)G06K9/62GK101496035SQ200780028017
公開(kāi)日2009年7月29日 申請(qǐng)日期2007年7月17日 優(yōu)先權(quán)日2006年7月28日
發(fā)明者B·米爾巴赫, P·德瓦拉科塔 申請(qǐng)人:Iee國(guó)際電子工程股份公司