本發(fā)明涉及圖像處理、計算機(jī)視覺(computervision)和模式識別,并且特別地涉及用于一組對象分類器的在線學(xué)習(xí)方法和設(shè)備以及用于在圖像序列中檢測對象的方法和設(shè)備。
背景技術(shù):
:最近幾十年在檢測特定對象或種類(諸如臉、人、汽車等)方面已經(jīng)取得很大的進(jìn)展。大部分檢測器必須被離線訓(xùn)練,其經(jīng)常包含利用手動標(biāo)記的訓(xùn)練示例的較大集合的密集學(xué)習(xí)階段。當(dāng)前,越來越多的用戶傾向于拍攝特定對象。這意味著用戶需要的不是傳統(tǒng)的像臉/狗/貓檢測器那樣的檢測器,而是能夠?qū)W習(xí)用戶自己的對象(例如,他的寵物)的外觀(appearance)的檢測器。例如,用戶經(jīng)常想要在拍攝時自動地聚焦于他們的寵物。已經(jīng)開發(fā)了一種新穎的技術(shù),稱為“用戶注冊對象檢測(UserRegisteredObjectDetection)”,其能夠基于由用戶作為正樣本提供的一個或若干個對象圖像來檢測用戶注冊對象。但是一般難以僅僅通過使用非常小集合的正樣本而從視頻幀序列中準(zhǔn)確地檢測出對象。因此,已經(jīng)提出了一種解決方案,其使用基于用于檢測用戶注冊對象的支持向量的單類分類器(one-classclassifier)。這個方法能夠基于少數(shù)的正樣本(即,由用戶注冊的對象圖像)、甚至僅僅一個正樣本來對單類分類器進(jìn)行在線學(xué)習(xí)。由于不使用任何負(fù)樣本,因此該單類分類器能夠適合于任何場景。這個方法能夠通過可調(diào)參數(shù)將單類分類器的誤報警率(falsealarmrate)保持在穩(wěn)定的水平。然而,仍然存在對在一些特殊應(yīng)用中進(jìn)一步減少誤報警率的需要。例如,在對于用戶注冊對象的監(jiān)視(surveillance)應(yīng)用中,分類 器需要長時間工作在有限場景中。針對各種照明條件的極低誤報警率和高魯棒性是重要的要求。技術(shù)實現(xiàn)要素:鑒于上述內(nèi)容,本發(fā)明的發(fā)明人提出了通過對一組對象分類器進(jìn)行在線學(xué)習(xí)的用于用戶注冊對象檢測的新的解決方案,其能夠?qū)⒄`報警率保持在極低水平。該組分類器包括一個或更多個單類分類器以及一個或更多個兩類分類器(binaryclassifier),并且這兩個類型的分類器都基于支持向量并且當(dāng)它們被在線學(xué)習(xí)時將在其之間共享支持向量,從而提高在線學(xué)習(xí)效果。此外,可以利用在其之間共享支持向量的這樣一組在線學(xué)習(xí)分類器來從視頻幀序列中更準(zhǔn)確地檢測用戶注冊對象。請注意,在現(xiàn)有技術(shù)中,兩類分類器是僅僅基于巨大數(shù)量的正樣本和負(fù)樣本離線學(xué)習(xí)的。兩類分類器不能用于僅僅使用小集合樣本的用戶注冊對象檢測,因為它的誤報警率將會非常高。這是因為學(xué)習(xí)兩類分類器需要許多的足夠的負(fù)樣本,但是在用戶注冊對象檢測期間,用戶不能提供足夠的負(fù)樣本來覆蓋背景中的所有情形。當(dāng)在要檢測的場景中存在未知的負(fù)樣本時,誤報警率將會較高,也就是說,許多不是用戶注冊對象的對象將被視為對象。此外,通過使用直接反饋的對于兩類分類器的在線學(xué)習(xí)使得檢測器傾向于漂移(drift),并且錯誤地更新將使得檢測器處于不可靠的狀態(tài)。然而,通過深入研究,本發(fā)明的發(fā)明人已經(jīng)發(fā)現(xiàn),在用戶注冊對象檢測期間通過在其之間共享支持向量來與單類分類器結(jié)合地使用兩類分類器,能夠改善誤報警率。本發(fā)明的一個方面提供了一種用于一組對象分類器的在線學(xué)習(xí)方法,其中所述一組對象分類器包含至少一個單類分類器和至少一個兩類分類器,所述方法包括:特征向量提取步驟,從新添加的樣本中提取特征向量;單類分類器更新步驟,基于所提取的特征向量以及所述至少一個兩類分類器的支持向量來更新所述至少一個單類分類器中的至少一個;兩類分類器更新步驟,基于所提取的特征向量以及在 所述單類分類器更新步驟中已經(jīng)部分地或全部地被更新的所述至少一個單類分類器的支持向量,來更新所述至少一個兩類分類器中的至少一個。本發(fā)明的另一個方面提供了一種用于通過使用已經(jīng)被確定為對象的至少一個正樣本在圖像序列中檢測所述對象的方法,所述方法包括:單類分類器產(chǎn)生步驟,根據(jù)所述至少一個正樣本,產(chǎn)生基于用于對所述對象進(jìn)行分類的支持向量的至少一個單類分類器;兩類分類器產(chǎn)生步驟,基于所述圖像序列的第一圖像以及所述單類分類器產(chǎn)生用于對所述對象進(jìn)行分類的至少一個兩類分類器;對象檢測步驟,通過使用包括所述單類分類器和所述兩類分類器的一組對象分類器在所述序列中的第二圖像中檢測所述對象;分類器更新步驟,通過使用上述的在線學(xué)習(xí)方法,根據(jù)所述檢測結(jié)果更新所述一組對象分類器;以及后續(xù)的檢測和更新步驟,對于所述序列中的每一個后續(xù)的圖像,通過使用經(jīng)更新的一組對象分類器在所述后續(xù)的圖像中檢測所述對象并且隨后更新所述一組對象分類器。本發(fā)明的又一個方面提供了一種用于一組對象分類器的在線學(xué)習(xí)設(shè)備,其中所述一組對象分類器包含至少一個單類分類器和至少一個兩類分類器,所述設(shè)備包括:特征向量提取單元,被配置為從新添加的樣本中提取特征向量;單類分類器更新單元,被配置為基于所提取的特征向量以及所述至少一個兩類分類器的支持向量來更新所述至少一個單類分類器中的至少一個;兩類分類器更新單元,被配置為基于所提取的特征向量以及由所述單類分類器更新單元已經(jīng)部分地或全部地更新的所述至少一個單類分類器的支持向量,來更新所述至少一個兩類分類器中的至少一個。本發(fā)明的還一個方面提供了一種用于通過使用已經(jīng)被確定為對象的至少一個正樣本在圖像序列中檢測所述對象的設(shè)備,所述設(shè)備包括:單類分類器產(chǎn)生單元,被配置為根據(jù)所述至少一個正樣本,產(chǎn)生基于用于對所述對象進(jìn)行分類的支持向量的至少一個單類分類器;兩類分類器產(chǎn)生單元,被配置為基于所述圖像序列的第一圖像以及所述 單類分類器產(chǎn)生用于對所述對象進(jìn)行分類的至少一個兩類分類器;對象檢測單元,被配置為通過使用包括所述單類分類器和所述兩類分類器的一組對象分類器在所述序列中的每一個后續(xù)的圖像中檢測所述對象;以及如上所述的在線學(xué)習(xí)設(shè)備,被配置為根據(jù)由所述對象檢測單元獲得的檢測結(jié)果來更新所述一組對象分類器。在本發(fā)明的上述方面中,在在線學(xué)習(xí)階段期間將共享來自單類分類器和兩類分類器兩者的支持向量。因此,將通過共享支持向量而緊密地結(jié)合這兩個類型的分類器,使得通過利用該組分類器進(jìn)行的分類更準(zhǔn)確。此外,更多的特征向量將被用于該組分類器的在線學(xué)習(xí),因此共享支持向量非常適合于在線學(xué)習(xí)應(yīng)用。另外,使用該組分類器將使單獨的分類器避免漂移問題并且因此將誤報警率保持在極低水平。此外,這組分類器不僅能夠?qū)ο笈c類似的場景區(qū)分開,而且能夠避免來自我們還沒有發(fā)現(xiàn)的未知的負(fù)樣本的噪聲。鑒于上述內(nèi)容,利用根據(jù)本發(fā)明的在線學(xué)習(xí)和檢測方法以及設(shè)備,能夠在將檢出率保持在高水平的同時將誤報警率降低到極低水平,尤其對于持續(xù)且有限的場景如此。因此,本發(fā)明尤其適合于監(jiān)視應(yīng)用等。根據(jù)參照附圖的以下描述,本發(fā)明的其它特性特征和優(yōu)點將變得清晰。附圖說明并入說明書中并且構(gòu)成說明書的一部分的附圖示出了本發(fā)明的實施例,并且與描述一起用于說明本發(fā)明的原理。圖1是示出能夠?qū)嵤┍景l(fā)明的實施例的計算機(jī)系統(tǒng)的硬件配置的框圖。圖2是示出了根據(jù)本發(fā)明的第一實施例的用于一組對象分類器的在線學(xué)習(xí)方法的流程圖。圖3示例性地示出用于確定用于更新單類分類器的候選特征向 量的單類分類器的判決超球面(decisionhypersphere)。圖4是示出了根據(jù)本發(fā)明第一實施例的用于一組對象分類器的在線學(xué)習(xí)設(shè)備400的框圖。圖5是示出根據(jù)本發(fā)明第二實施例的用于在圖像序列中檢測對象的方法的流程圖。圖6是示出根據(jù)本發(fā)明第二實施例的用于在圖像序列中檢測對象的設(shè)備600的框圖。圖7示出根據(jù)本發(fā)明其它實施例的圖像拾取設(shè)備的一個示例。圖8示出將根據(jù)本發(fā)明實施例的使用一對分類器的檢測方法與僅僅使用單類分類器的現(xiàn)有技術(shù)檢測方法進(jìn)行比較而得到的比較結(jié)果。具體實施方式下面將參考附圖來詳細(xì)描述本發(fā)明的優(yōu)選的實施例。請注意,類似的參考數(shù)字和字母指的是圖中的類似的項目,因而一旦在一幅圖中定義了一個項目,就不需要在之后的圖中討論了。在本公開中,術(shù)語“第一”、“第二”等僅僅被用來在元件或步驟之間進(jìn)行區(qū)分,而并不意圖表示時間順序、優(yōu)先級或重要性。(計算機(jī)系統(tǒng)的硬件配置)圖1是示出能夠?qū)嵤┍景l(fā)明的實施例的計算機(jī)系統(tǒng)1000的硬件配置的框圖。如圖1中所示,計算機(jī)系統(tǒng)包括計算機(jī)1110。計算機(jī)1110包括經(jīng)由系統(tǒng)總線1121連接的處理單元1120、系統(tǒng)存儲器1130、固定非易失性存儲器接口1140、可移動非易失性存儲器接口1150、用戶輸入接口1160、網(wǎng)絡(luò)接口1170、視頻接口1190和輸出外圍接口1195。系統(tǒng)存儲器1130包括ROM(只讀存儲器)1131和RAM(隨機(jī)存取存儲器)1132。BIOS(基本輸入輸出系統(tǒng))1133駐留在ROM1131中。操作系統(tǒng)1134、應(yīng)用程序1135、其它程序模塊1136和某些程序 數(shù)據(jù)1137駐留在RAM1132中。諸如硬盤之類的固定非易失性存儲器1141連接到固定非易失性存儲器接口1140。固定非易失性存儲器1141例如可以存儲操作系統(tǒng)1144、應(yīng)用程序1145、其它程序模塊1146和某些程序數(shù)據(jù)1147。諸如軟盤驅(qū)動器1151和CD-ROM驅(qū)動器1155之類的可移動非易失性存儲器連接到可移動非易失性存儲器接口1150。例如,軟盤1152可以被插入到軟盤驅(qū)動器1151中,以及CD(光盤)1156可以被插入到CD-ROM驅(qū)動器1155中。諸如麥克風(fēng)1161和鍵盤1162之類的輸入設(shè)備被連接到用戶輸入接口1160。計算機(jī)1110可以通過網(wǎng)絡(luò)接口1170連接到遠(yuǎn)程計算機(jī)1180。例如,網(wǎng)絡(luò)接口1170可以經(jīng)由局域網(wǎng)1171連接到遠(yuǎn)程計算機(jī)1180?;蛘?,網(wǎng)絡(luò)接口1170可以連接到調(diào)制解調(diào)器(調(diào)制器-解調(diào)器)1172,以及調(diào)制解調(diào)器1172經(jīng)由廣域網(wǎng)1173連接到遠(yuǎn)程計算機(jī)1180。遠(yuǎn)程計算機(jī)1180可以包括諸如硬盤之類的存儲器1181,其存儲遠(yuǎn)程應(yīng)用程序1185。視頻接口1190連接到監(jiān)視器1191。輸出外圍接口1195連接到打印機(jī)1196和揚聲器1197。圖1所示的計算機(jī)系統(tǒng)僅僅是說明性的并且決不意圖對本發(fā)明、其應(yīng)用或用途進(jìn)行任何限制。圖1所示的計算機(jī)系統(tǒng)可以被實施于任何實施例,可作為獨立計算機(jī),或者也可作為設(shè)備中的處理系統(tǒng),可以移除一個或更多個不必要的組件,也可以向其添加一個或更多個附加的組件。(第一實施例)圖2是示出了根據(jù)本發(fā)明的第一實施例的用于一組對象分類器的在線學(xué)習(xí)方法的流程圖,其中所述一組對象分類器包含至少一個單類分類器和至少一個兩類分類器。如圖2所示,在特征向量提取步驟210中,從新添加的樣本中提 取特征向量。此時,該組對象分類器已經(jīng)基于用戶注冊對象圖像(一個或多個)以及可選地先前檢測的圖像而被產(chǎn)生,并且將要基于作為新添加樣本的新圖像(例如,捕獲的視頻幀)來被在線更新。顯然,所提取的特征向量的類型與單類分類器和兩類分類器的支持向量的類型相同,使得這些特征向量能夠在單類分類器和兩類分類器之間被共享。然后,在單類分類器更新步驟220中,基于所提取的特征向量以及所述至少一個兩類分類器的支持向量來更新所述至少一個單類分類器中的至少一個。在一種實現(xiàn)方式中,所述單類分類器更新步驟220可以包括:對于所述至少一個單類分類器中的一個單類分類器,計算從這個單類分類器的所有支持向量的聚類中心(clusteringcentre)到所提取的特征向量和所述至少一個兩類分類器的所述支持向量中的每一個的各個距離;基于所述單類分類器的支持向量來設(shè)定閾值;從所提取的特征向量和所述至少一個兩類分類器的所述支持向量中選擇候選特征向量,其中所述候選特征向量中的每一個的計算距離都比所述閾值??;以及通過使用所述候選特征向量來更新所述單類分類器的支持向量。下面將詳細(xì)描述這樣的單類分類器更新方法的一個示例。本領(lǐng)域技術(shù)人員會理解,本發(fā)明不限于這個特定的示例,而是能夠使用任何適當(dāng)?shù)姆绞絹砀聠晤惙诸惼?。在該示例中,單類分類器是基于SVDD的單類分類器,其通過僅僅使用正樣本來訓(xùn)練,并且它旨在獲得具有最小體積的球形的邊界使得該球能夠包圍盡可能多的正樣本。單類分類器的支持向量組如下:SVs={(xi,αi)|i=1,2…Np},其中xi是支持向量并且αi是對應(yīng)的權(quán)重。對于所提取的特征向量以及所述至少一個兩類分類器的所述支持向量中的任何一個特征向量z,可以計算到這個單類分類器的所有支持向量的聚類中心的距離。用于從所提取的特征向量以及所述至少一個兩類分類器的所述支持向量中選擇候選特征向量的判決函數(shù)可以是:fone(z)=Rz2=K(z,z)-2Σxi∈SVsaiK(xi,z)+Σxi∈SVsaiajK(xi,xj)≤RT2---(1)]]>其中,Rz是從特征向量z到聚類中心的距離,RT是基于所述單類分類器的支持向量設(shè)定的閾值,并且K(·)是核函數(shù),例如,公式化為如下的直方圖交叉核(HistogramIntersectionKernel,HIK):K(T,Q)=Σi=1dmin(Ti,Qi)---(2)]]>其中,d是特征向量維度。這里,我們并不試圖找到支持向量的所述聚類中心在特征空間中的位置,我們只是想要確定從任何特征向量z到支持向量的所述聚類中心的距離函數(shù)。在該步驟中,將計算從所述中心到所提取的特征向量以及兩類分類器的支持向量的所有距離。然后,該方法將通過使用所述單類分類器的支持向量來設(shè)定閾值,即,上述RT。下面,假設(shè)參數(shù)P,即,指出將在單類分類器的判決超球面外的正樣本的比率的預(yù)設(shè)概率,通過使用Rmin和Rmax,產(chǎn)生判決超球面的半徑RT,即,上述閾值。參數(shù)P被定義如下:P=(fT(z)-fmin)/(fmax-fmin)(3)。根據(jù)公式(3),判決超球面的半徑RT可以被確定為:fT(z)=Pfmax+(1-P)fmin⇒πRT2=PπRmax2+(1-P)πPmin2⇒RT2=PRmax2+(1-P)Rmin2---(4)]]>其中Rmin和Rmax是能夠基于公式(1)得到的最小半徑和最大半徑。根據(jù)公式(4),對于特征向量z,估計適當(dāng)?shù)拈撝?,即fT(z)。最終,對于所有支持向量Xi∈SVs估計fT:fT=Σi=1MαifT(Xi)---(5)]]>fT是閾值RT的平方。至于根據(jù)公式(1)的fone(z),K(z,z)將對于任何特征向量z是固定的,因為K(·)是HIK核并且數(shù)據(jù)z已經(jīng)被規(guī)格化(normalize)。fmax(z)=Rmax2=K(z,z)+Σxi∈SVsΣxj∈SVsαiαjK(xi,xj)]]>fmin(z)=Rmin2=fmax-2max(Σxi∈SVsαiK(xi,z))---(6)]]>結(jié)合公式(4)-(6),能夠通過設(shè)定固定概率Pone來計算閾值RT。然后,對于所提取的特征向量以及所述兩類分類器的所述支持向量中的每一個,將計算距離與設(shè)定的閾值進(jìn)行比較,并且當(dāng)時,特征向量z被選為候選特征向量,所述候選特征向量被認(rèn)為是位于其半徑為RT的判決超球面內(nèi)的正樣本,如圖3所示。接下來,通過使用所述候選特征向量來更新單類分類器的支持向量。這里能夠使用用于具有支持向量的單類分類器的任何更新方法。以下方法是優(yōu)選的:通過使用由LIBSVM實現(xiàn)的序列最小優(yōu)化(SequentialMinimalOptimization,SMO)方法,基于先前的支持向量和更新后的候選特征向量對單類分類器進(jìn)行再學(xué)習(xí)。SMO方法將較大的二次規(guī)劃(quadraticprogramming,QP)優(yōu)化問題分解成一系列的最小的可能的QP問題。解析地解出這些小的QP問題,這避免了使用耗時的數(shù)值QP優(yōu)化作為內(nèi)循環(huán)。LIBSVM是用于SVM的庫,其自2000年以來已經(jīng)被開發(fā)。它是當(dāng)前使用最廣泛的SVM軟件。接下來,在兩類分類器更新步驟230中,基于所提取的特征向量以及在所述步驟220中已經(jīng)部分地或全部地被更新的所述至少一個單類分類器的支持向量,來更新所述至少一個兩類分類器中的至少一個。在一種實現(xiàn)方式中,所述兩類分類器更新步驟230可以包括:對于所述至少一個兩類分類器中的一個兩類分類器,確定所提取的特征向量是正特征向量還是負(fù)特征向量;以及通過使用所有單類分類器的支持向量作為正特征向量以及使用確定結(jié)果來更新所述兩類分類器的支持向量。本領(lǐng)域技術(shù)人員會理解,本發(fā)明不限于這種實現(xiàn)方式,而是能夠使用任何適當(dāng)?shù)姆绞絹砀聝深惙诸惼?。具體地,單類分類器的支持向量被獲得作為正特征向量。并且所提取的特征向量可以由所述一組分類器或者僅僅單類分類器或者僅僅兩類分類器確定為正特征向量或者負(fù)特征向量。然后,通過使用所有正特征向量和負(fù)特征向量來更新兩類分類器的支持向量?;谡卣飨蛄亢拓?fù)特征向量兩者,可以通過采用基于直方圖交叉核的SVM來訓(xùn)練兩類分類器。對于未確定的樣本z,SVM的判決函數(shù)被示出為:fbinary(z)=Σxi∈SVsαiK(xi,z)+b>0---(7)]]>其中xi是支持向量,αi是對應(yīng)的權(quán)重因子,K(·)是核函數(shù),并且b是判決偏置(bias)。當(dāng)fbinary(z)>0時,樣本z被分類為正的。此外,如公式(7)所示的SVM的判決函數(shù)能夠被規(guī)格化為概率輸出SVM。對于兩類SVM的概率輸出被公式化為:fbinary=1.0-11+exp(Af(z)+B)---(8)]]>其中在訓(xùn)練過程中使用5折交叉驗證(5-foldcross-validation)來估計A和B。與單類分類器更新方法類似,在訓(xùn)練過程中的5折交叉驗證期間,序列最小優(yōu)化(SMO)方法和LIBSVM能夠被用于更新兩類分類器。本領(lǐng)域技術(shù)人員會明白的是,任何已知的或者新的適當(dāng)?shù)姆椒軌虮挥糜诟聝深惙诸惼鳌U堊⒁?,在一些示例中,包含單類分類器和兩類分類器的所述一組分類器可以是級聯(lián)結(jié)構(gòu)(cascadestructure),其通過這兩個類型的分類器按合適順序進(jìn)行分類。但是所述一組分類器還可以具有加權(quán)累加結(jié)構(gòu),其通過所有分類器的加權(quán)累加的分?jǐn)?shù)來進(jìn)行分類。在所述一組分類器具有加權(quán)累加結(jié)構(gòu)的情況下,根據(jù)第一實施例的在線學(xué)習(xí)方法在所述兩類分類器更新步驟230之后還可以可選地包括更新單類分類器和兩類分類器的權(quán)重的權(quán)重更新步驟。在加權(quán)累加結(jié)構(gòu)中,兩種類型的分類器具有各自的規(guī)格化的概率 輸出,并且可以通過如下地對所有輸出進(jìn)行加權(quán)求和來計算最終分類分?jǐn)?shù)。fwin=w1one*f1one+w2one*f2one+…+wmone*fmone+w1binary*f1binary+w2binary*f2binary+…+wnbinary*fnbinary(9)其中w1one,…,wmone和w1binary,…,wnbinary是對于單類分類器和兩類分類器的各自的權(quán)重,其可以基于用戶體驗或者非參數(shù)評估或者訓(xùn)練來得到。許多方法可以被用于更新權(quán)重w1one,…,wmone和w1binary,…,wnbinary。以下是優(yōu)選的有效的方法:1)收集包括所提取的特征向量以及所述單類分類器和兩類分類器的支持向量的所有正特征向量和負(fù)特征向量作為F={Xpos,Xneg},以及Xpos={(xi,fi)|i=1,2…Np},Xneg={(xi,fi)|i=1,2…Nn}其中Xpos是正特征向量集合,并且Xneg是負(fù)特征向量集合。2)調(diào)節(jié)權(quán)重w1one,…,wmone和w1binary,…,wnbinary,從而確保正特征向量和負(fù)特征向量的平均分?jǐn)?shù)之間的差值最大;w1one+...+wmone+w1binary+...wnbinary=1diffrence=fpositiveaverage-fnegativeaverage.]]>圖4是示出了根據(jù)本發(fā)明第一實施例的用于一組對象分類器的在線學(xué)習(xí)設(shè)備400的框圖,其中所述一組對象分類器包含至少一個單類分類器和至少一個兩類分類器。如圖4所示,用于一組對象分類器的在線學(xué)習(xí)設(shè)備400包括:特征向量提取單元410、單類分類器更新單元420和兩類分類器更新單元430。更具體地,特征向量提取單元410被配置為從新添加的樣本中提取特征向量。單類分類器更新單元420被配置為基于所提取的特征向量以及所述至少一個兩類分類器的支持向量來更新所述至少一個單類分類器中的至少一個。兩類分類器更新單元430被配置為基于所提取的特征向量以及 由所述單類分類器更新單元420已經(jīng)部分地或全部地更新的所述至少一個單類分類器的支持向量,來更新所述至少一個兩類分類器中的至少一個。設(shè)備400中的各個單元能夠被配置為執(zhí)行圖2中的流程圖中示出的各個步驟。在上述的用于包含單類分類器和兩類分類器的一組對象分類器的在線學(xué)習(xí)方法和設(shè)備中,在單類分類器和兩類分類器之間共享支持向量,并且因此能夠在將檢出率保持在高水平的同時將誤報警率降低到極低水平。(第二實施例)本實施例涉及將根據(jù)第一實施例的在線學(xué)習(xí)方法和設(shè)備應(yīng)用于在圖像序列中檢測用戶注冊對象。圖5是示出根據(jù)本發(fā)明第二實施例的通過使用已經(jīng)確定為對象的至少一個正樣本在圖像序列中檢測對象的方法的流程圖。如圖5所示,在單類分類器產(chǎn)生步驟510中,根據(jù)所述至少一個正樣本,產(chǎn)生基于用于對所述對象進(jìn)行分類的支持向量的至少一個單類分類器。本領(lǐng)域技術(shù)人員會明白的是,任何已知的或者新的適當(dāng)?shù)姆椒軌虮挥糜诋a(chǎn)生單類分類器。接下來,在兩類分類器產(chǎn)生步驟520中,基于所述圖像序列的第一圖像以及所述單類分類器產(chǎn)生用于對所述對象進(jìn)行分類的至少一個兩類分類器。在一種實現(xiàn)方式中,所述兩類分類器產(chǎn)生步驟520可以包括:將所述第一圖像劃分成多個區(qū)域并且通過使用所述單類分類器確定所劃分的區(qū)域中的每一個是否為所述對象;收集所述單類分類器的支持向量以及從已經(jīng)被確定為所述對象的區(qū)域中提取的特征向量,作為正特征向量;收集從已經(jīng)被確定為非對象的區(qū)域中提取的特征向量,作為負(fù)特征向量;以及通過使用所收集的正特征向量和負(fù)特征向量訓(xùn)練 至少一個兩類分類器。下面將詳細(xì)描述這樣的兩類分類器產(chǎn)生方法的一個示例。本領(lǐng)域技術(shù)人員會理解,本發(fā)明不限于這個特定的示例,而是能夠使用任何適當(dāng)?shù)姆绞絹懋a(chǎn)生兩類分類器。在該示例中,首先,通過滑動窗來將第一圖像劃分成多個窗圖像,然后對于每個窗,提取特征向量。然后,單類對象分類器基于所提取的特征向量來確定滑動窗中的圖像是正的還是負(fù)的,即,確定該圖像是否為待檢測對象。基于分類結(jié)果,收集被分類為正的所有窗,使用非最大抑制(non-maximumsuppression),將正的窗進(jìn)行聚類并且合并以便利用包圍盒(boundingbox)wobj定位對象。然后,所有所述包圍盒wobj的特征向量被提取,并且被視為正特征向量。此外,單類分類器的所有支持向量也被收集作為正特征向量。在圖像中定位對象區(qū)域之后,與對象包圍盒的重合度(overlapratio)小于用戶特定的閾值thr的窗被視為負(fù)的,即:如果則窗ws被視為負(fù)的。所有的負(fù)的窗被收集,并且基于它們的分類分?jǐn)?shù)按升序排列,并且僅僅頭Nn個窗被選為難(hard)負(fù)樣本,其中Nn=Np,并且Np是通用的單類分類器的正支持向量的數(shù)量。從那些負(fù)樣本中提取特征向量并且將其添加到負(fù)特征向量集合Xneg中。然后,訓(xùn)練基于支持向量的兩類分類器,其可以將對象與當(dāng)前場景區(qū)分開。序列最小優(yōu)化(SMO)方法和LIBSVM也可以被用于這種訓(xùn)練?;谡卣飨蛄亢拓?fù)特征向量(名為Xpos和Xneg)兩者,通過采用基于直方圖交叉核的SVM來訓(xùn)練兩類分類器,其將對象與背景分離。對于未確定的樣本z,SVM的判決函數(shù)被示出為:fbinary(z)=Σxi∈SVsαiK(xi,z)+b>0---(10)]]>其中xi是支持向量,αi是對應(yīng)的權(quán)重因子,K(·)是核函數(shù),并且b是判決偏置(bias)。當(dāng)fbinary(z)>0時,樣本z被分類為正的。此外,如公式(10)所示的SVM的判決函數(shù)能夠被規(guī)格化為概率輸出SVM。對于兩類SVM的概率輸出被公式化為:fbinary=1.0-11+exp(Af(z)+B)---(11)]]>其中在訓(xùn)練過程中使用5折交叉驗證來估計A和B。然后,在對象檢測步驟530中,通過使用包括所述單類分類器和所述兩類分類器的一組對象分類器在所述序列中的跟在第一圖像之后的第二圖像中檢測所述對象。在該檢測之后,該方法執(zhí)行分類器更新步驟540,在該步驟540中通過使用根據(jù)第一實施例的在線學(xué)習(xí)方法,根據(jù)所述檢測結(jié)果來更新所述一組對象分類器。然后,該方法返回到對象檢測步驟530,以用于通過使用更新后的對象分類器在該序列中的下一個圖像中檢測所述對象。對象檢測步驟530和分類器更新步驟540被重復(fù),直到該序列中的所有圖像都已經(jīng)被檢測完或者檢測結(jié)束。分類器更新步驟540采用根據(jù)第一實施例的在線學(xué)習(xí)方法,其之前已經(jīng)被詳細(xì)討論并且這里不會重復(fù)敘述。因此,我們下面將詳細(xì)討論對象檢測步驟530。在對象檢測方法的一種實現(xiàn)方式中,檢測所述對象可以包括:將所述圖像劃分成多個區(qū)域;通過使用所述一組對象分類器來對所劃分的區(qū)域中的每一個進(jìn)行分類并且從所述一組分類器得到對于所劃分的區(qū)域中的每一個的分類分?jǐn)?shù);以及根據(jù)所述分類分?jǐn)?shù)和預(yù)定義的閾值確定所劃分的區(qū)域中的每一個是所述對象還是非對象。可替代地,在另一種實現(xiàn)方式中,檢測所述對象可以包括:將所述圖像劃分成多個區(qū)域;通過使用所述單類分類器來對所劃分的區(qū)域中的每一個進(jìn)行分類并且從所述單類分類器得到對于所劃分的區(qū)域中的每一個的第一分類分?jǐn)?shù);通過使用兩類分類器來對已經(jīng)由所述單類分類器分類為正的區(qū)域進(jìn)行分類,從兩類分類器得到對于這些區(qū)域 的第二分類分?jǐn)?shù),并且通過對第一分類分?jǐn)?shù)和第二分類分?jǐn)?shù)進(jìn)行加權(quán)求和來計算最終分類分?jǐn)?shù);以及收集其最終分類分?jǐn)?shù)大于預(yù)定義的閾值的區(qū)域作為對象區(qū)域,并且收集其最終分類分?jǐn)?shù)不大于所述預(yù)定義的閾值的區(qū)域作為非對象區(qū)域。下面將詳細(xì)描述這樣的檢測方法的一個示例。本領(lǐng)域技術(shù)人員會理解,本發(fā)明不限于這個特定的示例,而是能夠使用任何適當(dāng)?shù)姆绞絹頇z測對象。在該示例中,包括單類分類器和兩類分類器的該組分類器具有級聯(lián)結(jié)構(gòu)。這個結(jié)構(gòu)的第一級是單類分類器而第二級是兩類分類器。通過該組分類器在圖像中檢測對象并且收集正特征向量和負(fù)特征向量以用于接下來的更新(在線學(xué)習(xí))。具體的檢測過程如下。通過滑動窗來將圖像劃分成多個樣本窗圖像,然后對于每個窗ws,提取特征向量xs。然后,該組分類器如下地對樣本圖像進(jìn)行分類:1)通過使用單類分類器對樣本特征向量xs進(jìn)行分類并且得到分類分?jǐn)?shù)2)如果由單類分類器將該樣本特征向量xs分類為正的,則通過使用兩類分類器來對其進(jìn)行分類并且得到分類分?jǐn)?shù)3)當(dāng)通過上述兩個分類器將樣本分類為對象區(qū)域時,通過使用公式來得到最終分類分?jǐn)?shù)fs。在檢測期間,收集候選的正窗和負(fù)窗:Wpos={(wi,fi)|i=1,…,Np},Wneg={(wi,fi)|i=1,…,Nn},其中每一個關(guān)聯(lián)一個分類分?jǐn)?shù),其中Wpos是正窗集合,并且Wneg是負(fù)窗集合。正的候選者Wpos是已經(jīng)被該組分類器分類為正的那些樣本,即,其最終分類分?jǐn)?shù)大于預(yù)定義的閾值的那些樣本,而負(fù)的候選者Wneg是已經(jīng)被單類分類器分類為正的但是被兩類分類器分類為負(fù)的那些樣本,即,其最終分類分?jǐn)?shù)不大于預(yù)定義的閾值的那些樣本。圖6是示出根據(jù)本發(fā)明第二實施例的用于通過使用已經(jīng)確定為 對象的至少一個正樣本在圖像序列中檢測對象的設(shè)備600的框圖。如圖6所示,該設(shè)備600包括:單類分類器產(chǎn)生單元610、兩類分類器產(chǎn)生單元620、對象檢測單元630、以及根據(jù)第一實施例的在線學(xué)習(xí)設(shè)備400。更具體地,單類分類器產(chǎn)生單元610被配置為根據(jù)所述至少一個正樣本,基于用于對所述對象進(jìn)行分類的支持向量產(chǎn)生至少一個單類分類器。兩類分類器產(chǎn)生單元620被配置為基于所述圖像序列的第一圖像以及所述單類分類器產(chǎn)生用于對所述對象進(jìn)行分類的至少一個兩類分類器。對象檢測單元630被配置為通過使用包括所述單類分類器和所述兩類分類器的一組對象分類器在所述序列中的每一個后續(xù)的圖像中檢測所述對象。根據(jù)第一實施例的在線學(xué)習(xí)設(shè)備400被配置為根據(jù)由所述對象檢測單元獲得的檢測結(jié)果來更新所述一組對象分類器。設(shè)備600中的各個單元能夠被配置為執(zhí)行圖5中的流程圖中示出的各個步驟。在上述的檢測方法和設(shè)備中,在單類分類器和兩類分類器之間共享支持向量,并且因此能夠在將檢出率保持在高水平的同時將誤報警率降低到極低水平。(其它實施例)上述的根據(jù)第一實施例的在線學(xué)習(xí)方法或者根據(jù)第二實施例的用于在圖像序列中檢測對象的方法可被用于許多應(yīng)用中。應(yīng)用之一是用于在圖像拾取設(shè)備中自動地聚焦于用戶注冊對象。如圖7所示,圖像拾取設(shè)備700可以包括:光學(xué)系統(tǒng)710,被配置為拾取圖像或者視頻;以及根據(jù)第一實施例的在線學(xué)習(xí)設(shè)備400或者根據(jù)第二實施例的用于在視頻幀的序列中檢測對象的設(shè)備600。此外,圖像拾取設(shè)備700可以被包括在圖像處理設(shè)備中,該圖 像處理設(shè)備例如是照相機(jī)、移動電話、臺式計算機(jī)、平板計算機(jī)或者膝上型計算機(jī)等。(通過本發(fā)明實現(xiàn)的技術(shù)效果的評估)示出了根據(jù)本發(fā)明的原理的用于檢測對象的方法與現(xiàn)有技術(shù)中的其它方法的測試比較的示例。注意,這里示出的示例僅僅是示例性的,用于示出本發(fā)明的有利技術(shù)效果,而不是限制性的。根據(jù)本發(fā)明的對象檢測方法被用在用戶注冊對象檢測(UROD)系統(tǒng)中。通過使用用戶提供的很少的樣本來訓(xùn)練用于特定對象的單類分類器;并且視頻序列的第一幀被用來構(gòu)造兩類分類器。這兩個分類器被組合以形成一組分類器,并且基于檢測結(jié)果被在線更新。我們將本發(fā)明的檢測方法的性能與僅僅使用單類分類器的現(xiàn)有技術(shù)的方法進(jìn)行比較。用于圖像區(qū)域描述的特征是顏色和局部三值模式(Localternarypattern,LTP)。評估準(zhǔn)則是PASCAL評估準(zhǔn)則,當(dāng)時,檢測區(qū)域被視為正確的檢測區(qū)域。這里,T是0.5。召回率(recallrate),即檢出率,為虛檢率(FPPI)為其中錯誤檢出的幀包括不具有對象但是被檢測為對象的幀。表1示出測試中的硬件和軟件配置。表1評估示例1圖8示出將根據(jù)本發(fā)明實施例的使用一對分類器的檢測方法與僅使用單類分類器的現(xiàn)有技術(shù)檢測方法進(jìn)行比較而得到的比較結(jié)果,即,ROC曲線。采用的數(shù)據(jù)集是全部由手持式照相機(jī)拍攝的20個視頻。待檢測對象是許多種動物,諸如貓、狗等等。每一種動物包括不同的外觀并且背景慢慢地改變。如圖8所示,與僅具有單類分類器的方法相比,根據(jù)本實施例的方法具有更好的性能(更高的檢出率和更低的FPPI)。評估示例2在該示例中,同樣,將根據(jù)本發(fā)明實施例的使用一對分類器的檢測方法與僅使用單類分類器的現(xiàn)有技術(shù)檢測方法進(jìn)行比較。采用的數(shù)據(jù)集是全部由手持式照相機(jī)拍攝的144個視頻。待檢測對象是28種動物。在將檢出率保持在92.1%的情況下執(zhí)行FPPI的比較。FPPI被示出在表2中:表2如上述表所示,當(dāng)這兩種方法的檢出率相同時,根據(jù)本發(fā)明的方法的FPPI僅為單類分類器方法的FPPI的約30%。從上面的比較結(jié)果可以看出,根據(jù)本發(fā)明的對象檢測方法能夠減少FPPI率(假警報)。也就是說,單類分類器和兩類分類器的組合能更有效地將對象與周圍的場景區(qū)分開。此外,根據(jù)本發(fā)明的對象檢測方法能夠改善檢出率。也就是說,根據(jù)本發(fā)明的在線學(xué)習(xí)將使得該 組分類器能夠適應(yīng)于對象的外觀變化。可以通過許多方式來實施本發(fā)明的方法和設(shè)備。例如,可以通過軟件、硬件、固件、或其任何組合來實施本發(fā)明的方法和設(shè)備。上述的方法步驟的次序僅是說明性的,本發(fā)明的方法步驟不限于以上具體描述的次序,除非以其它方式明確說明。此外,在一些實施例中,本發(fā)明還可以被實施為記錄在記錄介質(zhì)中的程序,其包括用于實現(xiàn)根據(jù)本發(fā)明的方法的機(jī)器可讀指令。因而,本發(fā)明還覆蓋存儲用于實現(xiàn)根據(jù)本發(fā)明的方法的程序的記錄介質(zhì)。雖然已通過示例詳細(xì)展示了本發(fā)明的一些具體實施例,但是本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,上述示例僅意圖是說明性的而不限制本發(fā)明的范圍。本領(lǐng)域技術(shù)人員應(yīng)該理解,上述實施例可以在不脫離本發(fā)明的范圍和實質(zhì)的情況下被修改。本發(fā)明的范圍是通過所附的權(quán)利要求限定的。當(dāng)前第1頁1 2 3