本發(fā)明涉及從數(shù)字攝像頭圖像確定停車場占用情況的方法和系統(tǒng)。
背景技術(shù):作為背景情況,對可用停車位的檢測在世界范圍內(nèi)都是非常重要的,這是因為它與燃料消耗和交通擁堵高度相關(guān)。研究表明,在人口密集的美國城市中,比如舊金山和紐約市,相當(dāng)大比例的交通量與找尋(cruise)空停車位相關(guān)。例如,據(jù)估計,舊金山大約三分之一的交通量和二分之一的所使用燃料是因為搜尋空停車位的車輛而導(dǎo)致。一項在布魯克林完成的關(guān)于停車位相關(guān)問題的研究表明總交通量的45%和本地交通量的64%是在尋找可用的停車位。因此,停車場占用情況的自動估計以及空位的檢測能夠解決繁忙地段的燃料消耗和交通量的問題。停車的進行通常只有非常少的自動化技術(shù),這使得該過程效率低下且常常失效。需要廉價的自動和半自動的停車執(zhí)行系統(tǒng)(parkingenforcementsystem)。雖然已有基于停車傳感器的系統(tǒng),但是它們往往牽涉到大的安裝和部署成本,以及安裝許可的獲取、不是沒有困難的過程。由成組的攝像頭組成的系統(tǒng)不僅可提供易于部署的廉價解決方案,而且可支持會給消費者提供附加值的其它任務(wù),比如交通執(zhí)法和監(jiān)督。對基于攝像頭的執(zhí)行系統(tǒng)而言,主要的挑戰(zhàn)之一是從圖像和視頻確定占用率和空位位置。需要一種執(zhí)行停車場占用情況估計并檢測空位的自動化系統(tǒng)。該信息轉(zhuǎn)而可經(jīng)由無線電、因特網(wǎng)、路標(biāo)和/或GPS輔助信號轉(zhuǎn)達給司機。
技術(shù)實現(xiàn)要素:在一實施方式中,提供了一種從數(shù)字圖像確定停車場占用情況的方法。該方法包括構(gòu)建程序,該構(gòu)建程序包括如下步驟:獲得具有多個停車位的停車場的布局且針對至少一個視角估計停車位的體積并估計觀察的像素屬于所述停車位的體積的概率。該方法進一步包括如下步驟:從至少一個數(shù)字攝像頭獲取所述停車場的一或多個圖像幀;利用至少一個車輛檢測器在所獲得的所述一或多個圖像幀上執(zhí)行像素分類以確定像素屬于車輛的可能性;基于空間變化的成員概率密度函數(shù)(PDF)和相關(guān)區(qū)域(aregionofinterest)內(nèi)車輛像素的可能性計算停車位被車輛占用的概率;以及通過比較計算出的停車位被車輛占用的所述概率和預(yù)定閾值確定停車場的空位。在另一實施方式中,提供了一種從數(shù)字圖像確定停車場占用情況的系統(tǒng)。該系統(tǒng)包括數(shù)據(jù)庫和圖像處理單元,所述數(shù)據(jù)庫存儲數(shù)字圖像以及與數(shù)字圖像處理相關(guān)的數(shù)據(jù),所述圖像處理單元包括處理器、系統(tǒng)存儲器和系統(tǒng)總線,所述系統(tǒng)總線連接系統(tǒng)存儲器和處理單元。所述圖像處理單元是可操作的以:獲得具有多個停車位的停車場的布局;針對至少一個視角估計停車位的體積并估計觀察的像素屬于所述停車位的體積的概率;從至少一個數(shù)字攝像頭獲取所述停車場的一或多個圖像幀;利用至少一個車輛檢測器在所獲得的所述一或多個圖像幀上執(zhí)行像素分類以確定像素屬于車輛的可能性;基于空間變化的成員概率密度函數(shù)(PDF)和相關(guān)區(qū)域內(nèi)車輛像素的可能性計算停車位被車輛占用的概率;以及通過比較計算出的停車位被車輛占用的所述概率和預(yù)定閾值確定停車場的空位。在又一實施方式中,提供了一種存儲指令的非暫時的計算機可讀的數(shù)據(jù)載體,所述指令當(dāng)被計算機執(zhí)行時,使得所述計算機執(zhí)行從數(shù)字圖像確定停車場占用情況的方法。該方法包括構(gòu)建程序,該構(gòu)建程序包括如下步驟:獲得具有多個停車位的停車場的布局且針對至少一個視角估計停車位的體積并估計觀察的像素屬于所述停車位的體積的概率。該方法進一步包括如下步驟:從至少一個數(shù)字攝像頭獲取所述停車場的一或多個圖像幀;利用至少一個車輛檢測器在所獲得的所述一或多個圖像幀上執(zhí)行像素分類以確定像素屬于車輛的可能性;基于空間變化的成員概率密度函數(shù)(PDF)和相關(guān)區(qū)域內(nèi)車輛像素的可能性計算停車位被車輛占用的概率;以及通過比較計算出的停車位被車輛占用的所述概率和預(yù)定閾值確定停車場的空位。附圖說明圖1是圖解適于實施從一或多幅攝像頭圖像確定停車場占用情況的示例性方法的數(shù)字圖像處理裝置的框圖;圖2是從攝像頭圖像確定停車場占用情況的示例性方法的流程圖;圖3是用于詳細說明停車場布局的示例性用戶界面(UI);圖4示出了使用示例性車輛體積建模方法對停車位體積的估計;圖5示出了使用LBP-SVM車輛分類器的像素分類結(jié)果;圖6示出了局部二元模式編碼方案;圖7示出了停車位的成員概率密度函數(shù);以及圖8示出了具有樣本停車場圖像經(jīng)示例性方法分析得出的占用結(jié)果的UI。具體實施方式這里所記載的是一種用于從一或多幅攝像頭視圖標(biāo)記停車場占用檢測的方法和系統(tǒng)。在合意的高度安裝攝像頭的常用方法是安裝在燈柱上;但要理解的是,攝像頭的任何架高安裝(例如,高于8英尺)會是適合的。示例性實施方式專注于從燈柱攝像頭視圖而標(biāo)記的停車場占用檢測,但它也涉及沿街停車,尤其是用于具有畫線的街道(即,劃出的“停車位”)。在更高層面上,示例性實施方式的一個方面是從靜態(tài)圖像確定占用率和占用/空閑位置的一系列圖像處理步驟。具體而言,該示例性實施方式一般包括(1)利用用戶標(biāo)記線確定停車場布局的半手動規(guī)則系統(tǒng)(algorithm),(2)執(zhí)行車輛/背景區(qū)分的切分規(guī)則系統(tǒng)(algorithm),以及(3)利用車輛體積模型的占用確定規(guī)則系統(tǒng)(algorithm)。圖1概略地示出了用于實施示例性方法的數(shù)字圖像處理裝置100。根據(jù)示例性實施方式形成的數(shù)字圖像處理裝置100包括用于執(zhí)行數(shù)字圖像處理和其它電子計算操作的圖像處理單元(IPU)102。計算機是用于IPU102的一種可行的硬件配置。要知道的是,雖然圖示了獨立架構(gòu),但可以根據(jù)本實施方式采用任何合適的計算環(huán)境。例如,根據(jù)本實施方式可采用的計算架構(gòu)包括但不限于獨立的、多處理器的、分布式的、客戶端/服務(wù)器的、小型計算機的、大型計算機的、巨型計算機的、數(shù)字的和模擬的。雖然沒有特別顯示在該圖中,但就本領(lǐng)域技術(shù)人員所知,IPU102通常包括處理單元、系統(tǒng)存儲器和連接各種系統(tǒng)部件(包括連接系統(tǒng)存儲器和處理單元)的系統(tǒng)總線。處理單元可以是市場上可獲得的各種處理器中的任何一種。雙微處理器和其它多處理器架構(gòu)也可被用作為處理單元。系統(tǒng)總線可以是若干類型的總線結(jié)構(gòu)中的任何一種,所述若干類型的總線結(jié)構(gòu)包括使用市場上可獲得的各種總線架構(gòu)中的任何一種的存儲總線或存儲控制器、外設(shè)總線和局部總線。計算機存儲器包括只讀存儲器(ROM)和隨機訪問存儲器(RAM)。ROM中存儲基本輸入/輸出系統(tǒng)(BIOS),BIOS包含有助于比如在啟動期間、在計算機中的元件之間傳遞信息的基本例程。IPU102可進一步包括硬盤驅(qū)動器、磁盤驅(qū)動器(例如,用于從可移動磁盤讀取或者寫入可移動磁盤)和光盤驅(qū)動器(例如,用于讀取CD-ROM盤或者從其它光學(xué)介質(zhì)上讀取或者寫入其它光學(xué)介質(zhì))。IPU102通常包括至少某種形式的計算機可讀介質(zhì)。計算機可讀介質(zhì)可以是能夠被計算機訪問的任何可獲得的介質(zhì)。示例而不是限制地,計算機可讀介質(zhì)可包括計算機存儲介質(zhì)和通信介質(zhì)。計算機存儲介質(zhì)包括在用于存儲諸如計算機可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù)等信息的任何方法和技術(shù)中使用的易失和非易失、可移動和不可移動的介質(zhì)。計算機存儲介質(zhì)包括但不限于RAM、ROM、EEPROM、閃存或其它存儲技術(shù)、CD-ROM、數(shù)字通用光盤(DVD)或其它磁存儲設(shè)備,或者可用來存儲所需信息且可被計算機訪問的任何其它介質(zhì)。許多程序模塊可被存儲在驅(qū)動器和RAM中,包括操作系統(tǒng)、一或多個應(yīng)用程序、其它程序模塊和程序非中斷數(shù)據(jù)(programnon-interruptdata)。IPU102中的操作系統(tǒng)可以是市場上可獲得的許多操作系統(tǒng)中的任何一種。如本領(lǐng)域中所公知的,IPU102被可操作地連接于數(shù)字圖像輸入設(shè)備104,比如數(shù)字攝像頭,數(shù)字圖像輸入設(shè)備104接收作為輸入的圖像并取得代表該圖像的數(shù)字圖像數(shù)據(jù)。IPU102從圖案輸入設(shè)備104接收數(shù)字圖像數(shù)據(jù)。IPU102還被可操作地連接于一或多個輸出設(shè)備106,輸出設(shè)備106從IPU102接收數(shù)字圖像數(shù)據(jù)。圖像輸出設(shè)備106可包括存儲用于后續(xù)檢索的數(shù)字圖像數(shù)據(jù)的數(shù)字數(shù)據(jù)存儲設(shè)備(例如,CD-ROM、磁介質(zhì)或其它存儲介質(zhì))、和/或基于該數(shù)字圖像數(shù)據(jù)產(chǎn)生視覺圖像的視頻顯示終端。如此處所圖示的,IPU102可選地被連接到計算機網(wǎng)絡(luò)112。如此,IPU102可發(fā)送數(shù)字圖像數(shù)據(jù)給其所連接的任何網(wǎng)絡(luò)或者從該網(wǎng)絡(luò)接收數(shù)字圖像數(shù)據(jù)。IPU102可工作在使用到一或多個遠程計算機的邏輯和/或物理連接的網(wǎng)絡(luò)環(huán)境中。遠程計算機可以是工作站、服務(wù)器計算機、路由器、個人計算機、基于微處理器的娛樂性電器、對等設(shè)備或其它常見的網(wǎng)絡(luò)節(jié)點,且通常包括所描述的與計算機相關(guān)的許多或全部元件。所描繪的邏輯連接包括局域網(wǎng)(LAN)和廣域網(wǎng)(WAN)。這樣的網(wǎng)絡(luò)環(huán)境在辦公室、企業(yè)級計算機網(wǎng)絡(luò)、內(nèi)聯(lián)網(wǎng)和因特網(wǎng)中是常見的。當(dāng)被用于LAN網(wǎng)絡(luò)環(huán)境中時,計算機通過網(wǎng)絡(luò)接口或適配器被連接到本地網(wǎng)絡(luò)。當(dāng)被用于WAN網(wǎng)絡(luò)環(huán)境中時,計算機通常包括調(diào)制解調(diào)器,或者被連接到LAN上的通信服務(wù)器,或者具有用于在WAN(比如因特網(wǎng))上建立通信的其他裝置。在網(wǎng)絡(luò)環(huán)境中,所描繪的與計算機相關(guān)的程序模塊或其部分可被存儲在遠程存儲設(shè)備中。要知道的是,此處所描述的網(wǎng)絡(luò)連接是示例性的且可使用建立計算機之間的通信鏈路的其它裝置。IPU102還被可操作地連接于數(shù)字圖像數(shù)據(jù)庫108,數(shù)字圖像數(shù)據(jù)庫108存儲與數(shù)字圖像處理相關(guān)的數(shù)據(jù)。該數(shù)字圖像數(shù)據(jù)庫108可以是簡單的固定磁盤驅(qū)動器和/或可移動磁盤驅(qū)動器、接納光學(xué)存儲介質(zhì)的光學(xué)介質(zhì)讀寫器(例如,CD-ROM輸入設(shè)備)、和/或包括和/或適于接收和讀取數(shù)字圖像存儲介質(zhì)的任何其它合適的數(shù)字圖像數(shù)據(jù)存儲設(shè)備。圖1的裝置100可任選地包括用戶界面(UI)110,UI110被可操作地連接于IPU102。UI110包括任何合適的輸入/輸出設(shè)備,被用戶用于從圖像處理單元102接收信息和將信息輸入圖像處理單元102。合適的用戶界面設(shè)備包括鍵盤/小鍵盤、機械按鈕/開關(guān)、具有圖形用戶界面的視頻顯示終端、諸如操縱桿或鼠標(biāo)之類的指點設(shè)備、語音命令輸入設(shè)備、觸摸屏、和/或可被用戶用來從IPU102接收信息和將信息輸入IPU102的任何其它合適的輸入/輸出設(shè)備。本領(lǐng)域普通技術(shù)人員會意識到在UI110和輸出設(shè)備106之間可能存在一些重疊。例如,輸出設(shè)備106的視頻顯示終端或屏幕也可以是UI110的部件且提供視覺信息給用戶。本領(lǐng)域普通技術(shù)人員還會意識到根據(jù)圖1制成的包括IPU102的裝置可通過各種已知系統(tǒng)進行提供?,F(xiàn)在參考圖2,在更具體的層面上,示例性方法的步驟可包括:(1)接收和/或確定(不然獲取)討論中的停車場的布局(201);(2)針對一或多個視角根據(jù)觀測像素屬于給定停車體積的概率(即,成員概率密度函數(shù),或者PDF)估計停車位體積(202);(3)從優(yōu)選地安裝在諸如燈柱之類的架高結(jié)構(gòu)上的至少一個數(shù)字攝像頭獲取停車場的一或多個圖像幀(203);(4)利用至少一個車輛檢測器(或車輛檢測規(guī)則系統(tǒng)(algorithm))在所獲取的圖像幀上執(zhí)行像素分類以確定給定像素對應(yīng)于車輛的可能性(204);(5)基于空間變化的成員PDF以及相關(guān)區(qū)域內(nèi)車輛像素的可能性計算停車位被車輛占用的概率(205);以及(6)通過比較計算出的概率和預(yù)定閾值(Th)確定停車場的空位(206)。要注意的是,如圖2中所示,可引入反饋回路207以強調(diào)步驟(203-206)中的至少一些通常可隨著時間的推移且根據(jù)需要被重復(fù),但是其它步驟(201和202)對于給定的停車場和攝像頭安裝而言一般只執(zhí)行一次。下面將更詳細地說明這些步驟中的每一個。第一步驟(201)是接收和/或確定相關(guān)停車場的停車位布局。為了確定停車場中的空位(即,多少車位是可用的且更重要的是它們的位置在哪里),擁有關(guān)于相關(guān)停車場的布局的一些知識是有益的。有多種方式收集這種信息。例如,可使用現(xiàn)有的停車場藍圖加上攝像頭安裝設(shè)置的知識來推斷停車場布局。還可通過將每天收到的停車場占用情況的部分信息放在一起來學(xué)習(xí)隨著時間推移的停車場布局。另一方法是直接從已獲取的圖像(理想地從該停車場大部分空置時獲取的圖像)檢測限定停車位的標(biāo)記(或者線)。關(guān)于示例性實施方式,利用UI300的半手動方法可被用來執(zhí)行這個任務(wù)(參見圖3)。例如,通過UI300,可要求用戶畫線(不然輸入),其中這些線的交叉可限定停車位的角落。注意:由于每個攝像頭安裝只需要限定一次停車位布局,所以這種方法對該實施而言是適當(dāng)?shù)販?zhǔn)確和有效的。注意:對某些停車場而言,適當(dāng)時候也可使用曲線來限定停車位。如圖3中所示,示例性UI300一般包括至少一個停車場圖像畫面302。此外,UI300可包括其它種種功能,比如“打開圖像”(304)、“畫線”(306)、“加載線”(308)、“保存線”(310)、“像素分類”(312)、“選擇方法”(314)(例如,LBP、TextonBoost、LBP+TextonBoost)、“占用估計”(316)、“地面實測”(318)、“保存地面實況”(320)和/或“評估”(322)。但要理解的是,其它UI布局也是可行的且其它功能也可被包括?,F(xiàn)在參考圖2,該方法的第二步驟(202)是查明攝像頭的透視圖,估計停車體積。也就是說,由于攝像頭的透視圖,停放的車子看起來會占用比單個停車位更大的空間(或者延伸越過限定的停車線)。在這一點上,圖4示出了利用提議的車輛體積建模方法針對停車場的給定圖像/視圖402的停車場體積的估計。在該步驟,估計與圖像402中的停車位相關(guān)的體積,即,與成像的停車位相關(guān)的三維(3-D)區(qū)域,在該區(qū)域中可觀察停放的車輛。該體積可例如通過使停車位逼近平行六面體來估計。這可通過使用來自第一步驟201的停車位標(biāo)記線(404)以及將高度估計為例如四條底邊(406和408)的平均長度的一半來完成。從給定攝像頭角度看到的平行六面體面層(mask)可通過簡單的幾何操作獲得,所述幾何操作針對給定停車位產(chǎn)生相關(guān)3-D區(qū)域(確切地說是體積)的投影(408)。接下來,針對該區(qū)域內(nèi)的每一個像素,指定是給定停車位的像素成員的概率。這是優(yōu)選的,因為考慮到代表3-D場景的二維(2-D)圖像像素的位置有固有的不確定性。這種成員PDF是距相關(guān)區(qū)域的中心的距離(中心的像素具有較大的權(quán)重)和可與相鄰?fù)\囄恢丿B的區(qū)域(408中吸藏的、色彩編碼的區(qū)域)的數(shù)量的函數(shù)。這種成員PDF的細節(jié)在第五步驟(205)中進行描述。在該方法的第三步驟(203)中,從安裝在例如燈柱或類似架高結(jié)構(gòu)上的至少一個數(shù)字攝像頭獲取停車場的至少一個圖像幀l(x)。該圖像會在后續(xù)的步驟中被進一步處理以確定停車場和/或該停車場內(nèi)相關(guān)停車位的占用情況。該方法的第四步驟(204)是利用至少一種類型的車輛檢測器(或車輛檢測規(guī)則系統(tǒng)(algorithm))執(zhí)行像素分類。更具體地,在所獲得的圖像上利用至少一個車輛檢測器執(zhí)行像素分類以確定像素屬于車輛的可能性。在優(yōu)選的實施方式中,兩種不同的對象識別規(guī)則系統(tǒng)(algorithm)(即,車輛檢測器或分類器)的分類/輸出被整合。例如,可以采用使用旋轉(zhuǎn)不變的局部二元模式(LBP)作為輸入特征的支持向量機(SVM)分類器和/或TextonBoost(TB)分類器。但要理解的是,該示例性方法可使用其它車輛檢測器。該步驟的輸出是概率圖Pv(x),其表明像素x屬于車輛的可能性(從而提供車位已被占用的證據(jù))。圖5示出了對圖像502應(yīng)用LBP-SVM車輛分類器時的取樣結(jié)果504。參考圖6,下面將更詳細地描述使用旋轉(zhuǎn)不變的LBP作為輸入特征的SVM分類器。一般而言,局部二元模式是良好的圖像紋理描述符且已被成功地運用于人臉識別領(lǐng)域。因此,針對該圖像中的每一個像素,考慮了大約按選定半徑r遠離中心的周圍的鄰近像素,如圖6的第一幅圖602中所示。具有大于或等于給定像素(例如,中心像素)的值的每一個鄰近像素被分配編碼1,具有較低值的每一個鄰近像素被分配編碼0。然后遍歷所得的二進制碼序列,如第二幅圖604中所示。所以,當(dāng)考慮8個鄰近像素時,該8個二進制值串在一起形成一個字節(jié)(606)。該二進制值被轉(zhuǎn)換為十進制(例如,11010011),從而獲得一個數(shù)字(211)。該數(shù)字是給定像素的LBP碼值。這個過程針對該圖像中的每一個像素進行重復(fù),從而獲得編碼圖像。一致收斂的(uniform)局部二元模式是在比特序列中的0和1之間具有至少2次轉(zhuǎn)變的模式。例如,下面的模式是一致收斂的:00001100、11110011、111111111、00000000、00011111。而下面的模式是不一致收斂的:00110011、01010101。旋轉(zhuǎn)不變的模式將只是由于循環(huán)偏移而有所不同的所有序列視為等同方式。例如,下面的模式列舉了00110000的所有可能的旋轉(zhuǎn)不變的版本:00011000、00001100、00000110、00000011、10000001、11000000和01100000。在本實施例中,可以指定旋轉(zhuǎn)不變的該組序列的每一個成員中具有最小十進制值的序列。該圖像可被分成m×m像素(例如,m=15)的網(wǎng)格,且可計算每一個塊中的旋轉(zhuǎn)不變一致收斂的LBP值的直方圖。每一個塊可基于地面實況被標(biāo)注(即,人工標(biāo)注的數(shù)據(jù),假定完全正確,用于訓(xùn)練和評估目的)為屬于各種類型對象中的一種,比如車輛、人行道、樹木、天空、建筑物和/或空白(以上都沒有)。但要理解的是,可根據(jù)停車場的位置以及其它環(huán)境因素采用對象類型。每一個塊內(nèi)的值的直方圖可被用作為特征向量以訓(xùn)練SVM分類器。例如,可以利用停車場環(huán)境(setting)中的5種最常見對象,即使一般而言,主要相關(guān)的是車輛類。因此,分類器的輸出通常被視為二進制輸出(這種類型的分類器被標(biāo)記為“硬分類器”),表示像素x是否屬于車輛:接著,將更詳細地描述TextonBoost分類器。TextonBoost是對象識別方法,由JamieShaton在《TextonBoostforImageUnderstanding:Multi-ClassObjectRecognitionandSegmentationbyJointlyModelingTexture,Layout,andContext》(2007)(《用于圖像理解的TextonBoost:通過共同建模的紋理、布局、和背景的多類目標(biāo)識別與分段》(2007))中進行了介紹。它使用條件隨機場模型來學(xué)習(xí)對象類標(biāo)簽在整個給定圖像中的條件分布。該模型利用紋理布局、色彩、位置和邊緣特征。TextonBoost基于前述的類(即,車輛、樹木、人行道、天空、建筑物和/或空白)。類似于LBP,TextonBoost的硬輸出可被用作為表示像素x是否屬于車輛的二進制分類器:注意:當(dāng)只使用一個硬像素分類器時,只計算硬分類輸出。但是,為了更佳的車輛像素檢測,整合多個像素分類器的輸出以產(chǎn)生最后的分類判定是有利的。在這種情況下,可以使用由加權(quán)整合一或多個分類器的輸出而獲得的軟分類輸出。例如,車輛檢測模型可合并LBP和TextonBoost分類器二者。具體地,對于TextonBoost分類器而言,針對像素屬于“車輛”類的概率用于替代硬分類。進一步地,計算每一個類標(biāo)簽的概率的熵,熵是每一個像素處的判定的不確定性的程度。通過按比例調(diào)節(jié)這個值以達到最大值1并從1中減去該結(jié)果,可獲得每一個像素處的判定的確定性的程度。在像素x處的判定的確定性ηx的范圍在0(低確定性)和1(最大確定性)之間。注意:還可以類似的方式整合LBP-SVM分類器的軟概率輸出和TextonBoost分類器的硬輸出下面將說明一種關(guān)于像素x是車輛的概率的模型,該模型利用整合了LBP硬輸出的TextonBoost軟輸出:其中是由TextonBoost輸出的像素對應(yīng)于車輛的軟概率,而是由具有作為輸入的LBP值的SVM分類器提供的像素對應(yīng)于車輛的硬分類輸出。替代地,利用TextonBoost的硬輸出和LBP的硬輸出的關(guān)于像素x是車輛的概率的模型可包括下面的一者:或者其中是由TextonBoost給出的像素對應(yīng)于車輛的硬分類,而是由具有作為輸入的LBP的SVM分類器給出的像素對應(yīng)于車輛的硬分類。雖然已經(jīng)詳細描述了TextonBoost和LBP的特征,但是在分類過程中可使用其它圖像處理功能。例如,可使用梯度方向直方圖(HOG)、旋轉(zhuǎn)不變特征變換(RIFT)、廣義RIFT(G-RIFT)、加速魯棒特征(SURF)、梯度位置和方向直方圖(GLOH)、SIFT(比例不變特征變換)和/或哈里斯角落(HarrisCorners)特性。在該方法的第五步驟(205)中,可基于每一個停車位的相關(guān)區(qū)域內(nèi)的車輛像素的概率的加權(quán)總和(參見第二步驟(202))計算停車位被車輛占用的概率。此處所使用的術(shù)語“相關(guān)區(qū)域”是指可潛在地屬于停在給定停車位中的車輛的像素。在此,空間變化的權(quán)重對應(yīng)于第二步驟(202)中所介紹的成員PDF。更具體地,使用以停車位的相關(guān)區(qū)域的質(zhì)心為中心且以沿著相關(guān)區(qū)域的主導(dǎo)方向為方向的高斯內(nèi)核。這對位于朝相關(guān)區(qū)域的中心的像素賦予更大的權(quán)重。這些權(quán)重根據(jù)相鄰?fù)\囄坏南嚓P(guān)區(qū)域的可能的重疊區(qū)域(可能的吸藏區(qū)域)的數(shù)量被進一步擴展(scale)??梢约俣ù蟛糠周囕v被停放在每一個停車位的中心附近。因為不是所有的車輛都是相同尺寸,所以在車輛體積的中心權(quán)重較大是有道理的據(jù)此,可使用加權(quán)函數(shù),比如下面所示的這個函數(shù):其中x0是停車位體積(相關(guān)區(qū)域)的中心,Σ(a2×2矩陣)包含表示高斯內(nèi)核的旋轉(zhuǎn)和權(quán)重隨像素到中心的距離增加而急降的速率的參數(shù)。由于可用的攝像頭安裝位置所提供的有限選擇,會出現(xiàn)一些吸藏區(qū)域(occlusion)。所述吸藏區(qū)域本身表現(xiàn)為例如停車位體積(相關(guān)區(qū)域)的重疊3-D模型。因此,每一個相關(guān)區(qū)域可被分為許多子區(qū)域,其中每一個子區(qū)域以與相鄰?fù)\囄坏目赡艿闹丿B(吸藏)的數(shù)量為特征:沒有吸藏、可被一個吸藏、可被兩個吸藏,等等。對可出現(xiàn)吸藏的子區(qū)域中的像素而言,一或多個通常毗鄰的車位可有助于確定像素屬于車輛的概率(若不恰當(dāng)處理,這會導(dǎo)致多個計數(shù))。為了對這種限制進行完善,以的形式規(guī)定了子區(qū)域的權(quán)重,其中k表示打折(discount)的一個會強加到潛在的吸藏子區(qū)域,n是擁有(claim)這種子區(qū)域(重疊)的停車位的數(shù)量。結(jié)合上述兩個權(quán)重(高斯內(nèi)核權(quán)重和吸藏補償權(quán)重),每一個像素x的最終空間變化權(quán)重被規(guī)定為w(x)=wg(x)w0。在每一個相關(guān)區(qū)域(即,每一個停車位)內(nèi),這些值被正規(guī)化為總計為1,從而代表成員PDF(參見圖7)。圖7示出了樣本停車場的車輛體積(702)、樣本車輛體積(704)、樣本車輛體積的對應(yīng)的具有高斯內(nèi)核的成員PDF(706)、以及樣本車輛體積的對應(yīng)的具有高斯內(nèi)核和吸藏補償?shù)淖罱K成員PDF(708)。直觀地說,靠近車輛體積的中心的像素和位于針對每一個3-D車輛體積停車位沒有吸藏的子區(qū)域內(nèi)的像素權(quán)重較高。停車位s被占用的概率由屬于s的每一個個體像素被占用的概率的總和給出。因此,這個概率可由像素x被分類為車輛以及像素x是停車位s的成員的聯(lián)合概率給出??杉俣ㄟ@兩者是獨立的,從而該聯(lián)合概率等于像素x是車輛的概率(由第四步驟(204)給出)和像素x屬于停車位s的概率(由成員PDF給出)的積。數(shù)學(xué)上這可表示為:(5)代表占用的概率的一個這樣的值針對每一個停車位s被獲取。然后,將該值與閾值進行比較,作出二元判定。在該方法的第六步驟(206)中,通過計算出的每一個停車位的概率和預(yù)定閾值(Th)的比較,確定停車場空位。一種簡單的選擇是,例如,Th=0.5。但要理解的是,其它值也是可行的。更復(fù)雜的方法可基于分類器的特征和/或通過訓(xùn)練被使用??蛇x地,預(yù)定閾值可基于額外信息進行調(diào)整,該額外信息包括進出所述停車場的車輛的總數(shù)和空停車位的總數(shù)中的至少一者。所得信息可進而通過無線電、因特網(wǎng)、路標(biāo)和/或GPS輔助信號轉(zhuǎn)達給司機或其它相關(guān)人員。為了說明示例性實施方式的可行性和性能,收集各種停車場圖像以形成數(shù)據(jù)集。該數(shù)據(jù)集由三組圖像組成。第一組62幅圖像由大約五個不同停車場的在一天的大約兩個不同的時間拍攝的各種視圖組成。這些圖像的大部分是在晴天拍攝的,但有一些受到霧的影響。第二數(shù)據(jù)集由一個停車場在一天的各個時間在不同照明條件下獲取的圖像組成。這些圖像全部從十分相似的角度拍攝。第三組圖像由從谷歌圖片搜索收集的10幅圖像組成。這是最多樣化的數(shù)據(jù)集,因為每一幅圖像在照明條件、視角等方面都不同于其余圖像。用于對象分類的像素級地面實況針對第一組中的32幅圖像被手動創(chuàng)建。這些在車輛檢測器的訓(xùn)練中被使用。剩余的圖像(即第一組中的30幅、第二組中的15幅以及第三組中的10幅)被用于測試該系統(tǒng)。由用戶輸入為這些圖像創(chuàng)建停車位標(biāo)記線,以及每一個停車位的占用地面實況。下面展示的是該數(shù)據(jù)集的以下性能分析。下面的表1示出了在不同數(shù)量的圖像(9、25和32)上訓(xùn)練的半徑為1和2的LBP的性能以及在第一數(shù)據(jù)集中的32幅圖像上訓(xùn)練的TextonBoost的性能的概要,全部在吸藏參數(shù)k=2的情況下作出。這些值代表貫穿整個圖像集合的已占停車位和空停車位的正確檢測的百分率。正如所料,這些方法通常在第一數(shù)據(jù)集上效果最好,因為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)類型相同。在更現(xiàn)實的方案中,訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)彼此類似,因為一旦系統(tǒng)建立,訓(xùn)練便從停車場的相似視圖完成。第一數(shù)據(jù)集由大約5個停車場的不同視圖組成,從而在只有一個停車場、從一個視圖觀察的情況下工作時預(yù)計性能提升。其它兩個數(shù)據(jù)集上的結(jié)果探索了推廣這種方法的可行性。注意:在9幅圖像上訓(xùn)練的半徑為1的LBP通常表現(xiàn)最好。較多訓(xùn)練圖像反而降低了性能的可能原因是發(fā)生在SVM分類器階段的潛在的過度擬合。表1車輛檢測器的分類準(zhǔn)確度接著,考慮吸藏參數(shù)k的影響。由下面的表2可知,k=2時,該規(guī)則系統(tǒng)(algorithm)通常表現(xiàn)最好。本實驗使用在9幅圖像上訓(xùn)練的r=1的LBP方法。表2吸藏參數(shù)對分類準(zhǔn)確度的影響的探索測試數(shù)據(jù)集k=1k=1.5k=2k=3k=4第一組8183858485第二組6464636564第三組8381817979平均76.076.076.276.276.0一般而言,增加圖像尺寸(從而增加車輛對象的分辨率)會將在9幅圖像上訓(xùn)練的r=1的LBP的準(zhǔn)確度從85%增加到88%。接著,考慮最佳LBP方法(r=1、在9幅圖像上訓(xùn)練)和TextonBoost的整合,使用k=2。下表3的結(jié)果顯示,LBP和TB分類器的整合相較于單個分類器在結(jié)果上有少許改進。直觀地,整合方法會試圖在細到像素級在多個分類器中選出最佳的。整合策略部分實現(xiàn)了所需效果。表3具有最佳參數(shù)的各個分類器的分類準(zhǔn)確度測試數(shù)據(jù)集LBPTBLBP+TB第一組888187第二組607372第三組836176平均76.871.378.1最后,出于說明目的,圖8中示出了具有停車場圖像802和占用(或者中間)結(jié)果804的UI800的一個實施例。中間結(jié)果804表示:(1)對每一個類進行色彩編碼的分類器輸出(806),(2)從用戶引導(dǎo)線估計的停車位(808),(3)停車位的疊加體積(810),以及(4)色彩代表對具體像素而言可能的吸藏數(shù)量的吸藏示意圖(812)。如先前所述,UI800可包括其它種種功能,比如打開圖像(814)、畫線(816)、加載線(818)、保存線(820)、像素分類(822)、選擇方法(824)(例如,LBP、TextonBoost、LBP+TextonBoost)、占用估計(826)、地面實測(828)、保存地面實況(830)和/或評估(832)。示例性實施方式參照轎車(car)進行描述。但是,可在其它車輛(比如摩托車和卡車)上訓(xùn)練該規(guī)則系統(tǒng)(algorithm),因為它們顯示出類似的特征??梢钥紤]用于結(jié)合LBP和TB(TextonBoost)結(jié)果的其它整合方法。例如{LBP∧TB},根據(jù)該方法,如果LBP和TB二者的結(jié)果均表明車位被占用,則車位被視為占用。另一示例為{LBP∨TB},根據(jù)該方法,如果LBP或TB的結(jié)果之一表明車位被占用,則車位被視為占用。除非車位被占用的確定性高,否則前一方法的輸出偏向空位判定。后一方法的輸出偏向車位被占的判定。判定偏向不同組合的選擇由具體的應(yīng)用需要驅(qū)動。當(dāng)可獲得給定停車場的原始統(tǒng)計時,比如停車容量、進出車輛的數(shù)量,等等,這些信息可被用來完美我們的方法中的參數(shù)。一個簡單的例子,設(shè)定的概率閾值(例如,LBP和TB分類器為0.5,LBP+TB分類器為0.3)可被設(shè)置在占用和空置輸出之間使得占用的總數(shù)和空置的總數(shù)最接近停車場的給定的原始統(tǒng)計。示例性方法可在計算機程序產(chǎn)品中被實施,該計算機程序產(chǎn)品可在計算設(shè)備上被執(zhí)行。該計算機程序產(chǎn)品可以是非暫時的計算機可讀的其上記錄控制程序的記錄介質(zhì)(比如磁盤、硬盤驅(qū)動器),或者可以是傳輸載波(在其中,控制程序被體現(xiàn)為數(shù)據(jù)信號)。計算機可讀介質(zhì)的常規(guī)形式包括,例如,軟盤、軟磁盤、硬盤、磁帶、或者任何其它磁性存儲介質(zhì)、CD-ROM、DVD、或者任何其它光學(xué)介質(zhì)、RAM、PROM、EPROM、閃存EPROM、或者其它存儲芯片或存儲匣、傳輸介質(zhì)(比如聲波或光波,比如無線電波和紅外數(shù)據(jù)通信期間產(chǎn)生的那些,諸如此類)、或者計算機可讀并可用的任何其它介質(zhì)。