專利名稱:用于識(shí)別媒體內(nèi)容中的對(duì)象的方法和裝置的制作方法
用于識(shí)別媒體內(nèi)容中的對(duì)象的方法和裝置
背景技術(shù):
服務(wù)提供商和設(shè)備制造者(例如無(wú)線、蜂窩等)不斷面臨著挑戰(zhàn)以例如通過提供有競(jìng)爭(zhēng)力的網(wǎng)絡(luò)服務(wù)向消費(fèi)者提供價(jià)值和便利。開發(fā)的一個(gè)領(lǐng)域是使用用于自動(dòng)化識(shí)別媒體內(nèi)容中的臉部、人物和其他對(duì)象或特征(例如,識(shí)別表情,例如面部表情、體態(tài)、移動(dòng)、話音、聲音等),所述媒體內(nèi)容例如圖像、視頻流以及音頻流。例如,許多現(xiàn)代化通信設(shè)備(例如,智能電話、手機(jī)等)通常配置有照相機(jī)和其他傳感器(例如,麥克風(fēng)),使得設(shè)備在捕獲的內(nèi)容上執(zhí)行此類的識(shí)別(例如,面部、話音、表情識(shí)別等)。然而,這些設(shè)備通常使用用于面部和/或?qū)ο笞R(shí)別的常規(guī)方法,這些常規(guī)方法傳統(tǒng)上致力于在某些條件下(例如,噪聲、變化的表情、壞的角度、差的照明、低分辨率圖像或聲音等)準(zhǔn)確地執(zhí)行。相應(yīng)地,服務(wù)提供商和設(shè)備制造商面臨改進(jìn)面部和/或?qū)ο笞R(shí)別的準(zhǔn)確性的顯著技術(shù)挑戰(zhàn)。一#示例實(shí)施例因此,需要一種方式來(lái)有效地和高效地識(shí)別媒體內(nèi)容中的面部、對(duì)象和其他特征。根據(jù)一個(gè)實(shí)施例,一種方法包括確定在裝置處檢測(cè)內(nèi)容流中的一個(gè)或多個(gè)對(duì)象。該方法還包括確定捕獲所述內(nèi)容流中的一個(gè)或多個(gè)對(duì)象的一個(gè)或多個(gè)表征。該方法進(jìn)一步包括將所述一個(gè)或多個(gè)表征與所述內(nèi)容流的一個(gè)或多個(gè)實(shí)例關(guān)聯(lián)。根據(jù)另一實(shí)施例,一種設(shè)備包括至少一個(gè)處理器;以及包括計(jì)算機(jī)程序代碼的至少一個(gè)存儲(chǔ)器,該至少一個(gè)存儲(chǔ)器和該計(jì)算機(jī)程序代碼配置成使用該至少一個(gè)處理器,至少部分地促使該設(shè)備確定在裝置處檢測(cè)內(nèi)容流中的一個(gè)或多個(gè)對(duì)象。還促使該設(shè)備確定捕獲所述內(nèi)容流中的一個(gè)或多個(gè)對(duì)象的一個(gè)或多個(gè)表征。進(jìn)一步促使該設(shè)備將所述一個(gè)或多個(gè)表征與所述內(nèi)容流的一個(gè)或多個(gè)實(shí)例關(guān)聯(lián)。根據(jù)另一實(shí)施例,一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其承載一個(gè)或多個(gè)指令的一個(gè)或多個(gè)序列,當(dāng)由一個(gè)或多個(gè)處理器執(zhí)行時(shí),該一個(gè)或多個(gè)指令至少部分地促使設(shè)備確定在裝置處檢測(cè)內(nèi)容流中的一個(gè)或多個(gè)對(duì)象。該設(shè)備還被促使確定捕獲所述內(nèi)容流中的一個(gè)或多個(gè)對(duì)象的一個(gè)或多個(gè)表征。該設(shè)備進(jìn)一步被促使將所述一個(gè)或多個(gè)表征與所述內(nèi)容流的一個(gè)或多個(gè)實(shí)例關(guān)聯(lián)。根據(jù)另一實(shí)施例,一種設(shè)備包括用于確定在裝置處檢測(cè)內(nèi)容流中的一個(gè)或多個(gè)對(duì)象的裝置。該設(shè)備還包括用于確定捕獲所述內(nèi)容流中的一個(gè)或多個(gè)對(duì)象的一個(gè)或多個(gè)表征的裝置。該設(shè)備進(jìn)一步包括用于將所述一個(gè)或多個(gè)表征與所述內(nèi)容流的一個(gè)或多個(gè)實(shí)例關(guān)聯(lián)的裝置。簡(jiǎn)單地通過說明包括針對(duì)實(shí)施本發(fā)明所設(shè)想的最佳方式的很多特定實(shí)施例和實(shí)現(xiàn),從下面的詳細(xì)描述將容易顯見本發(fā)明的其他方面、特征和優(yōu)點(diǎn)。本發(fā)明還能夠具有其他或不同實(shí)施例,且其若干細(xì)節(jié)可以在各個(gè)明顯方面進(jìn)行修改,所有這些都不偏離本發(fā)明的精神和范圍。因此,附圖和說明本質(zhì)上是說明性而非限制性的。
通過示例而非限制性方式說明本發(fā)明的實(shí)施例,在附圖的各圖中
圖1是根據(jù)一個(gè)實(shí)施例的能夠識(shí)別媒體內(nèi)容中的對(duì)象的系統(tǒng)的視圖;圖2是根據(jù)一個(gè)實(shí)施例的捕獲管理器的組件的視圖;圖3是根據(jù)一個(gè)實(shí)施例的用于識(shí)別媒體內(nèi)容中的對(duì)象的過程的流程圖;圖4是根據(jù)一個(gè)實(shí)施例的用于將識(shí)別信息與內(nèi)容流的多個(gè)實(shí)例關(guān)聯(lián)的過程的流程圖;圖5是根據(jù)一個(gè)實(shí)施例的用于將最佳面部表征與內(nèi)容流的圖像實(shí)例關(guān)聯(lián)的過程的流程圖;圖6是根據(jù)一個(gè)實(shí)施例的用于將識(shí)別信息與圖像實(shí)例/面部表征對(duì)關(guān)聯(lián)的過程的流程圖;圖7是根據(jù)一個(gè)實(shí)施例的用于將識(shí)別信息與數(shù)據(jù)庫(kù)中的圖像實(shí)例/面部表征對(duì)關(guān)聯(lián)的過程的流程圖;圖8A-8B是根據(jù)各種實(shí)施例的在圖3的過程中捕獲的內(nèi)容流的實(shí)例中的對(duì)象的表征的視圖;圖9A-9B是根據(jù)各種實(shí)施例的在圖3的過程中從不同角度捕獲的內(nèi)容流的實(shí)例中的對(duì)象的表征的視圖;圖10是根據(jù)一個(gè)實(shí)施例的用于使用圖4、6和7的過程的用戶接口的視圖;圖11是可以用于實(shí)施本發(fā)明的一個(gè)實(shí)施例的硬件的視圖;圖12是可以用于實(shí)施本發(fā)明的一個(gè)實(shí)施例的芯片組的視圖;以及圖13是可以用于實(shí)施本發(fā)明的一個(gè)實(shí)施例的移動(dòng)終端(例如手機(jī))的視圖。
具體實(shí)施例方式公開了用于識(shí)別媒體內(nèi)容中的對(duì)象的方法、設(shè)備和計(jì)算機(jī)程序的示例。在下面的描述中,出于解釋目的,提出了各種特定細(xì)節(jié)以提供對(duì)本發(fā)明的實(shí)施例的徹底理解。然而,對(duì)于本領(lǐng)域技術(shù)人員而言,很明顯的是可以不使用這些特定細(xì)節(jié)或可以使用等同布置來(lái)實(shí)現(xiàn)本發(fā)明的實(shí)施例。在其他實(shí)例中,以框圖形式示出已知結(jié)構(gòu)和裝置,以避免不必要地混淆本發(fā)明的實(shí)施例。圖1是根據(jù)一個(gè)實(shí)施例的能夠識(shí)別媒體內(nèi)容中的對(duì)象的系統(tǒng)的視圖。如前所提到的,例如面部或話音識(shí)別的識(shí)別方法已經(jīng)開發(fā)了數(shù)年。作為該開發(fā)的結(jié)果,識(shí)別方法已經(jīng)變得更為復(fù)雜和準(zhǔn)確。例如,通過分析例如眼睛、鼻子和嘴的臉部顯著特征,以及到關(guān)鍵面部特征的相對(duì)距離,面部識(shí)別方法已經(jīng)被擴(kuò)展到識(shí)別面部表情。附加地,話音和語(yǔ)音識(shí)別方法已經(jīng)從識(shí)別語(yǔ)音擴(kuò)展到識(shí)別有聲表達(dá),例如笑聲和哭聲,以及通常的周圍或背景噪聲(例如、交通、來(lái)自聚會(huì)的聲音等)。然而,如前所指出,識(shí)別方法仍努力于在某些條件下(例如,噪聲、變化的表情、壞的角度、差的照明、低分辨率圖像或聲音等)執(zhí)行,這使得識(shí)別不會(huì)最優(yōu)或者有時(shí)不準(zhǔn)確。此外,傳統(tǒng)的識(shí)別方法通常操作在捕獲內(nèi)容的特定實(shí)例上(例如,場(chǎng)景的單次捕獲的照片),由此通常依賴于特定實(shí)例的識(shí)別條件上。作為結(jié)果,在與捕獲實(shí)例中的識(shí)別主體(例如,對(duì)象或臉部,也統(tǒng)稱為對(duì)象)關(guān)聯(lián)的條件對(duì)于識(shí)別不夠理想的情況下,傳統(tǒng)的識(shí)別方法可能無(wú)法準(zhǔn)確地識(shí)別對(duì)象。例如,當(dāng)臉部遠(yuǎn)離、方位不直接對(duì)著捕獲裝置(例如,照相機(jī)、攝像機(jī)等),受陰影遮蔽等,當(dāng)圖像被捕獲時(shí),面部識(shí)別可以產(chǎn)生不準(zhǔn)確的結(jié)果。為解決該問題,圖1的系統(tǒng)100引入了存儲(chǔ)對(duì)象的最佳表征或?qū)?duì)象的最佳表征與對(duì)象的相應(yīng)捕獲實(shí)例(例如,照片、音頻記錄、視頻記錄等)關(guān)聯(lián)的能力。在一個(gè)實(shí)施例中,這些最佳表征(例如,在更適合于例如當(dāng)臉正直視照相機(jī)時(shí)執(zhí)行對(duì)象識(shí)別的條件下捕獲的表征)可以作為元數(shù)據(jù)附接到捕獲的實(shí)例。在另一個(gè)實(shí)施例中,當(dāng)應(yīng)用或其他服務(wù)試圖在捕獲的實(shí)例上執(zhí)行對(duì)象識(shí)別時(shí),對(duì)象的附接或關(guān)聯(lián)的最佳表征可以識(shí)別為替換捕獲實(shí)例中的實(shí)際對(duì)象。例如,在其中當(dāng)捕獲的實(shí)例是包含一個(gè)或多個(gè)臉部的相片時(shí),臉部的一個(gè)或多個(gè)最佳表征可以附接到每個(gè)相片。通過這種方式,臉部可以被自動(dòng)地識(shí)別,即使臉部例如從照相機(jī)轉(zhuǎn)開或否則不清楚。更具體地,系統(tǒng)100在內(nèi)容流的實(shí)例(例如,相片、音頻記錄、視頻記錄等)被捕獲之前、之后和/或同時(shí)檢測(cè)內(nèi)容流中的對(duì)象。例如,內(nèi)容流表征連續(xù)地或基本上連續(xù)地在捕獲設(shè)備處接收到的內(nèi)容,例如在照相機(jī)的取景器處接收到的圖像或在打開的麥克風(fēng)處接收到的音頻。一旦在內(nèi)容流中檢測(cè)到對(duì)象,系統(tǒng)100可以隨關(guān)于對(duì)象改變的情形(例如,人員走來(lái)走去,臉部轉(zhuǎn)離照相機(jī)、照明改變等)來(lái)持續(xù)跟蹤對(duì)象。并發(fā)地,系統(tǒng)100捕獲內(nèi)容流中的對(duì)象的表征(例如,連續(xù)地或周期性地)。在一個(gè)實(shí)施例中,系統(tǒng)100可以在內(nèi)容流的實(shí)例被捕獲之前、之后和/或同時(shí)來(lái)捕獲對(duì)象的表征。在另一個(gè)實(shí)施例中,當(dāng)用戶發(fā)起對(duì)包括對(duì)象的內(nèi)容流的特定實(shí)例的捕獲時(shí)(例如,當(dāng)激勵(lì)照相機(jī)上的快門以拍攝相片時(shí)),跟蹤的對(duì)象信息,以及對(duì)象的最佳表征的相應(yīng)一個(gè)或多個(gè)可以與捕獲的實(shí)例關(guān)聯(lián)或標(biāo)記到捕獲的實(shí)例。在一些實(shí)施例中,跟蹤信息包括標(biāo)識(shí)至少在捕獲實(shí)例內(nèi)的對(duì)象的相對(duì)位置的信息,由此使得系統(tǒng)100能夠?qū)?duì)象的最佳表征與捕獲的實(shí)例內(nèi)的對(duì)象的位置關(guān)聯(lián)。如上所指出,對(duì)于作為實(shí)例的一部分捕獲的任意對(duì)象,系統(tǒng)100并不需要依賴于實(shí)例中存在的對(duì)象的特定表征用于識(shí)別目的。相反,系統(tǒng)100可以使用在實(shí)例被捕獲之前、之后和/或同時(shí)捕獲的對(duì)象的任意表征來(lái)表示內(nèi)容流的實(shí)例中的對(duì)象。在另一個(gè)實(shí)施例中,系統(tǒng)100可以基于一個(gè)或多個(gè)準(zhǔn)則(例如,位置、角度、照明、清晰度、模糊強(qiáng)度、噪聲、分辨率等)來(lái)選擇表征。例如,如果表征中的對(duì)象是臉部,則可以基于一個(gè)或多個(gè)優(yōu)選的面部表情來(lái)選擇表征。在這種情形下,如果相應(yīng)的臉部正在微笑或大笑,則可以選擇表征。在一些情形中,當(dāng)臉部具有最為中性的表情時(shí)(例如,沒有表情),則可以選擇最佳表征。在另一個(gè)實(shí)施例中,可以持續(xù)地、周期性地、在預(yù)定的調(diào)度處捕獲表征,直到表征的質(zhì)量(例如,適于對(duì)象識(shí)別)滿足預(yù)定的質(zhì)量閾值。盡管表征可以被持續(xù)地捕獲(例如,只要捕獲裝置加電),預(yù)定質(zhì)量閾值條件允許捕獲至少滿足預(yù)定質(zhì)量閾值的表征,并且通過避免不必要捕獲額外的表征來(lái)允許例如移動(dòng)裝置保護(hù)電池壽命。此后,系統(tǒng)100可以將例如對(duì)象的最佳表征與內(nèi)容流的實(shí)例關(guān)聯(lián)。根據(jù)另一實(shí)施例,系統(tǒng)100可以通知用戶是否滿足質(zhì)量閾值,并且要求用戶將照相機(jī)指向質(zhì)量閾值沒有被滿足的臉部或?qū)ο蟆Mㄟ^這種方式,用戶可以嘗試除了捕獲場(chǎng)景的實(shí)際實(shí)例或相片以外,直接捕獲最佳表征。如圖1中所示,系統(tǒng)100包括用戶設(shè)備(UE) 101或具有經(jīng)由通信網(wǎng)絡(luò)105到服務(wù)平臺(tái)103的連接性的多個(gè)UE101a-101n。盡管服務(wù)平臺(tái)103已經(jīng)示為通信網(wǎng)絡(luò)105的獨(dú)立組件,可以預(yù)期服務(wù)平臺(tái)103可以并入進(jìn)包括以下討論的任意組件的系統(tǒng)100的任意其他組件。在一個(gè)實(shí)施例中,UElOl可以包括捕獲管理器107或連接到捕獲管理器107。UElOl也可以包括或被連接到捕獲存儲(chǔ)器109。捕獲管理器107可以與捕獲存儲(chǔ)器109通信以訪問或存儲(chǔ)媒體數(shù)據(jù)或任意其他形式的數(shù)據(jù)。捕獲管理器107可以與UE中或與UE連接的媒體捕獲裝置(例如,數(shù)字照相機(jī)、攝像機(jī)、聲音記錄器等)通信以檢測(cè)內(nèi)容流中的對(duì)象,并且捕獲內(nèi)容流的對(duì)象表征和實(shí)例。捕獲管理器107可以進(jìn)一步執(zhí)行將表征與內(nèi)容流的實(shí)例關(guān)聯(lián)的功能。此外,捕獲管理器107可以執(zhí)行確定內(nèi)容流中的對(duì)象的識(shí)別信息并且將識(shí)別信息與內(nèi)容流的實(shí)例關(guān)聯(lián)的功能。捕獲管理器107也可以提供視覺化(例如,圖形用戶接口)以允許用戶添加或修改識(shí)別信息,以輔助捕獲管理器107確定并且將識(shí)別信息與內(nèi)容流的實(shí)例關(guān)聯(lián)。進(jìn)一步,捕獲管理器107能夠使用在UElOl處可獲得的任意形式的通信來(lái)操控各種通信操作。例如,捕獲管理器107可以經(jīng)由UElOl來(lái)管理傳入或傳出的通信,并且在此類通信被接收和處理時(shí)顯示它們。在某些實(shí)施例中,捕獲管理器107也可以提供視覺化(例如,圖形用戶接口)來(lái)允許用戶通過使用任意可獲得形式的通信的通信網(wǎng)絡(luò)105來(lái)控制通信或共享媒體。例如,捕獲管理器107可以包括選項(xiàng)來(lái)選擇與UElOla-1Oln通信,以便共享媒體數(shù)據(jù)或其他形式的數(shù)據(jù)。進(jìn)一步,捕獲管理器107可以包括允許用戶與任意基于因特網(wǎng)的網(wǎng)站通信或經(jīng)由服務(wù)平臺(tái)103來(lái)使用電子郵件服務(wù)的接口。此外,捕獲管理器107也包括用于與社交網(wǎng)絡(luò)服務(wù)交互,并且支持從UElOl上傳或共享媒體到所述社交網(wǎng)絡(luò)服務(wù)的接□。服務(wù)平臺(tái)103可以執(zhí)行與如這里所描述的在媒體內(nèi)容中檢測(cè)、跟蹤和識(shí)別對(duì)象關(guān)聯(lián)的各種計(jì)算。此外或可替換地,可以針對(duì)UElOl來(lái)執(zhí)行至少一些或所有的計(jì)算。例如,UElOl可以向服務(wù)平臺(tái)103發(fā)送對(duì)象表征,以便執(zhí)行一個(gè)或多個(gè)表征和一個(gè)或多個(gè)其他表征之間的比較計(jì)算,以便從兩組中確定最好的對(duì)象表征。在計(jì)算結(jié)果后,服務(wù)平臺(tái)103可以向UElOl發(fā)送計(jì)算的結(jié)果。在另一個(gè)例子中,通過向服務(wù)平臺(tái)103發(fā)送圖像實(shí)例(例如,作為元數(shù)據(jù)附接到或標(biāo)記到捕獲的圖像文件的對(duì)象的最佳圖像)內(nèi)的對(duì)象的表征,UElOl可以請(qǐng)求最近捕獲的圖像實(shí)例(例如,在UElOl處捕獲的相片)的識(shí)別信息。響應(yīng)于此,服務(wù)平臺(tái)103可以將發(fā)送的表征與數(shù)據(jù)庫(kù)中的其他表征進(jìn)行比較,該其他表征與具有識(shí)別信息的類似圖像實(shí)例(例如,相同對(duì)象的先前捕獲和識(shí)別的相片)關(guān)聯(lián)。另外或可選地,服務(wù)平臺(tái)103可以使用一個(gè)或多個(gè)識(shí)別算法來(lái)從發(fā)送的表征和/或捕獲的圖像實(shí)例生成識(shí)別信息。例如,服務(wù)平臺(tái)103可以通過構(gòu)建表征的視覺簽名并且接著將構(gòu)建的簽名與已知簽名(例如,先前獲取的簽名、來(lái)自數(shù)據(jù)庫(kù)的已知簽名、通過因特網(wǎng)搜索獲得的已知簽名等)進(jìn)行比較來(lái)執(zhí)行視覺對(duì)象識(shí)別。在一個(gè)例子中,視覺簽名基于在表征中的標(biāo)識(shí)特征、特征之間的相對(duì)距離、特征的尺寸或特性等,以便唯一地標(biāo)識(shí)表征和/或捕獲的圖像中的相應(yīng)對(duì)象。如果找到匹配或者否則生成識(shí)別信息,服務(wù)平臺(tái)103可以向UElOl發(fā)送發(fā)現(xiàn)的識(shí)別信息。否則,服務(wù)平臺(tái)103可以發(fā)送聲明在數(shù)據(jù)庫(kù)中沒有找到識(shí)別信息的消息。服務(wù)平臺(tái)103也能夠執(zhí)行涉及到UElOla-1Oln的通信的各種服務(wù),使得UElOla-1Oln可以通過通信網(wǎng)絡(luò)105彼此通信。由服務(wù)平臺(tái)103提供的服務(wù)可以包括蜂窩電話服務(wù)、因特網(wǎng)服務(wù)、數(shù)據(jù)傳輸服務(wù)等。服務(wù)平臺(tái)103也可以提供例如音樂、視頻、電視服務(wù)等的內(nèi)容。服務(wù)平臺(tái)103可以進(jìn)一步包括或連接到服務(wù)存儲(chǔ)器111,以存儲(chǔ)或訪問媒體數(shù)據(jù)或任意其他形式的數(shù)據(jù)。如這里所使用的,術(shù)語(yǔ)數(shù)據(jù)庫(kù)表示捕獲存儲(chǔ)器109中的數(shù)據(jù)庫(kù)、服務(wù)存儲(chǔ)器111、通信網(wǎng)絡(luò)105的另一存儲(chǔ)組件或者其組合。另外如這里所使用的,術(shù)語(yǔ)“媒體”表示各種形式的媒體,包括音頻、視頻、靜態(tài)圖像、圖片等。進(jìn)一步,如這里所使用的,術(shù)語(yǔ)“圖像”表示由照相機(jī)(例如,靜態(tài)照相機(jī)、數(shù)字照相機(jī)、視頻照相機(jī)、照相機(jī)電話等)或任意其他成像設(shè)備所拍攝的一個(gè)或一系列的圖像。例如,單個(gè)圖像可以代表相片而多個(gè)圖像可以按順序組合以構(gòu)成視頻剪輯。舉例而言,系統(tǒng)100的通信網(wǎng)絡(luò)105包括諸如數(shù)據(jù)網(wǎng)絡(luò)(未示出)、無(wú)線網(wǎng)絡(luò)(未示出)、電話網(wǎng)絡(luò)(未示出)或其任意組合的一個(gè)或多個(gè)網(wǎng)絡(luò)。可以預(yù)期的是,數(shù)據(jù)網(wǎng)絡(luò)可以是任意局域網(wǎng)(LAN)、城域網(wǎng)(MAN)、廣域網(wǎng)(WAN)、公共數(shù)據(jù)網(wǎng)絡(luò)(例如因特網(wǎng))、短距離無(wú)線網(wǎng)絡(luò)、或諸如商用私有分組交換網(wǎng)絡(luò)(例如,私有電纜或光纖網(wǎng)絡(luò))等任意其他合適的分組交換網(wǎng)絡(luò)或其任意組合。另外,無(wú)線網(wǎng)絡(luò)例如可以是蜂窩網(wǎng)絡(luò)且可以采用各種技術(shù),包括全球演進(jìn)的增強(qiáng)型數(shù)據(jù)速率(EDGE)、通用分組無(wú)線業(yè)務(wù)(GPRS)、全球移動(dòng)通信系統(tǒng)(GSM)、因特網(wǎng)協(xié)議多媒體子系統(tǒng)(MS)、通用移動(dòng)電信系統(tǒng)(UMTS)等以及任意其他合適的無(wú)線介質(zhì),例如,全球微波互聯(lián)接入(WiMAX)、長(zhǎng)期演進(jìn)(LTE)網(wǎng)絡(luò)、碼分多址(CDMA)、寬帶碼分多
址(WCDMA)、無(wú)線保真(WiFi)、無(wú)線LAN (WLAN)、藍(lán)牙 、因特網(wǎng)協(xié)議(IP)數(shù)據(jù)廣播、衛(wèi)星、
移動(dòng)ad-hoc網(wǎng)絡(luò)(MANET)等或其任意組合。UElOl是任意類型的移動(dòng)終端、固定終端或便攜式終端,包括移動(dòng)手機(jī)、移動(dòng)站、移動(dòng)單元、移動(dòng)裝置、多媒體計(jì)算機(jī)、多媒體平板電腦、因特網(wǎng)節(jié)點(diǎn)、通信器、臺(tái)式計(jì)算機(jī)、膝上型計(jì)算機(jī)、筆記本電腦、上網(wǎng)本計(jì)算機(jī)、平板電腦、可佩戴裝置、個(gè)人通信系統(tǒng)(PCS)裝置、個(gè)人導(dǎo)航裝置、個(gè)人數(shù)字助理(PDA)、音頻/視頻播放器、數(shù)字照相機(jī)/攝像機(jī)、定位設(shè)備、電視接收器、無(wú)線電廣播接收器、電子書設(shè)備、游戲設(shè)備或其任意組合,包括這些裝置的附件和外圍設(shè)備及其組合。還可以預(yù)期,UElOl可以支持到用戶的任意類型的接口(諸如“可穿戴”電路系統(tǒng)等)。在一個(gè)實(shí)施例中,通過基于表征來(lái)確定識(shí)別信息,可以識(shí)別出對(duì)象。例如,通過與圖像關(guān)聯(lián)的臉部表征,可以識(shí)別圖像中的人物??梢愿鶕?jù)臉部表征來(lái)確定識(shí)別信息(例如,人的姓名),因?yàn)槟槻勘碚骺赡芤呀?jīng)具有與其關(guān)聯(lián)的識(shí)別信息,例如,該人先前已經(jīng)在存在于數(shù)據(jù)庫(kù)中的另一個(gè)圖像中被標(biāo)記或識(shí)別。在對(duì)象被識(shí)別后,識(shí)別信息可以與包含對(duì)象的實(shí)例關(guān)聯(lián)。如圖10中所示,標(biāo)記是將識(shí)別信息與實(shí)例關(guān)聯(lián)的一種方式。在另一個(gè)實(shí)施例中,識(shí)別信息的確定進(jìn)一步基于裝置、另一個(gè)裝置、服務(wù)器、網(wǎng)絡(luò)組件或者其組合處可獲得的資源。為了有效地使用資源,可以在執(zhí)行識(shí)別信息確定功能的組件的資源未充分利用或否則可用時(shí)確定識(shí)別信息。在另一實(shí)施例中,表征可以作為元數(shù)據(jù)存儲(chǔ)在實(shí)例中,作為元數(shù)據(jù)存儲(chǔ)在鏈接到實(shí)例的存儲(chǔ)器中、或二者的組合。在進(jìn)一步的實(shí)施例中,識(shí)別信息也可以作為元數(shù)據(jù)存儲(chǔ)在實(shí)例中、作為元數(shù)據(jù)存儲(chǔ)在鏈接到實(shí)例的存儲(chǔ)器中、或二者的組合。通常,文件(例如文檔、圖像、視頻等)包含元數(shù)據(jù)并且包含在這些文件中的元數(shù)據(jù)可以被輕易地發(fā)現(xiàn)。該情形特別是在當(dāng)旨在共享文件和關(guān)于文件的信息時(shí)不是問題。例如,用戶可能想共享與特定的圖像關(guān)聯(lián)的表征和識(shí)別信息。用戶可以將圖像上傳到公共服務(wù)器或社交網(wǎng)絡(luò)的網(wǎng)站,以與用戶的朋友共享。因?yàn)閳D像包含作為元數(shù)據(jù)的表征和識(shí)別信息,用戶的朋友可以下載該圖像并且使用該圖像、利用新的元數(shù)據(jù)信息來(lái)更新他們自己的圖像。然而,用戶可能也想與用戶的朋友共享圖像并且保持表征和識(shí)別信息私密。這樣,可能更為理想的是將表征和識(shí)別信息作為元數(shù)據(jù)存儲(chǔ)在鏈接到實(shí)例的安全存儲(chǔ)器中。通過這種方式,表征和識(shí)別信息可以用于由用戶用于識(shí)別目的,但即使在圖像本身被共享的情況下,也不會(huì)由其他用戶用于識(shí)別目的。
在另一實(shí)施例中,表征也可以與各自的時(shí)間戳關(guān)聯(lián)。進(jìn)一步,表征可以基于時(shí)間戳而與實(shí)例關(guān)聯(lián)。例如,一個(gè)人的多個(gè)臉部表征可以被存儲(chǔ),每個(gè)表征具有基于何時(shí)表征被捕獲的時(shí)間戳。當(dāng)圖像被捕獲或添加到數(shù)據(jù)庫(kù)時(shí),具有最接近于特定的圖像被捕獲的時(shí)間的時(shí)間戳的面部表征將被選擇以表示圖像中的人物。在另一實(shí)施例中,可以存在一個(gè)或多個(gè)內(nèi)容流。例如,UElOl可以接受多個(gè)內(nèi)容流(例如,多個(gè)麥克風(fēng)、多個(gè)照相機(jī)等)、同時(shí)地或在不同的時(shí)間,包含相同的或不同類型的實(shí)例。另外,UElOl可以接受來(lái)自于其他的UE101a-101n、服務(wù)平臺(tái)103、通信網(wǎng)絡(luò)105的其他組件或者其組合的一個(gè)或多個(gè)的經(jīng)由例如通信網(wǎng)絡(luò)105的內(nèi)容流。在另一實(shí)施例中,可以從其他設(shè)備(例如,其他UElOla-lOln、服務(wù)平臺(tái)103、通信網(wǎng)絡(luò)105的其他組件或其組合)、其他內(nèi)容流或者其組合來(lái)接收表征。這樣,來(lái)自一個(gè)內(nèi)容流的表征可以被選擇用于表示另一內(nèi)容流的實(shí)例中的對(duì)象。例如,從更早的內(nèi)容流捕獲的、存在于數(shù)據(jù)庫(kù)中的最佳表征可以稍后被更新或如果新的表征被確定為具有更好的質(zhì)量,以從另一個(gè)內(nèi)容流捕獲的新的表征來(lái)替代。此外,如關(guān)于圖9A-9B所描述的,用戶可以例如經(jīng)由通信網(wǎng)絡(luò)105自動(dòng)地或手動(dòng)地彼此共享對(duì)象表征。在另一實(shí)施例中,表征對(duì)應(yīng)于對(duì)象的特性(例如,面部特性、表情、體態(tài)、移動(dòng)、話音、聲音等)??梢圆东@關(guān)于對(duì)象的不同類型情況的多個(gè)表征,以呈現(xiàn)不同類型的情況。例如,可以針對(duì)每個(gè)面部表情、包括微笑的臉部、痛哭的臉部、平靜的臉部等來(lái)捕獲表征。在另一實(shí)施例中,內(nèi)容流可以是直播的視頻流并且實(shí)例可以是圖像、視頻、音頻記錄或其組合。例如,諸如照相機(jī)、攝像機(jī)等的捕獲設(shè)備可以包括顯示直播的視頻流的取景器,其中實(shí)例是圖像、視頻、音頻記錄或其組合。舉例而言,UElOl和服務(wù)平臺(tái)103使用已知的、新的或仍發(fā)展的協(xié)議彼此通信以及與通信網(wǎng)絡(luò)105的其他組件通信。在該情況下,協(xié)議包括限定通信網(wǎng)絡(luò)105中的網(wǎng)絡(luò)節(jié)點(diǎn)如何基于通過通信鏈路發(fā)送的信息而彼此交互的一組規(guī)則。在每個(gè)節(jié)點(diǎn)內(nèi)的不同操作層,從產(chǎn)生和接收各種類型的物理信號(hào),到選擇用于傳送這些信號(hào)的鏈路,到這些信號(hào)指示的信息的格式,再到識(shí)別在計(jì)算機(jī)系統(tǒng)上執(zhí)行哪個(gè)軟件應(yīng)用發(fā)送或接收信息,該協(xié)議均有效。在開放系統(tǒng)互連(OSI)參考模型中描述了用于在網(wǎng)絡(luò)上交換信息的概念性不同協(xié)議層。網(wǎng)絡(luò)節(jié)點(diǎn)之間的通信典型地通過交換離散數(shù)據(jù)分組實(shí)現(xiàn)。每個(gè)分組典型地包括(O與特定協(xié)議相關(guān)的報(bào)頭信息;以及(2)跟在報(bào)頭信息之后且包括可以獨(dú)立于特定協(xié)議被處理的信息的凈荷信息。在一些協(xié)議中,分組包括(3)跟在凈荷之后且指示凈荷信息的結(jié)束的尾部信息。報(bào)頭包括諸如分組的來(lái)源、其目的地、凈荷的長(zhǎng)度以及協(xié)議使用的其他屬性之類的信息。通常,用于特定協(xié)議的凈荷中的數(shù)據(jù)包括用于與OSI參考模型的不同較高層相關(guān)的不同協(xié)議的報(bào)頭和凈荷。用于特定協(xié)議的報(bào)頭典型地指示在其凈荷中包括的下一協(xié)議的類型。較高層協(xié)議據(jù)說被封裝在較低層協(xié)議中。包括在跨越多個(gè)異構(gòu)網(wǎng)絡(luò)(諸如因特網(wǎng))的分組中的報(bào)頭典型地包括物理(層I)報(bào)頭、數(shù)據(jù)鏈路(層2)報(bào)頭、網(wǎng)絡(luò)(層3)報(bào)頭和傳輸(層4)報(bào)頭以及各種應(yīng)用報(bào)頭(層5、層6和層7),如OSI參考模型限定的。圖2是根據(jù)一個(gè)實(shí)施例的捕獲管理器的組件的圖。舉例而言,捕獲管理器107包括用于識(shí)別媒體內(nèi)容中的對(duì)象的一個(gè)或多個(gè)組件??梢灶A(yù)期這些組件的功能可以組合在一個(gè)或多個(gè)組件中或由等同功能性的其他組件來(lái)執(zhí)行。在該實(shí)施例中,捕獲管理器107包括控制器201、捕獲模塊203、識(shí)別模塊205、通信模塊207、計(jì)算模塊209以及呈現(xiàn)模塊211??刂破?01監(jiān)視任務(wù),這些任務(wù)包括由捕獲模塊203、識(shí)別模塊205、通信模塊207、計(jì)算模塊209以及呈現(xiàn)模塊211執(zhí)行的任務(wù)。例如,盡管其他模塊可以執(zhí)行實(shí)際的任務(wù),控制器201可以確定這些任務(wù)何時(shí)以及如何被執(zhí)行或否則引導(dǎo)其他的模塊來(lái)執(zhí)行任務(wù)。捕獲模塊203管理和控制內(nèi)容流中的對(duì)象的檢測(cè)以及內(nèi)容流的對(duì)象表征和實(shí)例的捕獲。捕獲模塊203也可以操控將對(duì)象表征與內(nèi)容流的實(shí)例關(guān)聯(lián)。例如,捕獲模塊203可以確定將捕獲的表征臨時(shí)地存儲(chǔ)在緩沖器或數(shù)據(jù)庫(kù)中,直到對(duì)象的最佳表征與內(nèi)容流的相應(yīng)捕獲實(shí)例關(guān)聯(lián)。在另一個(gè)例子中,捕獲I旲塊203也可以控制表征被捕獲的頻率(例如,連續(xù)地、周期性地或在預(yù)定的調(diào)度處)或何時(shí)停止捕獲新的表征(例如,當(dāng)表征滿足質(zhì)量閾值)。識(shí)別模塊205管理和控制內(nèi)容流中的對(duì)象的識(shí)別信息的確定以及將識(shí)別信息與內(nèi)容流的實(shí)例的關(guān)聯(lián)。實(shí)際的確定和關(guān)聯(lián)功能可以由識(shí)別模塊205、服務(wù)平臺(tái)103、通信網(wǎng)絡(luò)105的另一組件或者其組合來(lái)執(zhí)行。例如,特定捕獲管理器107的識(shí)別模塊205可以連同指令向服務(wù)平臺(tái)103發(fā)送新的識(shí)別信息,該識(shí)別信息例如與特定圖像中的人物關(guān)聯(lián)的人物姓名,而該指令用于利用發(fā)送的識(shí)別信息來(lái)更新數(shù)據(jù)庫(kù)中的其他圖像。響應(yīng)于此,服務(wù)平臺(tái)103可以執(zhí)行例如一個(gè)或多個(gè)面部表征之間的比較,以在數(shù)據(jù)庫(kù)中找到與發(fā)送的識(shí)別信息關(guān)聯(lián)的面部表征匹配的具有面部表征的圖像。在將識(shí)別信息與數(shù)據(jù)庫(kù)中的匹配圖像關(guān)聯(lián)后,服務(wù)平臺(tái)103可以此后向識(shí)別模塊205發(fā)送更新的關(guān)聯(lián)的結(jié)果。這樣,通過自動(dòng)化處理,識(shí)別模塊205可以緩解用戶手動(dòng)地輸入識(shí)別信息(例如,逐一地標(biāo)記每個(gè)圖像)的時(shí)間量和資源。通信模塊207管理和控制任何的傳入和傳出的通信,例如數(shù)據(jù)共享、從其他UElOl或服務(wù)平臺(tái)103接收各種請(qǐng)求、以及電話呼叫、文本消息收發(fā)、即時(shí)消息收發(fā)和因特網(wǎng)通信。例如,如上所討論的,為了用新的識(shí)別信息來(lái)更新數(shù)據(jù)庫(kù)中的其他圖像,識(shí)別模塊205可以經(jīng)由通信模塊207與服務(wù)平臺(tái)103共享新的識(shí)別信息。UElOl也可以連接到例如捕獲存儲(chǔ)器109a-109n的存儲(chǔ)介質(zhì),使得捕獲管理器107可以訪問或存儲(chǔ)通信歷史數(shù)據(jù)。舉例而言,如果捕獲存儲(chǔ)器109a-109n不是本地的,則它們可以經(jīng)由通信網(wǎng)絡(luò)105來(lái)訪問。UElOl也可以經(jīng)由通信網(wǎng)絡(luò)105來(lái)連接到服務(wù)存儲(chǔ)器111,使得捕獲管理器107可以能夠管理或訪問服務(wù)存儲(chǔ)器111中的數(shù)據(jù)。計(jì)算模塊209執(zhí)行各種計(jì)算,包括基于一個(gè)或多個(gè)準(zhǔn)則(例如,位置、角度、照明、清晰度、模糊強(qiáng)度、噪聲、分辨率等)來(lái)確定和比較捕獲表征的質(zhì)量,并且在數(shù)據(jù)庫(kù)中匹配表征。計(jì)算任務(wù)可以響應(yīng)于來(lái)自其他模塊,例如控制器201、捕獲模塊203、識(shí)別模塊205、通信模塊207或呈現(xiàn)模塊211的請(qǐng)求而執(zhí)行各種計(jì)算。呈現(xiàn)模塊211控制例如圖像用戶接口的用戶接口的顯示,以經(jīng)由接口傳達(dá)信息并且允許用戶與UElOl進(jìn)行交互。例如,通過將姓名標(biāo)記到圖像中的人物,呈現(xiàn)模塊211可以允許用戶向特定的圖像添加識(shí)別信息。此后,如早些所討論的,可以向識(shí)別模塊205發(fā)送識(shí)別信息,以更新數(shù)據(jù)庫(kù)中的其他圖像。進(jìn)一步,呈現(xiàn)模塊211與控制器201、捕獲模塊203、識(shí)別模塊205、以及通信模塊207交互,以顯示在它們的操作期間所產(chǎn)生的任意信息。圖3是根據(jù)一個(gè)實(shí)施例的用于識(shí)別媒體內(nèi)容中的對(duì)象的過程的流程圖。在一個(gè)實(shí)施例中,捕獲管理器107執(zhí)行過程300并且其實(shí)現(xiàn)在例如芯片組中,該芯片組包括如圖12中所示出的處理器和存儲(chǔ)器。在步驟301中,捕獲管理器107確定在裝置處檢測(cè)內(nèi)容流中的一個(gè)或多個(gè)對(duì)象。該檢測(cè)可以在內(nèi)容流的實(shí)例被捕獲之前、之后和/或同時(shí)執(zhí)行。通過這種方式,如果在內(nèi)容流的實(shí)例被捕獲的時(shí)刻不能輕易地檢測(cè)到對(duì)象,則對(duì)象也可以在實(shí)例被捕獲之前或之后來(lái)檢測(cè)。捕獲管理器107可以在關(guān)于對(duì)象的情況改變(例如,人員四周移動(dòng)、臉部背離照相機(jī)、照明改變等)時(shí)持續(xù)跟蹤對(duì)象。在步驟303中,捕獲管理器107確定捕獲內(nèi)容流中的一個(gè)或多個(gè)對(duì)象的一個(gè)或多個(gè)表征。如先前所討論的,捕獲管理器107也可以在內(nèi)容流的實(shí)例被捕獲之前、之后和/或同時(shí),如在步驟305中那樣,也捕獲內(nèi)容流中的一個(gè)或多個(gè)對(duì)象的一個(gè)或多個(gè)其他表征。例如,UElOl可以令照相機(jī)模塊配置成無(wú)論何時(shí)照相機(jī)模塊起作用時(shí),自動(dòng)地檢測(cè)、識(shí)別和捕獲在其取景器圖像內(nèi)可見的對(duì)象以及臉部的表征(例如,將用于識(shí)別的最佳圖像)。UElOl可以接著持續(xù)地處理在取景器處捕獲(例如,持續(xù)地或周期性地)的一系列圖像(例如,內(nèi)容流)。在一個(gè)實(shí)施例中,即使用戶沒有指示UElOl來(lái)捕獲圖像,該內(nèi)容流也被捕獲。通過這種方式,隨著用戶正在構(gòu)建用于捕獲的圖像,UElOl可以識(shí)別和捕獲在取景器場(chǎng)景中存在的對(duì)象或臉部的最佳圖像(例如,當(dāng)臉部或?qū)ο笳谥币曊障鄼C(jī)時(shí),不模糊、具有最佳照明等)、跟蹤識(shí)別的對(duì)象或臉部,并且將最佳圖像或表征與內(nèi)容流的捕獲實(shí)例(例如,捕獲的相片)關(guān)聯(lián)。關(guān)聯(lián)的表征接著可以用于捕獲的實(shí)例中的相應(yīng)對(duì)象或臉部的識(shí)別。例如,用戶可以激活UElOl的照相機(jī)模塊(例如,通過執(zhí)行照相機(jī)應(yīng)用或打開照相機(jī)模塊)以開始捕獲取景器或照相機(jī)視野內(nèi)的圖像的內(nèi)容流。捕獲管理器107接著可以發(fā)起圖像上的對(duì)象和/或面部檢測(cè)。捕獲管理器107保持每個(gè)檢測(cè)的對(duì)象和/或臉部的記錄并且開始跟蹤每個(gè)檢測(cè)的臉部。在一個(gè)實(shí)施例中,跟蹤包括識(shí)別和記錄捕獲的內(nèi)容流內(nèi)的每個(gè)對(duì)象/臉部的相對(duì)位置。在該過程期間,捕獲管理器107不需要識(shí)別或確定對(duì)象或臉部的特定標(biāo)識(shí)。相反,捕獲管理器107僅需要檢測(cè)和跟蹤各個(gè)對(duì)象/臉部,從而它們各個(gè)不同于其他的對(duì)象或臉部。換句話說,捕獲管理器107檢測(cè)內(nèi)容流中的特定對(duì)象或臉部,存儲(chǔ)對(duì)象或臉部,跟蹤對(duì)象或臉部,并且持續(xù)地跟隨內(nèi)容流中的捕獲對(duì)象或臉部的移動(dòng)。相應(yīng)地,當(dāng)用戶拍攝一幅圖像時(shí),圖像中的跟蹤對(duì)象和/或臉部的任意最佳表征可以與圖像鏈接或否則關(guān)聯(lián)(例如,如元數(shù)據(jù)信息與圖像關(guān)聯(lián))。在一個(gè)樣本用例中,用戶可以設(shè)置照相機(jī)、使用照相機(jī)的定時(shí)器功能(例如,十秒鐘定時(shí)器)來(lái)對(duì)用戶以及用戶的朋友拍攝照片。隨著他們對(duì)于相片做好準(zhǔn)備,在相片被實(shí)際拍攝之前,對(duì)于照相機(jī)的取景器所檢測(cè)的每個(gè)人,照相機(jī)的捕獲管理器107可以捕獲若干個(gè)面部表征。在相片被捕獲后,捕獲管理器107可以持續(xù)地捕獲相片中的人的臉部表征以識(shí)別出最佳的圖像。如果在捕獲后找到最佳的表征,則捕獲管理器107可以倒行地將表征與捕獲的實(shí)例關(guān)聯(lián)。這樣,捕獲管理器107并不需要依賴于捕獲的相片中的特定臉部表征,但是可以選擇捕獲的任意臉部表征來(lái)代表相片中的人。舉例而言,圖8A-8B演示了這樣的一種情形,其中在特定的圖像實(shí)例之前捕獲的對(duì)象表征可以代表在稍后時(shí)間捕獲的其他圖像實(shí)例中的對(duì)象。類似地,在圖像實(shí)例捕獲之間或在所有的圖像實(shí)例已經(jīng)被捕獲之后的對(duì)象表征可以代表多個(gè)圖像實(shí)例中的對(duì)象。在另一實(shí)施例中,捕獲管理器107可以接著如在步驟S307中選擇一個(gè)或多個(gè)表征或一個(gè)或多個(gè)其他表征,以便至少部分地基于一個(gè)或多個(gè)準(zhǔn)則(例如,位置、角度、照明、清晰度、模糊強(qiáng)度、噪聲、分辨率等)來(lái)與一個(gè)或多個(gè)實(shí)例關(guān)聯(lián)。在進(jìn)一步的實(shí)施例中,捕獲管理器107可以如步驟309中持續(xù)地、周期性地,或在預(yù)定的調(diào)度處捕獲一個(gè)或多個(gè)表征或一個(gè)或多個(gè)其他表征,直到一個(gè)或多個(gè)表征滿足預(yù)定的質(zhì)量閾值。盡管表征可以被持續(xù)地捕獲,預(yù)定的質(zhì)量閾值條件允許捕獲至少滿足預(yù)定質(zhì)量閾值的表征,并且允許例如UElOl通過避免不必要地捕獲多余的表征來(lái)保持電池壽命。此后,如步驟311中,捕獲管理器107將選擇(例如,一個(gè)或多個(gè)表征,一個(gè)或多個(gè)其他表征等)與內(nèi)容流的一個(gè)或多個(gè)實(shí)例關(guān)聯(lián)。如先前所討論的,選擇的表征可以作為元數(shù)據(jù)附接到捕獲的實(shí)例,這是捕獲管理器107可以將表征與內(nèi)容流的實(shí)例關(guān)聯(lián)的一種方式。此外,如圖8A-8B中所示出的,捕獲管理器107可以將單個(gè)的表征與多個(gè)實(shí)例關(guān)聯(lián)。圖4是根據(jù)一個(gè)實(shí)施例的用于將識(shí)別信息與內(nèi)容流的實(shí)例關(guān)聯(lián)的過程的流程圖。在一個(gè)實(shí)施例中,捕獲管理器107執(zhí)行過程400并且實(shí)現(xiàn)在例如包括如圖12中所示的處理器和存儲(chǔ)器的芯片組中。在步驟401中,捕獲管理器107至少部分地基于一個(gè)或多個(gè)表征來(lái)確定一個(gè)或多個(gè)表征的識(shí)別信息。例如,圖像中的人物可以通過與圖像關(guān)聯(lián)的臉部表征來(lái)識(shí)別??梢詮哪槻勘碚鱽?lái)確定識(shí)別信息(例如,個(gè)人的姓名),因?yàn)槿绻鐐€(gè)人已經(jīng)先前在存在于數(shù)據(jù)庫(kù)中的另一圖像中被標(biāo)識(shí)或識(shí)別,則臉部表征可能已經(jīng)具有與其關(guān)聯(lián)的識(shí)別信息。在步驟403中,捕獲管理器107將識(shí)別信息與一個(gè)或多個(gè)實(shí)例關(guān)聯(lián)。如圖10中所示,加標(biāo)記可以是將識(shí)別信息與一個(gè)或多個(gè)實(shí)例關(guān)聯(lián)的一種方式。圖5是根據(jù)一個(gè)實(shí)施例的用于將最佳臉部表征與內(nèi)容流的圖像實(shí)例關(guān)聯(lián)的過程的流程圖。在一個(gè)實(shí)施例中,捕獲管理器107執(zhí)行過程500并且實(shí)現(xiàn)在例如包括如圖12中所示的處理器和存儲(chǔ)器的芯片組中。在圖5中,當(dāng)例如照相機(jī)被打開時(shí),過程500也演示可以由捕獲管理器107所執(zhí)行的步驟。照相機(jī)可以經(jīng)由捕獲管理器107的呈現(xiàn)模塊211來(lái)在照相機(jī)的顯示器上向用戶顯示內(nèi)容流,例如直播視頻流。同時(shí),捕獲管理器107可以開始運(yùn)行代表過程500的算法。這樣,在步驟501中,捕獲管理器107通過確定臉部是否已經(jīng)被檢測(cè)而開始。注意到在該步驟中,捕獲管理器107僅嘗試檢測(cè)臉部;其并不嘗試識(shí)別其是誰(shuí)的臉部。在已經(jīng)檢測(cè)到臉部后,在步驟503中,捕獲管理器107捕獲臉部的表征。進(jìn)一步注意到在過程500期間,在照相機(jī)的取景器上示出的人可能四周移動(dòng),從而他們的臉部可能不再位于朝著照相機(jī)(例如,頭部的后部朝著取景器)。即使在此類的情形下,捕獲管理器107可以仍將捕獲臉部表征,因?yàn)椴东@管理器107可以記錄臉部(或個(gè)人),使得捕獲管理器107知道他們?cè)谀?,即使他們不可以被直接檢測(cè)到。進(jìn)一步,在步驟505中,捕獲管理器107確定表征是否是新的臉部或表征是否是已存在于數(shù)據(jù)庫(kù)中的臉部的更好質(zhì)量表征。如果臉部表征是易于稍后用于基于一個(gè)或多個(gè)準(zhǔn)貝IJ(例如,位置、角度、照明、清晰度、模糊強(qiáng)度、噪聲、分辨率等)來(lái)識(shí)別的目的,則該臉部表征是更好的質(zhì)量表征。如果表征是新的臉部或表征是現(xiàn)存的臉部的更好的質(zhì)量表征,則捕獲管理器107經(jīng)由步驟507存儲(chǔ)表征以及與表征關(guān)聯(lián)的質(zhì)量值。捕獲管理器107可以例如臨時(shí)地在緩沖器或數(shù)據(jù)庫(kù)中存儲(chǔ)數(shù)據(jù)。否則,捕獲管理器107在步驟509中確定是否已經(jīng)捕獲圖像實(shí)例。如果已經(jīng)捕獲圖像實(shí)例,則在步驟511中,捕獲管理器107存儲(chǔ)具有鏈接為數(shù)據(jù)庫(kù)中的元數(shù)據(jù)的臉部的最佳表征的圖像實(shí)例。注意到當(dāng)圖像實(shí)例被捕獲時(shí),可能出現(xiàn)其中當(dāng)圖像實(shí)例被捕獲的時(shí)刻臉部方位對(duì)于面部識(shí)別不是足夠好的情形。然而,因?yàn)橄惹安东@的臉部表征可以用于識(shí)別臉部,該類情形并不是問題。如果還沒有捕獲圖像實(shí)例,則捕獲管理器107可以繼續(xù)檢測(cè)和捕獲其他臉部表征。圖6是根據(jù)一個(gè)實(shí)施例的用于將識(shí)別信息與圖像實(shí)例/臉部表征對(duì)關(guān)聯(lián)的過程的流程圖。在一個(gè)實(shí)施例中,捕獲管理器107執(zhí)行過程600并且實(shí)現(xiàn)在例如包括如圖12中所示的處理器和存儲(chǔ)器的芯片組中。在步驟601中,捕獲管理器107將圖像實(shí)例/臉部表征對(duì)的表征與數(shù)據(jù)庫(kù)中的識(shí)別的臉部表征進(jìn)行比較。在步驟603中,捕獲管理器107基于比較確定表征是否被識(shí)別或已知。例如,如果表征匹配具有與其關(guān)聯(lián)的識(shí)別信息(例如個(gè)人的姓名)的另一個(gè)對(duì)的表征,則捕獲管理器107可以確定一個(gè)圖像實(shí)例/臉部表征對(duì)的表征被識(shí)別或已知。如果表征被識(shí)別,則在步驟605中,捕獲管理器107將匹配對(duì)的識(shí)別信息(例如,個(gè)人的姓名)與圖像實(shí)例/臉部表征對(duì)關(guān)聯(lián)。否則,捕獲管理器107將留下圖像實(shí)例/臉部表征對(duì)的表征不識(shí)別。圖7是根據(jù)一個(gè)實(shí)施例的用于將識(shí)別信息與數(shù)據(jù)庫(kù)中的圖像實(shí)例/臉部表征對(duì)關(guān)聯(lián)的過程的流程圖。在一個(gè)實(shí)施例中,捕獲管理器107執(zhí)行過程700并且實(shí)現(xiàn)在例如包括在如圖12中所示的處理器和存儲(chǔ)器的芯片組中。在步驟701中,與圖像實(shí)例/臉部表征對(duì)關(guān)聯(lián)的新的識(shí)別信息(例如新的個(gè)人姓名)被添加到數(shù)據(jù)庫(kù)(例如自動(dòng)地或由用戶手動(dòng)地)。類似地,也可以修改已經(jīng)與數(shù)據(jù)庫(kù)中的圖像實(shí)例/臉部表征對(duì)關(guān)聯(lián)的現(xiàn)存識(shí)別信息。在步驟703中,圖像實(shí)例/臉部表征對(duì)的表征與數(shù)據(jù)庫(kù)中的另一圖像實(shí)例/臉部表征對(duì)的表征比較。在步驟705中,捕獲管理器確定是否找到任何的匹配。如果存在一個(gè)或多個(gè)匹配,則在步驟707中,捕獲管理器107將新的識(shí)別信息(例如,個(gè)人的姓名)與包含匹配表征的圖像實(shí)例/臉部表征對(duì)關(guān)聯(lián)。圖8A-8B是根據(jù)各種實(shí)施例的在圖3的過程中捕獲的內(nèi)容流的實(shí)例中的對(duì)象的表征的視圖。如先前所述的,捕獲管理器107可以捕獲一個(gè)或多個(gè)表征,并且也捕獲一個(gè)或多個(gè)其他的表征。此后,捕獲管理器107可以基于一個(gè)或多個(gè)準(zhǔn)則(例如,位置、角度、照明、清晰度、模糊強(qiáng)度、噪聲、分辨率等)來(lái)選擇與一個(gè)或多個(gè)實(shí)例關(guān)聯(lián)的一個(gè)或多個(gè)表征或一個(gè)或多個(gè)其他的表征。圖8A-8B示出內(nèi)容流的兩個(gè)時(shí)間實(shí)例在時(shí)間A處實(shí)例801,具有最佳的表征803、805、807、809和811 ;以及在時(shí)間B處實(shí)例851,具有最佳的表征853、855、857、859和861。在圖8A中,檢測(cè)的對(duì)象是弗蘭克、杰里、蘇和哈里森。迄今為止,在時(shí)間A處捕獲弗蘭克、杰里、蘇和哈里森的表征是最佳表征。相應(yīng)地,示出對(duì)于在時(shí)間A處的實(shí)例的迄今為目在時(shí)間A處的最佳表征(例如,最佳表征803、805、807、809和811)。在圖SB中,檢測(cè)到的對(duì)象仍是弗蘭克、瑪麗、杰里、蘇和哈里森。在該例子中,然而,在時(shí)間B處捕獲的弗蘭克、瑪麗、杰里、蘇和哈里森的表征并不必然是迄今的最佳表征。例如,捕獲管理器107確定(例如,基于位置和角度)在時(shí)間B處的弗蘭克的表征比在時(shí)間A處的弗蘭克的表征更優(yōu),因?yàn)樵跁r(shí)間B處的弗蘭克的表征示出弗蘭克的整個(gè)臉部,而在時(shí)間A處的表征僅示出弗蘭克臉部的側(cè)面。因此,在圖SB中,捕獲管理器107選擇在時(shí)間B處的弗蘭克的表征作為由最佳表征853所示出的迄今的最佳表征。在另一例子中,在圖8B中,捕獲管理器107確定在時(shí)間A處的瑪麗的表征比在時(shí)間B處的瑪麗的表征更佳,因?yàn)樵跁r(shí)間A處的瑪麗的表征示出了瑪麗臉部的大部分而在時(shí)間B處的瑪麗的表征僅示出瑪麗臉部的側(cè)面。因此,在圖SB中,捕獲管理器107選擇在時(shí)間A處的瑪麗的表征作為由最佳表征855所示出的迄今的最佳表征。類似地,在圖SB中,捕獲管理器107也對(duì)如由最佳表征857、859和861所示出的杰里、蘇和哈里森執(zhí)行確定和選擇功能。圖9A-9B是根據(jù)各種實(shí)施例的從圖3的過程中的不同角度捕獲的內(nèi)容流的實(shí)例中的對(duì)象的表征的圖。如先前所述,捕獲管理器107可以捕獲一個(gè)或多個(gè)表征以及也捕獲一個(gè)或多個(gè)其他表征。此后,捕獲管理器107可以基于一個(gè)或多個(gè)準(zhǔn)則(例如,位置、角度、照明、清晰度、模糊強(qiáng)度、噪聲、分辨率等)來(lái)選擇一個(gè)或多個(gè)表征或一個(gè)或多個(gè)其他表征來(lái)與一個(gè)或多個(gè)實(shí)例關(guān)聯(lián)。此外,如圖9A-9B中所示,可以從一個(gè)或多個(gè)內(nèi)容流捕獲一個(gè)或多個(gè)表征或一個(gè)或多個(gè)其他表征。圖9A-9B示出兩個(gè)實(shí)例在時(shí)間X處從角度A捕獲的內(nèi)容流的實(shí)例901,具有最佳表征903、905和907 ;以及在時(shí)間X處從角度B捕獲的另一內(nèi)容流的實(shí)例951,具有最佳表征953、955和957。在該例子中,一個(gè)設(shè)備(例如UE101)可以包括兩個(gè)捕獲裝置(例如,多個(gè)照相機(jī)、多個(gè)攝像機(jī)等),-每個(gè)捕獲裝置分別進(jìn)行內(nèi)容中的流處理(streaming)。然而,在該例子中,也可能兩個(gè)裝置(例如,UElOla-1Oln)每個(gè)分別地在內(nèi)容中進(jìn)行流處理-一個(gè)裝置從角度A在內(nèi)容中進(jìn)行流處理而另一個(gè)裝置從角度B在內(nèi)容中進(jìn)行流處理。在圖9A中,捕獲管理器107檢測(cè)對(duì)象,瑪麗、杰里和蘇,并且從角度A捕獲他們的表征。類似地,在圖9B中,捕獲管理器107檢測(cè)對(duì)象,瑪麗、杰里和蘇,并且從角度B捕獲他們的表征。如先前所提到的,裝置可以從一個(gè)或多個(gè)其他裝置接收一個(gè)或多個(gè)表征。例如,如果一個(gè)裝置在角度A而一個(gè)裝置在角度B,則兩個(gè)裝置可以從它們各自的角度無(wú)線地共享它們捕獲的表征。相應(yīng)地,每個(gè)裝置的捕獲管理器107基于一個(gè)或多個(gè)準(zhǔn)則來(lái)在從角度A捕獲的表征或在從角度B捕獲的表征之間做出選擇,以便與實(shí)例關(guān)聯(lián)。如圖A中所示,選擇與實(shí)例901關(guān)聯(lián)的表征是最佳表征903、905和907。同樣地,在圖B中,選擇與實(shí)例951關(guān)聯(lián)的表征是最佳表征953、955和957。最佳表征901和951是從角度B捕獲的瑪麗的表征,而最佳表征903和953是從角度A捕獲的杰里的表征,而最佳表征905和955是從角度A捕獲的蘇的表征。圖10是根據(jù)一個(gè)實(shí)施例的使用圖4、6和7的過程的用戶接口的圖。UElOl可以并入用戶接口 1001以允許用戶與系統(tǒng)100交互。在圖10中,捕獲管理器107實(shí)現(xiàn)若干個(gè)人在圖片中并且以矩形突出顯示他們中的每個(gè)。因?yàn)橛脩艨赡芤呀?jīng)在另一個(gè)圖像中標(biāo)記了弗蘭克和蘇,捕獲管理器107能夠在圖10中示出的圖像被捕獲之前、之后和/或同時(shí)確定他們的識(shí)別信息(例如,他們的姓名)。當(dāng)圖像被捕獲時(shí),捕獲管理器107可以通過例如標(biāo)記圖像來(lái)將識(shí)別信息與圖像關(guān)聯(lián)。如所示出的,基于包括最佳表征1005的一個(gè)或多個(gè)表征來(lái)確定弗蘭克的識(shí)別信息1003。類似地,基于包括最佳表征1009的一個(gè)或多個(gè)表征來(lái)確定蘇的識(shí)別信息1007。然而,如所示出的,圖像中的其他人還未被標(biāo)記。這樣,捕獲管理器107并不能夠基于它們的表征(例如,最佳表征1011和1013)來(lái)確定它們的識(shí)別信息,因?yàn)樗鼈兊谋碚鬟€未與任何的識(shí)別信息關(guān)聯(lián)。因此,對(duì)于由最佳表征1011和1013所代表的兩個(gè)人,沒有顯示識(shí)別信息或標(biāo)簽。此外,用戶接口 1001顯示若干個(gè)與用戶選項(xiàng)關(guān)聯(lián)的圖標(biāo),以執(zhí)行特定的接口功能(例如,從左到右的選項(xiàng)觀看主視圖菜單,觀看圖片庫(kù)中的圖像列表,共享圖像、作為收藏保存、編輯圖像實(shí)例、刪除圖像實(shí)例以及返回到先前的屏幕)。例如,用戶接口 1001可以允許用戶來(lái)編輯圖像實(shí)例,包括對(duì)象、表征、以及與圖像實(shí)例關(guān)聯(lián)的識(shí)別信息。使用編輯選項(xiàng),用戶可以通過例如點(diǎn)擊繞對(duì)象的矩形內(nèi)的任意位置并且鍵入識(shí)別信息來(lái)添加新的識(shí)別信息(例如,新的人的姓名)。用戶接口 1001接著可以將新的識(shí)別信息與對(duì)象表征關(guān)聯(lián)。隨后,可以自動(dòng)地或手動(dòng)地使得圖7的過程運(yùn)行,由此更新數(shù)據(jù)庫(kù)中的其他圖像實(shí)例。類似地,編輯選項(xiàng)也可以用于修改已經(jīng)與圖像實(shí)例關(guān)聯(lián)的識(shí)別信息。此處描述的用于識(shí)別媒體內(nèi)容中的對(duì)象的過程可以有利地經(jīng)由軟件、硬件、固件或軟件和/或固件和/或硬件的組合來(lái)實(shí)施。例如,此處描述的過程可以有利地經(jīng)由(多個(gè))處理器、數(shù)字信號(hào)處理器(DSP)芯片、專用集成電路(ASIC)、現(xiàn)場(chǎng)可編程門陣列(FPGA)等實(shí)施。下面詳細(xì)描述用于執(zhí)行所述功能的這種示例性硬件。圖11圖示了本發(fā)明實(shí)施例可以在其上實(shí)現(xiàn)的計(jì)算機(jī)系統(tǒng)1100。盡管針對(duì)特定設(shè)備或裝置描述了計(jì)算機(jī)系統(tǒng)1100,可以預(yù)期圖11內(nèi)的其他設(shè)備或裝置(例如,網(wǎng)元、服務(wù)器等)可以部署系統(tǒng)1100的示出硬件和部件。計(jì)算機(jī)系統(tǒng)1100被編程(例如,經(jīng)由計(jì)算機(jī)程序代碼或指令)以如此處所述的識(shí)別媒體內(nèi)容中的對(duì)象,并且包括諸如用于在計(jì)算機(jī)系統(tǒng)1100的其他內(nèi)部組件和外部組件之間傳遞信息的總線1110的通信機(jī)制。信息(也稱為數(shù)據(jù))表示為可測(cè)量現(xiàn)象(典型為電壓)的物理表示,但在其他實(shí)施例中,這種現(xiàn)象包括磁的、電磁的、壓力的、化學(xué)的、生物的、分子的、原子的、亞原子和量子交互的現(xiàn)象。例如,北磁場(chǎng)和南磁場(chǎng),或零電壓和非零電壓,表示二進(jìn)制數(shù)位(比特)的兩種狀態(tài)(O,I)。其他現(xiàn)象可以表示更高基數(shù)的數(shù)位。多個(gè)同時(shí)量子態(tài)在測(cè)量前的疊加表示量子比特(qubit)。一個(gè)或更多數(shù)位的序列構(gòu)成用于表示字符的編號(hào)或代碼的數(shù)字?jǐn)?shù)據(jù)。在一些實(shí)施例中,稱為模擬數(shù)據(jù)的信息由特定范圍內(nèi)近連續(xù)的可測(cè)量值來(lái)表示。計(jì)算機(jī)系統(tǒng)1100或其部分構(gòu)成用于執(zhí)行識(shí)別媒體內(nèi)容中的對(duì)象的一個(gè)或多個(gè)步驟的裝置??偩€1110包括一個(gè)或更多并聯(lián)的信息導(dǎo)線,從而信息在耦合到總線1110的設(shè)備之間快速傳輸。一個(gè)或更多處理信息的處理器1102與總線1110耦合。處理器(或多個(gè)處理器)1102對(duì)信息執(zhí)行與識(shí)別媒體內(nèi)容中的對(duì)象有關(guān)的計(jì)算機(jī)程序代碼所指定的操作集。計(jì)算機(jī)程序代碼是指令或語(yǔ)句的集合,其為處理器和/或計(jì)算機(jī)系統(tǒng)的操作提供指令以執(zhí)行指定功能。例如,可以用編譯為處理器本機(jī)指令集的計(jì)算機(jī)編程語(yǔ)言來(lái)編寫代碼。還可以直接用本機(jī)指令集(例如,機(jī)器語(yǔ)言)編寫代碼。操作集包括從總線1110導(dǎo)入信息和置入信息到總線1110上。操作集典型地還包括比較兩個(gè)或更多的信息單元、移動(dòng)信息單元的位置和組合兩個(gè)或更多的信息單元,諸如通過加法或乘法或諸如或(0R)、異或(XOR)和與(AND)的邏輯操作。操作集中每個(gè)可由處理器執(zhí)行的操作通過稱為指令的信息(諸如一或多位的操作代碼)表現(xiàn)給處理器。將由處理器1102執(zhí)行的操作序列(諸如操作代碼序列)構(gòu)成處理器指令,也稱為計(jì)算機(jī)系統(tǒng)指令或簡(jiǎn)單稱為計(jì)算機(jī)指令。除了別的之外,處理器可以單獨(dú)或者結(jié)合地實(shí)施為機(jī)械的、電的、磁的、光學(xué)的、化學(xué)的或量子的組件。計(jì)算機(jī)系統(tǒng)1100還包括耦合到總線1110的存儲(chǔ)器1104。存儲(chǔ)器1104,諸如隨機(jī)訪問存儲(chǔ)器(RAM)或其他動(dòng)態(tài)存儲(chǔ)設(shè)備,存有包括用于識(shí)別媒體內(nèi)容中的對(duì)象的處理器指令的信息。動(dòng)態(tài)存儲(chǔ)器允許計(jì)算機(jī)系統(tǒng)1100改變存儲(chǔ)于其中的信息。RAM允許存儲(chǔ)在稱為存儲(chǔ)器地址的位置處的信息單元獨(dú)立于臨近地址處的信息而被儲(chǔ)存和檢索。存儲(chǔ)器1104還被處理器1102使用,以存儲(chǔ)執(zhí)行處理器指令過程中的臨時(shí)值。計(jì)算機(jī)系統(tǒng)1100還包括耦合到總線1110的只讀存儲(chǔ)器(R0M)1106或任意其他靜態(tài)存儲(chǔ)設(shè)備,用于存儲(chǔ)靜態(tài)包括指令的信息,其不被計(jì)算機(jī)系統(tǒng)1100所改變。一些存儲(chǔ)器由掉電時(shí)會(huì)失去存儲(chǔ)于其上的信息的易失性存儲(chǔ)組成。非易失性(永久)存儲(chǔ)設(shè)備1108也耦合到總線1110,諸如磁盤、光盤或快閃卡,用于存儲(chǔ)包括指令的信息,該信息即使當(dāng)計(jì)算機(jī)系統(tǒng)1100關(guān)閉或以其他方式斷電時(shí)也存留。包括用于識(shí)別媒體內(nèi)容中的對(duì)象的指令的信息從諸如傳感器或包含由人類用戶操作的字母數(shù)字鍵的鍵盤之類的外部輸入設(shè)備1112提供到總線1110,以供處理器使用。傳感器檢測(cè)其附近的狀況,而且將這些檢測(cè)轉(zhuǎn)化為與用于表示計(jì)算機(jī)系統(tǒng)1100中的信息的可測(cè)量現(xiàn)象相兼容的物理表示。耦合到總線1110的其他外部設(shè)備主要用于與人交互,包括諸如陰極射線管(CRT)、液晶顯示器(IXD)、發(fā)光二極管(LED)顯示器、有機(jī)LED (OLED)顯示器、等離子屏的顯示設(shè)備1114,或用于呈現(xiàn)文本或圖像的打印機(jī),以及諸如鼠標(biāo)、軌跡球或光標(biāo)導(dǎo)向鍵的指點(diǎn)設(shè)備1116,用于控制呈現(xiàn)在顯示器1114上的小光標(biāo)圖像位置和發(fā)布與呈現(xiàn)在顯示器1114上圖形元件相關(guān)聯(lián)的命令的運(yùn)動(dòng)傳感器。在一些實(shí)施例中,例如,在計(jì)算機(jī)系統(tǒng)1100無(wú)需人工輸入而自動(dòng)執(zhí)行所有功能的實(shí)施例中,外部輸入設(shè)備1112、顯示設(shè)備1114和指點(diǎn)設(shè)備1116中的一個(gè)或更多被省略。在示出的實(shí)施例中,專用硬件,諸如專用集成電路(ASIC) 1120耦合到總線1110。專用硬件配置用于執(zhí)行處理器1102針對(duì)特定目的不能足夠快地執(zhí)行的操作。ASIC的示例包括用于為顯示器1114生成圖像的圖形加速卡、加密和解密通過網(wǎng)絡(luò)發(fā)送的消息的密碼板、語(yǔ)音識(shí)別和到諸如機(jī)器臂和醫(yī)療掃描裝備等特殊外部設(shè)備的接口,這些特殊外部設(shè)備重復(fù)執(zhí)行由硬件實(shí)施的更為有效的一些復(fù)雜操作序列。計(jì)算機(jī)系統(tǒng)1100還包括耦合到總線1110的通信接口 1170的一個(gè)或更多實(shí)例。通信接口 1170提供耦合到利用自身處理器操作的多樣外部設(shè)備的單向或雙向通信,這些外部設(shè)備諸如是打印機(jī)、掃描儀和外部磁盤。一般地,該耦合是利用連接到本地網(wǎng)絡(luò)1180的網(wǎng)絡(luò)鏈路1178,其中多種利用自身處理器的外部設(shè)備連接到本地網(wǎng)絡(luò)1180。例如,通信接口 1170可以是個(gè)人計(jì)算機(jī)上的并口、串口或通用串行總線(USB)端口。在一些實(shí)施例中,通信接口 1170是提供到相應(yīng)類型電話線的信息通信連接的綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)卡、數(shù)字用戶線路(DSL)卡或電話調(diào)制解調(diào)器。在一些實(shí)施例中,通信接口 1170是電纜調(diào)制解調(diào)器,其將總線1110上的信號(hào)轉(zhuǎn)化為用于同軸電纜上通信連接的信號(hào),或轉(zhuǎn)化為用于在光纜上通信連接的光學(xué)信號(hào)。作為另外示例,通信接口 1170可以是提供到諸如以太網(wǎng)的兼容LAN的數(shù)據(jù)通信連接的局域網(wǎng)(LAN)卡。還可以實(shí)施無(wú)線鏈路。對(duì)于無(wú)線鏈路,通信接口1170發(fā)送或接收或者既發(fā)送又接收承載諸如數(shù)字?jǐn)?shù)據(jù)等信息流的電的、聲學(xué)的或者電磁的信號(hào),包括紅外和光學(xué)信號(hào)。例如,在無(wú)線手持設(shè)備中,諸如比如蜂窩電話的移動(dòng)電話,通信接口 1170包括稱為無(wú)線收發(fā)信機(jī)的無(wú)線電頻段電磁發(fā)射器和接收器。在某些實(shí)施例中,通信接口 1170支持到通信網(wǎng)絡(luò)105的連接,以用于在到UElOl的媒體內(nèi)容中識(shí)別對(duì)象。這里使用術(shù)語(yǔ)“計(jì)算機(jī)可讀介質(zhì)”是指參與向處理器1102提供信息的任意介質(zhì),包括用于執(zhí)行的指令。這樣的介質(zhì)可以采取許多形式,包括但是不局限于計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)(例如,非易失性介質(zhì)、易失性介質(zhì))和傳輸介質(zhì)。非瞬態(tài)介質(zhì)(諸如,非易失性介質(zhì))例如包括光盤或磁盤,諸如存儲(chǔ)設(shè)備1108。易失性介質(zhì)包括例如動(dòng)態(tài)存儲(chǔ)器1104。傳輸介質(zhì)例如包括雙絞線電纜、同軸電纜、銅線、光纜和無(wú)需線和纜在空間穿行的載波,諸如聲波和電磁波,包括無(wú)線電波、光波和紅外波。信號(hào)包括幅度、頻率、相位、極化的人為瞬時(shí)變化或通過傳輸介質(zhì)傳播的其他物理屬性。計(jì)算機(jī)可讀介質(zhì)的通常形式例如包括軟盤、柔性盤、硬盤、磁帶、任意其他磁介質(zhì)、CD-ROM、CDRff, DVD、任意其他光介質(zhì)、打孔卡、紙帶、光符板、具有孔樣式或其他光學(xué)可識(shí)別標(biāo)記的任意其他物理介質(zhì)、RAM、PROM、EPROM、FLASH-EPROM、EEPROM、閃存存儲(chǔ)器、任意其他的存儲(chǔ)器芯片或盒式磁盤、載波或計(jì)算機(jī)可讀的任意其他介質(zhì)。這里使用術(shù)語(yǔ)計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)是指除了傳輸介質(zhì)之外的任意計(jì)算機(jī)可讀介質(zhì)。編碼在一個(gè)或更多有形介質(zhì)中的邏輯包括計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)和專用硬件(諸如,ASIC1120)中之一或二者上的處理器指令。網(wǎng)絡(luò)鏈路1178典型地使用通過一個(gè)或更多網(wǎng)絡(luò)的傳輸介質(zhì)向使用或處理信息的其他設(shè)備提供信息通信。例如,網(wǎng)絡(luò)鏈路1178可以通過本地網(wǎng)絡(luò)1180提供去往由因特網(wǎng)服務(wù)提供者(ISP)操作的設(shè)備1184或主機(jī)計(jì)算機(jī)1182的連接。ISP設(shè)備1184轉(zhuǎn)而通過現(xiàn)在稱為因特網(wǎng)1190的、網(wǎng)絡(luò)的公共全球分組交換通信網(wǎng)絡(luò)來(lái)提供數(shù)據(jù)通信服務(wù)。連接至因特網(wǎng)的、稱為服務(wù)器主機(jī)1192的計(jì)算機(jī)主控響應(yīng)于通過因特網(wǎng)接收的信息而提供服務(wù)的過程。例如,服務(wù)器主機(jī)1192主控提供代表呈現(xiàn)在顯示器1114上的視頻數(shù)據(jù)的信息的過程。預(yù)期系統(tǒng)1100的部件可以以各種配置部署在其他計(jì)算機(jī)系統(tǒng)中,例如,主機(jī)1182和服務(wù)器1192。本發(fā)明的至少某些實(shí)施例涉及使用計(jì)算機(jī)系統(tǒng)1100來(lái)實(shí)現(xiàn)此處描述的某些或全部技術(shù)。根據(jù)本發(fā)明的一個(gè)實(shí)施例,這些技術(shù)響應(yīng)于處理器1102執(zhí)行存儲(chǔ)器1104中包含的一個(gè)或更多處理器指令的一個(gè)或更多序列而由計(jì)算機(jī)系統(tǒng)1100執(zhí)行。這種指令(也稱為計(jì)算機(jī)指令、軟件和程序代碼)可以從諸如存儲(chǔ)設(shè)備1108或網(wǎng)絡(luò)鏈路1178的另一計(jì)算機(jī)可讀介質(zhì)讀取至存儲(chǔ)器1104中。包含在存儲(chǔ)器1104中的指令序列的執(zhí)行引起處理器1102執(zhí)行此處描述的一個(gè)或更多方法步驟。在備選實(shí)施例中,諸如ASIC1120的硬件可以替代或結(jié)合軟件使用,以實(shí)現(xiàn)本發(fā)明。由此,本發(fā)明的實(shí)施例不限于任何特定的硬件和軟件組合,除非以其他方式在此明確表明。在網(wǎng)絡(luò)鏈路1178和其他網(wǎng)絡(luò)上通過通信接口 1170傳輸?shù)男盘?hào)攜帶去往和來(lái)自計(jì)算機(jī)系統(tǒng)1100的信息。除了其他之外,計(jì)算機(jī)系統(tǒng)1100可以通過網(wǎng)絡(luò)1180、1190,經(jīng)由網(wǎng)絡(luò)鏈路1178和通信接口 1170發(fā)送和接收信息,包括程序代碼。在使用因特網(wǎng)1190的示例中,服務(wù)器主機(jī)1192通過因特網(wǎng)1190、ISP設(shè)備1184、本地網(wǎng)絡(luò)1180和通信接口 1170傳輸從計(jì)算機(jī)1100發(fā)送的消息所請(qǐng)求的特定應(yīng)用的程序代碼。所接收的代碼可以在接收時(shí)由處理器1102執(zhí)行,或者可以存儲(chǔ)在存儲(chǔ)器1104或存儲(chǔ)設(shè)備1108或其他非易失性存儲(chǔ)中以供后續(xù)執(zhí)行,或者二者皆可實(shí)現(xiàn)。以此方式,計(jì)算機(jī)系統(tǒng)1100可以獲取載波上信號(hào)形式的應(yīng)用程序代碼。各種形式的計(jì)算機(jī)可讀介質(zhì)可以用于將指令或數(shù)據(jù)或二者的一個(gè)或更多序列攜帶至處理器1102以供執(zhí)行。例如,指令和數(shù)據(jù)最初可以承載在遠(yuǎn)程計(jì)算機(jī)(諸如,主機(jī)1182)的磁盤上。遠(yuǎn)程計(jì)算機(jī)將指令和數(shù)據(jù)加載至其動(dòng)態(tài)存儲(chǔ)器,并使用調(diào)制解調(diào)器通過電話線來(lái)發(fā)送指令和數(shù)據(jù)。計(jì)算機(jī)系統(tǒng)1100本地的調(diào)制解調(diào)器在電話線上接收指令和數(shù)據(jù),并且使用紅外發(fā)射器來(lái)將這些指令和數(shù)據(jù)轉(zhuǎn)換為用作網(wǎng)絡(luò)鏈路1178的紅外載波上的信號(hào)。用作通信接口 1170的紅外檢測(cè)器接收在紅外信號(hào)中攜帶的指令和數(shù)據(jù),并將代表指令和數(shù)據(jù)的信息放置在總線1110上。總線1110將這些信息攜帶至存儲(chǔ)器1104,處理器1102從存儲(chǔ)器1104處獲取指令并使用與指令一起發(fā)送的某些數(shù)據(jù)來(lái)執(zhí)行指令。在存儲(chǔ)器1104中接收的指令和數(shù)據(jù)可以可選地存儲(chǔ)在存儲(chǔ)設(shè)備1108上,或者在由處理器1102執(zhí)行之前,或者在其執(zhí)行之后。圖12示出本發(fā)明實(shí)施例可以在其上實(shí)施的芯片組或芯片1200。芯片組1200被編程以如這里描述的識(shí)別媒體內(nèi)容中的對(duì)象,而且例如包括參照?qǐng)D12描述的、結(jié)合到一個(gè)或更多物理封裝(例如,芯片)中的處理器和存儲(chǔ)器部件。通過示例方式,物理封裝包括一個(gè)或更多物質(zhì)、部件、和/或電線在結(jié)構(gòu)組件(例如,基板)上的布置,以提供諸如物理強(qiáng)度、保存尺寸和/或電交互局限的一個(gè)或更多特征??梢灶A(yù)期在某些實(shí)施例中,芯片組1200可以實(shí)施為單芯片。還可以預(yù)期,在某些實(shí)施例中,芯片組或者芯片1200可以實(shí)施為單個(gè)“片上系統(tǒng)”。還可以預(yù)期,在某些實(shí)施例中,例如不使用分離的ASIC,且如此處討論的所有相關(guān)功能將通過一個(gè)處理器或多個(gè)處理器執(zhí)行。芯片組或芯片1200或其一部分構(gòu)成了用于執(zhí)行提供與服務(wù)可用性相關(guān)的用戶接口導(dǎo)航信息的一個(gè)或更多步驟的方式。芯片組或芯片1200或其部分構(gòu)成用于執(zhí)行識(shí)別媒體內(nèi)容中的對(duì)象的一個(gè)或更多步驟的裝置。在一個(gè)實(shí)施例中,芯片組或芯片1200包括諸如用于在芯片組1200的部件之間傳送信息的總線1201之類的通信機(jī)制。處理器1203具有到總線1201的連通性,以執(zhí)行指令和處理存儲(chǔ)在例如存儲(chǔ)器1205中的信息。處理器1203可以包括一個(gè)或更多處理核,每個(gè)核配置為獨(dú)立操作。多核處理器支持單個(gè)物理封裝中的多處理。多核處理器的示例包括兩個(gè)、四個(gè)、八個(gè)或更多數(shù)目的處理核??商鎿Q地或附加地,處理器1203可以包括一個(gè)或更多經(jīng)由總線1201串聯(lián)的微處理器,以支持獨(dú)立執(zhí)行指令、流水線和多線程。處理器1203還可以與諸如一個(gè)或更多數(shù)字信號(hào)處理器(DSP) 1207,或者一個(gè)或更多專用集成電路(ASIC)1209之類的一個(gè)或更多專用部件相互協(xié)同,以執(zhí)行某些處理功能和任務(wù)。DSP1207典型地配置為獨(dú)立于處理器1203實(shí)時(shí)處理現(xiàn)實(shí)世界信號(hào)(例如,聲音)。類似地,ASIC1209可以配置為執(zhí)行更加通用處理器難以執(zhí)行的專用功能。其他有助于執(zhí)行這里描述的本發(fā)明功能的專用部件可以包括一個(gè)或更多現(xiàn)場(chǎng)可編程門陣列(FPGA)(未示出),一個(gè)或更多控制器(未示出)或一個(gè)或更多其他專用計(jì)算機(jī)芯片。在一個(gè)實(shí)施例中,芯片組或芯片1200僅包括一個(gè)或更多處理器以及支持和/或涉及和/或用于該一個(gè)或更多處理器的一些軟件和/或固件。處理器1203和協(xié)同部件具有經(jīng)由總線1201到存儲(chǔ)器1205的連通性。存儲(chǔ)器1205包括用于存儲(chǔ)可執(zhí)行指令的動(dòng)態(tài)存儲(chǔ)器(例如,RAM、磁盤、可寫光盤等)和靜態(tài)存儲(chǔ)器(例如,ROM、⑶-ROM等),當(dāng)指令被運(yùn)行時(shí)執(zhí)行這里描述的發(fā)明步驟以識(shí)別媒體內(nèi)容中的對(duì)象。存儲(chǔ)器1205還存儲(chǔ)與執(zhí)行本發(fā)明步驟相關(guān)聯(lián)的數(shù)據(jù)或執(zhí)行本發(fā)明步驟所產(chǎn)生的數(shù)據(jù)。圖13是根據(jù)一個(gè)實(shí)施例、能夠在圖1系統(tǒng)中操作的用于通信的移動(dòng)終端(例如,手機(jī))的示例性部件圖示。在某些實(shí)施例中,移動(dòng)終端1301或其部分構(gòu)成用于識(shí)別媒體內(nèi)容中的對(duì)象的一個(gè)或更多步驟的裝置。通常,依據(jù)前端和后端特征來(lái)定義無(wú)線電接收器。接收器的前端涵蓋所有射頻(RF)電路,而后端涵蓋所有基帶處理電路。如此申請(qǐng)中使用的,術(shù)語(yǔ)“電路”涉及以下二者(I)僅硬件實(shí)現(xiàn)(諸如以模擬和/或數(shù)字電路實(shí)現(xiàn)),和(2)電路和軟件(和/或固件)的組合(諸如,如果適用于特定上下文,則涉及處理器(多個(gè))(包括數(shù)字信號(hào)處理器(多個(gè)))、軟件和存儲(chǔ)器(多個(gè))的組合,這些部件一起工作以引起諸如移動(dòng)電話或服務(wù)器之類的設(shè)備執(zhí)行各種功能)?!半娐贰钡倪@一定義在此申請(qǐng)中適用于此術(shù)語(yǔ)的所有使用,包括在任何權(quán)利要求中也是如此。作為另一示例,如在此申請(qǐng)中使用的以及如果適用于特定上下文,術(shù)語(yǔ)“電路”也將覆蓋僅處理器(或多個(gè)處理器)及其隨附軟件和/或固件的實(shí)現(xiàn)。如果適用于特定上下文,術(shù)語(yǔ)“電路”也將覆蓋例如移動(dòng)電話中的基帶集成電路或應(yīng)用處理器集成電路,或者蜂窩網(wǎng)絡(luò)設(shè)備或其他網(wǎng)絡(luò)設(shè)備中類似的集成電路。電話的有關(guān)內(nèi)部部件包括主控單元(MCU) 1303、數(shù)字信號(hào)處理器(DSP) 1305和包括麥克風(fēng)增益控制單元和揚(yáng)聲器增益控制單元的接收器/發(fā)射器單元。主顯示單元1307向用戶提供顯示以支持各種應(yīng)用和移動(dòng)終端功能,該各種應(yīng)用和移動(dòng)終端功能執(zhí)行或支持在媒體內(nèi)容中識(shí)別對(duì)象的步驟。顯示器1307包括配置用于顯示移動(dòng)終端(例如,移動(dòng)電話)用戶界面的至少一部分的顯示電路。附加地,顯示器1307和顯示電路配置用于促進(jìn)用戶對(duì)移動(dòng)終端至少某些功能的控制。音頻功能電路1309包括麥克風(fēng)1311和放大從麥克風(fēng)1311輸出的語(yǔ)音信號(hào)的麥克風(fēng)放大器。放大的語(yǔ)音信號(hào)從麥克風(fēng)1311輸出,饋送到編碼器/解碼器(CODEC) 1313。無(wú)線電部分1315放大功率并轉(zhuǎn)化頻率以經(jīng)由天線1317與基站通信,其中基站包含在移動(dòng)通信系統(tǒng)中。如現(xiàn)有技術(shù)已知,功率放大器(PA)1319和發(fā)射器/調(diào)制電路可操作地響應(yīng)于MCU1303,從PA1319的輸出耦合到雙工器1321或循環(huán)器或天線開關(guān)。PA1319還耦合到電池接口和功率控制單元1320。在使用中,移動(dòng)終端1301的用戶對(duì)著麥克風(fēng)1311講話,而且他或她的語(yǔ)音連同任何檢測(cè)到的背景噪音被轉(zhuǎn)換為模擬電壓。模擬電壓繼而通過模擬到數(shù)字轉(zhuǎn)換器(ADC) 1323轉(zhuǎn)換為數(shù)字信號(hào)??刂茊卧?303將數(shù)字信號(hào)路由到DSP1305以在其中處理,諸如語(yǔ)音編碼、信道編碼、解密和交織。在一個(gè)實(shí)施例中,處理后的語(yǔ)音信號(hào)由沒有單獨(dú)示出的單元進(jìn)行編碼,其使用蜂窩傳輸協(xié)議,諸如全球演進(jìn)(EDGE)、通用分組無(wú)線服務(wù)(GPRS)、全球移動(dòng)通信系統(tǒng)(GSM)、因特網(wǎng)協(xié)議多媒體子系統(tǒng)(IMS)、通用移動(dòng)通信系統(tǒng)(UMTS)等,以及例如微波接入(WiMAX)、長(zhǎng)期演進(jìn)(LTE)網(wǎng)絡(luò)、碼分多址(CDMA)、寬帶碼分多址(WCDMA)、無(wú)線保真(WiFi)、衛(wèi)星及類似的其他任意合適的無(wú)線介質(zhì)。編碼信號(hào)接著路由到均衡器1325,以補(bǔ)償在穿過空氣而傳輸?shù)倪^程中發(fā)生的、與頻率相關(guān)的任意損失,諸如相位和幅度失真。均衡比特流之后,調(diào)制器1327將該信號(hào)與RF接口 1329中產(chǎn)生的RF信號(hào)結(jié)合。調(diào)制器1327通過頻率或相位調(diào)制產(chǎn)生正弦波。為了準(zhǔn)備傳輸信號(hào),上變頻器1331將調(diào)制器1327輸出的正弦波與合成器1333產(chǎn)生的另一正弦波相結(jié)合,以達(dá)到傳輸期望頻率。接著經(jīng)過PA1319發(fā)送信號(hào),以將該信號(hào)增加到恰當(dāng)?shù)墓β始?jí)別。在實(shí)際系統(tǒng)中,PA 1319作為可變?cè)鲆娣糯笃?,其增益由DSP1305根據(jù)從網(wǎng)絡(luò)基站接收的信息進(jìn)行控制。信號(hào)接著在雙工器1321內(nèi)濾波,而且可選地發(fā)送到天線耦合器1335以匹配阻抗,從而提供最大功率傳輸。最后,信號(hào)經(jīng)由天線1317發(fā)射到本地基站??梢蕴峁┳詣?dòng)增益控制(AGC),以控制接收器最后級(jí)的增益。信號(hào)可以從那里轉(zhuǎn)發(fā)至可以是另一蜂窩電話、其他移動(dòng)電話或連接到公共交換電話網(wǎng)絡(luò)(PSTN)或其他電話網(wǎng)絡(luò)的陸上通訊線的遠(yuǎn)程電話。發(fā)射到移動(dòng)終端1301的語(yǔ)音信號(hào)經(jīng)由天線1317被接收,而且立刻被低噪放大器(LNA)1337放大。下變頻器1339降低載波頻率,而解調(diào)器1341將RF剝離為只剩下數(shù)字比特流。信號(hào)接著穿過均衡器1325且被DSP1305處理。數(shù)字到模擬轉(zhuǎn)換器(DAC) 1343轉(zhuǎn)換該信號(hào),而且得到的輸出通過揚(yáng)聲器1345被發(fā)送到用戶,這都在可以實(shí)施為中央處理單元(CPU)(沒有示出)的主控單元(MCU) 1303的控制之下。MCUl303接收包括來(lái)自鍵盤1347的輸入信號(hào)的各種信號(hào)。與其他用戶輸入部件(例如,麥克風(fēng)1311)結(jié)合的鍵盤1347和/或MCU1303包括用于管理用戶輸入的用戶接口電路。MCU1303運(yùn)行用戶接口軟件以促進(jìn)用戶控制移動(dòng)終端1301的至少一些功能,以識(shí)別媒體內(nèi)容中的對(duì)象。MCU1303還分別遞送顯示命令和切換命令到顯示器1307以及到語(yǔ)音輸出切換控制器。此外,MCU1303與DSP1305交換信息,而且能夠訪問可選并入的SM卡1349和存儲(chǔ)器1351。另外,MCU1303執(zhí)行該終端所需要的各種控制功能。取決于具體實(shí)施,DSP1305可以執(zhí)行關(guān)于語(yǔ)音信號(hào)的許多傳統(tǒng)數(shù)字處理功能中的任意。另外地,DSP1305根據(jù)麥克風(fēng)1311檢測(cè)的信號(hào)確定本地環(huán)境的背景噪聲水平,而且將麥克風(fēng)1311的增益設(shè)置到補(bǔ)償移動(dòng)終端1301用戶的自然趨勢(shì)的選定級(jí)別。C0DEC1313包括ADC1323和DAC1343。存儲(chǔ)器1351存儲(chǔ)包括呼入音數(shù)據(jù)的各種數(shù)據(jù),而且能夠存儲(chǔ)其他數(shù)據(jù),包括經(jīng)由例如全球因特網(wǎng)接收到的音樂數(shù)據(jù)。軟件模塊可以駐留在RAM存儲(chǔ)器、閃存、寄存器或其他任意形式的本領(lǐng)域公知的可寫存儲(chǔ)介質(zhì)中。存儲(chǔ)設(shè)備1351可以是,但是不局限于單存儲(chǔ)器、CD、DVD、ROM、RAM、EEPROM、光存儲(chǔ)、磁盤存儲(chǔ)器、閃存存儲(chǔ)器或任意其他能夠存儲(chǔ)數(shù)字?jǐn)?shù)據(jù)的非易失性存儲(chǔ)介質(zhì)。例如,可選并入的SIM卡1349承載諸如蜂窩電話號(hào)碼、載波提供服務(wù)、訂閱細(xì)節(jié)和安全信息的重要信息。SM卡1349主要服務(wù)于在無(wú)線電網(wǎng)絡(luò)中標(biāo)識(shí)移動(dòng)終端1301???349還包含用于存儲(chǔ)個(gè)人電話號(hào)碼登記簿、文本消息和用戶特定移動(dòng)臺(tái)設(shè)置的存儲(chǔ)器。盡管結(jié)合許多實(shí)施例和實(shí)現(xiàn)對(duì)本發(fā)明進(jìn)行了描述,本發(fā)明卻并不如此局限,而應(yīng)該覆蓋落入所附權(quán)利要求范圍內(nèi)的許多明顯修改和等同布置。雖然在權(quán)利要求中以某種組合表述了本發(fā)明的特征,可以預(yù)期到能夠按照任意組合和順序布置這些特征。
權(quán)利要求
1.一種方法,包括: 確定在裝置處檢測(cè)內(nèi)容流中的一個(gè)或多個(gè)對(duì)象; 確定捕獲所述內(nèi)容流中的所述一個(gè)或多個(gè)對(duì)象的一個(gè)或多個(gè)表征;以及 將所述一個(gè)或多個(gè)表征與所述內(nèi)容流的一個(gè)或多個(gè)實(shí)例關(guān)聯(lián)。
2.根據(jù)權(quán)利要求1所述的方法,進(jìn)一步包括: 確定捕獲所述內(nèi)容流中的所述一個(gè)或多個(gè)對(duì)象的一個(gè)或多個(gè)其他表征; 至少部分基于一個(gè)或多個(gè)準(zhǔn)則來(lái)選擇所述一個(gè)或多個(gè)表征或所述一個(gè)或多個(gè)其他表征以與所述一個(gè)或多個(gè)實(shí)例關(guān)聯(lián)。
3.根據(jù)權(quán)利要求2所述的方法,其中持續(xù)地、周期性地或在預(yù)定的調(diào)度處捕獲所述一個(gè)或多個(gè)表征或所述一個(gè)或多個(gè)其他表征,直到所述一個(gè)或多個(gè)表征或一個(gè)或多個(gè)其他表征滿足預(yù)定的質(zhì)量閾值。
4.根據(jù)權(quán)利要求1-3的任意一項(xiàng)所述的方法,進(jìn)一步包括: 至少部分地基于所述一個(gè)或多個(gè)表征來(lái)確定所述一個(gè)或多個(gè)對(duì)象的識(shí)別信息;以及 將所述識(shí)別信息與所述一個(gè)或多個(gè)實(shí)例關(guān)聯(lián)。
5.根據(jù)權(quán)利要求4所述的方法,其中確定所述識(shí)別信息進(jìn)一步至少部分地基于在所述裝置、另一個(gè)裝置、服務(wù)器、網(wǎng)絡(luò)組件或者其組合處可獲得的資源。
6.根據(jù)權(quán)利要求1-5的任意一項(xiàng)所述的方法,其中關(guān)聯(lián)所述一個(gè)或多個(gè)表征包括: 確定將所述一個(gè)或多個(gè)表征存儲(chǔ)為所述一個(gè)或多個(gè)實(shí)例中的元數(shù)據(jù),存儲(chǔ)為鏈接到所述一個(gè)或多個(gè)實(shí)例的存儲(chǔ)器中的元數(shù)據(jù),或者其組合。
7.根據(jù)權(quán)利要求1-6的任意一項(xiàng)所述的方法,進(jìn)一步包括: 將所述一個(gè)或多個(gè)表征與各自的時(shí)間戳關(guān)聯(lián);以及 至少部分地基于所述時(shí)間戳將所述一個(gè)或多個(gè)表征與所述一個(gè)或多個(gè)其他實(shí)例關(guān)聯(lián)。
8.根據(jù)權(quán)利要求1-7的任意一項(xiàng)所述的方法,進(jìn)一步包括: 從一個(gè)或多個(gè)其他裝置、一個(gè)或多個(gè)其他內(nèi)容流或者其組合接收所述一個(gè)或多個(gè)表征的至少一個(gè)表征。
9.根據(jù)權(quán)利要求1-8的任意一項(xiàng)所述的方法,其中所述一個(gè)或多個(gè)表征對(duì)應(yīng)于所述一個(gè)或多個(gè)對(duì)象的一個(gè)或多個(gè)特性。
10.根據(jù)權(quán)利要求1-9的任意一項(xiàng)所述的方法,其中所述內(nèi)容流是直播視頻流,并且所述一個(gè)或多個(gè)實(shí)例是圖像、視頻、音頻記錄或其組合。
11.一種設(shè)備,包括: 至少一個(gè)處理器;以及 至少一個(gè)存儲(chǔ)器,其包括用于一個(gè)或多個(gè)程序的計(jì)算機(jī)程序代碼, 所述至少一個(gè)存儲(chǔ)器和計(jì)算機(jī)程序代碼配置成利用所述至少一個(gè)處理器,使得所述設(shè)備執(zhí)行至少以下: 確定在裝置處檢測(cè)內(nèi)容流中的一個(gè)或多個(gè)對(duì)象; 確定捕獲所述內(nèi)容流中的所述一個(gè)或多個(gè)對(duì)象的一個(gè)或多個(gè)表征;以及 將所述一個(gè)或多個(gè)表征與所 述內(nèi)容流的一個(gè)或多個(gè)實(shí)例關(guān)聯(lián)。
12.根據(jù)權(quán)利要求11所述的設(shè)備,其中進(jìn)一步使得所述設(shè)備: 確定捕獲所述內(nèi)容流中的所述一個(gè)或多個(gè)對(duì)象的一個(gè)或多個(gè)其他表征;至少部分基于一個(gè)或多個(gè)準(zhǔn)則來(lái)選擇所述一個(gè)或多個(gè)表征或所述一個(gè)或多個(gè)其他表征以與所述一個(gè)或多個(gè)實(shí)例關(guān)聯(lián)。
13.根據(jù)權(quán)利要求12所述的設(shè)備,其中持續(xù)地、周期性地或在預(yù)定的調(diào)度處捕獲所述一個(gè)或多個(gè)表征或所述一個(gè)或多個(gè)其他表征,直到所述一個(gè)或多個(gè)表征或所述一個(gè)或多個(gè)其他表征滿足預(yù)定的質(zhì)量閾值。
14.根據(jù)權(quán)利要求11-13的任意一項(xiàng)所述的設(shè)備,其中進(jìn)一步使得所述設(shè)備: 至少部分地基于所述一個(gè)或多個(gè)表征來(lái)確定所述一個(gè)或多個(gè)對(duì)象的識(shí)別信息;以及 將所述識(shí)別信息與所述一個(gè)或多個(gè)實(shí)例關(guān)聯(lián)。
15.根據(jù)權(quán)利要求14所述的設(shè)備,其中確定所述識(shí)別信息進(jìn)一步至少部分地基于在所述裝置、另一個(gè)裝置、服務(wù)器、網(wǎng)絡(luò)組件或者其組合處可獲得的資源。
16.根據(jù)權(quán)利要求11-15的任意一項(xiàng)所述的設(shè)備,其中關(guān)聯(lián)所述一個(gè)或多個(gè)表征包括: 確定將所述一個(gè)或多個(gè)表征存儲(chǔ)為所述一個(gè)或多個(gè)實(shí)例中的元數(shù)據(jù),存儲(chǔ)為鏈接到所述一個(gè)或多個(gè)實(shí)例的存儲(chǔ)器中的元數(shù)據(jù),或者其組合。
17.根據(jù)權(quán)利要求11-16的任意一項(xiàng)所述的設(shè)備,其中進(jìn)一步使得所述設(shè)備: 將所述一個(gè)或多個(gè)表征與各自的時(shí)間戳關(guān)聯(lián);以及 至少部分地基于所述時(shí)間戳將所述一個(gè)或多個(gè)表征與所述一個(gè)或多個(gè)其他實(shí)例關(guān)聯(lián)。
18.根據(jù)權(quán)利要求11-17的任意一項(xiàng)所述的設(shè)備,其中進(jìn)一步使得所述設(shè)備: 從一個(gè)或多個(gè)其他裝置、一個(gè)或多個(gè)其他內(nèi)容流或者其組合接收所述一個(gè)或多個(gè)表征的至少一個(gè)表征。
19.根據(jù)權(quán)利要求11-18的任意一項(xiàng)所述的設(shè)備,其中所述一個(gè)或多個(gè)表征對(duì)應(yīng)于所述一個(gè)或多個(gè)對(duì)象的一個(gè)或多個(gè)特性。
20.根據(jù)權(quán)利要求11-19的任意一項(xiàng)所述的設(shè)備,其中所述內(nèi)容流是直播視頻流,并且所述一個(gè)或多個(gè)實(shí)例是圖像、視頻、音頻記錄或其組合。
21.根據(jù)權(quán)利要求11-20的任意一項(xiàng)所述的設(shè)備,其中所述設(shè)備是移動(dòng)電話,其進(jìn)一步包括: 用戶接口電路和用戶接口軟件,配置成促進(jìn)用戶通過使用顯示器來(lái)控制所述移動(dòng)電話的至少一些功能并且配置成響應(yīng)于用戶輸入;以及 顯示器和顯示電路,配置成顯示所述移動(dòng)電話的用戶接口的至少一部分,所述顯示器和所述顯示電路配置成促進(jìn)用戶對(duì)所述移動(dòng)電話的至少一些功能的控制。
22.—種攜帶一個(gè)或多個(gè)指令的一個(gè)或多個(gè)序列的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),當(dāng)由一個(gè)或多個(gè)處理器執(zhí)行時(shí),所述一個(gè)或多個(gè)指令的一個(gè)或多個(gè)序列使得設(shè)備至少執(zhí)行根據(jù)權(quán)利要求1-10的任意一項(xiàng)所述的方法。
23.一種設(shè)備,包括用于執(zhí)行根據(jù)權(quán)利要求1-10的任意一項(xiàng)所述的方法的裝置。
24.根據(jù)權(quán)利要求23所述的設(shè)備,其中所述設(shè)備是移動(dòng)電話,其進(jìn)一步包括: 用戶接口電路和用戶接口軟件,配置成促進(jìn)用戶通過使用顯示器來(lái)控制所述移動(dòng)電話的至少一些功能并且配置成響應(yīng)于用戶輸入;以及 顯示器和顯示電路,配置成顯示所述移動(dòng)電話的用戶接口的至少一部分,所述顯示器和所述顯示電路配置成促進(jìn)用戶對(duì)所述移動(dòng)電話的至少一些功能的控制。
25.—種包括一個(gè)或多個(gè)指令的一個(gè)或多個(gè)序列的計(jì)算機(jī)程序產(chǎn)品,當(dāng)由一個(gè)或多個(gè)處理器執(zhí)行時(shí),所述一個(gè)或多個(gè)指令的一個(gè)或多個(gè)序列使得設(shè)備至少執(zhí)行根據(jù)權(quán)利要求1-10的任意一項(xiàng)所述的方法的步驟。
26.一種方法,包括促進(jìn)對(duì)于配置成允許接入到至少一個(gè)服務(wù)的至少一個(gè)接口的接入,所述至少一個(gè)服務(wù)配置成執(zhí)行根 據(jù)權(quán)利要求1-10的任意一項(xiàng)所述的方法。
全文摘要
提供一種用于識(shí)別媒體內(nèi)容中的對(duì)象的方法。捕獲管理器確定在裝置處檢測(cè)內(nèi)容流中的一個(gè)或多個(gè)對(duì)象。下面,捕獲管理器確定捕獲所述內(nèi)容流中的一個(gè)或多個(gè)對(duì)象的一個(gè)或多個(gè)表征。接著,捕獲管理器將所述一個(gè)或多個(gè)表征與所述內(nèi)容流的一個(gè)或多個(gè)實(shí)例關(guān)聯(lián)。
文檔編號(hào)H04L29/08GK103080951SQ201180040741
公開日2013年5月1日 申請(qǐng)日期2011年8月2日 優(yōu)先權(quán)日2010年8月23日
發(fā)明者I·T·薩爾米南, M·A·尼爾米 申請(qǐng)人:諾基亞公司