專利名稱:數(shù)據(jù)處理裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及將多個(gè)圖像自動(dòng)分類為預(yù)先確定的范疇的圖像處理技術(shù)。
背景技術(shù):
近年來,例如對(duì)被攝體像進(jìn)行攝像的DSC(Digital Still Camera)、便攜電話照相機(jī)和數(shù)字?jǐn)z像機(jī)廣泛普及,進(jìn)而,圖像數(shù)據(jù)保存用的記錄介質(zhì)正在大規(guī)?;?。因此,個(gè)人用戶也能夠保有大量的圖像或動(dòng)畫等的AV(Audi0 Video)內(nèi)容。但是,用戶從大量的圖像組或動(dòng)畫組中搜索用戶需要的圖像或動(dòng)畫時(shí),需要很多時(shí)間和勞力。因此,存在如下的圖像索引技術(shù)能夠自動(dòng)對(duì)圖像賦予標(biāo)簽并進(jìn)行整理,以便高效地搜索用戶期望的圖像。這里,作為用于自動(dòng)對(duì)圖像賦予標(biāo)簽的圖像索引技術(shù),存在各種手法。例如,使用時(shí)間或場所信息估計(jì)事件的技術(shù)、面部檢測技術(shù)等的特定物體的檢測、或者通過顏色或紋理信息的類似度檢測類似圖像并賦予標(biāo)簽在檢索時(shí)加以利用。但是,在各種場所拍攝的圖像中存在各種物體和風(fēng)景。因此,提出了對(duì)一般物體進(jìn)行識(shí)別或分類的圖像索引技術(shù)。作為現(xiàn)有的一般物體識(shí)別技術(shù),根據(jù)亮度值等的圖像中的基本特征量或局部特征量組對(duì)物體進(jìn)行建模,與從圖像中檢測到的特征量進(jìn)行匹配,從而進(jìn)行識(shí)別。該識(shí)別技術(shù)一般多用作計(jì)算機(jī)視覺應(yīng)用。并且,公知有提供如下裝置的技術(shù)為了與現(xiàn)有手法相比高速高精度地識(shí)別多個(gè)圖像,生成表示輸入圖形的特征矢量,根據(jù)使用多個(gè)不同的分類器進(jìn)行處理后的輸出結(jié)果的組合,對(duì)輸入圖形進(jìn)行自動(dòng)分類(例如參照專利文獻(xiàn)1)。通過該手法,能夠更加高速地利用各種觀點(diǎn)計(jì)算物體的特征。而且,公知有如下方法著眼于物體的各種移動(dòng)或變化,物體自動(dòng)學(xué)習(xí)由無法通過任意方法相互以對(duì)方為基準(zhǔn)移動(dòng)的若干部分構(gòu)成的分級(jí)型的物體識(shí)別模型,從而檢索物體 (例如參照專利文獻(xiàn)2)。現(xiàn)有技術(shù)文獻(xiàn)專利文獻(xiàn)專利文獻(xiàn)1 日本特開2008-97607號(hào)公報(bào)專利文獻(xiàn)2 日本特開2009-104666號(hào)公報(bào)
發(fā)明內(nèi)容
發(fā)明要解決的課題通常,在上述圖像索引技術(shù)中,不是用戶數(shù)據(jù)中特定(特化)的分類,而是以針對(duì)一般物體定義有效模型并進(jìn)行分類為前提。因此,例如在專利文獻(xiàn)1所公開的結(jié)構(gòu)中,根據(jù)多個(gè)分類器的加權(quán)組合輸出,對(duì)根據(jù)圖像計(jì)算出的特征矢量進(jìn)行分類,所以,針對(duì)能夠定義的某個(gè)范圍內(nèi)的物體有效發(fā)揮作用,但是,不具有能夠覆蓋全部一般物體的程度的處理能力,不一定能夠進(jìn)行未定義物體的檢測或者對(duì)用戶來說很重要的物體的檢測。S卩,在現(xiàn)有技術(shù)中,不一定對(duì)用戶數(shù)據(jù)中特定的目標(biāo)進(jìn)行分類,所以,產(chǎn)生用戶不滿意分類結(jié)果這樣的問題。因此,鑒于上述問題,本發(fā)明的目的在于,提供即使在存在用戶數(shù)據(jù)中特定的目標(biāo)的情況下用戶也會(huì)滿意分類結(jié)果的數(shù)據(jù)處理裝置、圖像處理方法、程序以及集成電路。用于解決課題的手段為了實(shí)現(xiàn)上述目的,本發(fā)明的數(shù)據(jù)處理裝置的特征在于,該數(shù)據(jù)處理裝置具有存儲(chǔ)單元,保持由多個(gè)特征量各自的檢測頻度的組合構(gòu)成且用于目標(biāo)分類的多個(gè)模型數(shù)據(jù); 分類單元,根據(jù)所述多個(gè)模型數(shù)據(jù)和在分類對(duì)象的數(shù)據(jù)中被檢測的2個(gè)以上的特征量各自的檢測頻度,確定可否進(jìn)行該數(shù)據(jù)中包含的目標(biāo)的分類;確定單元,在對(duì)多個(gè)分類對(duì)象的數(shù)據(jù)進(jìn)行了基于所述分類單元的處理后,在存在多個(gè)確定為不可進(jìn)行目標(biāo)分類的未識(shí)別數(shù)據(jù)的情況下,確定2個(gè)以上的、被檢測的頻度相同的未識(shí)別數(shù)據(jù)為一定數(shù)量以上的特征量;以及模型生成單元,通過類生成手法,根據(jù)所確定的2個(gè)以上的特征量生成新的模型數(shù)據(jù),并存儲(chǔ)在所述存儲(chǔ)單元中。發(fā)明效果根據(jù)該結(jié)構(gòu),數(shù)據(jù)處理裝置使用多個(gè)未識(shí)別數(shù)據(jù),確定2個(gè)以上的、被檢測的頻度相同的未識(shí)別數(shù)據(jù)為一定數(shù)量以上的特征量。在多個(gè)未識(shí)別數(shù)據(jù)中包含相同目標(biāo)的未識(shí)別數(shù)據(jù)較多,因此能夠進(jìn)行這種確定。因此,通過根據(jù)所確定的2個(gè)以上的特征量生成新的模型數(shù)據(jù),能夠從多個(gè)未識(shí)別數(shù)據(jù)中對(duì)包含相同目標(biāo)的未識(shí)別數(shù)據(jù)進(jìn)行分類。這里,也可以是,所述確定單元按照每個(gè)所述未識(shí)別數(shù)據(jù),取得針對(duì)所述多個(gè)特征量分別檢測與該特征量類似的特征量的檢測頻度,根據(jù)分別從所述未識(shí)別數(shù)據(jù)取得的檢測頻度,按照所述多個(gè)特征量的每一個(gè)生成檢測頻度的分布程度,分別根據(jù)所述分布程度,確定2個(gè)以上的、被檢測的頻度相同的未識(shí)別數(shù)據(jù)為一定數(shù)量以上的特征量。根據(jù)該結(jié)構(gòu),數(shù)據(jù)處理裝置根據(jù)檢測頻度的分布程度,能夠容易地確定2個(gè)以上的、被檢測的頻度相同的未識(shí)別數(shù)據(jù)為一定數(shù)量以上的特征量。這里,也可以是,所述確定單元按照依據(jù)規(guī)定規(guī)則的每個(gè)區(qū)間對(duì)所述多個(gè)未識(shí)別數(shù)據(jù)進(jìn)行分組,生成多個(gè)數(shù)據(jù)組,按照每個(gè)所述數(shù)據(jù)組進(jìn)行檢測頻度的取得、分布程度的生成以及特征量的確定,所述模型生成單元按照每個(gè)所述數(shù)據(jù)組生成新的模型數(shù)據(jù)。根據(jù)該結(jié)構(gòu),數(shù)據(jù)處理裝置按照依據(jù)規(guī)定規(guī)則的每個(gè)區(qū)間,確定被檢測的頻度相同的未識(shí)別數(shù)據(jù)為一定數(shù)量以上的特征量,所以,能夠進(jìn)行每個(gè)區(qū)間內(nèi)包含的目標(biāo)的分類。這里,也可以是,表示生成該未識(shí)別數(shù)據(jù)的日期時(shí)間的時(shí)間信息分別與所述未識(shí)別數(shù)據(jù)對(duì)應(yīng),依據(jù)所述規(guī)定規(guī)則的區(qū)間是按照一定時(shí)間段劃分的期間,所述確定單元按照劃分為一定時(shí)間段的每個(gè)期間,對(duì)所述多個(gè)未識(shí)別數(shù)據(jù)進(jìn)行分組,生成所述多個(gè)數(shù)據(jù)組。根據(jù)該結(jié)構(gòu),數(shù)據(jù)處理裝置按照劃分為一定時(shí)間段的每個(gè)期間,確定2個(gè)以上的特征量。通常在相同時(shí)間段中生成包含相同目標(biāo)的數(shù)據(jù)的情況較多,所以,通過劃分為這種區(qū)間,能夠容易地進(jìn)行每個(gè)區(qū)間內(nèi)包含的目標(biāo)的分類。這里,也可以是,所述模型生成單元在生成了多個(gè)新的模型數(shù)據(jù)的情況下,判定在一個(gè)數(shù)據(jù)組中生成的一個(gè)模型數(shù)據(jù)與在其他數(shù)據(jù)組中生成的其他模型數(shù)據(jù)是否存在基于時(shí)間推移的相關(guān)關(guān)系,在判定為存在相關(guān)關(guān)系的情況下,將該一個(gè)模型數(shù)據(jù)與該其他模型數(shù)據(jù)作為具有時(shí)間變化性的模型數(shù)據(jù)對(duì)應(yīng)起來。根據(jù)該結(jié)構(gòu),當(dāng)在不同數(shù)據(jù)組中生成的各模型數(shù)據(jù)存在基于時(shí)間推移的相關(guān)關(guān)系的情況下,數(shù)據(jù)處理裝置將這些模型數(shù)據(jù)作為具有時(shí)間變化性的模型數(shù)據(jù)對(duì)應(yīng)起來,所以, 能夠使根據(jù)這些模型數(shù)據(jù)分類的數(shù)據(jù)為包含同一目標(biāo)的數(shù)據(jù)。這里,也可以是,在對(duì)所述一個(gè)模型數(shù)據(jù)賦予特征的第1特征量的類似性的變化度與對(duì)所述其他模型數(shù)據(jù)賦予特征的第2特征量的類似性的變化度之間存在比例關(guān)系的情況下,所述模型生成單元判定為存在相關(guān)關(guān)系。根據(jù)該結(jié)構(gòu),當(dāng)在不同數(shù)據(jù)組中生成的各模型數(shù)據(jù)的類似性的變化度存在比例關(guān)系的情況下,數(shù)據(jù)處理裝置判定為存在相關(guān)關(guān)系,所以,能夠容易地確定有無相關(guān)關(guān)系。這里,也可以是,當(dāng)在一個(gè)數(shù)據(jù)組中生成的一個(gè)模型數(shù)據(jù)與在其他數(shù)據(jù)組中生成的其他模型數(shù)據(jù)相同的情況下、或者在其余的數(shù)據(jù)組中周期性地出現(xiàn)與該一個(gè)模型數(shù)據(jù)相同的模型數(shù)據(jù)的情況下,所述模型生成單元僅將該一個(gè)模型數(shù)據(jù)向所述存儲(chǔ)單元存儲(chǔ)。根據(jù)該結(jié)構(gòu),當(dāng)在一個(gè)數(shù)據(jù)組中生成的模型數(shù)據(jù)與在其他數(shù)據(jù)組中生成的模型數(shù)據(jù)相同的情況下,數(shù)據(jù)處理裝置僅存儲(chǔ)該一個(gè)模型數(shù)據(jù),由此,能夠防止應(yīng)該存儲(chǔ)的模型數(shù)據(jù)重復(fù)。這里,也可以是,所述確定單元使用全部所述未識(shí)別數(shù)據(jù),取得針對(duì)每個(gè)特征量的計(jì)算頻度,確定所取得的計(jì)算頻度為規(guī)定頻度以上的一個(gè)以上的特征量,按照未進(jìn)行所述目標(biāo)的識(shí)別的每個(gè)數(shù)據(jù),取得分別針對(duì)所取得的一個(gè)以上的特征量的檢測頻度,根據(jù)按照該每個(gè)數(shù)據(jù)取得的一個(gè)以上的檢測頻度,生成所述分布程度。根據(jù)該結(jié)構(gòu),數(shù)據(jù)處理裝置確定分別針對(duì)多個(gè)特征量取得的計(jì)算頻度中的所取得的計(jì)算頻度為規(guī)定頻度以上的一個(gè)以上的特征量,針對(duì)所確定的一個(gè)以上的特征量分別取得檢測頻度,所以,與取得全部特征量各自的檢測頻度的情況相比,能夠減輕處理負(fù)荷。這里,也可以是,所述數(shù)據(jù)處理裝置還具有顯示單元,顯示所述多個(gè)未識(shí)別數(shù)據(jù); 以及指示受理單元,從用戶受理從所顯示的未識(shí)別數(shù)據(jù)中指定2個(gè)以上的數(shù)據(jù),所述確定單元根據(jù)分別從由所述指示受理單元受理的所述2個(gè)以上的未識(shí)別數(shù)據(jù)取得的所述多個(gè)特征量的檢測頻度,或者根據(jù)分別從除了所述2個(gè)以上的數(shù)據(jù)以外的其余數(shù)據(jù)取得的所述多個(gè)特征量的檢測頻度,生成所述多個(gè)特征量的所述分布程度。根據(jù)該結(jié)構(gòu),數(shù)據(jù)處理裝置從規(guī)定數(shù)以上的未識(shí)別數(shù)據(jù)中的從用戶受理的2個(gè)以上的數(shù)據(jù)取得檢測頻度,生成分布程度,所以,能夠生成反映了用戶意圖的模型數(shù)據(jù)。這里,也可以是,所述指示受理單元在還未生成新的模型數(shù)據(jù)時(shí)受理所述指示。根據(jù)該結(jié)構(gòu),數(shù)據(jù)處理裝置在還未生成新的模型數(shù)據(jù)時(shí),從用戶受理用于生成模型數(shù)據(jù)的數(shù)據(jù)的指定,所以,能夠生成更加可靠的模型數(shù)據(jù)。這里,也可以是,分別關(guān)于由所述指示受理單元受理的所述2個(gè)以上的未識(shí)別數(shù)據(jù),所述確定單元根據(jù)該未識(shí)別數(shù)據(jù)的生成日期時(shí)間,分別對(duì)所述2個(gè)以上的未識(shí)別數(shù)據(jù)進(jìn)行分組以使得該生成日期時(shí)間屬于多個(gè)期間中的某個(gè)期間,按照每個(gè)組生成所述分布程度。根據(jù)該結(jié)構(gòu),數(shù)據(jù)處理裝置按照每個(gè)期間生成分布程度,所以,模型生成單元能夠生成每個(gè)期間的模型數(shù)據(jù)。這里,也可以是,所述數(shù)據(jù)處理裝置還具有顯示單元,對(duì)估計(jì)具有通過由所述模型數(shù)據(jù)生成單元生成的所述新的模型數(shù)據(jù)識(shí)別的目標(biāo)的多個(gè)數(shù)據(jù)進(jìn)行顯示;以及指示受理單元,從用戶受理從所顯示的多個(gè)數(shù)據(jù)中指定2個(gè)以上的數(shù)據(jù),所述確定單元根據(jù)分別從由所述指示受理單元受理的所述2個(gè)以上的數(shù)據(jù)取得的所述多個(gè)特征量的檢測頻度,或者根據(jù)分別從除了所述2個(gè)以上的數(shù)據(jù)以外的其余數(shù)據(jù)取得的所述多個(gè)特征量的檢測頻度, 按照所述多個(gè)特征量生成與所述分布程度不同的分布程度,所述模型數(shù)據(jù)生成單元根據(jù)所述不同的分布程度,生成與所述新的模型數(shù)據(jù)不同的模型數(shù)據(jù)。根據(jù)該結(jié)構(gòu),數(shù)據(jù)處理裝置根據(jù)估計(jì)具有通過所生成的新的模型數(shù)據(jù)識(shí)別的目標(biāo)的多個(gè)數(shù)據(jù)中的從用戶受理的2個(gè)以上的數(shù)據(jù),再次生成模型數(shù)據(jù),而且,將估計(jì)具有通過之前生成的新的模型數(shù)據(jù)識(shí)別的目標(biāo)的多個(gè)數(shù)據(jù)中的不應(yīng)該識(shí)別的數(shù)據(jù)除外,由此,能夠再次生成高精度的模型數(shù)據(jù)。這里,也可以是,所述數(shù)據(jù)是圖像,所述確定單元按照未進(jìn)行所述目標(biāo)的識(shí)別的每個(gè)圖像,使用在該圖像中被檢測的一個(gè)以上的特征量的類似度,生成至少包含局部特征組的高次特征組,從各局部特征組取得所述檢測頻度。根據(jù)該結(jié)構(gòu),數(shù)據(jù)處理裝置針對(duì)未進(jìn)行目標(biāo)的識(shí)別的圖像,生成新的模型數(shù)據(jù),所以,在生成了該新的模型數(shù)據(jù)以后,能夠?qū)υ撔碌哪P蛿?shù)據(jù)中特定的圖像進(jìn)行分類。
圖1是示出數(shù)據(jù)處理裝置100的結(jié)構(gòu)的框圖。圖2是示出在某個(gè)圖像中提取出的SIFT特征量的一例的圖。圖3是示出在某個(gè)圖像中提取出的各Visual Word的檢測頻度的一例的圖。圖4是示出根據(jù)從未分類的全部AV數(shù)據(jù)中提取出的每個(gè)Visual Word的檢測頻度值的檢測數(shù)而生成的類似度分布的一例的圖。圖5是示出第1基準(zhǔn)參數(shù)表TlOO的數(shù)據(jù)結(jié)構(gòu)的一例的圖。圖6是示出第2基準(zhǔn)參數(shù)表TllO的數(shù)據(jù)結(jié)構(gòu)的一例的圖。圖7是計(jì)算同一特征量的處理的流程圖。圖8是以區(qū)間單位計(jì)算同一特征量的處理的流程圖。圖9是示出通過同一特征中的限定特征量空間提取局域模型時(shí)的圖形的一例的圖。圖10是示出局域模型生成部20的結(jié)構(gòu)的框圖。圖11是示出按照每個(gè)區(qū)間存在的圖像組的一例的圖。圖12是示出提取區(qū)間信息的處理的流程圖。圖13是示出按照每個(gè)區(qū)間生成的局域模型和時(shí)間連續(xù)性的一例的圖。圖14是示出按照每個(gè)區(qū)間生成的局域模型和長期變化性的一例的圖。圖15是示出追加了用戶交互輸入部30時(shí)的結(jié)構(gòu)的框圖。圖16是示出通過用戶交互輸入部30顯示的圖像GlOO的一例的圖。圖17是示出通過用戶交互輸入部30顯示的圖像G200的一例的圖。圖18是示出通過用戶交互輸入部30顯示的圖像G300的一例的圖。圖19是示出反饋處理的流程圖。圖20是示出數(shù)據(jù)處理裝置IOOa的結(jié)構(gòu)的框圖。圖21是示出數(shù)據(jù)處理裝置IOOb的結(jié)構(gòu)的框圖。圖22是在數(shù)據(jù)處理裝置IOOb中計(jì)算同一特征量的處理的流程圖。
圖23是示出根據(jù)基準(zhǔn)特征量與全部圖像的一致度而生成的一致度分布的一例的圖。
具體實(shí)施例方式下面,參照
本發(fā)明的實(shí)施方式。1.第1實(shí)施方式1. 1數(shù)據(jù)處理裝置100的結(jié)構(gòu)下面,參照
本發(fā)明的第1實(shí)施方式。本實(shí)施方式涉及如下結(jié)構(gòu)在對(duì)家庭內(nèi)等的局域AV(Audic) Video)數(shù)據(jù)組進(jìn)行自動(dòng)整理的數(shù)據(jù)處理裝置100中,生成局域的分類模型,自動(dòng)地以高精度對(duì)AV數(shù)據(jù)組賦予標(biāo)簽。這里,AV數(shù)據(jù)是照片圖像數(shù)據(jù)、動(dòng)態(tài)圖像數(shù)據(jù)、音樂數(shù)據(jù)等的總稱。圖1是示出數(shù)據(jù)處理裝置100的結(jié)構(gòu)的框圖。在圖1中,數(shù)據(jù)處理裝置100由局域DB(Data Base 數(shù)據(jù)庫)1、預(yù)處理部2、特征量提取部3、分類部4、基本辭典DB (數(shù)據(jù)庫)5、檢索索引DB (數(shù)據(jù)庫)6、未分類特征DB (數(shù)據(jù)庫)7、同一特征提取部8、局域模型生成部9、局域辭典DB (數(shù)據(jù)庫)10以及基準(zhǔn)參數(shù)DB (數(shù)據(jù)庫)11構(gòu)成。這里,具體而言,各DB是HDD (Hard Disk Drive)或DVD (Digital Versatile Disk) 等的大容量介質(zhì)盤或半導(dǎo)體存儲(chǔ)器等的存儲(chǔ)設(shè)備。(1)局域 DB 1局域DB 1例如存儲(chǔ)照片圖像數(shù)據(jù)、動(dòng)態(tài)圖像數(shù)據(jù)、音樂數(shù)據(jù)等的AV(Audic) Video)數(shù)據(jù),作為家庭內(nèi)等的文件數(shù)據(jù)。(2)預(yù)處理部2預(yù)處理部2進(jìn)行在提取AV數(shù)據(jù)的特征量之前進(jìn)行的處理。具體而言,為了容易地提取特征量,預(yù)處理部2進(jìn)行AV數(shù)據(jù)的歸一化處理、基于圖像的區(qū)域分割處理來檢測背景或物體區(qū)域的處理、基于音頻的功率變化計(jì)算來檢測場景區(qū)間的處理。(3)特征量提取部3特征量提取部3進(jìn)行提取AV數(shù)據(jù)的特征量的處理。具體而言,在AV數(shù)據(jù)是圖像數(shù)據(jù)的情況下,在特征量提取部3中,存在根據(jù)邊緣、顏色或紋理等的低次特征量以特征點(diǎn)為中心表現(xiàn)區(qū)域特征量的特征量描述符即SURF(Speeded Up Robust Features)或 SIFT (Scale-Invariant Feature Transform)等的特征量、以及表現(xiàn)物體的形狀特征的 HOG (Histogram of oriented Gradient)等的高次特征。另外,在藤吉弘亙著的“Gradient 《一 ^ Q特徴抽出-SIFT i H0G-” (信息處理學(xué)會(huì)研究報(bào)告CVIM 160,pp. 211-224,2007) 中進(jìn)行了詳細(xì)記載。在AV數(shù)據(jù)是音頻數(shù)據(jù)的情況下,在特征量提取部3中,存在音頻功率、零交叉、頻譜關(guān)聯(lián)特征量、倒頻譜關(guān)聯(lián)特征量、色度矢量等的特征量。作為頻譜關(guān)聯(lián)或倒頻譜關(guān)聯(lián)的特征量,存在頻譜的滾降、MFCC(Mel Frequency Cepstrum Coefficient)等。除此之外,在 MPEG7 (Moving Picture Expelts Group Phase 7)的標(biāo)準(zhǔn)中,存在多個(gè)記載為 MPEG7_Audio Features 白勺牛寺 IEfi。 # 力 Low · 5F T"白勺牛寺 ffi fi,# $ Audio Power、Audio Spectrum Envelope、Audio Spectrum CentroicUHarmonic Spectral Deviation、Harmonic SpectralSpread 等。另外,在 Hyoung-Gook Kim 等著的 “MPEG7AUDI0 AND BEYOND”(John Wiley & Sons Ltd, 2005)中進(jìn)行了詳細(xì)記載。這里,作為一例,以下說明AV數(shù)據(jù)是圖像數(shù)據(jù)時(shí)的特征量提取部3的功能。特征量提取部3預(yù)先具有存儲(chǔ)了多個(gè)用于提取特征量的基準(zhǔn)特征量即Visual Word的辭典。特征量提取部3提取圖像內(nèi)的一個(gè)以上的特征點(diǎn),根據(jù)提取出的特征點(diǎn)計(jì)算SIFT 特征量。特征量提取部3使用計(jì)算出的全部SIFT特征量和存儲(chǔ)在辭典內(nèi)的多個(gè)Visual Word,生成一個(gè)以上的BoF (Bag Of Features) 0特征量提取部3向分類部4輸出所生成的一個(gè)以上的BoF。這里,Visual Word是作為各種SIFT特征量中的代表性的中心模型而計(jì)算出的, 表示人、房屋、雨傘等的一般物體形狀的部分要素或全體。另外,Visual Word、特征點(diǎn)的提取、SIFT特征量的計(jì)算、BoF的生成是公知技術(shù),所以,這里省略說明。(4)分類部 4分類部4使用從AV數(shù)據(jù)中提取出的特征量,與現(xiàn)有的模型數(shù)據(jù)進(jìn)行匹配處理,進(jìn)行輸入數(shù)據(jù)適合哪個(gè)模型的判定處理。這里,在判定處理中例如使用機(jī)械學(xué)習(xí)手法即判別器。作為一般的判別器,存在 GMM(Gaussian mixture model) SVM(Support Vector Machine)等。在判別器中設(shè)置預(yù)先按照應(yīng)該分類的每個(gè)范疇準(zhǔn)備的分類基準(zhǔn)數(shù)據(jù)、例如后述的基本辭典DB 5和局域辭典DB 10所蓄積的模型信息,使用取樣輸入信息(這里為AV數(shù)據(jù)的一個(gè)以上的各BoF)進(jìn)行分類項(xiàng)目的判別以及作為其判別可靠度的似然的計(jì)算。這里,似然一般意味著,值越大,可靠度越高。在判別器中,當(dāng)所輸入的AV數(shù)據(jù)在分類部4中適合一個(gè)模型時(shí),分類部4將該適合的一個(gè)模型的分類信息與輸入數(shù)據(jù)即AV數(shù)據(jù)關(guān)聯(lián)起來(賦予標(biāo)簽),蓄積在檢索索引DB 6中。在判別器中,當(dāng)所輸入的AV數(shù)據(jù)不適合任意模型的情況下,分類部4將其與和該 AV數(shù)據(jù)關(guān)聯(lián)的未分類信息關(guān)聯(lián)起來(賦予標(biāo)簽),蓄積在檢索索引DB 6中。這里,未分類信息是識(shí)別AV數(shù)據(jù)的識(shí)別符,例如在AV數(shù)據(jù)是圖像的情況下,未分類信息是與圖像對(duì)應(yīng)的圖像編號(hào)。(5)基本辭典DB 5基本辭典DB 5預(yù)先定義了用于利用分類部4進(jìn)行分類的范疇,根據(jù)要利用的特征量,蓄積對(duì)該范疇進(jìn)行分類所需要的各范疇的模型信息。(6)檢索索引DB 6當(dāng)所輸入的AV數(shù)據(jù)在分類部4中適合一個(gè)模型時(shí),檢索索引DB 6將該適合的模型的分類信息與輸入數(shù)據(jù)關(guān)聯(lián)起來進(jìn)行蓄積。(7)未分類特征DB 7未分類特征DB 7蓄積無法分類的AV數(shù)據(jù)的未分類信息。(8)同一特征提取部8同一特征提取部8根據(jù)蓄積在未分類特征DB 7中的未分類信息,從未分類的多個(gè) AV數(shù)據(jù)中計(jì)算特征量的類似性和特征量的出現(xiàn)頻度等,提取存在一定偏差時(shí)估計(jì)能夠從同一物體得到的同一特征。例如在分類部4進(jìn)行了分類處理的情況下,同一特征提取部8開始進(jìn)行處理。開始分類處理后,同一特征提取部8判定蓄積在未分類特征DB 7中的未分類信息的數(shù)量是否為開始同一特征提取處理所需要的一定數(shù)量以上。例如,使用在后述的基準(zhǔn)參數(shù)DB 11中存儲(chǔ)的第1基準(zhǔn)參數(shù)表TlOO進(jìn)行判定。在判斷為進(jìn)行提取處理的情況下,同一特征提取部8分別從蓄積在未分類特征DB 7中的未分類信息中,提取從該未分類信息所表示的AV數(shù)據(jù)中提取出的全部特征量中的計(jì)算頻度為一定頻度以上的基準(zhǔn)特征量(Visual Word)。這里,例如設(shè)全部AV數(shù)據(jù)數(shù)量為 Vall,設(shè)計(jì)算出一個(gè)以上的特征量χ的AV數(shù)據(jù)數(shù)量為Vx,。al,設(shè)根據(jù)存在特征量χ的各AV數(shù)據(jù)計(jì)算出的特征量χ的平均數(shù)為Vx,_,通過以下的數(shù)式1計(jì)算基準(zhǔn)特征量的某個(gè)類別χ的計(jì)算頻度F(X)。[數(shù)式1]FOO = log(Vx,one) X (Vx,cal + Vall)···(數(shù)式 1)然后,同一特征提取部8使用計(jì)算出的F(x)的值、以及在后述的基準(zhǔn)參數(shù)DB 11 中存儲(chǔ)的第2基準(zhǔn)參數(shù)表T110,僅提取一個(gè)以上的計(jì)算頻度大的基準(zhǔn)特征量。并且,同一特征提取部8針對(duì)一個(gè)AV數(shù)據(jù),計(jì)算相對(duì)于各個(gè)基準(zhǔn)特征量的特征量的類似度。例如,在基準(zhǔn)特征量是Visual Word的情況下,計(jì)算各Visual Word相對(duì)于模型的距離作為類似度。具體而言,使用圖2和圖3進(jìn)行說明。圖2示出在某個(gè)拍攝了人、房屋和雨傘的照片中提取出的SIFT特征量。檢測一張圖像內(nèi)的特征點(diǎn)(圖中所示的特征點(diǎn)) 并將該區(qū)域信息(圖中的刻度)作為SIFT描述符,從而計(jì)算SIFT特征量。并且,旋轉(zhuǎn)是用來表示捕捉特征點(diǎn)的特征區(qū)域(刻度)的旋轉(zhuǎn)方向的朝向。另外,特征點(diǎn)、刻度和旋轉(zhuǎn)與現(xiàn)有技術(shù)的定義相同,所以省略詳細(xì)說明。并且,在類似度的計(jì)算中,例如根據(jù)同一特征組所具有的多變量數(shù)據(jù),計(jì)算歐幾里得距離、馬氏距離、閔可夫斯基距離等,將該距離的近度作為類似度。作為基本的距離,存在歐幾里得平方距離,在得到η個(gè)體m變量的特征的觀測值時(shí),作為表示個(gè)體i與個(gè)體j的非類似性的量,非類似度能夠通過下述數(shù)式2計(jì)算。[數(shù)式2]Cilj=S (Xk4-Xkj)2…(數(shù)式 2)
k=l如圖2所示,同一特征提取部8按照未分類的全部AV數(shù)據(jù)(圖像),計(jì)算該AV數(shù)據(jù)內(nèi)的全部SIFT特征量。然后,同一特征提取部8針對(duì)未分類的全部AV數(shù)據(jù),如圖3所示, 計(jì)算作為與各Visual Word類似的SIFT特征量檢測到的數(shù)量,作為檢測頻度。然后,同一特征提取部8分別針對(duì)作為頻度大的基準(zhǔn)特征量提取出的一個(gè)以上的基準(zhǔn)特征量,在未分類的全部AV數(shù)據(jù)各自的該基準(zhǔn)特征量中,根據(jù)檢測頻度生成圖4所示的類似度分布,計(jì)算該分布內(nèi)的峰值。這里,峰值例如能夠作為從類似度分布中的極大值減去最近的極小值而得到的差分來計(jì)算。下面,具體說明圖4所示的各Visual Word的類似度分布中的峰值的計(jì)算方法。同一特征提取部8按照全部圖像數(shù)據(jù),計(jì)算圖3所示的檢測頻度,計(jì)算各檢測頻度值的檢測數(shù),從而生成縱軸為檢測頻度且橫軸為檢測數(shù)的類似度分布。根據(jù)類似度分布中的檢測數(shù)的增減來計(jì)算極大值和極小值,使用檢測頻度最近的極小值所具有的檢測數(shù),從各極大值取得差分,從而計(jì)算峰值。同一特征提取部8判定并提取如下的基準(zhǔn)特征量,該基準(zhǔn)特征量具有估計(jì)能夠使用該峰值判定同一物體性的峰值。同一特征提取部8將提取出的基準(zhǔn)特征量作為同一特征輸出到局域模型生成部9。另外,峰值的判定基準(zhǔn)例如使用后述的第2基準(zhǔn)參數(shù)表T110。(9)局域模型生成部9局域模型生成部9使用由同一特征提取部8提取出的同一特征,定義某個(gè)局域AV 數(shù)據(jù)組特有的物體的范疇,對(duì)其模型信息進(jìn)行計(jì)算處理。具體而言,局域模型生成部9使用由同一特征提取部8提取出的同一特征,使用 k-means手法等的類生成手法,從由未分類的多個(gè)AV數(shù)據(jù)中的檢測該同一特征的一個(gè)以上的AV數(shù)據(jù)構(gòu)成的類似數(shù)據(jù)組中,進(jìn)行范疇的定義以及模型的生成。k-means手法等的類生成手法是已知技術(shù),所以,這里省略說明。(10)局域辭典 DB 10局域辭典DB 10根據(jù)要利用的特征量,蓄積由局域模型生成部9計(jì)算出的范疇定義以及對(duì)該范疇進(jìn)行分類所需要的模型信息。蓄積DB例如是HDD或DVD等的大容量介質(zhì)盤或半導(dǎo)體存儲(chǔ)器等的存儲(chǔ)設(shè)備。(11)基準(zhǔn)參數(shù) DB 11基準(zhǔn)參數(shù)DB 11存儲(chǔ)第1基準(zhǔn)參數(shù)表TlOO和第2基準(zhǔn)參數(shù)表Tl 10。第1基準(zhǔn)參數(shù)表TlOO表示同一特征提取部8中的處理開始的基準(zhǔn)。并且,第2基準(zhǔn)參數(shù)表TllO表示用于提取頻度大的基準(zhǔn)特征量和基于峰值的基準(zhǔn)特征量的基準(zhǔn)。(11-1)第1基準(zhǔn)參數(shù)表TlOO如圖5所示,第1基準(zhǔn)參數(shù)表TlOO由包含數(shù)據(jù)種類和分類開始量基準(zhǔn)參數(shù)的一個(gè)以上的組構(gòu)成。數(shù)據(jù)種類表示作為分類對(duì)象的數(shù)據(jù)的類別。具體而言,數(shù)據(jù)種類是靜態(tài)圖像、動(dòng)態(tài)圖像、音頻等。分類開始量基準(zhǔn)參數(shù)進(jìn)一步由基準(zhǔn)1、基準(zhǔn)2、基準(zhǔn)3、…構(gòu)成?;鶞?zhǔn)1、基準(zhǔn) 2、基準(zhǔn)3、…表示作為對(duì)應(yīng)的數(shù)據(jù)種類的分類開始的數(shù)據(jù)的數(shù)量(量)。例如在分類對(duì)象是靜態(tài)圖像的情況下,同一特征提取部8在未分類的靜態(tài)圖像中判斷為滿足基準(zhǔn)1、基準(zhǔn)2、…中的某個(gè)基準(zhǔn)的情況下,開始進(jìn)行分類。(11-2)第2基準(zhǔn)參數(shù)表TllO如圖6所示,第2基準(zhǔn)參數(shù)表TllO由包含數(shù)據(jù)種類和各種基準(zhǔn)參數(shù)的一個(gè)以上的組構(gòu)成。數(shù)據(jù)種類表示作為提取對(duì)象的數(shù)據(jù)的類別。具體而言,數(shù)據(jù)種類是靜態(tài)圖像、動(dòng)態(tài)圖像、音頻等。各種基準(zhǔn)參數(shù)由頻度基準(zhǔn)、峰值基準(zhǔn)1、峰值基準(zhǔn)2、…構(gòu)成。在對(duì)應(yīng)的數(shù)據(jù)種類中提取計(jì)算頻度大的基準(zhǔn)特征量時(shí)使用頻度基準(zhǔn)。在對(duì)應(yīng)的數(shù)據(jù)種類中判定估計(jì)能夠判定同一物體性的基準(zhǔn)特征量時(shí)使用峰值基準(zhǔn)1、峰值基準(zhǔn)2、…。例如,在提取計(jì)算頻度大的基準(zhǔn)特征量的對(duì)象是靜態(tài)圖像的情況下,同一特征提取部8提取頻度基準(zhǔn)(0. 35)以上的一個(gè)以上的基準(zhǔn)特征量。并且,在判定估計(jì)能夠判定同一物體性的基準(zhǔn)特征量的情況下,在滿足峰值基準(zhǔn)1、峰值基準(zhǔn)2、…中的某個(gè)基準(zhǔn)時(shí),同一特征提取部8判定為對(duì)應(yīng)的基準(zhǔn)特征量能夠判定同一物體性。1.2 動(dòng)作
12
這里,詳細(xì)說明生成為了整理用戶保有的AV數(shù)據(jù)而自動(dòng)對(duì)AV數(shù)據(jù)賦予標(biāo)簽時(shí)的局域模型的動(dòng)作。為了生成局域模型,數(shù)據(jù)處理裝置100需要提取能夠檢測在用戶保有的AV數(shù)據(jù)中包含的局域數(shù)據(jù)中頻繁出現(xiàn)的被攝體信息的特征量。圖7是示出數(shù)據(jù)處理裝置100從局域數(shù)據(jù)中提取同一特征時(shí)的同一特征提取處理的流程圖。例如在分類部4進(jìn)行了分類處理的情況下,開始同一特征提取處理。開始分類處理后,同一特征提取部8判定蓄積在未分類特征DB 7中的未分類信息的數(shù)量是否為處理開始所需要的一定數(shù)量以上(步驟Si)。例如,在分類對(duì)象是靜態(tài)圖像的情況下,同一特征提取部8判定是否滿足圖5所示的第1基準(zhǔn)參數(shù)表TlOO中的基準(zhǔn)1、基準(zhǔn) 2、基準(zhǔn)3、…中的某個(gè)基準(zhǔn)。在判斷為不是處理開始所需要的一定數(shù)量以上的情況下(步驟Sl中的“否”),同一特征提取部8結(jié)束同一特征提取處理。在判斷為是處理開始所需要的一定數(shù)量以上的情況下(步驟Sl中的“是”),同一特征提取部8根據(jù)數(shù)式1的F(X)的值,提取從AV數(shù)據(jù)中提取出的全部特征量中的計(jì)算頻度為一定頻度以上的基準(zhǔn)特征量(步驟S2)。同一特征提取部8按照提取出的每個(gè)基準(zhǔn)特征量,計(jì)算代表特征量和在全部AV數(shù)據(jù)中計(jì)算出的基準(zhǔn)特征量的類似度(步驟S3)。具體而言,在基準(zhǔn)特征量是Visual Word的情況下,同一特征提取部8計(jì)算各Visual Word相對(duì)于模型的距離作為類似度(SIFT特征量)。如圖3所示,同一特征提取部8按照每個(gè)基準(zhǔn)特征量,計(jì)算作為SIFT特征量檢測到的數(shù)量,作為檢測頻度。同一特征提取部8分別針對(duì)作為頻度大的基準(zhǔn)特征量提取出的一個(gè)以上的基準(zhǔn)特征量,在未分類的全部AV數(shù)據(jù)各自的該基準(zhǔn)特征量中,根據(jù)檢測頻度生成圖4所示的類似度分布,計(jì)算該分布內(nèi)的峰值(步驟S4)。同一特征提取部8判定并提取如下的基準(zhǔn)特征量,該基準(zhǔn)特征量具有認(rèn)為能夠使用該峰值判定同一物體性的峰值(步驟S5),將其作為同一特征輸出到局域模型生成部9。 另外,如上所述,峰值的判定是指是否滿足峰值基準(zhǔn)1、峰值基準(zhǔn)2、…中的某個(gè)基準(zhǔn)。1.4 總結(jié)如上所述,數(shù)據(jù)處理裝置100使用無法分類的AV數(shù)據(jù)(圖像),根據(jù)這些圖像中包含的特征量,根據(jù)具有認(rèn)為能夠判定同一物體性的峰值的基準(zhǔn)特征量,生成模型數(shù)據(jù)。由此,通過在局域辭典DB中蓄積用戶特定的模型數(shù)據(jù),能夠?qū)υ诨巨o典DB中無法分類的圖像進(jìn)行分類。1.5變形例在上述實(shí)施方式中,從未分類的全部AV數(shù)據(jù)中提取同一特征,但是不限于此。也可以不是從未分類的全部AV數(shù)據(jù)中提取同一特征,而是從一定量或一定時(shí)間區(qū)間的AV數(shù)據(jù)中提取同一特征。使用圖8所示的流程圖說明該情況下的同一特征提取處理的順序。另外,為了便于說明,對(duì)本變形例的同一特征提取部標(biāo)注標(biāo)號(hào)“8a”進(jìn)行說明。與上述第1實(shí)施方式同樣,雖然沒有圖示,但是,開始分類處理后,同一特征提取部8a判定蓄積在未分類特征DB 7中的未分類信息的數(shù)量是否為處理開始所需要的一定數(shù)量以上。在判斷為不是處理開始所需要的一定數(shù)量以上的情況下,同一特征提取部8a結(jié)束同一特征提取處理。在判斷為是處理開始所需要的一定數(shù)量以上的情況下,同一特征提取部8a從未分類特征DB輸入按照一定時(shí)間段檢測的特征量(步驟Sll)。同一特征提取部8a以一定時(shí)間段的輸入單位計(jì)算局部特征量即BoF (步驟S12)。 接著,同一特征提取部8a使用在步驟S12中計(jì)算出的局部特征量,計(jì)算Visual Word的檢測頻度(步驟S13)。同一特征提取部8a使用計(jì)算出的檢測頻度,按照?qǐng)D3所示的Visual Word,生成檢測數(shù)的直方圖(步驟S14)。同一特征提取部8a判定在各Visual Word中的檢測數(shù)的直方圖中是否存在峰值, 判定具有峰值基準(zhǔn)以上的峰值的基準(zhǔn)特征量,作為該一定時(shí)間區(qū)間中的同一特征進(jìn)行提取 (步驟S15)。同一特征提取部8a判定是否關(guān)于全部時(shí)間段的數(shù)據(jù)完成處理(步驟S16)。在判斷為完成的情況下(步驟S16中的“是”),同一特征提取部8a結(jié)束處理。并且,在判斷為未完成的情況下(步驟S16中的“否”),同一特征提取部8a返回步驟S11,反復(fù)進(jìn)行處理直到全部時(shí)間段的處理完成為止。另外,在上述流程圖中,設(shè)提取對(duì)象為以一定時(shí)間段分割的圖像組,但是不限于此。如一定張數(shù)、一定區(qū)域、一定事件等那樣,只要是能夠分割圖像的單位即可,與其類別無關(guān)。由此,例如,該變形例的數(shù)據(jù)處理裝置如圖9所示,能夠在僅基于同一特征的限定特征量空間中創(chuàng)建在全部特征量空間中難以建模的例如某個(gè)家族飼養(yǎng)的寵物狗或特殊所有物的模型,并進(jìn)行提取。這樣生成的局域模型是在局域AV數(shù)據(jù)中特定的模型,所以,能夠高精度地對(duì)該模型進(jìn)行分類。如上所述,不是通過使用全部特征量的距離空間來生成局域模型,而是構(gòu)成為在將要利用的特征量僅限定為同一被攝體性高的特征量后、在該限定空間內(nèi)生成局域模型, 由此,不是一般的模型,而是局域識(shí)別性高的模型,所以,能夠定義某個(gè)局域AV數(shù)據(jù)組特有的物體的范疇,并高精度地提取其模型信息。另外,作為使用蓄積在未分類特征DB中的未分類信息的單位,考慮如第1實(shí)施方式那樣使用全部未分類信息計(jì)算同一特征,也考慮如上述變形例那樣按照規(guī)定的圖像數(shù)進(jìn)行計(jì)算,或者以某個(gè)事件單位、時(shí)間單位、場所單位對(duì)未分類信息進(jìn)行分割并計(jì)算。并且,作為圖像中的同一特征量的提取方法,可以使用通過特征點(diǎn)中的對(duì)應(yīng)點(diǎn)匹配來判定是否包含同一物體并加以利用的手法、或者利用顏色直方圖或邊緣量的分布的全體類似性的方法,只要是使用能夠提取在數(shù)據(jù)庫內(nèi)存在的同一物體的特征量的方法即可, 與其類別無關(guān)。2.第2實(shí)施方式下面,參照
本發(fā)明的第2實(shí)施方式。第2實(shí)施方式涉及如下的方法不僅考慮信息量的多少和類似度,在局域模型生成時(shí)還考慮時(shí)間連續(xù)性作為局域AV數(shù)據(jù)所具有的特有信息,由此,不是在全部數(shù)據(jù)中生成最佳的模型,而是以時(shí)間序列生成最佳的模型。另外,在本實(shí)施方式中,對(duì)具有與第1實(shí)施方式相同的功能的結(jié)構(gòu)標(biāo)注相同標(biāo)號(hào),并省略其說明。并且,除了特別記載的情況以外,包含數(shù)據(jù)處理裝置的原理結(jié)構(gòu)在內(nèi),與第1實(shí)施方式的情況相同。在本實(shí)施方式中,作為生成更加適于用戶獨(dú)自的局域DB的局域模型的方法,不采用統(tǒng)一處理全部AV數(shù)據(jù)來生成局域DB特有的模型的方法,而采用考慮蓄積的AV數(shù)據(jù)的時(shí)間序列的遷移來生成局域DB特有的模型的方法。作為在本實(shí)施方式中利用的數(shù)據(jù),主要假設(shè)了圖像,具體說明根據(jù)圖像信息的解析結(jié)果生成局域模型的方法。2. 1 結(jié)構(gòu)這里,關(guān)于第2實(shí)施方式的數(shù)據(jù)處理裝置的結(jié)構(gòu),以與第1實(shí)施方式不同的方面為中心進(jìn)行說明。局域模型生成部的功能結(jié)構(gòu)與第1實(shí)施方式不同。其他結(jié)構(gòu)要素與第1實(shí)施方式相同,所以,這里說明局域模型生成部。(1)局域模型生成部20下面,參照?qǐng)D10說明本實(shí)施方式的局域模型生成部20的功能結(jié)構(gòu)的一例。圖10 是局域模型生成部20的功能框圖。局域模型生成部20由區(qū)間信息提取部21、區(qū)間模型生成部22、模型連續(xù)性判定部23構(gòu)成。(1-1)區(qū)間信息提取部21區(qū)間信息提取部21提取一定的數(shù)據(jù)單位、時(shí)間單位、場所單位、事件單位的區(qū)間信息,作為局域AV數(shù)據(jù)的集中信息。例如,作為圖像信息,使用EXIF (Exchangeable Image File i^ormat)信息中包含的攝影時(shí)間或GPS(Global Positioning System)信息,能夠自動(dòng)計(jì)算一定的連續(xù)攝影區(qū)間信息。并且,考慮以用戶生成的文件夾單位信息等分割數(shù)據(jù)并提取其區(qū)間信息等。這里,區(qū)間信息提取部21根據(jù)EXIF信息中包含的攝影時(shí)間計(jì)算一定的連續(xù)攝影區(qū)間信息。具體而言,區(qū)間信息提取部21根據(jù)存儲(chǔ)在未分類特征DB 7中的未分類信息的內(nèi)容,從EXIF信息中提取存儲(chǔ)在局域DB 1中的作為處理對(duì)象的全部圖像的時(shí)間信息。接著, 區(qū)間信息提取部21根據(jù)所得到的時(shí)間信息,以最初進(jìn)行拍攝的日期時(shí)間為基準(zhǔn),例如針對(duì)每個(gè)小時(shí)的區(qū)間計(jì)算所拍攝的圖像的張數(shù)。然后,區(qū)間信息提取部21根據(jù)按照每個(gè)小時(shí)計(jì)算出的圖像張數(shù),對(duì)處理中的開始一小時(shí)的圖像張數(shù)進(jìn)行相加,計(jì)算累計(jì)圖像張數(shù)。在累計(jì)圖像張數(shù)為500張以上且要相加的圖像張數(shù)為0的區(qū)間連續(xù)3小時(shí)以上的情況下,區(qū)間信息提取部21提取該區(qū)間,使累計(jì)圖像張數(shù)為0。區(qū)間信息提取部21針對(duì)處理對(duì)象的全部圖像進(jìn)行上述動(dòng)作。(1-2)區(qū)間模型生成部22區(qū)間模型生成部22按照由區(qū)間信息提取部21提取出的每個(gè)區(qū)間,使用由同一特征提取部8計(jì)算出的特征量組,生成局域模型。關(guān)于具體的模型生成方法,可以通過與第1 實(shí)施方式相同的方法生成。另外,在類似性的計(jì)算中,與第1實(shí)施方式相同,考慮根據(jù)多變量特征量計(jì)算模型間距離等。(1- 模型連續(xù)性判定部23模型連續(xù)性判定部23計(jì)算以多長的區(qū)間連續(xù)生成按照每個(gè)區(qū)間生成的局域模型,判定局域DB 1內(nèi)是否具有時(shí)間連續(xù)性。模型連續(xù)性判定部23從時(shí)間連續(xù)性高的局域模型、即出現(xiàn)頻度高的局域模型起,依次賦予標(biāo)簽。并且,作為長期變化性,模型連續(xù)性判定部23計(jì)算是否存在特征量內(nèi)的部分變化,判定是否具有一定的變化傾向性。針對(duì)具有一定的變化傾向性的多個(gè)局域模型,模型連續(xù)性判定部23進(jìn)行具有同一特征的意思的關(guān)聯(lián)(賦予同一標(biāo)簽)。2. 2 動(dòng)作下面,詳細(xì)說明AV數(shù)據(jù)是圖像時(shí)的具體的局域模型的生成手法。圖11是示出在圖像中按照每個(gè)區(qū)間存在的圖像組的一例的圖。另外,這里,設(shè)在局域DB 1中存在橫軸為時(shí)間軸、縱軸為每小時(shí)的圖像量的圖11所示的特定用戶以時(shí)間序列拍攝的圖像組。使用圖12所示的流程圖說明該情況下的區(qū)間信息提取部21的動(dòng)作。首先,區(qū)間信息提取部21根據(jù)存儲(chǔ)在未分類特征DB 7中的未分類信息的內(nèi)容,從 EXIF信息中提取存儲(chǔ)在局域DB 1中的作為處理對(duì)象的全部圖像的時(shí)間信息(步驟S21)。區(qū)間信息提取部21根據(jù)所得到的時(shí)間信息,以最初進(jìn)行拍攝的日期時(shí)間為基準(zhǔn), 例如針對(duì)每個(gè)小時(shí)的區(qū)間計(jì)算所拍攝的圖像的張數(shù)(步驟S22)。區(qū)間信息提取部21根據(jù)按照每個(gè)小時(shí)計(jì)算出的圖像張數(shù),對(duì)處理中的開始一小時(shí)的圖像張數(shù)進(jìn)行相加,計(jì)算累計(jì)圖像張數(shù)(步驟S23)。在累計(jì)圖像張數(shù)為500張以上且要相加的圖像張數(shù)為0的區(qū)間連續(xù)3小時(shí)以上的情況下,區(qū)間信息提取部21提取該區(qū)間,使累計(jì)圖像張數(shù)為0(步驟S24)。區(qū)間信息提取部21判定是否針對(duì)處理對(duì)象的全部圖像完成處理(步驟S2Q。在判斷為完成的情況下(步驟S25中的“是”),區(qū)間信息提取部21完成區(qū)間信息提取處理。 在判斷為未完成的情況下(步驟S25中的“否”),區(qū)間信息提取部21返回步驟S23,反復(fù)進(jìn)行處理直到針對(duì)全部圖像的處理完成為止。2. 3具體例通過進(jìn)行上述動(dòng)作,區(qū)間信息提取部21例如能夠提取圖11所示的區(qū)間1 6。然后,區(qū)間模型生成部22針對(duì)由區(qū)間信息提取部21提取出的全部區(qū)間(區(qū)間1 6),生成局域模型。在圖11所示的例子中,提取出區(qū)間1 區(qū)間6這6個(gè)區(qū)間,所以,例如如圖13所示,生成在6個(gè)區(qū)間中存在的全部局域模型A、B、C、D、E、F、G。模型連續(xù)性判定部23判定所生成的局域模型是否具有時(shí)間連續(xù)性、周期性、長期變化性。在圖13的例子中,計(jì)算每個(gè)區(qū)間的局域模型的全體類似性,對(duì)具有一定以上的類似性的局域模型賦予相同標(biāo)記。其結(jié)果,作為時(shí)間連續(xù)性高、即出現(xiàn)頻度高的模型,能夠提取局域模型C。因此,作為與短期存在的局域模型(例如局域模型B、G)相比局域?qū)傩愿叩哪P?,模型連續(xù)性判定部23能夠優(yōu)先賦予標(biāo)簽。并且,模型連續(xù)性判定部23檢測長期變化性并進(jìn)行建模。例如如圖14所示,在局部類似性的變化度存在比例關(guān)系的情況下,模型連續(xù)性判定部23提取局域模型A、E、D,作為具有一定的長期變化性的局域模型,作為局域?qū)傩愿叩哪P停瑑?yōu)先賦予標(biāo)簽,作為同一物體進(jìn)行關(guān)聯(lián)。具體而言,提取作為孩子成長時(shí)的面部或身體的變化程度的長期變化性、物體中的基于劣化或破損的變化性、基于流行的車輛等物體的形狀變化性等。由此,模型連續(xù)性判定部23計(jì)算考慮全體特征時(shí)為不同的模型、但作為類似性高的模型提取出的局域模型之間的局部特征量的類似性的變化度,對(duì)該變化度進(jìn)行例如主成分分析等的統(tǒng)計(jì)處理,在得到相關(guān)關(guān)系時(shí),這些模型能夠作為具有長期變化性的一個(gè)模型來提取。即,在模型之間的某個(gè)特征量組具有一定基準(zhǔn)以上的類似性、在其他特征量組中類似性低、但其變化程度存在一定傾向的情況下,能夠作為具有長期變化性的模型來提取。2. 4 總結(jié)如上所述,根據(jù)本實(shí)施方式,數(shù)據(jù)處理裝置判定各種生成的局域模型在局域DB 1 內(nèi)的連續(xù)性,由此,能夠短期或單次地生成有效的局域模型,或者長期或周期地生成有效的模型,或者生成根據(jù)長期變化而自適應(yīng)地變化的局域模型。并且,不是使用全部AV數(shù)據(jù)針對(duì)全部特征量生成最佳的局域模型,而是構(gòu)成為, 例如提取時(shí)間塊作為AV數(shù)據(jù)之間的聯(lián)系,限定為每個(gè)區(qū)間的AV數(shù)據(jù)后生成局域模型,判定每個(gè)區(qū)間的模型間連續(xù)性,生成局域?qū)傩愿叩木钟蚰P?,由此,能夠成為考慮了用戶取得的AV數(shù)據(jù)的傾向性的局域識(shí)別性高的模型,所以,能夠高精度地定義局域AV數(shù)據(jù)組特有的物體的范疇,并提取其模型信息。2. 5變形例在本實(shí)施方式中,區(qū)間信息提取部21從EXIF信息中提取作為處理對(duì)象的全部圖像的時(shí)間信息,但是,也可以從數(shù)據(jù)生成時(shí)間信息中提取。另外,在本實(shí)施例的結(jié)構(gòu)中,設(shè)置同一特征提取部8,但是,也可以采用利用由特征量提取部3計(jì)算出的一般特征量的結(jié)構(gòu)、或者針對(duì)全部AV數(shù)據(jù)提取特征量并加以利用的結(jié)構(gòu)。并且,在具體說明中僅說明了圖像的時(shí)間連續(xù)性,但是,還考慮使用音頻或影像數(shù)據(jù)的情況,作為連續(xù)性,也可以利用場所的連續(xù)或者根據(jù)時(shí)間和場所等的融合信息而得到的事件性的聯(lián)系。3.第3實(shí)施方式下面,參照
本發(fā)明的第3實(shí)施方式。本實(shí)施方式涉及如下的方法在提取同一特征時(shí)、生成局域模型時(shí)、或者顯示通過所生成的局域模型進(jìn)行分類后的結(jié)果時(shí),考慮來自用戶的反饋(以后為用戶交互),修正自動(dòng)生成的同一特征和局域模型中存在的差異,生成無法自動(dòng)生成的同一特征或局域模型。另外,在本實(shí)施方式中,對(duì)具有與第1實(shí)施方式相同的功能的結(jié)構(gòu)標(biāo)注相同標(biāo)號(hào)并應(yīng)用其說明,所以,省略說明。并且,除了特別記載的情況以外,包含數(shù)據(jù)處理裝置的原理結(jié)構(gòu)在內(nèi),與第1實(shí)施方式的情況相同。在本實(shí)施方式中,作為高精度地進(jìn)行適于用戶的局域DB 1的同一特征的提取以及局域模型的生成的方法,不采用通過預(yù)先確定的程序自動(dòng)進(jìn)行全部處理的方法,而采用如下方法在各種處理的輸入輸出中考慮基于用戶交互的用戶的輸入信息,高精度地生成局域DB 1特有的特征和模型。作為在本發(fā)明的實(shí)施方式中利用的數(shù)據(jù),主要假設(shè)了圖像,具體說明在圖像解析的輸入輸出時(shí)根據(jù)用戶交互生成同一特征和局域模型的方法。3. 1 結(jié)構(gòu)這里,關(guān)于第3實(shí)施方式的數(shù)據(jù)處理裝置的結(jié)構(gòu),以與第1實(shí)施方式不同的方面為中心進(jìn)行說明。
圖15是示出在本實(shí)施方式中在圖1的結(jié)構(gòu)中追加了具有用戶交互輸入功能的用戶交互輸入部30時(shí)的結(jié)構(gòu)的框圖。下面,說明用戶交互輸入部30的功能以及同一特征提取部8和局域模型生成部9 中的更多功能。(1)用戶交互輸入部30用戶交互輸入部30具有如下功能為了改善在同一特征提取部8和局域模型生成部9中處理的內(nèi)容的精度,針對(duì)用戶具有的AV數(shù)據(jù)或由數(shù)據(jù)處理裝置計(jì)算出的輸出結(jié)果輸入附加信息。具體而言,用戶交互輸入部30顯示圖16所示的圖像G100、圖17所示的圖像G200 以及圖18所示的圖像G300,受理來自用戶的指示。另外,在本實(shí)施方式中,設(shè)顯示圖像的畫面具有觸摸面板功能。(圖像 G100)圖16所示的圖像GlOO示出同一物體且對(duì)圖像輸入標(biāo)簽信息時(shí)的一例。在圖16所示的圖像GlOO中包含表示顯示中的圖像的存儲(chǔ)場所的庫G101、未分類的圖像 1100、1101、1102、1103、…、按鈕 B100、ΒΙΟΙ、B102、B103、滾動(dòng)條 SBlOOo在庫GlOl中,利用粗框包圍顯示對(duì)象的庫,以使用戶得知顯示中的各圖像的存儲(chǔ)目的地。這里,利用粗框包圍相冊(cè)1下屬的AOl庫,所以,用戶一眼便知顯示中的各圖像的存儲(chǔ)目的地為AO1。并且,所顯示的圖像1100、1101、1102、1103、…分別是包含在顯示對(duì)象的庫中且未分類的圖像,在所顯示的各圖像的下方顯示復(fù)選框C100、C101、C102、C103、…。用戶針對(duì)顯示中的圖像中的一個(gè)以上的圖像,在復(fù)選框中進(jìn)行勾選,由此,能夠指定處理對(duì)象的圖像。例如,在圖16中,除了圖像1102、1103以外還指定3個(gè)圖像(合計(jì)5個(gè)圖像)。按鈕BlOO用于指示在處理指定的多個(gè)圖像中包含同一物體。按下該按鈕BlOO時(shí), 同一特征提取部8從所指定的多個(gè)圖像中提取同一物體涉及的特征量。另外,以后的同一特征提取部8和局域模型生成部9的動(dòng)作與第1實(shí)施方式相同,所以,這里省略說明。按鈕BlOl用于指示針對(duì)處理指定的一個(gè)以上的圖像關(guān)聯(lián)標(biāo)簽信息。通過用戶操作而按下該按鈕BlOl時(shí),顯示畫面從圖像GlOO遷移到圖像G200。按鈕B102用于針對(duì)處理指定的一個(gè)以上的圖像指定要提取特征量的區(qū)域。按下該按鈕B102后,用戶通過鼠標(biāo)操作指定要提取的區(qū)域。按鈕B103用于指示基于用戶交互的處理的結(jié)束。滾動(dòng)條SB100用于使所顯示的圖像滾動(dòng)。用戶使用鼠標(biāo)操作該顯示的滾動(dòng)條 SB100,從而使圖像滾動(dòng)。(圖像 G200)當(dāng)在圖像GlOO中按下按鈕BlOl的情況下,顯示圖17所示的圖像G200。這里,示出指定圖16的圖像1103并按下按鈕BlOl時(shí)的顯示形式。用戶交互輸入部30顯示所指定的圖像,然后,從用戶受理關(guān)聯(lián)標(biāo)簽信息的物體的指定。具體而言,在觸摸面板上,以包圍關(guān)聯(lián)標(biāo)簽信息的物體的方式,用戶用手指指定區(qū)域。例如,在希望針對(duì)物體0200關(guān)聯(lián)標(biāo)簽信息的情況下,以包圍物體0200的方式指定區(qū)域
180201。用戶交互輸入部30受理區(qū)域0201的指定后,顯示用于輸入標(biāo)簽名的框T200。用戶在框T200中輸入標(biāo)簽信息(這里,標(biāo)簽名為“椅子”)。用戶交互輸入部30取得關(guān)聯(lián)有標(biāo)簽信息的圖像的未分類信息,與標(biāo)簽信息一起通知給局域模型生成部9。然后,局域模型生成部9在針對(duì)所指定的物體0200生成的局域模型中關(guān)聯(lián)所輸入的標(biāo)簽信息(“椅子”)。(圖像 G300)圖18所示的圖像G300示出輸入基于通過數(shù)據(jù)處理裝置分類后的結(jié)果的指示時(shí)的一例。在圖18所示的圖像G300中包含庫G301、圖像1300、1301、1302、1303、…、按鈕 B300、B301、B302、B303、滾動(dòng)條 SB300。在庫G301中,顯示由同一特征提取部8和局域模型生成部9檢測到的每個(gè)物體的庫名。這里,利用粗框包圍顯示對(duì)象的庫名,以使用戶得知顯示中的文件夾。這里,利用粗框包圍庫名“XOOl ”。并且,所顯示的圖像1100、1101、1102、1103、…分別是包含在顯示對(duì)象的庫 “X001”中的圖像,在所顯示的各圖像的下方顯示復(fù)選框C100、C101、C102、C103、…。用戶針對(duì)顯示中的圖像中的一個(gè)以上的圖像,在復(fù)選框中進(jìn)行勾選,由此,能夠指定處理對(duì)象的圖像。例如,在圖18中,除了圖像1302以外還指定3個(gè)圖像(合計(jì)4個(gè)圖像)。按鈕B300用于指示使用處理指定的多個(gè)圖像再次生成局域模型。按下該按鈕 B300時(shí),同一特征提取部8從所指定的多個(gè)圖像中提取同一物體涉及的特征量。另外,以后的同一特征提取部8和局域模型生成部9的動(dòng)作與第1實(shí)施方式相同,所以,這里省略說明。按鈕B301用于指示使用除了處理指定的一個(gè)以上的圖像以外的其余圖像再次生成局域模型。按下該按鈕B301時(shí),同一特征提取部8從所指定的多個(gè)圖像中提取同一物體涉及的特征量。另外,以后的同一特征提取部8和局域模型生成部9的動(dòng)作與第1實(shí)施方式相同,所以,這里省略說明。例如,在圖18中主要匯集了拍攝狗的圖像,但是,其中也有貓或風(fēng)景的圖像,所以,在復(fù)選框中指定這些圖像,按下按鈕B301,由此,能夠僅根據(jù)拍攝狗的圖像再次生成局域模型。按鈕B302用于指示分割為處理指定的多個(gè)圖像和其余圖像并針對(duì)分割后的各個(gè)圖像組生成局域模型。按下該按鈕B302時(shí),通過同一特征提取部8和局域模型生成部9,針對(duì)分割后的圖像組分別生成局域模型。按鈕B303用于指示對(duì)2個(gè)以上的庫進(jìn)行合并。按下該按鈕B303時(shí),通過同一特征提取部8和局域模型生成部9,使用2個(gè)以上的庫生成局域模型。滾動(dòng)條SB300具有與滾動(dòng)條SB100相同的功能,所以,這里省略說明。在按下按鈕B300和按鈕B301進(jìn)行再次分類時(shí),用戶交互輸入部30顯示其結(jié)果。并且,在按下按鈕B302進(jìn)行顯示中的圖像組的分割時(shí),用戶交互輸入部30顯示其結(jié)果。并且,在按下按鈕B303進(jìn)行所指定的2個(gè)圖像組的合并時(shí),用戶交互輸入部30顯示其結(jié)果。通過該用戶交互輸入部30,例如如圖18所示,關(guān)于用戶通過數(shù)據(jù)處理裝置進(jìn)行分類后的結(jié)果,在各種物體混合存在時(shí),指定主要的分類內(nèi)容以外的內(nèi)容,按下按鈕B301,從而修正該內(nèi)容。具體而言,在圖18內(nèi)的庫“X001”中主要存儲(chǔ)拍攝狗的圖像,但是,其中也有貓或場景的圖像,所以,在復(fù)選框中指定這些圖像,向數(shù)據(jù)處理裝置反饋錯(cuò)誤,從而修正該內(nèi)容,能夠成為僅檢測到狗的圖像組。除此之外,可以采用如下的修正方法僅指定正確的內(nèi)容,以及在狗中希望進(jìn)一步通過種類進(jìn)行區(qū)分時(shí)進(jìn)行再次分割,在過度分割的情況下進(jìn)行合并等。3. 2 動(dòng)作具體說明通過基于用戶交互的指示的受理對(duì)同一特征提取處理和局域模型生成處理進(jìn)行改善的改善方法。圖19是示出該具體的反饋處理的順序的流程圖。開始用戶輸入后,開始反饋處理。首先,在用戶輸入了與AV數(shù)據(jù)關(guān)聯(lián)的信息的情況下,用戶交互輸入部30取得該信息(步驟S31)。具體而言,在圖16所示的圖像GlOO和圖18所示的圖像G300中,指定處理對(duì)象的圖像,取得在按下某個(gè)按鈕時(shí)指定的圖像的張數(shù)和與被按下的按鈕對(duì)應(yīng)的處理內(nèi)容,作為輸入信息。判定該輸入信息是否是能夠改善圖像處理內(nèi)容的信息(步驟S32)。另外,作為這里的能夠改善的信息,在AV數(shù)據(jù)是圖像的情況下,是圖像中包含的被攝體的區(qū)域關(guān)聯(lián)信息、標(biāo)簽關(guān)聯(lián)信息、與圖像組有關(guān)的事件關(guān)聯(lián)信息、被指定的圖像的張數(shù)。具體而言,用戶交互輸入部30在按下了按鈕BlOO和按鈕B300的情況下,判斷被指定的圖像是否為2個(gè)以上, 在按下了按鈕BlOl的情況下,判斷被指定的圖像是否為一個(gè)以上,在按下了按鈕B301的情況下,判斷除了被指定的圖像以外的其余圖像是否存在2個(gè)以上。并且,在按下了按鈕B302 的情況下,判斷是否在分割后的2個(gè)圖像組中分別包含2個(gè)以上的圖像,在按下了按鈕B303 的情況下,判斷是否指定了 2個(gè)以上的庫。在判斷為能夠改善的情況下(步驟S32中的“是”),用戶交互輸入部30將取得的輸入信息轉(zhuǎn)換為能夠由同一特征提取部8和局域模型生成部9處理的信息(步驟S3; )。具體而言,用戶交互輸入部30針對(duì)被指定的一個(gè)以上的圖像分別取得未分類信息(識(shí)別AV 數(shù)據(jù)的識(shí)別符)。并且,例如在對(duì)家中飼養(yǎng)的寵物賦予姓名標(biāo)簽的情況下,將賦予了該姓名的圖像和區(qū)域轉(zhuǎn)換為存在同一物體的圖像信息(未分類信息)。在同一特征提取部8和局域模型生成部9中,根據(jù)轉(zhuǎn)換后的信息進(jìn)行各種能夠改善的處理,更新結(jié)果內(nèi)容(步驟S34)。進(jìn)行更新后,用戶交互輸入部30判定用戶輸入是否完成(步驟S35)。在判斷為完成的情況下(步驟S34中的“是”),完成反饋處理。在判斷為未完成的情況下(步驟S34中的“否”),處理返回步驟S31,反復(fù)進(jìn)行處理直到用戶輸入完成為止。在判斷為無法改善的情況下(步驟S32中的“否”),處理轉(zhuǎn)移到步驟S35。3. 3 總結(jié)在第1實(shí)施方式中,在同一特征提取部8中,在自動(dòng)提取同一特征時(shí),與是否是同一物體無關(guān),僅將特征的類似性作為判斷依據(jù),使用基于類似性的聚類(clustering)手法提取同一特征。因此,混合存在有不必要的特征量,同一特征的提取精度不太高。但是,在本實(shí)施方式中,用戶預(yù)先指定同一物體,所以,數(shù)據(jù)處理裝置在預(yù)先得知是同一物體并得知信息的情況下,能夠僅根據(jù)被限定的同一物體的圖像信息計(jì)算類似性并提取同一特征,所以, 能夠進(jìn)行高精度的提取。并且,在局域模型生成部9中,在直接輸入同一物體信息的情況下,能夠直接根據(jù)圖像學(xué)習(xí)并生成必要的局域模型,所以,能夠生成高精度的分類模型。作為間接信息,即使僅是是否包含同一物體的信息,也能夠?qū)﹀e(cuò)誤地生成的分類模型進(jìn)行修正。另外,用戶交互可以是一個(gè)一個(gè)的用戶輸入單位,也可以是與一定功能有關(guān)而集中的輸入單位等。如上所述,不是通過數(shù)據(jù)處理裝置全部自動(dòng)進(jìn)行處理來生成同一特征或局域模型,而是采用如下結(jié)構(gòu)作為用戶交互,考慮基于用戶輸入的反饋處理進(jìn)行修正,同時(shí)生成同一特征或局域模型,由此,能夠成為階段地改善了分類精度的局域模型,所以,能夠階段地修正定義某個(gè)局域AV數(shù)據(jù)組特有的物體的范疇,可靠地提取其模型信息。4.第4實(shí)施方式下面,參照
本發(fā)明的第4實(shí)施方式。本實(shí)施方式涉及如下的方法在基本辭典DB 5中沒有預(yù)先定義用于在分類部4中進(jìn)行分類的范疇的情況下,通過考慮用于對(duì)AV數(shù)據(jù)中包含的一般范疇進(jìn)行分類的類似特征、以及用于對(duì)局域特有的物體進(jìn)行分類的同一特征這雙方,自動(dòng)生成基本辭典DB和局域辭典DB這雙方。另外,在本實(shí)施方式中,對(duì)具有與第1實(shí)施方式相同的功能的結(jié)構(gòu)標(biāo)注相同標(biāo)號(hào)并應(yīng)用其說明,所以,省略說明。在本實(shí)施方式中,作為全部自動(dòng)生成適于局域DB的一般模型和局域模型的方法, 不采用蓄積預(yù)先定義的范疇的模型信息進(jìn)行生成的方法,而采用如下方法考慮分別計(jì)算用于生成各模型的特征并加以利用,除了同一特征以外,還生成用于對(duì)一般模型進(jìn)行分類的類似特征,自動(dòng)生成一般模型。作為在本發(fā)明的實(shí)施方式中利用的數(shù)據(jù),主要假設(shè)了圖像,具體說明在圖像解析中根據(jù)上述2種特征(同一特征和類似特征)生成一般模型和局域模型的方法。4. 1 結(jié)構(gòu)圖20是示出本發(fā)明的數(shù)據(jù)處理裝置IOOa的原理結(jié)構(gòu)的框圖。在圖20中,數(shù)據(jù)處理裝置IOOa由局域DB 1、預(yù)處理部2、特征量提取部3、分類部40、基本辭典DB 5、檢索索引 DB 6、同一特征提取部8、局域模型生成部9、局域辭典DB 10、基準(zhǔn)參數(shù)DB 11、全部圖像特征DB(數(shù)據(jù)庫)41、類似特征提取部42、全域模型生成部43構(gòu)成。局域DB 1、預(yù)處理部2、 特征量提取部3、基本辭典DB 5、檢索索引DB 6、同一特征提取部8、局域模型生成部9、局域辭典DB 10、基準(zhǔn)參數(shù)DB 11與第1實(shí)施方式所記載的內(nèi)容相同,所以,這里省略說明。(1)全部圖像特征DB 41全部圖像特征DB 41蓄積由特征量提取部3計(jì)算出的全部未分類信息。(2)類似特征提取部42類似特征提取部42不是根據(jù)全部圖像的特征量對(duì)特定的模型(例如狗)進(jìn)行分類,而是提取各個(gè)種類的模型(例如狗)共通的特征量。類似特征提取部42與同一特征提取部8同樣,使用基準(zhǔn)參數(shù)DBll中包含的第1 基準(zhǔn)參數(shù)表T100,判定蓄積在全部圖像特征DB 41中的未分類信息的數(shù)量是否為開始類似特征提取處理所需要的一定數(shù)量以上。在判定為肯定的情況下,類似特征提取部42進(jìn)行類似特征提取處理。在判定為否定的情況下,類似特征提取部42不進(jìn)行類似特征提取處理。這里,作為類似特征的提取方法,考慮與提取同一特征時(shí)相比降低用于判定特征量的類似性的基準(zhǔn),或融合同一特征和以一定水平以上的程度類似的特征,或利用同一特征以外的特征量,或預(yù)先定義利用特征量。(3)全域模型生成部43全域模型生成部43使用由類似特征提取部42提取出的類似特征,定義某個(gè)局域 AV數(shù)據(jù)組中的一般物體的范疇,對(duì)其模型信息進(jìn)行計(jì)算處理。由此,數(shù)據(jù)處理裝置IOOa還根據(jù)局域AV數(shù)據(jù)組的信息生成一般的分類模型,所以,無法分類的信息減少,能夠增加可分類的信息。(4)分類部 40分類部40與第1實(shí)施方式同樣,使用從AV數(shù)據(jù)中提取出的特征量,與現(xiàn)有的模型數(shù)據(jù)進(jìn)行匹配處理,進(jìn)行輸入數(shù)據(jù)適合哪個(gè)模型的判定處理。但是,在基本辭典DB 5和局域辭典DB 10中不存在預(yù)先定義的模型的情況下,分類部40不進(jìn)行處理,而在全部圖像特征DB 41中蓄積在特征量提取部3中作為特征量的計(jì)算對(duì)象的AV數(shù)據(jù)的未分類信息。然后,當(dāng)在局域模型生成部9中生成局域模型、在全域模型生成部43中生成全域模型后,分類部4進(jìn)行判定處理,針對(duì)AV數(shù)據(jù)賦予標(biāo)簽信息等的元數(shù)據(jù)。4. 2 總結(jié)如上所述,不是預(yù)先定義并保持分類模型,而是通過從局域AV數(shù)據(jù)得到的特征量,不僅提取同一被攝體性高的特征量,還提取類似被攝體性高的特征量,數(shù)據(jù)處理裝置 IOOa自動(dòng)生成全部分類模型。由此,數(shù)據(jù)處理裝置IOOa不僅能夠?qū)ν槐粩z體性高的局域模型進(jìn)行分類,還能夠?qū)︻愃票粩z體性高的全域模型進(jìn)行分類,所以,能夠全部自動(dòng)定義某個(gè)局域AV數(shù)據(jù)組中包含的物體的范疇,并提取其模型信息。5.第5實(shí)施方式下面,參照
本發(fā)明的第5實(shí)施方式。本實(shí)施方式涉及如下的方法在提取同一特征時(shí)或生成局域模型時(shí),從用戶受理多個(gè)圖像的指定,根據(jù)所受理的多個(gè)圖像生成同一特征或局部模型。另外,在本實(shí)施方式中,對(duì)具有與第1實(shí)施方式或第3實(shí)施方式相同的功能的結(jié)構(gòu)標(biāo)注相同標(biāo)號(hào)并應(yīng)用其說明,所以,省略說明。并且,除了特別記載的情況以外,包含數(shù)據(jù)處理裝置的原理結(jié)構(gòu)在內(nèi),與第1實(shí)施方式或第3實(shí)施方式的情況相同。在本實(shí)施方式中,與第3實(shí)施方式同樣,采用如下方法在各種處理的輸入輸出中考慮基于用戶交互的用戶的輸入信息,高精度地生成局域DB 1特有的特征和模型。作為在本發(fā)明的實(shí)施方式中利用的數(shù)據(jù),主要假設(shè)了圖像,具體說明在圖像解析的輸入輸出時(shí)根據(jù)用戶交互生成同一特征和局域模型的方法。5. 1 結(jié)構(gòu)這里,關(guān)于第5實(shí)施方式的數(shù)據(jù)處理裝置IOOb的結(jié)構(gòu),以與第1實(shí)施方式和第3實(shí)施方式不同的方面為中心進(jìn)行說明。如圖21所示,數(shù)據(jù)處理裝置IOOb由局域DB 1、預(yù)處理部2、特征量提取部3、分類部4、基本辭典DB 5、檢索索引DB 6、未分類特征DB 7、同一特征提取部58、局域模型生成部 59、局域辭典DB 10、基準(zhǔn)參數(shù)DB 11以及登記部51構(gòu)成。下面,說明與第1實(shí)施方式不同的登記部51的功能以及同一特征提取部58和局域模型生成部59中的更多功能。(1)登記部 51登記部51具有如下功能為了提高在同一特征提取部58和局域模型生成部59中處理的內(nèi)容的精度,受理用于選擇由用戶希望分類的多個(gè)圖像構(gòu)成的圖像組并生成局域模型的指示。具體而言,登記部51例如顯示與圖16所示的圖像G100、圖17所示的圖像G200以及圖18所示的圖像G300相同的圖像,受理來自用戶的指示。另外,在本實(shí)施方式中,與第 3實(shí)施方式同樣,具有觸摸面板功能。并且,在以后的說明中,使用圖16、17、18所示的圖像6100、6200和6300進(jìn)行說明。在本實(shí)施方式中顯示的圖像GlOO的畫面結(jié)構(gòu)與第3實(shí)施方式所示的畫面結(jié)構(gòu)相同,作為顯示對(duì)象的圖像不同。在本實(shí)施方式中,處于還未生成局域模型的狀態(tài),作為顯示對(duì)象的圖像不用于分類。其他畫面結(jié)構(gòu)例如庫G101、復(fù)選框C100、C101、C102、C103、…、按鈕B100、BlOU B102、B103、滾動(dòng)條SB100與第3實(shí)施方式相同,所以,這里省略說明。例如,在顯示圖像GlOO的期間內(nèi),用戶能夠使用滾動(dòng)條SB100進(jìn)行滾動(dòng)操作,并容易地選擇作為登記對(duì)象的圖像組。并且,當(dāng)按下在圖像G300中示出的按鈕B300時(shí),在局域辭典DB 10中登記通過后述的同一特征提取部58和局域模型生成部59的功能而生成的局域模型。(2)同一特征提取部58同一特征提取部58從由登記部51指定的圖像組中提取同一特征。具體而言,同一特征提取部58例如在圖像GlOO中勾選了多個(gè)圖像之后,當(dāng)按下按鈕BlOO時(shí),按照攝影時(shí)期的遠(yuǎn)近、即事件單位對(duì)所勾選的圖像組中包含的多個(gè)圖像進(jìn)行分類。同一特征提取部58以分類后的多個(gè)圖像單位提取同一特征。提取方法與第1實(shí)施方式所示的同一特征提取部8相同,所以,這里省略說明。(3)局域模型生成部59局域模型生成部59按照以分類后的多個(gè)圖像單位由同一特征提取部58提取出的同一特征,生成局域模型。局域模型的生成方法與第1實(shí)施方式所示的局域模型生成部59相同,所以,這里省略說明。5. 2 動(dòng)作這里,使用圖22所示的流程圖說明數(shù)據(jù)處理裝置100從用戶指定的圖像組中提取同一特征時(shí)的處理。
登記部51從用戶受理登記指示和作為對(duì)象的多個(gè)圖像的指定(步驟S100)。具體而言,登記部51在圖像GlOO中勾選了多個(gè)圖像后,按下按鈕B100,由此,受理登記指示和圖像的指定。當(dāng)利用登記部51受理了登記指示和圖像的指定后,同一特征提取部58判斷是否指定了多張所受理的圖像(步驟S105)。在判斷為沒有指定多張的情況下(步驟S105中的“否”),處理結(jié)束。在判斷為指定了多張的情況下(步驟S105中的“是”),同一特征提取部58按照每個(gè)事件單位進(jìn)行分類(步驟Sl 10)。同一特征提取部58選擇一個(gè)事件(步驟Sl 15)。同一特征提取部58判斷所選擇的事件中包含的圖像數(shù)量是否為一定數(shù)量以上 (步驟 S120)。在判斷為一定數(shù)量以上的情況下(步驟S120中的“是”),同一特征提取部58從所選擇的事件中包含的多個(gè)圖像中提取以一定頻度以上計(jì)算的基準(zhǔn)特征量(步驟S125)。 關(guān)于特征量的類別,只要是由特征量提取部3提取出的特征量即可,可以是任意的,還考慮對(duì)顏色信息和高次特征量的SIFT進(jìn)行組合來利用的情況等。這里,假設(shè)利用SIFT特征量。 通過在所指定的全部圖像中存在半數(shù)以上的具有某個(gè)一定閾值以上的類似度的SIFT特征量等的條件,能夠識(shí)別并提取基準(zhǔn)特征量。接著,按照提取出的每個(gè)基準(zhǔn)特征量,同一特征提取部58計(jì)算代表特征量和全部頻繁出現(xiàn)特征量的類似度(步驟S130)。例如,在頻繁出現(xiàn)特征量是SIFT特征量的情況下, 計(jì)算全部圖像數(shù)據(jù)相對(duì)于各SIFT特征量的距離作為類似度。同一特征提取部58按照每個(gè)基準(zhǔn)特征量,例如在0(全部不一致) 1(完全一致)之間對(duì)與未分類的全部圖像內(nèi)的 SIFT特征量之間的一致程度進(jìn)行歸一化,計(jì)算類似度分布(步驟S135)。在該一致度分布中接近0的比例高、接近1的比例也高的情況下,例如圖23所示的分布的情況下,同一特征提取部58判定并提取認(rèn)為能夠判定同一物體性的頻繁出現(xiàn)特征量(步驟S140),將其作為同一特征輸出到局域模型生成部9。同一特征提取部58判斷是否存在未選擇的事件(步驟S145)。在判斷為存在的情況下(步驟S145中的“是”),同一特征提取部58選擇下一個(gè)事件(步驟S150),返回步驟S120。在判斷為不存在的情況下(步驟S145中的“否”),處理結(jié)束。以后,在局域模型生成部9中,使用提取出的同一特征,按照事件單位生成局域模型。5. 3第5實(shí)施方式的變形例以上,作為本發(fā)明的一例,根據(jù)第5實(shí)施方式進(jìn)行了說明,但是不限于此。例如考慮以下的變形例。(1)在上述第5實(shí)施方式中,同一特征提取部58按照事件單位對(duì)所指定的圖像組進(jìn)行分割,但是不限于此。同一特征提取部也可以不按照事件單位對(duì)所指定的圖像組進(jìn)行分割,而從所指定的圖像組中提取多個(gè)同一特征。此時(shí),局域模型生成部可以按照事件單位對(duì)提取出的多個(gè)同一特征進(jìn)行分類,或者,也可以不按照事件單位進(jìn)行分類,而根據(jù)提取出的全部同一特征生成局域模型。 (2)在上述第5實(shí)施方式中,局域模型生成部59按照事件單位生成局域模型,但是
不限于此。局域模型生成部也可以使用按照事件單位提取出的全部同一特征生成局域模型。 該情況下,僅提取按照每個(gè)事件生成的局域模型分別共通的特征,根據(jù)提取出的特征生成局域模型的核心部分。進(jìn)而,通過計(jì)算核心部分的局域模型與各局域模型的差分,提取這些局域模型的傾向變化,生成適于該變化傾向和區(qū)間全體的圖像傾向的新的局域模型?;蛘撸钟蚰P蜕刹堪凑帐录挝簧删钟蚰P?,根據(jù)一個(gè)事件的局域模型和其他事件的局域模型,生成在所述一個(gè)事件與所述其他事件之間存在且用戶沒有從指定圖像中確定的事件(未選擇事件)的局域模型。例如,在將用戶指定的圖像組分割成圖11中的區(qū)間1、3所示的2個(gè)事件的情況下,局域模型生成部生成各個(gè)區(qū)間1、3中的局域模型,進(jìn)而,根據(jù)各個(gè)區(qū)間1、3中的局域模型,生成在區(qū)間1、3之間存在的區(qū)間2(用戶未指定的區(qū)間)的局域模型。并且,局域模型生成部也可以對(duì)要利用的2個(gè)事件各自的局域模型進(jìn)行加權(quán),生成未選擇事件的局域模型。例如,與上述同樣,在所選擇的事件為區(qū)間1、3、未選擇事件為區(qū)間2的情況下,考慮區(qū)間1與區(qū)間2的差分為2日、區(qū)間2與區(qū)間3的差分為3時(shí)。該情況下, 使用區(qū)間1的局域模型(X)和區(qū)間3的局域模型(Y),通過數(shù)式“Z = XX (3/5)+YX (2/5),, 計(jì)算區(qū)間2的局域模型(Z)。(3)在上述第5實(shí)施方式中,用戶進(jìn)行登記指示時(shí),也可以按照?qǐng)D像中包含的物體的朝向進(jìn)行選擇。例如,在希望選擇寵物或人作為生成局域模型的對(duì)象的情況下,用戶按照從正面拍攝了寵物或人的面部的圖像、從右側(cè)面拍攝的圖像、從左側(cè)面拍攝的圖像等,根據(jù)拍攝角度進(jìn)行選擇。同一特征提取部按照每個(gè)拍攝角度提取同一特征。(4)在上述第5實(shí)施方式中,同一特征提取部58按照每個(gè)事件對(duì)圖像組進(jìn)行分割, 但是不限于此。在用戶指定圖像時(shí),也可以按照每個(gè)事件進(jìn)行分類并指定圖像。(5)在上述第5實(shí)施方式中,數(shù)據(jù)處理裝置在還未生成局域模型的狀態(tài)下,僅將未分類的圖像作為顯示對(duì)象,但是不限于此。在還未生成局域模型的狀態(tài)下,所顯示的圖像與是否分類無關(guān),可以是包含在顯示對(duì)象的庫中的圖像。(6)可以對(duì)上述第5實(shí)施方式和這些變形例進(jìn)行組合。5. 4 總結(jié)如上所述,局域模型生成部59能夠按照每個(gè)事件單位(例如圖11所示的區(qū)間單位)生成局域模型,并且,在由用戶指定的圖像組中判定該模型的時(shí)間連續(xù)性。例如,在用戶指定的圖像組包含在圖11所示的區(qū)間1、2、6中的情況下,在區(qū)間1、2、6中,根據(jù)包含用戶指定的對(duì)象的圖像組,針對(duì)各個(gè)區(qū)間生成局域模型,由此,能夠針對(duì)各個(gè)區(qū)間全體的圖像傾向(例如圖像的平均顏色直方圖、特征物體的含有度、背景種類等)生成作為最佳登記對(duì)象的局域模型。
并且,例如,在用戶指定的圖像組僅包含在圖11所示的區(qū)間3中的情況下,按照事件拍攝的可能性高,可以僅在該區(qū)間內(nèi)生成最佳的局域模型。進(jìn)而,可以限定利用在各區(qū)間內(nèi)提取同一特征并加以利用的特征量自身。6.變形例以上,根據(jù)實(shí)施方式進(jìn)行了說明,但是,本發(fā)明不限于上述各實(shí)施方式。例如,考慮以下的變形例。(1)在上述各實(shí)施方式中,在分類部4進(jìn)行的判定處理中使用的判別器基于機(jī)械學(xué)習(xí)手法,但是不限于此。判別器只要是如下方法即可能夠按照某個(gè)判別基準(zhǔn)判別具有某個(gè)特征量的信號(hào)所屬的某個(gè)定義的分類項(xiàng)目。(2)本發(fā)明中利用的基準(zhǔn)特征量只要能夠在由特征量提取部3提取出的特征量中捕捉AV數(shù)據(jù)內(nèi)的特征即可。例如,在圖像中,考慮BoF (Bag OfFeatures)中的各Visual Word等的部分要素特征量,在音頻中,考慮作為語言基本模型的母音和子音的講話模型等。(3)在上述各實(shí)施方式中,關(guān)于同一特征提取處理的開始,作為一例,使用第1基準(zhǔn)參數(shù)表T100,但是不限于該表的內(nèi)容。只要是能夠根據(jù)分類結(jié)果的增減來開始處理的數(shù)量即可,與其類別無關(guān)。例如,簡單地講,數(shù)據(jù)處理裝置可以根據(jù)全部數(shù)據(jù)數(shù)量的增減來進(jìn)行同一特征提取處理,也可以在滿足第1基準(zhǔn)參數(shù)表TlOO的各基準(zhǔn)中的至少2個(gè)以上的基準(zhǔn)的情況下進(jìn)行處理。(4)在上述各實(shí)施方式中,同一特征提取部8和同一特征提取部58也可以按照全部圖像數(shù)據(jù)計(jì)算圖3所示的檢測頻度,計(jì)算一定區(qū)間的檢測頻度值的檢測數(shù)。(5)在上述各實(shí)施方式中,也可以在0 1中對(duì)類似度分布的檢測數(shù)的值進(jìn)行歸一化。由此,能夠簡化計(jì)算處理。(6)在上述各實(shí)施方式中,同一特征提取部8和同一特征提取部58在滿足第2基準(zhǔn)參數(shù)表TllO中的多個(gè)峰值基準(zhǔn)中的某個(gè)峰值基準(zhǔn)的情況下,判定為對(duì)應(yīng)的基準(zhǔn)特征量能夠判定同一物體性,但是不限于此。也可以按照每個(gè)要利用的基準(zhǔn)特征量來對(duì)應(yīng)峰值基準(zhǔn)。(7)在上述第3實(shí)施方式中,在圖16的例子中,使用復(fù)選框來選擇圖像,但是不限于此。也可以通過直接接觸(觸摸)的方式來選擇圖像。在圖17的例子中,選擇一個(gè)物體(椅子)并輸入標(biāo)簽,但是,也可以在一張圖像中選擇多個(gè)物體,針對(duì)各物體分別輸入標(biāo)簽。S卩,只要是能夠?qū)ν惶卣魈崛〔?和局域模型生成部9的處理結(jié)果進(jìn)行修正的用戶交互內(nèi)容即可,與其手法無關(guān)。(8)在上述第1實(shí)施方式中,在未分類特征DB 7中存儲(chǔ)有識(shí)別AV數(shù)據(jù)的識(shí)別符作為未分類信息,但是不限于此。也可以在未分類特征DB 7中存儲(chǔ)由特征量提取部3計(jì)算出的針對(duì)AV數(shù)據(jù)的特征量,作為未分類信息。(9)在上述各實(shí)施方式中,以圖像為中心進(jìn)行了說明,但是,本發(fā)明的裝置不是僅將圖像作為對(duì)象。
26
也可以根據(jù)音頻生成局域模型。只要是能夠根據(jù)某種特征生成局域模型的數(shù)據(jù)即可。并且,本發(fā)明的裝置也可以組入能夠蓄積能夠生成局域模型的數(shù)據(jù)的裝置、例如 DVD記錄器、TV、個(gè)人電腦、數(shù)據(jù)服務(wù)器等中。(10)在上述各實(shí)施方式中,特征量提取部提取根據(jù)邊緣、顏色或紋理等的低次特征量以特征點(diǎn)為中心表現(xiàn)區(qū)域特征量的特征量描述符即SURF或SIFT等的特征量、以及表現(xiàn)物體的形狀特征的HOG (Histogram of oriented Gradient)等的高次特征,但是不限于此。特征量提取部也可以生成包含在邊緣、顏色或紋理等中類似的局部特征組在內(nèi)的特征組。此時(shí),同一特征提取部根據(jù)所生成的特征組中包含的各局部特征組,計(jì)算特征量的類似性和特征量的出現(xiàn)頻度等。(11)也可以將記述了上述實(shí)施方式中說明的手法的順序的程序存儲(chǔ)在存儲(chǔ)器中, CPU (Central Processing Unit)等從存儲(chǔ)器中讀出程序,執(zhí)行所讀出的程序,由此,實(shí)現(xiàn)上述手法。并且,也可以將記述了該手法的順序的程序存儲(chǔ)在記錄介質(zhì)中并頒布。(12)上述各實(shí)施方式的各結(jié)構(gòu)也可以作為集成電路即LSI(Large Scale Integration)實(shí)現(xiàn)。這些結(jié)構(gòu)可以單片化,也可以以包含一部分或全部的方式單片化。這里。表現(xiàn)為LSI,但是,根據(jù)電路的集成度的差異,有時(shí)稱為ICantegrated Circuit)、系統(tǒng)LSI、超級(jí)LSI、特級(jí)LSI。并且,集成電路化的手法不限于LSI,也可以通過專用電路或通用處理器進(jìn)行集成電路化。并且,也可以使用能夠在LSI制造后進(jìn)行編程的FPGA(Field Programmable Gate Array)、能夠再次構(gòu)筑LSI內(nèi)部的電路單元的連接或設(shè)定的可重構(gòu)處理器(ReConfigurable processor)?;蛘撸缈梢允褂?DSP (Digital Signal Processor) 或CPU(Central Processing Unit)等進(jìn)行這些功能塊的運(yùn)算。進(jìn)而,這些處理步驟可以作為程序記錄在記錄介質(zhì)中來執(zhí)行。進(jìn)而,如果出現(xiàn)了通過半導(dǎo)體技術(shù)的進(jìn)步或派生的其他技術(shù)置換LSI的集成電路的技術(shù),則當(dāng)然也可以使用該技術(shù)來進(jìn)行功能塊的集成化。存在應(yīng)用生物技術(shù)等的可能性。(13)可以對(duì)上述實(shí)施方式和變形例進(jìn)行組合。產(chǎn)業(yè)上的可利用性本發(fā)明的數(shù)據(jù)處理裝置在對(duì)一般模型中無法識(shí)別的數(shù)據(jù)進(jìn)行分類并生成用戶特定的局域模型時(shí)是有用的。并且,本發(fā)明的數(shù)據(jù)處理裝置不是通過主要使用全部特征量的距離空間來生成局域模型,而是將要利用的特征量僅限定為同一被攝體性高的特征量,或者按照一定區(qū)間進(jìn)行分割而生成考慮了時(shí)間序列連續(xù)性的模型,由此,不是一般的分類模型,而是針對(duì)局域AV 數(shù)據(jù)的識(shí)別性高的局域分類模型。因此,通過高精度地提取局域AV數(shù)據(jù)組特有的物體信息并進(jìn)行數(shù)據(jù)的索引,能夠進(jìn)行用戶省事的AV數(shù)據(jù)分類和檢索。例如,在進(jìn)行照片檢索時(shí),在一般的分類模型中分類不充分的情況下,具有生成用戶的局域圖像組特有的分類模型并進(jìn)行分類的圖像處理功能,作為各種圖像視聽終端機(jī)等是有用的。并且,還可以應(yīng)用于DVD記錄器、TVCTelevision)、個(gè)人電腦軟件、數(shù)據(jù)服務(wù)器等的用途。標(biāo)號(hào)說明
1 局域DB ;
2 預(yù)處理部;
3 特征量提取部;
4 分類部;
5 基本辭典DB ;
6 檢索索引DB;
7 未分類特征DB ;
8 同一特征提取部;
9 局域模型生成部;
10局域辭典DB ;
11基準(zhǔn)參數(shù)DB;
20局域模型生成部;
21區(qū)間信息提取部;
22區(qū)間模型生成部;
23模型連續(xù)性判定部;
30用戶交互輸入部;
40分類部;
41全部圖像特征DB;
42類似特征提取部;
43全域模型生成部;
100 數(shù)據(jù)處理裝置。
權(quán)利要求
1.一種數(shù)據(jù)處理裝置,其特征在于,具有存儲(chǔ)單元,保持由多個(gè)特征量各自的檢測頻度的組合構(gòu)成且用于目標(biāo)分類的多個(gè)模型數(shù)據(jù);分類單元,根據(jù)所述多個(gè)模型數(shù)據(jù)和在分類對(duì)象的數(shù)據(jù)中被檢測的2個(gè)以上的特征量各自的檢測頻度,確定可否進(jìn)行該數(shù)據(jù)中包含的目標(biāo)的分類;確定單元,在對(duì)多個(gè)分類對(duì)象的數(shù)據(jù)進(jìn)行了基于所述分類單元的處理后,在存在多個(gè)確定為不可進(jìn)行目標(biāo)分類的未識(shí)別數(shù)據(jù)的情況下,確定2個(gè)以上的、被檢測的頻度相同的未識(shí)別數(shù)據(jù)為一定數(shù)量以上的特征量;以及模型生成單元,通過類生成手法,根據(jù)所確定的2個(gè)以上的特征量生成新的模型數(shù)據(jù), 并存儲(chǔ)在所述存儲(chǔ)單元中。
2.如權(quán)利要求1所述的數(shù)據(jù)處理裝置,其特征在于,所述確定單元按照每個(gè)所述未識(shí)別數(shù)據(jù),取得針對(duì)所述多個(gè)特征量分別檢測與該特征量類似的特征量的檢測頻度,根據(jù)分別從所述未識(shí)別數(shù)據(jù)取得的檢測頻度,按照所述多個(gè)特征量的每一個(gè)生成檢測頻度的分布程度,分別根據(jù)所述分布程度,確定2個(gè)以上的、被檢測的頻度相同的未識(shí)別數(shù)據(jù)為一定數(shù)量以上的特征量。
3.如權(quán)利要求2所述的數(shù)據(jù)處理裝置,其特征在于,所述確定單元按照依據(jù)規(guī)定規(guī)則的每個(gè)區(qū)間對(duì)所述多個(gè)未識(shí)別數(shù)據(jù)進(jìn)行分組,生成多個(gè)數(shù)據(jù)組,按照每個(gè)所述數(shù)據(jù)組進(jìn)行檢測頻度的取得、分布程度的生成以及特征量的確定,所述模型生成單元按照每個(gè)所述數(shù)據(jù)組生成新的模型數(shù)據(jù)。
4.如權(quán)利要求3所述的數(shù)據(jù)處理裝置,其特征在于,表示生成該未識(shí)別數(shù)據(jù)的日期時(shí)間的時(shí)間信息分別與所述未識(shí)別數(shù)據(jù)對(duì)應(yīng),依據(jù)所述規(guī)定規(guī)則的區(qū)間是按照一定時(shí)間段劃分的期間,所述確定單元按照劃分為一定時(shí)間段的每個(gè)期間,對(duì)所述多個(gè)未識(shí)別數(shù)據(jù)進(jìn)行分組, 生成所述多個(gè)數(shù)據(jù)組。
5.如權(quán)利要求4所述的數(shù)據(jù)處理裝置,其特征在于,所述模型生成單元在生成了多個(gè)新的模型數(shù)據(jù)的情況下,判定在一個(gè)數(shù)據(jù)組中生成的一個(gè)模型數(shù)據(jù)與在其他數(shù)據(jù)組中生成的其他模型數(shù)據(jù)是否存在基于時(shí)間推移的相關(guān)關(guān)系, 在判定為存在相關(guān)關(guān)系的情況下,將該一個(gè)模型數(shù)據(jù)與該其他模型數(shù)據(jù)作為具有時(shí)間變化性的模型數(shù)據(jù)對(duì)應(yīng)起來。
6.如權(quán)利要求5所述的數(shù)據(jù)處理裝置,其特征在于,在對(duì)所述一個(gè)模型數(shù)據(jù)賦予特征的第1特征量的類似性的變化度與對(duì)所述其他模型數(shù)據(jù)賦予特征的第2特征量的類似性的變化度之間存在比例關(guān)系的情況下,所述模型生成單元判定為存在相關(guān)關(guān)系。
7.如權(quán)利要求5所述的數(shù)據(jù)處理裝置,其特征在于,當(dāng)在一個(gè)數(shù)據(jù)組中生成的一個(gè)模型數(shù)據(jù)與在其他數(shù)據(jù)組中生成的其他模型數(shù)據(jù)相同的情況下、或者在其余的數(shù)據(jù)組中周期性地出現(xiàn)與該一個(gè)模型數(shù)據(jù)相同的模型數(shù)據(jù)的情況下,所述模型生成單元僅將該一個(gè)模型數(shù)據(jù)向所述存儲(chǔ)單元存儲(chǔ)。
8.如權(quán)利要求2所述的數(shù)據(jù)處理裝置,其特征在于,所述確定單元使用全部所述未識(shí)別數(shù)據(jù),取得針對(duì)每個(gè)特征量的計(jì)算頻度,確定所取得的計(jì)算頻度為規(guī)定頻度以上的一個(gè)以上的特征量,按照未進(jìn)行所述目標(biāo)的識(shí)別的每個(gè)數(shù)據(jù),取得分別針對(duì)所取得的一個(gè)以上的特征量的檢測頻度,根據(jù)按照該每個(gè)數(shù)據(jù)取得的一個(gè)以上的檢測頻度,生成所述分布程度。
9.如權(quán)利要求2所述的數(shù)據(jù)處理裝置,其特征在于, 所述數(shù)據(jù)處理裝置還具有顯示單元,顯示所述多個(gè)未識(shí)別數(shù)據(jù);以及指示受理單元,從用戶受理從所顯示的未識(shí)別數(shù)據(jù)中指定2個(gè)以上的數(shù)據(jù), 所述確定單元根據(jù)分別從由所述指示受理單元受理的所述2個(gè)以上的未識(shí)別數(shù)據(jù)取得的所述多個(gè)特征量的每一個(gè)的檢測頻度,或者根據(jù)分別從除了所述2個(gè)以上的數(shù)據(jù)以外的其余數(shù)據(jù)取得的所述多個(gè)特征量的每一個(gè)的檢測頻度,生成所述多個(gè)特征量的每一個(gè)的所述分布程度。
10.如權(quán)利要求9所述的數(shù)據(jù)處理裝置,其特征在于, 所述指示受理單元在還未生成新的模型數(shù)據(jù)時(shí)受理所述指示。
11.如權(quán)利要求10所述的數(shù)據(jù)處理裝置,其特征在于,所述確定單元對(duì)于由所述指示受理單元受理的所述2個(gè)以上的未識(shí)別數(shù)據(jù)的每一個(gè), 根據(jù)該未識(shí)別數(shù)據(jù)的生成日期時(shí)間,分別對(duì)所述2個(gè)以上的未識(shí)別數(shù)據(jù)進(jìn)行分組以使得該生成日期時(shí)間屬于多個(gè)期間中的某個(gè)期間,按照每個(gè)組生成所述分布程度。
12.如權(quán)利要求2所述的數(shù)據(jù)處理裝置,其特征在于, 所述數(shù)據(jù)處理裝置還具有顯示單元,對(duì)估計(jì)為具有通過由所述模型數(shù)據(jù)生成單元生成的所述新的模型數(shù)據(jù)識(shí)別的目標(biāo)的多個(gè)數(shù)據(jù)進(jìn)行顯示;以及指示受理單元,從用戶受理從所顯示的多個(gè)數(shù)據(jù)中指定2個(gè)以上的數(shù)據(jù), 所述確定單元根據(jù)分別從由所述指示受理單元受理的所述2個(gè)以上的數(shù)據(jù)取得的所述多個(gè)特征量的每一個(gè)的檢測頻度,或者根據(jù)分別從除了所述2個(gè)以上的數(shù)據(jù)以外的其余數(shù)據(jù)取得的所述多個(gè)特征量的每一個(gè)的檢測頻度,按照所述多個(gè)特征量的每一個(gè)生成與所述分布程度不同的分布程度,所述模型數(shù)據(jù)生成單元根據(jù)所述不同的分布程度,生成與所述新的模型數(shù)據(jù)不同的模型數(shù)據(jù)。
13.如權(quán)利要求2所述的數(shù)據(jù)處理裝置,其特征在于, 所述數(shù)據(jù)是圖像,所述確定單元按照未進(jìn)行所述目標(biāo)的識(shí)別的每個(gè)圖像,使用在該圖像中被檢測的一個(gè)以上的特征量的類似度,生成至少包含局部特征組的高次特征組,從各局部特征組取得所述檢測頻度。
14.一種數(shù)據(jù)處理方法,該數(shù)據(jù)處理方法用于數(shù)據(jù)處理裝置,該數(shù)據(jù)處理裝置具有保持由多個(gè)特征量各自的檢測頻度的組合構(gòu)成且用于目標(biāo)分類的多個(gè)模型數(shù)據(jù)的存儲(chǔ)單元,其特征在于,該數(shù)據(jù)處理方法包含以下步驟分類步驟,根據(jù)所述多個(gè)模型數(shù)據(jù)和在分類對(duì)象數(shù)據(jù)中被檢測的2個(gè)以上的特征量各自的檢測頻度,確定可否進(jìn)行該數(shù)據(jù)中包含的目標(biāo)的分類;確定步驟,在對(duì)多個(gè)分類對(duì)象數(shù)據(jù)進(jìn)行了所述分類步驟的處理后,在存在多個(gè)確定為不可進(jìn)行目標(biāo)分類的未識(shí)別數(shù)據(jù)的情況下,確定2個(gè)以上的、被檢測的頻度相同的未識(shí)別數(shù)據(jù)為一定數(shù)量以上的特征量;以及模型生成步驟,通過類生成手法,根據(jù)所確定的2個(gè)以上的特征量生成新的模型數(shù)據(jù), 存儲(chǔ)在所述存儲(chǔ)單元中。
15.一種程序,該程序用于數(shù)據(jù)處理裝置,該數(shù)據(jù)處理裝置具有保持由多個(gè)特征量各自的檢測頻度的組合構(gòu)成且用于目標(biāo)分類的多個(gè)模型數(shù)據(jù)的存儲(chǔ)單元,其特征在于,該程序使所述數(shù)據(jù)處理裝置執(zhí)行以下步驟分類步驟,根據(jù)所述多個(gè)模型數(shù)據(jù)和在分類對(duì)象數(shù)據(jù)中被檢測的2個(gè)以上的特征量各自的檢測頻度,確定可否進(jìn)行該數(shù)據(jù)中包含的目標(biāo)的分類;確定步驟,在對(duì)多個(gè)分類對(duì)象數(shù)據(jù)進(jìn)行了所述分類步驟的處理后,在存在多個(gè)確定為不可進(jìn)行目標(biāo)分類的未識(shí)別數(shù)據(jù)的情況下,確定2個(gè)以上的、被檢測的頻度相同的未識(shí)別數(shù)據(jù)為一定數(shù)量以上的特征量;以及模型生成步驟,通過類生成手法,根據(jù)所確定的2個(gè)以上的特征量生成新的模型數(shù)據(jù), 存儲(chǔ)在所述存儲(chǔ)單元中。
16.一種集成電路,該集成電路用于數(shù)據(jù)處理裝置,其特征在于,該集成電路具有存儲(chǔ)單元,保持由多個(gè)特征量各自的檢測頻度的組合構(gòu)成且用于目標(biāo)分類的多個(gè)模型數(shù)據(jù);分類單元,根據(jù)所述多個(gè)模型數(shù)據(jù)和在分類對(duì)象數(shù)據(jù)中被檢測的2個(gè)以上的特征量各自的檢測頻度,確定可否進(jìn)行該數(shù)據(jù)中包含的目標(biāo)的分類;確定單元,在對(duì)多個(gè)分類對(duì)象數(shù)據(jù)進(jìn)行了所述分類單元的處理后,在存在多個(gè)確定為不可進(jìn)行目標(biāo)分類的未識(shí)別數(shù)據(jù)的情況下,確定2個(gè)以上的、被檢測的頻度相同的未識(shí)別數(shù)據(jù)為一定數(shù)量以上的特征量;以及模型生成單元,通過類生成手法,根據(jù)所確定的2個(gè)以上的特征量生成新的模型數(shù)據(jù), 存儲(chǔ)在所述存儲(chǔ)單元中。
全文摘要
目的在于,提供即使在存在用戶數(shù)據(jù)中特定的目標(biāo)的情況下用戶也會(huì)滿意分類結(jié)果的數(shù)據(jù)處理裝置。數(shù)據(jù)處理裝置保持由多個(gè)特征量各自的檢測頻度的組合構(gòu)成的多個(gè)模型數(shù)據(jù),根據(jù)所述多個(gè)模型數(shù)據(jù)和在識(shí)別對(duì)象數(shù)據(jù)中被檢測的2個(gè)以上的特征量各自的檢測頻度,進(jìn)行確定可否識(shí)別該數(shù)據(jù)中包含的目標(biāo)的處理,在對(duì)多個(gè)識(shí)別對(duì)象數(shù)據(jù)進(jìn)行了所述處理后,在存在多個(gè)未進(jìn)行目標(biāo)識(shí)別的未識(shí)別數(shù)據(jù)的情況下,確定2個(gè)以上的被檢測的頻度相同的未識(shí)別數(shù)據(jù)為一定數(shù)量以上的特征量,通過類生成手法,根據(jù)所確定的2個(gè)以上的特征量生成新的模型數(shù)據(jù),與所述多個(gè)模型數(shù)據(jù)一起保持。
文檔編號(hào)G06F17/30GK102356393SQ20108001254
公開日2012年2月15日 申請(qǐng)日期2010年12月24日 優(yōu)先權(quán)日2010年1月29日
發(fā)明者上野山努, 川西亮一, 石田明 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社