專利名稱:數(shù)據(jù)庫搜索方法、系統(tǒng)和控制器的制作方法
數(shù)據(jù)庫搜索方法、系統(tǒng)和控制器領(lǐng)域本發(fā)明涉及用于搜索數(shù)據(jù)項(xiàng)目的數(shù)據(jù)庫的計(jì)算機(jī)化方法、系統(tǒng)和控制器,數(shù)據(jù)項(xiàng)目特別是但不局限于諸如圖像、音樂、電影、游戲或書籍的媒體項(xiàng)目。
背景技術(shù):
搜尋媒體項(xiàng)目例如現(xiàn)有的照片的數(shù)據(jù)庫是一項(xiàng)經(jīng)常在媒體業(yè)中以及消費(fèi)者通常進(jìn)行的任務(wù)。諸如gettyimages. com、images, google, com等的網(wǎng)站通常提供涉及圖像內(nèi)容的基于描述符的編索引的搜索方法。內(nèi)容描述符通常涉及諸如觀念、情感、位置的方面或涉及圖像中的人的特點(diǎn)。用戶通常使用下拉列表中的復(fù)選框指定一個(gè)或多個(gè)內(nèi)容描述符的值,且圖像搜索引擎然后搜索與用戶指定的值匹配的圖像的圖像數(shù)據(jù)庫索引。匹配的圖像然后通常伴隨著諸如分辨率或來源的技術(shù)信息被顯示在滾動(dòng)窗口中。通常第一頁示出最接近的匹配,其可能涉及諸如色彩平衡的額外的本機(jī)特性的某個(gè)評(píng)估,以及多個(gè)其他頁包含較少的接近的匹配。用戶檢查許多圖像,并可以通過指定另外的內(nèi)容描述符值或通過選擇一個(gè)參考圖像作為示例來細(xì)化搜索。盡管使用描述符的初始搜索產(chǎn)生了許多可能相關(guān)的圖像,但選擇出更感興趣的圖像的搜索的細(xì)化常常是令人沮喪的。另外,對(duì)滾動(dòng)以及單獨(dú)地檢查大量圖像和文本的混合的需要是令人疲倦和乏味的。因此存在提供改進(jìn)的數(shù)據(jù)庫搜索技術(shù)的需要,改進(jìn)的數(shù)據(jù)庫搜索技術(shù)實(shí)現(xiàn)有用的數(shù)據(jù)項(xiàng)目的更高效和用戶友好的識(shí)別。本發(fā)明的發(fā)明人通過在具代表性的數(shù)據(jù)項(xiàng)目的選擇和顯示的使用方面取得進(jìn)展,找到了幫助用戶定位感興趣的數(shù)據(jù)項(xiàng)目的更加改進(jìn)的方法。發(fā)明概述根據(jù)本發(fā)明的第一方面,提供了一種用戶通過用戶接口搜索包含數(shù)據(jù)項(xiàng)目的數(shù)據(jù)庫的方法,其包括以下步驟指定數(shù)據(jù)庫中的一些數(shù)據(jù)項(xiàng)目或所有數(shù)據(jù)項(xiàng)目的初始搜索子集;識(shí)別搜索子集中的多個(gè)數(shù)據(jù)類別中的每一個(gè)類別的代表;將這些代表顯示在用戶接口上;選擇代表中的一個(gè)或多個(gè);指定在搜索子集中的在對(duì)應(yīng)于所選擇的代表的數(shù)據(jù)類別內(nèi)的數(shù)據(jù)項(xiàng)目的細(xì)化搜索子集;以及重復(fù)識(shí)別和顯示細(xì)化搜索子集的代表的步驟。在一個(gè)實(shí)施方式中,指定初始搜索子集的步驟包括從用戶接收限制標(biāo)準(zhǔn)并將初始子集定義為滿足限制標(biāo)準(zhǔn)的數(shù)據(jù)項(xiàng)目。限制標(biāo)準(zhǔn)可以是搜索詞的值。 在一個(gè)實(shí)施方式中,數(shù)據(jù)項(xiàng)目與多維描述符空間中的描述符值相關(guān)聯(lián),并且搜索子集中的數(shù)據(jù)類別是描述符空間中的區(qū)段??紤]獲得適合于所指定的搜索子集的類別,例如通過識(shí)別具有對(duì)搜索子集的減小的維度的一組適當(dāng)?shù)拿枋龇乃惴◤母缶S度的描述符空間中的存儲(chǔ)的值的描述符表,可以定義所述多維描述符空間??紤]類別的數(shù)量來選擇減小的維度。在一個(gè)實(shí)施方式中,描述符空間的原點(diǎn)在搜索子集的中心附近,以便搜索子集的描述符坐標(biāo)具有正值和負(fù)值;以及類別中的至少一個(gè)是多維描述符空間中的區(qū)段,相比于其他維度,所述區(qū)段在一個(gè)維度中的正方向或負(fù)方向上較大。在一個(gè)實(shí)施方式中,類別的數(shù)量被選擇成使得所有的代表可以一起被顯示給用戶。顯示細(xì)化搜索集的代表的步驟可以包括顯示靠近初始搜索子集的代表的細(xì)化搜索子集的代表。在一個(gè)實(shí)施方式中,指定、識(shí)別、顯示和選擇的過程適合于重復(fù),直到所有的類別具有不多于一個(gè)的成員。 在一個(gè)實(shí)施方式中,數(shù)據(jù)項(xiàng)目包括數(shù)字媒體。根據(jù)本發(fā)明的第二方面,提供了一種供用戶交互地搜索包含數(shù)據(jù)項(xiàng)目的數(shù)據(jù)庫的數(shù)據(jù)庫搜索系統(tǒng),其包括具有顯示器的用戶接口 ;初始搜索子集指定器,其用于指定數(shù)據(jù)庫中的一些數(shù)據(jù)項(xiàng)目或所有數(shù)據(jù)項(xiàng)目的初始搜索子集;代表識(shí)別器,其用于識(shí)別搜索子集中的多個(gè)數(shù)據(jù)類別中的每一個(gè)類別的代表;代表顯示控制器,其用于將代表顯示在顯示器上;代表選擇器,其用于選擇代表中的一個(gè)或多個(gè);細(xì)化搜索子集指定器,其用于指定在搜索子集中的在對(duì)應(yīng)于所選擇的代表的數(shù)據(jù)類別內(nèi)的數(shù)據(jù)項(xiàng)目的細(xì)化搜索子集;重復(fù)器,其用于重復(fù)識(shí)別以及顯示細(xì)化搜索子集的代表的步驟。根據(jù)本發(fā)明的第三方面,提供了一種供用戶通過具有顯示器的用戶接口交互地搜索包含數(shù)據(jù)項(xiàng)目的數(shù)據(jù)庫的數(shù)據(jù)庫搜索控制器,其包括初始搜索子集指定器,其用于指定數(shù)據(jù)庫中的一些數(shù)據(jù)項(xiàng)目或所有數(shù)據(jù)項(xiàng)目的初始搜索子集;代表識(shí)別器,其用于識(shí)別搜索子集中的多個(gè)數(shù)據(jù)類別中的每一個(gè)類別的代表;代表顯示控制器,其用于將代表顯示在顯示器上;代表選擇器,其用于選擇代表中的一個(gè)或多個(gè);細(xì)化搜索子集指定器,其用于指定在搜索子集中的在對(duì)應(yīng)于所選擇的代表的數(shù)據(jù)類別內(nèi)的數(shù)據(jù)項(xiàng)目的細(xì)化搜索子集;重復(fù)器,其用于重復(fù)識(shí)別以及顯示細(xì)化搜索子集的代表的步驟。根據(jù)本發(fā)明的第五方面,提供了計(jì)算機(jī)可讀介質(zhì),其包括本發(fā)明的第四方面的程序代碼。根據(jù)本發(fā)明的第六方面,提供了數(shù)據(jù)信號(hào),其包括本發(fā)明的第四方面的計(jì)算機(jī)程序代碼。附圖的簡要描述圖I是本發(fā)明的示例性數(shù)據(jù)庫搜索系統(tǒng)的框圖2示出本發(fā)明的一個(gè)實(shí)施方式的數(shù)據(jù)庫搜索的方法的流程圖。圖3-6示出根據(jù)本發(fā)明的一個(gè)實(shí)施方式的在圖像的數(shù)據(jù)庫中的搜索會(huì)話中的顯實(shí)施方式的詳細(xì)描述參考附圖,示出了根據(jù)本發(fā)明的一個(gè)實(shí)施方式的數(shù)據(jù)庫搜索系統(tǒng)、控制器和方法的不同方面。所述系統(tǒng)可以采用若干不同的形式。在第一種形式中,提供了獨(dú)立的系統(tǒng),其中所需要的所有組件或大部分組件存在于本地用戶可操作的計(jì)算機(jī)和接口中。在第二種形式中,提供了分布式結(jié)構(gòu),其中實(shí)現(xiàn)系統(tǒng)所需要的一些組件存在于本地用戶可操作的計(jì)算機(jī)和接口中,以及一些組件相對(duì)用戶被遠(yuǎn)程定位。例如,可以使用“胖客戶端”結(jié)構(gòu),其中搜索和/或顯示控制的一部分在本地用戶可操作的計(jì)算機(jī)和接口上執(zhí)行,而一部分被遠(yuǎn)程地例如通過服務(wù)器執(zhí)行;或者可以使用“瘦客戶端”結(jié)構(gòu),其中搜索和顯示控制的大部分被遠(yuǎn)程地例如通過服務(wù)器執(zhí)行,而本地機(jī)器只用于用戶接口。典型的基于網(wǎng)絡(luò)的實(shí)現(xiàn)涉及具有顯示器、鍵盤和鼠標(biāo)或觸敏屏的傳統(tǒng)的個(gè)人計(jì)算機(jī),其將數(shù)據(jù)庫搜索控制器實(shí)現(xiàn)為可以從網(wǎng)站下載的JavaScript或XML程序。數(shù)據(jù)庫將通常遠(yuǎn)離用戶被存儲(chǔ)并由數(shù)據(jù)庫搜索控制器詢問?,F(xiàn)在參考
圖1,最廣泛地來說,核心組件是數(shù)據(jù)庫搜索系統(tǒng)10,其包括用戶接口 20和數(shù)據(jù)庫搜索控制器30,數(shù)據(jù)庫搜索系統(tǒng)10與數(shù)據(jù)存儲(chǔ)器40通信,數(shù)據(jù)存儲(chǔ)器40可以本地以及遠(yuǎn)程地被定位。在一個(gè)實(shí)施方式中,數(shù)據(jù)存儲(chǔ)器40包括數(shù)據(jù)項(xiàng)目數(shù)據(jù)庫420、描述符表422和限制標(biāo)簽表421。用戶接口 20的組件包括諸如IXD監(jiān)視器的顯示器200以及諸如鼠標(biāo)的位置選擇器210,用于使用戶使用諸如左鼠標(biāo)按鈕或右鼠標(biāo)按鈕的至少一個(gè)選擇器按鈕來指示顯示器200上的位置,以使用戶能夠選擇位置并執(zhí)行其他的輸入功能。數(shù)據(jù)庫搜索控制器30與用戶接口 20和數(shù)據(jù)存儲(chǔ)器40進(jìn)行數(shù)據(jù)通信,并且通常包含處理器或在處理器上被實(shí)現(xiàn),處理器根據(jù)在顯示器200上的用戶輸入和輸出來處理搜索。在此,術(shù)語“處理器”用于一般指可執(zhí)行這一功能的任何設(shè)備并且可以包括微處理器、微控制器、可編程邏輯器件或其他計(jì)算設(shè)備、通用計(jì)算機(jī)(例如,PO或服務(wù)器。對(duì)于媒體應(yīng)用,數(shù)據(jù)項(xiàng)目數(shù)據(jù)庫420是媒體數(shù)據(jù)項(xiàng)的大數(shù)據(jù)庫,如在本領(lǐng)域中的普通的,媒體數(shù)據(jù)項(xiàng)伴隨有通常包含與每個(gè)媒體項(xiàng)目相關(guān)的基于文本或二進(jìn)制內(nèi)容的信息的限制標(biāo)簽表421,而且還可以包含一些本機(jī)媒體信息例如媒體類型(例如彩色/黑白)。數(shù)據(jù)存儲(chǔ)器40還包含如在此所描述的每個(gè)媒體項(xiàng)目的衍生描述符的描述符表422,描述符表422通常起源于本機(jī)視聽描述符,而且也可以起源于基于內(nèi)容的信息。表421和422在數(shù)據(jù)庫建立期間被計(jì)算,并可以從媒體項(xiàng)目數(shù)據(jù)庫420遠(yuǎn)程地定位,尤其是在本發(fā)明由除了數(shù)據(jù)項(xiàng)目數(shù)據(jù)庫420的所有者之外的一方運(yùn)用的情況下。表421和422可以例如使用二叉樹全部或部分地被排序或編索引,以加速在數(shù)據(jù)庫420中滿足描述符或限制標(biāo)簽中的值或值的范圍的項(xiàng)目的識(shí)別,如本領(lǐng)域中所熟知的。數(shù)據(jù)庫搜索控制器30具有初始搜索子集指定器310,初始搜索子集指定器310用于通常通過經(jīng)由用戶接口從用戶接收限制標(biāo)準(zhǔn)來指定初始搜索子集。在簡單的實(shí)現(xiàn)中,初始搜索子集指定器310可以平凡地僅適合于指定數(shù)據(jù)庫420中的全部數(shù)據(jù)項(xiàng)目或其固定子集。數(shù)據(jù)庫搜索控制器30還具有代表識(shí)別器320、代表顯示控制器321和代表選擇器330,代表識(shí)別器320用于識(shí)別搜索子集420中的一組代表性數(shù)據(jù)項(xiàng)目,每個(gè)代表性數(shù)據(jù)項(xiàng)目代表搜索子集中的若干類別中的一個(gè),代表顯不控制器321用于將代表顯不在顯不器200上,以及代表選擇器330用于選擇通常由用戶通過位置選擇器210選擇的代表中的一個(gè)或多個(gè)。在數(shù)據(jù)庫搜索控制器30中還提供了細(xì)化搜索子集指定器331和重復(fù)器332,細(xì)化搜索子集指定器331用于指定在搜索子集中的在對(duì)應(yīng)于所選擇的代表的數(shù)據(jù)類別內(nèi)的數(shù)據(jù)項(xiàng)目的細(xì)化搜索子集,以及重復(fù)器332用于將細(xì)化搜素子集轉(zhuǎn)移到代表識(shí)別器320并用于通過代表顯示控制器321顯示新識(shí)別的代表。
現(xiàn)在參考圖2到圖6,在圖2的流程圖中描繪了本發(fā)明的方法方面的一個(gè)實(shí)施方式,以及在圖3到圖6中在本發(fā)明的方法的步驟中示出了示例性顯示布局。在步驟1201中,用戶通過在限制標(biāo)準(zhǔn)窗口 62中鍵入諸如搜索詞“fruit (水果)”的限制標(biāo)準(zhǔn)并點(diǎn)擊“search(搜索)”按鈕64b來指定初始搜索子集。初始搜索子集指定器310訪問限制標(biāo)簽表421以識(shí)別滿足限制標(biāo)準(zhǔn)的數(shù)據(jù)項(xiàng)目,在這種情況下為包含水果的圖像。這是初始搜索子集。在步驟1202中,使用從在描述符表422中表示的35維空間到10維描述符空間的單值分解來找到20個(gè)適合于搜索子集的數(shù)據(jù)類別。在下面的示例中提供了這些過程的細(xì)節(jié)。在步驟1203和1204中,每個(gè)數(shù)據(jù)類別的代表被識(shí)別和顯示,也在下面被更詳細(xì)地描述。圖3示出所顯示的20個(gè)代表是在顯示器60的左側(cè)上的5乘4網(wǎng)格64。在每個(gè)圖像的左上方處是通知用戶搜索子集中的多少數(shù)據(jù)項(xiàng)目在每個(gè)對(duì)應(yīng)的數(shù)據(jù)類別中的數(shù)字。在步驟1205中,用戶通過使用位置選擇器210點(diǎn)擊并在步驟1206中確認(rèn)所選擇的項(xiàng)目將是通過點(diǎn)擊“search”按鈕64b而選擇的代表來選擇值得進(jìn)一步搜索的代表中的一個(gè)或多個(gè)。在圖3中示出的會(huì)話中,選擇了右上代表64a。在步驟1207中,細(xì)化搜索子集被定義為當(dāng)前搜索子集的包含在對(duì)應(yīng)于所選擇的代表的數(shù)據(jù)類別內(nèi)的那些成員。系統(tǒng)然后重復(fù)通過SVD從細(xì)化搜索子集的描述符表值到適合于細(xì)化搜索子集的新的10維描述符空間來找到適當(dāng)?shù)念悇e的步驟。20個(gè)類別中的每一個(gè)類別的代表然后被再次識(shí)別并顯示在顯示器的右側(cè)65上。左上代表與之前選擇的代表相同,但可以不一定是這種情況。在屏幕的底部是搜索細(xì)化的“面包屑”小徑(breadcrumb traiI)。點(diǎn)擊小徑中的最后一個(gè)框會(huì)將搜索子集返回到之前的搜索子集。進(jìn)一步細(xì)化的子集從圖5中的代表65a (石榴)選擇以產(chǎn)生二維描述符空間的四個(gè)代表,以及如在圖6中所示,作為具有3個(gè)成員的類別的代表的石榴66a被再次選擇,以及僅具有3個(gè)成員的最后的細(xì)化搜索子集67被顯示。隨著分級(jí)搜索的繼續(xù),面包屑小徑63擴(kuò)展,且在搜索子集的代表處的系列被添加到在左邊消失的帶中。用戶可以通過點(diǎn)擊面包屑小徑中的相關(guān)的框來跳回到序列中的任何搜索子集,并可以通過編輯限制標(biāo)準(zhǔn)窗62對(duì)搜索子集添加進(jìn)一步的限制。基于圖像的描述符表的示例設(shè)想在本發(fā)明的典型的實(shí)施方式中,從更大維度的描述符空間中的存儲(chǔ)值的描述符表422定義適合于數(shù)據(jù)類別的多維描述符空間。對(duì)于圖像的應(yīng)用,存在很多可用的圖像描述符,其在本發(fā)明中可以用來生成描述符表422。例子包括彩色直方圖、SIFT邊緣檢測、SURF邊緣檢測、Canny邊緣檢測、Tamura紋理特征以及Gabor紋理特征。發(fā)明人當(dāng)前實(shí)現(xiàn)的對(duì)于圖像例如照片或靜止的電影的實(shí)施方式對(duì)描述符表使用一組35個(gè)描述符,其在數(shù)據(jù)庫建立期間使用未壓縮的CEDD[參考文獻(xiàn)I]和FTCH[參考文獻(xiàn)2]描述符集的組合中的336個(gè)描述符的單值分解(SVD)來獲取。找到搜索子集的數(shù)據(jù)類別的示例
在圖3到圖6中所示的實(shí)施方式中,在所有數(shù)據(jù)項(xiàng)目的初始搜索子集中具有“fruit”標(biāo)簽的20個(gè)數(shù)據(jù)類別的代表以5乘4網(wǎng)格64顯示在顯示器60的左邊部分上。在預(yù)備步驟中,使用單值分解(SVD)從被限制到搜索子集的描述符表計(jì)算適合于搜索子集的新的35維描述符空間。通過選擇前10維將35維減少到10,這10維是對(duì)搜索子集的35個(gè)描述符的差異的最大的貢獻(xiàn)者,并因此是識(shí)別適合于搜索子集的類別的好的開始。這20個(gè)類別然后被定義為已減小的10維描述符空間中的區(qū)段。SVD算法的輸出被按比例縮放,以便描述符空間的原點(diǎn)在搜索子集的中心附近,使得搜索子集的描述符坐標(biāo)具有正值和負(fù)值。實(shí)現(xiàn)這一目的的簡單方法是通過減去搜索子集中的每個(gè)坐標(biāo)維的最大值和最小值的平均值來相對(duì)于粗略計(jì)算的中心定義該維。這允許區(qū)段定義為區(qū)域,其中一個(gè)坐標(biāo)在正方向或負(fù)方向上比每維產(chǎn)生兩個(gè)區(qū)段的其他坐標(biāo)大。就數(shù)學(xué)符號(hào)而言,n維描述符空間(例如新的已減小的10維空間)的第k維的點(diǎn)X = (X1, X2. . Xn)的正區(qū)段由下式定義S+k =(所有的點(diǎn)2L,使得對(duì)于所有的i關(guān)k, Xk > Xi且| xk|彡Xi |)以及負(fù)區(qū)段由下式定義S_k =(所有的點(diǎn)2L,使得對(duì)于所有的i關(guān)k, Xk彡Xi且| xk|彡Xi |)這種定義區(qū)段的方法通過B+樹的使用在標(biāo)準(zhǔn)數(shù)據(jù)庫上高效地運(yùn)行。識(shí)別數(shù)據(jù)類別的代表的示例對(duì)于在以上示例中找到的類別,可以通過多種方法對(duì)每一類別識(shí)別代表性的數(shù)據(jù)項(xiàng)目。對(duì)標(biāo)準(zhǔn)數(shù)據(jù)庫快速執(zhí)行的方法的示例是識(shí)別最大值和最小值。換句話說,對(duì)于第k維的正區(qū)段的代表由具有最大的(最正的)Xk的區(qū)段S+k中的數(shù)據(jù)項(xiàng)目定義,以及對(duì)于第k維的負(fù)區(qū)段的代表由具有最小的(最負(fù)的)Xk的區(qū)段S_k中的數(shù)據(jù)項(xiàng)目定義。顯示代表的示例對(duì)于在本說明書中詳細(xì)說明的圖像示例,代表的顯示可以方便地通過將St1^P S_k的代表放在顯示器網(wǎng)格上的相對(duì)位置處來排序,例如,S+!和被放在左上(行1,列I)和右下(5,4)位置上,以及S+2和S_2被放在相鄰的相對(duì)的位置(2,I)和(4,4)上,等等。如在圖5和圖6中所看到的,當(dāng)搜索集被細(xì)化到包括逐步減少的數(shù)據(jù)項(xiàng)目時(shí),由于一些區(qū)段變空,代表的數(shù)量減少。可以通過如圖5所示的增大每個(gè)代表的圖像尺寸并如圖6所示的為不能整齊地放在網(wǎng)格中的素?cái)?shù)數(shù)量的代表提供不規(guī)則分區(qū),來實(shí)現(xiàn)減少數(shù)量的圖像的顯示。音頻描述符空間的示例附圖示出了圖像數(shù)據(jù)庫的示例,但本發(fā)明同樣適用于諸如音樂的音頻數(shù)據(jù)??梢栽诒景l(fā)明中使用的音頻描述符的例子包括梅爾頻率倒譜、零交叉、光譜分析、光譜矩心、光譜滾降、線性預(yù)測編碼系數(shù)和節(jié)拍直方圖。發(fā)明人當(dāng)前實(shí)現(xiàn)的對(duì)于音樂和音頻數(shù)據(jù)項(xiàng)目的實(shí)施方式對(duì)多維描述符空間使用例如在jAudio描述符計(jì)算軟件[參考文獻(xiàn)3]上實(shí)現(xiàn)的、在互聯(lián)網(wǎng)上在http: Ilimir.sourceforRe. net/iAudio. html找到的各種各樣的已知音頻描述符的組合。大量的可用描述符(在這種情況下為330個(gè))在數(shù)據(jù)集上被首次測試以移除傾向于在對(duì)某些數(shù)據(jù)類型的SVD算法中引起錯(cuò)誤的任何(通常大約為30個(gè))描述符。魯棒剩余集(大約300個(gè))然后經(jīng)受如在圖像示例中的SVD算法,以提供要存儲(chǔ)在描述符表422中的一組35個(gè)描述符。10維及更低的描述符空間的計(jì)算在搜索過程中如以上所描述的進(jìn)行。音頻顯示的示例在照片的情況下,項(xiàng)目的性質(zhì)在項(xiàng)目的顯示中對(duì)于用戶是明顯的。在音頻的情況下很清楚,在代表顯示控制器321中在音頻項(xiàng)目的顯示中適應(yīng)是合乎需要的,以傳達(dá)通常關(guān)于除了視覺方面例如所提供的音樂曲目插圖或?qū)]嫹饷嫱獾囊纛l的性質(zhì)的一些信息。一種方法是使用SVD將描述符坐標(biāo)進(jìn)一步從35縮簡到3,并將這3個(gè)縮簡的坐標(biāo)表示為顏色空間中的RGB值。用戶將會(huì)明白哪些顏色對(duì)應(yīng)于哪些類型的聲音?;跇?biāo)簽的描述符應(yīng)用盡管在以上的示例中數(shù)據(jù)庫建于從本地視聽數(shù)據(jù)計(jì)算的描述符,例如圖像的色彩平衡或邊緣信息以及在音樂的情況下的時(shí)間序列描述符,但在原始的描述符集中包括搜索詞是可能的,原始的描述符集也可以與本地描述符一起用SVD算法簡縮。 根據(jù)數(shù)據(jù)庫和應(yīng)用,也存在描述符表422中的描述符集完全從簡縮的描述符來計(jì)算的情況。例如,當(dāng)搜索一部電影或尤其是一本書時(shí),可能發(fā)現(xiàn)諸如演員、導(dǎo)演、作者、情節(jié)、暴力程度等的信息在向用戶提供建議方面比本機(jī)描述符更有用。也可能存在各式各樣的二進(jìn)制描述符,例如,在視頻游戲的情況下,游戲是否具有動(dòng)作或戰(zhàn)略元素、謎題、精靈或槍。這些內(nèi)容標(biāo)簽都可以用與本機(jī)描述符相同的方式來處理,并使用諸如SVD的算法減少到可控?cái)?shù)量的連續(xù)坐標(biāo)的多維集。將認(rèn)識(shí)到,雖然從大量描述符的單值分解被描述為計(jì)算描述符表422的可控描述符空間以及初始搜索子集和細(xì)化搜索子集的減少的維度的多維描述符空間的一種方法,然而本發(fā)明包括分類和識(shí)別所產(chǎn)生的代表的任何方式。特別是,可以使用諸如NIPALS的另一聚類算法來代替SVD。而且,描述符空間不限于笛卡爾空間,且例如可以是節(jié)點(diǎn)樹,坐標(biāo)是代表在樹中的位置的任何方式或任何其他結(jié)構(gòu)。另外,盡管例證了適合于搜索子集的內(nèi)容的自動(dòng)分類,但本發(fā)明以其最廣泛的形式還包括嚴(yán)格的非適應(yīng)性分類。在權(quán)利要求和說明書中,術(shù)語“初始搜索子集”擴(kuò)展到領(lǐng)先并被細(xì)化成“細(xì)化搜索子集”的任何搜索子集,并且不需要是由用戶在搜索會(huì)話中指定的絕對(duì)的第一搜索子集。本領(lǐng)域中的技術(shù)人員還將認(rèn)識(shí)到,可以對(duì)本發(fā)明進(jìn)行許多其他變化而不偏離本發(fā)明的范圍。在接下來的權(quán)利要求中以及在本發(fā)明的前面的描述中,除了在上下文由于明確的語言或必要的暗示而另外需要的場合外,詞“包括(comprise)”或諸如“包括(comprises)”或“包括(comprising)”的變化形式在包含的意義上使用,即,以指定所陳述的特征的存在但不排除在本發(fā)明的多種實(shí)施方式中的另外的特征的存在或添加。應(yīng)理解,如果在此提到任何已有技術(shù)公布,這樣的參考文獻(xiàn)并不構(gòu)成所述公布 在澳大利亞或任何其他國家形成本領(lǐng)域中的常見的一般知識(shí)的一部分的承認(rèn)。參考文獻(xiàn)I. S. A. Chatzichristofis 和 Y.S. Boutalis 的 “CEDD:C0L0R AND EDGEDIRECTIVITY DESCRIPTOR-A COMPACT DESCRIPTOR FOR IMAGE INDEXING AND RETRIEVAL(CEDD :顏色和邊緣的方向性描述符——用于圖像索引和檢索的簡潔描述符)”,《6thInternational Conference in advanced research on Computer Vision Systems ICVS2008 (2008第6屆關(guān)于計(jì)算機(jī)視覺系統(tǒng)的高級(jí)研究國際會(huì)議ICVS)》,Proceedings (學(xué)報(bào))LectureNotes in Computer Science (計(jì)算機(jī)科學(xué)講義)(LNCS)pp. 312-322,2008 年 5 月12-15 日,Santorini,Greece。2. S. A. Chatzichristofis 和 Υ· S. Boutalis 的 “FCTH:FUZZY COLOR AND TEXTURE
HIstogram-a low level feature for accurate image retrieval (FCTH:模糊顏色和
紋理直方圖-用于精確的圖像檢索的低水平特征)”,《9th International Workshop on
Image Analysis for Multimedia Interactive Services (關(guān)于用于多媒體交互服務(wù)的圖像分析的第9屆國際研討會(huì))》,Proceedings (學(xué)報(bào)):IEEE Computer Society (IEEE計(jì)算機(jī)學(xué)會(huì))pp. 191-196,2008 年 5 月 7-9 日,Klagenfurtj Austria。 3. McEnnisj D.、C. McKay、I. Fujinaga 和 P. Depalle 的 2005,jAudio:A featureextraction library Proceedings of the International Conference on MusicInformation Retrieval (關(guān)于音樂信息檢索的國際會(huì)議的特征提取庫學(xué)報(bào)),600-3。
權(quán)利要求
1.一種搜索方法,供用戶通過用戶接口搜索包含數(shù)據(jù)項(xiàng)目的數(shù)據(jù)庫,所述方法包括以下步驟 指定所述數(shù)據(jù)庫中的一些所述數(shù)據(jù)項(xiàng)目或所有所述數(shù)據(jù)項(xiàng)目的初始搜索子集; 識(shí)別所述搜索子集中的多個(gè)數(shù)據(jù)類別中的每一個(gè)類別的代表; 將所述代表顯示在所述用戶接口上; 選擇所述代表中的一個(gè)或多個(gè); 指定在所述搜索子集中的在對(duì)應(yīng)于所選擇的代表的所述數(shù)據(jù)類別內(nèi)的數(shù)據(jù)項(xiàng)目的細(xì)化搜索子集;以及 重復(fù)識(shí)別和顯示所述細(xì)化搜索子集的代表的步驟。
2.如權(quán)利要求I所述的方法,其中指定初始搜索子集的步驟包括從用戶接收限制標(biāo)準(zhǔn)并將所述初始子集定義為滿足所述限制標(biāo)準(zhǔn)的數(shù)據(jù)項(xiàng)目。
3.如權(quán)利要求2所述的方法,其中所述限制標(biāo)準(zhǔn)是搜索詞的值。
4.如權(quán)利要求I所述的方法,其中所述數(shù)據(jù)項(xiàng)目與多維描述符空間中的描述符值相關(guān)聯(lián),并且所述搜索子集中的所述數(shù)據(jù)類別是所述描述符空間中的區(qū)段。
5.如權(quán)利要求4所述的方法,其中考慮獲得適合于所指定的搜索子集的類別來定義所述多維描述符空間。
6.如權(quán)利要求5所述的方法,其中通過識(shí)別具有對(duì)所述搜索子集的減小的維度的一組適當(dāng)?shù)拿枋龇乃惴◤母缶S度的描述符空間中的存儲(chǔ)的值的描述符表來定義所述多維描述符空間。
7.如權(quán)利要求6所述的方法,其中考慮類別的數(shù)量來選擇所述減小的維度。
8.如權(quán)利要求7所述的方法,其中 所述描述符空間的原點(diǎn)在所述搜索子集的中心附近,以便所述搜索子集的所述描述符的坐標(biāo)具有正值和負(fù)值;以及 所述類別中的至少一個(gè)是所述多維描述符空間中的區(qū)段,相比于其他維度,所述區(qū)段在一個(gè)維度中的正方向或負(fù)方向上較大。
9.如權(quán)利要求8所述的方法,其中 所述區(qū)段在一個(gè)維度中的正方向上較大,并由所述一個(gè)維度中的坐標(biāo)值的帶符號(hào)值以及絕對(duì)值比所有其他維度中的坐標(biāo)值的帶符號(hào)值以及絕對(duì)值大的點(diǎn)來定義;或者 所述區(qū)段在所述一個(gè)維度中的負(fù)方向上較大,并由所述一個(gè)維度中的坐標(biāo)值的帶符號(hào)值比在其他維度中的坐標(biāo)值的帶符號(hào)值小且絕對(duì)值比在其他維度中的坐標(biāo)值的絕對(duì)值大的點(diǎn)來定義。
10.如權(quán)利要求8所述的方法,其中 對(duì)應(yīng)于在所述一個(gè)維度中的所述正方向上的較大值的所述區(qū)段的所述代表是在所述搜索子集中具有所述一個(gè)維度中的最大帶符號(hào)坐標(biāo)值的數(shù)據(jù)項(xiàng)目;以及 對(duì)應(yīng)于在所述一個(gè)維度中的所述負(fù)方向上的較大值的所述區(qū)段的所述代表是在所述搜索子集中具有所述一個(gè)維度中的最小帶符號(hào)坐標(biāo)值的數(shù)據(jù)項(xiàng)目。
11.如權(quán)利要求I所述的方法,其中所述類別的數(shù)量被選擇成使得所有的所述代表能夠一起被顯示給用戶。
12.如權(quán)利要求11所述的方法,其中顯示所述細(xì)化搜索集的代表的步驟包括顯示靠近所述初始搜索子集的代表的所述細(xì)化搜索子集的代表。
13.如權(quán)利要求I所述的方法,其中指定、識(shí)別、顯示和選擇的過程適合于重復(fù),直到所有的所述類別具有不多于一個(gè)的成員。
14.如權(quán)利要求I所述的方法,其中所述數(shù)據(jù)項(xiàng)目包括數(shù)字媒體。
15.一種供用戶交互地搜索包含數(shù)據(jù)項(xiàng)目的數(shù)據(jù)庫的數(shù)據(jù)庫搜索系統(tǒng),包括 具有顯示器的用戶接口; 初始搜索子集指定器,其用于指定所述數(shù)據(jù)庫中的一些所述數(shù)據(jù)項(xiàng)目或所有所述數(shù)據(jù)項(xiàng)目的初始搜索子集; 代表識(shí)別器,其用于識(shí)別所述搜索子集中的多個(gè)數(shù)據(jù)類別中的每一個(gè)類別的代表; 代表顯示控制器,其用于將所述代表顯示在所述顯示器上; 代表選擇器,其用于選擇所述代表中的一個(gè)或多個(gè); 細(xì)化搜索子集指定器,其用于指定在所述搜索子集中的在對(duì)應(yīng)于所選擇的代表的所述數(shù)據(jù)類別內(nèi)的數(shù)據(jù)項(xiàng)目的細(xì)化搜索子集; 重復(fù)器,其用于重復(fù)識(shí)別以及顯示所述細(xì)化搜索子集的代表的步驟。
16.一種供用戶通過具有顯示器的用戶接口交互地搜索包含數(shù)據(jù)項(xiàng)目的數(shù)據(jù)庫的數(shù)據(jù)庫搜索控制器,包括 初始搜索子集指定器,其用于指定所述數(shù)據(jù)庫中的一些所述數(shù)據(jù)項(xiàng)目或所有所述數(shù)據(jù)項(xiàng)目的初始搜索子集; 代表識(shí)別器,其用于識(shí)別所述搜索子集中的多個(gè)數(shù)據(jù)類別中的每一個(gè)類別的代表; 代表顯示控制器,其用于將所述代表顯示在所述顯示器上; 代表選擇器,其用于選擇所述代表中的一個(gè)或多個(gè); 細(xì)化搜索子集指定器,其用于指定在所述搜索子集中的在對(duì)應(yīng)于所選擇的代表的所述數(shù)據(jù)類別內(nèi)的數(shù)據(jù)項(xiàng)目的細(xì)化搜索子集; 重復(fù)器,其用于重復(fù)識(shí)別以及顯示所述細(xì)化搜索子集的代表的步驟。
17.分別如權(quán)利要求15或權(quán)利要求16中所述的數(shù)據(jù)庫搜索系統(tǒng)或數(shù)據(jù)庫搜索控制器,其中所述初始搜索子集指定器、代表識(shí)別器、代表顯示控制器、代表選擇器、細(xì)化搜索子集指定器和重復(fù)器中的至少一個(gè)至少部分地通過執(zhí)行存儲(chǔ)在存儲(chǔ)器中的代碼的處理器來實(shí)現(xiàn)。
18.計(jì)算機(jī)程序代碼,所述計(jì)算機(jī)程序代碼當(dāng)由計(jì)算機(jī)執(zhí)行時(shí)使所述計(jì)算機(jī)實(shí)現(xiàn)權(quán)利要求I到14中的任一項(xiàng)所述的搜索方法。
19.一種計(jì)算機(jī)可讀介質(zhì),包括權(quán)利要求18所述的程序代碼。
20.一種數(shù)據(jù)信號(hào),包括權(quán)利要求18所述的計(jì)算機(jī)程序代碼。
全文摘要
提供了一種用戶通過用戶接口搜索包含數(shù)據(jù)項(xiàng)目的數(shù)據(jù)庫的方法、系統(tǒng)和控制器,所述方法包括以下步驟指定數(shù)據(jù)庫中的一些數(shù)據(jù)項(xiàng)目或所有數(shù)據(jù)項(xiàng)目的初始搜索子集(1201);識(shí)別搜索子集中的多個(gè)數(shù)據(jù)類別中的每一個(gè)類別的代表(1203);將代表顯示在用戶接口上(1204);選擇代表中的一個(gè)或多個(gè)(1205);指定在搜索子集中的在對(duì)應(yīng)于所選擇的代表的數(shù)據(jù)類別內(nèi)的數(shù)據(jù)項(xiàng)目的細(xì)化搜索子集(1207);以及重復(fù)識(shí)別和顯示細(xì)化搜索子集的代表的步驟。
文檔編號(hào)G06F17/30GK102640146SQ201080050275
公開日2012年8月15日 申請(qǐng)日期2010年9月10日 優(yōu)先權(quán)日2009年9月11日
發(fā)明者喬納森·大衛(wèi)·帕克, 克里斯多佛·格倫頓·貝茨, 基思·大衛(wèi)·德弗雷爾, 大衛(wèi)·彼得·沃爾夫, 布雷特·詹姆斯·格羅諾 申請(qǐng)人:薩姆萬斯集團(tuán)知識(shí)產(chǎn)權(quán)控股私人有限公司