專利名稱:近似性計(jì)算方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種近似計(jì)算方法、近似計(jì)算設(shè)備、高速執(zhí)行兩個(gè)向量之間的模式(pattern)匹配的程序和記錄介質(zhì)。
本申請要求2002年7月9日提交的日本專利申請?zhí)?002-200481的優(yōu)先權(quán),這里通過引用而并入全文。
背景技術(shù):
到目前為止,為了從未知信號中檢測與已知模式基本相同的模式,或?yàn)榱斯烙?jì)兩個(gè)信號之間的近似性,在與信號處理相關(guān)的所有技術(shù)領(lǐng)域,例如聲學(xué)處理技術(shù)、圖像處理技術(shù)、通信技術(shù)、和/或雷達(dá)技術(shù)等中,進(jìn)行了對于數(shù)據(jù)近似性或一致性的判斷。一般來說,對于模擬數(shù)據(jù)的檢測,使用了一種技術(shù),即允許數(shù)據(jù)成為特征向量,以通過其距離或角度(相關(guān)性)的大小而判斷近似性。
具體說,所謂全搜索就是確定輸入值和各候選者之間的近似性以隨后確定距離最近的數(shù)據(jù),全搜索是最簡單且沒有檢測泄漏的技術(shù),并且當(dāng)數(shù)據(jù)量小時(shí)頻繁使用所謂全搜索。然而,例如在從大量積累圖像或語音(聲音)中檢索與輸入圖像或輸入語音(聲音)相似的部分的情況下,由于每秒鐘的特征向量的維數(shù)大,并且對已經(jīng)過幾十或幾百小時(shí)積累的特征向量進(jìn)行檢索,所以存在當(dāng)執(zhí)行這樣的簡單全搜索時(shí)檢索時(shí)間變長的問題。
另一方面,為了檢索大量數(shù)據(jù),在進(jìn)行編碼數(shù)據(jù)的完全一致檢索,例如文檔檢索的情況下,使用例如二叉樹搜索或散列方法的高速運(yùn)算技術(shù)。根據(jù)該技術(shù),數(shù)據(jù)按順序排放的狀態(tài)被預(yù)先存儲,以省略檢索時(shí)比較與輸入數(shù)據(jù)不同的分枝或表,從而實(shí)現(xiàn)高速運(yùn)算。然而,在物理信號,例如圖像或聲音等,用作主體的情況下,由于在數(shù)據(jù)中本質(zhì)上存在失真和/或噪音,所以編碼數(shù)據(jù)很少彼此完全一致。結(jié)果,在使用高速運(yùn)算技術(shù)的情況下,將發(fā)生大量檢測泄漏。另外,由于數(shù)據(jù)本質(zhì)上是多維的,所以存在很難實(shí)現(xiàn)預(yù)先對數(shù)據(jù)單意排序的問題。
考慮到以上情況,在日本專利公開號H08-123460中提出了一種技術(shù),其中在數(shù)據(jù)登記時(shí)執(zhí)行對距離近的多個(gè)向量分組以用一個(gè)代表性向量代表所分組的向量的處理,以在檢索時(shí)第一次計(jì)算輸入向量和代表性向量之間的距離,以僅對于該組中距離近的向量進(jìn)行組內(nèi)所有向量的比較,從而允許以高速執(zhí)行近似(類似)向量檢索,并具有用多維反映向量失真的能力。
而且,在日本專利公開號2001-134573中提出了一種技術(shù),其中對向量編碼以用短碼索引它們,從而抑制距離計(jì)算次數(shù)的增加,以允許高速近似(類似)數(shù)據(jù)檢索。
然而,在上述日本專利公開號H08-123460描述的技術(shù)中,存在以下問題,即在登記時(shí)需要對代表性向量的合適分組和選擇,從而登記操作變得麻煩。而且,還存在問題,即因?yàn)樵跈z索時(shí)不限制,例如與輸入向量距離最近的登記向量屬于與輸入向量距離最近的代表性向量所代表的組,所以確定將要檢索的組的操作變得麻煩。
而且,在上述日本專利公開號2001-134573描述的技術(shù)中,存在以下問題,即當(dāng)執(zhí)行編碼時(shí)丟失了向量之間的距離關(guān)系,或?qū)е路翘砑踊蚍菃握{(diào)方式的復(fù)雜的距離關(guān)系,使得登記和/或檢索機(jī)構(gòu)變得麻煩。
這里,由于圖像和/或聲音實(shí)質(zhì)上是時(shí)序的,所以需要基于實(shí)時(shí)進(jìn)行登記,并需要在檢索時(shí)反映出時(shí)間順序。換言之,存在這種技術(shù)的例子,即在上述日本專利公開號H08-123460和日本專利公開號2001-134573描述的技術(shù)不適于時(shí)序數(shù)據(jù)的檢索的情況下,需要登記操作以交換時(shí)序,和/或需要對在登記時(shí)已登記數(shù)據(jù)的數(shù)據(jù)或索引進(jìn)行再分配(改組)。
也就是說,需要這樣的機(jī)構(gòu),能以遠(yuǎn)遠(yuǎn)短于全搜索的時(shí)間執(zhí)行檢索,同時(shí)滿足以下條件(a)不丟失關(guān)于全搜索失真的結(jié)構(gòu)簡單性和魯棒性,(b)實(shí)時(shí)進(jìn)行登記和/或刪除,和(c)登記或刪除不需要對于其他已登記數(shù)據(jù)的操作。
發(fā)明內(nèi)容
考慮到這樣的傳統(tǒng)實(shí)際情況而提出了本發(fā)明,并且其目的是提供當(dāng)滿足上述條件時(shí),以高速執(zhí)行兩個(gè)向量之間的模式匹配的一種近似性計(jì)算方法和一種近似性計(jì)算設(shè)備,以及允許計(jì)算機(jī)執(zhí)行該近似性計(jì)算處理的程序、和記錄有該程序的計(jì)算機(jī)可讀記錄介質(zhì)。
為了達(dá)到上述目的,根據(jù)本發(fā)明的近似性計(jì)算方法針對一種確定兩個(gè)輸入向量之間的近似性的近似性計(jì)算方法,并包括分級距離計(jì)算步驟,用于以分級方式執(zhí)行所述兩個(gè)輸入向量之間的距離計(jì)算;閾值比較步驟,用于將在該分級距離計(jì)算步驟的各級所計(jì)算的距離的積分值與預(yù)先設(shè)置的閾值進(jìn)行比較;控制步驟,用于根據(jù)該閾值比較步驟的比較結(jié)果而控制在該分級距離計(jì)算步驟的距離計(jì)算;和輸出步驟,用于輸出直至最后一級計(jì)算的距離的積分值作為該近似性,其中,在該控制步驟,在閾值比較步驟中直至某一級所計(jì)算的距離的積分值高于該閾值的情況下,進(jìn)行控制使得舍位該距離計(jì)算。
在該近似性計(jì)算方法中,以分級方式執(zhí)行兩個(gè)向量之間的距離計(jì)算,從而在直至某一級所計(jì)算的距離的積分值高于預(yù)定閾值的情況下,僅檢測距離的積分值高于該閾值而不計(jì)算實(shí)際距離,以從而允許以高速執(zhí)行操作。
而且,該近似性計(jì)算方法還包括變換步驟,用于對所述兩個(gè)輸入向量進(jìn)行預(yù)定變換操作。在這種情況下,在該分級距離計(jì)算步驟,基于預(yù)定變換操作、按照預(yù)定次序執(zhí)行在該變換步驟所變換的兩個(gè)輸入向量之間的距離計(jì)算。這里,該預(yù)定變換操作是例如根據(jù)各分量的離差幅度對構(gòu)成輸入向量的各分量的次序執(zhí)行排序的變換、離散余弦變換、離散傅立葉變換、Walsh-Hadamard變換或Karhunen-Lueve變換。
而且,該近似性計(jì)算方法可包括分離步驟,用于以預(yù)定次序取出構(gòu)成在該變換步驟所變換的兩個(gè)輸入向量的各分量,以將它們分離為分級的多個(gè)局部向量。在這種情況下,在該分級距離計(jì)算步驟,按照從最高級的局部向量的次序、以分級方式執(zhí)行構(gòu)成局部向量的各分量之間的距離計(jì)算,從而在構(gòu)成直至某一級的局部向量的所有分量之間的計(jì)算距離的積分值低于該閾值的情況下,執(zhí)行構(gòu)成較低一級的局部向量的各分量之間的距離計(jì)算。
而且,為了達(dá)到上述目的,根據(jù)本發(fā)明的近似性計(jì)算設(shè)備針對一種確定兩個(gè)輸入向量之間的近似性的近似性計(jì)算設(shè)備,并包括分級距離計(jì)算裝置,用于以分級方式執(zhí)行所述兩個(gè)輸入向量之間的距離計(jì)算;閾值比較裝置,用于將該分級距離計(jì)算裝置在各級所計(jì)算的距離的積分值與預(yù)先設(shè)置的閾值進(jìn)行比較;控制裝置,用于根據(jù)該閾值比較裝置的比較結(jié)果而控制該分級距離計(jì)算裝置的距離計(jì)算;和輸出裝置,用于輸出直至最后一級所計(jì)算的距離的積分值作為該近似性,其中該控制裝置進(jìn)行控制,使得在該閾值比較裝置的比較結(jié)果是直至某一級所計(jì)算的距離的積分值高于該閾值的情況下,中斷(舍位)距離計(jì)算。
該近似計(jì)算設(shè)備以分級方式執(zhí)行兩個(gè)向量之間的距離計(jì)算,從而在直至某一級所計(jì)算的距離的積分值高于預(yù)定閾值的情況下,僅檢測距離的積分值是該閾值或更大而不計(jì)算實(shí)際距離,以從而允許以高速進(jìn)行操作。
而且,該近似性計(jì)算設(shè)備還包括變換裝置,用于對所述兩個(gè)輸入向量進(jìn)行預(yù)定變換操作。在這種情況下,該分級距離計(jì)算裝置基于預(yù)定變換操作、按照預(yù)定次序執(zhí)行由該變換裝置所變換的兩個(gè)輸入向量之間的距離計(jì)算。這里,該預(yù)定變換操作是例如根據(jù)各分量的離差幅度對構(gòu)成輸入向量的各分量的次序執(zhí)行排序的變換、離散余弦變換、離散傅立葉變換、Walsh-Hadamard變換或Karhunen-Lueve變換。
而且,該近似性計(jì)算設(shè)備可包括分離裝置,用于以預(yù)定次序取出構(gòu)成由該變換裝置所變換的兩個(gè)輸入向量的各分量,以將它們分離為分級的多個(gè)局部向量。在這種情況下,該分級距離計(jì)算裝置按照從最高級的局部向量的次序、以分級方式執(zhí)行構(gòu)成局部向量的各分量之間的距離計(jì)算,從而在構(gòu)成直至某一級的局部向量的所有分量之間所計(jì)算的計(jì)算距離的積分值低于該閾值的情況下,執(zhí)行構(gòu)成較低一級的局部向量的各分量之間的距離計(jì)算。
另外,根據(jù)本發(fā)明的程序允許計(jì)算機(jī)執(zhí)行上述近似性計(jì)算處理,而根據(jù)本發(fā)明的記錄介質(zhì)是記錄有該程序的計(jì)算機(jī)可讀記錄介質(zhì)。
通過對下面給出的實(shí)施例的描述,本發(fā)明的其他目的和本發(fā)明獲得的實(shí)際優(yōu)點(diǎn)將變得更加清楚。
圖1是用于解釋第一實(shí)施例的近似向量檢測設(shè)備的配置的輪廓的視圖。
圖2是解釋該近似向量檢測設(shè)備中向量登記時(shí)的處理的流程圖。
圖3是解釋該近似向量檢測設(shè)備中向量檢索時(shí)的處理的流程圖。
圖4是直觀解釋第一實(shí)施例中的處理的視圖。
圖5是示出了特征空間內(nèi)的向量分布存在偏離的例子的視圖。
圖6是用于解釋第二實(shí)施例中近似向量檢測設(shè)備的配置的輪廓的視圖。
圖7是解釋該近似向量檢測設(shè)備中向量登記時(shí)的處理的流程圖。
圖8是解釋該近似向量檢測設(shè)備中向量檢索時(shí)的處理的流程圖。
圖9是用于解釋第三實(shí)施例中近似向量檢測設(shè)備的配置的輪廓的視圖。
圖10是解釋該近似向量檢測設(shè)備中向量登記時(shí)的處理的流程圖。
圖11是解釋該近似向量檢測設(shè)備中向量檢索時(shí)的處理的流程圖。
圖12是解釋用于從聲學(xué)信號中提取聲學(xué)特征向量處理的例子的流程圖。
圖13是解釋用于從聲學(xué)信號中提取聲學(xué)特征向量的處理的例子的視圖。
圖14是解釋聲學(xué)信號的變換編碼的視圖。
圖15是解釋用于從編碼的聲學(xué)信號中提取聲學(xué)特征向量的處理的例子的流程圖。
圖16是解釋用于從編碼的聲學(xué)信號中提取聲學(xué)特征向量的處理的例子的視圖。
圖17是解釋用于從視頻信號中提取圖像特征向量的處理的一個(gè)例子的流程圖。
圖18是解釋用于從視頻信號中提取圖像特征向量的處理的一個(gè)例子的視圖。
圖19是解釋用于從視頻信號中提取圖像特征向量的處理的另一個(gè)例子的流程圖。
圖20是解釋用于從視頻信號中提取圖像特征向量的處理的另一個(gè)例子的視圖。
圖21是解釋用于從編碼的視頻信號中提取圖像特征向量的處理的另一個(gè)例子的流程圖。
圖22是解釋用于從編碼的視頻信號中提取圖像特征向量的處理的另一個(gè)例子的視圖。
具體實(shí)施例方式
下面將參考附圖結(jié)合應(yīng)用本發(fā)明的實(shí)際實(shí)施例而給出詳細(xì)解釋。在該實(shí)施例中,本發(fā)明應(yīng)用了一種近似向量檢測方法及其設(shè)備,用于以高速從多個(gè)登記向量中檢測與輸入向量相似的向量。
具體說,在該實(shí)施例的近似向量檢測方法及其設(shè)備中,在計(jì)算兩個(gè)向量之間的距離時(shí),采用了一種方案,當(dāng)對應(yīng)距離低于預(yù)定閾值時(shí)計(jì)算距離,而當(dāng)對應(yīng)距離高于該預(yù)定值時(shí)僅檢測對應(yīng)距離大于閾值而無需計(jì)算實(shí)際距離,從而允許以高速進(jìn)行近似向量檢測的操作。應(yīng)注意在該實(shí)施例的近似向量檢測設(shè)備中,在距離大于閾值的情況下,為方便起見,假設(shè)將輸出-1。
以下,由下列公式表示用于計(jì)算距離的兩個(gè)向量f和g。
f=(f[1],f[2],...,f[N])t…(1)g=(g[1],g[2],...,g[N])t…(2)這里,在公式(1)中,f[1],f[2],...表示向量f的各分量。在公式(2)中,g[1],g[2],...表示向量g的各分量。另外,t表示移項(xiàng),而N表示向量的維數(shù)。
(1)第一實(shí)施例圖1示出了第一實(shí)施例中近似向量檢測設(shè)備的配置的略圖。如圖1所示,該近似向量檢測設(shè)備1用于輸入向量f和向量g,并輸出向量(或-1)之間的平方距離,并且該近似向量檢測設(shè)備1由記錄單元10、分級距離計(jì)算單元11、和閾值判斷單元12組成。
將通過利用圖2的流程圖解釋在該近似向量檢測設(shè)備1中的登記時(shí)的處理。首先,在步驟S1,記錄單元10(圖1)預(yù)先輸入登記的向量g。一般來說,向量g是復(fù)數(shù),并在很多情況下將變?yōu)樘貏e大的數(shù)。而且,在接下來的步驟S2,記錄單元10記錄輸入的向量g。
如上所述,在該第一實(shí)施例中,由于在登記時(shí)不必要進(jìn)行特殊的操作,所以該設(shè)備簡單并適于基于實(shí)時(shí)的處理。在該例子中,該記錄單元10是例如磁盤、光盤或半導(dǎo)體存儲器等。
隨后,將通過利用圖3的流程圖解釋在該近似向量檢測設(shè)備1中的檢索時(shí)的處理。首先,在步驟S10,閾值判斷單元12(圖1)設(shè)置距離的閾值S。在隨后的步驟S11,該分級距離計(jì)算單元11輸入向量f,并獲取在記錄單元10中記錄的一個(gè)向量g。
隨后,在步驟S12,該分級距離計(jì)算單元11將用作內(nèi)部變量的分量編號i設(shè)置為1,并將距離的積分值sum(和)設(shè)置為0。在步驟S13,在向量f的第i個(gè)分量f[i]和向量g的第i個(gè)分量g[i]之間執(zhí)行如以下公式(3)所示的積分操作。
sum=sum+(f[i]-g[i])2…(3)在步驟S14,該閾值判斷單元12辨別積分值sum是否小于閾值S。在積分值sum小于閾值S的情況下(是),處理進(jìn)行到步驟S16。在積分值sum是閾值S或更大的情況下(否),該閾值判斷單元12在步驟S15輸出-1以完成處理。這里,如上所述,輸出的-1是表示輸入向量f和獲取向量g之間的距離高于閾值S的合適數(shù)值,而向量g無效。如上所述,在積分操作的中間級,積分值sum高于該閾值S的情況下,閾值判斷單元12提供閾值S并在分級距離計(jì)算單元11進(jìn)行舍位(truncate)積分操作,以從而實(shí)現(xiàn)高速處理。
在步驟S16,辨別分量號i是否是向量f或向量g的維數(shù)N或更小。在分量號i是N或更小的情況下(是),在步驟S17中i被遞增以返回步驟S13。另一方面,在分量號i大于N的情況下(否),因?yàn)橐淹瓿闪朔e分操作,所以該閾值判斷單元12在步驟S18輸出積分值sum,直至向量f或向量g的最后一個(gè)分量,以完成處理。應(yīng)注意此時(shí)的積分值sum是向量之間距離的平方。
盡管在圖3的流程圖中已表示了對于一個(gè)登記向量g的處理,實(shí)際上執(zhí)行對于登記的所有向量g的近似處理,以輸出作為與向量f相似的向量的所有向量g,其中與向量f的距離的積分值sum低于閾值S。
當(dāng)直觀解釋上述第一實(shí)施例中的處理時(shí),該處理對應(yīng)于以下處理僅計(jì)算關(guān)于登記的向量的精確距離,其中圖4中由圖中的×表示的輸入向量與多個(gè)由黑圓圈表示的登記向量的距離在半徑為 的大球的范圍內(nèi),并當(dāng)每個(gè)軸的距離的積分值高于半徑時(shí),無效在該時(shí)間點(diǎn)不在該范圍內(nèi)的登記向量。
應(yīng)注意盡管在上述說明中使用了向量之間的平方距離,但也可使用關(guān)于任意距離的近似技術(shù)而不限于平方距離。應(yīng)注意在使用平方距離的情況下,不可能因?yàn)榉e分值sum相對于各分量之間的距離的積分值單調(diào)增加,而引起錯(cuò)誤無效發(fā)生。而且,由于各分量之間的距離的總和與向量之間的距離一致,所以關(guān)于向量f和g輸出與簡單全搜索方法完全相同的距離,其中距離是閾值 或更小,從而不可能發(fā)生錯(cuò)誤。
而且,在這種技術(shù)的情況下,由于不必要準(zhǔn)備會破壞時(shí)序關(guān)系的參考表等,所以可根據(jù)時(shí)序順序進(jìn)行數(shù)據(jù)的更新和/或刪除,從而處理和/或管理簡單。另外,也很可能根據(jù)時(shí)序順序容易地進(jìn)行檢索,或指定將要檢索的時(shí)序范圍。
(2)第二實(shí)施例在上述第一實(shí)施例中,設(shè)置了距離的閾值S,從而可能以高速進(jìn)行與全搜索等效的檢索。然而,在這種技術(shù)的情況下,由于從何處開始向量分量的檢索取決于向量的排列川頁序,該排列川頁序?qū)е聶z索速度的不同。例如在圖5所示的特征空間內(nèi)的向量分布存在偏離的情況下,依據(jù)f[1]軸或f[2]軸中的哪一個(gè)被首先積分,檢索速度將顯著改變。在這個(gè)例子中,采用首先評估f[2]軸的方法導(dǎo)致較小的額外積分,從而實(shí)現(xiàn)高速操作。
考慮到以上,在下面將描述的第二實(shí)施例中,如下列公式(4)和(5)所示,對于輸入向量f和登記向量g進(jìn)行普通正交變換矩陣U的相乘,以執(zhí)行正交變換操作,以通過使用正交變換向量f’和g’而按照有效位的順序進(jìn)行檢索,從而允許以高速進(jìn)行檢索。
f’=Uf…(4)g’=Ug…(5)應(yīng)注意如以下公式(6)所示,普通正交變換矩陣U不改變兩個(gè)向量g和f之間的平方距離d2。
d2=‖f’-g’‖2=‖U(f-g)‖2=(f-g)tUtU(f-g)=(f-g)t(f-g)=‖f-g‖2…(6)圖6中示出了第二實(shí)施例中近似向量檢測設(shè)備的配置的略圖。如圖6所示,該近似向量檢測設(shè)備2用于輸入向量f和g,并輸出向量之間的距離(或-1),并且該近似向量檢測設(shè)備2由向量變換單元20和21、記錄單元22、分級距離計(jì)算單元23、和閾值判斷單元24組成。這里,所述向量變換單元20和21分別用于實(shí)現(xiàn)向量g和f的近似變換操作。另外,該記錄單元22是例如磁盤、光盤或半導(dǎo)體存儲器等。
將通過利用圖7的流程圖解釋該近似向量檢測設(shè)備2中登記時(shí)的處理。首先,在步驟S20,該向量變換單元20(圖6)預(yù)先輸入登記的向量g。在隨后的步驟S21,如上述公式(5)所示變換向量g以產(chǎn)生向量g’。而且,在步驟S22,該記錄單元10記錄變換的向量g’。
接下來,將通過利用圖8的流程圖解釋該近似向量檢測設(shè)備2中檢索時(shí)的處理。首先,在步驟S30,該閾值判斷單元24(圖6)設(shè)置距離的閾值S。在隨后的步驟S31,該向量變換單元21輸入向量f,并且該分級距離計(jì)算單元23獲取在該記錄單元22中記錄的一個(gè)向量g’。
隨后,在步驟S32,該向量變換單元21如上述公式(4)所示變換向量f,以產(chǎn)生向量f’。
在步驟S33,該分級距離計(jì)算單元23將用作內(nèi)部變量的分量號i設(shè)置為1,并將距離的積分值sum設(shè)置為0。在步驟S34,在向量f’的第i個(gè)分量f’[i]和向量g’的第i個(gè)分量g’[i]之間執(zhí)行如以下公式(7)所示的積分操作。
sum=sum+(f’[i]-g’[i])2…(7)在步驟S35,該閾值判斷單元24辨別積分值sum是否小于閾值S。在積分值sum小于閾值S的情況下(是),處理進(jìn)行到步驟S37。在積分值sum是閾值S或更大的情況下(否),該閾值判斷單元24在步驟S36輸出-1以完成處理。
在步驟S37,辨別分量號i是否是向量f’和向量g’的維數(shù)N或更小。在分量號i是N或更小的情況下(是),在步驟S38中i被遞增以返回步驟S34。另一方面,在分量號i大于N的情況下(否),因?yàn)橐淹瓿闪朔e分操作,所以該閾值判斷單元24在步驟S39輸出積分值sum直至向量f’和向量g’的最后一個(gè)分量,以完成處理。應(yīng)注意此時(shí)的積分值sum是向量之間距離的平方。
盡管在圖8的流程圖中已表示了對于一個(gè)登記向量g’的處理,實(shí)際上可采用以下方案,即執(zhí)行對于登記的所有向量g’的近似處理,以輸出作為與向量f’相似的向量的所有向量g’,其中與向量f’的距離的積分值sum低于閾值S。
這里,盡管各種矩陣可用作上述普通正交變換矩陣U,但下面將通過實(shí)際上的四個(gè)例子來給出解釋。
(2-1)正交變換的實(shí)際例子(2-1-1)順序(sequential)矩陣被稱為最簡單的正交變換。在該順序矩陣中,向量分量的階次經(jīng)過簡單的排序。例如,用以下公式(8)所示的形式表達(dá)八階順序矩陣P。
P=0100000010000000000100000010000000000100000010000000000100000010---(8)]]>在各向量的分量的分布與上述圖5的情況不一樣的情況下,很顯然分量的離差越大,距離的分布越大。因此,在確定排序順序時(shí),最適宜預(yù)先準(zhǔn)備采樣(sample)向量gi的足夠數(shù)目(I),以設(shè)置按以下公式(9)計(jì)算的離差向量V的幅度順序排列的順序矩陣。
V=Σi=1I(gi-g‾)2,g‾=1IΣigi---(9)]]>應(yīng)注意在擴(kuò)展各向量分量的方式不同的情況下,利用該順序矩陣的正交變換是有效的,并由于其足夠執(zhí)行排序所以速度高,從而不必要進(jìn)行乘/除和/或條件跳變。
(2-1-2)在相鄰分量之間的相關(guān)關(guān)系大的特征量,例如圖像特征量或聲學(xué)特征量中,在特征向量被視為離散信號時(shí),能量偏離到較低頻率分量。
考慮到以上,由以下公式(10)、(11)表示的離散余弦變換(DCT)和由以下公式(12)、(13)表示的離散傅里葉變換(DFT)被用作正交變換,以按照從低頻率分量開始的順序進(jìn)行積分,從而可能按照從高有效位分量開始的順序進(jìn)行積分。因而,以高速進(jìn)行距離計(jì)算。
D=D11···D1N·········DN1···DNN---(10)]]> F=F11···F1N·········FN1···FNN---(12)]]> 這里,由于高速變換方法可用于離散余弦變換或離散傅里葉變換,并由于不必要保持所有變換矩陣,所以在計(jì)算機(jī)實(shí)現(xiàn)操作的情況下,與執(zhí)行所有矩陣計(jì)算的情況相比,存儲器使用量和/或操作速度很有利。
(2-1-3)
Walsh-Hadamard(沃爾什-哈德瑪?shù)?變換是僅由±1構(gòu)成變換矩陣的各元素的正交變換,并因?yàn)樵谧儞Q時(shí)不需要乘法,所以適于高速變換。這里,將順序用作與頻率相近的概念,并按照從低頻開始的階次排列分量,從而可實(shí)現(xiàn)高速的向量距離計(jì)算,其中相鄰分量之間的相關(guān)關(guān)系與上述離散余弦變換或離散傅里葉變換很近似。
根據(jù)傅里葉變換矩陣的代碼組成該Walsh-Hadmard變換矩陣,或由矩陣的遞歸擴(kuò)展操作組成該Walsh-Hadmard變換矩陣。作為一個(gè)例子,以下公式(14)示出了按順序的階次排列的八階Walsh-Hadmard變換矩陣W。
W=18111111111111-1-1-1-111-1-1-1-11111-1-111-1-11-1-111-1-111-1-11-111-11-11-1-11-111-11-11-11-1---(14)]]>(2-1-4)在預(yù)先收集足夠數(shù)目采樣向量,且變換操作需要一定數(shù)量成本的情況下,將Karhunen-Loeve(卡胡恩-勞亦夫)變換(以下稱為KL變換)用作正交變換是有效的。
該KL變換矩陣T是本征矩陣,其中采樣向量的離差矩陣V分解為本征值,并在本征值假設(shè)為λ1,...λN的情況下,被定義為如以下公式(15)所示。
V=TtΛT,Λ=diag{λ1,λ2,...,λN}…(15)這里,該KL變換是完全去除各個(gè)分量之間的相關(guān)關(guān)系的正交變換矩陣,并且變換向量分量的離差導(dǎo)致本征值λi。因此構(gòu)成該KL變換矩陣T使得按幅度的階次安排本征值λi,以從而積分所有分量,去除重疊信息,此后具有執(zhí)行到離差最大的軸的距離的積分的能力。
應(yīng)注意在利用該KL變換的技術(shù)中,由于操作時(shí)原則上必須保持整個(gè)維數(shù)上的KL變換矩陣T,并由于必須對于所有變量執(zhí)行所有階次的矩陣操作,所以操作成本高。然而,由于在登記時(shí)執(zhí)行該操作,所以不能說需要高速的檢索處理所需的時(shí)間顯著增加了。
另外,盡管伴隨了精度的輕微降級,但采用了一種方案,僅提取具有大本征值的向量分量,以保持它們而不保持具有小本征值的向量分量,以從而壓縮向量本身,也因此可能降低記錄單元22的存儲區(qū)域和/或數(shù)據(jù)讀入時(shí)間(圖6)。
(3)第三實(shí)施例盡管上述第一和第二實(shí)施例中距離計(jì)算的高速實(shí)現(xiàn)可以高速進(jìn)行檢索操作,但從記錄單元,例如硬盤等的數(shù)據(jù)讀入時(shí)間也導(dǎo)致執(zhí)行檢索中的大開銷。
這里,上述第二實(shí)施例中的KL變換對應(yīng)于多元分析領(lǐng)域中稱為主分量分析的分析方法,并且該KL變換是提取組成向量的主分量的操作??紤]到以上,在下面將解釋的第三實(shí)施例中,將第二實(shí)施例中獲得的變換向量g’的主分量記錄為索引向量g1,并將剩余分量記錄為細(xì)節(jié)分量g2。在檢索時(shí),僅在結(jié)果小于閾值S的情況下,首先執(zhí)行關(guān)于索引向量g1的距離計(jì)算以獲取細(xì)節(jié)分量g2,以進(jìn)一步執(zhí)行距離計(jì)算,從而可能縮短數(shù)據(jù)讀入時(shí)間。
圖9中示出了第三實(shí)施例中近似向量檢測設(shè)備的配置的略圖。如圖9所示,該近似向量檢測設(shè)備3輸入向量f和向量g,并輸出向量之間的平方距離(或-1),并且該近似向量檢測設(shè)備3由向量變換單元30和31、索引記錄單元32、細(xì)節(jié)記錄單元33、分級距離計(jì)算單元34、和閾值判斷單元35組成。這里,所述向量變換單元30和31對向量g和f分別執(zhí)行與上述第二實(shí)施例相似的變換操作。另外,所述索引記錄單元32和細(xì)節(jié)記錄單元33是例如磁盤、光盤或半導(dǎo)體存儲器等。
將通過利用圖10的流程圖解釋在該近似向量檢測設(shè)備3中的登記時(shí)的處理。首先,在步驟S40,向量變換單元30(圖9)預(yù)先輸入登記的向量g。在接下來的步驟S41,按上述公式(5)所示變換向量g以產(chǎn)生向量g’。而且,該向量變換單元30將其分為具有預(yù)定數(shù)目M(1≤M≤N)個(gè)分量的索引向量g1和具有剩余分量的細(xì)節(jié)向量g2,所述剩余分量按照具有小分量號的分量的順序,即具有上述變換操作中的大離差或本征值的分量或低頻分量。而且,在步驟S42,該索引記錄單元32記錄索引向量g1。在步驟S43,該細(xì)節(jié)記錄單元33記錄細(xì)節(jié)向量g2。
接下來,將通過利用圖11的流程圖解釋在該近似向量檢測設(shè)備3中的檢索時(shí)的處理。首先,在步驟S50,該閾值判斷單元35(圖9)設(shè)置距離的閾值S。在隨后的步驟S51,該向量變換單元31輸入向量f,而該分級距離計(jì)算單元34獲取在索引記錄單元32中記錄的一個(gè)索引向量g1。
隨后,在步驟S52,該向量變換單元31按上述公式(4)所示變換向量f以產(chǎn)生向量f’。而且,該向量變換單元31將其分為具有預(yù)定數(shù)目M(1≤M≤N)個(gè)分量的索引向量f1和具有剩余分量的細(xì)節(jié)向量f2,所述剩余分量按照具有小分量號的分量的順序。
在步驟S53,該分級距離計(jì)算單元34將用作內(nèi)部變量的分量號i設(shè)置為1,并將距離的積分值sum設(shè)置為0。在步驟S54,在向量f’的第i個(gè)分量f’[i]和向量g’的第i個(gè)分量g’[i]之間執(zhí)行如以下公式(16)所示的積分操作。
sum=sum(f’[i]-g’[i])2…(16)在步驟S55,該閾值判斷單元35辨別積分值sum是否小于閾值S。在積分值sum小于閾值S的情況下(是),處理進(jìn)行到步驟S57。在積分值sum是閾值S或更大的情況下(否),該閾值判斷單元35在步驟S56輸出-1以完成處理。這里,如上所述,輸出的-1是表示距離高于閾值使得其為零的合適數(shù)值。
在步驟S57,辨別分量號i是否是索引向量f1和索引向量g1的維數(shù)M或更小。在分量號i是M或更小的情況下(是),在步驟S58中i被遞增以返回步驟S54。另一方面,在分量號i大于M的情況下(否),該分級距離計(jì)算單元34獲取在該細(xì)節(jié)記錄單元33中記錄的一個(gè)細(xì)節(jié)向量g2。
在步驟S60,該分級距離計(jì)算單元34在向量f’的第i個(gè)分量f’[i]和向量g’的第i個(gè)分量g’[i]之間執(zhí)行如上述公式(16)所示的積分操作。
在步驟S61,該閾值判斷單元35辨別積分值sum是否小于閾值S。在積分值sum小于閾值S的情況下(是),處理進(jìn)行到步驟S63。在積分值sum是閾值S或更大的情況下(否),該閾值判斷單元35在步驟S62輸出-1以完成處理。
在步驟S63,辨別分量號i是否是向量f’或向量g’的維數(shù)N或更小。在分量號i是N或更小的情況下(是),在步驟S64中i被遞增以返回步驟S60。另一方面,在分量號i大于N的情況下(否),因?yàn)橐淹瓿闪朔e分操作,所以該閾值判斷單元35在步驟S65輸出積分值sum,直至向量g’的最后一個(gè)分量,以完成處理。應(yīng)注意此時(shí)的積分值sum導(dǎo)致向量之間距離的平方。
盡管在圖11的流程圖中已表示了對于一個(gè)登記向量g’的處理,實(shí)際上執(zhí)行對于登記的所有向量g’的近似處理,以輸出作為與向量f’相似的向量的所有向量g’,其中與向量f’的距離的積分值sum低于閾值S。
在上述第三實(shí)施例中,與第一和第二實(shí)施例相比,存儲容量和/或精度沒有改變,而操作速度幾乎未改變。然而,在索引向量g1的階段大多數(shù)比較被無效使得不必獲取細(xì)節(jié)向量g2的情況下,消除了數(shù)據(jù)存取的開銷。
盡管在上述解釋中假設(shè)向量被分為索引向量和細(xì)節(jié)向量兩階段,但問題是可對多階段作出擴(kuò)展,例如索引向量還被近似分為高階的索引向量和細(xì)節(jié)索引向量,從而提供了三級配置。
(4)提取特征向量下面將給出關(guān)于從聲學(xué)信號或視頻信號中提取特征向量的解釋。以下述方式,提取聲學(xué)特征向量和/或圖像特征向量以將它們用作上述向量f和g,從而可能在輸入聲學(xué)信號或視頻信號的情況下,通過利用上述第一到第三實(shí)施例的技術(shù)以高速從登記的聲學(xué)信號或視頻信號中檢索近似的聲學(xué)或視頻信號。
(4-1)聲學(xué)特征向量的提取(4-1-1)將通過結(jié)合將功率譜系數(shù)用作與聲學(xué)信號相關(guān)的特征量的例子、并利用圖12和13的流程圖給出解釋。首先,在步驟S70,如圖13所示,從目標(biāo)時(shí)間周期內(nèi)的聲學(xué)信號獲取關(guān)于每一時(shí)間周期T的聲學(xué)信號。
隨后,在步驟S71,對獲取的聲學(xué)信號實(shí)現(xiàn)頻譜操作,例如高速傅立葉變換,以確定關(guān)于每一短時(shí)間周期的功率譜系數(shù)Sq(q=0,1,...,Q-1)。這里,q是代表離散頻率的索引,而Q是最大離散頻率。
隨后,在步驟S72,辨別是否完成了目標(biāo)時(shí)間周期內(nèi)的計(jì)算。在完成該計(jì)算的情況下(是),處理進(jìn)行到步驟S73。在沒有完成該計(jì)算的情況下(否),處理進(jìn)行到步驟S70。
在步驟S73,計(jì)算確定的功率譜系數(shù)Sq的平均頻譜S’q。在步驟S74,將該平均頻譜S’q改變?yōu)橄蛄恳援a(chǎn)生聲學(xué)特征向量a。由例如以下公式(17)代表該聲學(xué)特征向量a。
a=(S0,...,SQ-1)…(17)應(yīng)注意盡管在上述例子中給出解釋的前提是將目標(biāo)時(shí)間周期內(nèi)的聲學(xué)信號分成每一時(shí)間周期T,但在目標(biāo)時(shí)間周期短的情況下,可實(shí)現(xiàn)頻譜操作而無須分成每一時(shí)間周期T。
另外,盡管已在上述例子中解釋了利用功率譜系數(shù)的例子,但本發(fā)明不限于這種實(shí)現(xiàn),而也可以使用具有等同信息的倒頻譜系數(shù)等。而且,代替傅立葉變換,通過利用AR(自動(dòng)-回歸)模型的線性預(yù)測系數(shù)也可獲得相似效果。
(4-1-2)由于該聲學(xué)信號很大,所以存在很多例子,即這類信號在壓縮編碼之后被記錄或經(jīng)歷發(fā)送。盡管可能在將編碼的聲學(xué)信號解碼為基帶信號后利用上述技術(shù)提取聲學(xué)特征向量a,但如果只能通過部分解碼提取聲學(xué)特征向量a,則可以高速有效地進(jìn)行提取處理。
這里,在作為通常使用的編碼方法的變換編碼中,如圖14所示,將用作原始聲音的聲學(xué)信號分成關(guān)于每一時(shí)間周期T的許多幀。而且,對每一幀的聲學(xué)信號進(jìn)行例如修改離散余弦變換(MDCT)的正交變換等,并量化和編碼其系數(shù)。在該例子中,對于每一頻帶提取用作幅度的標(biāo)準(zhǔn)化系數(shù)的比例因子,并單獨(dú)編碼該比例因子??紤]到以上,通過僅解碼所述比例因子,它們可被用作聲學(xué)特征向量a。
將通過結(jié)合將比例因子用作與聲學(xué)信號相關(guān)的特征量的例子并利用圖15和16的流程圖給出解釋。首先,在步驟S80,獲取目標(biāo)時(shí)間周期的時(shí)間周期T內(nèi)的編碼聲學(xué)信號。在步驟S81,部分解碼每一幀的比例因子。
隨后,在步驟S82,辨別是否已完成目標(biāo)時(shí)間周期內(nèi)的解碼。在完成了該解碼的情況下(是),處理進(jìn)行到步驟S83。在沒有完成該解碼的情況下(否),處理返回到步驟S80。
在步驟S83,對于每一頻帶從目標(biāo)時(shí)間周期內(nèi)的比例因子中檢測最大比例因子。在步驟S84,這些比例因子被改變?yōu)橄蛄恳援a(chǎn)生聲學(xué)特征向量a。
以這種方式,可能以高速提取與以上等同的聲學(xué)特征向量a,而無須完全解碼編碼的聲學(xué)信號。
(4-2)圖像特征向量的提取(4-2-1)將通過結(jié)合將亮度信息和顏色信息用作與視頻信號相關(guān)的特征量的例子并利用圖17和18的流程圖給出解釋。首先,在步驟S90,如圖18所示,在目標(biāo)時(shí)間周期T內(nèi)從視頻信號獲取圖像幀。
隨后,在步驟S91,基于獲取的全部圖像幀而準(zhǔn)備時(shí)間平均圖像100。
隨后,在步驟S92,沿寬度和廣度方向?qū)?zhǔn)備的時(shí)間平均圖像100分成X×Y個(gè)小塊,以準(zhǔn)備其中平均了各塊內(nèi)的像素值的塊平均圖像110。
而且,在步驟S93,按R、G、B的順序排列這些小塊,例如從左上方向到右下方向,以產(chǎn)生一維圖像特征向量v。由例如以下公式(18)代表該圖像特征向量v。
v=(R00,...,RX-1,Y-1,G00,...,GX-1,Y-1,B00,...,BX-1,Y-1)…(18)應(yīng)注意已結(jié)合了重新排列分割時(shí)間平均圖像100的塊平均圖像110的像素值、以產(chǎn)生一維圖像特征向量v的例子在上述例子中給出了解釋,然而,本發(fā)明不限于這樣的實(shí)現(xiàn),而可采用以下方案,即重新排列時(shí)間平均圖像100的像素值而無需準(zhǔn)備該塊平均圖像110,以產(chǎn)生一維圖像特征向量v。
另外,由于在常態(tài)下視頻信號的時(shí)間改變不太迅速,所以也可能通過采用一種方案來獲得相同的效果/優(yōu)點(diǎn),即選擇目標(biāo)時(shí)間周期內(nèi)的一幀作為代表性圖像,而無需準(zhǔn)備該時(shí)間平均圖像100來替換它。
(4-2-2)即使在對應(yīng)視頻信號不是完全相同的視頻信號的情況下,仍有很多例子,即當(dāng)從新聞圖像的相同角度拍照的例如演播圖像等的所有圖像的顏色分布近似時(shí),存在圖像的某一關(guān)系。由此,需要在將這些圖像認(rèn)為是相同的情形下執(zhí)行檢索。在這一情況下,采用拒絕圖像的空間依賴性的方法以準(zhǔn)備顏色分布的直方圖進(jìn)行比較是有效的。
考慮到以上,將通過結(jié)合將顏色分布的直方圖以這種方式用作特征量的例子并利用圖19和20的流程圖給出解釋。首先,在步驟S100,如圖20所示,從目標(biāo)時(shí)間周期T內(nèi)的視頻信號獲取圖像幀。
隨后,在步驟S101,根據(jù)各圖像幀的信號值來準(zhǔn)備關(guān)于例如R、G、B的各種顏色的信號值的直方圖。
而且,在步驟S102,按例如R、G、B的順序排列這些顏色,以產(chǎn)生一維圖像特征向量v。由以下公式(19)代表該圖像特征向量v。
v=(R0,...,RN-1,G0,...,GN-1,B0,...,BN-1)…(19)應(yīng)注意盡管在準(zhǔn)備了R、G、B的信號值的直方圖的前提下,在上述例子中已給出了解釋,然而,即使在準(zhǔn)備了亮度(Y)和色差(Cb,Cr)的信號值的直方圖的情況下,也可能獲得相似的效果/優(yōu)點(diǎn)。
(4-2-3)由于視頻信號很大,所以存在很多例子,即這類信號在壓縮編碼之后被記錄或經(jīng)歷發(fā)送。盡管可能在采用將編碼的視頻信號解碼為基帶信號的方案之后利用上述技術(shù)提取圖像特征向量v,但如果僅通過部分解碼提取圖像特征向量v,也可以高速有效地進(jìn)行提取處理。
將結(jié)合通過MPEG1(活動(dòng)圖像專家組1)或MPEG2從壓縮編碼的視頻信號中提取圖像特征向量v的例子并利用圖21和22的流程圖給出解釋。首先,在步驟S110,獲取將被改變?yōu)橄蛄康?、與目標(biāo)時(shí)間周期T最近的編碼組(畫面組GOP)的編碼視頻信號,以獲取該GOP內(nèi)的幀內(nèi)編碼畫面(I畫面)。
這里,用宏塊MB(16×16像素,或8×8像素)作為單位對幀圖像進(jìn)行編碼,并使用離散余弦變換(DCT)。這些DC變換的DC系數(shù)對應(yīng)于宏塊內(nèi)圖像的像素值的平均值。
考慮到以上,在步驟S111,獲取這些DC系數(shù)。在隨后的步驟S112,按例如Y、Cb、Cr的順序安排這些系數(shù),以產(chǎn)生一維圖像特征向量v。由例如以下公式(20)代表該圖像特征向量v。
v=(Y00,...,YX-1,Y-1,Cb00,...,CbX-1,Y-1,Cr00,...,CrX-1,Y-1)…(20)以這種方式,可能以高速提取圖像特征向量v而無需完全解碼編碼的視頻信號。
應(yīng)注意盡管已在假設(shè)使用由MPEG1或MPEG2壓縮編碼的視頻信號的上述例子中給出了解釋,然而,本發(fā)明也可應(yīng)用到其他壓縮編碼系統(tǒng)。
(5)其他如上所述,根據(jù)該實(shí)施例,當(dāng)距離的積分值高于預(yù)先設(shè)置的距離的閾值時(shí),基于向量之間的距離對檢測類似(近似)向量執(zhí)行分級距離積分操作,以舍位距離積分操作,從而可能以高速檢測近似向量。具體說,在從大量登記向量中檢測與輸入向量近似的向量的情況下,由于多數(shù)登記向量不近似,使得距離的積分值高于閾值,因此可在早期階段舍位該距離計(jì)算。由此,可最大程度縮短檢測時(shí)間。
另外,通過預(yù)先對向量實(shí)行順序變換、離散余弦變換、離散傅立葉變換、Walsh-Hadamard變換或KL變換,以按照從具有高有效位的向量分量,即在上述變換操作中具有大離差或本征值的分量,的順序,或按照從低頻分量的順序,執(zhí)行積分操作,則可能考慮到向量分量的分布而有效高速地檢測近似向量。
因此,也在執(zhí)行聲學(xué)信號或視頻信號的檢索時(shí),預(yù)先提取聲學(xué)特征向量和/或圖像特征向量以登記由此提取的向量,從而在輸入任意聲學(xué)信號或視頻信號的情況下,可以高速檢索近似聲學(xué)或視頻信號,并同時(shí)保持與全搜索近似的結(jié)構(gòu)簡單性和/或檢索精度。
盡管已根據(jù)在附圖中示出的和在以上說明中詳細(xì)描述的特定實(shí)施例描述了本發(fā)明,但本領(lǐng)域普通技術(shù)人員應(yīng)明白本發(fā)明不限于這些實(shí)施例,在不脫離所附權(quán)利要求限定的本發(fā)明的范圍和精神的情況下,可實(shí)現(xiàn)各種修改、替換實(shí)施例或等同方式。
例如,盡管在上述實(shí)施例中將本發(fā)明解釋為硬件配置,但本發(fā)明不限于這種實(shí)現(xiàn)實(shí)現(xiàn),通過允許CPU(中央處理單元)執(zhí)行計(jì)算機(jī)程序也可實(shí)現(xiàn)任意處理。在這種情況下,計(jì)算機(jī)程序可記錄在記錄介質(zhì)上,或通過例如因特網(wǎng)的其他傳輸介質(zhì)而經(jīng)受傳輸。
工業(yè)實(shí)用性根據(jù)上述本發(fā)明,采用了以分級方式執(zhí)行兩個(gè)向量之間的距離計(jì)算的方案,從而在最高至某一等級所計(jì)算的距離的積分值高于預(yù)定閾值的情況下,僅檢測距離的積分值是閾值或更大,而無需計(jì)算實(shí)際距離,從而允許以高速進(jìn)行操作。具體說,在從大量登記向量中檢測與輸入向量近似的向量的情況下,由于大多數(shù)登記向量不近似,并由此距離的積分值高于閾值,所以可在早期階段對距離計(jì)算進(jìn)行舍位。所以,可最大程度縮短檢測時(shí)間。
權(quán)利要求
1.一種確定兩個(gè)輸入向量之間的近似性的近似性計(jì)算方法,包括分級距離計(jì)算步驟,用于以分級方式執(zhí)行所述兩個(gè)輸入向量之間的距離計(jì)算,閾值比較步驟,用于將在該分級距離計(jì)算步驟的各級所計(jì)算的距離的積分值與預(yù)先設(shè)置的閾值進(jìn)行比較,控制步驟,用于根據(jù)該閾值比較步驟的比較結(jié)果而控制在該分級距離計(jì)算步驟的距離計(jì)算,和輸出步驟,用于輸出直至最后一級的計(jì)算距離的積分值,作為該近似性,其中,在該控制步驟進(jìn)行控制,使得在直至某一級別所計(jì)算的距離的積分值高于閾值的情況下,對該距離計(jì)算進(jìn)行舍位。
2.根據(jù)權(quán)利要求1的近似性計(jì)算方法,其中在該分級距離計(jì)算步驟以分級方式執(zhí)行構(gòu)成所述兩個(gè)輸入向量的各分量之間的距離計(jì)算,從而在直至某一級別所計(jì)算的距離的積分值低于該閾值的情況下,執(zhí)行隨后分量之間的距離計(jì)算。
3.根據(jù)權(quán)利要求2的近似性計(jì)算方法,還包括變換步驟,用于對所述兩個(gè)輸入向量進(jìn)行預(yù)定變換操作,其中在該分級距離計(jì)算步驟,基于預(yù)定變換操作、按照預(yù)定次序執(zhí)行在該變換步驟所變換的兩個(gè)輸入向量之間的距離計(jì)算。
4.根據(jù)權(quán)利要求3的近似性計(jì)算方法,其中該預(yù)定變換操作是根據(jù)各分量的離差幅度對構(gòu)成所述兩個(gè)輸入向量的各分量的次序執(zhí)行排序的變換操作,并且其中在該分級距離計(jì)算步驟,按照從大離差的分量的次序執(zhí)行在該變換步驟所變換的兩個(gè)輸入向量之間的距離計(jì)算。
5.根據(jù)權(quán)利要求3的近似性計(jì)算方法,其中該預(yù)定變換操作是離散余弦變換操作或離散傅立葉變換操作,并且其中在該分級距離計(jì)算步驟,按照從低頻分量的次序執(zhí)行在該變換步驟所變換的兩個(gè)輸入向量之間的距離計(jì)算。
6.根據(jù)權(quán)利要求3的近似性計(jì)算方法,其中該預(yù)定變換操作是Walsh-Hadamard變換操作,并且其中在該分級距離計(jì)算步驟,按照從低頻分量的次序執(zhí)行在該變換步驟所變換的兩個(gè)輸入向量之間的距離計(jì)算。
7.根據(jù)權(quán)利要求3的近似性計(jì)算方法,其中該預(yù)定變換操作是Karhunen-Loeve變換操作,并且其中在該分級距離計(jì)算步驟,按照從大本征值的分量的次序執(zhí)行在該變換步驟所變換的兩個(gè)輸入向量之間的距離計(jì)算。
8.根據(jù)權(quán)利要求3的近似性計(jì)算方法,還包括分離步驟,用于以預(yù)定次序取出構(gòu)成在該變換步驟所變換的兩個(gè)輸入向量的各分量,以將它們分離為分級的多個(gè)局部向量,其中在該分級距離計(jì)算步驟,按照從最高級的局部向量的次序、以分級方式執(zhí)行構(gòu)成局部向量的各分量之間的距離計(jì)算,從而在直至某一級構(gòu)成局部向量的所有分量之間的計(jì)算距離的積分值低于該閾值的情況下,執(zhí)行構(gòu)成較低一級的局部向量的各分量之間的距離計(jì)算。
9.根據(jù)權(quán)利要求1的近似性計(jì)算方法,其中通過將聲學(xué)信號改變?yōu)樘卣飨蛄慷@得該輸入向量,并且其中通過將該聲學(xué)信號的預(yù)定時(shí)間周期內(nèi)的功率譜系數(shù)改變?yōu)橄蛄慷@得該特征向量。
10.根據(jù)權(quán)利要求1的近似性計(jì)算方法,其中通過將聲學(xué)信號改變?yōu)樘卣飨蛄慷@得該輸入向量,并且其中通過將該聲學(xué)信號的預(yù)定時(shí)間周期內(nèi)的線性預(yù)測系數(shù)改變?yōu)橄蛄慷@得該特征向量。
11.根據(jù)權(quán)利要求1的近似性計(jì)算方法,其中通過將編碼的聲學(xué)信號改變?yōu)樘卣飨蛄慷@得該輸入向量,并且其中通過將表示該編碼的聲學(xué)信號的各幀內(nèi)的頻率分量強(qiáng)度的參數(shù)改變?yōu)橄蛄慷@得該特征向量。
12.根據(jù)權(quán)利要求1的近似性計(jì)算方法,其中通過將視頻信號改變?yōu)樘卣飨蛄慷@得該輸入向量,并且其中通過將該視頻信號的預(yù)定時(shí)間周期內(nèi)的代表圖像、預(yù)定時(shí)間周期內(nèi)的幀圖像的平均圖像、或通過基于預(yù)定塊單元分離所述代表圖像或平均圖像而獲得的小圖像的信號值改變?yōu)橄蛄慷@得該特征向量。
13.根據(jù)權(quán)利要求1的近似性計(jì)算方法,其中通過將視頻信號改變?yōu)樘卣飨蛄慷@得該輸入向量,并且其中通過將該視頻信號的預(yù)定時(shí)間周期內(nèi)的幀圖像的亮度和/或顏色的直方圖改變?yōu)橄蛄慷@得該特征向量。
14.根據(jù)權(quán)利要求1的近似性計(jì)算方法,其中通過將編碼的視頻信號改變?yōu)樘卣飨蛄慷@得該輸入向量,并且其中通過將用作與該編碼的視頻信號的預(yù)定時(shí)間周期相近的幀內(nèi)編碼圖像的編碼單元的各塊的DC分量的信號值改變?yōu)橄蛄慷@得該特征向量。
15.一種用于確定兩個(gè)輸入向量之間的近似性的近似性計(jì)算設(shè)備,包括分級距離計(jì)算裝置,用于以分級方式執(zhí)行所述兩個(gè)輸入向量之間的距離計(jì)算,閾值比較裝置,用于將該分級距離計(jì)算裝置在各級所計(jì)算的距離的積分值與預(yù)先設(shè)置的閾值進(jìn)行比較,控制裝置,用于根據(jù)該閾值比較裝置的比較結(jié)果而控制該分級距離計(jì)算裝置的距離計(jì)算,和輸出裝置,用于輸出直至最后一級所計(jì)算的距離的積分值作為該近似性,其中,操作該控制裝置使得在該閾值比較裝置的比較結(jié)果是直至某一級所計(jì)算的距離的積分值高于該閾值的情況下,該控制裝置進(jìn)行控制以舍位距離計(jì)算。
16.根據(jù)權(quán)利要求15的近似性計(jì)算設(shè)備,其中該分級距離計(jì)算裝置以分級方式執(zhí)行構(gòu)成所述兩個(gè)輸入向量的各分量之間的距離計(jì)算,從而在直至某一級所計(jì)算的距離的積分值低于該閾值的情況下,執(zhí)行隨后分量之間的距離計(jì)算。
17.根據(jù)權(quán)利要求16的近似性計(jì)算設(shè)備,還包括變換裝置,用于對所述兩個(gè)輸入向量進(jìn)行預(yù)定變換操作,其中該分級距離計(jì)算裝置基于預(yù)定變換操作、按照預(yù)定次序執(zhí)行由該變換裝置所變換的兩個(gè)輸入向量之間的距離計(jì)算。
18.根據(jù)權(quán)利要求17的近似性計(jì)算設(shè)備,還包括分離裝置,用于以預(yù)定次序取出構(gòu)成由該變換裝置所變換的兩個(gè)輸入向量的各分量,以將它們分離為分級的多個(gè)局部向量,其中該分級距離計(jì)算裝置按照從最高等級的局部向量的次序、以分級方式執(zhí)行構(gòu)成局部向量的各分量之間的距離計(jì)算,從而在構(gòu)成直至某一級的局部向量的所有分量之間所計(jì)算的計(jì)算距離的積分值低于該閾值的情況下,該分級距離計(jì)算裝置執(zhí)行構(gòu)成較低一級的局部向量的各分量之間的距離計(jì)算。
19.一種程序,用于允許計(jì)算機(jī)執(zhí)行確定兩個(gè)輸入向量之間的近似性的近似性計(jì)算處理,包括分級距離計(jì)算步驟,用于以分級方式執(zhí)行所述兩個(gè)輸入向量之間的距離計(jì)算,閾值比較步驟,用于將在該分級距離計(jì)算步驟的各級所計(jì)算的距離的積分值與預(yù)先設(shè)置的閾值進(jìn)行比較,控制步驟,用于根據(jù)該閾值比較步驟的比較結(jié)果而控制在該分級距離計(jì)算步驟的距離計(jì)算,和輸出步驟,用于輸出直至最后一級所計(jì)算的距離的積分值作為該近似性,其中,在該控制步驟,在該閾值比較步驟中直至某一級所計(jì)算的距離的積分值高于該閾值的情況下,進(jìn)行控制使得舍位距離計(jì)算。
20.根據(jù)權(quán)利要求19的程序,其中在該分級距離計(jì)算步驟以分級方式執(zhí)行構(gòu)成所述兩個(gè)輸入向量的各分量之間的距離計(jì)算,從而在直至某一級所計(jì)算的距離的積分值低于該閾值的情況下,執(zhí)行隨后分量之間的距離計(jì)算。
21.根據(jù)權(quán)利要求20的程序,還包括變換步驟,用于對所述兩個(gè)輸入向量進(jìn)行預(yù)定變換操作,其中,在該分級距離計(jì)算步驟,基于預(yù)定變換操作、按照預(yù)定次序執(zhí)行在該變換步驟所變換的兩個(gè)輸入向量之間的距離計(jì)算。
22.根據(jù)權(quán)利要求21的程序,還包括分離步驟,用于以預(yù)定次序取出構(gòu)成在該變換步驟所變換的兩個(gè)輸入向量的各分量,以將它們分離為分級的多個(gè)局部向量,其中在該分級計(jì)算步驟,按照從最高級的局部向量的次序、以分級方式執(zhí)行構(gòu)成局部向量的各分量之間的距離計(jì)算,從而在構(gòu)成直至某一級的局部向量的所有分量之間的計(jì)算距離的積分值低于該閾值的情況下,執(zhí)行構(gòu)成較低一級的局部向量的各分量之間的距離計(jì)算。
23.一種計(jì)算機(jī)可讀介質(zhì),記錄有允許計(jì)算機(jī)執(zhí)行確定兩個(gè)向量之間的近似性的近似性計(jì)算處理的程序,該程序包括分級距離計(jì)算步驟,用于以分級方式執(zhí)行所述兩個(gè)輸入向量之間的距離計(jì)算,閾值比較步驟,用于將在該分級距離計(jì)算步驟的各級所計(jì)算的距離的積分值與預(yù)先設(shè)置的閾值進(jìn)行比較,控制步驟,用于根據(jù)該閾值比較步驟的比較結(jié)果而控制在該分級距離計(jì)算步驟的距離計(jì)算,和輸出步驟,用于輸出直至最后一級所計(jì)算的距離的積分值作為該近似性,其中,在該控制步驟,在該閾值比較步驟中直至某一級所計(jì)算的距離的積分值高于該閾值的情況下,進(jìn)行控制使得舍位距離計(jì)算。
24.根據(jù)權(quán)利要求23的記錄介質(zhì),其中在該分級距離計(jì)算步驟以分級方式執(zhí)行構(gòu)成所述兩個(gè)輸入向量的各分量之間的距離計(jì)算,從而在直至某一級所計(jì)算的距離的積分值低于該閾值的情況下,執(zhí)行隨后分量之間的距離計(jì)算。
25.根據(jù)權(quán)利要求24的記錄介質(zhì),其中該程序還包括變換步驟,用于對所述兩個(gè)輸入向量進(jìn)行預(yù)定變換操作,并且其中,在該分級距離計(jì)算步驟,基于預(yù)定變換操作、按照預(yù)定次序執(zhí)行在該變換步驟所變換的兩個(gè)輸入向量之間的距離計(jì)算。
26.根據(jù)權(quán)利要求25的記錄介質(zhì),其中該程序包括分離步驟,用于以預(yù)定次序取出構(gòu)成在該變換步驟所變換的兩個(gè)輸入向量的各分量,以將它們分離為分級的多個(gè)局部向量,并且其中在該分級距離計(jì)算步驟,按照從最高級的局部向量的次序、以分級方式執(zhí)行構(gòu)成局部向量的各分量之間的距離計(jì)算,從而在構(gòu)成直至某一級的局部向量的所有分量之間的計(jì)算距離的積分值低于該閾值的情況下,執(zhí)行構(gòu)成較低一級的局部向量的各分量之間的距離計(jì)算。
全文摘要
在近似性向量檢測設(shè)備(2)中,向量變換器(20)、(21)通過順序矩陣、離散余弦變換、離散傅立葉變換、Walsh-Hadamard變換、或Karhunen-Lueve變換而對登記向量g和輸入向量f進(jìn)行變換。分級距離計(jì)算單元(23)按照從具有高有效位的向量分量,即在上述變換操作中具有大離差或唯一值的分量的順序,或按照從低頻分量的順序,執(zhí)行兩個(gè)向量之間的距離計(jì)算。而且,當(dāng)閾值判斷部分(24)判斷直至某一級所計(jì)算的距離的積分值高于距離的閾值S時(shí),僅通過輸出表示該積分值高于該閾值S的事實(shí),以中斷該距離計(jì)算。
文檔編號G06T7/00GK1552042SQ0380097
公開日2004年12月1日 申請日期2003年6月26日 優(yōu)先權(quán)日2002年7月9日
發(fā)明者安部素嗣, 西口正之, 之 申請人:索尼株式會社