br>【具體實(shí)施方式】
[0050]下面結(jié)合附圖對技術(shù)方案的實(shí)施作進(jìn)一步的詳細(xì)描述。
[0051]方法實(shí)施例一:
[0052]本發(fā)明實(shí)施例的一種信息處理方法,如圖1所示,所述方法包括:
[0053]步驟101、接收第一多媒體指紋信息,所述第一多媒體指紋信息根據(jù)第一多媒體數(shù)據(jù)生成,用于表征所述第一多媒體數(shù)據(jù)的聲學(xué)特征;
[0054]步驟102、將所述第一多媒體指紋信息轉(zhuǎn)換成與其對應(yīng)的第一參數(shù)值,所述第一參數(shù)值的存儲(chǔ)容量小于所述第一多媒體指紋信息的存儲(chǔ)容量;
[0055]步驟103、將所述第一參數(shù)值與選取的已有候選參數(shù)值進(jìn)行匹配,得到匹配信息;
[0056]步驟104、對所述匹配信息進(jìn)行篩選,得到篩選結(jié)果;
[0057]步驟105、根據(jù)參數(shù)值的時(shí)間密度分布從所述篩選結(jié)果中過濾得到目標(biāo)信息。
[0058]采用本發(fā)明實(shí)施例,通過步驟101-102,轉(zhuǎn)換得到比第一多媒體指紋信息的存儲(chǔ)容量還要小的第一參數(shù)值,不僅減少了數(shù)據(jù)庫的存儲(chǔ)空間,而且通過步驟103-105能根據(jù)第一參數(shù)值進(jìn)行匹配,通過對所述匹配信息進(jìn)行篩選,得到篩選結(jié)果,根據(jù)參數(shù)值的時(shí)間密度分布從所述篩選結(jié)果中過濾得到目標(biāo)信息,還能得到最精確的匹配識(shí)別結(jié)果,提高了匹配速度和識(shí)別成功率。
[0059]方法實(shí)施例二:
[0060]本發(fā)明實(shí)施例的一種信息處理方法,如圖2所示,所述方法包括:
[0061]步驟201、接收第一多媒體指紋信息,所述第一多媒體指紋信息根據(jù)第一多媒體數(shù)據(jù)生成,用于表征所述第一多媒體數(shù)據(jù)的聲學(xué)特征;
[0062]步驟202、將所述第一多媒體指紋信息轉(zhuǎn)換成與其對應(yīng)的第一哈希值,所述第一哈希值的存儲(chǔ)容量小于所述第一多媒體指紋信息的存儲(chǔ)容量;
[0063]步驟203、將所述第一哈希值與已有哈希值進(jìn)行哈希匹配,找到與所述第一哈希值相匹配的至少一個(gè)哈希值,及與所述哈希值對應(yīng)的多媒體數(shù)據(jù)及其時(shí)間點(diǎn)信息,以組成所述匹配信息;
[0064]步驟204、對所述匹配信息進(jìn)行篩選,得到篩選結(jié)果;
[0065]步驟205、根據(jù)參數(shù)值的時(shí)間密度分布從所述篩選結(jié)果中過濾得到目標(biāo)信息。
[0066]在本發(fā)明實(shí)施例一實(shí)施方式中,所述對所述匹配信息進(jìn)行篩選,得到篩選結(jié)果,包括:將具有相同多媒體數(shù)據(jù)和時(shí)間差的匹配哈希值進(jìn)行統(tǒng)計(jì),以用于所述匹配信息的第一級篩選過濾,得到所述篩選結(jié)果。
[0067]在本發(fā)明實(shí)施例一實(shí)施方式中,所述時(shí)間差通過輸入的所述第一多媒體數(shù)據(jù)對應(yīng)的哈希時(shí)間點(diǎn)與候選多媒體數(shù)據(jù)庫里的哈希時(shí)間點(diǎn)的差計(jì)算得到;所述候選多媒體數(shù)據(jù)庫里的哈希時(shí)間點(diǎn)通過所述哈希值對應(yīng)的多媒體數(shù)據(jù)及其時(shí)間點(diǎn)信息計(jì)算得到。
[0068]在本發(fā)明實(shí)施例一實(shí)施方式中,所述方法還包括:對所述篩選結(jié)果按照預(yù)設(shè)條件進(jìn)行排序選取,選取得到所述篩選結(jié)果中前N個(gè)匹配到的多媒體數(shù)據(jù),并組成潛力匹配的音頻段,所述N為大于I的整數(shù)。
[0069]在本發(fā)明實(shí)施例一實(shí)施方式中,所述根據(jù)參數(shù)值的時(shí)間密度分布從所述篩選結(jié)果中過濾得到目標(biāo)信息,包括:
[0070]對于所述潛力匹配的音頻段中的每一個(gè)匹配的音頻段,根據(jù)所述參數(shù)值的時(shí)間密度分布進(jìn)行統(tǒng)計(jì),得到所述每一個(gè)匹配的音頻段其哈希值在指定時(shí)間上的密度分布;
[0071]判斷所述每一個(gè)匹配的音頻段其哈希值在指定時(shí)間上的密度分布是否大于第一閥值,如果是,則保留當(dāng)前哈希值密度分布大于第一閥值的音頻段,否則,刪除當(dāng)前哈希值密度分布小于等于第一閥值的音頻段;
[0072]將當(dāng)前哈希值密度分布大于第一閥值的音頻段組成所述目標(biāo)信息。
[0073]服務(wù)器實(shí)施例一:如圖3所示,所述服務(wù)器包括:
[0074]接收單元11,用于接收第一多媒體指紋信息,所述第一多媒體指紋信息根據(jù)第一多媒體數(shù)據(jù)生成,用于表征所述第一多媒體數(shù)據(jù)的聲學(xué)特征;
[0075]轉(zhuǎn)換單元12,用于將所述第一多媒體指紋信息轉(zhuǎn)換成與其對應(yīng)的第一參數(shù)值,所述第一參數(shù)值的存儲(chǔ)容量小于所述第一多媒體指紋信息的存儲(chǔ)容量;
[0076]匹配單元13,用于將所述第一參數(shù)值與選取的已有候選參數(shù)值進(jìn)行匹配,得到匹配信息;
[0077]篩選單元14,用于對所述匹配信息進(jìn)行篩選,得到篩選結(jié)果;
[0078]過濾單元15,用于根據(jù)參數(shù)值的時(shí)間密度分布從所述篩選結(jié)果中過濾得到目標(biāo)信息。
[0079]在本發(fā)明實(shí)施例一實(shí)施方式中,所述候選參數(shù)值的類型包括哈希值,所述第一參數(shù)值為第一哈希值;
[0080]所述匹配單元,進(jìn)一步用于將所述第一哈希值與已有哈希值進(jìn)行哈希匹配,找到與所述第一哈希值相匹配的至少一個(gè)哈希值,及與所述哈希值對應(yīng)的多媒體數(shù)據(jù)及其時(shí)間點(diǎn)信息,以組成所述匹配信息。
[0081]在本發(fā)明實(shí)施例一實(shí)施方式中,所述篩選單元,進(jìn)一步用于將具有相同多媒體數(shù)據(jù)和時(shí)間差的匹配哈希值進(jìn)行統(tǒng)計(jì),以用于所述匹配信息的第一級篩選過濾,得到所述篩選結(jié)果。
[0082]在本發(fā)明實(shí)施例一實(shí)施方式中,所述篩選單元,進(jìn)一步用于通過輸入的所述第一多媒體數(shù)據(jù)對應(yīng)的哈希時(shí)間點(diǎn)與候選多媒體數(shù)據(jù)庫里的哈希時(shí)間點(diǎn)的差計(jì)算得到所述時(shí)間差;所述候選多媒體數(shù)據(jù)庫里的哈希時(shí)間點(diǎn)通過所述哈希值對應(yīng)的多媒體數(shù)據(jù)及其時(shí)間點(diǎn)信息計(jì)算得到。
[0083]在本發(fā)明實(shí)施例一實(shí)施方式中,所述服務(wù)器還包括:
[0084]選取單元,用于對所述篩選結(jié)果按照預(yù)設(shè)條件進(jìn)行排序選取,選取得到所述篩選結(jié)果中前N個(gè)匹配到的多媒體數(shù)據(jù),并組成潛力匹配的音頻段,所述N為大于I的整數(shù)。
[0085]在本發(fā)明實(shí)施例一實(shí)施方式中,所述過濾單元,進(jìn)一步包括:
[0086]統(tǒng)計(jì)子單元,用于對于所述潛力匹配的音頻段中的每一個(gè)匹配的音頻段,根據(jù)所述參數(shù)值的時(shí)間密度分布進(jìn)行統(tǒng)計(jì),得到所述每一個(gè)匹配的音頻段其哈希值在指定時(shí)間上的密度分布;
[0087]判斷子單元,用于判斷所述每一個(gè)匹配的音頻段其哈希值在指定時(shí)間上的密度分布是否大于第一閥值,如果是,則保留當(dāng)前哈希值密度分布大于第一閥值的音頻段,否則,刪除當(dāng)前哈希值密度分布小于等于第一閥值的音頻段;將當(dāng)前哈希值密度分布大于第一閥值的音頻段組成所述目標(biāo)信息。
[0088]這里需要指出的是,上述服務(wù)器可以是通過集群系統(tǒng)構(gòu)成的,為實(shí)現(xiàn)各單元功能而合并為一或各單元功能分體設(shè)置的電子設(shè)備,服務(wù)器都至少包括用于存儲(chǔ)數(shù)據(jù)的數(shù)據(jù)庫和用于數(shù)據(jù)處理的處理器,或者包括設(shè)置于服務(wù)器內(nèi)的存儲(chǔ)介質(zhì)或獨(dú)立設(shè)置的存儲(chǔ)介質(zhì)。
[0089]其中,對于用于數(shù)據(jù)處理的處理器而言,在執(zhí)行處理時(shí),可以采用微處理器、中央處理器(CPU,Central Processing Unit)、數(shù)字信號(hào)處理器(DSP,Digital SingnalProcessor)或可編程邏輯陣列(FPGA,F(xiàn)ield 一 Programmable Gate Array)實(shí)現(xiàn);對于存儲(chǔ)介質(zhì)來說,包含操作指令,該操作指令可以為計(jì)算機(jī)可執(zhí)行代碼,通過所述操作指令來實(shí)現(xiàn)上述本發(fā)明實(shí)施例信息處理方法流程中的各個(gè)步驟。
[0090]該服務(wù)器作為硬件實(shí)體Sll的一個(gè)示例如圖4所示。所述裝置包括處理器31、存儲(chǔ)介質(zhì)32以及至少一個(gè)外部通信接口 33 ;所述處理器31、存儲(chǔ)介質(zhì)32以及外部通信接口33均通過總線34連接。
[0091]這里需要指出的是:以上涉及服務(wù)器項(xiàng)的描述,與上述方法描述是類似的,同方法的有益效果描述,不做贅述。對于本發(fā)明服務(wù)器實(shí)施例中未披露的技術(shù)細(xì)節(jié),請參照本發(fā)明方法實(shí)施例的描述。
[0092]以一個(gè)現(xiàn)實(shí)應(yīng)用場景為例對本發(fā)明實(shí)施例闡述如下:
[0093]本應(yīng)用場景為:識(shí)別進(jìn)而選取一首歌曲或一段視頻的情況,可以通過指紋識(shí)別技術(shù)來實(shí)現(xiàn),即:在客戶端生成音頻指紋或視頻指紋信息,然后將其與服務(wù)器的數(shù)據(jù)庫中已有的音頻指紋或視頻指紋信息樣本進(jìn)行比對,從而進(jìn)行識(shí)別。
[0094]服務(wù)器的數(shù)據(jù)庫中已有的音頻指紋或視頻指紋信息樣本有非常多,以其中的音頻指紋樣本為例進(jìn)行如下描述,視頻指紋信息樣本是類似的,不作贅述。
[0095]大量音頻數(shù)據(jù)對應(yīng)的音頻指紋和其相應(yīng)的元數(shù)據(jù)比如歌曲名稱、詞曲作者、歌詞等內(nèi)容一起存儲(chǔ)在一個(gè)數(shù)據(jù)庫中,并采用音頻指紋作為相應(yīng)元數(shù)據(jù)的索引,這種情況是音頻指紋和其相應(yīng)的元數(shù)據(jù)分別獨(dú)立存在數(shù)據(jù)庫的一條記錄中,且音頻指紋作為該記錄的索引值;也可以是:音頻指紋中就包含了作為數(shù)據(jù)頭的音頻指紋及作為其數(shù)據(jù)具體內(nèi)容的所述元數(shù)據(jù)。
[0096]一個(gè)音頻指紋系統(tǒng)通常包括兩個(gè)部分:1)計(jì)算聽覺重要特征的指紋提取算法;2)在指紋數(shù)據(jù)庫中進(jìn)行有效搜索的