應用中,只需要找到一個唯一的匹配,只需在這個去重的過程中保留一個匹配上最長的視頻,如圖10所示,把a去掉,保存b就可以了。
[0120]采用本發(fā)明實施例得到的優(yōu)勢為:1)在音頻哈希值匹配時充分利用哈希值在時間上的分布,哈希值在一定時間內(nèi)的匹配數(shù)量,從而達到將音頻匹配的準確度提升到99.5% ;2)不僅適用于短音頻的匹配(從約五秒到幾十秒),也適用于長音頻(大于I分鐘)的音頻指紋匹配;3)該匹配算法可以通過參數(shù)、模糊搜索條計的調(diào)節(jié),控制匹配的精準度,和匹配的復雜度;4)該匹配算法不僅可應用于基于哈希值的音頻指紋,也適用基于特征的音頻指紋,視頻指紋。
[0121]在本申請所提供的幾個實施例中,應該理解到,所揭露的設備和方法,可以通過其它的方式實現(xiàn)。以上所描述的設備實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,如:多個單元或組件可以結合,或可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的各組成部分相互之間的耦合、或直接耦合、或通信連接可以是通過一些接口,設備或單元的間接耦合或通信連接,可以是電性的、機械的或其它形式的。
[0122]上述作為分離部件說明的單元可以是、或也可以不是物理上分開的,作為單元顯示的部件可以是、或也可以不是物理單元,即可以位于一個地方,也可以分布到多個網(wǎng)絡單元上;可以根據(jù)實際的需要選擇其中的部分或全部單元來實現(xiàn)本實施例方案的目的。
[0123]另外,在本發(fā)明各實施例中的各功能單元可以全部集成在一個處理單元中,也可以是各單元分別單獨作為一個單元,也可以兩個或兩個以上單元集成在一個單元中;上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用硬件加軟件功能單元的形式實現(xiàn)。
[0124]本領域普通技術人員可以理解:實現(xiàn)上述方法實施例的全部或部分步驟可以通過程序指令相關的硬件來完成,前述的程序可以存儲于一計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質(zhì)包括:移動存儲設備、只讀存儲器(ROM,Read-Only Memory)、隨機存取存儲器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
[0125]或者,本發(fā)明上述集成的單元如果以軟件功能模塊的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,也可以存儲在一個計算機可讀取存儲介質(zhì)中。基于這樣的理解,本發(fā)明實施例的技術方案本質(zhì)上或者說對現(xiàn)有技術做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設備(可以是個人計算機、服務器、或者網(wǎng)絡設備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分。而前述的存儲介質(zhì)包括:移動存儲設備、ROM、RAM、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
[0126]以上所述,僅為本發(fā)明的【具體實施方式】,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術領域的技術人員在本發(fā)明揭露的技術范圍內(nèi),可輕易想到變化或替換,都應涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應以所述權利要求的保護范圍為準。
【主權項】
1.一種信息處理方法,其特征在于,所述方法包括: 接收第一多媒體指紋信息,所述第一多媒體指紋信息根據(jù)第一多媒體數(shù)據(jù)生成,用于表征所述第一多媒體數(shù)據(jù)的聲學特征; 將所述第一多媒體指紋信息轉換成與其對應的第一參數(shù)值,所述第一參數(shù)值的存儲容量小于所述第一多媒體指紋信息的存儲容量; 將所述第一參數(shù)值與選取的已有候選參數(shù)值進行匹配,得到匹配信息; 對所述匹配信息進行篩選,得到篩選結果; 根據(jù)參數(shù)值的時間密度分布從所述篩選結果中過濾得到目標信息。2.根據(jù)權利要求1所述的方法,其特征在于,所述候選參數(shù)值的類型包括哈希值,所述第一參數(shù)值為第一哈希值; 所述將所述第一參數(shù)值與選取的已有候選參數(shù)值進行匹配,得到匹配信息,包括: 將所述第一哈希值與已有哈希值進行哈希匹配,找到與所述第一哈希值相匹配的至少一個哈希值,及與所述哈希值對應的多媒體數(shù)據(jù)及其時間點信息,以組成所述匹配信息。3.根據(jù)權利要求2所述的方法,其特征在于,所述對所述匹配信息進行篩選,得到篩選結果,包括: 將具有相同多媒體數(shù)據(jù)和時間差的匹配哈希值進行統(tǒng)計,以用于所述匹配信息的第一級篩選過濾,得到所述篩選結果。4.根據(jù)權利要求3所述的方法,其特征在于,所述時間差通過輸入的所述第一多媒體數(shù)據(jù)對應的哈希時間點與候選多媒體數(shù)據(jù)庫里的哈希時間點的差計算得到; 所述候選多媒體數(shù)據(jù)庫里的哈希時間點通過所述哈希值對應的多媒體數(shù)據(jù)及其時間點?目息計算得到。5.根據(jù)權利要求3或4所述的方法,其特征在于,所述方法還包括: 對所述篩選結果按照預設條件進行排序選取,選取得到所述篩選結果中前N個匹配到的多媒體數(shù)據(jù),并組成潛力匹配的音頻段,所述N為大于I的整數(shù)。6.根據(jù)權利要求5所述的方法,其特征在于,所述根據(jù)參數(shù)值的時間密度分布從所述篩選結果中過濾得到目標信息,包括: 對于所述潛力匹配的音頻段中的每一個匹配的音頻段,根據(jù)所述參數(shù)值的時間密度分布進行統(tǒng)計,得到所述每一個匹配的音頻段其哈希值在指定時間上的密度分布; 判斷所述每一個匹配的音頻段其哈希值在指定時間上的密度分布是否大于第一閥值,如果是,則保留當前哈希值密度分布大于第一閥值的音頻段,否則,刪除當前哈希值密度分布小于等于第一閥值的音頻段; 將當前哈希值密度分布大于第一閥值的音頻段組成所述目標信息。7.一種服務器,其特征在于,所述服務器包括: 接收單元,用于接收第一多媒體指紋信息,所述第一多媒體指紋信息根據(jù)第一多媒體數(shù)據(jù)生成,用于表征所述第一多媒體數(shù)據(jù)的聲學特征; 轉換單元,用于將所述第一多媒體指紋信息轉換成與其對應的第一參數(shù)值,所述第一參數(shù)值的存儲容量小于所述第一多媒體指紋信息的存儲容量; 匹配單元,用于將所述第一參數(shù)值與選取的已有候選參數(shù)值進行匹配,得到匹配信息; 篩選單元,用于對所述匹配信息進行篩選,得到篩選結果; 過濾單元,用于根據(jù)參數(shù)值的時間密度分布從所述篩選結果中過濾得到目標信息。8.根據(jù)權利要求7所述的服務器,其特征在于,所述候選參數(shù)值的類型包括哈希值,所述第一參數(shù)值為第一哈希值; 所述匹配單元,進一步用于將所述第一哈希值與已有哈希值進行哈希匹配,找到與所述第一哈希值相匹配的至少一個哈希值,及與所述哈希值對應的多媒體數(shù)據(jù)及其時間點信息,以組成所述匹配信息。9.根據(jù)權利要求8所述的服務器,其特征在于,所述篩選單元,進一步用于將具有相同多媒體數(shù)據(jù)和時間差的匹配哈希值進行統(tǒng)計,以用于所述匹配信息的第一級篩選過濾,得到所述篩選結果。10.根據(jù)權利要求9所述的服務器,其特征在于,所述篩選單元,進一步用于通過輸入的所述第一多媒體數(shù)據(jù)對應的哈希時間點與候選多媒體數(shù)據(jù)庫里的哈希時間點的差計算得到所述時間差;所述候選多媒體數(shù)據(jù)庫里的哈希時間點通過所述哈希值對應的多媒體數(shù)據(jù)及其時間點信息計算得到。11.根據(jù)權利要求9或10所述的服務器,其特征在于,所述服務器還包括: 選取單元,用于對所述篩選結果按照預設條件進行排序選取,選取得到所述篩選結果中前N個匹配到的多媒體數(shù)據(jù),并組成潛力匹配的音頻段,所述N為大于I的整數(shù)。12.根據(jù)權利要求11所述的服務器,其特征在于,所述過濾單元,進一步包括: 統(tǒng)計子單元,用于對于所述潛力匹配的音頻段中的每一個匹配的音頻段,根據(jù)所述參數(shù)值的時間密度分布進行統(tǒng)計,得到所述每一個匹配的音頻段其哈希值在指定時間上的密度分布; 判斷子單元,用于判斷所述每一個匹配的音頻段其哈希值在指定時間上的密度分布是否大于第一閥值,如果是,則保留當前哈希值密度分布大于第一閥值的音頻段,否則,刪除當前哈希值密度分布小于等于第一閥值的音頻段;將當前哈希值密度分布大于第一閥值的音頻段組成所述目標信息。
【專利摘要】本發(fā)明公開了一種信息處理方法及服務器,其中,所述方法包括:接收第一多媒體指紋信息,所述第一多媒體指紋信息根據(jù)第一多媒體數(shù)據(jù)生成,用于表征所述第一多媒體數(shù)據(jù)的聲學特征;將所述第一多媒體指紋信息轉換成與其對應的第一參數(shù)值,所述第一參數(shù)值的存儲容量小于所述第一多媒體指紋信息的存儲容量;將所述第一參數(shù)值與選取的已有候選參數(shù)值進行匹配,得到匹配信息;對所述匹配信息進行篩選,得到篩選結果;根據(jù)參數(shù)值的時間密度分布從所述篩選結果中過濾得到目標信息。
【IPC分類】G06F17/30
【公開號】CN104915403
【申請?zhí)枴緾N201510293840
【發(fā)明人】徐敘遠
【申請人】騰訊科技(北京)有限公司
【公開日】2015年9月16日
【申請日】2015年6月1日