在播放視頻的設(shè)備中識別視頻中音頻的方法和裝置的制造方法_5

文檔序號：9671284閱讀：來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)>在播放視頻的設(shè)備中識別視頻中音頻的方法和裝置的制造方法

裝在驅(qū)動器610上，以便于從其上讀出的計算機程序根據(jù)需要被安裝入存儲部分608。
[0128]特別地，根據(jù)本公開的實施例，上文參考流程圖描述的過程可以被實現(xiàn)為計算機軟件程序。例如，本公開的實施例包括一種計算機程序產(chǎn)品，其包括有形地包含在機器可讀介質(zhì)上的計算機程序，所述計算機程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這樣的實施例中，該計算機程序可以通過通信部分609從網(wǎng)絡(luò)上被下載和安裝，和/或從可拆卸介質(zhì)611被安裝。
[0129]附圖中的流程圖和框圖，圖示了按照本申請各種實施例的系統(tǒng)、方法和計算機程序產(chǎn)品的可能實現(xiàn)的體系架構(gòu)、功能和操作。在這點上，流程圖或框圖中的每個方框可以代表一個模塊、程序段、或代碼的一部分，所述模塊、程序段、或代碼的一部分包含一個或多個用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意，在有些作為替換的實現(xiàn)中，方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如，兩個接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行，它們有時也可以按相反的順序執(zhí)行，這依所涉及的功能而定。也要注意的是，框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合，可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實現(xiàn)，或者可以用專用硬件與計算機指令的組合來實現(xiàn)。
[0130]描述于本申請實施例中所涉及到的模塊可以通過軟件的方式實現(xiàn)，也可以通過硬件的方式來實現(xiàn)。所描述的模塊也可以設(shè)置在處理器中，例如，可以描述為:一種處理器包括截取模塊、提取模塊、比對模塊、獲取模塊和呈現(xiàn)模塊。其中，這些模塊的名稱在某種情況下并不構(gòu)成對該模塊本身的限定，例如，截取模塊還可以被描述為“響應(yīng)于用戶的截取指令而截取正在播放的視頻中的音頻信息的模塊”。
[0131]作為另一方面，本申請還提供了一種非易失性計算機存儲介質(zhì)，該非易失性計算機存儲介質(zhì)可以是上述實施例中所述裝置中所包含的非易失性計算機存儲介質(zhì);也可以是單獨存在，未裝配入終端中的非易失性計算機存儲介質(zhì)。上述非易失性計算機存儲介質(zhì)存儲有一個或者多個程序，當(dāng)所述一個或者多個程序被一個設(shè)備執(zhí)行時，使得所述設(shè)備:響應(yīng)于用戶的截取指令而截取正在播放的視頻中的音頻信息；對截取的音頻信息提取音頻特征，得到待識別音頻指紋；比對待識別音頻指紋與預(yù)設(shè)的音頻指紋數(shù)據(jù)庫中的樂曲音頻指紋的相似度;按照相似度從高至低，獲取預(yù)設(shè)數(shù)量的樂曲音頻指紋，查詢以獲取的音頻指紋為索引的樂曲的元數(shù)據(jù);呈現(xiàn)查詢得到的元數(shù)據(jù)。
[0132]以上描述僅為本申請的較佳實施例以及對所運用技術(shù)原理的說明。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解，本申請中所涉及的發(fā)明范圍，并不限于上述技術(shù)特征的特定組合而成的技術(shù)方案，同時也應(yīng)涵蓋在不脫離所述發(fā)明構(gòu)思的情況下，由上述技術(shù)特征或其等同特征進行任意組合而形成的其它技術(shù)方案。例如上述特征與本申請中公開的(但不限于)具有類似功能的技術(shù)特征進行互相替換而形成的技術(shù)方案。
【主權(quán)項】
1.一種在播放視頻的設(shè)備中識別視頻中音頻的方法，其特征在于，包括: 響應(yīng)于用戶的截取指令而截取正在播放的視頻中的音頻信息；對截取的音頻信息提取音頻特征，得到待識別音頻指紋；比對所述待識別音頻指紋與預(yù)設(shè)的音頻指紋數(shù)據(jù)庫中的樂曲音頻指紋的相似度；按照相似度從高至低，獲取預(yù)設(shè)數(shù)量的樂曲音頻指紋，查詢以獲取的音頻指紋為索引的樂曲的元數(shù)據(jù)；呈現(xiàn)查詢得到的元數(shù)據(jù)。2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述方法還包括: 接收用戶操作；響應(yīng)于所述用戶操作符合預(yù)設(shè)的觸發(fā)操作，觸發(fā)所述用戶的截取指令。3.根據(jù)權(quán)利要求2所述的方法，其特征在于，響應(yīng)于所述用戶操作符合預(yù)設(shè)的觸發(fā)操作，觸發(fā)所述用戶的截取指令包括以下一項或多項: 響應(yīng)于所述用戶操作為對正在播放的視頻中呈現(xiàn)的截取選項的選擇操作，并且所述選擇操作符合預(yù)設(shè)的觸發(fā)操作，觸發(fā)所述用戶的截取指令；響應(yīng)于所述用戶操作為對快捷鍵的按鍵操作，并且所述按鍵操作符合預(yù)設(shè)的觸發(fā)操作，觸發(fā)所述用戶的截取指令；響應(yīng)于所述用戶操作為指紋輸入，并且所述指紋輸入為預(yù)設(shè)的觸發(fā)操作，觸發(fā)所述用戶的截取指令；響應(yīng)于所述用戶操作為音波輸入，并且所述音波輸入為預(yù)設(shè)的觸發(fā)操作，觸發(fā)所述用戶的截取指令;以及響應(yīng)于所述用戶操作為正在播放視頻的設(shè)備感應(yīng)到的操作，并且所述感應(yīng)到的操作符合預(yù)設(shè)的觸發(fā)操作，觸發(fā)所述用戶的截取指令。4.根據(jù)權(quán)利要求1-3任意一項所述的方法，其特征在于，所述響應(yīng)于用戶的截取指令而截取正在播放的視頻中的音頻信息包括: 響應(yīng)于用戶的截取指令而截取所述正在播放的視頻的音頻源文件，得到截取的音頻信息;和/或響應(yīng)于用戶的截取指令而對所述正在播放的視頻進行錄音，得到截取的音頻信息。5.根據(jù)權(quán)利要求4所述的方法，其特征在于，在云端服務(wù)器進行以下一項或多項操作: 對截取的音頻信息提取音頻特征，得到待識別音頻指紋；比對所述待識別音頻指紋與預(yù)設(shè)的音頻指紋數(shù)據(jù)庫中的樂曲音頻指紋的相似度；按照相似度從高至低，獲取預(yù)設(shè)數(shù)量的樂曲音頻指紋，查詢以獲取的音頻指紋為索引的樂曲的元數(shù)據(jù)。6.根據(jù)權(quán)利要求5所述的方法，其特征在于，通過以下一項或多項表現(xiàn)形式向用戶呈現(xiàn)查詢得到的樂曲的元數(shù)據(jù): 語音、文本、圖片和流媒體。7.根據(jù)權(quán)利要求6所述的方法，其特征在于，在預(yù)設(shè)位置以以下一項或多項呈現(xiàn)方式向用戶呈現(xiàn)查詢得到的樂曲的元數(shù)據(jù): 預(yù)設(shè)顏色、預(yù)設(shè)亮度和預(yù)設(shè)遮罩狀態(tài)。8.一種在播放視頻的設(shè)備中識別視頻中音頻的裝置，其特征在于，所述裝置包括: 截取模塊，用于響應(yīng)于用戶的截取指令而截取正在播放的視頻中的音頻信息；提取模塊，用于對截取的音頻信息提取音頻特征，得到待識別音頻指紋；比對模塊，用于比對所述待識別音頻指紋與預(yù)設(shè)的音頻指紋數(shù)據(jù)庫中的樂曲音頻指紋的相似度；獲取模塊，用于按照相似度從高至低，獲取預(yù)設(shè)數(shù)量的樂曲音頻指紋，查詢以獲取的音頻指紋為索引的樂曲的元數(shù)據(jù)；呈現(xiàn)模塊，用于呈現(xiàn)查詢得到的樂曲的元數(shù)據(jù)。9.根據(jù)權(quán)利要求8所述的裝置，其特征在于，所述裝置還包括: 接收模塊，用于接收用戶操作；觸發(fā)模塊，用于響應(yīng)于所述用戶操作符合預(yù)設(shè)的觸發(fā)操作，觸發(fā)所述用戶的截取指令。10.根據(jù)權(quán)利要求9所述的裝置，其特征在于，所述觸發(fā)模塊包括以下一項或多項: 選項觸發(fā)模塊，用于響應(yīng)于所述用戶操作為對正在播放的視頻中呈現(xiàn)的截取選項的選擇操作，并且所述選擇操作符合預(yù)設(shè)的觸發(fā)操作，觸發(fā)所述用戶的截取指令；快捷鍵觸發(fā)模塊，用于響應(yīng)于所述用戶操作為對快捷鍵的按鍵操作，并且所述按鍵操作符合預(yù)設(shè)的觸發(fā)操作，觸發(fā)所述用戶的截取指令；指紋觸發(fā)模塊，用于響應(yīng)于所述用戶操作為指紋輸入，并且所述指紋輸入為預(yù)設(shè)的觸發(fā)操作，觸發(fā)所述用戶的截取指令；音波觸發(fā)模塊，用于響應(yīng)于所述用戶操作為音波輸入，并且所述音波輸入為預(yù)設(shè)的觸發(fā)操作，觸發(fā)所述用戶的截取指令;以及感應(yīng)觸發(fā)模塊，用于響應(yīng)于所述用戶操作為正在播放視頻的設(shè)備感應(yīng)到的操作，并且所述感應(yīng)到的操作符合預(yù)設(shè)的觸發(fā)操作，觸發(fā)所述用戶的截取指令。11.根據(jù)權(quán)利要求8-10任意一項所述的裝置，其特征在于，所述截取模塊包括: 源音頻截取模塊，用于響應(yīng)于用戶的截取指令而截取所述正在播放的視頻的音頻源文件，得到截取的音頻信息;和/或錄音截取模塊，用于響應(yīng)于用戶的截取指令而對所述正在播放的視頻進行錄音，得到截取的音頻信息。12.根據(jù)權(quán)利要求11所述的裝置，其特征在于，以下一個或多個模塊設(shè)于云端服務(wù)器:提取模塊、比對模塊和獲取模塊。13.根據(jù)權(quán)利要求12所述的裝置，其特征在于，所述呈現(xiàn)模塊通過以下一項或多項表現(xiàn)形式向用戶呈現(xiàn)查詢得到的樂曲的元數(shù)據(jù): 語音、文本、圖片和流媒體。14.根據(jù)權(quán)利要求13所述的裝置，其特征在于，所述呈現(xiàn)模塊在預(yù)設(shè)位置以以下一項或多項呈現(xiàn)方式向用戶呈現(xiàn)查詢得到的樂曲的元數(shù)據(jù): 預(yù)設(shè)顏色、預(yù)設(shè)亮度和預(yù)設(shè)遮罩狀態(tài)。15.一種視頻播放裝置，其特征在于，所述視頻播放裝置包括如權(quán)利要求8-14任意一項所述的在播放視頻的設(shè)備中識別視頻中音頻的裝置。16.一種電子設(shè)備，其特征在于，所述電子設(shè)備包括: 如權(quán)利要求8-14任意一項所述的在播放視頻的設(shè)備中識別視頻中音頻的裝置;和/或如權(quán)利要求15所述的視頻播放裝置。
【專利摘要】本申請公開了在播放視頻的設(shè)備中識別視頻中音頻的方法和裝置。所述方法的一【具體實施方式】包括：響應(yīng)于用戶的截取指令而截取正在播放的視頻中的音頻信息；對截取的音頻信息提取音頻特征，得到待識別音頻指紋；比對待識別音頻指紋與預(yù)設(shè)的音頻指紋數(shù)據(jù)庫中的樂曲音頻指紋的相似度；按照相似度從高至低，獲取預(yù)設(shè)數(shù)量的樂曲音頻指紋，查詢以獲取的音頻指紋為索引的樂曲的元數(shù)據(jù)；呈現(xiàn)查詢得到的元數(shù)據(jù)。該實施方式降低了識別過程中的環(huán)境噪音，有效提高了音頻識別的精準(zhǔn)度以及音頻識別的成功率。
【IPC分類】H04N21/439, H04N21/4722, H04N21/4402, H04N21/435, H04N21/84, H04N21/433, H04N21/41
【公開號】CN105430494
【申請?zhí)枴緾N201510875730
【發(fā)明人】宋治云, 姜史哲
【申請人】百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司
【公開日】2016年3月23日
【申請日】2015年12月2日

完整全部詳細技術(shù)資料下載

當(dāng)前第5頁1 2 3 4 5

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

lync無法識別音頻設(shè)備相關(guān)技術(shù)

播放設(shè)備沒有藍牙音頻相關(guān)技術(shù)

音頻沒有播放設(shè)備相關(guān)技術(shù)

音頻播放設(shè)備下載相關(guān)技術(shù)

音頻播放設(shè)備相關(guān)技術(shù)

浪子音頻播放設(shè)備相關(guān)技術(shù)

音視頻設(shè)備相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

在播放視頻的設(shè)備中識別視頻中音頻的方法和裝置的制造方法_5