亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

在播放視頻的設(shè)備中識別視頻中音頻的方法和裝置的制造方法_5

文檔序號:9671284閱讀:來源:國知局
裝在驅(qū)動器610上,以便于從其上讀出的計算機程序根據(jù)需要被安裝入存儲部分608。
[0128]特別地,根據(jù)本公開的實施例,上文參考流程圖描述的過程可以被實現(xiàn)為計算機軟件程序。例如,本公開的實施例包括一種計算機程序產(chǎn)品,其包括有形地包含在機器可讀介質(zhì)上的計算機程序,所述計算機程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這樣的實施例中,該計算機程序可以通過通信部分609從網(wǎng)絡(luò)上被下載和安裝,和/或從可拆卸介質(zhì)611被安裝。
[0129]附圖中的流程圖和框圖,圖示了按照本申請各種實施例的系統(tǒng)、方法和計算機程序產(chǎn)品的可能實現(xiàn)的體系架構(gòu)、功能和操作。在這點上,流程圖或框圖中的每個方框可以代表一個模塊、程序段、或代碼的一部分,所述模塊、程序段、或代碼的一部分包含一個或多個用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專用的基于硬件的系統(tǒng)來實現(xiàn),或者可以用專用硬件與計算機指令的組合來實現(xiàn)。
[0130]描述于本申請實施例中所涉及到的模塊可以通過軟件的方式實現(xiàn),也可以通過硬件的方式來實現(xiàn)。所描述的模塊也可以設(shè)置在處理器中,例如,可以描述為:一種處理器包括截取模塊、提取模塊、比對模塊、獲取模塊和呈現(xiàn)模塊。其中,這些模塊的名稱在某種情況下并不構(gòu)成對該模塊本身的限定,例如,截取模塊還可以被描述為“響應(yīng)于用戶的截取指令而截取正在播放的視頻中的音頻信息的模塊”。
[0131]作為另一方面,本申請還提供了一種非易失性計算機存儲介質(zhì),該非易失性計算機存儲介質(zhì)可以是上述實施例中所述裝置中所包含的非易失性計算機存儲介質(zhì);也可以是單獨存在,未裝配入終端中的非易失性計算機存儲介質(zhì)。上述非易失性計算機存儲介質(zhì)存儲有一個或者多個程序,當(dāng)所述一個或者多個程序被一個設(shè)備執(zhí)行時,使得所述設(shè)備:響應(yīng)于用戶的截取指令而截取正在播放的視頻中的音頻信息;對截取的音頻信息提取音頻特征,得到待識別音頻指紋;比對待識別音頻指紋與預(yù)設(shè)的音頻指紋數(shù)據(jù)庫中的樂曲音頻指紋的相似度;按照相似度從高至低,獲取預(yù)設(shè)數(shù)量的樂曲音頻指紋,查詢以獲取的音頻指紋為索引的樂曲的元數(shù)據(jù);呈現(xiàn)查詢得到的元數(shù)據(jù)。
[0132]以上描述僅為本申請的較佳實施例以及對所運用技術(shù)原理的說明。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本申請中所涉及的發(fā)明范圍,并不限于上述技術(shù)特征的特定組合而成的技術(shù)方案,同時也應(yīng)涵蓋在不脫離所述發(fā)明構(gòu)思的情況下,由上述技術(shù)特征或其等同特征進行任意組合而形成的其它技術(shù)方案。例如上述特征與本申請中公開的(但不限于)具有類似功能的技術(shù)特征進行互相替換而形成的技術(shù)方案。
【主權(quán)項】
1.一種在播放視頻的設(shè)備中識別視頻中音頻的方法,其特征在于,包括: 響應(yīng)于用戶的截取指令而截取正在播放的視頻中的音頻信息; 對截取的音頻信息提取音頻特征,得到待識別音頻指紋; 比對所述待識別音頻指紋與預(yù)設(shè)的音頻指紋數(shù)據(jù)庫中的樂曲音頻指紋的相似度;按照相似度從高至低,獲取預(yù)設(shè)數(shù)量的樂曲音頻指紋,查詢以獲取的音頻指紋為索引的樂曲的元數(shù)據(jù); 呈現(xiàn)查詢得到的元數(shù)據(jù)。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 接收用戶操作; 響應(yīng)于所述用戶操作符合預(yù)設(shè)的觸發(fā)操作,觸發(fā)所述用戶的截取指令。3.根據(jù)權(quán)利要求2所述的方法,其特征在于,響應(yīng)于所述用戶操作符合預(yù)設(shè)的觸發(fā)操作,觸發(fā)所述用戶的截取指令包括以下一項或多項: 響應(yīng)于所述用戶操作為對正在播放的視頻中呈現(xiàn)的截取選項的選擇操作,并且所述選擇操作符合預(yù)設(shè)的觸發(fā)操作,觸發(fā)所述用戶的截取指令; 響應(yīng)于所述用戶操作為對快捷鍵的按鍵操作,并且所述按鍵操作符合預(yù)設(shè)的觸發(fā)操作,觸發(fā)所述用戶的截取指令; 響應(yīng)于所述用戶操作為指紋輸入,并且所述指紋輸入為預(yù)設(shè)的觸發(fā)操作,觸發(fā)所述用戶的截取指令; 響應(yīng)于所述用戶操作為音波輸入,并且所述音波輸入為預(yù)設(shè)的觸發(fā)操作,觸發(fā)所述用戶的截取指令;以及 響應(yīng)于所述用戶操作為正在播放視頻的設(shè)備感應(yīng)到的操作,并且所述感應(yīng)到的操作符合預(yù)設(shè)的觸發(fā)操作,觸發(fā)所述用戶的截取指令。4.根據(jù)權(quán)利要求1-3任意一項所述的方法,其特征在于,所述響應(yīng)于用戶的截取指令而截取正在播放的視頻中的音頻信息包括: 響應(yīng)于用戶的截取指令而截取所述正在播放的視頻的音頻源文件,得到截取的音頻信息;和/或 響應(yīng)于用戶的截取指令而對所述正在播放的視頻進行錄音,得到截取的音頻信息。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,在云端服務(wù)器進行以下一項或多項操作: 對截取的音頻信息提取音頻特征,得到待識別音頻指紋; 比對所述待識別音頻指紋與預(yù)設(shè)的音頻指紋數(shù)據(jù)庫中的樂曲音頻指紋的相似度;按照相似度從高至低,獲取預(yù)設(shè)數(shù)量的樂曲音頻指紋,查詢以獲取的音頻指紋為索引的樂曲的元數(shù)據(jù)。6.根據(jù)權(quán)利要求5所述的方法,其特征在于,通過以下一項或多項表現(xiàn)形式向用戶呈現(xiàn)查詢得到的樂曲的元數(shù)據(jù): 語音、文本、圖片和流媒體。7.根據(jù)權(quán)利要求6所述的方法,其特征在于,在預(yù)設(shè)位置以以下一項或多項呈現(xiàn)方式向用戶呈現(xiàn)查詢得到的樂曲的元數(shù)據(jù): 預(yù)設(shè)顏色、預(yù)設(shè)亮度和預(yù)設(shè)遮罩狀態(tài)。8.一種在播放視頻的設(shè)備中識別視頻中音頻的裝置,其特征在于,所述裝置包括: 截取模塊,用于響應(yīng)于用戶的截取指令而截取正在播放的視頻中的音頻信息; 提取模塊,用于對截取的音頻信息提取音頻特征,得到待識別音頻指紋; 比對模塊,用于比對所述待識別音頻指紋與預(yù)設(shè)的音頻指紋數(shù)據(jù)庫中的樂曲音頻指紋的相似度; 獲取模塊,用于按照相似度從高至低,獲取預(yù)設(shè)數(shù)量的樂曲音頻指紋,查詢以獲取的音頻指紋為索引的樂曲的元數(shù)據(jù); 呈現(xiàn)模塊,用于呈現(xiàn)查詢得到的樂曲的元數(shù)據(jù)。9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述裝置還包括: 接收模塊,用于接收用戶操作; 觸發(fā)模塊,用于響應(yīng)于所述用戶操作符合預(yù)設(shè)的觸發(fā)操作,觸發(fā)所述用戶的截取指令。10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述觸發(fā)模塊包括以下一項或多項: 選項觸發(fā)模塊,用于響應(yīng)于所述用戶操作為對正在播放的視頻中呈現(xiàn)的截取選項的選擇操作,并且所述選擇操作符合預(yù)設(shè)的觸發(fā)操作,觸發(fā)所述用戶的截取指令; 快捷鍵觸發(fā)模塊,用于響應(yīng)于所述用戶操作為對快捷鍵的按鍵操作,并且所述按鍵操作符合預(yù)設(shè)的觸發(fā)操作,觸發(fā)所述用戶的截取指令; 指紋觸發(fā)模塊,用于響應(yīng)于所述用戶操作為指紋輸入,并且所述指紋輸入為預(yù)設(shè)的觸發(fā)操作,觸發(fā)所述用戶的截取指令; 音波觸發(fā)模塊,用于響應(yīng)于所述用戶操作為音波輸入,并且所述音波輸入為預(yù)設(shè)的觸發(fā)操作,觸發(fā)所述用戶的截取指令;以及 感應(yīng)觸發(fā)模塊,用于響應(yīng)于所述用戶操作為正在播放視頻的設(shè)備感應(yīng)到的操作,并且所述感應(yīng)到的操作符合預(yù)設(shè)的觸發(fā)操作,觸發(fā)所述用戶的截取指令。11.根據(jù)權(quán)利要求8-10任意一項所述的裝置,其特征在于,所述截取模塊包括: 源音頻截取模塊,用于響應(yīng)于用戶的截取指令而截取所述正在播放的視頻的音頻源文件,得到截取的音頻信息;和/或 錄音截取模塊,用于響應(yīng)于用戶的截取指令而對所述正在播放的視頻進行錄音,得到截取的音頻信息。12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,以下一個或多個模塊設(shè)于云端服務(wù)器:提取模塊、比對模塊和獲取模塊。13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述呈現(xiàn)模塊通過以下一項或多項表現(xiàn)形式向用戶呈現(xiàn)查詢得到的樂曲的元數(shù)據(jù): 語音、文本、圖片和流媒體。14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述呈現(xiàn)模塊在預(yù)設(shè)位置以以下一項或多項呈現(xiàn)方式向用戶呈現(xiàn)查詢得到的樂曲的元數(shù)據(jù): 預(yù)設(shè)顏色、預(yù)設(shè)亮度和預(yù)設(shè)遮罩狀態(tài)。15.一種視頻播放裝置,其特征在于,所述視頻播放裝置包括如權(quán)利要求8-14任意一項所述的在播放視頻的設(shè)備中識別視頻中音頻的裝置。16.一種電子設(shè)備,其特征在于,所述電子設(shè)備包括: 如權(quán)利要求8-14任意一項所述的在播放視頻的設(shè)備中識別視頻中音頻的裝置;和/或 如權(quán)利要求15所述的視頻播放裝置。
【專利摘要】本申請公開了在播放視頻的設(shè)備中識別視頻中音頻的方法和裝置。所述方法的一【具體實施方式】包括:響應(yīng)于用戶的截取指令而截取正在播放的視頻中的音頻信息;對截取的音頻信息提取音頻特征,得到待識別音頻指紋;比對待識別音頻指紋與預(yù)設(shè)的音頻指紋數(shù)據(jù)庫中的樂曲音頻指紋的相似度;按照相似度從高至低,獲取預(yù)設(shè)數(shù)量的樂曲音頻指紋,查詢以獲取的音頻指紋為索引的樂曲的元數(shù)據(jù);呈現(xiàn)查詢得到的元數(shù)據(jù)。該實施方式降低了識別過程中的環(huán)境噪音,有效提高了音頻識別的精準(zhǔn)度以及音頻識別的成功率。
【IPC分類】H04N21/439, H04N21/4722, H04N21/4402, H04N21/435, H04N21/84, H04N21/433, H04N21/41
【公開號】CN105430494
【申請?zhí)枴緾N201510875730
【發(fā)明人】宋治云, 姜史哲
【申請人】百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
【公開日】2016年3月23日
【申請日】2015年12月2日
當(dāng)前第5頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1