本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別是涉及一種視頻中背景音樂的識(shí)別方法和移動(dòng)終端。
背景技術(shù):
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,移動(dòng)終端的使用越來越普遍。日常生活中,用戶經(jīng)常會(huì)使用移動(dòng)終端觀看視頻。比如,用戶利用手機(jī)來觀看視頻,為了渲染氣氛,視頻中經(jīng)常會(huì)設(shè)置背景音樂。在觀看視頻的過程中,經(jīng)常會(huì)出現(xiàn),用戶對(duì)該視頻的背景音樂產(chǎn)生了興趣,進(jìn)而想要獲知和該背景音樂有關(guān)的信息。
在先技術(shù)中,通常是用戶以聽到的該背景音樂的歌詞作為搜索依據(jù),來對(duì)該音樂進(jìn)行識(shí)別,進(jìn)而獲取和該背景音樂有關(guān)的信息。示例的,張三在觀看視頻a的時(shí)候,聽到此時(shí)背景音樂的歌詞為“你下了念”,以該聽到的歌詞“你下了念”作為搜索關(guān)鍵詞通過搜索引擎檢索獲得該背景音樂的歌名、演唱者、專輯等信息。
由于用戶根據(jù)聽到的音樂確定出的歌詞受環(huán)境噪音、播放效果影響較大,導(dǎo)致聽到的歌詞不夠清楚、準(zhǔn)確,以此作為搜索依據(jù),可能會(huì)造成識(shí)別結(jié)果不準(zhǔn)確的問題。示例的,張三觀看的視頻a的時(shí)候,聽到的背景音樂的歌詞實(shí)際上是“雨下整夜”,那么以張三聽到的“你下了念”作為搜索依據(jù),就會(huì)出現(xiàn)識(shí)別不準(zhǔn)確甚至識(shí)別失敗的情況。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種視頻中背景音樂的識(shí)別方法和移動(dòng)終端,以便解決對(duì)視頻中背景音樂識(shí)別不準(zhǔn)確的問題。
依據(jù)本發(fā)明的第一方面,提供了一種視頻中背景音樂的識(shí)別方法,應(yīng)用于移動(dòng)終端,該方法包括:
接收背景音樂識(shí)別指令;
根據(jù)所述背景音樂識(shí)別指令,對(duì)播放的視頻進(jìn)行音頻采集,將采集到的音頻數(shù)據(jù)作為待識(shí)別音頻數(shù)據(jù);
對(duì)所述待識(shí)別音頻數(shù)據(jù)進(jìn)行識(shí)別,獲取所述待識(shí)別音頻數(shù)據(jù)的音頻屬性并進(jìn)行顯示。
依據(jù)本發(fā)明的第二方面,提供了一種移動(dòng)終端,該移動(dòng)終端包括:
接收模塊,用于接收背景音樂識(shí)別指令;
采集模塊,用于根據(jù)所述背景音樂識(shí)別指令,對(duì)播放的視頻進(jìn)行音頻采集,將采集到的音頻數(shù)據(jù)作為待識(shí)別音頻數(shù)據(jù);
識(shí)別模塊,用于對(duì)所述待識(shí)別音頻數(shù)據(jù)進(jìn)行識(shí)別,獲取所述待識(shí)別音頻數(shù)據(jù)的音頻屬性并進(jìn)行顯示。
針對(duì)在先技術(shù),本發(fā)明具備如下優(yōu)點(diǎn):
本發(fā)明實(shí)施例提供的視頻中背景音樂的識(shí)別方法和移動(dòng)終端,在對(duì)視頻中背景音樂進(jìn)行識(shí)別的時(shí)候,可以直接采集移動(dòng)終端播放的視頻中的音頻數(shù)據(jù)作為待識(shí)別音頻數(shù)據(jù),進(jìn)行識(shí)別。由于待識(shí)別音頻數(shù)據(jù)是從終端內(nèi)部采集的,采集的時(shí)候不會(huì)受到環(huán)境噪音以及播放效果的影響,保證了搜索依據(jù)的準(zhǔn)確性,進(jìn)而提高了對(duì)于視頻中背景音樂識(shí)別的準(zhǔn)確性。
上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式。
附圖說明
通過閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
圖1示出了本發(fā)明實(shí)施例一的視頻中背景音樂的識(shí)別方法的流程圖;
圖2-1示出了本發(fā)明實(shí)施例二的視頻中背景音樂的識(shí)別方法的流程圖;
圖2-2是本發(fā)明實(shí)施例二提供的一種用戶界面的示意圖;
圖2-3是本發(fā)明實(shí)施例二提供的另一種用戶界面的示意圖;
圖2-4是本發(fā)明實(shí)施例二提供的又一種用戶界面的示意圖;
圖2-5是本發(fā)明實(shí)施例二提供的一種音頻采集方法的流程圖;
圖2-6是本發(fā)明實(shí)施例二提供的再一種用戶界面的示意圖;
圖2-7是本發(fā)明實(shí)施例二提供的一種識(shí)別方法的流程圖;
圖2-8是本發(fā)明實(shí)施例二提供的再一種用戶界面的示意圖;
圖2-9是本發(fā)明實(shí)施例二提供的再一種用戶界面的示意圖;
圖2-10是本發(fā)明實(shí)施例二提供的再一種用戶界面的示意圖;
圖2-11是本發(fā)明實(shí)施例二提供的再一種用戶界面的示意圖;
圖3本發(fā)明實(shí)施例提供的一種移動(dòng)終端的框圖;
圖4-1是本發(fā)明實(shí)施例提供的另一種移動(dòng)終端的框圖;
圖4-2是本發(fā)明實(shí)施例提供的又一種移動(dòng)終端的框圖;
圖4-3是本發(fā)明實(shí)施例提供的一種采集模塊的框圖;
圖4-4是本發(fā)明實(shí)施例提供的一種識(shí)別模塊的框圖;
圖5是本發(fā)明又一個(gè)實(shí)施例的移動(dòng)終端的框圖;
圖6是本發(fā)明又一個(gè)實(shí)施例的移動(dòng)終端的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將參照附圖更詳細(xì)地描述本發(fā)明的示例性實(shí)施例。雖然附圖中顯示了本發(fā)明的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本發(fā)明而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本發(fā)明,并且能夠?qū)⒈景l(fā)明的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
實(shí)施例一
參照?qǐng)D1,示出了本發(fā)明實(shí)施例一的視頻中背景音樂的識(shí)別方法的流程圖,該方法可以應(yīng)用于移動(dòng)終端,該移動(dòng)終端可以為智能手機(jī)、電腦、多媒體播放器等可以進(jìn)行視頻播放的設(shè)備。當(dāng)用戶通過移動(dòng)終端進(jìn)行視頻觀看時(shí),想對(duì)該視頻中的背景音樂進(jìn)行識(shí)別的時(shí)候,可以通過該方法來實(shí)現(xiàn),具體的,該方法可以包括如下步驟:
步驟101、接收背景音樂識(shí)別指令。
該背景音樂識(shí)別指令可以是用戶通過觸發(fā)背景音樂識(shí)別功能所產(chǎn)生的指令,用戶觸發(fā)背景音樂識(shí)別功能的方式,本發(fā)明實(shí)施例不做限定。用戶通過觸發(fā)背景音樂識(shí)別功能,產(chǎn)生背景音樂識(shí)別指令之后,移動(dòng)終端可以接收該背景音樂識(shí)別指令。
步驟102、根據(jù)所述背景音樂識(shí)別指令,對(duì)播放的視頻進(jìn)行音頻采集,將采集到的音頻數(shù)據(jù)作為待識(shí)別音頻數(shù)據(jù)。
該背景音樂識(shí)別指令可以指示移動(dòng)終端對(duì)當(dāng)前視頻中的背景音樂進(jìn)行識(shí)別。移動(dòng)終端可以根據(jù)該背景音樂識(shí)別指令,采集移動(dòng)終端播放的視頻中的音頻,其中,該采集到的音頻數(shù)據(jù)中包括了視頻中的背景音樂。
步驟103、對(duì)所述待識(shí)別音頻數(shù)據(jù)進(jìn)行識(shí)別,獲取所述待識(shí)別音頻數(shù)據(jù)的音頻屬性并進(jìn)行顯示。
其中,該待識(shí)別音頻數(shù)據(jù)的音頻屬性可以是該待識(shí)別音頻數(shù)據(jù)的相關(guān)信息,例如,該音頻數(shù)據(jù)的音頻名稱、音頻所屬專輯、音頻的播放鏈接地址以及音頻歌詞等。
綜上所述,本發(fā)明實(shí)施例提供的視頻中背景音樂的識(shí)別方法,在對(duì)視頻中背景音樂進(jìn)行識(shí)別的時(shí)候,可以直接采集移動(dòng)終端播放的視頻中的音頻數(shù)據(jù)作為待識(shí)別音頻數(shù)據(jù),進(jìn)行識(shí)別。由于待識(shí)別音頻數(shù)據(jù)是從終端內(nèi)部采集的,采集的時(shí)候不會(huì)受到環(huán)境噪音以及播放效果的影響,保證了搜索依據(jù)的準(zhǔn)確性,進(jìn)而提高了對(duì)于視頻中背景音樂識(shí)別的準(zhǔn)確性。
實(shí)施例二
參照?qǐng)D2-1,示出了本發(fā)明實(shí)施例二的視頻中背景音樂的識(shí)別方法的流程圖,具體的,可以包括如下步驟:
步驟201、接收背景音樂識(shí)別指令。
該背景音樂識(shí)別指令是用戶在進(jìn)行視頻觀看時(shí),通過觸發(fā)背景音樂識(shí)別功能所產(chǎn)生的指令,用戶觸發(fā)背景音樂識(shí)別功能的方式,本發(fā)明實(shí)施例不做限定,本發(fā)明實(shí)施例中以以下兩種可實(shí)現(xiàn)方式進(jìn)行說明:
第一種可實(shí)現(xiàn)方式:背景音樂識(shí)別功能可以通過按鈕觸發(fā),其中,該按鈕觸發(fā)可以為虛擬按鈕觸發(fā),也可以為實(shí)體按鈕觸發(fā)。
通過虛擬按鈕觸發(fā)的時(shí)候,可以在視頻播放界面中顯示一個(gè)背景音樂識(shí)別按鈕,用戶在需要對(duì)當(dāng)前視頻中的背景音樂進(jìn)行識(shí)別時(shí),可以點(diǎn)擊該背景音樂識(shí)別按鈕,觸發(fā)背景音樂識(shí)別功能,生成背景音樂識(shí)別指令。圖2-2是本發(fā)明實(shí)施例二提供的一種用戶界面的示意圖,參見圖2-2,該用戶界面中包括:當(dāng)前視頻播放界面00,位于當(dāng)前視頻播放界面00右上角的背景音樂識(shí)別按鈕01,該背景音樂識(shí)別按鈕01可以為圖2-2中所示的m形狀的按鈕。用戶可以點(diǎn)擊該背景音樂識(shí)別按鈕01,觸發(fā)背景音樂識(shí)別功能,生成背景音樂識(shí)別指令,無需退出視頻播放界面,即觸發(fā)對(duì)視頻背景音樂的識(shí)別。需要說明的是,圖2-2中的用戶界面只是舉例說明,實(shí)際應(yīng)用中,用戶界面所顯示的背景音樂識(shí)別按鈕的位置以及形狀可以根據(jù)具體情況設(shè)置,本發(fā)明實(shí)施例對(duì)此不作限定。
示例的,還可以在視頻播放界面之外的界面中設(shè)置背景音樂識(shí)別按鈕,,例如,可以在移動(dòng)終端的狀態(tài)欄中顯示一個(gè)背景音樂識(shí)別按鈕,用戶在需要對(duì)當(dāng)前視頻中的背景音樂進(jìn)行識(shí)別時(shí),可以下拉狀態(tài)欄,然后點(diǎn)擊該背景音樂識(shí)別按鈕,觸發(fā)背景音樂識(shí)別功能,生成背景音樂識(shí)別指令。圖2-3是本發(fā)明實(shí)施例二提供的另一種用戶界面的示意圖,參見圖2-3,該用戶界面中包括:狀態(tài)欄02,位于狀態(tài)欄02中的背景音樂識(shí)別按鈕01,該背景音樂識(shí)別按鈕01可以為圖2-3中所示的m形狀的按鈕。用戶可以點(diǎn)擊該背景音樂識(shí)別按鈕01,觸發(fā)背景音樂識(shí)別功能,生成背景音樂識(shí)別指令。
通過實(shí)體按鈕觸發(fā)的時(shí)候,可以利用移動(dòng)終端上的實(shí)體按鈕的組合來觸發(fā)。示例的,可以設(shè)置同時(shí)按下移動(dòng)終端的電源鍵和音量加鍵時(shí),觸發(fā)移動(dòng)終端顯示一個(gè)浮動(dòng)窗口,該浮動(dòng)窗口中可以顯示一個(gè)背景音樂識(shí)別按鈕,用戶可以點(diǎn)擊該背景音樂識(shí)別按鈕,觸發(fā)背景音樂識(shí)別功能。圖2-4是本發(fā)明實(shí)施例二提供的又一種用戶界面的示意圖,參見圖2-4,該用戶界面中包括:當(dāng)前視頻播放界面00,浮動(dòng)窗口03,位于浮動(dòng)窗口03中的背景音樂識(shí)別按鈕01,該背景音樂識(shí)別按鈕01可以為圖2-4中所示的m形狀的按鈕。用戶可以點(diǎn)擊該背景音樂識(shí)別按鈕01,觸發(fā)背景音樂識(shí)別功能,生成背景音樂識(shí)別指令,如果用戶想要取消背景音樂識(shí)別操作,可以通過點(diǎn)擊浮動(dòng)窗口03中的關(guān)閉按鈕04來取消。需要說明的是,圖2-4中的用戶界面只是舉例說明,實(shí)際應(yīng)用中,用戶界面所顯示的各個(gè)內(nèi)容的形狀以及位置,均可根據(jù)具體情況設(shè)置,本發(fā)明實(shí)施例對(duì)此不作限定。實(shí)際應(yīng)用中,還可以設(shè)置同時(shí)按下移動(dòng)終端的電源鍵和音量加鍵時(shí),直接觸發(fā)移動(dòng)終端的背景音樂識(shí)別功能,生成背景音樂識(shí)別指令。本發(fā)明實(shí)施例對(duì)于具體的實(shí)體按鈕組合不作限定,只要能起到觸發(fā)作用即可。例如,還可以設(shè)置:同時(shí)按下移動(dòng)終端的電源鍵和音量減鍵時(shí),觸發(fā)移動(dòng)終端的背景音樂識(shí)別功能。
第二種可實(shí)現(xiàn)方式:背景音樂識(shí)別功能還可以通過語音觸發(fā),在視頻應(yīng)用的后臺(tái)插入一個(gè)語音識(shí)別軟件,識(shí)別用戶的語音,當(dāng)用戶的語音中包含預(yù)設(shè)詞語時(shí),觸發(fā)背景音樂識(shí)別功能,例如,該預(yù)設(shè)詞語為“進(jìn)行背景音樂識(shí)別”。
步驟202、根據(jù)所述背景音樂識(shí)別指令,對(duì)播放的視頻進(jìn)行音頻采集,將采集到的音頻數(shù)據(jù)作為待識(shí)別音頻數(shù)據(jù)。
其中,該移動(dòng)終端包括音頻硬件抽象層以及音頻硬件單元。一般,移動(dòng)終端的音頻系統(tǒng)中,通常是,通過該音頻硬件抽象層來實(shí)現(xiàn)對(duì)音頻硬件單元的操作。示例的,該音頻硬件抽象層可以調(diào)用標(biāo)準(zhǔn)接口,來實(shí)現(xiàn)對(duì)音頻硬件單元的操作。
示例的,圖2-5是本發(fā)明實(shí)施例二提供的一種音頻采集方法的流程圖,如圖2-5所示,步驟202可以包括:
步驟2021、通過所述音頻硬件抽象層對(duì)所述音頻硬件單元中的音頻數(shù)據(jù)流進(jìn)行采集。
其中,該音頻數(shù)據(jù)流即為移動(dòng)終端播放的視頻中的音頻數(shù)據(jù)流。
步驟2022、將所述采集到的音頻數(shù)據(jù)流確定為待識(shí)別音頻數(shù)據(jù)。
該待識(shí)別音頻數(shù)據(jù)可以包括第一音頻數(shù)據(jù)和第二音頻數(shù)據(jù)。該第一音頻數(shù)據(jù)可以為背景音樂,該第二音頻數(shù)據(jù)可以為演員的對(duì)白、旁白、以及音效中的至少一種。其中,該音效可以為視頻中動(dòng)物的叫聲、機(jī)器的轟鳴聲或者自然界中的聲音等等。在視頻中,除背景音樂和演員對(duì)話之外的所有其他聲音,都可以確定為該音效,本發(fā)明實(shí)施例對(duì)此不作限定。
實(shí)際應(yīng)用中,視頻中往往包含了多種聲音,視頻在播放背景音樂的時(shí)候,通常也會(huì)伴隨有其他的聲音,例如,演員的對(duì)話、小鳥的鳴叫、風(fēng)聲、水流聲等等。因此,采集到的待識(shí)別音頻數(shù)據(jù)中會(huì)同時(shí)包括第一音頻數(shù)據(jù)和第二音頻數(shù)據(jù)。
步驟203、分離所述待識(shí)別音頻數(shù)據(jù)中的所述第二音頻數(shù)據(jù)或降低所述待識(shí)別音頻數(shù)據(jù)中的所述第二音頻數(shù)據(jù)的頻率。
當(dāng)采集到的待識(shí)別音頻數(shù)據(jù)為多聲道音頻數(shù)據(jù),可以分離待識(shí)別音頻數(shù)據(jù)中的第二音頻數(shù)據(jù)。多聲道音頻數(shù)據(jù)中存在和第一音頻數(shù)據(jù)對(duì)應(yīng)的第一音頻軌道以及和第二音頻數(shù)據(jù)對(duì)應(yīng)的第二音頻軌道。在分離的時(shí)候,可以將第二音頻軌道提取出來,完成分離操作。
當(dāng)采集到的待識(shí)別音頻數(shù)據(jù)為混縮的多聲道音頻數(shù)據(jù)時(shí),可以降低待識(shí)別音頻數(shù)據(jù)中的第二音頻數(shù)據(jù)的頻率。由于該多聲道音頻數(shù)據(jù)是混縮在一起的,這種情況下,無法通過提取音軌的方式來分離第二音頻數(shù)據(jù)。此時(shí),可以對(duì)第二音頻數(shù)據(jù)進(jìn)行頻率衰減,進(jìn)而降低待識(shí)別音頻數(shù)據(jù)中的第二音頻數(shù)據(jù)的頻率。
在對(duì)背景音樂識(shí)別的時(shí)候,是以采集到的待識(shí)別音頻數(shù)據(jù)作為識(shí)別依據(jù),來進(jìn)行識(shí)別的。由于待識(shí)別音頻數(shù)據(jù)中同時(shí)包括了第一音頻數(shù)據(jù)和第二音頻數(shù)據(jù),而識(shí)別操作的主要對(duì)象是第一音頻數(shù)據(jù),即,視頻中背景音樂,所以第二音頻數(shù)據(jù)會(huì)對(duì)識(shí)別操作產(chǎn)生一定的干擾,導(dǎo)致識(shí)別操作不準(zhǔn)確。本發(fā)明實(shí)施例先對(duì)待識(shí)別音頻數(shù)據(jù)中第二音頻數(shù)據(jù)進(jìn)行分離或者降低,然后再對(duì)待識(shí)別音頻進(jìn)行識(shí)別,減弱了第二音頻數(shù)據(jù)造成的干擾,進(jìn)而可以提高識(shí)別的準(zhǔn)確度。
步驟204、對(duì)所述待識(shí)別音頻數(shù)據(jù)進(jìn)行識(shí)別,獲取所述待識(shí)別音頻數(shù)據(jù)的音頻屬性并進(jìn)行顯示。
圖2-6是本發(fā)明實(shí)施例二提供的再一種用戶界面的示意圖,該用戶界面示意圖片是移動(dòng)終端對(duì)待識(shí)別音頻數(shù)據(jù)進(jìn)行識(shí)別時(shí),顯示的用戶界面示意圖。參見圖2-6,該用戶界面中包括:當(dāng)前視頻播放界面00,位于當(dāng)前視頻播放界面00中的“正在識(shí)別”的提示窗口05,該提示窗口05可以用來表示識(shí)別操作正在進(jìn)行。
本發(fā)明實(shí)施例中的音頻屬性可以包括音頻名稱、音頻所屬專輯、音頻的播放鏈接地址以及音頻歌詞。實(shí)際應(yīng)用中,該音頻屬性還可以包括其他信息,例如,演唱該音頻的歌手信息、音頻所述專輯封面等,本發(fā)明實(shí)施例對(duì)此不作限定。圖2-7是本發(fā)明實(shí)施例二提供的一種識(shí)別方法的流程圖,如圖2-7所示,步驟204可以包括:
步驟2041、從預(yù)設(shè)數(shù)據(jù)庫中查找與所述待識(shí)別音頻數(shù)據(jù)相匹配的目標(biāo)音頻數(shù)據(jù)。
其中,該預(yù)設(shè)數(shù)據(jù)庫中存儲(chǔ)有至少一個(gè)音頻數(shù)據(jù),以及與所述每一個(gè)音頻數(shù)據(jù)對(duì)應(yīng)的音頻屬性。實(shí)際應(yīng)用中,該預(yù)設(shè)數(shù)據(jù)庫中還可以存儲(chǔ)有音頻數(shù)據(jù)的特征信息以及音頻數(shù)據(jù)的標(biāo)識(shí)信息等,本發(fā)明實(shí)施例對(duì)此不作限定。
具體的,在進(jìn)行查找的時(shí)候,可以通過特征信息比對(duì)的方式來查找,該特征信息可以是音頻數(shù)據(jù)的音頻指紋。音頻指紋是可以代表音頻數(shù)據(jù)的重要聲學(xué)特征,且基于該音頻數(shù)據(jù)內(nèi)容的緊致數(shù)字簽名,一個(gè)音頻數(shù)據(jù)對(duì)應(yīng)一個(gè)音頻指紋。在進(jìn)行識(shí)別的時(shí)候,可以先計(jì)算該待識(shí)別音頻數(shù)據(jù)的第一特征信息,然后在預(yù)設(shè)數(shù)據(jù)庫中查找和該第一特征信息相匹配第二特征信息,將該第二特征信息對(duì)應(yīng)的音頻數(shù)據(jù),確定為目標(biāo)音頻數(shù)據(jù)。
步驟2042、若查找成功,獲取所述目標(biāo)音頻數(shù)據(jù)的音頻屬性,將所述目標(biāo)音頻數(shù)據(jù)的音頻屬性作為所述待識(shí)別音頻數(shù)據(jù)的音頻屬性并進(jìn)行顯示。
一般情況下,視頻中的背景音樂可以為有歌詞的背景音樂,也可以為無有歌詞背景音樂。示例的,步驟2042可以包括:
步驟2042a、當(dāng)所述背景音樂為有歌詞的背景音樂時(shí),將所述目標(biāo)音頻數(shù)據(jù)的音頻歌詞與所述移動(dòng)終端當(dāng)前正在播放的視頻中背景音樂進(jìn)行同步匹配顯示。
其中,本發(fā)明實(shí)施例中的同步匹配顯示可以是根據(jù)視頻當(dāng)前背景音樂的演唱進(jìn)度,將音頻歌詞進(jìn)行同步顯示。這樣,用戶可以通過顯示的歌詞確認(rèn)識(shí)別的準(zhǔn)確性,同時(shí)同步顯示的歌詞不會(huì)影響當(dāng)前視頻的播放產(chǎn)生影響,保證了用戶的觀看體驗(yàn)。
例如,當(dāng)背景音樂演唱到“到想象的地方穿越了時(shí)光”的時(shí)候,此時(shí)可以將該句“到想象的地方穿越了時(shí)光”顯示在當(dāng)前視頻播放界面中。圖2-8是本發(fā)明實(shí)施例二提供的再一種用戶界面的示意圖,參見圖2-8,該用戶界面中包括:當(dāng)前視頻播放界面00,位于當(dāng)前視頻播放界面00中的歌詞框06,該歌詞框06中顯示著和當(dāng)前視頻中背景音樂相對(duì)應(yīng)的當(dāng)前歌詞“到想象的地方穿越了時(shí)光”,歌詞框06中還包括重新識(shí)別按鈕07,該重新識(shí)別按鈕可以為圖2-8中所示的r形狀按鈕,如果用戶發(fā)現(xiàn)當(dāng)前顯示的歌詞有誤,僅通過點(diǎn)擊該重新識(shí)別按鈕07就可以進(jìn)行重新識(shí)別,簡(jiǎn)化了重新識(shí)別的操作過程。如果用戶想要取消歌詞顯示,可以通過點(diǎn)擊歌詞框06中的關(guān)閉按鈕04來關(guān)閉。
當(dāng)背景音樂演唱到下一句“來我們坐上時(shí)光機(jī)”的時(shí)候,此時(shí)可以將該句“來我們坐上時(shí)光機(jī)”顯示在當(dāng)前視頻播放界面中。圖2-9是本發(fā)明實(shí)施例二提供的再一種用戶界面的示意圖,參見圖2-9,該用戶界面中包括:當(dāng)前視頻播放界面00,位于當(dāng)前視頻播放界面00中的歌詞框06,該歌詞框06中顯示著和當(dāng)前視頻中背景音樂相對(duì)應(yīng)的當(dāng)前歌詞“來我們坐上時(shí)光機(jī)”,歌詞框06中還包括重新識(shí)別按鈕07,該重新識(shí)別按鈕可以為圖2-9中所示的r形狀按鈕,如果用戶發(fā)現(xiàn)當(dāng)前顯示的歌詞有誤,僅通過點(diǎn)擊該重新識(shí)別按鈕07就可以進(jìn)行重新識(shí)別,簡(jiǎn)化了重新識(shí)別的操作過程。如果用戶想要取消歌詞顯示,可以通過點(diǎn)擊歌詞框06中的關(guān)閉按鈕04來關(guān)閉。這樣,將音頻歌詞和背景音樂同步顯示,可以方便用戶觀看。
實(shí)際應(yīng)用中,還可以在同步顯示歌詞的同時(shí),顯示“查看具體信息”選項(xiàng),用戶可以通過點(diǎn)擊該“查看具體信息”來查看和背景音樂的具體信息需要說明的是,上述的顯示方式僅為本發(fā)明實(shí)施例一種示意性方式,在本發(fā)明另一可選實(shí)施例中,還可以是,在識(shí)別成功之后,跳轉(zhuǎn)至識(shí)別成功界面,在該識(shí)別成功界面中顯示該有歌詞的背景音樂的音頻名稱、音頻專輯、音頻播放鏈接地址以及音頻歌詞。
步驟2042b、當(dāng)所述背景音樂為無歌詞的背景音樂時(shí),將所述目標(biāo)音頻數(shù)據(jù)的音頻名稱、音頻所屬專輯、音頻的播放鏈接地址進(jìn)行顯示。
該無歌詞的背景音樂可以為一段純音樂。示例的,在識(shí)別成功之后,可以直接將該純音樂的名稱,所屬的專輯,以及播放鏈接地址顯示在當(dāng)前播放界面中,圖2-10是本發(fā)明實(shí)施例二提供的再一種用戶界面的示意圖,參見圖2-10,該用戶界面中包括:當(dāng)前視頻播放界面00,位于當(dāng)前視頻播放界面00中的識(shí)別成功窗口08,該識(shí)別成功窗口08中顯示著和當(dāng)前視頻中背景音樂相對(duì)應(yīng)的音頻名稱、音頻所屬專輯以及播放鏈接地址。如果用戶想要取消識(shí)別成功窗口08的顯示,可以通過點(diǎn)擊識(shí)別成功窗口08中的關(guān)閉按鈕04來關(guān)閉。也可以跳轉(zhuǎn)至識(shí)別成功界面,在識(shí)別成功界面中進(jìn)行顯示。
步驟2043、若查找失敗,顯示是否重新識(shí)別標(biāo)識(shí)。
如果未識(shí)別成功,即就是,查找失敗,可以在視頻播放界面中顯示一個(gè)“是否重新識(shí)別標(biāo)識(shí)”,該標(biāo)識(shí)可以用來提醒用戶當(dāng)前識(shí)別操作失敗,是否需要對(duì)重新識(shí)別。圖2-11是本發(fā)明實(shí)施例二提供的再一種用戶界面的示意圖,參見圖2-11,該用戶界面中包括:當(dāng)前視頻播放界面00,位于當(dāng)前視頻播放界面00中的是否重新識(shí)別標(biāo)識(shí)09,該是否重新識(shí)別標(biāo)識(shí)09中包括“是”選項(xiàng)10和“否”選項(xiàng)11。當(dāng)用戶需要對(duì)該背景音樂進(jìn)行重新識(shí)別的時(shí)候,可以通過點(diǎn)擊該標(biāo)識(shí)中的“是”選項(xiàng)10,來實(shí)現(xiàn)重新識(shí)別。如果用戶不需要對(duì)該背景音樂進(jìn)行重新識(shí)別,可以通過點(diǎn)擊“否”選項(xiàng)11,來結(jié)束識(shí)別操作,繼續(xù)觀看視頻。
綜上所述,本發(fā)明實(shí)施例提供的視頻中背景音樂的識(shí)別方法,在對(duì)視頻中背景音樂進(jìn)行識(shí)別的時(shí)候,可以直接采集移動(dòng)終端播放的視頻中的音頻數(shù)據(jù)作為待識(shí)別音頻數(shù)據(jù),進(jìn)行識(shí)別。由于待識(shí)別音頻數(shù)據(jù)是從終端內(nèi)部采集的,采集的時(shí)候不會(huì)受到環(huán)境噪音以及播放效果的影響,保證了搜索依據(jù)的準(zhǔn)確性,進(jìn)而提高了對(duì)于視頻中背景音樂識(shí)別的準(zhǔn)確性。
需要說明的是,對(duì)于前述的方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作并不一定是本發(fā)明所必需的。
實(shí)施例三
圖3是本發(fā)明實(shí)施例提供的一種移動(dòng)終端的框圖,如圖3所示,該移動(dòng)終端30可以包括:
接收模塊301,用于接收背景音樂識(shí)別指令。
采集模塊302,用于根據(jù)所述背景音樂識(shí)別指令,對(duì)播放的視頻進(jìn)行音頻采集,將采集到的音頻數(shù)據(jù)作為待識(shí)別音頻數(shù)據(jù)。
識(shí)別模塊303,用于對(duì)所述待識(shí)別音頻數(shù)據(jù)進(jìn)行識(shí)別,獲取所述待識(shí)別音頻數(shù)據(jù)的音頻屬性并進(jìn)行顯示。
綜上所述,本發(fā)明實(shí)施例提供的移動(dòng)終端,在對(duì)視頻中背景音樂進(jìn)行識(shí)別的時(shí)候,可以直接采集移動(dòng)終端播放的視頻中的音頻數(shù)據(jù)作為待識(shí)別音頻數(shù)據(jù),進(jìn)行識(shí)別。由于待識(shí)別音頻數(shù)據(jù)是從終端內(nèi)部采集的,采集的時(shí)候不會(huì)受到環(huán)境噪音以及播放效果的影響,保證了搜索依據(jù)的準(zhǔn)確性,進(jìn)而提高了對(duì)于視頻中背景音樂識(shí)別的準(zhǔn)確性。
實(shí)施例四
圖4-1是本發(fā)明實(shí)施例提供的另一種移動(dòng)終端的框圖,如圖4-1所示,該移動(dòng)終端40可以包括:
接收模塊401,用于接收背景音樂識(shí)別指令。
采集模塊402,用于根據(jù)所述背景音樂識(shí)別指令,對(duì)播放的視頻進(jìn)行音頻采集,將采集到的音頻數(shù)據(jù)作為待識(shí)別音頻數(shù)據(jù)。
識(shí)別模塊403,用于對(duì)所述待識(shí)別音頻數(shù)據(jù)進(jìn)行識(shí)別,獲取所述待識(shí)別音頻數(shù)據(jù)的音頻屬性并進(jìn)行顯示。
圖4-2是本發(fā)明實(shí)施例提供的又一種移動(dòng)終端的框圖,如圖4-2所示,該移動(dòng)終端40可以包括:接收模塊401、采集模塊402、識(shí)別模塊403以及分離模塊404。
接收模塊401,用于接收背景音樂識(shí)別指令。
采集模塊402,用于根據(jù)所述背景音樂識(shí)別指令,對(duì)播放的視頻進(jìn)行音頻采集,將采集到的音頻數(shù)據(jù)作為待識(shí)別音頻數(shù)據(jù)。
識(shí)別模塊403,用于對(duì)所述待識(shí)別音頻數(shù)據(jù)進(jìn)行識(shí)別,獲取所述待識(shí)別音頻數(shù)據(jù)的音頻屬性并進(jìn)行顯示。
分離模塊404,用于分離所述待識(shí)別音頻數(shù)據(jù)中的第二音頻數(shù)據(jù)或降低所述待識(shí)別音頻數(shù)據(jù)中的所述第二音頻數(shù)據(jù)的頻率。
可選的,圖4-3是本發(fā)明實(shí)施例提供的一種采集模塊的框圖,如圖4-3所示,該采集模塊402可以包括:
采集子模塊4021,用于通過所述音頻硬件抽象層對(duì)所述音頻硬件單元中的音頻數(shù)據(jù)流進(jìn)行采集。
確定子模塊4022,用于將所述采集到的音頻數(shù)據(jù)流確定為待識(shí)別音頻數(shù)據(jù)。
可選的,圖4-4是本發(fā)明實(shí)施例提供的一種識(shí)別模塊的框圖,如圖4-4所示,該識(shí)別模塊403可以包括:
查找子模塊4031,用于從預(yù)設(shè)數(shù)據(jù)庫中查找與所述待識(shí)別音頻數(shù)據(jù)相匹配的目標(biāo)音頻數(shù)據(jù),其中,所述預(yù)設(shè)數(shù)據(jù)庫中存儲(chǔ)至少一個(gè)音頻數(shù)據(jù),以及與所述每一個(gè)音頻數(shù)據(jù)對(duì)應(yīng)的音頻屬性。
獲取子模塊4032,用于若查找成功,獲取所述目標(biāo)音頻數(shù)據(jù)的音頻屬性,將所述目標(biāo)音頻數(shù)據(jù)的音頻屬性作為所述待識(shí)別音頻數(shù)據(jù)的音頻屬性并進(jìn)行顯示。
顯示子模塊4033,用于若查找失敗,顯示是否重新識(shí)別標(biāo)識(shí)。
可選的,上述獲取子模塊4032,還可以用于:
當(dāng)所述背景音樂為有歌詞的背景音樂時(shí),將所述目標(biāo)音頻數(shù)據(jù)的音頻歌詞與所述移動(dòng)終端當(dāng)前正在播放的視頻中背景音樂進(jìn)行同步匹配顯示。
當(dāng)所述背景音樂為無歌詞的背景音樂時(shí),將所述目標(biāo)音頻數(shù)據(jù)的音頻名稱、音頻所屬專輯、音頻的播放鏈接地址進(jìn)行顯示。
綜上所述,本發(fā)明實(shí)施例提供的移動(dòng)終端,在對(duì)視頻中背景音樂進(jìn)行識(shí)別的時(shí)候,可以直接采集移動(dòng)終端播放的視頻中的音頻數(shù)據(jù)作為待識(shí)別音頻數(shù)據(jù),進(jìn)行識(shí)別。由于待識(shí)別音頻數(shù)據(jù)是從終端內(nèi)部采集的,采集的時(shí)候不會(huì)受到環(huán)境噪音以及播放效果的影響,保證了搜索依據(jù)的準(zhǔn)確性,進(jìn)而提高了對(duì)于視頻中背景音樂識(shí)別的準(zhǔn)確性。
實(shí)施例五
圖5是本發(fā)明另一個(gè)實(shí)施例的移動(dòng)終端的框圖。圖5所示的移動(dòng)終端500包括:至少一個(gè)處理器501、存儲(chǔ)器502、至少一個(gè)網(wǎng)絡(luò)接口504和用戶接口503。移動(dòng)終端500中的各個(gè)組件通過總線系統(tǒng)505耦合在一起??衫斫?,總線系統(tǒng)505用于實(shí)現(xiàn)這些組件之間的連接通信??偩€系統(tǒng)505除包括數(shù)據(jù)總線之外,還包括電源總線、控制總線和狀態(tài)信號(hào)總線。但是為了清楚說明起見,在圖5中將各種總線都標(biāo)為總線系統(tǒng)505。
其中,用戶接口503可以包括顯示器、鍵盤或者點(diǎn)擊設(shè)備(例如,鼠標(biāo),軌跡球(trackball)、觸感板或者柔性屏等。
可以理解,本發(fā)明實(shí)施例中的存儲(chǔ)器502可以是易失性存儲(chǔ)器或非易失性存儲(chǔ)器,或可包括易失性和非易失性存儲(chǔ)器兩者。其中,非易失性存儲(chǔ)器可以是只讀存儲(chǔ)器(read-onlymemory,rom)、可編程只讀存儲(chǔ)器(programmablerom,prom)、可擦除可編程只讀存儲(chǔ)器(erasableprom,eprom)、電可擦除可編程只讀存儲(chǔ)器(electricallyeprom,eeprom)或閃存。易失性存儲(chǔ)器可以是隨機(jī)存取存儲(chǔ)器(randomaccessmemory,ram),其用作外部高速緩存。通過示例性但不是限制性說明,許多形式的ram可用,例如靜態(tài)隨機(jī)存取存儲(chǔ)器(staticram,sram)、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(dynamicram,dram)、同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(synchronousdram,sdram)、雙倍數(shù)據(jù)速率同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(doubledataratesdram,ddrsdram)、增強(qiáng)型同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(enhancedsdram,esdram)、同步連接動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(synchlinkdram,sldram)和直接內(nèi)存總線隨機(jī)存取存儲(chǔ)器(directrambusram,drram)。本發(fā)明實(shí)施例描述的系統(tǒng)和方法的存儲(chǔ)器502旨在包括但不限于這些和任意其它適合類型的存儲(chǔ)器。
在一些實(shí)施方式中,存儲(chǔ)器502存儲(chǔ)了如下的元素,可執(zhí)行模塊或者數(shù)據(jù)結(jié)構(gòu),或者他們的子集,或者他們的擴(kuò)展集:操作系統(tǒng)5021和應(yīng)用程序5022。
其中,操作系統(tǒng)5021,包含各種系統(tǒng)程序,例如框架層、核心庫層、驅(qū)動(dòng)層等,用于實(shí)現(xiàn)各種基礎(chǔ)業(yè)務(wù)以及處理基于硬件的任務(wù)。應(yīng)用程序5022,包含各種應(yīng)用程序,例如媒體播放器(mediaplayer)、瀏覽器(browser)等,用于實(shí)現(xiàn)各種應(yīng)用業(yè)務(wù)。實(shí)現(xiàn)本發(fā)明實(shí)施例方法的程序可以包含在應(yīng)用程序5022中。
在本發(fā)明實(shí)施例中,通過調(diào)用存儲(chǔ)器502存儲(chǔ)的程序或指令,具體的,可以是應(yīng)用程序5022中存儲(chǔ)的程序或指令,處理器501用于接收背景音樂識(shí)別指令,根據(jù)所述背景音樂識(shí)別指令,對(duì)播放的視頻進(jìn)行音頻采集,將采集到的音頻數(shù)據(jù)作為待識(shí)別音頻數(shù)據(jù),對(duì)所述待識(shí)別音頻數(shù)據(jù)進(jìn)行識(shí)別,獲取所述待識(shí)別音頻數(shù)據(jù)的音頻屬性并進(jìn)行顯示。
上述本發(fā)明實(shí)施例揭示的方法可以應(yīng)用于處理器501中,或者由處理器501實(shí)現(xiàn)。處理器501可能是一種集成電路芯片,具有信號(hào)的處理能力。在實(shí)現(xiàn)過程中,上述方法的各步驟可以通過處理器501中的硬件的集成邏輯電路或者軟件形式的指令完成。上述的處理器501可以是通用處理器、數(shù)字信號(hào)處理器(digitalsignalprocessor,dsp)、專用集成電路(applicationspecificintegratedcircuit,asic)、現(xiàn)成可編程門陣列(fieldprogrammablegatearray,fpga)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件??梢詫?shí)現(xiàn)或者執(zhí)行本發(fā)明實(shí)施例中的公開的各方法、步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規(guī)的處理器等。結(jié)合本發(fā)明實(shí)施例所公開的方法的步驟可以直接體現(xiàn)為硬件譯碼處理器執(zhí)行完成,或者用譯碼處理器中的硬件及軟件模塊組合執(zhí)行完成。軟件模塊可以位于隨機(jī)存儲(chǔ)器,閃存、只讀存儲(chǔ)器,可編程只讀存儲(chǔ)器或者電可擦寫可編程存儲(chǔ)器、寄存器等本領(lǐng)域成熟的存儲(chǔ)介質(zhì)中。該存儲(chǔ)介質(zhì)位于存儲(chǔ)器502,處理器501讀取存儲(chǔ)器502中的信息,結(jié)合其硬件完成上述方法的步驟。
可以理解的是,本發(fā)明實(shí)施例描述的這些實(shí)施例可以用硬件、軟件、固件、中間件、微碼或其組合來實(shí)現(xiàn)。對(duì)于硬件實(shí)現(xiàn),處理單元可以實(shí)現(xiàn)在一個(gè)或多個(gè)專用集成電路(applicationspecificintegratedcircuits,asic)、數(shù)字信號(hào)處理器(digitalsignalprocessing,dsp)、數(shù)字信號(hào)處理設(shè)備(dspdevice,dspd)、可編程邏輯設(shè)備(programmablelogicdevice,pld)、現(xiàn)場(chǎng)可編程門陣列(field-programmablegatearray,fpga)、通用處理器、控制器、微控制器、微處理器、用于執(zhí)行本申請(qǐng)所述功能的其它電子單元或其組合中。
對(duì)于軟件實(shí)現(xiàn),可通過執(zhí)行本發(fā)明實(shí)施例所述功能的模塊(例如過程、函數(shù)等)來實(shí)現(xiàn)本發(fā)明實(shí)施例所述的技術(shù)。軟件代碼可存儲(chǔ)在存儲(chǔ)器中并通過處理器執(zhí)行。存儲(chǔ)器可以在處理器中或在處理器外部實(shí)現(xiàn)。
可選地,所述移動(dòng)終端包括音頻硬件抽象層以及音頻硬件單元,所述處理器501還用于:通過所述音頻硬件抽象層對(duì)所述音頻硬件單元中的音頻數(shù)據(jù)流進(jìn)行采集,將所述采集到的音頻數(shù)據(jù)流確定為待識(shí)別音頻數(shù)據(jù)。
可選地,所述待識(shí)別音頻數(shù)據(jù)包括第一音頻數(shù)據(jù)和第二音頻數(shù)據(jù),其中,所述第一音頻數(shù)據(jù)為所述視頻中的背景音樂,所述第二音頻數(shù)據(jù)為所述視頻中的演員對(duì)白、旁白以及音效中的至少一種,所述處理器501還用于:分離所述待識(shí)別音頻數(shù)據(jù)中的所述第二音頻數(shù)據(jù)或降低所述待識(shí)別音頻數(shù)據(jù)中的所述第二音頻數(shù)據(jù)的頻率。
可選地,所述處理器501還用于:從預(yù)設(shè)數(shù)據(jù)庫中查找與所述待識(shí)別音頻數(shù)據(jù)相匹配的目標(biāo)音頻數(shù)據(jù),其中,所述預(yù)設(shè)數(shù)據(jù)庫中存儲(chǔ)至少一個(gè)音頻數(shù)據(jù),以及與所述每一個(gè)音頻數(shù)據(jù)對(duì)應(yīng)的音頻屬性,若查找成功,獲取所述目標(biāo)音頻數(shù)據(jù)的音頻屬性,將所述目標(biāo)音頻數(shù)據(jù)的音頻屬性作為所述待識(shí)別音頻數(shù)據(jù)的音頻屬性并進(jìn)行顯示,若查找失敗,顯示是否重新識(shí)別標(biāo)識(shí)。
可選地,所述音頻屬性包括音頻名稱、音頻所屬專輯、音頻的播放鏈接地址以及音頻歌詞中的至少一種,所述處理器501還用于:當(dāng)所述背景音樂為有歌詞的背景音樂時(shí),將所述目標(biāo)音頻數(shù)據(jù)的音頻歌詞與所述移動(dòng)終端當(dāng)前正在播放的視頻中背景音樂進(jìn)行同步匹配顯示,當(dāng)所述背景音樂為無歌詞的背景音樂時(shí),將所述目標(biāo)音頻數(shù)據(jù)的音頻名稱、音頻所屬專輯、音頻的播放鏈接地址進(jìn)行顯示。
移動(dòng)終端500能夠?qū)崿F(xiàn)前述實(shí)施例中移動(dòng)終端實(shí)現(xiàn)的各個(gè)過程,為避免重復(fù),這里不再贅述。本發(fā)明實(shí)施例中,移動(dòng)終端500可以在對(duì)視頻中背景音樂進(jìn)行識(shí)別的時(shí)候,直接采集移動(dòng)終端播放的視頻中的音頻數(shù)據(jù)作為待識(shí)別音頻數(shù)據(jù),進(jìn)行識(shí)別。由于待識(shí)別音頻數(shù)據(jù)是從終端內(nèi)部采集的,采集的時(shí)候不會(huì)受到環(huán)境噪音以及播放效果的影響,保證了搜索依據(jù)的準(zhǔn)確性,進(jìn)而提高了對(duì)于視頻中背景音樂識(shí)別的準(zhǔn)確性。
實(shí)施例六
圖6是本發(fā)明另一個(gè)實(shí)施例的移動(dòng)終端的結(jié)構(gòu)示意圖。具體地,圖6中的移動(dòng)終端600可以為手機(jī)、平板電腦、個(gè)人數(shù)字助理(personaldigitalassistant,pda)、或車載電腦等。
圖6中的移動(dòng)終端600包括射頻(radiofrequency,rf)電路610、存儲(chǔ)器620、輸入單元630、顯示單元640、處理器660、音頻電路670、無線局域網(wǎng)(wirelessfidelity)模塊680和電源690。
其中,輸入單元630可用于接收用戶輸入的數(shù)字或字符信息,以及產(chǎn)生與移動(dòng)終端600的用戶設(shè)置以及功能控制有關(guān)的信號(hào)輸入。具體地,本發(fā)明實(shí)施例中,該輸入單元630可以包括觸控面板631。觸控面板631,可收集用戶在其上或附近的觸摸操作(比如用戶使用手指、觸筆等任何適合的物體或附件在觸控面板631上的操作),并根據(jù)預(yù)先設(shè)定的程式驅(qū)動(dòng)相應(yīng)的連接裝置??蛇x的,觸控面板631可包括觸摸檢測(cè)裝置和觸摸控制器兩個(gè)部分。其中,觸摸檢測(cè)裝置檢測(cè)用戶的觸摸方位,并檢測(cè)觸摸操作帶來的信號(hào),將信號(hào)傳送給觸摸控制器;觸摸控制器從觸摸檢測(cè)裝置上接收觸摸信息,并將它轉(zhuǎn)換成觸點(diǎn)坐標(biāo),再送給該處理器660,并能接收處理器660發(fā)來的命令并加以執(zhí)行。此外,可以采用電阻式、電容式、紅外線以及表面聲波等多種類型實(shí)現(xiàn)觸控面板631。除了觸控面板631,輸入單元630還可以包括其他輸入設(shè)備632,其他輸入設(shè)備632可以包括但不限于物理鍵盤、功能鍵(比如音量控制按鍵、開關(guān)按鍵等)、軌跡球、鼠標(biāo)、操作桿等中的一種或多種。
其中,顯示單元640可用于顯示由用戶輸入的信息或提供給用戶的信息以及移動(dòng)終端600的各種菜單界面。顯示單元640可包括顯示面板641,可選的,可以采用lcd或有機(jī)發(fā)光二極管(organiclight-emittingdiode,oled)等形式來配置顯示面板641。
應(yīng)注意,觸控面板631可以覆蓋顯示面板641,形成觸摸顯示屏,當(dāng)該觸摸顯示屏檢測(cè)到在其上或附近的觸摸操作后,傳送給處理器660以確定觸摸事件的類型,隨后處理器660根據(jù)觸摸事件的類型在觸摸顯示屏上提供相應(yīng)的視覺輸出。
觸摸顯示屏包括應(yīng)用程序界面顯示區(qū)及常用控件顯示區(qū)。該應(yīng)用程序界面顯示區(qū)及該常用控件顯示區(qū)的排列方式并不限定,可以為上下排列、左右排列等可以區(qū)分兩個(gè)顯示區(qū)的排列方式。該應(yīng)用程序界面顯示區(qū)可以用于顯示應(yīng)用程序的界面。每一個(gè)界面可以包含至少一個(gè)應(yīng)用程序的圖標(biāo)和/或widget桌面控件等界面元素。該應(yīng)用程序界面顯示區(qū)也可以為不包含任何內(nèi)容的空界面。該常用控件顯示區(qū)用于顯示使用率較高的控件,例如,設(shè)置按鈕、界面編號(hào)、滾動(dòng)條、電話本圖標(biāo)等應(yīng)用程序圖標(biāo)等。
其中處理器660是移動(dòng)終端600的控制中心,利用各種接口和線路連接整個(gè)手機(jī)的各個(gè)部分,通過運(yùn)行或執(zhí)行存儲(chǔ)在第一存儲(chǔ)器621內(nèi)的軟件程序和/或模塊,以及調(diào)用存儲(chǔ)在第二存儲(chǔ)器622內(nèi)的數(shù)據(jù),執(zhí)行移動(dòng)終端600的各種功能和處理數(shù)據(jù),從而對(duì)移動(dòng)終端600進(jìn)行整體監(jiān)控??蛇x的,處理器660可包括一個(gè)或多個(gè)處理單元。
在本發(fā)明實(shí)施例中,通過調(diào)用存儲(chǔ)該第一存儲(chǔ)器621內(nèi)的軟件程序和/或模塊和/或該第二存儲(chǔ)器622內(nèi)的數(shù)據(jù),處理器660用于接收背景音樂識(shí)別指令,根據(jù)所述背景音樂識(shí)別指令,對(duì)播放的視頻進(jìn)行音頻采集,將采集到的音頻數(shù)據(jù)作為待識(shí)別音頻數(shù)據(jù),對(duì)所述待識(shí)別音頻數(shù)據(jù)進(jìn)行識(shí)別,獲取所述待識(shí)別音頻數(shù)據(jù)的音頻屬性并進(jìn)行顯示。
可選地,所述移動(dòng)終端包括音頻硬件抽象層以及音頻硬件單元,所述處理器660還用于:通過所述音頻硬件抽象層對(duì)所述音頻硬件單元中的音頻數(shù)據(jù)流進(jìn)行采集,將所述采集到的音頻數(shù)據(jù)流確定為待識(shí)別音頻數(shù)據(jù)。
可選地,所述待識(shí)別音頻數(shù)據(jù)包括第一音頻數(shù)據(jù)和第二音頻數(shù)據(jù),其中,所述第一音頻數(shù)據(jù)為所述視頻中的背景音樂,所述第二音頻數(shù)據(jù)為所述視頻中的演員對(duì)白、旁白以及音效中的至少一種,所述處理器660還用于:分離所述待識(shí)別音頻數(shù)據(jù)中的所述第二音頻數(shù)據(jù)或降低所述待識(shí)別音頻數(shù)據(jù)中的所述第二音頻數(shù)據(jù)的頻率。
可選地,所述處理器660還用于:從預(yù)設(shè)數(shù)據(jù)庫中查找與所述待識(shí)別音頻數(shù)據(jù)相匹配的目標(biāo)音頻數(shù)據(jù),其中,所述預(yù)設(shè)數(shù)據(jù)庫中存儲(chǔ)至少一個(gè)音頻數(shù)據(jù),以及與所述每一個(gè)音頻數(shù)據(jù)對(duì)應(yīng)的音頻屬性,若查找成功,獲取所述目標(biāo)音頻數(shù)據(jù)的音頻屬性,將所述目標(biāo)音頻數(shù)據(jù)的音頻屬性作為所述待識(shí)別音頻數(shù)據(jù)的音頻屬性并進(jìn)行顯示,若查找失敗,顯示是否重新識(shí)別標(biāo)識(shí)。
可選地,述音頻屬性包括音頻名稱、音頻所屬專輯、音頻的播放鏈接地址以及音頻歌詞中的至少一種,所述處理器660還用于:當(dāng)所述背景音樂為有歌詞的背景音樂時(shí),將所述目標(biāo)音頻數(shù)據(jù)的音頻歌詞與所述移動(dòng)終端當(dāng)前正在播放的視頻中背景音樂進(jìn)行同步匹配顯示,當(dāng)所述背景音樂為無歌詞的背景音樂時(shí),將所述目標(biāo)音頻數(shù)據(jù)的音頻名稱、音頻所屬專輯、音頻的播放鏈接地址進(jìn)行顯示??梢?,本發(fā)明實(shí)施例中,移動(dòng)終端600可以在對(duì)視頻中背景音樂進(jìn)行識(shí)別的時(shí)候,直接采集移動(dòng)終端播放的視頻中的音頻數(shù)據(jù)作為待識(shí)別音頻數(shù)據(jù),進(jìn)行識(shí)別。由于待識(shí)別音頻數(shù)據(jù)是從終端內(nèi)部采集的,采集的時(shí)候不會(huì)受到環(huán)境噪音以及播放效果的影響,保證了搜索依據(jù)的準(zhǔn)確性,進(jìn)而提高了對(duì)于視頻中背景音樂識(shí)別的準(zhǔn)確性。
對(duì)于上述裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡(jiǎn)單,相關(guān)之處參見方法實(shí)施例的部分說明即可。
本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見即可。
本領(lǐng)域技術(shù)人員易于想到的是:上述各個(gè)實(shí)施例的任意組合應(yīng)用都是可行的,故上述各個(gè)實(shí)施例之間的任意組合都是本發(fā)明的實(shí)施方案,但是由于篇幅限制,本說明書在此就不一一詳述了。
在此提供的視頻中背景音樂的識(shí)別方法不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造具有本發(fā)明方案的系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對(duì)任何特定編程語言。應(yīng)當(dāng)明白,可以利用各種編程語言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。
在此處所提供的說明書中,說明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說明書的理解。
類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本發(fā)明并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個(gè)實(shí)施例的所有特征。因此,遵循具體實(shí)施方式的權(quán)利要求書由此明確地并入該具體實(shí)施方式,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進(jìn)行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來代替。
此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來使用。
本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(dsp)來實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的視頻中背景音樂的識(shí)別方法中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。
應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過同一個(gè)硬件項(xiàng)來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。