本發(fā)明涉及電子技術(shù)領(lǐng)域,具體涉及一種音頻處理方法及裝置。
背景技術(shù):
隨著媒體技術(shù)的發(fā)展,音頻處理已經(jīng)成為比較重要的一項(xiàng)媒體處理技術(shù),同時隨著音頻處理技術(shù)的發(fā)展,各種音頻應(yīng)用也應(yīng)運(yùn)而生,用戶可以通過音頻應(yīng)用從網(wǎng)上下載歌曲,保存至本地,當(dāng)需要播放時,進(jìn)行播放,或者用戶可以直接通過音頻應(yīng)用在線播放歌曲,通常存在這樣一種情況,用戶在聽某一首音樂時,很喜歡其中一段,比如音樂高潮部分,非常希望能夠?qū)⒃摱我魳窂恼麄€音頻文件中截取出來成為一個單獨(dú)的音頻文件,后續(xù)可以將該段音樂作為鈴聲,現(xiàn)有的音樂截取方式采用的是,用戶需要反復(fù)設(shè)置開始和結(jié)束點(diǎn)試聽才能確定要截取音頻的精確起始時間和結(jié)束時間,這種方案效率非常低。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供一種音頻處理方法及裝置,可通過選擇音頻文本的第一位置和第二位置,從待處理音頻文件中截取音頻,使用方便,效率高。
本發(fā)明第一方面提供一種音頻處理方法,包括:
接收音頻截取指令,所述音頻截取指令包括音頻文本中的第一位置和所述音頻文本中的第二位置,所述音頻文本為待處理音頻文件對應(yīng)的文本,所述第一位置和所述第二位置為用戶在所述音頻文本中選取的位置;
從所述待處理音頻文件中查找與所述第一位置對應(yīng)的第一音頻時間;
從所述待處理音頻文件中查找與所述第二位置對應(yīng)的第二音頻時間;
提取所述待處理音頻文件中所述第一音頻時間與所述第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件。
本發(fā)明第二方面提供一種音頻處理裝置,包括:
接收模塊,用于接收音頻截取指令,所述音頻截取指令包括音頻文本中的第一位置和所述音頻文本中的第二位置,所述音頻文本為待處理音頻文件對應(yīng)的文本,所述第一位置和所述第二位置為用戶在所述音頻文本中選取的位置;
第一查找模塊,用于從所述待處理音頻文件中查找與所述第一位置對應(yīng)的第一音頻時間;
第二查找模塊,用于從所述待處理音頻文件中查找與所述第二位置對應(yīng)的第二音頻時間;
第一提取模塊,用于提取所述待處理音頻文件中所述第一音頻時間與所述第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件。
實(shí)施本發(fā)明實(shí)施例,具有如下有益效果:
本發(fā)明實(shí)施例,接收音頻截取指令,該音頻截取指令中包括音頻文本中的第一位置和音頻文本中的第二位置,該音頻文本為待處理音頻文件對應(yīng)的文本,所述第一位置和第二位置為用戶在音頻文本中選取的位置,從待處理音頻文件中查找與第一位置對應(yīng)的第一音頻時間,從待處理音頻文件中查找與第二位置對應(yīng)的第二音頻時間,提取待處理音頻文件中第一音頻時間與第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件,這種方式可通過選擇音頻文本的第一位置和第二位置,從待處理音頻文件中截取音頻,使用方便,效率高。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例提供的一種音頻處理方法的流程圖;
圖2為本發(fā)明實(shí)施例提供的另一種音頻處理方法的流程圖;
圖3為本發(fā)明實(shí)施例提供的又一種音頻處理方法的流程圖;
圖4為本發(fā)明實(shí)施例提供的又一種音頻處理方法的流程圖;
圖5為本發(fā)明實(shí)施例提供的一種界面顯示示意圖;
圖6為本發(fā)明實(shí)施例提供的一種音頻處理裝置的結(jié)構(gòu)示意圖;
圖7為本發(fā)明實(shí)施例提供的一種提取模塊的結(jié)構(gòu)示意圖;
圖8為本發(fā)明實(shí)施例提供的另一種音頻處理裝置的結(jié)構(gòu)示意圖;
圖9為本發(fā)明實(shí)施例提供的又一種音頻處理裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
下面將結(jié)合附圖1-附圖5,對本發(fā)明實(shí)施例提供的音頻處理方法進(jìn)行詳細(xì)介紹。
請參照圖1,為本發(fā)明實(shí)施例提供的一種音頻處理方法的流程圖;該方法可包括以下步驟S100-步驟S103。
S100,接收音頻截取指令,所述音頻截取指令包括音頻文本中的第一位置和所述音頻文本中的第二位置,所述音頻文本為待處理音頻文件對應(yīng)的文本,所述第一位置和所述第二位置為用戶在所述音頻文本中選取的位置;
本發(fā)明實(shí)施例中的待處理音頻文件的音頻格式可以是高級音頻編碼(Advanced Audio Coding,AAC)或者也可以是MP3等等,音頻格式即是音頻數(shù)據(jù)的文件封裝格式。
本發(fā)明實(shí)施例的音頻處理方法可以由客戶端執(zhí)行處理,也可以由服務(wù)器執(zhí)行處理,比如,若該音頻處理方法是由客戶端執(zhí)行處理,則音頻截取指令可以是用戶在終端進(jìn)行操作從而觸發(fā)音頻截取指令,該操作可以是在終端屏幕的觸屏操作或者按鍵操作,或者也可以是輸入關(guān)鍵字等等。若該音頻處理方法是由服務(wù)器執(zhí)行處理,則該音頻截取指令可以是由安裝有音頻播放客戶端的終端發(fā)送的。
進(jìn)一步可選的,該音頻截取指令包括音頻文本中的第一位置和音頻文本中的第二位置,音頻文本即是待處理音頻文件對應(yīng)的文本,比如,待處理音頻文件為歌曲文件,則該音頻文本可以是該歌曲對應(yīng)的歌詞,或者該待處理音頻文件為演講音頻文件,則該音頻文本可以是該演講音頻文件的演講稿等等。
第一位置和第二位置為用戶選擇的希望截取的音頻數(shù)據(jù)的開始位置和結(jié)束位置,如圖5所示,即是本發(fā)明實(shí)施例提供的一種歌詞界面顯示示意圖,若用戶需要截取的開始位置為“忘了我讓我一個人自由自在”,結(jié)束位置為“沒錯,你快先離開”,則可以通過對終端屏幕的操作實(shí)現(xiàn)位置的選取,第一位置為開始位置,第二位置為結(jié)束位置。
具體可選的,以下將接收音頻截取指令進(jìn)行具體闡述:
1)使用音頻客戶端的音頻截取工具打開一個要截取的待處理音頻文件;
2)音頻客戶端解析這個待處理音頻文件以后,通過音頻指紋匹配到后臺服務(wù)器獲取歌曲文件的歌詞信息;
3)截取工具解析歌詞信息并且顯示,用戶通過歌詞的位置來快速設(shè)置音頻截取的開始位置和結(jié)束位置,即是本發(fā)明實(shí)施例的第一位置和第二位置。
S101,從所述待處理音頻文件中查找與所述第一位置對應(yīng)的第一音頻時間;
S102,從所述待處理音頻文件中查找與所述第二位置對應(yīng)的第二音頻時間;
本發(fā)明實(shí)施例中,當(dāng)用戶從音頻文本中選取了第一位置和第二位置之后,即從待處理音頻文件中查找與第一位置對應(yīng)的第一音頻時間,以及從待處理音頻文件中查找與第二位置對應(yīng)的第二音頻時間,具體可選的,音頻文件中包括了音頻文本的每一句的開始時間,當(dāng)確定了第一位置與第二位置之后,即可獲得與第一位置對應(yīng)的第一音頻時間,以及與第二位置對應(yīng)的第二音頻時間。
需要說明的是,第一音頻時間即是該第一位置的文本在整個音頻文件播放時的時間點(diǎn),第二音頻時間即是該第二位置的文本在整個音頻文件播放時的時間點(diǎn),如圖5所示,第一位置對應(yīng)的第一音頻時間為1分38秒,第二位置對應(yīng)的第二音頻時間為2分25秒。
S103,提取所述待處理音頻文件中所述第一音頻時間與所述第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件。
本發(fā)明實(shí)施例中,從待處理音頻文件中提取該第一音頻時間與第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件,具體提取方法可以是,讀取該待處理音頻文件的頭信息,根據(jù)頭信息對該第一音頻時間與第二音頻時間之間的音頻數(shù)據(jù)進(jìn)行解碼,獲得脈沖編碼調(diào)制(Pulse-code modulation,PCM)文件,并進(jìn)一步將該P(yáng)CM文件進(jìn)行轉(zhuǎn)碼處理,得到新的第一目標(biāo)音頻文件,該第一目標(biāo)音頻文件即是從待處理音頻文件中截取的一部分音頻數(shù)據(jù)。
本發(fā)明實(shí)施例,接收音頻截取指令,該音頻截取指令中包括音頻文本中的第一位置和音頻文本中的第二位置,該音頻文本為待處理音頻文件對應(yīng)的文本,所述第一位置和第二位置為用戶在音頻文本中選取的位置,從待處理音頻文件中查找與第一位置對應(yīng)的第一音頻時間,從待處理音頻文件中查找與第二位置對應(yīng)的第二音頻時間,提取待處理音頻文件中第一音頻時間與第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件,這種方式可通過選擇音頻文本的第一位置和第二位置,從待處理音頻文件中截取音頻,使用方便,效率高。
請參照圖2,為本發(fā)明實(shí)施例提供的另一種音頻處理方法的流程示意圖,如圖所示,本發(fā)明實(shí)施例的音頻處理方法包括步驟S200~S205;
S200,接收音頻截取指令,所述音頻截取指令包括音頻文本中的第一位置和所述音頻文本中的第二位置,所述音頻文本為待處理音頻文件對應(yīng)的文本,所述第一位置和所述第二位置為用戶在所述音頻文本中選取的位置;
S201,從所述待處理音頻文件中查找與所述第一位置對應(yīng)的第一音頻時間;
S202,從所述待處理音頻文件中查找與所述第二位置對應(yīng)的第二音頻時間;
本發(fā)明實(shí)施例步驟S200~S202請參照圖1的實(shí)施例步驟S100~S102,在此不再贅述。
S203,提取所述待處理音頻文件中所述第一音頻時間與所述第二音頻時間之間的音頻數(shù)據(jù);
S204,對所述音頻數(shù)據(jù)進(jìn)行解碼,生成脈沖編碼調(diào)制PCM文件;
本發(fā)明實(shí)施例中,從待處理音頻文件中將第一音頻時間與第二音頻數(shù)據(jù)之間的音頻數(shù)據(jù)提取出來之后,并對該音頻數(shù)據(jù)進(jìn)行解碼,生成PCM文件,PCM是一種模擬信號的數(shù)碼化方法。PCM將信號的強(qiáng)度依照同樣的間距分成數(shù)段,然后用獨(dú)特的數(shù)碼記號(通常是二進(jìn)制)來量化。PCM常被用于數(shù)碼電信系統(tǒng)上,也是電腦和CD紅皮書中的標(biāo)準(zhǔn)形式。
S205,對所述PCM文件進(jìn)行轉(zhuǎn)碼處理,生成第一目標(biāo)音頻文件。
本發(fā)明實(shí)施例中,對該P(yáng)CM文件進(jìn)行轉(zhuǎn)碼處理,生成第一目標(biāo)音頻文件,若需要對該第一目標(biāo)音頻文件進(jìn)行播放時,則可以通過音頻解碼進(jìn)行播放,音頻解碼播放接收到壓縮的音頻數(shù)據(jù)以后,把數(shù)據(jù)通過解碼程序還原成PCM數(shù)據(jù),然后,通過輸出設(shè)備轉(zhuǎn)換成模擬信息進(jìn)行播放。
本發(fā)明實(shí)施例,接收音頻截取指令,該音頻截取指令中包括音頻文本中的第一位置和音頻文本中的第二位置,該音頻文本為待處理音頻文件對應(yīng)的文本,所述第一位置和第二位置為用戶在音頻文本中選取的位置,從待處理音頻文件中查找與第一位置對應(yīng)的第一音頻時間,從待處理音頻文件中查找與第二位置對應(yīng)的第二音頻時間,提取待處理音頻文件中第一音頻時間與第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件,這種方式可通過選擇音頻文本的第一位置和第二位置,從待處理音頻文件中截取音頻,使用方便,效率高。
請參照圖3,為本發(fā)明實(shí)施例提供的又一種音頻處理方法的流程示意圖,如圖所示,本發(fā)明實(shí)施例的音頻處理方法包括步驟S300~S308;
S300,接收音頻截取指令,所述音頻截取指令包括音頻文本中的第一位置和所述音頻文本中的第二位置,所述音頻文本為待處理音頻文件對應(yīng)的文本,所述第一位置和所述第二位置為用戶在所述音頻文本中選取的位置;
S301,從所述待處理音頻文件中查找與所述第一位置對應(yīng)的第一音頻時間;
S302,從所述待處理音頻文件中查找與所述第二位置對應(yīng)的第二音頻時間;
本發(fā)明實(shí)施例步驟S300~S302請參照圖1的實(shí)施例步驟S100~S102,在此不再贅述。
S303,在所述待處理音頻文件中檢測在所述第一音頻時間之前預(yù)設(shè)時長內(nèi)是否包含無文本音頻數(shù)據(jù);
本發(fā)明實(shí)施例中,在實(shí)際的待處理音頻文件中,包含音頻文本的音頻數(shù)據(jù)占據(jù)了整個文件的大部分,但是待處理音頻文件中也會存在無文本音頻數(shù)據(jù),比如,該待處理音頻文件為歌曲,則無文本音頻數(shù)據(jù)可以是歌曲的伴奏,或者某一句歌詞的前奏等等,或者該待處理音頻文件為演講音頻,則無文本音頻數(shù)據(jù)可以是演講音頻中穿插的輕音樂。
為了方便用戶準(zhǔn)確截取自己需要的音頻數(shù)據(jù),本發(fā)明實(shí)施例在提取第一音頻時間與第二音頻時間之間的音頻數(shù)據(jù)之前,還會檢測在該第一音頻時間之前預(yù)設(shè)時長內(nèi)是否包含無文本音頻數(shù)據(jù)。
S304,若否,則提取所述待處理音頻文件中所述第一音頻時間與所述第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件。
本發(fā)明實(shí)施例中,若檢測到在該第一音頻時間之前預(yù)設(shè)時長內(nèi)不包含無文本音頻數(shù)據(jù),則說明沒用前奏,可以直接提取待處理音頻文件中第一音頻時間與第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件。
S305,若所述待處理音頻文件中在所述第一音頻時間之前預(yù)設(shè)時長內(nèi)包含無文本音頻數(shù)據(jù),輸出至少一個選項(xiàng),所述選項(xiàng)用于提示用戶選擇是否需要音頻前奏;
本發(fā)明實(shí)施例中,若檢測到在該第一音頻時間之前預(yù)設(shè)時長內(nèi)包含無文本音頻數(shù)據(jù),則說明該第一音頻時間之前包含前奏部分,則終端輸出至少一個選項(xiàng)供用戶選擇,該至少一個選項(xiàng)可以是,“您所選取的歌詞之前包含前奏部分,是否需要一同截取”;或者終端輸出該前奏部分的時長,并根據(jù)該前奏的連貫性預(yù)先將該時長劃分成至少兩個時間段,輸出選項(xiàng),供用戶選擇需要哪幾個時間段的前奏。
S306,若用戶選擇需要音頻前奏,獲取所述無文本音頻數(shù)據(jù)的目標(biāo)時長;
本發(fā)明實(shí)施例中,若用戶選擇需要音頻前奏,則獲取該無文本音頻數(shù)據(jù)的目標(biāo)時長,比如,該目標(biāo)時長為5秒。
S307,根據(jù)所述第一音頻時間和所述目標(biāo)時長,獲取所述無文本音頻數(shù)據(jù)開始的第三音頻時間;
本發(fā)明實(shí)施例中,進(jìn)一步根據(jù)第一音頻時間和目標(biāo)時長,獲取無文本音頻數(shù)據(jù)開始的第三音頻數(shù)據(jù),比如,第一音頻時間為1分52秒,目標(biāo)時長為5秒,則將第一音頻時間往前移動目標(biāo)時長即可得到第三音頻時間,即第三音頻時間為1分47秒。
S308,提取所述待處理音頻文件中所述第三音頻時間與所述第二音頻時間之間的音頻數(shù)據(jù),并生成第二目標(biāo)音頻文件。
本發(fā)明實(shí)施例中,提取該待處理音頻文件中第三音頻時間與第二音頻時間之間的音頻數(shù)據(jù),并且生成第二目標(biāo)音頻文件,繼續(xù)以上述例子作為舉例,若第二音頻時間為2分50秒,則第二目標(biāo)音頻文件為待處理音頻文件中1分47秒到2分50秒之間的音頻數(shù)據(jù)。
本發(fā)明實(shí)施例,接收音頻截取指令,該音頻截取指令中包括音頻文本中的第一位置和音頻文本中的第二位置,該音頻文本為待處理音頻文件對應(yīng)的文本,所述第一位置和第二位置為用戶在音頻文本中選取的位置,從待處理音頻文件中查找與第一位置對應(yīng)的第一音頻時間,從待處理音頻文件中查找與第二位置對應(yīng)的第二音頻時間,提取待處理音頻文件中第一音頻時間與第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件,這種方式可通過選擇音頻文本的第一位置和第二位置,從待處理音頻文件中截取音頻,使用方便,效率高。
請參照圖4,為本發(fā)明實(shí)施例提供的又一種音頻處理方法的流程示意圖,如圖所示,本發(fā)明實(shí)施例的音頻處理方法包括步驟S400~S406;
S400,在終端顯示待處理音頻文件的音頻文本;
本發(fā)明實(shí)施例中,使用音頻客戶端的音頻截取工具打開一個要截取的待處理音頻文件;音頻客戶端解析這個待處理音頻文件以后,通過音頻指紋匹配到后臺服務(wù)器獲取該待處理音頻文件的音頻文本,比如歌曲文件的歌詞信息,進(jìn)一步終端顯示該音頻文本。
S401,捕獲用戶針對所述音頻文本的操作軌跡;
本發(fā)明實(shí)施例中,當(dāng)終端顯示音頻文本時,則用戶可以通過觸屏操作對該音頻文本進(jìn)行位置選擇,終端捕獲用戶針對該音頻文本的操作軌跡,該操作軌跡可以是點(diǎn)擊操作軌跡,或者滑動操作軌跡等等,本發(fā)明不作限定,例如,如圖5所示,用戶可以點(diǎn)擊第一位置(忘了我讓我一個人自由自在)和第二位置(沒錯,你快先離開),或者用戶可以從第一位置向下滑動到第二位置。
S402,根據(jù)所述操作軌跡確定用戶所選取的第一位置和第二位置,并根據(jù)所述第一位置和所述第二位置生成音頻截取指令。
本發(fā)明實(shí)施例中,終端根據(jù)操作軌跡確定用戶所選取的第一位置和第二位置,若該操作軌跡為滑動操作軌跡,則第一位置為該滑動操作軌跡的起點(diǎn)位置,第二位置為該滑動操作軌跡的結(jié)束位置,根據(jù)該第一位置和第二位置生成音頻截取指令,若后續(xù)音頻處理過程是在終端進(jìn)行,則將該音頻截取指令發(fā)送至終端的處理器,由處理器分析執(zhí)行,若后續(xù)音頻處理過程是在服務(wù)器側(cè)進(jìn)行,則終端將該音頻截取指令發(fā)送至服務(wù)器,由服務(wù)器分析執(zhí)行。
S403,接收音頻截取指令,所述音頻截取指令包括音頻文本中的第一位置和所述音頻文本中的第二位置,所述音頻文本為待處理音頻文件對應(yīng)的文本,所述第一位置和所述第二位置為用戶在所述音頻文本中選取的位置;
S404,從所述待處理音頻文件中查找與所述第一位置對應(yīng)的第一音頻時間;
S405,從所述待處理音頻文件中查找與所述第二位置對應(yīng)的第二音頻時間;
S406,提取所述待處理音頻文件中所述第一音頻時間與所述第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件。
本發(fā)明實(shí)施例步驟S403~S406請參照圖1的實(shí)施例步驟S100~S103,在此不再贅述。
本發(fā)明實(shí)施例,接收音頻截取指令,該音頻截取指令中包括音頻文本中的第一位置和音頻文本中的第二位置,該音頻文本為待處理音頻文件對應(yīng)的文本,所述第一位置和第二位置為用戶在音頻文本中選取的位置,從待處理音頻文件中查找與第一位置對應(yīng)的第一音頻時間,從待處理音頻文件中查找與第二位置對應(yīng)的第二音頻時間,提取待處理音頻文件中第一音頻時間與第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件,這種方式可通過選擇音頻文本的第一位置和第二位置,從待處理音頻文件中截取音頻,使用方便,效率高。
請參照圖6,為本發(fā)明實(shí)施例提供的一種音頻處理裝置的結(jié)構(gòu)示意圖,如圖所示,本發(fā)明實(shí)施例的音頻處理裝置包括:
接收模塊100,用于接收音頻截取指令,所述音頻截取指令包括音頻文本中的第一位置和所述音頻文本中的第二位置,所述音頻文本為待處理音頻文件對應(yīng)的文本,所述第一位置和所述第二位置為用戶在所述音頻文本中選取的位置;
本發(fā)明實(shí)施例中的待處理音頻文件的音頻格式可以是高級音頻編碼(Advanced Audio Coding,AAC)或者也可以是MP3等等,音頻格式即是音頻數(shù)據(jù)的文件封裝格式。
本發(fā)明實(shí)施例的音頻處理方法可以由客戶端執(zhí)行處理,也可以由服務(wù)器執(zhí)行處理,比如,若該音頻處理方法是由客戶端執(zhí)行處理,則音頻截取指令可以是用戶在終端進(jìn)行操作從而觸發(fā)音頻截取指令,該操作可以是在終端屏幕的觸屏操作或者按鍵操作,或者也可以是輸入關(guān)鍵字等等。若該音頻處理方法是由服務(wù)器執(zhí)行處理,則該音頻截取指令可以是由安裝有音頻播放客戶端的終端發(fā)送的。
進(jìn)一步可選的,該音頻截取指令包括音頻文本中的第一位置和音頻文本中的第二位置,音頻文本即是待處理音頻文件對應(yīng)的文本,比如,待處理音頻文件為歌曲文件,則該音頻文本可以是該歌曲對應(yīng)的歌詞,或者該待處理音頻文件為演講音頻文件,則該音頻文本可以是該演講音頻文件的演講稿等等。
第一位置和第二位置為用戶選擇的希望截取的音頻數(shù)據(jù)的開始位置和結(jié)束位置,如圖5所示,即是本發(fā)明實(shí)施例提供的一種歌詞界面顯示示意圖,若用戶需要截取的開始位置為“忘了我讓我一個人自由自在”,結(jié)束位置為“沒錯,你快先離開”,則可以通過對終端屏幕的操作實(shí)現(xiàn)位置的選取,第一位置為開始位置,第二位置為結(jié)束位置。
具體可選的,以下將接收音頻截取指令進(jìn)行具體闡述:
1)使用音頻客戶端的音頻截取工具打開一個要截取的待處理音頻文件;
2)音頻客戶端解析這個待處理音頻文件以后,通過音頻指紋匹配到后臺服務(wù)器獲取歌曲文件的歌詞信息;
3)截取工具解析歌詞信息并且顯示,用戶通過歌詞的位置來快速設(shè)置音頻截取的開始位置和結(jié)束位置,即是本發(fā)明實(shí)施例的第一位置和第二位置。
第一查找模塊101,用于從所述待處理音頻文件中查找與所述第一位置對應(yīng)的第一音頻時間;
第二查找模塊102,用于從所述待處理音頻文件中查找與所述第二位置對應(yīng)的第二音頻時間;
本發(fā)明實(shí)施例中,當(dāng)用戶從音頻文本中選取了第一位置和第二位置之后,即從待處理音頻文件中查找與第一位置對應(yīng)的第一音頻時間,以及從待處理音頻文件中查找與第二位置對應(yīng)的第二音頻時間,具體可選的,音頻文件中包括了音頻文本的每一句的開始時間,當(dāng)確定了第一位置與第二位置之后,即可獲得與第一位置對應(yīng)的第一音頻時間,以及與第二位置對應(yīng)的第二音頻時間。
需要說明的是,第一音頻時間即是該第一位置的文本在整個音頻文件播放時的時間點(diǎn),第二音頻時間即是該第二位置的文本在整個音頻文件播放時的時間點(diǎn),如圖5所示,第一位置對應(yīng)的第一音頻時間為1分38秒,第二位置對應(yīng)的第二音頻時間為2分25秒。
第一提取模塊103,用于提取所述待處理音頻文件中所述第一音頻時間與所述第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件。
本發(fā)明實(shí)施例中,從待處理音頻文件中提取該第一音頻時間與第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件,具體提取方法可以是,讀取該待處理音頻文件的頭信息,根據(jù)頭信息對該第一音頻時間與第二音頻時間之間的音頻數(shù)據(jù)進(jìn)行解碼,獲得脈沖編碼調(diào)制(Pulse-code modulation,PCM)文件,并進(jìn)一步將該P(yáng)CM文件進(jìn)行轉(zhuǎn)碼處理,得到新的第一目標(biāo)音頻文件,該第一目標(biāo)音頻文件即是從待處理音頻文件中截取的一部分音頻數(shù)據(jù)。
進(jìn)一步可選的,請參照圖7,為本發(fā)明實(shí)施例提供的一種第一提取模塊的結(jié)構(gòu)示意圖,如圖所示,本發(fā)明實(shí)施例的第一提取模塊103包括提取單元1030、解碼單元1031以及轉(zhuǎn)碼單元1032;
提取單元1030,用于提取所述待處理音頻文件中所述第一音頻時間與所述第二音頻時間之間的音頻數(shù)據(jù);
解碼單元1031,用于對所述音頻數(shù)據(jù)進(jìn)行解碼,生成脈沖編碼調(diào)制PCM文件;
本發(fā)明實(shí)施例中,從待處理音頻文件中將第一音頻時間與第二音頻數(shù)據(jù)之間的音頻數(shù)據(jù)提取出來之后,并對該音頻數(shù)據(jù)進(jìn)行解碼,生成PCM文件,PCM是一種模擬信號的數(shù)碼化方法。PCM將信號的強(qiáng)度依照同樣的間距分成數(shù)段,然后用獨(dú)特的數(shù)碼記號(通常是二進(jìn)制)來量化。PCM常被用于數(shù)碼電信系統(tǒng)上,也是電腦和CD紅皮書中的標(biāo)準(zhǔn)形式。
轉(zhuǎn)碼單元1032,用于對所述PCM文件進(jìn)行轉(zhuǎn)碼處理,生成第一目標(biāo)音頻文件。
本發(fā)明實(shí)施例中,對該P(yáng)CM文件進(jìn)行轉(zhuǎn)碼處理,生成第一目標(biāo)音頻文件,若需要對該第一目標(biāo)音頻文件進(jìn)行播放時,則可以通過音頻解碼進(jìn)行播放,音頻解碼播放接收到壓縮的音頻數(shù)據(jù)以后,把數(shù)據(jù)通過解碼程序還原成PCM數(shù)據(jù),然后,通過輸出設(shè)備轉(zhuǎn)換成模擬信息進(jìn)行播放。
本發(fā)明實(shí)施例,接收音頻截取指令,該音頻截取指令中包括音頻文本中的第一位置和音頻文本中的第二位置,該音頻文本為待處理音頻文件對應(yīng)的文本,所述第一位置和第二位置為用戶在音頻文本中選取的位置,從待處理音頻文件中查找與第一位置對應(yīng)的第一音頻時間,從待處理音頻文件中查找與第二位置對應(yīng)的第二音頻時間,提取待處理音頻文件中第一音頻時間與第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件,這種方式可通過選擇音頻文本的第一位置和第二位置,從待處理音頻文件中截取音頻,使用方便,效率高。
請參照圖8,為本發(fā)明實(shí)施例提供的另一種音頻處理裝置的結(jié)構(gòu)示意圖,如圖所示,本發(fā)明實(shí)施例的音頻處理裝置包括:
接收模塊200,用于接收音頻截取指令,所述音頻截取指令包括音頻文本中的第一位置和所述音頻文本中的第二位置,所述音頻文本為待處理音頻文件對應(yīng)的文本,所述第一位置和所述第二位置為用戶在所述音頻文本中選取的位置;
第一查找模塊201,用于從所述待處理音頻文件中查找與所述第一位置對應(yīng)的第一音頻時間;
第二查找模塊202,用于從所述待處理音頻文件中查找與所述第二位置對應(yīng)的第二音頻時間;
檢測模塊203,用于在所述待處理音頻文件中檢測在所述第一音頻時間之前預(yù)設(shè)時長內(nèi)是否包含無文本音頻數(shù)據(jù);
本發(fā)明實(shí)施例中,在實(shí)際的待處理音頻文件中,包含音頻文本的音頻數(shù)據(jù)占據(jù)了整個文件的大部分,但是待處理音頻文件中也會存在無文本音頻數(shù)據(jù),比如,該待處理音頻文件為歌曲,則無文本音頻數(shù)據(jù)可以是歌曲的伴奏,或者某一句歌詞的前奏等等,或者該待處理音頻文件為演講音頻,則無文本音頻數(shù)據(jù)可以是演講音頻中穿插的輕音樂。
為了方便用戶準(zhǔn)確截取自己需要的音頻數(shù)據(jù),本發(fā)明實(shí)施例在提取第一音頻時間與第二音頻時間之間的音頻數(shù)據(jù)之前,還會檢測在該第一音頻時間之前預(yù)設(shè)時長內(nèi)是否包含無文本音頻數(shù)據(jù)。
第一提取模塊204具體用于若在所述第一音頻時間之前預(yù)設(shè)時長內(nèi)不包含無文本音頻數(shù)據(jù),則提取所述待處理音頻文件中所述第一音頻時間與所述第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件。
本發(fā)明實(shí)施例中,若檢測到在該第一音頻時間之前預(yù)設(shè)時長內(nèi)不包含無文本音頻數(shù)據(jù),則說明沒用前奏,可以直接提取待處理音頻文件中第一音頻時間與第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件。
輸出模塊205,用于若所述待處理音頻文件中在所述第一音頻時間之前預(yù)設(shè)時長內(nèi)包含無文本音頻數(shù)據(jù),輸出至少一個選項(xiàng),所述選項(xiàng)用于提示用戶選擇是否需要音頻前奏;
本發(fā)明實(shí)施例中,若檢測到在該第一音頻時間之前預(yù)設(shè)時長內(nèi)包含無文本音頻數(shù)據(jù),則說明該第一音頻時間之前包含前奏部分,則終端輸出至少一個選項(xiàng)供用戶選擇,該至少一個選項(xiàng)可以是,“您所選取的歌詞之前包含前奏部分,是否需要一同截取”;或者終端輸出該前奏部分的時長,并根據(jù)該前奏的連貫性預(yù)先將該時長劃分成至少兩個時間段,輸出選項(xiàng),供用戶選擇需要哪幾個時間段的前奏。
第一獲取模塊206,用于若用戶選擇需要音頻前奏,獲取所述無文本音頻數(shù)據(jù)的目標(biāo)時長;
本發(fā)明實(shí)施例中,若用戶選擇需要音頻前奏,則獲取該無文本音頻數(shù)據(jù)的目標(biāo)時長,比如,該目標(biāo)時長為5秒。
第二獲取模塊207,用于根據(jù)所述第一音頻時間和所述目標(biāo)時長,獲取所述無文本音頻數(shù)據(jù)開始的第三音頻時間;
本發(fā)明實(shí)施例中,進(jìn)一步根據(jù)第一音頻時間和目標(biāo)時長,獲取無文本音頻數(shù)據(jù)開始的第三音頻數(shù)據(jù),比如,第一音頻時間為1分52秒,目標(biāo)時長為5秒,則將第一音頻時間往前移動目標(biāo)時長即可得到第三音頻時間,即第三音頻時間為1分47秒。
第二提取模塊208,用于提取所述待處理音頻文件中所述第三音頻時間與所述第二音頻時間之間的音頻數(shù)據(jù),并生成第二目標(biāo)音頻文件。
本發(fā)明實(shí)施例中,提取該待處理音頻文件中第三音頻時間與第二音頻時間之間的音頻數(shù)據(jù),并且生成第二目標(biāo)音頻文件,繼續(xù)以上述例子作為舉例,若第二音頻時間為2分50秒,則第二目標(biāo)音頻文件為待處理音頻文件中1分47秒到2分50秒之間的音頻數(shù)據(jù)。
本發(fā)明實(shí)施例,接收音頻截取指令,該音頻截取指令中包括音頻文本中的第一位置和音頻文本中的第二位置,該音頻文本為待處理音頻文件對應(yīng)的文本,所述第一位置和第二位置為用戶在音頻文本中選取的位置,從待處理音頻文件中查找與第一位置對應(yīng)的第一音頻時間,從待處理音頻文件中查找與第二位置對應(yīng)的第二音頻時間,提取待處理音頻文件中第一音頻時間與第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件,這種方式可通過選擇音頻文本的第一位置和第二位置,從待處理音頻文件中截取音頻,使用方便,效率高。
請參照圖9,為本發(fā)明實(shí)施例提供的又一種音頻處理裝置的結(jié)構(gòu)示意圖,如圖所示,本發(fā)明實(shí)施例的音頻處理裝置包括:
顯示模塊300,用于在終端顯示待處理音頻文件的音頻文本;
本發(fā)明實(shí)施例中,使用音頻客戶端的音頻截取工具打開一個要截取的待處理音頻文件;音頻客戶端解析這個待處理音頻文件以后,通過音頻指紋匹配到后臺服務(wù)器獲取該待處理音頻文件的音頻文本,比如歌曲文件的歌詞信息,進(jìn)一步終端顯示該音頻文本。
捕獲模塊301,用于捕獲用戶針對所述音頻文本的操作軌跡;
本發(fā)明實(shí)施例中,當(dāng)終端顯示音頻文本時,則用戶可以通過觸屏操作對該音頻文本進(jìn)行位置選擇,終端捕獲用戶針對該音頻文本的操作軌跡,該操作軌跡可以是點(diǎn)擊操作軌跡,或者滑動操作軌跡等等,本發(fā)明不作限定,例如,如圖5所示,用戶可以點(diǎn)擊第一位置(忘了我讓我一個人自由自在)和第二位置(沒錯,你快先離開),或者用戶可以從第一位置向下滑動到第二位置。
生成模塊302,用于根據(jù)所述操作軌跡確定用戶所選取的第一位置和第二位置,并根據(jù)所述第一位置和所述第二位置生成音頻截取指令。
本發(fā)明實(shí)施例中,終端根據(jù)操作軌跡確定用戶所選取的第一位置和第二位置,若該操作軌跡為滑動操作軌跡,則第一位置為該滑動操作軌跡的起點(diǎn)位置,第二位置為該滑動操作軌跡的結(jié)束位置,根據(jù)該第一位置和第二位置生成音頻截取指令,若后續(xù)音頻處理過程是在終端進(jìn)行,則將該音頻截取指令發(fā)送至終端的處理器,由處理器分析執(zhí)行,若后續(xù)音頻處理過程是在服務(wù)器側(cè)進(jìn)行,則終端將該音頻截取指令發(fā)送至服務(wù)器,由服務(wù)器分析執(zhí)行。
接收模塊303,用于接收音頻截取指令,所述音頻截取指令包括音頻文本中的第一位置和所述音頻文本中的第二位置,所述音頻文本為待處理音頻文件對應(yīng)的文本,所述第一位置和所述第二位置為用戶在所述音頻文本中選取的位置;
第一查找模塊304,用于從所述待處理音頻文件中查找與所述第一位置對應(yīng)的第一音頻時間;
第二查找模塊305,用于從所述待處理音頻文件中查找與所述第二位置對應(yīng)的第二音頻時間;
第一提取模塊306,用于提取所述待處理音頻文件中所述第一音頻時間與所述第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件。
本發(fā)明實(shí)施例,接收音頻截取指令,該音頻截取指令中包括音頻文本中的第一位置和音頻文本中的第二位置,該音頻文本為待處理音頻文件對應(yīng)的文本,所述第一位置和第二位置為用戶在音頻文本中選取的位置,從待處理音頻文件中查找與第一位置對應(yīng)的第一音頻時間,從待處理音頻文件中查找與第二位置對應(yīng)的第二音頻時間,提取待處理音頻文件中第一音頻時間與第二音頻時間之間的音頻數(shù)據(jù),并生成第一目標(biāo)音頻文件,這種方式可通過選擇音頻文本的第一位置和第二位置,從待處理音頻文件中截取音頻,使用方便,效率高。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以通過計(jì)算機(jī)程序來指令相關(guān)的硬件來完成,所述的程序可存儲于一計(jì)算機(jī)可讀取存儲介質(zhì)中,附圖6-附圖9所示音頻處理裝置對應(yīng)的程序可存儲在終端的可讀存儲介質(zhì)內(nèi),并被該終端中的至少一個處理器執(zhí)行,以實(shí)現(xiàn)上述音頻處理方法,該方法包括圖1-圖4中方法實(shí)施例所述的流程。其中,所述的存儲介質(zhì)可為磁碟、光盤、只讀存儲記憶體(Read-Only Memory,ROM)或隨機(jī)存儲記憶體(Random Access Memory,RAM)等。
以上所揭露的僅為本發(fā)明較佳實(shí)施例而已,當(dāng)然不能以此來限定本發(fā)明之權(quán)利范圍,因此依本發(fā)明權(quán)利要求所作的等同變化,仍屬本發(fā)明所涵蓋的范圍。