本發(fā)明涉及終端技術(shù)領(lǐng)域,特別涉及一種音頻文件的重錄方法及裝置。
背景技術(shù):
在現(xiàn)代生活中,為了豐富用戶的業(yè)余生活,越來越多的錄音應(yīng)用被安裝的移動終端中,基于這些錄音應(yīng)用,用戶無需走入專業(yè)的錄音棚,即可錄制音頻文件。在錄制音頻文件的過程中,受限于氣息、音色等自身?xiàng)l件,所錄制的音頻文件中的某一人聲片段可能無法達(dá)到用戶的預(yù)期效果,為了提高所錄制的音頻文件的聽感效果,需要對音頻文件中的該人聲片段進(jìn)行重錄。
目前,移動終端中的錄音應(yīng)用提供了重錄功能,當(dāng)接收到用戶的重錄指令時(shí),移動終端通過揚(yáng)聲器播放伴奏文件,同時(shí)通過麥克風(fēng)采集用戶的歌唱數(shù)據(jù),得到一個(gè)音頻文件。當(dāng)經(jīng)過多次重錄操作,得到多個(gè)音頻文件后,移動終端通過將多個(gè)音頻文件進(jìn)行剪輯、拼接,最終可得到一個(gè)重錄音頻文件。
在實(shí)現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題:
通常音頻文件中需要重新錄制的部分可能僅是一句話或一段話,對整個(gè)音頻文件進(jìn)行多次重錄,不僅增加了移動終端的資源消耗,而且由于每次重錄時(shí)用戶的氣息、與麥克風(fēng)的距離、音色等控制上的不同,導(dǎo)致移動終端每次采集到的歌唱數(shù)據(jù)不同,最終剪輯、拼接得到的重錄音頻文件聽感效果依然較差,聽者能夠很明顯的察覺出拼接的痕跡。
技術(shù)實(shí)現(xiàn)要素:
為了解決現(xiàn)有技術(shù)的問題,本發(fā)明實(shí)施例提供了一種音頻文件的重錄方法 及裝置。所述技術(shù)方案如下:
一方面,提供了一種音頻文件的重錄方法,所述方法包括:
獲取第一時(shí)間,所述第一時(shí)間為待重錄人聲片段的起始時(shí)間;
根據(jù)所述第一時(shí)間,播放已錄制的第一人聲片段,所述第一人聲片段以所述第一時(shí)間為結(jié)束時(shí)間;
當(dāng)?shù)竭_(dá)所述第一時(shí)間時(shí),采集用戶的第一人聲數(shù)據(jù),得到第二人聲片段;
對所述第一人聲片段和所述第二人聲片段進(jìn)行處理,得到重錄音頻文件。
另一方面,提供了一種音頻文件的重錄裝置,所述裝置包括:
獲取模塊,用于獲取第一時(shí)間,所述第一時(shí)間為待重錄人聲片段的起始時(shí)間;
第一播放模塊,用于根據(jù)所述第一時(shí)間,播放已錄制的第一人聲片段,所述第一人聲片段以所述第一時(shí)間為結(jié)束時(shí)間;
第一采集模塊,用于當(dāng)?shù)竭_(dá)所述第一時(shí)間時(shí),采集用戶的第一人聲數(shù)據(jù),得到第二人聲片段;
處理模塊,用于對所述第一人聲片段和所述第二人聲片段進(jìn)行處理,得到重錄音頻文件。
本發(fā)明實(shí)施例提供的技術(shù)方案帶來的有益效果是:
本發(fā)明無需將音譜文件錄制多次,通過播放待重錄人聲片段之前的人聲片段,使得用戶在重新錄制待重錄人聲片段時(shí),能夠聆聽之前所錄制的人聲片段,以調(diào)整氣息、與麥克風(fēng)的距離、音色等,基于采集到的歌唱數(shù)據(jù),移動終端剪輯、拼接得到的音頻文件聽感效果較佳,聽者察覺不出拼接的痕跡。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下, 還可以根據(jù)這些附圖獲得其他的附圖。
圖1是本發(fā)明一實(shí)施例提供的一種音頻文件的重錄方法流程圖;
圖2是本發(fā)明另一實(shí)施例提供的一種音頻文件的重錄方法流程圖;
圖3是本發(fā)明另一實(shí)施例提供的一種音頻文件的錄制界面的示意圖;
圖4是本發(fā)明另一實(shí)施例提供的一種音譜的示意圖;
圖5是本發(fā)明另一實(shí)施例提供的一種音譜的示意圖;
圖6是本發(fā)明另一實(shí)施例提供的一種音譜的示意圖;
圖7是本發(fā)明另一實(shí)施例提供的一種音譜的示意圖;
圖8是本發(fā)明另一實(shí)施例提供的一種對第一目標(biāo)音譜和第二目標(biāo)音譜進(jìn)行擬合的示意圖;
圖9是本發(fā)明另一實(shí)施例提供的一種音頻文件的重錄裝置的結(jié)構(gòu)示意圖;
圖10是本發(fā)明另一實(shí)施例提供的一種音頻文件的重錄終端的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對本發(fā)明實(shí)施方式作進(jìn)一步地詳細(xì)描述。
隨著終端技術(shù)的發(fā)展,為了滿足用戶的歌唱需要,各種用于錄制歌曲的應(yīng)用被安裝在移動終端中。對于一些非專業(yè)歌手而言,在錄制音頻文件時(shí),很難把控自己的氣息、感情,導(dǎo)致某些人聲片段很難達(dá)到用戶的預(yù)期效果,此時(shí)用戶常會對這些人聲片段進(jìn)行重錄。由于現(xiàn)有技術(shù)在對音頻文件進(jìn)行重錄時(shí),需要將整個(gè)音頻文件重錄多次,并將多次重錄的音頻文件進(jìn)行剪輯、拼接,不僅增加了移動終端的資源消耗,而且所拼接出的音頻文件播放以后,聽者能夠明顯感覺到并不是歌者一氣呵成的唱作。為此,本發(fā)明實(shí)施例提供了一種音頻文件的重錄方法,該方法在重錄某一人聲片段時(shí),通過播放待重錄人聲片段之前的一段人聲片段,使用戶回憶起之前歌唱的情景,通過調(diào)整當(dāng)前歌唱時(shí)的音色、力度、與麥克風(fēng)之間的距離、氣息等,使得重錄的人聲片段盡可能的與之前歌 唱的人聲片段能夠自然銜接。參見圖1,本實(shí)施例提供的方法流程包括:
101、獲取第一時(shí)間,該第一時(shí)間為待重錄人聲片段的起始時(shí)間。
102、根據(jù)第一時(shí)間,播放已錄制的第一人聲片段,該第一人聲片段以第一時(shí)間為結(jié)束時(shí)間。
103、當(dāng)?shù)竭_(dá)第一時(shí)間時(shí),采集用戶的第一人聲數(shù)據(jù),得到第二人聲片段。
104、對第一人聲片段和第二人聲片段進(jìn)行處理,得到重錄音頻文件。
本發(fā)明實(shí)施例提供的方法,無需將音譜文件錄制多次,通過播放待重錄人聲片段之前的人聲片段,使得用戶在重新錄制待重錄人聲片段時(shí),能夠聆聽之前所錄制的人聲片段,以調(diào)整氣息、與麥克風(fēng)的距離、音色等,基于采集到的歌唱數(shù)據(jù),移動終端剪輯、拼接得到的音頻文件聽感效果較佳,聽者察覺不出拼接的痕跡。
在本發(fā)明的另一個(gè)實(shí)施例中,該方法還包括:
在播放已錄制的第一人聲片段的過程中,采集用戶的第二人聲數(shù)據(jù),得到第三人聲片段;
將第二人聲片段和第三人聲片段作為本次錄制的人聲片段。
在本發(fā)明的另一個(gè)實(shí)施例中,對第一人聲片段和第二人聲片段進(jìn)行處理,得到重錄音頻文件,包括:
獲取第一人聲片段對應(yīng)的第一音譜,并獲取第二人聲片段對應(yīng)的第二音譜;
從第一音譜中,獲取平穩(wěn)起始點(diǎn)及平穩(wěn)起始點(diǎn)對應(yīng)的第二時(shí)間;
從第二音譜中,獲取上升起始點(diǎn)及上升起始點(diǎn)對應(yīng)的第三時(shí)間;
以第二時(shí)間為起始時(shí)間,從本次錄制的人聲片段中選取第四人聲片段;
以第三時(shí)間為結(jié)束時(shí)間,從上次錄制的人聲片段中選取第五人聲片段,上次錄制的人聲片段包括待重錄人聲片段和第一人聲片段;
對第四人聲片段和第五人聲片段進(jìn)行處理,得到重錄音頻文件;
其中,第二時(shí)間早于第一時(shí)間,第一時(shí)間早于第三時(shí)間。
在本發(fā)明的另一個(gè)實(shí)施例中,對第四人聲片段和第五人聲片段進(jìn)行處理, 得到重錄音頻文件,包括:
將第四人聲片段對應(yīng)的音譜和第五人聲片段對應(yīng)的音譜進(jìn)行比對;
從第四人聲片段對應(yīng)的音譜中,獲取第一目標(biāo)音譜,并從第五人聲片段對應(yīng)的音譜中,獲取第二目標(biāo)音譜,第一目標(biāo)音譜和第二音譜具有相同的起始時(shí)間和結(jié)束時(shí)間;
對第一目標(biāo)音頻和第二目標(biāo)音譜進(jìn)行擬合,使得第四人聲片段和第五人聲片段拼接在一起,得到重錄音頻文件。
在本發(fā)明的另一個(gè)實(shí)施例中,該方法還包括:
在播放已錄制的人聲片段及錄制人聲片段的過程中,播放相應(yīng)的伴奏文件。
上述所有可選技術(shù)方案,可以采用任意結(jié)合形成本發(fā)明的可選實(shí)施例,在此不再一一贅述。
本發(fā)明實(shí)施例提供了一種音頻文件的重錄方法,參見圖2,本實(shí)施例提供的方法流程包括:
201、移動終端獲取第一時(shí)間,該第一時(shí)間為待重錄人聲片段的起始時(shí)間。
在本實(shí)施例中,移動終端可以為智能手機(jī)、筆記本電腦、平板電腦等設(shè)備,該移動終端中安裝有具有重錄功能的錄音應(yīng)用,基于所安裝的錄音應(yīng)用,用戶可隨時(shí)隨地的錄制自己喜歡的音頻文件,并將錄制好的音頻文件分享給好友。
在錄制音頻文件的過程中,如果所錄制的人聲片段沒有達(dá)到用戶的預(yù)期效果或錄制過程中得分較低,用戶可根據(jù)錄音應(yīng)用所提供的重錄功能,對該人聲片段進(jìn)行重錄。其中,待重錄人聲片段可以為一句歌詞、一個(gè)段落等,該待重錄人聲片段在音頻文件中對應(yīng)一個(gè)起始時(shí)間和結(jié)束時(shí)間。本實(shí)施例以待重錄人聲片段的起始時(shí)間為第一時(shí)間為例,該第一時(shí)間并不是絕對時(shí)間,而是相對音頻文件起始播放時(shí)刻的時(shí)間,可用于表征音頻文件的播放時(shí)刻或錄制進(jìn)度。該第一時(shí)間應(yīng)小于音頻文件的播放時(shí)長,例如,音頻文件的播放時(shí)長為4分鐘,起始播放時(shí)刻為00:00,該第一時(shí)間為音頻文件的第1分鐘30秒、第2分鐘等。 當(dāng)獲取音頻文件的播放時(shí)長及第一時(shí)間,還可獲知待重錄人聲片段在音頻文件中的位置,例如,音頻文件的時(shí)長為4分鐘,第一時(shí)間為音頻文件的第2分鐘為例,則可獲知待重錄人聲片段位于音頻文件的中點(diǎn)處。
需要說明的是,本實(shí)施例中涉及到多個(gè)人聲片段,為了將這些不同的人聲片段區(qū)分開來,本實(shí)施將未達(dá)到用戶預(yù)期效果需要重新錄制的人聲片段稱為待重錄人聲片段,將本次所播放的人聲片段稱為第一人聲片段,將播放第一人聲片段過程中所錄制的人聲片段稱為第三人聲片段,將本次重新錄制的人聲片段稱為第二人聲片段,將從本次所錄制的人聲片段中所選取的人聲片段稱為第四人聲片段,將從上次所錄制的人聲片段中所選取的人聲片段稱為第五人聲片段。
202、移動終端根據(jù)第一時(shí)間,播放已錄制的第一人聲片段,該第一人聲片段以第一時(shí)間為結(jié)束時(shí)間。
通常用戶在唱歌的時(shí)候,都會不經(jīng)意地調(diào)整氣息和情緒以配合當(dāng)前所歌唱的歌詞,這使得在重錄待重錄人聲片段的過程中,用戶很難找準(zhǔn)歌唱前一句歌詞時(shí)使用的氣息和情緒,導(dǎo)致重錄音頻文件聽感效果不佳。為了提高重錄音頻文件的聽感效果,當(dāng)待重錄人聲片段確定后,移動終端還將根據(jù)待重錄人聲片段的起始時(shí)間,從已錄制的音頻文件中,確定需要播放的第一人聲片段,該第一人聲片段應(yīng)以第一時(shí)間為結(jié)束時(shí)間,可以為待重錄人聲片段之前的一句歌詞、兩句歌詞,還可以為待重錄人聲片段之前的一段歌詞、二段歌詞等,本實(shí)施例不對第一人聲片段的長度作具體的限定。為使重錄后的音頻文件更為自然,播放效果更佳,移動終端在根據(jù)第一時(shí)間,確定第一人聲片段時(shí),可將第一人聲片段的長度選取的盡量長一些。以錄制歌曲《同桌的你》為例,參見圖3,圖3為歌曲《同桌的你》的錄制界面,如果用戶想要重新錄制“才想起同桌的你”這一句歌詞,即待重錄人聲片段為“才想起同桌的你”,并獲取到該句歌詞的起始時(shí)間為音頻文件的第39秒,則移動終端可將“猜不出問題的你,我也是偶然翻相片”作為第一人聲片段。
之后,移動終端將通過麥克風(fēng)播放該已錄制的第一人聲片段。為了最大限 度地還原上一次的錄制場景,移動終端在播放已錄制的第一人聲片段的過程中,還將根據(jù)該第一人聲片段對應(yīng)的時(shí)間,播放與該時(shí)間相應(yīng)的伴奏文件,該伴奏文件的播放時(shí)長與音頻文件的播放時(shí)長相同,且音頻文件中的人聲片段與伴奏文件的中的伴奏片段一一對應(yīng)。例如,第一人聲片段的起始時(shí)間為音頻文件的第1分鐘06秒、結(jié)束時(shí)間為2分鐘13秒,移動終端在通過麥克風(fēng)播放該第一人聲片段時(shí),還將同步播放第一人聲片段對應(yīng)的伴奏文件。
203、在播放已錄制的第一人聲片段的過程中,移動終端采集用戶的第二人聲數(shù)據(jù),得到第三人聲片段。
在移動終端播放已錄制的第一人聲片段時(shí),用戶即可跟隨第一人聲片段及相應(yīng)的伴奏文件重唱第一人聲片段,此時(shí)麥克風(fēng)等設(shè)備將采集用戶的第二人聲數(shù)據(jù),并將采集到的第二人聲數(shù)據(jù)存儲到緩存等存儲介質(zhì)中,得到第三人聲片段。該第三人聲片段與第一人聲片段具有相同的音頻內(nèi)容,即第三人聲片段和第一人聲片段對應(yīng)音頻文件中相同的歌詞。
204、當(dāng)?shù)竭_(dá)第一時(shí)間時(shí),移動終端采集用戶的第一人聲數(shù)據(jù),得到第二人聲片段,并將第二人聲片段和第三人聲片段作為本次錄制的人聲片段。
當(dāng)?shù)竭_(dá)第一人聲片段的結(jié)束時(shí)間第一時(shí)間時(shí),移動終端通過麥克風(fēng)等設(shè)備采集用戶的第一人聲數(shù)據(jù),并將采集到的第一人聲數(shù)據(jù)存儲到緩存等存儲介質(zhì)中,得到第二人聲片段,該第二人聲片段與待重錄人聲片段具有相同的音頻內(nèi)容,即第二人聲片段與待重錄人聲片段對應(yīng)音頻文件中相同的歌詞。
至此,在本次重錄過程中,移動終端總計(jì)錄制了兩段人聲片段,分別為第三人聲片段和第二人聲片段,移動終端將第三人聲片段和第二人聲片段作為本次錄制的人聲片段。
205、移動終端對第一人聲片段和第二人聲片段進(jìn)行處理,得到重錄音頻文件。
經(jīng)過上述步驟201~204,移動終端獲取到用戶較為滿意的第二人聲片段,但該第二人聲片段并未與第一人聲片段相連,而是與第三人聲片段連接在一起, 且第一人聲片段也未與第二人聲片段相連,而是與待重錄人聲片段相連,此時(shí)移動終端需要對第一人聲片段和第二人聲片段進(jìn)行處理,使得第一人聲片段和第二人聲片段能夠自然的拼接在一起,得到重錄音頻文件。
移動終端在對第一人聲片段和第二人聲片段進(jìn)行處理時(shí),可采用如下步驟2051~2056:
2051、移動終端獲取第一人聲片段對應(yīng)的第一音譜,并獲取第二人聲片段對應(yīng)的第二音譜。
眾所周知聲音在空氣中傳播可以形成聲波,每個(gè)聲波都對應(yīng)一個(gè)音譜。本實(shí)施例正是基于第一人聲片段對應(yīng)的音譜、第二人聲片段對應(yīng)的音譜,對第一人聲片段和第二人聲片段進(jìn)行處理的。為了便于后續(xù)敘述,本實(shí)施例將第一人聲片段對應(yīng)的音譜稱為第一音譜,將第二人聲片段對應(yīng)的音譜稱為第二音譜。參見圖4,圖4中401為伴奏文件對應(yīng)的音譜,402為第一人聲片段對應(yīng)的第一音譜,403為第一人聲片段之前的人聲片段對應(yīng)的音譜,404為待重錄人聲片段對應(yīng)的音譜,405為以待重錄人聲片段為起點(diǎn)已錄制人聲片段對應(yīng)的音譜。
在本實(shí)施例中,移動終端獲取第一人聲片段對應(yīng)的第一音譜時(shí),可將第一人聲片段輸入到示波器中,得到第一人聲片段對應(yīng)的第一音譜。移動終端在獲取第二人聲片段對應(yīng)的第二音譜時(shí),可將第二人聲片段譜輸入到示波器中,得到第二人聲片段對應(yīng)的第二音譜。
上述僅為獲取第一人聲片段對應(yīng)的第一音譜、以及第二人聲片段對應(yīng)的第二音譜的一種方式,在實(shí)際應(yīng)用中,還可以采用其他方式獲取第一人聲片段對應(yīng)的第一音譜及第二人聲片段對應(yīng)的第二音譜,本實(shí)施例對此不再一一說明。
2052、移動終端從第一音譜中,獲取平穩(wěn)起始點(diǎn)及平穩(wěn)起始點(diǎn)對應(yīng)的第二時(shí)間。
在一句歌詞歌唱完成的過程中,麥克風(fēng)等設(shè)備采集到的人聲片段對應(yīng)的音譜趨于穩(wěn)定且音譜幅值逐漸較小,從音譜趨于穩(wěn)定的起始點(diǎn)開始,麥克風(fēng)等設(shè)備所采集到的人聲片段通常僅為用戶的氣息等,并無人聲數(shù)據(jù)。本實(shí)施例將音 譜趨于穩(wěn)定的起始點(diǎn)稱為平穩(wěn)起始點(diǎn),將平穩(wěn)起始點(diǎn)對應(yīng)的時(shí)間稱為第二時(shí)間。其中,第二時(shí)間可以為音頻文件的第1分鐘、音頻文件的第3分鐘等,本實(shí)施例不對第二時(shí)間的大小作具體的限定,只需保證第二時(shí)間早于第一時(shí)間即可。參見圖5,圖5中的A為第一人聲片段對應(yīng)的第一音譜,B為待重錄人聲片段對應(yīng)的第二音譜,S為第一音譜中的平穩(wěn)起始點(diǎn),設(shè)定S點(diǎn)對應(yīng)的時(shí)間為t1。
2053、移動終端從第二音譜中,獲取上升起始點(diǎn)及上升起始點(diǎn)對應(yīng)的第三時(shí)間。
在開始歌唱一句歌詞的過程中,麥克風(fēng)等設(shè)備采集到的人聲片段對應(yīng)的音譜逐漸上升且音譜幅值逐漸增大,從音譜開始上升的起始點(diǎn)開始,麥克風(fēng)等設(shè)備采集到的人聲片段開始有用戶的人聲數(shù)據(jù)。本實(shí)施例將音譜趨于上升的起始點(diǎn)稱為上升起始點(diǎn),將上升起始點(diǎn)對應(yīng)的時(shí)間稱為第三時(shí)間。其中,第三時(shí)間可以為音頻文件的第3分鐘、音頻文件的第5分鐘等,本實(shí)施例不對第三時(shí)間的大小作具體的限定,只需保證第一時(shí)間早于第三時(shí)間即可。參見圖6,圖6中的A`為第三人聲片段對應(yīng)的音譜,C為第二人聲片段對應(yīng)的音譜,E為第二音譜中的上升起始點(diǎn),設(shè)定E點(diǎn)對應(yīng)的時(shí)間為t2。
2054、移動終端以第二時(shí)間為起始時(shí)間,從本次錄制的人聲片段中選取第四人聲片段。
為了獲取到聽感較佳的音頻文件,無論是上次采集到的人聲片段,還是本次采集到的人聲片段,移動終端都會將采集到的人聲片段存儲在緩存等存儲介質(zhì)中。為使第一人聲片段和第二人聲片段自然拼接在一起,移動終端可對第一人聲片段和第二人聲片段中無人聲數(shù)據(jù)的部分進(jìn)行拼接。
為了更好地做到無縫拼接,移動終端可以第二時(shí)間為起始時(shí)間,從本次錄制的人聲片段中選取第四人聲片段,該第四人聲片段包括第三人聲片段中的部分及第二人聲片段,該第三人聲片段中的部分以第二時(shí)間為起始時(shí)間、以第三時(shí)間為結(jié)束時(shí)間。參見圖7,第四人聲片段包括第三人聲片段中的部分及第二人聲片段C。
2055、移動終端以第三時(shí)間為結(jié)束時(shí)間,從上次錄制的人聲片段中選取第五人聲片段,上次錄制的人聲片段包括待重錄人聲片段和第一人聲片段。
為了將第一人聲片段和第二人聲片段更好地拼接在一起,移動終端還將以第三時(shí)間為結(jié)束時(shí)間,從上次錄制的人聲片段中選取第五人聲片段,該上次錄制的人聲片段包括待重錄人聲片段和第一人聲片段,相應(yīng)地,第五人聲片段包括第一人聲片段和待重錄人聲片段中的部分,該待重錄人聲片段的部分以第二時(shí)間為起始時(shí)間、以第三時(shí)間為結(jié)束時(shí)間。參見圖7,第五人聲片段包括第一人聲片段A及待重錄人聲片段中的部分。
2056、移動終端對第四人聲片段和第五人聲片段進(jìn)行處理,得到重錄音頻文件。
移動終端在對第四人聲片段和第五人聲片段進(jìn)行處理,得到重錄音頻文件時(shí),可采用如下步驟a~c:
a、移動終端將第四人聲片段對應(yīng)的音譜和第五人聲片段對應(yīng)的音譜進(jìn)行比對。
通常人聲片段的音譜可以反應(yīng)出人聲片段在某一時(shí)刻的振幅情況,移動終端通過將第四人聲片段對應(yīng)的音譜和第五人聲片段對應(yīng)的音譜進(jìn)行比較,可獲取到第四人聲片段和第五人聲片段振幅較小的部分,該振幅較小部分并無人聲,在該部分對第四人聲片段和第五人聲片段進(jìn)行拼接,不會影響到整個(gè)音頻文件的完整性。
b、移動終端從第四人聲片段對應(yīng)的音譜中,獲取第一目標(biāo)音譜,并從第五人聲片段對應(yīng)的音譜中,獲取第二目標(biāo)音譜。
其中,移動終端通過將第四人聲片段對應(yīng)的音譜和第五人聲片段對應(yīng)的音譜進(jìn)行比較,可從第四人聲片段對應(yīng)的音譜中,獲取到第一目標(biāo)音譜,從第五人聲片段對應(yīng)的音譜中,獲取第二目標(biāo)音譜。第一目標(biāo)音譜和第二音譜具有相同的起始時(shí)間和結(jié)束時(shí)間,該第一目標(biāo)音譜為第四人聲片段中振幅較小部分,該第二目標(biāo)音譜為第五人聲片段中振幅較小部分。
c、移動終端對第一目標(biāo)音頻和第二目標(biāo)音譜進(jìn)行擬合,使得第四人聲片段和第五人聲片段拼接在一起,得到重錄音頻文件。
移動終端在對第一目標(biāo)音譜和第二目標(biāo)音譜進(jìn)行擬合時(shí),可選取一次函數(shù)、二次函數(shù)、指定參數(shù)等作為第一目標(biāo)音譜和第二目標(biāo)音譜的權(quán)重值,并基于所選取的權(quán)重值對第一目標(biāo)音譜和第二目標(biāo)音譜的振幅進(jìn)行擬合,通過擬合可使第四人聲片段和第五人聲片段拼接在一起,進(jìn)而將第一人聲片段和第二人聲片段也拼接在一起,得到重錄音頻文件。為保證拼接在一起的第四人聲片段和第五人聲片段更自然,移動終端在為第一目標(biāo)音譜和第二目標(biāo)音譜選取權(quán)重值時(shí),可為第一目標(biāo)音譜的權(quán)重值和第二目標(biāo)音譜的權(quán)重值選取相同的數(shù)值或函數(shù)。參見圖8,圖8為對第一目標(biāo)音譜和第二目標(biāo)音譜進(jìn)行擬合的示意圖,其中,X為第一目標(biāo)音譜,Y為第二目標(biāo)音譜,s、t為二次函數(shù),s為第一目標(biāo)音譜對應(yīng)的權(quán)重值,t為第二目標(biāo)音譜對應(yīng)的權(quán)重值,,基于二次函數(shù)s和t,移動終端通過對第一目標(biāo)音譜和第二目標(biāo)音譜進(jìn)行擬合,可使第四人聲片段和第五人聲片段平滑地連接在一起。
需要說明的是,上述以移動終端在重錄音頻文件的過程中,僅采集用戶的人聲數(shù)據(jù)為例進(jìn)行說明,在實(shí)際應(yīng)用中,移動終端還可同時(shí)采集人聲數(shù)據(jù)和伴奏數(shù)據(jù),并將采集到的人聲數(shù)據(jù)和伴奏數(shù)據(jù)整合成重錄音譜文件。
本發(fā)明實(shí)施例提供的方法,無需將音譜文件錄制多次,通過播放待重錄人聲片段之前的人聲片段,使得用戶在重新錄制待重錄人聲片段時(shí),能夠聆聽之前所錄制的人聲片段,以調(diào)整氣息、與麥克風(fēng)的距離、音色等,基于采集到的歌唱數(shù)據(jù),移動終端剪輯、拼接得到的音頻文件聽感較佳,聽者察覺不出拼接的痕跡。
參見圖9,本發(fā)明實(shí)施例提供了一種音頻文件的重錄裝置的結(jié)構(gòu)示意圖,該裝置包括:
獲取模塊901,用于獲取第一時(shí)間,第一時(shí)間為待重錄人聲片段的起始時(shí)間;
第一播放模塊902,用于根據(jù)第一時(shí)間,播放已錄制的第一人聲片段,第一人聲片段以第一時(shí)間為結(jié)束時(shí)間;
第一采集模塊903,用于當(dāng)?shù)竭_(dá)第一時(shí)間時(shí),采集用戶的第一人聲數(shù)據(jù),得到第二人聲片段;
處理模塊904,用于對第一人聲片段和第二人聲片段進(jìn)行處理,得到重錄音頻文件。
在本發(fā)明的另一個(gè)實(shí)施例中,該裝置還包括:
第二采集模塊,用于在播放已錄制的第一人聲片段的過程中,采集用戶的第二人聲數(shù)據(jù),得到第三人聲片段;將第二人聲片段和第三人聲片段作為本次錄制的人聲片段。
在本發(fā)明的另一個(gè)實(shí)施例中,處理模塊904,用于獲取第一人聲片段對應(yīng)的第一音譜,并獲取第二人聲片段對應(yīng)的第二音譜;從第一音譜中,獲取平穩(wěn)起始點(diǎn)及平穩(wěn)起始點(diǎn)對應(yīng)的第二時(shí)間;從第二音譜中,獲取上升起始點(diǎn)及上升起始點(diǎn)對應(yīng)的第三時(shí)間;以第二時(shí)間為起始時(shí)間,從本次錄制的人聲片段中選取第四人聲片段;以第三時(shí)間為結(jié)束時(shí)間,從上次錄制的人聲片段中選取第五人聲片段,上次錄制的人聲片段包括待重錄人聲片段和第一人聲片段;對第四人聲片段和第五人聲片段進(jìn)行處理,得到重錄音頻文件;
其中,第二時(shí)間早于第一時(shí)間,第一時(shí)間早于第三時(shí)間。
在本發(fā)明的另一個(gè)實(shí)施例中,處理模塊904,還用于將第四人聲片段對應(yīng)的音譜和第五人聲片段對應(yīng)的音譜進(jìn)行比對;從第四人聲片段對應(yīng)的音譜中,獲取第一目標(biāo)音譜,并從第五人聲片段對應(yīng)的音譜中,獲取第二目標(biāo)音譜,第一目標(biāo)音譜和第二音譜具有相同的起始時(shí)間和結(jié)束時(shí)間;對第一目標(biāo)音頻和第二目標(biāo)音譜進(jìn)行擬合,使得第四人聲片段和第五人聲片段拼接在一起,得到重錄音頻文件。
在本發(fā)明的另一個(gè)實(shí)施例中,該裝置還包括:
第二播放模塊,用于在播放已錄制的人聲片段及錄制人聲片段的過程中, 播放相應(yīng)的伴奏文件。
綜上,本發(fā)明實(shí)施例提供的裝置,無需將音譜文件錄制多次,通過播放待重錄人聲片段之前的人聲片段,使得用戶在重新錄制待重錄人聲片段時(shí),能夠聆聽之前所錄制的人聲片段,以調(diào)整氣息、與麥克風(fēng)的距離、音色等,基于采集到的歌唱數(shù)據(jù),移動終端剪輯、拼接得到的音頻文件聽感較佳,聽者察覺不出拼接的痕跡。
參見圖10,其示出了本發(fā)明實(shí)施例所涉及音頻文件的重錄終端的結(jié)構(gòu)示意圖,該終端可以用于實(shí)施上述實(shí)施例中提供的音頻文件的重錄方法。具體來講:
終端1000可以包括RF(Radio Frequency,射頻)電路110、包括有一個(gè)或一個(gè)以上計(jì)算機(jī)可讀存儲介質(zhì)的存儲器120、輸入單元130、顯示單元140、傳感器150、音頻電路160、WiFi(Wireless Fidelity,無線保真)模塊170、包括有一個(gè)或者一個(gè)以上處理核心的處理器180、以及電源190等部件。本領(lǐng)域技術(shù)人員可以理解,圖10中示出的終端結(jié)構(gòu)并不構(gòu)成對終端的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。其中:
RF電路110可用于收發(fā)信息或通話過程中,信號的接收和發(fā)送,特別地,將基站的下行信息接收后,交由一個(gè)或者一個(gè)以上處理器180處理;另外,將涉及上行的數(shù)據(jù)發(fā)送給基站。通常,RF電路110包括但不限于天線、至少一個(gè)放大器、調(diào)諧器、一個(gè)或多個(gè)振蕩器、用戶身份模塊(SIM)卡、收發(fā)信機(jī)、耦合器、LNA(Low Noise Amplifier,低噪聲放大器)、雙工器等。此外,RF電路110還可以通過無線通信與網(wǎng)絡(luò)和其他設(shè)備通信。所述無線通信可以使用任一通信標(biāo)準(zhǔn)或協(xié)議,包括但不限于GSM(Global System of Mobile communication,全球移動通訊系統(tǒng))、GPRS(General Packet Radio Service,通用分組無線服務(wù))、CDMA(Code Division Multiple Access,碼分多址)、WCDMA(Wideband Code Division Multiple Access,寬帶碼分多址)、LTE(Long Term Evolution,長期演進(jìn))、電子郵件、SMS(Short Messaging Service,短消息服務(wù))等。
存儲器120可用于存儲軟件程序以及模塊,處理器180通過運(yùn)行存儲在存儲器120的軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理。存儲器120可主要包括存儲程序區(qū)和存儲數(shù)據(jù)區(qū),其中,存儲程序區(qū)可存儲操作系統(tǒng)、至少一個(gè)功能所需的應(yīng)用程序(比如聲音播放功能、圖像播放功能等)等;存儲數(shù)據(jù)區(qū)可存儲根據(jù)終端1000的使用所創(chuàng)建的數(shù)據(jù)(比如音頻數(shù)據(jù)、電話本等)等。此外,存儲器120可以包括高速隨機(jī)存取存儲器,還可以包括非易失性存儲器,例如至少一個(gè)磁盤存儲器件、閃存器件、或其他易失性固態(tài)存儲器件。相應(yīng)地,存儲器120還可以包括存儲器控制器,以提供處理器180和輸入單元130對存儲器120的訪問。
輸入單元130可用于接收輸入的數(shù)字或字符信息,以及產(chǎn)生與用戶設(shè)置以及功能控制有關(guān)的鍵盤、鼠標(biāo)、操作桿、光學(xué)或者軌跡球信號輸入。具體地,輸入單元130可包括觸敏表面131以及其他輸入設(shè)備132。觸敏表面131,也稱為觸摸顯示屏或者觸控板,可收集用戶在其上或附近的觸摸操作(比如用戶使用手指、觸筆等任何適合的物體或附件在觸敏表面131上或在觸敏表面131附近的操作),并根據(jù)預(yù)先設(shè)定的程式驅(qū)動相應(yīng)的連接裝置??蛇x的,觸敏表面131可包括觸摸檢測裝置和觸摸控制器兩個(gè)部分。其中,觸摸檢測裝置檢測用戶的觸摸方位,并檢測觸摸操作帶來的信號,將信號傳送給觸摸控制器;觸摸控制器從觸摸檢測裝置上接收觸摸信息,并將它轉(zhuǎn)換成觸點(diǎn)坐標(biāo),再送給處理器180,并能接收處理器180發(fā)來的命令并加以執(zhí)行。此外,可以采用電阻式、電容式、紅外線以及表面聲波等多種類型實(shí)現(xiàn)觸敏表面131。除了觸敏表面131,輸入單元130還可以包括其他輸入設(shè)備132。具體地,其他輸入設(shè)備132可以包括但不限于物理鍵盤、功能鍵(比如音量控制按鍵、開關(guān)按鍵等)、軌跡球、鼠標(biāo)、操作桿等中的一種或多種。
顯示單元140可用于顯示由用戶輸入的信息或提供給用戶的信息以及終端1000的各種圖形用戶接口,這些圖形用戶接口可以由圖形、文本、圖標(biāo)、視頻和其任意組合來構(gòu)成。顯示單元140可包括顯示面板141,可選的,可以采用 LCD(Liquid Crystal Display,液晶顯示器)、OLED(Organic Light-Emitting Diode,有機(jī)發(fā)光二極管)等形式來配置顯示面板141。進(jìn)一步的,觸敏表面131可覆蓋顯示面板141,當(dāng)觸敏表面131檢測到在其上或附近的觸摸操作后,傳送給處理器180以確定觸摸事件的類型,隨后處理器180根據(jù)觸摸事件的類型在顯示面板141上提供相應(yīng)的視覺輸出。雖然在圖10中,觸敏表面131與顯示面板141是作為兩個(gè)獨(dú)立的部件來實(shí)現(xiàn)輸入和輸入功能,但是在某些實(shí)施例中,可以將觸敏表面131與顯示面板141集成而實(shí)現(xiàn)輸入和輸出功能。
終端1000還可包括至少一種傳感器150,比如光傳感器、運(yùn)動傳感器以及其他傳感器。具體地,光傳感器可包括環(huán)境光傳感器及接近傳感器,其中,環(huán)境光傳感器可根據(jù)環(huán)境光線的明暗來調(diào)節(jié)顯示面板141的亮度,接近傳感器可在終端1000移動到耳邊時(shí),關(guān)閉顯示面板141和/或背光。作為運(yùn)動傳感器的一種,重力加速度傳感器可檢測各個(gè)方向上(一般為三軸)加速度的大小,靜止時(shí)可檢測出重力的大小及方向,可用于識別手機(jī)姿態(tài)的應(yīng)用(比如橫豎屏切換、相關(guān)游戲、磁力計(jì)姿態(tài)校準(zhǔn))、振動識別相關(guān)功能(比如計(jì)步器、敲擊)等;至于終端1000還可配置的陀螺儀、氣壓計(jì)、濕度計(jì)、溫度計(jì)、紅外線傳感器等其他傳感器,在此不再贅述。
音頻電路160、揚(yáng)聲器161,傳聲器162可提供用戶與終端1000之間的音頻接口。音頻電路160可將接收到的音頻數(shù)據(jù)轉(zhuǎn)換后的電信號,傳輸?shù)綋P(yáng)聲器161,由揚(yáng)聲器161轉(zhuǎn)換為聲音信號輸出;另一方面,傳聲器162將收集的聲音信號轉(zhuǎn)換為電信號,由音頻電路160接收后轉(zhuǎn)換為音頻數(shù)據(jù),再將音頻數(shù)據(jù)輸出處理器180處理后,經(jīng)RF電路110以發(fā)送給比如另一終端,或者將音頻數(shù)據(jù)輸出至存儲器120以便進(jìn)一步處理。音頻電路160還可能包括耳塞插孔,以提供外設(shè)耳機(jī)與終端1000的通信。
WiFi屬于短距離無線傳輸技術(shù),終端1000通過WiFi模塊170可以幫助用戶收發(fā)電子郵件、瀏覽網(wǎng)頁和訪問流式媒體等,它為用戶提供了無線的寬帶互聯(lián)網(wǎng)訪問。雖然圖10示出了WiFi模塊170,但是可以理解的是,其并不屬于終 端1000的必須構(gòu)成,完全可以根據(jù)需要在不改變發(fā)明的本質(zhì)的范圍內(nèi)而省略。
處理器180是終端1000的控制中心,利用各種接口和線路連接整個(gè)手機(jī)的各個(gè)部分,通過運(yùn)行或執(zhí)行存儲在存儲器120內(nèi)的軟件程序和/或模塊,以及調(diào)用存儲在存儲器120內(nèi)的數(shù)據(jù),執(zhí)行終端1000的各種功能和處理數(shù)據(jù),從而對手機(jī)進(jìn)行整體監(jiān)控??蛇x的,處理器180可包括一個(gè)或多個(gè)處理核心;可選的,處理器180可集成應(yīng)用處理器和調(diào)制解調(diào)處理器,其中,應(yīng)用處理器主要處理操作系統(tǒng)、用戶界面和應(yīng)用程序等,調(diào)制解調(diào)處理器主要處理無線通信??梢岳斫獾氖牵鲜稣{(diào)制解調(diào)處理器也可以不集成到處理器180中。
終端1000還包括給各個(gè)部件供電的電源190(比如電池),優(yōu)選的,電源可以通過電源管理系統(tǒng)與處理器180邏輯相連,從而通過電源管理系統(tǒng)實(shí)現(xiàn)管理充電、放電、以及功耗管理等功能。電源190還可以包括一個(gè)或一個(gè)以上的直流或交流電源、再充電系統(tǒng)、電源故障檢測電路、電源轉(zhuǎn)換器或者逆變器、電源狀態(tài)指示器等任意組件。
盡管未示出,終端1000還可以包括攝像頭、藍(lán)牙模塊等,在此不再贅述。具體在本實(shí)施例中,終端1000的顯示單元是觸摸屏顯示器,終端1000還包括有存儲器,以及一個(gè)或者一個(gè)以上的程序,其中一個(gè)或者一個(gè)以上程序存儲于存儲器中,且經(jīng)配置以由一個(gè)或者一個(gè)以上處理器執(zhí)行。所述一個(gè)或者一個(gè)以上程序包含用于執(zhí)行以下操作的指令:
獲取第一時(shí)間,第一時(shí)間為待重錄人聲片段的起始時(shí)間;
根據(jù)第一時(shí)間,播放已錄制的第一人聲片段,第一人聲片段以第一時(shí)間為結(jié)束時(shí)間;
當(dāng)?shù)竭_(dá)第一時(shí)間時(shí),采集用戶的第一人聲數(shù)據(jù),得到第二人聲片段;
對第一人聲片段和第二人聲片段進(jìn)行處理,得到重錄音頻文件。
假設(shè)上述為第一種可能的實(shí)施方式,則在第一種可能的實(shí)施方式作為基礎(chǔ)而提供的第二種可能的實(shí)施方式中,終端的存儲器中,還包含用于執(zhí)行以下操作的指令:
該方法還包括:
在播放已錄制的第一人聲片段的過程中,采集用戶的第二人聲數(shù)據(jù),得到第三人聲片段;
將第二人聲片段和第三人聲片段作為本次錄制的人聲片段。
假設(shè)上述為第二種可能的實(shí)施方式,則在第二種可能的實(shí)施方式作為基礎(chǔ)而提供的第三種可能的實(shí)施方式中,終端的存儲器中,還包含用于執(zhí)行以下操作的指令:
對第一人聲片段和第二人聲片段進(jìn)行處理,得到重錄音頻文件,包括:
獲取第一人聲片段對應(yīng)的第一音譜,并獲取第二人聲片段對應(yīng)的第二音譜;
從第一音譜中,獲取平穩(wěn)起始點(diǎn)及平穩(wěn)起始點(diǎn)對應(yīng)的第二時(shí)間;
從第二音譜中,獲取上升起始點(diǎn)及上升起始點(diǎn)對應(yīng)的第三時(shí)間;
以第二時(shí)間為起始時(shí)間,從本次錄制的人聲片段中選取第四人聲片段;
以第三時(shí)間為結(jié)束時(shí)間,從上次錄制的人聲片段中選取第五人聲片段,上次錄制的人聲片段包括待重錄人聲片段和第一人聲片段;
對第四人聲片段和第五人聲片段進(jìn)行處理,得到重錄音頻文件;
其中,第二時(shí)間早于第一時(shí)間,第一時(shí)間早于第三時(shí)間。
假設(shè)上述為第三種可能的實(shí)施方式,則在第三種可能的實(shí)施方式作為基礎(chǔ)而提供的第四種可能的實(shí)施方式中,終端的存儲器中,還包含用于執(zhí)行以下操作的指令:
對第四人聲片段和第五人聲片段進(jìn)行處理,得到重錄音頻文件,包括:
將第四人聲片段對應(yīng)的音譜和第五人聲片段對應(yīng)的音譜進(jìn)行比對;
從第四人聲片段對應(yīng)的音譜中,獲取第一目標(biāo)音譜,并從第五人聲片段對應(yīng)的音譜中,獲取第二目標(biāo)音譜,第一目標(biāo)音譜和第二音譜具有相同的起始時(shí)間和結(jié)束時(shí)間;
對第一目標(biāo)音頻和第二目標(biāo)音譜進(jìn)行擬合,使得第四人聲片段和第五人聲片段拼接在一起,得到重錄音頻文件。
假設(shè)上述為第四種可能的實(shí)施方式,則在第四種可能的實(shí)施方式作為基礎(chǔ)而提供的第五種可能的實(shí)施方式中,終端的存儲器中,還包含用于執(zhí)行以下操作的指令:
該方法還包括:
在播放已錄制的人聲片段及錄制人聲片段的過程中,播放相應(yīng)的伴奏文件。
本發(fā)明實(shí)施例提供的終端,無需將音譜文件錄制多次,通過播放待重錄人聲片段之前的人聲片段,使得用戶在重新錄制待重錄人聲片段時(shí),能夠聆聽之前所錄制的人聲片段,以調(diào)整氣息、與麥克風(fēng)的距離、音色等,基于采集到的歌唱數(shù)據(jù),移動終端剪輯、拼接得到的音頻文件聽感較佳,聽者察覺不出拼接的痕跡。
本發(fā)明實(shí)施例還提供了一種計(jì)算機(jī)可讀存儲介質(zhì),該計(jì)算機(jī)可讀存儲介質(zhì)可以是上述實(shí)施例中的存儲器中所包含的計(jì)算機(jī)可讀存儲介質(zhì);也可以是單獨(dú)存在,未裝配入終端中的計(jì)算機(jī)可讀存儲介質(zhì)。該計(jì)算機(jī)可讀存儲介質(zhì)存儲有一個(gè)或者一個(gè)以上程序,該一個(gè)或者一個(gè)以上程序被一個(gè)或者一個(gè)以上的處理器用來執(zhí)行音頻文件的重錄,該方法包括:
獲取第一時(shí)間,第一時(shí)間為待重錄人聲片段的起始時(shí)間;
根據(jù)第一時(shí)間,播放已錄制的第一人聲片段,第一人聲片段以第一時(shí)間為結(jié)束時(shí)間;
當(dāng)?shù)竭_(dá)第一時(shí)間時(shí),采集用戶的第一人聲數(shù)據(jù),得到第二人聲片段;
對第一人聲片段和第二人聲片段進(jìn)行處理,得到重錄音頻文件。
假設(shè)上述為第一種可能的實(shí)施方式,則在第一種可能的實(shí)施方式作為基礎(chǔ)而提供的第二種可能的實(shí)施方式中,終端的存儲器中,還包含用于執(zhí)行以下操作的指令:
該方法還包括:
在播放已錄制的第一人聲片段的過程中,采集用戶的第二人聲數(shù)據(jù),得到 第三人聲片段;
將第二人聲片段和第三人聲片段作為本次錄制的人聲片段。
假設(shè)上述為第二種可能的實(shí)施方式,則在第二種可能的實(shí)施方式作為基礎(chǔ)而提供的第三種可能的實(shí)施方式中,終端的存儲器中,還包含用于執(zhí)行以下操作的指令:
對第一人聲片段和第二人聲片段進(jìn)行處理,得到重錄音頻文件,包括:
獲取第一人聲片段對應(yīng)的第一音譜,并獲取第二人聲片段對應(yīng)的第二音譜;
從第一音譜中,獲取平穩(wěn)起始點(diǎn)及平穩(wěn)起始點(diǎn)對應(yīng)的第二時(shí)間;
從第二音譜中,獲取上升起始點(diǎn)及上升起始點(diǎn)對應(yīng)的第三時(shí)間;
以第二時(shí)間為起始時(shí)間,從本次錄制的人聲片段中選取第四人聲片段;
以第三時(shí)間為結(jié)束時(shí)間,從上次錄制的人聲片段中選取第五人聲片段,上次錄制的人聲片段包括待重錄人聲片段和第一人聲片段;
對第四人聲片段和第五人聲片段進(jìn)行處理,得到重錄音頻文件;
其中,第二時(shí)間早于第一時(shí)間,第一時(shí)間早于第三時(shí)間。
假設(shè)上述為第三種可能的實(shí)施方式,則在第三種可能的實(shí)施方式作為基礎(chǔ)而提供的第四種可能的實(shí)施方式中,終端的存儲器中,還包含用于執(zhí)行以下操作的指令:
對第四人聲片段和第五人聲片段進(jìn)行處理,得到重錄音頻文件,包括:
將第四人聲片段對應(yīng)的音譜和第五人聲片段對應(yīng)的音譜進(jìn)行比對;
從第四人聲片段對應(yīng)的音譜中,獲取第一目標(biāo)音譜,并從第五人聲片段對應(yīng)的音譜中,獲取第二目標(biāo)音譜,第一目標(biāo)音譜和第二音譜具有相同的起始時(shí)間和結(jié)束時(shí)間;
對第一目標(biāo)音頻和第二目標(biāo)音譜進(jìn)行擬合,使得第四人聲片段和第五人聲片段拼接在一起,得到重錄音頻文件。
假設(shè)上述為第四種可能的實(shí)施方式,則在第四種可能的實(shí)施方式作為基礎(chǔ)而提供的第五種可能的實(shí)施方式中,終端的存儲器中,還包含用于執(zhí)行以下操 作的指令:
該方法還包括:
在播放已錄制的人聲片段及錄制人聲片段的過程中,播放相應(yīng)的伴奏文件。
本發(fā)明實(shí)施例提供的計(jì)算機(jī)可讀存儲介質(zhì),無需將音譜文件錄制多次,通過播放待重錄人聲片段之前的人聲片段,使得用戶在重新錄制待重錄人聲片段時(shí),能夠聆聽之前所錄制的人聲片段,以調(diào)整氣息、與麥克風(fēng)的距離、音色等,基于采集到的歌唱數(shù)據(jù),移動終端剪輯、拼接得到的音頻文件聽感較佳,聽者察覺不出拼接的痕跡。
本發(fā)明實(shí)施例中提供了一種圖形用戶接口,該圖形用戶接口用在音頻文件的重錄終端上,該執(zhí)行音頻文件的重錄終端包括觸摸屏顯示器、存儲器和用于執(zhí)行一個(gè)或者一個(gè)以上的程序的一個(gè)或者一個(gè)以上的處理器;該圖形用戶接口包括:
獲取第一時(shí)間,第一時(shí)間為待重錄人聲片段的起始時(shí)間;
根據(jù)第一時(shí)間,播放已錄制的第一人聲片段,第一人聲片段以第一時(shí)間為結(jié)束時(shí)間;
當(dāng)?shù)竭_(dá)第一時(shí)間時(shí),采集用戶的第一人聲數(shù)據(jù),得到第二人聲片段;
對第一人聲片段和第二人聲片段進(jìn)行處理,得到重錄音頻文件。
本發(fā)明實(shí)施例提供的圖形用戶接口,無需將音譜文件錄制多次,通過播放待重錄人聲片段之前的人聲片段,使得用戶在重新錄制待重錄人聲片段時(shí),能夠聆聽之前所錄制的人聲片段,以調(diào)整氣息、與麥克風(fēng)的距離、音色等,基于采集到的歌唱數(shù)據(jù),移動終端剪輯、拼接得到的音頻文件聽感較佳,聽者察覺不出拼接的痕跡。
需要說明的是:上述實(shí)施例提供的音頻文件的重錄裝置在重錄音頻文件時(shí),僅以上述各功能模塊的劃分進(jìn)行舉例說明,實(shí)際應(yīng)用中,可以根據(jù)需要而將上 述功能分配由不同的功能模塊完成,即將音頻文件的重錄裝置的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實(shí)施例提供的音頻文件的重錄裝置與音頻文件的重錄方法實(shí)施例屬于同一構(gòu)思,其具體實(shí)現(xiàn)過程詳見方法實(shí)施例,這里不再贅述。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計(jì)算機(jī)可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
以上所述僅為本發(fā)明的較佳實(shí)施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。