專利名稱:歌詞文件生成、校對(duì)方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于終端技術(shù)領(lǐng)域,尤其涉及歌詞文件生成、校對(duì)方法及裝置。
背景技術(shù):
隨著人們對(duì)視聽體驗(yàn)追求的日益提高,人們要求音視頻播放器能夠提供顯示歌詞的功能?,F(xiàn)有的播放器大多支持從一種特定的歌詞文件讀 取歌詞并顯示,這給喜愛音樂的人群帶來了很大的方便。但這種歌詞文件必須從網(wǎng)絡(luò)下載,當(dāng)播放器處于無有效網(wǎng)絡(luò)的受限環(huán)境中而無法獲取到歌詞文件時(shí),這項(xiàng)功能便會(huì)失效,使用戶的聽歌體驗(yàn)大打折扣。另夕卜,即使播放器處于有效網(wǎng)絡(luò)環(huán)境下,下載歌詞文件也會(huì)產(chǎn)生額外的流量、資費(fèi),加重了用戶的負(fù)擔(dān),不利于播放器的用戶群擴(kuò)大。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例的目的在于提供一種歌詞文件生成方法及裝置,旨在解決現(xiàn)有技術(shù)無法自動(dòng)生成歌詞的問題。本發(fā)明實(shí)施例是這樣實(shí)現(xiàn)的,一種歌詞文件生成方法,包括在當(dāng)前播放的音視頻文件未關(guān)聯(lián)歌詞文件時(shí),生成與當(dāng)前播放的音視頻文件關(guān)聯(lián)的歌詞空文件;記錄所述音視頻文件的每句歌詞的開始播放時(shí)間;根據(jù)語音識(shí)別生成所述每句歌詞的文本;將所述每句歌詞的所述開始播放的時(shí)間和所述文本關(guān)聯(lián)后保存進(jìn)所述歌詞空文件,直至所述音視頻文件播放結(jié)束,以生成所述音視頻文件的歌詞文件。本發(fā)明實(shí)施例的另一目的在于提供一種歌詞文件生成裝置,包括生成單元,用于在當(dāng)前播放的音視頻文件未關(guān)聯(lián)歌詞文件時(shí),生成與當(dāng)前播放的音視頻文件關(guān)聯(lián)的歌詞空文件;第一記錄單元,用于記錄所述音視頻文件的每句歌詞的開始播放時(shí)間;第一語音識(shí)別單元,用于根據(jù)語音識(shí)別生成所述每句歌詞的文本;保存單元,用于將所述每句歌詞的所述開始播放的時(shí)間和所述文本關(guān)聯(lián)后保存進(jìn)所述歌詞空文件,直至所述音視頻文件播放結(jié)束,以生成所述音視頻文件的歌詞文件。在本發(fā)明實(shí)施例中,當(dāng)音視頻文件無關(guān)聯(lián)的歌詞文件時(shí),通過語音識(shí)別技術(shù)自動(dòng)生成歌詞文本并獲取到每句歌詞的開始播放時(shí)間,將每句歌詞的開始播放時(shí)間和該句歌詞的文本寫入特定格式的歌詞文件,從而實(shí)現(xiàn)歌詞文本的自動(dòng)生成,提升了用戶的視聽體驗(yàn)。本發(fā)明實(shí)施例的另一目的在于提供一種歌詞文件校對(duì)方法,包括載入當(dāng)前播放的音視頻文件關(guān)聯(lián)的歌詞文件;記錄所述音視頻文件每句歌詞的開始播放時(shí)間;根據(jù)語音識(shí)別生成所述每句歌詞的文本;對(duì)于所述每句歌詞,當(dāng)判斷出所述記錄的所述開始播放時(shí)間和所述歌詞文件中的開始播放時(shí)間不同,或者判斷出所述記錄的所述文本與所述歌詞文件中的文本不同,修改所述歌詞文件。本發(fā)明實(shí)施例的另一目的在于提供一種歌詞文件校對(duì)裝置,包括載入單元,用于載入當(dāng)前播放的音視頻文件關(guān)聯(lián)的歌詞文件;第二記錄單元,用于記錄所述音視頻文件每句歌詞的開始播放時(shí)間;第二語音識(shí)別單元,用于根據(jù)語音識(shí)別生成所述每句歌詞的文本;修改單元,用于對(duì)于所述每句歌詞,當(dāng)判斷出所述記錄的所述開始播放時(shí)間和所述歌詞文件中的開始播放時(shí)間不同,或者判斷出所述記錄的所述文本與所述歌詞文件中的文本不同,修改所述歌詞文件。 在本發(fā)明實(shí)施例中,當(dāng)音視頻文件關(guān)聯(lián)的歌詞文件出錯(cuò)時(shí),通過語音識(shí)別技術(shù)自動(dòng)生成正確的歌詞文本并獲取到每句歌詞正確的開始播放時(shí)間,以對(duì)歌詞文件進(jìn)行修改,從而實(shí)現(xiàn)歌詞文本的自動(dòng)校對(duì),提升了用戶的視聽體驗(yàn)。
圖I是本發(fā)明實(shí)施例提供的歌詞生成方法的實(shí)現(xiàn)流程圖;圖2是本發(fā)明實(shí)施例提供的歌詞生成裝置的結(jié)構(gòu)框圖;圖3是本發(fā)明實(shí)施例提供的歌詞校正方法的實(shí)現(xiàn)流程圖;圖4是本發(fā)明實(shí)施例提供的歌詞校正裝置的結(jié)構(gòu)框圖。
具體實(shí)施例方式為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。在本發(fā)明實(shí)施例中,當(dāng)音視頻文件無關(guān)聯(lián)的歌詞文件時(shí),通過語音識(shí)別技術(shù)自動(dòng)生成歌詞文本并獲取到每句歌詞的開始播放時(shí)間,將每句歌詞的開始播放時(shí)間和該句歌詞的文本寫入特定格式的歌詞文件,從而實(shí)現(xiàn)歌詞文本的自動(dòng)生成,提升了用戶的視聽體驗(yàn)。圖I示出了本發(fā)明實(shí)施例提供的歌詞生成方法的實(shí)現(xiàn)流程,詳述如下在步驟SlOl中,在當(dāng)前播放的音視頻文件未關(guān)聯(lián)歌詞文件時(shí),生成與當(dāng)前播放的音視頻文件關(guān)聯(lián)的歌詞空文件。在本實(shí)施例中,步驟SlOl之前首先判斷當(dāng)前播放的音視頻文件是否有關(guān)聯(lián)的歌詞文件,其中,關(guān)聯(lián)是指播放器等進(jìn)行音視頻播放的應(yīng)用程序可以根據(jù)音視頻文件的文件信息以某種特定的規(guī)則查找或優(yōu)選出唯一的歌詞文件,例如,根據(jù)音視頻文件的文件名,查找出相同文件名的.Iyc格式的歌詞文件。若當(dāng)前播放的音視頻文件關(guān)聯(lián)了歌詞文件,則載入其關(guān)聯(lián)的歌詞文件,若沒有關(guān)聯(lián)歌詞文件,則執(zhí)行步驟S101,生成與當(dāng)前播放的音視頻文件關(guān)聯(lián)的歌詞空文件,其中,在本步驟中生成的歌詞空文件為初始歌詞文件,即該歌詞文件中還不包括其關(guān)聯(lián)的音視頻文件的歌詞相關(guān)信息。具體地,生成與當(dāng)前音視頻文件關(guān)聯(lián)的歌詞空文件,可以首先通過獲取音視頻文件的文件信息,這些信息包括但不限于音視頻文件的文件名、音視頻文件的存儲(chǔ)位置、音樂家信息等,以生成與該音視頻文件的文件名命名的歌詞文件,從而通過相同的文件名建立起該音視頻文件與其歌詞文件的關(guān)聯(lián)關(guān)系。進(jìn)一步地,還可以在預(yù)設(shè)的存儲(chǔ)位置或者該音視頻文件的存儲(chǔ)位置生成該歌詞文件,由此,可以使播放器在下一次播放此音視頻文件時(shí)能夠查找到此歌詞文件,從而不必再一次啟動(dòng)自動(dòng)生成歌詞的過程,節(jié)省了時(shí)間,提升了用戶體驗(yàn)。在步驟S102中,記錄當(dāng)前播放的音視頻文件每句歌詞的開始播放時(shí)間。啟動(dòng)語音識(shí)別功能,監(jiān)聽音視頻文件的聲音波形。具體地,根據(jù)波形的振蕩圖形,可以辨識(shí)出音視頻文件音頻分量中每一句歌詞的開始,將此時(shí)間點(diǎn)以預(yù)設(shè)格式記錄下來,例如[mm: ss],其中,中mm表示此時(shí)間點(diǎn)的分鐘數(shù),ss表示此時(shí)間點(diǎn)的秒數(shù),數(shù)值mm和ss不足10的以O(shè)填充其十位。在步驟S103中,根據(jù)語音識(shí)別生成每句歌詞的文本。除了上述步驟S102中所述的辨識(shí)每句歌詞的開始之外,語音識(shí)別技術(shù)還能夠辨 識(shí)出每句歌詞的內(nèi)容,即將音視頻中所蘊(yùn)含的聲音信息轉(zhuǎn)化成語言文本。當(dāng)前,語音識(shí)別技術(shù)是一門相對(duì)成熟的技術(shù),其在便攜式終端或計(jì)算機(jī)等終端設(shè)備上的應(yīng)用已十分普遍,包括蘋果的Siri語音助手,微軟的SpeechSDK,IBM的ViaVoice等等,在此不再贅述。通過對(duì)識(shí)別算法做相應(yīng)的微調(diào),語音識(shí)別技術(shù)可以用來辨識(shí)具有不同特點(diǎn)的聲音信息。在本實(shí)施例中,以歌曲的旋律為參數(shù)對(duì)識(shí)別算法做相應(yīng)的微調(diào),即可準(zhǔn)確地辨識(shí)出歌詞信息。優(yōu)選地,在對(duì)歌詞進(jìn)行語音識(shí)別時(shí),可以在數(shù)據(jù)庫中存儲(chǔ)常用的詞語或者成語的聲音波形,通過將音視頻文件的波形與存儲(chǔ)的小型進(jìn)行匹配,能夠更加準(zhǔn)確地識(shí)別出歌詞的文本。在步驟S104中,將每句歌詞的開始播放時(shí)間與文本關(guān)聯(lián)后保存進(jìn)歌詞空文件,直至音視頻文件播放結(jié)束,以生成該音視頻文件的歌詞文件。在音視頻文件播放的過程中,每捕捉到一句歌詞,即獲取到一句歌詞的開始時(shí)間后,將S102中所記錄的時(shí)間與S103中所記錄的歌詞文本做關(guān)聯(lián),然后向步驟SlOl中所生成的歌詞文件中寫入關(guān)聯(lián)后時(shí)間歌詞信息。持續(xù)上述操作直至音視頻文件播放結(jié)束。時(shí)間信息與歌詞文本的關(guān)聯(lián)方式可因?qū)嵤├牟煌?。在本?shí)施例中,將時(shí)間信息與歌詞文本以英文半角空格字符相連接,時(shí)間信息在前,歌詞文本在后。對(duì)于寫入操作,每寫完一句歌詞會(huì)新起一行,在新行的行首執(zhí)行下一句的寫入操作,直至音視頻文件播放完畢。當(dāng)音視頻文件播放結(jié)束后,將其歌詞文件整體保存。通過上述步驟,在音視頻文件播放的過程中,播放器通過語音識(shí)別技術(shù)獲取每句歌詞的開始時(shí)間,記錄每句歌詞的文本,將二者關(guān)聯(lián)起來后寫入事先生成的歌詞文件中,直至音視頻文件播放結(jié)束后,將記錄了時(shí)間與歌詞信息的歌詞文件保存,從而實(shí)現(xiàn)了自動(dòng)生成音視頻文件的歌詞,極大地方便了用戶,提升了用戶的視聽體驗(yàn)。作為本發(fā)明的一個(gè)實(shí)施例,在自動(dòng)生成歌詞文件之前先判斷是否存在與所播放的音視頻文件相關(guān)聯(lián)的歌詞文件。若無則進(jìn)行歌詞文件的自動(dòng)生成,若有則不進(jìn)行自動(dòng)生成。關(guān)聯(lián)的特征在于,能夠通過音視頻文件的文件信息以某種規(guī)則查找或優(yōu)選出唯一的歌詞文件。作為本發(fā)明的一個(gè)實(shí)施例,在生成與音視頻文件相關(guān)聯(lián)的歌詞文件時(shí),首先獲取音視頻文件的文件信息,這些信息包括但不限于音視頻文件的文件名、音視頻文件的存儲(chǔ)位置、音樂家信息等。然后創(chuàng)建歌詞空文件,并根據(jù)獲取到的文件信息以關(guān)聯(lián)規(guī)則命名此文件。優(yōu)選地,在本發(fā)明實(shí)施例中,以音視頻文件的文件名加.Irc后綴命名歌詞文件,且存儲(chǔ)位置與其相關(guān)聯(lián)的音視頻文件相同。當(dāng)然,歌詞文件的命名規(guī)則可以因?qū)嵤├煌悾柙~文件的存儲(chǔ)位置也可以作為播放器的設(shè)置項(xiàng)以供用戶靈活設(shè)定。作為本發(fā)明的一個(gè)實(shí)施例,辨識(shí)一句歌詞開始時(shí)間的過程如下當(dāng)語音識(shí)別算法在音頻中辨識(shí)出字或詞時(shí),記錄下當(dāng)時(shí)的時(shí)刻,記作tk,同樣地,記上一次出現(xiàn)字或詞的時(shí)亥Ij為V1 ;a為可以設(shè)定的閾值,當(dāng)tk-tkja,表示一句歌詞開始,那么tk即為第k句歌詞的開始播放時(shí)間。值得注意的是,與此同時(shí),歌詞文本的記錄操作也相應(yīng)開始,即tk時(shí)刻辨識(shí)出的字或詞將被納入歌詞中,不可丟棄??梢钥闯觯柙~開始時(shí)間的辨識(shí)與歌詞文本的記錄兩種操作是并行進(jìn)行的。本發(fā)明實(shí)施例在音視頻文件播放的過程中,通過語音識(shí)別技術(shù)辨識(shí)音視頻文件中歌詞的開始時(shí)間和歌詞文本,并將它們記錄下來,寫入以特定規(guī)則命名的歌詞文件中保存,從而實(shí)現(xiàn)了自動(dòng)生成音視頻文件的歌詞,極大地方便了用戶,提升了用戶的視聽體驗(yàn)。需要說明的是,本發(fā)明實(shí)施例提供的歌詞生成方法也可適用于視頻文件的歌詞文 件或者字幕文件的生成,其相關(guān)原理與前述實(shí)施例所述原理相一致,在此不再贅述。圖2示出了本發(fā)明實(shí)施例提供的歌詞生成裝置的結(jié)構(gòu)框圖,該裝置可以運(yùn)行于音視頻文件的播放器中,該播放器的宿主環(huán)境包括但不限于移動(dòng)終端、便攜式媒體錄放器、計(jì)算機(jī)等設(shè)備。為了便于說明,僅示出了與本實(shí)施例相關(guān)的部分。參照?qǐng)D2,該裝置包括生成單元21,在當(dāng)前播放的音視頻文件未關(guān)聯(lián)歌詞文件時(shí),生成與當(dāng)前播放的音視頻文件關(guān)聯(lián)的歌詞空文件。第一記錄單元22,記錄所述音視頻文件的每句歌詞的開始播放時(shí)間。第二語音識(shí)別單元23,根據(jù)語音識(shí)別生成每句歌詞的文本。保存單元24,將每句歌詞的開始播放時(shí)間和文本關(guān)聯(lián)后保存進(jìn)歌詞空文件,直至音視頻文件播放結(jié)束,以生成所述音視頻文件的歌詞文件??蛇x地,生成單元21包括獲取子單元,獲取音視頻文件的文件信息,其中,文件信息包括該音視頻文件的文件名;生成子單元,生成以文件名命名的歌詞空文件。可選地,文件信息還包括音視頻文件的存儲(chǔ)位置,生成子單元21具體用于在該存儲(chǔ)位置生成以文件名命名的歌詞空文件??蛇x地,記錄單元22包括判斷子單元,當(dāng)有歌詞播放時(shí),判斷當(dāng)前時(shí)間距離上一次歌詞播放的時(shí)間的間隔是否超過了預(yù)設(shè)閾值;記錄子單元,當(dāng)間隔超過預(yù)設(shè)閾值,將當(dāng)前時(shí)間記錄為音視頻文件的一句歌詞的開始播放時(shí)間。如圖2所示,第一記錄單元22與第一語音識(shí)別單元23并行工作,同時(shí),二者又與保存單元24形成一個(gè)時(shí)間上的循環(huán),循環(huán)的周期為一句歌詞,循環(huán)的退出點(diǎn)為音視頻文件播放結(jié)束。本發(fā)明實(shí)施例所述的裝置在音視頻文件播放的過程中,通過語音識(shí)別技術(shù)辨識(shí)音視頻文件中歌詞的開始播放時(shí)間和歌詞文本,并將它們記錄下來,寫入以特定規(guī)則命名的歌詞文件中保存,從而實(shí)現(xiàn)了自動(dòng)生成音視頻文件的歌詞,極大地方便了用戶,提升了用戶的視聽體驗(yàn)。對(duì)于音視頻文件已關(guān)聯(lián)的一些歌詞文件,可能會(huì)出現(xiàn)歌詞文件錯(cuò)誤的情況,例如,在時(shí)間或者歌詞上對(duì)不上播放的音視頻文件,或者是通過前述方法自動(dòng)生成的歌詞文件還存在錯(cuò)誤,因此可以在音視頻文件播放時(shí),通過相應(yīng)的識(shí)別方法對(duì)已關(guān)聯(lián)的歌詞文件進(jìn)行自動(dòng)校正。圖3示出了本發(fā)明實(shí)施例提供的歌詞校對(duì)方法的實(shí)現(xiàn)流程,詳述如下在步驟S301中,載入當(dāng)前播放的音視頻文件關(guān)聯(lián)的歌詞文件。在本實(shí)施例中,若當(dāng)前播放的音視頻文件關(guān)聯(lián)了歌詞文件,則在播放音視頻文件的同時(shí)載入該音視頻文件關(guān)聯(lián)的歌詞文件。在步驟S302中,記錄音視頻文件每句歌詞的開始播放時(shí)間。 在步驟S303中,根據(jù)語音識(shí)別生成每句歌詞的文本。在本實(shí)施例中,與本發(fā)明圖I實(shí)施例所述相關(guān)實(shí)現(xiàn)原理相同,在音視頻文件播放的同時(shí),記錄歌詞的開始播放時(shí)間,并通過語音識(shí)別生成每句歌詞的文件,其具體實(shí)現(xiàn)原理與在本發(fā)明圖I實(shí)施例中進(jìn)行了詳細(xì)闡述,在此不再贅述。在步驟S304中,對(duì)于每句歌詞,當(dāng)判斷出記錄的開始播放時(shí)間和歌詞文件中的開始播放時(shí)間不同,或者判斷出記錄的文本與歌詞文件中的文本不同,修改歌詞文件。在本實(shí)施例中,對(duì)于音視頻文件中的每句歌詞,都將記錄的開始播放時(shí)間和其關(guān)聯(lián)的歌詞文件中對(duì)應(yīng)歌詞的開始播放時(shí)間進(jìn)行比較,且都將記錄的文本與歌詞文件中對(duì)應(yīng)歌詞的文本進(jìn)行比較,當(dāng)判斷出記錄的開始播放時(shí)間和歌詞文件中的開始播放時(shí)間不同,或者判斷出記錄的文本與歌詞文件中的文本不同,則修改歌詞文件的對(duì)應(yīng)內(nèi)容,從而在音視頻文件的播放過程中實(shí)現(xiàn)歌詞文件的自動(dòng)校正。圖4示出了本發(fā)明實(shí)施例提供的歌詞校正裝置的結(jié)構(gòu)框圖,該裝置可以運(yùn)行于音視頻文件的播放器中,該播放器的宿主環(huán)境包括但不限于移動(dòng)終端、便攜式媒體錄放器、計(jì)算機(jī)等設(shè)備。為了便于說明,僅示出了與本實(shí)施例相關(guān)的部分。參照?qǐng)D4,該裝置包括載入單元41,載入當(dāng)前播放的音視頻文件關(guān)聯(lián)的歌詞文件。第二記錄單元42,記錄音視頻文件每句歌詞的開始播放時(shí)間。第一語音識(shí)別單元43,根據(jù)語音識(shí)別生成每句歌詞的文本。修改單元44,對(duì)于每句歌詞,當(dāng)判斷出記錄的開始播放時(shí)間和歌詞文件中的開始播放時(shí)間不同,或者判斷出所述記錄的文本與歌詞文件中的文本不同,修改歌詞文件。在本發(fā)明實(shí)施例中,當(dāng)音視頻文件關(guān)聯(lián)的歌詞文件出錯(cuò)時(shí),通過語音識(shí)別技術(shù)自動(dòng)生成正確的歌詞文本并獲取到每句歌詞正確的開始播放時(shí)間,以對(duì)歌詞文件進(jìn)行修改,從而實(shí)現(xiàn)歌詞文本的自動(dòng)校對(duì),提升了用戶的視聽體驗(yàn)。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種歌詞文件生成方法,其特征在于,包括 在當(dāng)前播放的音視頻文件未關(guān)聯(lián)歌詞文件時(shí),生成與當(dāng)前播放的音視頻文件關(guān)聯(lián)的歌詞空文件; 記錄所述音視頻文件的每句歌詞的開始播放時(shí)間; 根據(jù)語音識(shí)別生成所述每句歌詞的文本; 將所述每句歌詞的所述開始播放時(shí)間和所述文本關(guān)聯(lián)后保存進(jìn)所述歌詞空文件,直至所述音視頻文件播放結(jié)束,以生成所述音視頻文件的歌詞文件。
2.如權(quán)利要求I所述的方法,其特征在于,所述生成與所述音視頻文件關(guān)聯(lián)的歌詞空文件包括 獲取所述音視頻文件的文件信息,所述文件信息包括所述音視頻文件的文件名; 生成以所述文件名命名的所述歌詞空文件。
3.如權(quán)利要求2所述的方法,其特征在于,所述文件信息還包括所述音視頻文件的存儲(chǔ)位置,所述生成以所述文件名命名的所述歌詞空文件包括 在所述存儲(chǔ)位置生成以所述文件名命名的所述歌詞空文件。
4.如權(quán)利要求I所述的方法,其特征在于,所述記錄所述音視頻文件的每句歌詞的開始播放時(shí)間包括 當(dāng)有歌詞播放時(shí),判斷當(dāng)前時(shí)間距離上一次歌詞播放的時(shí)間的間隔是否超過了預(yù)設(shè)閾值; 當(dāng)所述間隔超過所述預(yù)設(shè)閾值,將所述當(dāng)前時(shí)間記錄為所述音視頻文件的一句歌詞的所述開始播放時(shí)間。
5.—種歌詞文件校對(duì)方法,其特征在于,包括 載入當(dāng)前播放的音視頻文件關(guān)聯(lián)的歌詞文件; 記錄所述音視頻文件每句歌詞的開始播放時(shí)間; 根據(jù)語音識(shí)別生成所述每句歌詞的文本; 對(duì)于所述每句歌詞,當(dāng)判斷出所述記錄的所述開始播放時(shí)間和所述歌詞文件中的開始播放時(shí)間不同,或者判斷出所述記錄的所述文本與所述歌詞文件中的文本不同,修改所述歌詞文件。
6.一種歌詞文件生成裝置,其特征在于,包括 生成單元,用于在當(dāng)前播放的音視頻文件未關(guān)聯(lián)歌詞文件時(shí),生成與當(dāng)前播放的音視頻文件關(guān)聯(lián)的歌詞空文件; 第一記錄單元,用于記錄所述音視頻文件的每句歌詞的開始播放時(shí)間; 第一語音識(shí)別單元,用于根據(jù)語音識(shí)別生成所述每句歌詞的文本; 保存單元,用于將所述每句歌詞的所述開始播放時(shí)間和所述文本關(guān)聯(lián)后保存進(jìn)所述歌詞空文件,直至所述音視頻文件播放結(jié)束,以生成所述音視頻文件的歌詞文件。
7.如權(quán)利要求6所述的裝置,其特征在于,所述生成單元包括 獲取子單元,用于獲取所述音視頻文件的文件信息,所述文件信息包括所述音視頻文件的文件名; 生成子單元,生成以所述文件名命名的所述歌詞空文件。
8.如權(quán)利要求7所述的裝置,其特征在于,所述文件信息還包括所述音視頻文件的存儲(chǔ)位置,所述生成子單元具體用于在所述存儲(chǔ)位置生成以所述文件名命名的所述歌詞空文件。
9.如權(quán)利要求6所述的裝置,其特征在于,所述記錄單元包括 判斷子單元,用于當(dāng)有歌詞播放時(shí),判斷當(dāng)前時(shí)間距離上一次歌詞播放的時(shí)間的間隔是否超過了預(yù)設(shè)閾值; 記錄子單元,用于當(dāng)所述間隔超過所述預(yù)設(shè)閾值,將所述當(dāng)前時(shí)間記錄為所述音視頻文件的一句歌詞的所述開始播放時(shí)間。
10.一種歌詞文件校對(duì)裝置,其特征在于,包括 載入單元,用于載入當(dāng)前播放的音視頻文件關(guān)聯(lián)的歌詞文件; 第二記錄單元,用于記錄所述音視頻文件每句歌詞的開始播放時(shí)間; 第一語音識(shí)別單元,用于根據(jù)語音識(shí)別生成所述每句歌詞的文本; 修改單元,用于對(duì)于所述每句歌詞,當(dāng)判斷出所述記錄的所述開始播放時(shí)間和所述歌詞文件中的開始播放時(shí)間不同,或者判斷出所述記錄的所述文本與所述歌詞文件中的文本不同,修改所述歌詞文件。
全文摘要
本發(fā)明適用于終端技術(shù)領(lǐng)域,提供了一種歌詞文件生成方法及裝置,包括在當(dāng)前播放的音視頻文件未關(guān)聯(lián)歌詞文件時(shí),生成與當(dāng)前播放的音視頻文件關(guān)聯(lián)的歌詞空文件;記錄所述音視頻文件的每句歌詞的開始播放時(shí)間;根據(jù)語音識(shí)別生成所述每句歌詞的文本;將所述每句歌詞的所述開始播放時(shí)間和所述文本關(guān)聯(lián)后保存進(jìn)所述歌詞空文件,直至所述音視頻文件播放結(jié)束,以生成所述音視頻文件的歌詞文件。在本發(fā)明中,當(dāng)音視頻文件無關(guān)聯(lián)的歌詞文件時(shí),通過語音識(shí)別技術(shù)自動(dòng)生成歌詞文本并獲取到每句歌詞的開始播放時(shí)間,將每句歌詞的開始播放時(shí)間和該句歌詞的文本寫入特定格式的歌詞文件,從而實(shí)現(xiàn)歌詞文本的自動(dòng)生成,提升了用戶的視聽體驗(yàn)。
文檔編號(hào)G11B27/10GK102881309SQ20121035914
公開日2013年1月16日 申請(qǐng)日期2012年9月24日 優(yōu)先權(quán)日2012年9月24日
發(fā)明者曾元清, 李博寧 申請(qǐng)人:廣東歐珀移動(dòng)通信有限公司