視頻文件播放進(jìn)度的調(diào)整方法及裝置制造方法
【專利摘要】本發(fā)明公開了一種視頻文件播放進(jìn)度的調(diào)整方法及裝置,在上述方法中,接收待搜索的文本信息;在視頻文件的字幕文件中查找與文本信息相匹配的字幕內(nèi)容,其中,字幕文件是從視頻文件中獲取的或者根據(jù)視頻文件生成的;根據(jù)查找到的字幕內(nèi)容確定與該字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間,并按照播放時(shí)間調(diào)整視頻文件的播放進(jìn)度。根據(jù)本發(fā)明提供的技術(shù)方案,實(shí)現(xiàn)了對(duì)用戶期望回放片段進(jìn)行準(zhǔn)確定位,操作簡(jiǎn)單方便。
【專利說(shuō)明】視頻文件播放進(jìn)度的調(diào)整方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及通信領(lǐng)域,具體而言,涉及一種視頻文件播放進(jìn)度的調(diào)整方法及裝置。
【背景技術(shù)】
[0002]隨著智能移動(dòng)終端處理能力的不斷提高和顯示屏幕的不斷增大,視頻播放器已經(jīng)逐漸成為智能移動(dòng)終端中普遍安裝的應(yīng)用程序。目前,大多數(shù)的智能移動(dòng)終端均配置有觸摸屏,用戶可以通過(guò)手指觸摸屏幕來(lái)操作和控制應(yīng)用程序。這種智能移動(dòng)終端上的視頻播放器在播放視頻時(shí),通常都會(huì)在屏幕上顯示進(jìn)度條、視頻的總時(shí)間長(zhǎng)度以及當(dāng)前已播放的時(shí)間。而進(jìn)度條上又通常設(shè)置有滑塊,該滑塊會(huì)在視頻播放的過(guò)程中前進(jìn),并且該滑塊在進(jìn)度條中的位置與視頻播放的進(jìn)度相對(duì)應(yīng)。當(dāng)然,用戶也可以使用手指來(lái)回拖動(dòng)滑塊,此時(shí)屏幕上顯示的視頻內(nèi)容和當(dāng)前已播放時(shí)間將會(huì)進(jìn)行相應(yīng)地更新,用戶在拖動(dòng)滑塊的過(guò)程中通過(guò)查看視頻內(nèi)容或者當(dāng)前已播放時(shí)間來(lái)定位感興趣的播放位置。
[0003]但上述定位播放內(nèi)容的方式并不方便,這種定位方式只適合于用戶根據(jù)播放時(shí)間進(jìn)行定位,而在其它一些場(chǎng)景下并不太適用。例如:用戶以前看過(guò)當(dāng)前播放的視頻,對(duì)某個(gè)畫面或者某個(gè)人物說(shuō)的某句話有印象,其可以是在觀看教學(xué)視頻的時(shí)候,記得老師講過(guò)的某個(gè)知識(shí)點(diǎn),也可以是在觀看電影的時(shí)候,記得某句經(jīng)典臺(tái)詞。如果用戶想根據(jù)上述線索對(duì)視頻進(jìn)行搜索定位,則需要來(lái)回反復(fù)地拖動(dòng)進(jìn)度條上的滑塊,并查看對(duì)應(yīng)的視頻內(nèi)容或者視頻中人物的講話,直至能夠查找到用戶腦海中存有印象的視頻播放位置。
【發(fā)明內(nèi)容】
[0004]本發(fā)明提供了一種視頻文件播放進(jìn)度的調(diào)整方法及裝置,以至少解決相關(guān)技術(shù)中移動(dòng)終端用戶在已經(jīng)觀看視頻中查找特定片段的方式較為復(fù)雜且對(duì)該特定片段的播放進(jìn)度定位的準(zhǔn)確性較差的問(wèn)題。
[0005]根據(jù)本發(fā)明的一個(gè)方面,提供了一種視頻文件播放進(jìn)度的調(diào)整方法。
[0006]本發(fā)明的視頻文件播放進(jìn)度的調(diào)整方法包括:接收待搜索的文本信息;在視頻文件的字幕文件中查找與文本信息相匹配的字幕內(nèi)容,其中,字幕文件是從視頻文件中獲取的或者根據(jù)視頻文件生成的;根據(jù)查找到的字幕內(nèi)容確定與該字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間,并按照播放時(shí)間調(diào)整視頻文件的播放進(jìn)度。
[0007]根據(jù)本發(fā)明的另一方面,提供了一種視頻文件播放進(jìn)度的調(diào)整裝置。
[0008]本發(fā)明的視頻文件播放進(jìn)度的調(diào)整裝置包括:接收模塊,用于接收待搜索的文本信息;查找模塊,用于在視頻文件的字幕文件中查找與文本信息相匹配的字幕內(nèi)容,其中,字幕文件是從視頻文件中獲取的或者根據(jù)視頻文件生成的;調(diào)整模塊,用于根據(jù)查找到的字幕內(nèi)容確定與該字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間,并按照播放時(shí)間調(diào)整視頻文件的播放進(jìn)度。
[0009]上述技術(shù)方案具有如下有益效果:采用接收待搜索的文本信息;在視頻文件的字幕文件中查找與文本信息相匹配的字幕內(nèi)容,該字幕文件是從視頻文件中獲取的或者根據(jù)視頻文件生成的;根據(jù)查找到的字幕內(nèi)容確定與該字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間,并按照播放時(shí)間調(diào)整視頻文件的播放進(jìn)度,由此,移動(dòng)終端可以通過(guò)確定用戶待搜索的文本信息,然后將該文本信息與視頻文件中的字幕文件進(jìn)行匹配,如果能夠查找到匹配的字幕內(nèi)容,則獲取與匹配字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間,從而根據(jù)播放時(shí)間準(zhǔn)確調(diào)整視頻文件的播放進(jìn)度,解決了相關(guān)技術(shù)中移動(dòng)終端用戶在已經(jīng)觀看視頻中查找特定片段的方式較為復(fù)雜且對(duì)該特定片段的播放進(jìn)度定位的準(zhǔn)確性較差的問(wèn)題,進(jìn)而實(shí)現(xiàn)了對(duì)用戶期望回放片段進(jìn)行準(zhǔn)確定位,操作簡(jiǎn)單方便。
【專利附圖】
【附圖說(shuō)明】
[0010]此處所說(shuō)明的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:
[0011]圖1是根據(jù)本發(fā)明實(shí)施例的視頻文件播放進(jìn)度的調(diào)整方法的流程圖;
[0012]圖2是根據(jù)本發(fā)明優(yōu)選實(shí)施例的視頻文件播放進(jìn)度的調(diào)整方法的流程圖;
[0013]圖3是根據(jù)本發(fā)明實(shí)施例的視頻文件播放進(jìn)度的調(diào)整裝置的結(jié)構(gòu)框圖;
[0014]圖4是根據(jù)本發(fā)明優(yōu)選實(shí)施例的視頻文件播放進(jìn)度的調(diào)整裝置的結(jié)構(gòu)框圖;
[0015]圖5是根據(jù)本發(fā)明優(yōu)選實(shí)施例的智能移動(dòng)終端的軟硬件架構(gòu)示意圖。
【具體實(shí)施方式】
[0016]下文中將參考附圖并結(jié)合實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明。需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。
[0017]圖1是根據(jù)本發(fā)明實(shí)施例的視頻文件播放進(jìn)度的調(diào)整方法的流程圖。如圖1所示,該方法可以包括以下處理步驟:
[0018]步驟S102:接收待搜索的文本信息;
[0019]步驟S104:在視頻文件的字幕文件中查找與文本信息相匹配的字幕內(nèi)容,其中,字幕文件是從視頻文件中獲取的或者根據(jù)視頻文件生成的;
[0020]步驟S106:根據(jù)查找到的字幕內(nèi)容確定與該字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間,并按照播放時(shí)間調(diào)整視頻文件的播放進(jìn)度。
[0021]相關(guān)技術(shù)中,移動(dòng)終端用戶在已經(jīng)觀看視頻中查找特定片段的方式較為復(fù)雜且對(duì)該特定片段的播放進(jìn)度定位的準(zhǔn)確性較差。采用如圖1所示的方法,接收待搜索的文本信息;在視頻文件的字幕文件中查找與文本信息相匹配的字幕內(nèi)容,該字幕文件是從視頻文件中獲取的或者根據(jù)視頻文件生成的;根據(jù)查找到的字幕內(nèi)容確定與該字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間,并按照播放時(shí)間調(diào)整視頻文件的播放進(jìn)度,由此,移動(dòng)終端可以通過(guò)確定用戶待搜索的文本信息,然后將該文本信息與視頻文件中的字幕文件進(jìn)行匹配,如果能夠查找到匹配的字幕內(nèi)容,則獲取與匹配字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間,從而根據(jù)播放時(shí)間準(zhǔn)確調(diào)整視頻文件的播放進(jìn)度,解決了相關(guān)技術(shù)中移動(dòng)終端用戶在已經(jīng)觀看視頻中查找特定片段的方式較為復(fù)雜且對(duì)該特定片段的播放進(jìn)度定位的準(zhǔn)確性較差的問(wèn)題,進(jìn)而實(shí)現(xiàn)了對(duì)用戶期望回放片段進(jìn)行準(zhǔn)確定位,操作簡(jiǎn)單方便。
[0022]優(yōu)選地,在步驟S104,查找與文本信息相匹配的字幕內(nèi)容之前,還可以包括以下操作:
[0023]步驟S1:判斷視頻文件中是否存在字幕文件;
[0024]步驟S2:如果否,則根據(jù)視頻文件中的音頻數(shù)據(jù)生成字幕文件。
[0025]在優(yōu)選實(shí)施例中,如果視頻文件已經(jīng)加載了預(yù)設(shè)格式(例如:srt格式)的字幕文件,則可以直接從本地的視頻文件中獲取與該視頻文件對(duì)應(yīng)的字幕文件,當(dāng)然還可以從網(wǎng)絡(luò)中專門提供字幕的網(wǎng)站下載相應(yīng)的字幕文件;如果視頻文件中缺少對(duì)應(yīng)的字幕文件,則可以通過(guò)采集視頻文件中的音頻數(shù)據(jù)生成相應(yīng)的字幕文件。
[0026]字幕文件可以是一個(gè)文本文件,其中,描述了視頻文件中的各段字幕信息,而每一段字幕信息可以包括:字幕序號(hào)、起始時(shí)間以及字幕內(nèi)容。字幕文件可以有多種格式,例如:其中一種字幕文件格式為srt格式,此類字幕文件的文件名通常以.srt為后綴。每段字幕的格式如下:
[0027]字幕序列號(hào)
[0028]起始時(shí)間一終止時(shí)間
[0029]字幕文本(一行或多行)
[0030]空白行
[0031]字幕序號(hào)一般從I開始編號(hào),其所采用的時(shí)間格式是“小時(shí):分鐘:秒,毫秒”。下面是一個(gè)格式為srt的字幕文件的示例:
[0032]I
[0033]00:00:10,500 — 00:00:13,000
[0034]Elephant,s Dream
[0035]2
[0036]00:00:15,000 — 00:00:18,000
[0037]At the left we can see…
[0038]上述字幕文件中包含有兩段字幕,第一段字幕的起始時(shí)間是從10.5秒至13秒,其字幕內(nèi)容為Elephant’ s Dream,第二段字幕的起始時(shí)間是從15秒至18秒,其字幕內(nèi)容為At the left we can see...。
[0039]優(yōu)選地,在步驟S2中,根據(jù)音頻數(shù)據(jù)生成字幕文件可以包括以下操作:
[0040]步驟S21:對(duì)視頻文件中的音頻數(shù)據(jù)進(jìn)行解碼處理;
[0041]步驟S22:將解碼后的音頻數(shù)據(jù)轉(zhuǎn)換成字幕文件。
[0042]在優(yōu)選實(shí)施例中,可以采用移動(dòng)終端的音視頻解碼器對(duì)視頻文件中的音頻數(shù)據(jù)進(jìn)行解碼,然后將其轉(zhuǎn)換成特定語(yǔ)言(例如:中文或者英文)的文本。
[0043]優(yōu)選地,在步驟S104,查找與文本信息相匹配的字幕內(nèi)容之前,還可以包括以下步驟:
[0044]步驟S3:判斷字幕文件所使用的語(yǔ)言與文本信息所使用的語(yǔ)言是否一致;
[0045]步驟S4:如果否,則將字幕文件所使用的語(yǔ)言譯成與文本信息所使用的語(yǔ)言一致,或者,按照文本信息所使用的語(yǔ)言重新生成字幕文件。
[0046]在優(yōu)選實(shí)施例中,在移動(dòng)終端已經(jīng)確定用戶待搜索的文件信息并且已經(jīng)獲取到或者已經(jīng)生成與視頻文件對(duì)應(yīng)的字幕文件的情況下,如果希望將兩者進(jìn)行匹配,就需要確保兩者所使用的語(yǔ)音保持一致。因此,如果字幕文件中的所使用語(yǔ)言與用戶進(jìn)行語(yǔ)音搜索時(shí)所使用的語(yǔ)言相同,此時(shí),視頻播放器可以允許用戶指定字幕文件。但是,如果視頻文件中沒(méi)有加載字幕文件或者其加載的字幕文件所使用的語(yǔ)言與用戶所使用的語(yǔ)言不同。此時(shí),需要將字幕文件所使用的語(yǔ)言譯成與文本信息所使用的語(yǔ)言一致或者按照文本信息所使用的語(yǔ)言重新生成字幕文件。
[0047]優(yōu)選地,在步驟S106中,根據(jù)查找到的字幕內(nèi)容確定與該字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間,并按照播放時(shí)間調(diào)整播放進(jìn)度可以包括以下處理步驟:
[0048]步驟S5:根據(jù)查找到的字幕內(nèi)容確定該字幕內(nèi)容的字幕序號(hào);
[0049]步驟S6:根據(jù)字幕序號(hào)獲取與查找到的字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間段,并在播放時(shí)間段中確定與查找到的字幕內(nèi)容對(duì)應(yīng)的起始的播放時(shí)間;
[0050]步驟S7:按照播放時(shí)間調(diào)整播放進(jìn)度。
[0051]在優(yōu)選實(shí)施例中,盡管字幕文件可以有多種格式,但是在各種格式的字幕文件中均包含有多段字幕信息,而每一段字幕信息又可以包括:字幕序號(hào)、播放時(shí)間段以及字幕內(nèi)容。當(dāng)在字幕文件中查找到與用戶待搜索的文本信息匹配的字幕內(nèi)容后,便可以進(jìn)一步確定該段字幕內(nèi)容的字幕序號(hào),并且可以根據(jù)字幕序號(hào)進(jìn)一步確定該段字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間段(包括:起始時(shí)間與終止時(shí)間),由此可以確定該段字幕內(nèi)容的起始的播放時(shí)間,進(jìn)而按照播放時(shí)間調(diào)整播放進(jìn)度。以上述格式為srt的字幕文件示例為例,假設(shè)待搜索的文本信息為“At the left we can see…”,而在字幕文件中確實(shí)查找到與該文本信息相匹配的字幕信息,具體如下:
[0052]2
[0053]00:00:15,000 — 00:00:18,000
[0054]At the left we can see…
[0055]由此可以確定該段字幕內(nèi)容的字幕序號(hào)為2,而與字幕序號(hào)為2對(duì)應(yīng)的播放時(shí)間段為00:00:15,000 — 00:00:18,000,即起始的播放時(shí)間為00:00:15,000,因此,可以按照播放時(shí)間調(diào)整視頻文件的播放進(jìn)度。
[0056]優(yōu)選地,在步驟S102中,確定文本信息可以包括但不限于以下方式之一:
[0057]方式一、接收輸入的文本信息;
[0058]方式二、接收語(yǔ)音數(shù)據(jù),并將語(yǔ)音數(shù)據(jù)轉(zhuǎn)換成文本信息。
[0059]在優(yōu)選實(shí)施例中,移動(dòng)終端用戶既可以通過(guò)鍵盤或者觸摸屏在視頻播放器的搜索對(duì)話框中輸入待搜索的文本信息,也可以通過(guò)麥克風(fēng)將待搜索的文本信息通過(guò)語(yǔ)音的方式輸入到移動(dòng)終端中。
[0060]下面結(jié)合圖2所示的優(yōu)選實(shí)施方式對(duì)上述優(yōu)選實(shí)施過(guò)程做進(jìn)一步的描述。
[0061]圖2是根據(jù)本發(fā)明優(yōu)選實(shí)施例的視頻文件播放進(jìn)度的調(diào)整方法的流程圖。如圖2所示,該流程可以包括以下處理步驟:
[0062]步驟S202:用戶在移動(dòng)終端上打開視頻播放器軟件,并選擇播放特定的視頻文件;
[0063]步驟S204:用戶查找是否存在與視頻文件對(duì)應(yīng)的字幕文件,并且可以在視頻播放器中指定字幕文件;如果是,則轉(zhuǎn)到步驟S208 ;如果否,則繼續(xù)執(zhí)行步驟S206 ;
[0064]步驟S206:如果沒(méi)有,可以采用移動(dòng)終端的音視頻解碼器對(duì)視頻文件中的音頻數(shù)據(jù)進(jìn)行解碼,然后將其轉(zhuǎn)換成特定語(yǔ)言(例如:中文或者英文)的文本格式并同時(shí)記錄時(shí)間信息,即新生成一個(gè)字幕文件;
[0065]步驟S208:用戶選擇使用語(yǔ)音搜索功能來(lái)搜索視頻內(nèi)容;
[0066]步驟S210:視頻播放器軟件將用戶通過(guò)麥克風(fēng)輸入的語(yǔ)音數(shù)據(jù)轉(zhuǎn)換成特定格式的文本;
[0067]步驟S212:視頻播放器軟件使用轉(zhuǎn)換后的用戶語(yǔ)音文本在字幕文件中進(jìn)行搜索,如果查找到相匹配的字幕內(nèi)容,則可以得到對(duì)應(yīng)字幕的播放時(shí)間;
[0068]步驟S214:視頻播放器軟件使用播放時(shí)間調(diào)整視頻文件的播放進(jìn)度。
[0069]圖3是根據(jù)本發(fā)明實(shí)施例的視頻文件播放進(jìn)度的調(diào)整裝置的結(jié)構(gòu)框圖。如圖3所示,該視頻文件播放進(jìn)度的調(diào)整裝置可以包括:接收模塊10,用于接收待搜索的文本信息;查找模塊20,用于在視頻文件的字幕文件中查找與文本信息相匹配的字幕內(nèi)容,其中,字幕文件是從視頻文件中獲取的或者根據(jù)視頻文件生成的;調(diào)整模塊30,用于根據(jù)查找到的字幕內(nèi)容確定與該字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間,并按照播放時(shí)間調(diào)整視頻文件的播放進(jìn)度。
[0070]采用如圖3所示的裝置,解決了相關(guān)技術(shù)中移動(dòng)終端用戶在已經(jīng)觀看視頻中查找特定片段的方式較為復(fù)雜且對(duì)該特定片段的播放進(jìn)度定位的準(zhǔn)確性較差的問(wèn)題,進(jìn)而實(shí)現(xiàn)了對(duì)用戶期望回放片段進(jìn)行準(zhǔn)確定位,操作簡(jiǎn)單方便。
[0071]優(yōu)選地,如圖4所示,上述裝置還可以包括:第一判斷模塊40,用于判斷視頻文件中是否存在字幕文件;第一處理模塊50,用于在第一判斷模塊輸出為否時(shí),根據(jù)視頻文件中的音頻數(shù)據(jù)生成字幕文件。
[0072]優(yōu)選地,如圖4所示,第一處理模塊50可以包括:解碼單元500,用于對(duì)視頻文件中的音頻數(shù)據(jù)進(jìn)行解碼處理;轉(zhuǎn)換單元502,用于將解碼后的音頻數(shù)據(jù)轉(zhuǎn)換成字幕文件。
[0073]優(yōu)選地,如圖4所示,上述裝置還可以包括:第二判斷模塊60,用于判斷字幕文件所使用的語(yǔ)言與文本信息所使用的語(yǔ)言是否一致;第二處理模塊70,用于在第二判斷模塊輸出為否時(shí),將字幕文件所使用的語(yǔ)言譯成與文本信息所使用的語(yǔ)言一致,或者,按照文本信息所使用的語(yǔ)言重新生成字幕文件。
[0074]優(yōu)選地,如圖4所示,調(diào)整模塊30可以包括:第一確定單元300,用于根據(jù)查找到的字幕內(nèi)容確定該字幕內(nèi)容的字幕序號(hào);第二確定單元302,用于根據(jù)字幕序號(hào)獲取與查找到的字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間段,并在播放時(shí)間段中確定與查找到的字幕內(nèi)容對(duì)應(yīng)的起始的播放時(shí)間;調(diào)整單元304,用于按照播放時(shí)間調(diào)整播放進(jìn)度。
[0075]優(yōu)選地,如圖4所示,確定模塊10可以包括:第一接收單元100,用于接收輸入的文本信息;第二接收單元102,用于接收語(yǔ)音數(shù)據(jù),并將語(yǔ)音數(shù)據(jù)轉(zhuǎn)換成文本信息。
[0076]下面結(jié)合圖5所示的優(yōu)選實(shí)施方式對(duì)上述優(yōu)選實(shí)施過(guò)程做進(jìn)一步的描述。
[0077]圖5是根據(jù)本發(fā)明優(yōu)選實(shí)施例的智能移動(dòng)終端的軟硬件架構(gòu)示意圖。該架構(gòu)可以分為三個(gè)層次,從下至上依次分別為硬件層、操作系統(tǒng)層以及應(yīng)用程序?qū)印S布涌梢园?處理器、存儲(chǔ)器、麥克風(fēng)、揚(yáng)聲器和觸控顯示屏。操作系統(tǒng)層負(fù)責(zé)管理硬件設(shè)備、提供文件系統(tǒng)和功能程序庫(kù),而功能程序庫(kù)中可以包括:語(yǔ)音識(shí)別模塊(相當(dāng)于上述第一處理模塊和確定模塊)。語(yǔ)音識(shí)別模塊的作用在于將語(yǔ)音數(shù)據(jù)轉(zhuǎn)換成對(duì)應(yīng)的文本內(nèi)容。應(yīng)用程序?qū)涌梢园?多個(gè)應(yīng)用程序,例如:視頻播放器、計(jì)算器。視頻播放器中可以包括音視頻解碼器,能夠?qū)σ曨l文件進(jìn)行解碼,然后在顯示屏上播放圖像,并通過(guò)揚(yáng)聲器播放聲音。本發(fā)明所提供的技術(shù)方案可以在視頻播放器中新增一個(gè)功能模塊,在顯示屏上顯示的視頻圖像中可以將該功能命名為語(yǔ)音搜索(相當(dāng)于上述查找模塊和調(diào)整模塊)。
[0078]當(dāng)用戶使用視頻播放器觀看視頻時(shí),可以選擇使用語(yǔ)音搜索功能。此時(shí),用戶可以對(duì)著智能移動(dòng)終端說(shuō)出腦海中記憶的期望檢索的語(yǔ)句,然后,語(yǔ)音搜索模塊即可根據(jù)用戶說(shuō)出的語(yǔ)句的字幕內(nèi)容搜索視頻文件中相應(yīng)的音頻數(shù)據(jù),進(jìn)而查找匹配項(xiàng)。如果能夠查找到匹配項(xiàng),則將視頻播放器的進(jìn)度條滑塊定位到相應(yīng)的位置。
[0079]在該優(yōu)選實(shí)施例中,語(yǔ)音搜索模塊完成上述工作需要具備以下前提條件:
[0080]條件一、智能移動(dòng)終端的軟件系統(tǒng)中包含語(yǔ)音識(shí)別模塊,該語(yǔ)音識(shí)別模塊可以由操作系統(tǒng)或者其它應(yīng)用程序提供,而且視頻播放器軟件可以對(duì)其進(jìn)行使用。例如:語(yǔ)音識(shí)別模塊可以接收預(yù)設(shè)格式(例如:脈沖編碼調(diào)制(Pulse Code Modulat1n,簡(jiǎn)稱為PCM))的音頻輸入,并將其轉(zhuǎn)換成特定語(yǔ)言(例如:中文或者英文)的文本。
[0081 ] 條件二、視頻播放器中的音視頻解碼器能夠識(shí)別視頻文件的格式(例如:MP4、AVI),并將視頻文件中的音頻數(shù)據(jù)解碼成語(yǔ)音識(shí)別模塊能夠接收的格式。
[0082]條件三、語(yǔ)音搜索模塊能夠通過(guò)操作系統(tǒng)從麥克風(fēng)采集用戶說(shuō)出的語(yǔ)音數(shù)據(jù),而且這些語(yǔ)音數(shù)據(jù)能夠被語(yǔ)音識(shí)別模塊所接收。
[0083]作為本發(fā)明的一個(gè)優(yōu)選實(shí)施例,可以采用srt格式的字幕文件為例進(jìn)一步對(duì)用戶希望搜索的文本信息在視頻文件中的定位進(jìn)行詳細(xì)的描述,當(dāng)然,在具體實(shí)施過(guò)程中還可以采用其它格式的字幕文件,此處并不構(gòu)成對(duì)本發(fā)明的限定。整個(gè)過(guò)程具體包括以下幾個(gè)步驟:
[0084]第一步、使用視頻播放器中的音頻解碼器將視頻文件中的音頻數(shù)據(jù)解碼成語(yǔ)音識(shí)別模塊能夠識(shí)別的格式(例如:PCM格式)并保存至音頻文件中。
[0085]第二步、分析上述音頻文件并生成字幕文件。循環(huán)讀取音頻文件中的語(yǔ)音數(shù)據(jù),可以每次讀取I秒的語(yǔ)音數(shù)據(jù),其次將這I秒的音頻數(shù)據(jù)輸入至語(yǔ)音識(shí)別模塊中,生成對(duì)應(yīng)的字幕文本,然后按照srt格式生成一段字幕信息保存至字幕文件中。按照上述方式,如果視頻文件的長(zhǎng)度為N秒,那么在字幕文件中就會(huì)生成N段字幕。
[0086]第三步、視頻文件的搜索定位。在用戶啟用語(yǔ)音搜索功能時(shí),用戶說(shuō)出在視頻文件中期望檢索到的語(yǔ)句,語(yǔ)音搜索模塊從麥克風(fēng)采集到用戶說(shuō)出的語(yǔ)音數(shù)據(jù),然后將其輸入到語(yǔ)音識(shí)別模塊中,以生成對(duì)應(yīng)的文本。隨后,語(yǔ)音搜索模塊在字幕文件中搜索上述生成的文本,如果搜索到與之匹配的文本,按照字幕文件的格式可以獲得與匹配文本對(duì)應(yīng)的播放時(shí)間。最后,視頻播放器根據(jù)播放時(shí)間進(jìn)行定位。
[0087]從以上的描述中,可以看出,上述實(shí)施例實(shí)現(xiàn)了如下技術(shù)效果(需要說(shuō)明的是這些效果是某些優(yōu)選實(shí)施例可以達(dá)到的效果):采用本發(fā)明實(shí)施例所提供的技術(shù)方案,為用戶提供了一種新的視頻文件播放進(jìn)度的調(diào)整方法及裝置,移動(dòng)終端可以通過(guò)確定用戶待搜索的文本信息,然后將該文本信息與視頻文件中的字幕文件進(jìn)行匹配,如果能夠查找到匹配的字幕內(nèi)容,則獲取與匹配字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間,從而根據(jù)播放時(shí)間準(zhǔn)確調(diào)整視頻文件的播放進(jìn)度,解決了相關(guān)技術(shù)中移動(dòng)終端用戶在已經(jīng)觀看視頻中查找特定片段的方式較為復(fù)雜且對(duì)該特定片段的播放進(jìn)度定位的準(zhǔn)確性較差的問(wèn)題,進(jìn)而實(shí)現(xiàn)了對(duì)用戶期望回放片段進(jìn)行準(zhǔn)確定位,操作簡(jiǎn)單方便。
[0088]顯然,本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本發(fā)明實(shí)施例的各模塊或各步驟可以用通用的計(jì)算裝置來(lái)實(shí)現(xiàn),它們可以集中在單個(gè)的計(jì)算裝置上,或者分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計(jì)算裝置可執(zhí)行的程序代碼來(lái)實(shí)現(xiàn),從而,可以將它們存儲(chǔ)在存儲(chǔ)裝置中由計(jì)算裝置來(lái)執(zhí)行,并且在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟,或者將它們分別制作成各個(gè)集成電路模塊,或者將它們中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來(lái)實(shí)現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。
[0089]以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種視頻文件播放進(jìn)度的調(diào)整方法,包括: 接收待搜索的文本信息; 在視頻文件的字幕文件中查找與所述文本信息相匹配的字幕內(nèi)容,其中,所述字幕文件是從所述視頻文件中獲取的或者根據(jù)所述視頻文件生成的; 根據(jù)查找到的字幕內(nèi)容確定與該字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間,并按照所述播放時(shí)間調(diào)整所述視頻文件的播放進(jìn)度。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在查找與所述文本信息相匹配的字幕內(nèi)容之前,還包括: 判斷所述視頻文件中是否存在所述字幕文件; 如果否,則根據(jù)所述視頻文件中的音頻數(shù)據(jù)生成所述字幕文件。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)所述音頻數(shù)據(jù)生成所述字幕文件包括: 對(duì)所述視頻文件中的音頻數(shù)據(jù)進(jìn)行解碼處理; 將解碼后的音頻數(shù)據(jù)轉(zhuǎn)換成所述字幕文件。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,在查找與所述文本信息相匹配的字幕內(nèi)容之前還包括: 判斷所述字幕文件所使用的語(yǔ)言與所述文本信息所使用的語(yǔ)言是否一致; 如果否,則將所述字幕文件所使用的語(yǔ)言譯成與所述文本信息所使用的語(yǔ)言一致,或者,按照所述文本信息所使用的語(yǔ)言重新生成所述字幕文件。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述查找到的字幕內(nèi)容確定與該字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間,并按照所述播放時(shí)間調(diào)整所述播放進(jìn)度包括: 根據(jù)所述查找到的字幕內(nèi)容確定該字幕內(nèi)容的字幕序號(hào); 根據(jù)所述字幕序號(hào)獲取與所述查找到的字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間段,并在所述播放時(shí)間段中確定與所述查找到的字幕內(nèi)容對(duì)應(yīng)的起始的播放時(shí)間; 按照所述播放時(shí)間調(diào)整所述播放進(jìn)度。
6.根據(jù)權(quán)利要求1至5中任一項(xiàng)所述的方法,其特征在于,接收所述文本信息包括以下之一: 接收輸入的所述文本信息; 接收語(yǔ)音數(shù)據(jù),并將所述語(yǔ)音數(shù)據(jù)轉(zhuǎn)換成所述文本信息。
7.一種視頻文件播放進(jìn)度的調(diào)整裝置,其特征在于,包括: 接收模塊,用于接收待搜索的文本信息; 查找模塊,用于在視頻文件的字幕文件中查找與所述文本信息相匹配的字幕內(nèi)容,其中,所述字幕文件是從所述視頻文件中獲取的或者根據(jù)所述視頻文件生成的; 調(diào)整模塊,用于根據(jù)查找到的字幕內(nèi)容確定與該字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間,并按照所述播放時(shí)間調(diào)整所述視頻文件的播放進(jìn)度。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括: 第一判斷模塊,用于判斷所述視頻文件中是否存在所述字幕文件; 第一處理模塊,用于在所述第一判斷模塊輸出為否時(shí),根據(jù)所述視頻文件中的音頻數(shù)據(jù)生成所述字幕文件。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述第一處理模塊包括: 解碼單元,用于對(duì)所述視頻文件中的音頻數(shù)據(jù)進(jìn)行解碼處理; 轉(zhuǎn)換單元,用于將解碼后的音頻數(shù)據(jù)轉(zhuǎn)換成所述字幕文件。
10.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括: 第二判斷模塊,用于判斷所述字幕文件所使用的語(yǔ)言與所述文本信息所使用的語(yǔ)言是否一致; 第二處理模塊,用于在所述第二判斷模塊輸出為否時(shí),將所述字幕文件所使用的語(yǔ)言譯成與所述文本信息所使用的語(yǔ)言一致,或者,按照所述文本信息所使用的語(yǔ)言重新生成所述字幕文件。
11.根據(jù)權(quán)利要求1所述的裝置,其特征在于,所述調(diào)整模塊包括: 第一確定單元,用于根據(jù)所述查找到的字幕內(nèi)容確定該字幕內(nèi)容的字幕序號(hào); 第二確定單元,用于根據(jù)所述字幕序號(hào)獲取與所述查找到的字幕內(nèi)容對(duì)應(yīng)的播放時(shí)間段,并在所述播放時(shí)間段中確定與所述查找到的字幕內(nèi)容對(duì)應(yīng)的起始的播放時(shí)間; 調(diào)整單元,用于按照所述播放時(shí)間調(diào)整所述播放進(jìn)度。
12.根據(jù)權(quán)利要求7至11中任一項(xiàng)所述的裝置,其特征在于,所述接收模塊包括: 第一接收單元,用于接收輸入的所述文本信息; 第二接收單元,用于接收語(yǔ)音數(shù)據(jù),并將所述語(yǔ)音數(shù)據(jù)轉(zhuǎn)換成所述文本信息。
【文檔編號(hào)】H04N21/435GK104301771SQ201310295470
【公開日】2015年1月21日 申請(qǐng)日期:2013年7月15日 優(yōu)先權(quán)日:2013年7月15日
【發(fā)明者】周鵬 申請(qǐng)人:中興通訊股份有限公司