專利名稱:一種音視頻播放文件的播放控制方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音視頻播放相關(guān)技術(shù)領(lǐng)域,特別是一種音視頻播放文件的播放控制方法。
背景技術(shù):
現(xiàn)在的人們已經(jīng)習(xí)慣于在電腦上播放音視頻文件,例如各種電影或電視節(jié)目等。 但通常在電影或者電視節(jié)目并不是所有都是用戶感興趣的部分。因此,多數(shù)的音視頻播放軟件,都會加入進度條,當(dāng)用戶只想看其中的某些部分時,一般的做法是拖動進度條,通過肉眼進行搜索。但這種搜索方式非常的不科學(xué),拖動的時候很難保證用戶能看到所有的視頻畫面,聽到所有的音頻,因此用戶經(jīng)常要反復(fù)前后拖動,才能找到其感興趣的部分。
發(fā)明內(nèi)容
本發(fā)明提供一種音視頻播放文件的播放控制方法,以解決現(xiàn)有技術(shù)對音視頻播放文件的搜索只能通過拖動進度條的方式進行搜索,導(dǎo)致搜索不精確的技術(shù)問題。采用的技術(shù)方案如下
一種音視頻播放文件的播放控制方法,包括
把音視頻播放文件進行音視頻分離,獲取音頻文件;
對音頻文件根據(jù)語音資源進行語音識別,得到語音數(shù)據(jù);
把語音數(shù)據(jù)轉(zhuǎn)換為一個或多個文字,把每個文字及與每個文字所對應(yīng)的文字出現(xiàn)時間進行關(guān)聯(lián),并存儲在數(shù)據(jù)庫中,所述文字出現(xiàn)時間為每個文字在音視頻播放文件中出現(xiàn)的時間;
當(dāng)接收到用戶的文字搜索要求,在數(shù)據(jù)庫中搜索與所述文字搜索要求相匹配的文字 如果搜索到與所述文字搜索要求相匹配的文字,則音視頻播放文件從與所述文字搜索要求相匹配的文字對應(yīng)的文字出現(xiàn)時間開始播放。所述的音視頻播放文件指的是具有人類說話語音,且具有連續(xù)的視頻播放的音視頻文件,例如電影、電視節(jié)目等。進一步的
如果搜索到與所述文字搜索要求相匹配的文字超過一個,則從所有的與所述文字搜索要求相匹配的文字所對應(yīng)的文字出現(xiàn)時間中根據(jù)優(yōu)先播放時間選擇規(guī)則選擇優(yōu)先播放時間,所述音視頻播放文件從優(yōu)先播放時間開始播放,所述優(yōu)先播放時間選擇規(guī)則為
確定音視頻播放文件正在播放的時間為播放時間;
在所述播放時間之后,且最接近播放時間的文字出現(xiàn)時間為優(yōu)先播放時間。進一步的
如果搜索到與所述文字搜索要求相匹配的文字超過一個,則提示用戶選擇播放時間; 當(dāng)接收到用戶的時間選擇,音視頻播放文件根據(jù)用戶所選擇的播放時間開始播放。
更進一步的,當(dāng)提示用戶選擇播放時間時,顯示音視頻播放文件在文字所對應(yīng)的文字出現(xiàn)時間進行播放時的視頻截圖。進一步的,所述語音資源包括語言模型、聲學(xué)模型和/或字典。本發(fā)明通過語音文字搜索,使得用戶可以更加精準的搜索到其所關(guān)注的內(nèi)容,能快速的看到其所關(guān)心的節(jié)目內(nèi)容,而無需反復(fù)的拖動進度條。
圖I為本發(fā)明實施例的流程圖。圖2為本發(fā)明實施例播放搜索示意圖3為本發(fā)明實施例顯示搜索結(jié)果示意圖4為本發(fā)明實施例顯示用戶選擇結(jié)果示意圖。
具體實施例方式下面結(jié)合附圖和具體實施例對本發(fā)明做進一步詳細的說明。在本實施例中,音視頻播放文件為電影文件,在實際中,音視頻播放文件可以是各種具有人類說話語音,且具有連續(xù)的視頻播放的音視頻文件,例如電影、電視節(jié)目等。在本實施例中,采用電腦進行音視頻播放文件的播放,但實際中,可以采用其他各種播放設(shè)備,例如DVD機,手提電子設(shè)備(PAD、手機等)。如圖I所示為本實施例的流程圖
步驟S101,通過電腦的播放軟件播放電影文件的同時,電腦后臺把電影文件進行音視頻分離,獲取音頻文件。音視頻分離可以采用現(xiàn)有的各種音視頻分離技術(shù)。例如,最簡單也是最常見的方法,是對電影文件進行錄音,把音頻數(shù)據(jù)存放到緩沖區(qū),則得到音頻文件。由于音視頻分離技術(shù)已經(jīng)是成熟的方式,因此這里不再詳述。步驟S102,對音頻文件根據(jù)語音資源進行語音識別,得到語音數(shù)據(jù)。所示語音資源包括語言模型、聲學(xué)模型和/或字典。例如根據(jù)語言模型、聲學(xué)模型和/或字典得出對應(yīng)的聲音聲學(xué)特征向量,然后對電影文件根據(jù)聲音聲學(xué)特征向量進行提取。由于語音識別技術(shù)已經(jīng)是成熟的方式,因此這里不再詳述。步驟S103,把語音數(shù)據(jù)轉(zhuǎn)換為一個或多個文字,把每個文字及與每個文字所對應(yīng)的文字出現(xiàn)時間進行關(guān)聯(lián),并存儲在數(shù)據(jù)庫中,所述文字出現(xiàn)時間為每個文字在電影文件中出現(xiàn)的時間;
步驟S104,接收到用戶的文字搜索要求,在數(shù)據(jù)庫中搜索與所述文字搜索要求相匹配的文字
如果搜索到與所述文字搜索要求相匹配的文字,則執(zhí)行步驟S105,否則執(zhí)行步驟 S016。該步驟中,接收用戶的文字搜索要求,可以通過在播放軟件中,增加一個搜索欄即可實現(xiàn)。用戶在搜索欄中所輸入的所有文字,都會被認為是用戶的文字搜索要求。而在數(shù)據(jù)庫中進行搜索,可以采用現(xiàn)有的各種數(shù)據(jù)庫文字搜索方式,例如從數(shù)據(jù)庫的開始一直往后進行全數(shù)據(jù)庫搜索,或者采用冒泡算法等進行搜索。由于搜索方式已經(jīng)是成熟的方式,因此這里不再詳述。步驟S105,電影文件從與所述文字搜索要求相匹配的文字對應(yīng)的文字出現(xiàn)時間開始播放。如果搜索到與所述文字搜索要求相匹配的文字超過一個,則從所有的與所述文字搜索要求相匹配的文字所對應(yīng)的文字出現(xiàn)時間中根據(jù)優(yōu)先播放時間選擇規(guī)則選擇優(yōu)先播放時間,所述電影文件從優(yōu)先播放時間開始播放,所述優(yōu)先播放時間選擇規(guī)則為
確定電影文件正在播放的時間為播放時間;
在所述播放時間之后,且最接近播放時間的文字出現(xiàn)時間為優(yōu)先播放時間。例如,當(dāng)用戶在電影的播放時間20:46時,搜索“今天”,電腦后臺從數(shù)據(jù)庫中進行搜索,并得到3個“今天”,其分別對應(yīng)的播放時間為19:32、23:03、40:27,則從23:03進行播放,因為23:03是電影文件正在播放的時間20:46之后,且最接近的時間。步驟S106,在當(dāng)前電影文件正在播放的時間繼續(xù)播放。對于步驟S105,如果搜索到與所述文字搜索要求相匹配的文字超過一個,還可以采用如下更為方便用戶的方法
顯示電影文件在文字所對應(yīng)的文字出現(xiàn)時間進行播放時的視頻截圖,并提示用戶選擇播放時間;
當(dāng)接收到用戶的時間選擇,電影文件根據(jù)用戶所選擇的播放時間開始播放。例如,如圖2所示,當(dāng)用戶播放軟件I播放電影文件,在電影文件的播放時間20:46 時,在搜索欄2搜索“今天”,電腦后臺從數(shù)據(jù)庫中進行搜索,并得到3個“今天”,其分別對應(yīng)的播放時間為19:32、23:03、40:27
則如圖3所示,播放軟件I在左側(cè)的當(dāng)前畫面區(qū)3播放當(dāng)前畫面,在右側(cè)的顯示欄4顯示三個時間19:32、23:03、40:27,以及其分別對應(yīng)的三個畫面,畫面41、畫面42、畫面43。用戶選擇40:27的“今天”,則如圖4所示,播放軟件I從40:27開始播放。
權(quán)利要求
1.一種音視頻播放文件的播放控制方法,其特征在于,包括把音視頻播放文件進行音視頻分離,獲取音頻文件;對音頻文件根據(jù)語音資源進行語音識別,得到語音數(shù)據(jù);把語音數(shù)據(jù)轉(zhuǎn)換為一個或多個文字,把每個文字及與每個文字所對應(yīng)的文字出現(xiàn)時間進行關(guān)聯(lián),并存儲在數(shù)據(jù)庫中,所述文字出現(xiàn)時間為每個文字在音視頻播放文件中出現(xiàn)的時間;當(dāng)接收到用戶的文字搜索要求,在數(shù)據(jù)庫中搜索與所述文字搜索要求相匹配的文字如果搜索到與所述文字搜索要求相匹配的文字,則音視頻播放文件從與所述文字搜索要求相匹配的文字對應(yīng)的文字出現(xiàn)時間開始播放。
2.根據(jù)權(quán)利要求I所述的音視頻播放文件的播放控制方法,其特征在于如果搜索到與所述文字搜索要求相匹配的文字超過一個,則從所有的與所述文字搜索要求相匹配的文字所對應(yīng)的文字出現(xiàn)時間中根據(jù)優(yōu)先播放時間選擇規(guī)則選擇優(yōu)先播放時間,所述音視頻播放文件從優(yōu)先播放時間開始播放,所述優(yōu)先播放時間選擇規(guī)則為確定音視頻播放文件正在播放的時間為播放時間;在所述播放時間之后,且最接近播放時間的文字出現(xiàn)時間為優(yōu)先播放時間。
3.根據(jù)權(quán)利要求I所述的音視頻播放文件的播放控制方法,其特征在于如果搜索到與所述文字搜索要求相匹配的文字超過一個,則提示用戶選擇播放時間;當(dāng)接收到用戶的時間選擇,音視頻播放文件根據(jù)用戶所選擇的播放時間開始播放。
4.根據(jù)權(quán)利要求3所述的音視頻播放文件的播放控制方法,其特征在于,當(dāng)提示用戶選擇播放時間時,顯示音視頻播放文件在文字所對應(yīng)的文字出現(xiàn)時間進行播放時的視頻截圖。
5.根據(jù)權(quán)利要求I所述的音視頻播放文件的播放控制方法,其特征在于,所述語音資源包括語言模型、聲學(xué)模型和/或字典。
全文摘要
本發(fā)明涉及音視頻播放相關(guān)技術(shù)領(lǐng)域,特別是一種音視頻播放文件的播放控制方法,包括把音視頻播放文件進行音視頻分離,獲取音頻文件;對音頻文件根據(jù)語音資源進行語音識別,得到語音數(shù)據(jù);把語音數(shù)據(jù)轉(zhuǎn)換為一個或多個文字,把每個文字及與每個文字所對應(yīng)的文字出現(xiàn)時間進行關(guān)聯(lián),并存儲在數(shù)據(jù)庫中,所述文字出現(xiàn)時間為每個文字在音視頻播放文件中出現(xiàn)的時間;當(dāng)接收到用戶的文字搜索要求,在數(shù)據(jù)庫中搜索與所述文字搜索要求相匹配的文字音視頻播放文件從與所述文字搜索要求相匹配的文字對應(yīng)的文字出現(xiàn)時間開始播放。本發(fā)明通過語音文字搜索,使得用戶可以更加精準的搜索到其所關(guān)注的內(nèi)容。
文檔編號G11B20/00GK102592628SQ20121003371
公開日2012年7月18日 申請日期2012年2月15日 優(yōu)先權(quán)日2012年2月15日
發(fā)明者張群 申請人:張群