本發(fā)明實(shí)施例涉及語音識別技術(shù),尤其涉及一種語速調(diào)節(jié)方法和裝置。
背景技術(shù):
隨著網(wǎng)絡(luò)技術(shù)的快速發(fā)展,用戶可獲得大量的教學(xué)視頻資料,例如可以是課程教學(xué)視頻、廚藝教學(xué)視頻或者運(yùn)動教學(xué)視頻(例如瑜伽課程視頻)等,用戶可根據(jù)視頻資料學(xué)習(xí)相關(guān)知識。
由于教學(xué)視頻資料中的講解者的語速對于用戶而言存在過快或者過慢的問題,用戶不能適應(yīng)講解者的講解語速。目前,針對上述問題,在啟動視頻播放器后,用戶可根據(jù)講解者語速的快慢按照一定系數(shù)調(diào)節(jié)視頻播放的速度(例如按照播放速度的1.25倍或者0.75倍的播放速度進(jìn)行播放),來適應(yīng)用戶自己的接收節(jié)奏。
但是通過調(diào)節(jié)視頻播放器的播放速度的方法,不但會調(diào)整講解者語音講解部分的語速,還會調(diào)整教學(xué)視頻中沒有語音講解部分的視頻播放速度,使沒有語音講解部分的視頻播放速度發(fā)生改變,例如過快或過慢的展示實(shí)驗(yàn)現(xiàn)象或者動作展示等,從而導(dǎo)致播放的實(shí)驗(yàn)現(xiàn)象或者動作與實(shí)際現(xiàn)場的實(shí)驗(yàn)現(xiàn)象或者動作不符,導(dǎo)致用戶學(xué)習(xí)效果不佳。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種語速調(diào)節(jié)方法和裝置,以實(shí)現(xiàn)人性化的調(diào)節(jié)視頻播放速度。
第一方面,本發(fā)明實(shí)施例提供了一種語速調(diào)節(jié)方法,該方法包括:
在視頻播放過程中,檢測當(dāng)前播放的視頻幀是否配有語音信息。
若配有語音信息,則根據(jù)預(yù)設(shè)播放速度播放當(dāng)前視頻幀。
進(jìn)一步的,該方法還包括:
若未配有語音信息,則根據(jù)標(biāo)準(zhǔn)播放速度播放當(dāng)前視頻幀。
進(jìn)一步的,在視頻播放過程中,檢測當(dāng)前播放的視頻幀是否配有語音信息包括:
在視頻播放過程中,檢測當(dāng)前播放的視頻幀是否有對應(yīng)的音軌接入;
若有對應(yīng)的音軌接入,則確定當(dāng)前播放的視頻幀配有語音信息;
若無對應(yīng)的音軌接入,則確定當(dāng)前播放的視頻幀未配有語音信息。
進(jìn)一步的,根據(jù)預(yù)設(shè)播放速度播放當(dāng)前視頻幀包括:
確定所述音軌包含的語音播放時間起點(diǎn)和止點(diǎn);
根據(jù)預(yù)設(shè)播放速度播放所述起點(diǎn)至所述止點(diǎn)間的視頻幀。
進(jìn)一步的,該方法還包括:
對所述視頻進(jìn)行編輯處理,確定所述視頻中配有語音信息的視頻幀;
將配有語音信息的視頻幀的起止點(diǎn)與所述音軌的起止點(diǎn)對應(yīng)設(shè)置。
第二方面,本發(fā)明實(shí)施例還提供了一種語速調(diào)節(jié)裝置,該裝置包括:
語音檢測模塊,用于在視頻播放過程中,檢測當(dāng)前播放的視頻幀是否配有語音信息。
播放模塊,用于若檢測到當(dāng)前播放視頻幀配有語音信息,則根據(jù)預(yù)設(shè)播放速度播放當(dāng)前視頻幀。
進(jìn)一步的,所述播放模塊還用于:
若檢測到當(dāng)前播放視頻幀未配有語音信息,則根據(jù)標(biāo)準(zhǔn)播放速度播放當(dāng)前視頻幀。
進(jìn)一步的,所述語音檢測模塊具體用于:
在視頻播放過程中,檢測當(dāng)前播放的視頻幀是否有對應(yīng)的音軌接入;
若有對應(yīng)的音軌接入,則確定當(dāng)前播放的視頻幀配有語音信息;若無對應(yīng)的音軌接入,則確定當(dāng)前播放的視頻幀未配有語音信息。
進(jìn)一步的,所述播放模塊具體用于:
確定所述音軌包含的語音播放時間起點(diǎn)和止點(diǎn);
根據(jù)預(yù)設(shè)播放速度播放所述起點(diǎn)至所述止點(diǎn)間的視頻幀。
進(jìn)一步的,該裝置還包括:
預(yù)處理模塊,用于對所述視頻進(jìn)行編輯處理,確定所述視頻中配有語音信息的視頻幀;
將配有語音信息的視頻幀的起止點(diǎn)與所述音軌的起止點(diǎn)對應(yīng)設(shè)置。
本發(fā)明實(shí)施例通過調(diào)節(jié)配有語音信息的視頻幀的播放速度,解決了現(xiàn)有技術(shù)中由于視頻中語音講解速度與用戶接收速度不匹配時,調(diào)節(jié)語速同時調(diào)節(jié)沒有語音信息的視頻幀的播放速度的問題,達(dá)到了人性化調(diào)節(jié)語速的效果。
附圖說明
圖1是本發(fā)明實(shí)施例一提供的語速調(diào)節(jié)方法的流程圖;
圖2是本發(fā)明實(shí)施例二提供的語速調(diào)節(jié)方法的流程圖;
圖3是本發(fā)明實(shí)施例三提供的語速調(diào)節(jié)方法的流程圖;
圖4是本發(fā)明實(shí)施例四提供的語速調(diào)節(jié)方法的流程圖;
圖5是本發(fā)明實(shí)施例五提供的語速調(diào)節(jié)裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對本發(fā)明作進(jìn)一步的詳細(xì)說明??梢岳斫獾氖牵颂幩枋龅木唧w實(shí)施例僅僅用于解釋本發(fā)明,而非對本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部結(jié)構(gòu)。
實(shí)施例一
圖1為本發(fā)明實(shí)施例一提供的語速調(diào)節(jié)方法的流程圖,本實(shí)施例可適用于在教學(xué)視頻播放過程中,人性化調(diào)節(jié)語速的情況,該方法可以由本發(fā)明實(shí)施例提供的語速調(diào)節(jié)裝置來執(zhí)行,該裝置可以采用軟件和/或硬件的方式來實(shí)現(xiàn),該裝置可集成于具有視頻播放的終端內(nèi),該方法具體包括:
S110、在視頻播放過程中,檢測當(dāng)前播放的視頻幀是否配有語音信息。
其中,視頻是由連續(xù)的靜態(tài)圖像組成的,當(dāng)連續(xù)的圖像變化每秒超過24幀時,根據(jù)視覺暫留原理,人眼無法辨別單幅的靜態(tài)圖像,形成平滑連續(xù)的視頻效果,其中靜態(tài)圖像的單位為幀。語音信息指的是當(dāng)前播放的視頻中包含的聲音信息,示例性的,若當(dāng)前播放視頻為一位物理實(shí)驗(yàn)指導(dǎo)課,語音信息指的是老師對實(shí)驗(yàn)進(jìn)行講解的聲音信息。
本實(shí)施例中,在視頻播放時,檢測當(dāng)前播放的視頻的每一個播放單元,一個播放單元中包含至少一個視頻幀,確定視頻幀中是否配有當(dāng)前視頻講解者的語音信息。
S120、若配有語音信息,則根據(jù)預(yù)設(shè)播放速度播放當(dāng)前視頻幀。
在本實(shí)施例中,在教學(xué)視頻播放時,由于視頻講解者語速的快慢不同或者用戶理解速度的不同,可能導(dǎo)致用戶跟不上講解者的節(jié)奏,或者用戶認(rèn)為講解者速度過慢而浪費(fèi)時間的情況出現(xiàn),用戶可自定義設(shè)置播放速度播放當(dāng)前視頻幀。
其中,預(yù)設(shè)播放速度指的是用戶自定義設(shè)置的視頻幀播放速度。當(dāng)用戶判斷視頻中講解者的語速節(jié)奏與本人的接收節(jié)奏不匹配時,可自定義設(shè)置視頻中視頻幀的播放速度,讓視頻播放節(jié)奏適合用戶的接收節(jié)奏。其中,變化視頻幀的播放速度指的是只改變視頻幀播放的快慢,不改變視頻幀中語音信息的音調(diào)或音色等,保證視頻幀中的語音信息和畫面不失真。
示例性的,當(dāng)前播放視頻為物理實(shí)驗(yàn)指導(dǎo)課,若用戶在觀看一段視頻后判斷該老師講解的速度過慢,用戶可根據(jù)自身情況,設(shè)置視頻的語音速度以標(biāo)準(zhǔn)語音速度的1.25倍的速度進(jìn)行播放。其中,變化播放速度的視頻為配有老師講解語音信息的視頻幀。
本實(shí)施例的技術(shù)方案,通過調(diào)節(jié)配有語音信息的視頻幀的播放速度,解決了現(xiàn)有技術(shù)中由于視頻中語音講解速度與用戶接收速度不匹配時,調(diào)節(jié)語速同時調(diào)節(jié)沒有語音信息的視頻幀的播放速度的問題,達(dá)到了人性化調(diào)節(jié)語速的效果。
實(shí)施例二
圖2是本發(fā)明實(shí)施例二提供的語速調(diào)節(jié)方法的流程圖,在上述實(shí)施例一的基礎(chǔ)上,進(jìn)一步的將若配有語音信息,則根據(jù)預(yù)設(shè)播放速度播放當(dāng)前視頻幀優(yōu)化為:若配有語音信息,則根據(jù)預(yù)設(shè)播放速度播放當(dāng)前視頻幀;若未配有語音信息,則根據(jù)標(biāo)準(zhǔn)播放速度播放當(dāng)前視頻幀。相應(yīng)的,該方法具體包括:
S210、在視頻播放過程中,檢測當(dāng)前播放的視頻幀是否配有語音信息。
若配有語音信息,則執(zhí)行步驟S220;若未配有語音信息,則執(zhí)行步驟S230。
S220、根據(jù)預(yù)設(shè)播放速度播放當(dāng)前視頻幀。
S230、根據(jù)標(biāo)準(zhǔn)播放速度播放當(dāng)前視頻幀。
其中,標(biāo)準(zhǔn)播放速度指的是視頻幀未經(jīng)過用戶設(shè)置的原始播放速度,
本實(shí)施例中,在教學(xué)視頻中,不僅包括語音講解部分,還包括展示部分,示例性的,展示部分可以是物理實(shí)驗(yàn)講解視頻中的實(shí)驗(yàn)現(xiàn)象觀察部分、廚藝講解視頻中的刀工教學(xué)部分或者在瑜伽教學(xué)視頻中的瑜伽動作指導(dǎo)部分等。若視頻中的展示部分的視頻幀的播放速度進(jìn)行調(diào)節(jié),會導(dǎo)致播放的實(shí)驗(yàn)現(xiàn)象或者動作與實(shí)際現(xiàn)場的實(shí)驗(yàn)現(xiàn)象或者動作不符,用戶學(xué)習(xí)效果不佳的情況出現(xiàn)。
示例性的,當(dāng)前播放視頻為物理實(shí)驗(yàn)指導(dǎo)課,用戶結(jié)合自身情況和視頻中的講解速度設(shè)置了視頻以標(biāo)準(zhǔn)播放速度的1.25倍的速度進(jìn)行播放,則在視頻播放時,包含語音講解的視頻幀以標(biāo)準(zhǔn)播放速度的1.25倍的速度進(jìn)行播放,不包含語音講解的視頻幀自動切換為標(biāo)準(zhǔn)播放速度進(jìn)行播放。
本實(shí)施例的技術(shù)方案,通過只變化有語音信息的視頻幀的播放速度,不變化沒有語音信息的視頻幀的播放速度,解決了現(xiàn)有技術(shù)中,調(diào)節(jié)語速同時調(diào)節(jié)沒有語音信息的視頻幀的播放速度的問題,實(shí)現(xiàn)了人性化的調(diào)節(jié)語速的效果。
實(shí)施例三
圖3是本發(fā)明實(shí)施例三提供的語速調(diào)節(jié)方法的流程圖,本實(shí)施例在上述實(shí)施例的基礎(chǔ)上,進(jìn)一步的將在視頻播放過程中,檢測當(dāng)前播放的視頻幀是否配有語音信息優(yōu)化為:在視頻播放過程中,檢測當(dāng)前播放的視頻幀是否有對應(yīng)的音軌接入;若有對應(yīng)的音軌接入,則確定當(dāng)前播放的視頻幀配有語音信息;若無對應(yīng)的音軌接入,則確定當(dāng)前播放的視頻幀未配有語音信息。相應(yīng)的,該方法具體包括:
S310、在視頻播放過程中,檢測當(dāng)前播放的視頻幀是否有對應(yīng)的音軌接入。
其中,音軌指的是顯示在音序器軟件中的一條條的平行軌跡,每一條音軌代表一種語音信息,其中包含每一種語音信息的音色、音量或者通道數(shù)等信息。不同聲源發(fā)出的聲音對應(yīng)不同的音軌,當(dāng)前播放的視頻幀中包含多個音軌。本實(shí)施例中,對應(yīng)的音軌指的是當(dāng)前播放的視頻幀中講解者進(jìn)行語音講解的音軌。
若有對應(yīng)的音軌接入,則執(zhí)行步驟S320;若無對應(yīng)的音軌接入,則執(zhí)行步驟S330。
S320、確定當(dāng)前播放的視頻幀配有語音信息,則根據(jù)預(yù)設(shè)播放速度播放當(dāng)前視頻幀。
S330、確定當(dāng)前播放的視頻幀未配有語音信息,則根據(jù)標(biāo)準(zhǔn)播放速度播放當(dāng)前視頻幀。
示例性的,當(dāng)前播放視頻為物理實(shí)驗(yàn)指導(dǎo)課,在整個視頻中的音軌可以是包括老師語音講解的音軌、實(shí)驗(yàn)操作過程中各種器件碰撞發(fā)出聲音的音軌或者物理實(shí)驗(yàn)產(chǎn)生的現(xiàn)象中的聲音的音軌等。在視頻播放的過程中,當(dāng)終端檢測到有老師語音講解的音軌接入時,則確定當(dāng)前播放的視頻幀配有語音信息,當(dāng)前視頻幀根據(jù)用戶預(yù)設(shè)的播放速度進(jìn)行播放;相應(yīng)的,當(dāng)終端檢測到?jīng)]有老師語音講解的音軌接入時,確定當(dāng)前播放的視頻幀未配有語音信息,當(dāng)前視頻幀根據(jù)標(biāo)準(zhǔn)播放速度進(jìn)行播放。
本實(shí)施例的技術(shù)方案,通過檢測當(dāng)前播放的視頻幀中是否有對應(yīng)音軌接入,確定當(dāng)前視頻幀中是否配有語音信息,根據(jù)語音信息的判斷結(jié)果確定當(dāng)前視頻幀的播放速度,準(zhǔn)確的判斷當(dāng)前視頻幀中是否配有語音信息,解決了現(xiàn)有技術(shù)中,調(diào)節(jié)語速同時調(diào)節(jié)沒有語音信息的視頻幀的播放速度的問題,實(shí)現(xiàn)了人性化的調(diào)節(jié)語速的效果。
實(shí)施例四
圖4是本發(fā)明實(shí)施例四提供的語速調(diào)節(jié)方法的流程圖,在上述實(shí)施例的基礎(chǔ)上,進(jìn)一步的將根據(jù)預(yù)設(shè)播放速度播放當(dāng)前視頻幀優(yōu)化為:確定音軌包含的語音播放時間起點(diǎn)和止點(diǎn);根據(jù)預(yù)設(shè)播放速度播放起點(diǎn)至止點(diǎn)間的視頻幀。相應(yīng)的,該方法具體包括:
S410、在視頻播放過程中,檢測當(dāng)前播放的視頻幀是否有對應(yīng)的音軌接入。
S420、若有對應(yīng)的音軌接入,則確定音軌包含的語音播放時間起點(diǎn)和止點(diǎn)。其中,在當(dāng)期播放的視頻中,講解者的語音講解的音軌在整個視頻的播放過程中并不是一直存在的,具有一定的間隔性。為了準(zhǔn)確的檢測當(dāng)前視頻幀中是否有音軌的接入,可以通過檢測當(dāng)前音軌的時間起點(diǎn)和止點(diǎn)。其中,音軌的起點(diǎn)指的是當(dāng)前音軌的起始時間點(diǎn),音軌的止點(diǎn)指的是當(dāng)前音軌的終止時間點(diǎn)。示例性的,當(dāng)前播放的視頻為物理實(shí)驗(yàn)指導(dǎo)課,老師從視頻播放開始播放時進(jìn)行講解,講解時長為10分鐘,則老師語音講解對應(yīng)的音軌的時間起點(diǎn)為視頻播放的0:00時刻,音軌的時間止點(diǎn)為視頻播放的0:10時刻。
S430、根據(jù)預(yù)設(shè)播放速度播放起點(diǎn)至止點(diǎn)間的視頻幀。
本實(shí)施例中,當(dāng)終端檢測到當(dāng)前播放的視頻幀中包含對應(yīng)音軌的時間起點(diǎn),調(diào)節(jié)視頻幀的播放速度以用戶設(shè)置的預(yù)設(shè)播放速度進(jìn)行播放,并持續(xù)以該預(yù)設(shè)播放速度進(jìn)行播放;直到當(dāng)終端檢測到當(dāng)前播放的視頻幀中包含對應(yīng)音軌的時間止點(diǎn),調(diào)節(jié)視頻幀的播放速度恢復(fù)為標(biāo)準(zhǔn)播放速度進(jìn)行播放,并持續(xù)以該標(biāo)準(zhǔn)播放速度進(jìn)行播放,直到再次檢測到視頻幀中包含對應(yīng)音軌的時間起點(diǎn),循環(huán)調(diào)節(jié)視頻幀的播放速度。
本實(shí)施例的技術(shù)方案,根據(jù)確定當(dāng)前視頻中對應(yīng)音軌的時間起點(diǎn)和止點(diǎn),并調(diào)節(jié)起點(diǎn)與止點(diǎn)之間的視頻幀的播放速度,準(zhǔn)確判斷需要調(diào)節(jié)語速的視頻幀部分,解決了現(xiàn)有技術(shù)中由于視頻中語音講解速度與用戶接收速度不匹配時,調(diào)節(jié)語速同時調(diào)節(jié)沒有語音信息的視頻幀的播放速度的問題,達(dá)到了人性化調(diào)節(jié)語速的效果。
可選的,語速調(diào)節(jié)方法還包括:
對所述視頻進(jìn)行編輯處理,確定所述視頻中配有語音信息的視頻幀;
將配有語音信息的視頻幀的起止點(diǎn)與所述音軌的起止點(diǎn)對應(yīng)設(shè)置。
其中,對視頻進(jìn)行編輯處理指的是對于用視頻輸入設(shè)備拍攝的影響,應(yīng)用視頻編輯軟件等進(jìn)行編輯加工的過程,其中視頻編輯軟件能夠?qū)σ曨l源進(jìn)行非線性編輯,進(jìn)行視頻源的切割或者合并等,生成具有不同表現(xiàn)力、不同功能的新視頻。本實(shí)施例中,對視頻的編輯處理的目的是為了確定視頻中配有語音信息的視頻幀。示例性的,將配有語音信息的視頻幀從原視頻中分割出來,確定該部分視頻幀對應(yīng)的音軌的時間起止點(diǎn),并在該音軌時間起點(diǎn)和止點(diǎn)處分別設(shè)置起點(diǎn)標(biāo)識和止點(diǎn)標(biāo)識,其中起點(diǎn)標(biāo)識和止點(diǎn)標(biāo)識可以是不同的標(biāo)識。
實(shí)施例五
圖5為本發(fā)明實(shí)施例五提供的語速調(diào)節(jié)裝置的結(jié)構(gòu)示意圖,該裝置適用于執(zhí)行本發(fā)明實(shí)施例提供的語速調(diào)節(jié)方法,該裝置具體包括:
語音檢測模塊510,用于在視頻播放過程中,檢測當(dāng)前播放的視頻幀是否配有語音信息。
播放模塊520,用于若檢測到當(dāng)前播放視頻幀配有語音信息,則根據(jù)預(yù)設(shè)播放速度播放當(dāng)前視頻幀。
可選的,播放模塊520還用于:
若檢測到當(dāng)前播放視頻幀未配有語音信息,則根據(jù)標(biāo)準(zhǔn)播放速度播放當(dāng)前視頻幀。
可選的,語音檢測模塊510具體用于:
在視頻播放過程中,檢測當(dāng)前播放的視頻幀是否有對應(yīng)的音軌接入;
若有對應(yīng)的音軌接入,則確定當(dāng)前播放的視頻幀配有語音信息;若無對應(yīng)的音軌接入,則確定當(dāng)前播放的視頻幀未配有語音信息。
可選的,播放模塊520具體用于:
確定音軌包含的語音播放時間起點(diǎn)和止點(diǎn);
根據(jù)預(yù)設(shè)播放速度播放起點(diǎn)至止點(diǎn)間的視頻幀。
可選的,該裝置還包括:
預(yù)處理模塊530,用于對視頻進(jìn)行編輯處理,確定視頻中配有語音信息的視頻幀;
將配有語音信息的視頻幀的起止點(diǎn)與音軌的起止點(diǎn)對應(yīng)設(shè)置。
本發(fā)明實(shí)施例提供的語速調(diào)節(jié)裝置可執(zhí)行本發(fā)明任意實(shí)施例所提供的語速調(diào)節(jié)方法,具備執(zhí)行方法相應(yīng)的功能模塊和有益效果。
注意,上述僅為本發(fā)明的較佳實(shí)施例及所運(yùn)用技術(shù)原理。本領(lǐng)域技術(shù)人員會理解,本發(fā)明不限于這里所述的特定實(shí)施例,對本領(lǐng)域技術(shù)人員來說能夠進(jìn)行各種明顯的變化、重新調(diào)整和替代而不會脫離本發(fā)明的保護(hù)范圍。因此,雖然通過以上實(shí)施例對本發(fā)明進(jìn)行了較為詳細(xì)的說明,但是本發(fā)明不僅僅限于以上實(shí)施例,在不脫離本發(fā)明構(gòu)思的情況下,還可以包括更多其他等效實(shí)施例,而本發(fā)明的范圍由所附的權(quán)利要求范圍決定。