本發(fā)明涉及多媒體技術(shù)領(lǐng)域,尤其涉及一種音頻播放方法、終端及計算機(jī)可讀存儲介質(zhì)。
背景技術(shù):
隨著科學(xué)技術(shù)的發(fā)展和人們生活水平的提高,人們對多媒體技術(shù)的要求越來越高,人們希望通過先進(jìn)的多媒體技術(shù)模擬構(gòu)建出更逼真的虛擬現(xiàn)實世界,從而得到更好的娛樂體驗。在這其中,音頻聲效極其重要,而沉浸式音頻是構(gòu)建虛擬現(xiàn)實世界的重要手段之一。通過使用沉浸式音頻,人們能非常明顯地感受到音頻源仿佛就在耳邊,四周的聲音都是有跡可循,為人們提供出身臨其境的逼真音效體驗,例如在玩游戲時,轉(zhuǎn)動游戲人物的頭部,游戲系統(tǒng)會根據(jù)游戲人物面對方向的不同調(diào)整游戲環(huán)境聲音的音調(diào)、音色和響度,從而提供更刺激的感官體驗。
現(xiàn)有的環(huán)繞音效是通過7.1聲道系統(tǒng)進(jìn)行展示的,即通過增加音響設(shè)備提高音頻音效的表現(xiàn)力。但是一套7.1聲道系統(tǒng)需要使用4個環(huán)繞音箱,其設(shè)備成本高,一般的家庭中不會安裝這樣的音頻設(shè)備;對于顯示屏和音響的擺放、用戶所在位置都有較嚴(yán)格的要求,用戶在家中觀看時不一定會坐在某個固定位置,從而無法為用戶提供良好的娛樂體驗。
技術(shù)實現(xiàn)要素:
本發(fā)明的主要目的在于提出一種音頻播放方法、終端及計算機(jī)可讀存儲介質(zhì),旨在方便用戶體驗沉浸式音頻,并降低設(shè)備成本。
為實現(xiàn)上述目的,本發(fā)明提供一種音頻播放方法,所述音頻播放方法應(yīng)用于音頻播放終端,所述音頻播放方法包括以下步驟:
在檢測到視頻畫面為動態(tài)畫面時,獲取預(yù)設(shè)時間段內(nèi)所述視頻畫面第一幀畫面和最后一幀畫面;
將獲得的兩幀畫面發(fā)送到云端服務(wù)器以對所述兩幀畫面進(jìn)行景物識別獲取對應(yīng)的景物音頻信息;
接收所述云端服務(wù)器返回的所述景物音頻信息,并根據(jù)所述景物音頻信息和視頻畫面播放對應(yīng)的景物音頻。
優(yōu)選的,所述兩幀畫面包括動態(tài)背景和靜態(tài)背景,所述將獲得的兩幀畫面發(fā)送到云端服務(wù)器以對所述兩幀畫面進(jìn)行景物識別獲取對應(yīng)的景物音頻信息的步驟包括:
將獲得的兩幀畫面發(fā)送到云端服務(wù)器以對所述兩幀畫面的動態(tài)背景和靜態(tài)背景進(jìn)行景物識別獲取對應(yīng)的景物音頻信息。
優(yōu)選的,所述接收所述云端服務(wù)器返回的所述景物音頻信息,并根據(jù)所述景物音頻信息和視頻畫面播放對應(yīng)的景物音頻的步驟包括:
接收所述云端服務(wù)器返回的所述景物音頻信息,并根據(jù)所述景物音頻信息和視頻判斷所述景物音頻信息和視頻畫面是否匹配;
若所述景物音頻信息和視頻畫面匹配,則根據(jù)所述景物音頻信息和視頻的播放進(jìn)度播放對應(yīng)的景物音頻。
優(yōu)選的,所述接收所述云端服務(wù)器返回的所述景物音頻信息,并根據(jù)所述景物音頻信息和視頻判斷所述景物音頻信息和視頻畫面是否匹配的步驟之后,還包括:
若所述景物音頻信息和視頻畫面不匹配,則播放所述視頻畫面的原始音頻。
優(yōu)選的,所述接收所述云端服務(wù)器返回的所述景物音頻信息,并根據(jù)所述景物音頻信息和視頻畫面播放對應(yīng)的景物音頻的步驟之后,還包括:
統(tǒng)計所述景物音頻的播放次數(shù),并在所述視頻播放結(jié)束時顯示所述播放次數(shù)。
此外,為實現(xiàn)上述目的,本發(fā)明還提供一種音頻播放終端,所述音頻播放終端包括處理器、存儲器及存儲在所述存儲器上并可在所述處理器上運行的音頻播放程序,其中所述音頻播放程序被所述處理器執(zhí)行時實現(xiàn)以下步驟:
在檢測到播放視頻為動態(tài)視頻時,獲取預(yù)設(shè)時間段內(nèi)所述視頻第一幀畫面和最后一幀畫面;
將獲得的兩幀畫面發(fā)送到云端服務(wù)器以對所述兩幀畫面進(jìn)行景物識別獲取對應(yīng)的景物音頻信息;
接收所述云端服務(wù)器返回的所述景物音頻信息,并根據(jù)所述景物音頻信息和視頻畫面播放對應(yīng)的景物音頻。
優(yōu)選的,所述兩幀畫面包括動態(tài)背景和靜態(tài)背景,所述音頻播放程序被所述處理器執(zhí)行時,還實現(xiàn)以下步驟:
將獲得的兩幀畫面發(fā)送到云端服務(wù)器以對所述兩幀畫面的動態(tài)背景和靜態(tài)背景進(jìn)行景物識別獲取對應(yīng)的景物音頻信息。
優(yōu)選的,所述音頻播放程序被所述處理器執(zhí)行時,還實現(xiàn)以下步驟:
接收所述云端服務(wù)器返回的所述景物音頻信息,并根據(jù)所述景物音頻信息和視頻判斷所述景物音頻信息和視頻畫面是否匹配;
若所述景物音頻信息和視頻畫面匹配,則根據(jù)所述景物音頻信息和視頻的播放進(jìn)度播放對應(yīng)的景物音頻;
若所述景物音頻信息和視頻畫面不匹配,則播放所述視頻畫面的原始音頻。
優(yōu)選的,所述音頻播放程序被所述處理器執(zhí)行時,還實現(xiàn)以下步驟:
統(tǒng)計所述景物音頻的播放次數(shù),并在所述視頻播放結(jié)束時顯示所述播放次數(shù)。
此外,為實現(xiàn)上述目的,本發(fā)明還提供一種計算機(jī)可讀存儲介質(zhì),所述計算機(jī)可讀存儲介質(zhì)上存儲有音頻播放程序,所述音頻播放程序被處理器執(zhí)行時實現(xiàn)如上述的音頻播放方法的步驟。
本發(fā)明通過在檢測到視頻畫面為動態(tài)畫面時,獲取預(yù)設(shè)時間段內(nèi)所述視頻畫面第一幀畫面和最后一幀畫面;將獲得的兩幀畫面發(fā)送到云端服務(wù)器以對所述兩幀畫面進(jìn)行景物識別獲取對應(yīng)的景物音頻信息;接收所述云端服務(wù)器返回的所述景物音頻信息,并根據(jù)所述景物音頻信息和視頻畫面播放對應(yīng)的景物音頻。通過以上方式,本發(fā)明的音頻播放終端對視頻畫面進(jìn)行畫面截取,并根據(jù)畫面內(nèi)容獲取對應(yīng)的景物音頻信息,準(zhǔn)確地把握視頻畫面的重點表現(xiàn)內(nèi)容,并確定該內(nèi)容的音頻展現(xiàn)方式;在播放該視頻時,通過播放特定類型的音頻,構(gòu)建沉浸式的音效環(huán)境。本發(fā)明根據(jù)視頻畫面實現(xiàn)沉浸式音頻的播放,無需使用多種環(huán)繞式音響,降低了設(shè)備成本,為用戶提供良好的娛樂體驗。
附圖說明
圖1為本發(fā)明實施例方案涉及的音頻播放終端的硬件運行環(huán)境的終端結(jié)構(gòu)示意圖;
圖2為本發(fā)明音頻播放方法第一實施例的流程示意圖;
圖3為本發(fā)明音頻播放方法第二實施例的流程示意圖。
本發(fā)明目的的實現(xiàn)、功能特點及優(yōu)點將結(jié)合實施例,參照附圖做進(jìn)一步說明。
具體實施方式
應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
本發(fā)明實施例方案的主要思路是:音頻播放終端在檢測到播放視頻為動態(tài)視頻時,獲取預(yù)設(shè)時間段內(nèi)所述視頻第一幀畫面和最后一幀畫面;將獲得的兩幀畫面發(fā)送到云端服務(wù)器以對所述兩幀畫面進(jìn)行景物識別獲取對應(yīng)的景物音頻信息;接收所述云端服務(wù)器返回的所述景物音頻信息,并根據(jù)所述景物音頻信息和視頻的播放進(jìn)度播放對應(yīng)的景物音頻。
參照圖1,圖1為本發(fā)明實施例方案涉及的音頻播放終端的硬件運行環(huán)境的終端結(jié)構(gòu)示意圖。
本發(fā)明實施例中的音頻播放終端可以是智能電視、智能手機(jī)、平板電腦、、便攜計算機(jī)等具有顯示播放功能的終端設(shè)備。如圖1所示,本發(fā)明實施例的音頻播放終端可以包括處理器1001(例如cpu),通信總線1002,用戶接口1003,網(wǎng)絡(luò)接口1004,存儲器1005。其中,通信總線1002用于實現(xiàn)這些組件之間的連接通信;用戶接口1003包括視頻畫面獲取模塊(用于獲取視頻畫面)、沉浸式音頻提升模塊模塊(具備音頻播放和調(diào)節(jié)功能),可選用戶接口1003還可以包括顯示屏(display)、輸入單元比如鍵盤(keyboard);網(wǎng)絡(luò)接口1004可選的可以包括標(biāo)準(zhǔn)的有線接口、無線接口(如wi-fi接口);存儲器1005可以是高速ram存儲器,也可以是穩(wěn)定的存儲器(non-volatilememory),例如磁盤存儲器,存儲器1005可選的還可以是獨立于前述處理器1001的存儲裝置。
可選的,音頻播放終端還可以包括攝像頭、rf(radiofrequency,射頻)電路,傳感器、音頻電路、wifi模塊等等。其中,傳感器比如光傳感器、運動傳感器以及其他傳感器。具體的,光傳感器可包括環(huán)境光傳感器及接近傳感器,其中,環(huán)境光傳感器可根據(jù)環(huán)境光線的明暗來調(diào)節(jié)顯示屏的亮度,接近傳感器可在終端移動到耳邊時,關(guān)閉顯示屏和/或背光。作為運動傳感器的一種,重力加速度傳感器可檢測各個方向上(一般為三軸)加速度的大小,靜止時可檢測出重力的大小及方向,可用于識別終端姿態(tài)的應(yīng)用(比如橫豎屏切換、相關(guān)游戲、磁力計姿態(tài)校準(zhǔn))、振動識別相關(guān)功能(比如計步器、敲擊)等;當(dāng)然,音頻播放終端還可配置陀螺儀、氣壓計、濕度計、溫度計、紅外線傳感器等其他傳感器,在此不再贅述。
本領(lǐng)域技術(shù)人員可以理解,圖1中示出的音頻播放終端結(jié)構(gòu)并不構(gòu)成對本發(fā)明音頻播放終端的限定,可以包括比圖示更多或更少的部件,或者組合某些部件,或者不同的部件布置。
繼續(xù)參照圖1,圖1中作為一種計算機(jī)存儲介質(zhì)的存儲器1005可以包括操作系統(tǒng)、網(wǎng)絡(luò)通信模塊、用戶接口模塊以及音頻播放程序。
在圖1所示的終端中,網(wǎng)絡(luò)接口1004主要用于連接云端服務(wù)器,與云端服務(wù)器進(jìn)行數(shù)據(jù)通信;用戶接口1003主要用于獲取視頻信息和播放相關(guān)音頻。用戶接口1003還可以連接客戶端(用戶端)或控制器,與客戶端或控制器進(jìn)行數(shù)據(jù)通信;而處理器1001可以用于調(diào)用存儲器1005中存儲的音頻播放程序,并執(zhí)行以下操作:
在檢測到視頻畫面為動態(tài)畫面時,獲取預(yù)設(shè)時間段內(nèi)所述視頻第一幀畫面和最后一幀畫面;
將獲得的兩幀畫面發(fā)送到云端服務(wù)器以對所述兩幀畫面進(jìn)行景物識別獲取對應(yīng)的景物音頻信息;
接收所述云端服務(wù)器返回的所述景物音頻信息,并根據(jù)所述景物音頻信息和視頻畫面播放對應(yīng)的景物音頻。
進(jìn)一步的,處理器1001還可以調(diào)用存儲器1005中存儲的音頻播放程序,執(zhí)行以下操作:
將獲得的兩幀畫面發(fā)送到云端服務(wù)器以對所述兩幀畫面的動態(tài)背景和靜態(tài)背景進(jìn)行景物識別獲取對應(yīng)的景物音頻信息。
進(jìn)一步的,處理器1001還可以調(diào)用存儲器1005中存儲的音頻播放程序,執(zhí)行以下操作:
接收所述云端服務(wù)器返回的所述景物音頻信息,并根據(jù)所述景物音頻信息和視頻判斷所述景物音頻信息和視頻畫面是否匹配;
若所述景物音頻信息和視頻畫面匹配,則根據(jù)所述景物音頻信息和視頻的播放進(jìn)度播放對應(yīng)的景物音頻。
進(jìn)一步的,處理器1001還可以調(diào)用存儲器1005中存儲的音頻播放程序,執(zhí)行以下操作:
若所述景物音頻信息和視頻畫面不匹配,則播放所述視頻畫面的原始音頻。
進(jìn)一步的,處理器1001還可以調(diào)用存儲器1005中存儲的音頻播放程序,執(zhí)行以下操作:
統(tǒng)計所述景物音頻的播放次數(shù),并在所述視頻播放結(jié)束時顯示所述播放次數(shù)。
基于上述硬件結(jié)構(gòu),提出本發(fā)明音頻播放方法實施例。
參照圖2,圖2為本發(fā)明音頻播放方法第一實施例的流程示意圖。
本實施例中,所述音頻播放方法應(yīng)用于音頻播放終端,所述音頻播放方法包括以下步驟:
步驟s10,在檢測到視頻畫面為視頻畫面時,獲取預(yù)設(shè)時間段內(nèi)所述視頻第一幀畫面和最后一幀畫面;
本實施例中,考慮到現(xiàn)有的沉浸式音頻是一般通過7.1聲道系統(tǒng)進(jìn)行展示,而7.1聲道系統(tǒng)需要使用4個環(huán)繞音箱,其設(shè)備成本高,一般的家庭中不會安裝這樣的音頻設(shè)備;對于顯示屏和音響的擺放、用戶所在位置都有較嚴(yán)格的要求,用戶在家中觀看時不一定會坐在某個固定位置,從而無法為用戶提供良好的娛樂體驗,因此本實施例提出一種音頻播放方法,無需增加額外的音響設(shè)備,而是通過對視頻畫面進(jìn)行景物識別,并播放對應(yīng)的景物音效音頻,從而構(gòu)建出更逼真的虛擬現(xiàn)實世界,給用戶帶來更好的娛樂體驗。
本實施例的音頻播放方法應(yīng)用于音頻播放終端,本實施例中音頻播放終端為智能電視,除了音頻播放的功能外還具有視頻播放的功能;當(dāng)然本發(fā)明音頻播放方法也可以用于僅有音頻播放功能的音頻播放終端,該音頻播放終端與視頻播放終端配合使用;當(dāng)然本發(fā)明音頻播放方法還可應(yīng)用智能手機(jī)、平板電腦、便攜計算機(jī)等具有顯示播放功能的終端設(shè)備。智能電視在檢測到播放的視頻是動態(tài)畫面時,將會獲取預(yù)設(shè)時間段內(nèi)視頻畫面的第一幀畫面和第二幀畫面。其中的預(yù)設(shè)時間段的具體參數(shù)保存在智能電視內(nèi)存中,而預(yù)設(shè)時間段具體參數(shù)的設(shè)置,可以是用戶手動設(shè)置的固定數(shù)值,例如用戶設(shè)為2分鐘;還可以系統(tǒng)自動根據(jù)視頻長度進(jìn)行劃分,例如視頻長度為100分鐘,預(yù)設(shè)時間段為視頻長度的百分之二,即2分鐘。動態(tài)畫面可以是這樣判斷的,當(dāng)視頻中相鄰兩幀畫面的內(nèi)容存在差別,則該視頻畫面為動態(tài)畫面;若當(dāng)視頻中相鄰兩幀畫面的內(nèi)容相同,則該視頻畫面為靜態(tài)畫面,此時可直接播放視頻畫面的原始音頻,無需進(jìn)行音頻轉(zhuǎn)換和音效增強(qiáng);當(dāng)然為了節(jié)約系統(tǒng)資源,不對細(xì)小畫面變化進(jìn)行處理,還可以設(shè)置預(yù)設(shè)差別范圍,在視頻畫面的每一幀內(nèi)容存在差別,但該差別在預(yù)設(shè)差別范圍之內(nèi)時,認(rèn)為該視頻畫面為靜態(tài)畫面,例如視頻內(nèi)容為天空中的云在緩慢移動,雖然視頻中每一幀的內(nèi)容都不同,但是該差別較小,可認(rèn)為該視頻畫面為靜態(tài)畫面。
進(jìn)一步的,動態(tài)畫面中包括動態(tài)背景和靜態(tài)背景,其中動態(tài)背景和靜態(tài)背景的可以是這樣判斷的:若在預(yù)設(shè)時間段內(nèi),視頻畫面中某一背景內(nèi)容一直保持不變,或者該背景內(nèi)容發(fā)生改變但改變的范圍在預(yù)設(shè)改變范圍之內(nèi),則認(rèn)為該背景內(nèi)容為靜態(tài)背景;反之,該背景內(nèi)容為動態(tài)背景。通過區(qū)分視頻畫面中的動態(tài)背景和靜態(tài)背景,可以更有針對性為不同的背景設(shè)置對應(yīng)音頻屬性(包括響度、音色、音調(diào)),提高音頻的表現(xiàn)力。
步驟s20,將獲得的兩幀畫面發(fā)送到云端服務(wù)器以對所述兩幀畫面進(jìn)行景物識別獲取對應(yīng)的景物音頻信息;
本實施例中,智能電視在獲取預(yù)設(shè)時間段內(nèi)的第一幀畫面和第二幀畫面時,將會通過智能電視中通信模塊向云端服務(wù)器發(fā)送這兩幀畫面,通信方式可以是有線網(wǎng)絡(luò),也可以是無線網(wǎng)絡(luò),如2g、3g、4g等,在周圍可連接的無線wifi網(wǎng)絡(luò)時還可以通過該網(wǎng)絡(luò)進(jìn)行通信。智能電視在發(fā)送這兩幀畫面前,還可以先將這兩幀畫面保存在內(nèi)存中。云端服務(wù)器在接收到智能電視發(fā)送的兩幀畫面信息時,將對兩幀畫面進(jìn)行圖像景物提取和識別。具體的,云端服務(wù)器對畫面圖像進(jìn)行景物邊緣切割,將畫面圖像進(jìn)行拆解,得出單獨的具體景物,并對景物類型進(jìn)行識別,例如,畫面圖像中存在山谷和小溪,云端服務(wù)器將對畫面圖像進(jìn)行景物邊緣切割,拆解和識別出其中的山谷和小溪兩種景物類型。在識別出圖像景物類型時,系統(tǒng)將從預(yù)設(shè)音頻數(shù)據(jù)庫和/或網(wǎng)絡(luò)中獲取與該景物相對應(yīng)的景物音頻信息,例如山谷對應(yīng)的音頻為重低音100hz,小溪對應(yīng)的音頻為中音300hz。云端服務(wù)器在獲取到兩幀圖像中的景物所對應(yīng)的景物音頻信息時,將把該景物音頻信息返回至智能電視中。
進(jìn)一步的,若一幀畫面中有多個同一類型的景物,對于其音頻屬性,可以取各屬性參數(shù)的中間值,例如,在一幀畫面中有多條小溪,而其音頻范圍為100~800hz,此時小溪的音頻可取450hz;當(dāng)然還可以以其他方式進(jìn)行取值,例如取各屬性參數(shù)的眾數(shù)。
步驟s30,接收所述云端服務(wù)器返回的所述景物音頻信息,并根據(jù)所述景物音頻信息和視頻的播放進(jìn)度播放對應(yīng)的景物音頻,。
本實施例中,智能電視在接收到云端服務(wù)器返回的景物音頻信息時,將把該景物音頻信息保存在內(nèi)存中,并根據(jù)該景物音頻信息進(jìn)行視頻場景音頻設(shè)置;在設(shè)置完成時,將該音頻設(shè)置方案進(jìn)行保存,并根據(jù)該音頻設(shè)置方案和視頻畫面的播放情況,通過智能電視中的沉浸式音頻提升模塊播放對應(yīng)的景物音頻。具體的,在視頻畫面播放出現(xiàn)山谷畫面和小溪畫面時,播放山谷對應(yīng)的重低音音頻和小溪對應(yīng)的中音音頻,并根據(jù)山谷畫面的持續(xù),逐漸增加重低音和中音的增益。由于兩個特定增益音頻嵌入,用戶得到沉浸式的音效體驗。當(dāng)然在音頻播放過程中,可是是在原有音頻的基礎(chǔ)上疊加播放景物音頻;還可以是將原有音頻消除,根據(jù)云端服務(wù)器返回的景物音頻信息重新設(shè)置視頻的配套音頻并播放。
進(jìn)一步的,智能電視在接收到云端服務(wù)器返回的景物音頻信息時,將根據(jù)所述景物音頻信息和視頻判斷景物音頻信息和視頻畫面是否匹配;若述景物音頻信息和視頻畫面匹配,則根據(jù)景物音頻信息和視頻的播放進(jìn)度播放對應(yīng)的景物音頻;若景物音頻信息和視頻畫面匹配不匹配,則播放視頻畫面的原始音頻。具體的,智能電視可以根據(jù)景物音頻的出現(xiàn)次數(shù)進(jìn)行判斷,若景物音頻的出現(xiàn)次數(shù)和對應(yīng)的景物畫面的出現(xiàn)次數(shù)相等或相差在預(yù)設(shè)差值范圍內(nèi),則認(rèn)為景物音頻信息和視頻畫面匹配;反之則認(rèn)為景物音頻信息和視頻畫面不匹配。
再進(jìn)一步的,智能電視在視頻播放結(jié)束時,還可以將云端服務(wù)器返回的景物音頻信息和音頻設(shè)置方案保存在本地內(nèi)存中;在再次播放同一視頻或具有相同內(nèi)容的視頻時,直接調(diào)用內(nèi)存中的景物音頻信息和音頻設(shè)置方案進(jìn)行音頻播放,無需再次與云端服務(wù)器進(jìn)行數(shù)據(jù)交互,節(jié)約了網(wǎng)絡(luò)資源,同時提高了系統(tǒng)的任務(wù)處理速度和響應(yīng)速度。
本實施例中,通過在檢測到視頻畫面為動態(tài)畫面時,獲取預(yù)設(shè)時間段內(nèi)所述視頻畫面第一幀畫面和最后一幀畫面;將獲得的兩幀畫面發(fā)送到云端服務(wù)器以對所述兩幀畫面進(jìn)行景物識別獲取對應(yīng)的景物音頻信息;接收所述云端服務(wù)器返回的所述景物音頻信息,并根據(jù)所述景物音頻信息和視頻畫面播放對應(yīng)的景物音頻。通過以上方式,本實施例中的音頻播放終端對視頻畫面進(jìn)行畫面截取,并根據(jù)畫面內(nèi)容獲取對應(yīng)的景物音頻信息,準(zhǔn)確地把握視頻畫面的重點表現(xiàn)內(nèi)容,并確定該內(nèi)容的音頻展現(xiàn)方式;在播放該視頻時,通過播放特定類型的音頻,構(gòu)建沉浸式的音效環(huán)境。本實施例中根據(jù)視頻畫面實現(xiàn)沉浸式音頻的播放,無需使用多種環(huán)繞式音響,降低了設(shè)備成本,為用戶提供良好的娛樂體驗。
參照圖3,圖3為本發(fā)明音頻播放方法第二實施例的流程示意圖。
基于上述圖1所示實施例,所述音頻播放方法還包括:
步驟s40,統(tǒng)計所述景物音頻的播放次數(shù),并在所述視頻播放結(jié)束時顯示所述播放次數(shù)。
本實施例中,音頻播放終端仍采用智能電視進(jìn)行說明。智能電視在播放景物音頻對視頻音效進(jìn)行增強(qiáng)時,會對景物音頻的播放次數(shù)(即音效增強(qiáng)次數(shù))進(jìn)行統(tǒng)計,并將景物音頻的播放次數(shù)保存記錄在內(nèi)存中。在視頻播放結(jié)束時,將顯示景物音頻的播放次數(shù),供用戶了解本次音效增強(qiáng)情況;當(dāng)然,智能電視也可以在視頻播放的過程中在屏幕的某個區(qū)域?qū)崟r顯示景物音頻的播放次數(shù)。
進(jìn)一步的,智能電視在視頻播放結(jié)束時,還可將統(tǒng)計的景物音頻播放次數(shù)發(fā)送到云端服務(wù)器,由云端服務(wù)器進(jìn)行保存,以供相關(guān)技術(shù)人員利用該數(shù)據(jù)進(jìn)行音頻增強(qiáng)優(yōu)化。
本發(fā)明還提供一種音頻播放終端。
繼續(xù)參照圖2,本發(fā)明音頻播放終端包括處理器、存儲器及存儲在所述存儲器上并可在處理器上運行的音頻播放程序,所述音頻播放程序被所述處理器執(zhí)行時實現(xiàn)以下步驟:
步驟s10,在檢測到視頻畫面為視頻畫面時,獲取預(yù)設(shè)時間段內(nèi)所述視頻第一幀畫面和最后一幀畫面;
本實施例中,考慮到現(xiàn)有的沉浸式音頻是一般通過7.1聲道系統(tǒng)進(jìn)行展示,而7.1聲道系統(tǒng)需要使用4個環(huán)繞音箱,其設(shè)備成本高,一般的家庭中不會安裝這樣的音頻設(shè)備;對于顯示屏和音響的擺放、用戶所在位置都有較嚴(yán)格的要求,用戶在家中觀看時不一定會坐在某個固定位置,從而無法為用戶提供良好的娛樂體驗,因此本實施例提出一種音頻播放方法,無需增加額外的音響設(shè)備,而是通過對視頻畫面進(jìn)行景物識別,并播放對應(yīng)的景物音效音頻,從而構(gòu)建出更逼真的虛擬現(xiàn)實世界,給用戶帶來更好的娛樂體驗。
本實施例中音頻播放終端為智能電視,除了音頻播放的功能外還具有視頻播放的功能;當(dāng)然本發(fā)明音頻播放方法也可以用于僅有音頻播放功能的音頻播放終端,該音頻播放終端與視頻播放終端配合使用;當(dāng)然本發(fā)明音頻播放程序還可應(yīng)用智能手機(jī)、平板電腦、便攜計算機(jī)等具有顯示播放功能的終端設(shè)備。智能電視在檢測到播放的視頻是動態(tài)畫面時,將會獲取預(yù)設(shè)時間段內(nèi)視頻畫面的第一幀畫面和第二幀畫面。其中的預(yù)設(shè)時間段的具體參數(shù)保存在智能電視內(nèi)存中,而預(yù)設(shè)時間段具體參數(shù)的設(shè)置,可以是用戶手動設(shè)置的固定數(shù)值,例如用戶設(shè)為2分鐘;還可以系統(tǒng)自動根據(jù)視頻長度進(jìn)行劃分,例如視頻長度為100分鐘,預(yù)設(shè)時間段為視頻長度的百分之2,即2分鐘。動態(tài)畫面可以是這樣判斷的,當(dāng)視頻中相鄰兩幀畫面的內(nèi)容存在差別,則該視頻畫面為動態(tài)畫面;若當(dāng)視頻中相鄰兩幀畫面的內(nèi)容相同,則該視頻畫面為靜態(tài)畫面,此時可直接播放視頻畫面的原始音頻,無需進(jìn)行音頻轉(zhuǎn)換和音效增強(qiáng);當(dāng)然為了節(jié)約系統(tǒng)資源,不對細(xì)小畫面變化進(jìn)行處理,還可以設(shè)置預(yù)設(shè)差別范圍,在視頻畫面的每一幀內(nèi)容存在差別,但該差別在預(yù)設(shè)差別范圍之內(nèi)時,認(rèn)為該視頻畫面為靜態(tài)畫面,例如視頻內(nèi)容為天空中的云在緩慢移動,雖然視頻中每一幀的內(nèi)容都不同,但是該差別較小,可認(rèn)為該視頻畫面為靜態(tài)畫面。
進(jìn)一步的,動態(tài)畫面中包括動態(tài)背景和靜態(tài)背景,其中動態(tài)背景和靜態(tài)背景的可以是這樣判斷的:若在預(yù)設(shè)時間段內(nèi),視頻畫面中某一背景內(nèi)容一直保持不變,或者該背景內(nèi)容發(fā)生改變但改變的范圍在預(yù)設(shè)改變范圍之內(nèi),則認(rèn)為該背景內(nèi)容為靜態(tài)背景;反之,該背景內(nèi)容為動態(tài)背景。通過區(qū)分視頻畫面中的動態(tài)背景和靜態(tài)背景,可以更有針對性為不同的背景設(shè)置對應(yīng)音頻屬性(包括響度、音色、音調(diào)),提高音頻的表現(xiàn)力。
步驟s20,將獲得的兩幀畫面發(fā)送到云端服務(wù)器以對所述兩幀畫面進(jìn)行景物識別獲取對應(yīng)的景物音頻信息;
本實施例中,智能電視在獲取預(yù)設(shè)時間段內(nèi)的第一幀畫面和第二幀畫面時,將會通過智能電視中通信模塊向云端服務(wù)器發(fā)送這兩幀畫面,通信方式可以是有線網(wǎng)絡(luò),也可以是無線網(wǎng)絡(luò),如2g、3g、4g等,在周圍可連接的無線wifi網(wǎng)絡(luò)時還可以通過該網(wǎng)絡(luò)進(jìn)行通信。智能電視在發(fā)送這兩幀畫面前,還可以先將這兩幀畫面保存在內(nèi)存中。云端服務(wù)器在接收到智能電視發(fā)送的兩幀畫面信息時,將對兩幀畫面進(jìn)行圖像景物提取和識別。具體的,云端服務(wù)器對畫面圖像進(jìn)行景物邊緣切割,將畫面圖像進(jìn)行拆解,得出單獨的具體景物,并對景物類型進(jìn)行識別,例如,畫面圖像中存在山谷和小溪,云端服務(wù)器將對畫面圖像進(jìn)行景物邊緣切割,拆解和識別出其中的山谷和小溪兩種景物類型。在識別出圖像景物類型時,系統(tǒng)將從預(yù)設(shè)音頻數(shù)據(jù)庫和/或網(wǎng)絡(luò)中獲取與該景物相對應(yīng)的景物音頻信息,例如山谷對應(yīng)的音頻為重低音100hz,小溪對應(yīng)的音頻為中音300hz。云端服務(wù)器在獲取到兩幀圖像中的景物所對應(yīng)的景物音頻信息時,將把該景物音頻信息返回至智能電視中。
進(jìn)一步的,若一幀畫面中有多個同一類型的景物,對于其音頻屬性,可以取各屬性參數(shù)的中間值,例如,在一幀畫面中有多條小溪,而其音頻范圍為100~800hz,此時小溪的音頻可取450hz;當(dāng)然還可以以其他方式進(jìn)行取值,例如取各屬性參數(shù)的眾數(shù)。
步驟s30,接收所述云端服務(wù)器返回的所述景物音頻信息,并根據(jù)所述景物音頻信息和視頻的播放進(jìn)度播放對應(yīng)的景物音頻,。
本實施例中,智能電視在接收到云端服務(wù)器返回的景物音頻信息時,將把該景物音頻信息保存在內(nèi)存中獲取該景物音頻信息進(jìn)行視頻場景音頻設(shè)置;在設(shè)置完成時,將該音頻設(shè)置方案進(jìn)行保存,并根據(jù)該音頻設(shè)置方案和視頻畫面的播放情況,通過智能電視中的沉浸式音頻提升模塊播放對應(yīng)的景物音頻。具體的,在視頻畫面播放出現(xiàn)山谷畫面和小溪畫面時,播放山谷對應(yīng)的重低音音頻和小溪對應(yīng)的中音音頻,并根據(jù)山谷畫面的持續(xù),逐漸增加重低音和中音的增益。由于兩個特定增益音頻嵌入,用戶得到沉浸式的音效體驗。當(dāng)然在音頻播放過程中,可是是在原有音頻的基礎(chǔ)上疊加播放景物音頻;還可以是將原有音頻消除,根據(jù)云端服務(wù)器返回的景物音頻信息重新設(shè)置視頻的配套音頻并播放。
進(jìn)一步的,智能電視在接收到云端服務(wù)器返回的景物音頻信息時,將根據(jù)所述景物音頻信息和視頻判斷景物音頻信息和視頻畫面是否匹配;若述景物音頻信息和視頻畫面匹配,則根據(jù)景物音頻信息和視頻的播放進(jìn)度播放對應(yīng)的景物音頻;若景物音頻信息和視頻畫面匹配不匹配,則播放視頻畫面的原始音頻。具體的,智能電視可以根據(jù)景物音頻的出現(xiàn)次數(shù)進(jìn)行判斷,若景物音頻的出現(xiàn)次數(shù)和對應(yīng)的景物畫面的出現(xiàn)次數(shù)相等或相差在預(yù)設(shè)差值范圍內(nèi),則認(rèn)為景物音頻信息和視頻畫面匹配;反之則認(rèn)為景物音頻信息和視頻畫面不匹配。
再進(jìn)一步的,智能電視在視頻播放結(jié)束時,還可以將云端服務(wù)器返回的景物音頻信息和音頻設(shè)置方案保存在本地內(nèi)存中;在再次播放同一視頻或具有相同內(nèi)容的視頻時,直接調(diào)用內(nèi)存中的景物音頻信息和音頻設(shè)置方案進(jìn)行音頻播放,無需再次與云端服務(wù)器進(jìn)行數(shù)據(jù)交互,節(jié)約了網(wǎng)絡(luò)資源,同時提高了系統(tǒng)的任務(wù)處理速度和響應(yīng)速度。
本實施例中,通過在檢測到視頻畫面為動態(tài)畫面時,獲取預(yù)設(shè)時間段內(nèi)所述視頻畫面第一幀畫面和最后一幀畫面;將獲得的兩幀畫面發(fā)送到云端服務(wù)器以對所述兩幀畫面進(jìn)行景物識別獲取對應(yīng)的景物音頻信息;接收所述云端服務(wù)器返回的所述景物音頻信息,并根據(jù)所述景物音頻信息和視頻畫面播放對應(yīng)的景物音頻。通過以上方式,本實施例中的音頻播放終端對視頻畫面進(jìn)行畫面截取,并根據(jù)畫面內(nèi)容獲取對應(yīng)的景物音頻信息,準(zhǔn)確地把握視頻畫面的重點表現(xiàn)內(nèi)容,并確定該內(nèi)容的音頻展現(xiàn)方式;在播放該視頻時,通過播放特定類型的音頻,構(gòu)建沉浸式的音效環(huán)境。本實施例中根據(jù)視頻畫面實現(xiàn)沉浸式音頻的播放,無需使用多種環(huán)繞式音響,降低了設(shè)備成本,為用戶提供良好的娛樂體驗。
繼續(xù)參照圖3,本發(fā)明音頻播放終端中,所述音頻播放程序被所述處理器執(zhí)行時,還實現(xiàn)以下步驟:
步驟s40,統(tǒng)計所述景物音頻的播放次數(shù),并在所述視頻播放結(jié)束時顯示所述播放次數(shù)。
本實施例中,基于上述圖2所示實施例,音頻播放終端仍采用智能電視進(jìn)行說明。智能電視在播放景物音頻對視頻音效進(jìn)行增強(qiáng)時,會對景物音頻的播放次數(shù)(即音效增強(qiáng)次數(shù))進(jìn)行統(tǒng)計,并將景物音頻的播放次數(shù)保存記錄在內(nèi)存中。在視頻播放結(jié)束時,將顯示景物音頻的播放次數(shù),供用戶了解本次音效增強(qiáng)情況;當(dāng)然,智能電視也可以在視頻播放的過程中在屏幕的某個區(qū)域?qū)崟r顯示景物音頻的播放次數(shù)。
進(jìn)一步的,智能電視在視頻播放結(jié)束時,還可將統(tǒng)計的景物音頻播放次數(shù)發(fā)送到云端服務(wù)器,由云端服務(wù)器進(jìn)行保存,以供相關(guān)技術(shù)人員利用該數(shù)據(jù)進(jìn)行音頻增強(qiáng)優(yōu)化。
本發(fā)明還提供一種計算機(jī)可讀存儲介質(zhì)。
本發(fā)明計算機(jī)可讀存儲介質(zhì)上存儲有音頻播放程序,所述音頻播放程序被處理器執(zhí)行時實現(xiàn)如上述音頻播放方法的步驟。
其中,音頻播放程序被執(zhí)行時所實現(xiàn)的方法可參照本發(fā)明音頻播放方法和音頻播放終端的各個實施例,此處不再贅述。
需要說明的是,在本文中,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者系統(tǒng)不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者系統(tǒng)所固有的要素。在沒有更多限制的情況下,由語句“包括一個……”限定的要素,并不排除在包括該要素的過程、方法、物品或者系統(tǒng)中還存在另外的相同要素。
上述本發(fā)明實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。
通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到上述實施例方法可借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實施方式。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機(jī)軟件產(chǎn)品存儲在如上所述的一個存儲介質(zhì)(如rom/ram、磁碟、光盤)中,包括若干指令用以使得一臺終端設(shè)備(可以是手機(jī),計算機(jī),服務(wù)器,空調(diào)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述的方法。
以上僅為本發(fā)明的優(yōu)選實施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效流程變換,或直接或間接運用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。