專利名稱:應(yīng)用于多媒體內(nèi)容的播放方法與播放裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明是關(guān)于多媒體數(shù)據(jù)的播放,尤指依據(jù)使用者狀態(tài)的偵測結(jié)果來調(diào)整多媒體內(nèi)容的播放以及其相關(guān)裝置。
背景技術(shù):
傳統(tǒng)的平面(two-dimensional, 2D)顯示技術(shù)是呈現(xiàn)單一畫面(frame)給使用者的雙眼,然而,近來由于科技的發(fā)展,使用者所追求的已是具有立體感與更逼真的影像顯示,而不再是高質(zhì)量影像,因此,立體(three-dimensional, 3D)顯示技術(shù)便被提出來,以呈現(xiàn)不同的畫面給使用者左眼與右眼,如此ー來,使用者的大腦會將兩眼所看到不同的畫面認作立體畫面。然而,用戶必須手動控制平面/立體視頻播放設(shè)定以滿足個人偏好的觀賞 需求;同樣地,關(guān)于音頻的播放,用戶也必須手動控制音頻播放設(shè)定以滿足個人偏好的聆聽需求。因此,用戶也許會渴望有更佳的視頻觀賞與/或音頻聆聽的體驗,所以,需要ー種創(chuàng)新的播放器制,其可正確地與自動地調(diào)整包含視頻及/或音頻的多媒體內(nèi)容的播放。
發(fā)明內(nèi)容
依據(jù)本發(fā)明的實施方式,其提出一種依據(jù)使用者狀態(tài)的偵測結(jié)果來調(diào)整多媒體內(nèi)容的播放方法以及播放裝置,以解決上述問題。依據(jù)本發(fā)明的第一實施方式,其掲示ー種多媒體內(nèi)容的播放方法,包含接收多媒體內(nèi)容、對多媒體內(nèi)容進行播放、偵測使用者狀態(tài)并據(jù)以產(chǎn)生偵測結(jié)果,以及當(dāng)偵測結(jié)果指示使用者狀態(tài)有變化時,調(diào)整多媒體內(nèi)容的播放。依據(jù)本發(fā)明的第二實施方式,其掲示ー種多媒體內(nèi)容的播放裝置,包含接收功能模塊、播放功能模塊以及偵測功能模塊。所述接收功能模塊用以接收所述多媒體內(nèi)容。所述播放功能模塊耦接于接收功能模塊,用以對多媒體內(nèi)容進行播放。偵測功能模塊耦接于播放功能模塊,用以偵測使用者狀態(tài)并據(jù)以產(chǎn)生偵測結(jié)果。當(dāng)偵測結(jié)果指示使用者狀態(tài)有變化時,播放功能模塊會調(diào)整多媒體內(nèi)容的播放。本發(fā)明的多媒體內(nèi)容的播放方法及播放裝置能偵測用戶的狀態(tài)以正確地與自動地調(diào)整包含視頻及/或音頻的多媒體內(nèi)容的播放,用戶可以具有更佳的多媒體內(nèi)容播放的觀賞/聆聽體驗。
圖I為本發(fā)明的實施方式中廣義的多媒體播放裝置的模塊示意圖。圖2為本發(fā)明多媒體播放裝置的第一實施方式的模塊示意圖。圖3為足球場上不同視角所對應(yīng)的視頻比特流的示意圖。圖4為運用圖2的裝置來進行自動調(diào)整多媒體播放的示意圖。圖5為本發(fā)明多媒體播放裝置的第二實施方式的模塊示意圖。圖6為運用圖5的裝置來進行自動調(diào)整多媒體播放的示意圖。
圖7為本發(fā)明多媒體播放裝置的第三實施方式的模塊示意圖。 圖8為運用圖7的裝置來進行自動調(diào)整多媒體播放的示意圖。圖9為本發(fā)明多媒體播放裝置的第四實施方式的模塊示意圖。圖10為運用圖9的裝置來進行自動調(diào)整多媒體播放的示意圖。圖11為本發(fā)明多媒體播放裝置的第五實施方式的模塊示意圖。圖12為關(guān)于多視角立體算法如何呈現(xiàn)環(huán)繞音效給用戶的示意圖。
具體實施例方式在說明書及權(quán)利要求書當(dāng)中使用了某些詞匯來稱呼特定的元件。本領(lǐng)域的技術(shù)人員應(yīng)可理解,硬件制造商可能會用不同的名詞來稱呼同一個元件。本說明書及權(quán)利要求書并不以名稱的差異來作為區(qū)分元件的方式,而是以元件在功能上的差異來作為區(qū)分的準貝U。在通篇說明書及權(quán)利要求書當(dāng)中所提及的“包含”是開放式的用語,故應(yīng)解釋成“包含但不限定干”。此外,“耦接”ー詞在此是包含任何直接及間接的電氣連接手段。因此,若文中描述第一裝置耦接于第二裝置,則代表第一裝置可直接電氣連接于第二裝置,或通過其它裝置或連接手段間接地電氣連接到第二裝置。本發(fā)明的主要概念在于在多媒體內(nèi)容播放的期間,通過偵測使用者的狀態(tài)以正確地與自動地調(diào)整包含視頻及/或音頻之多媒體內(nèi)容的播放。舉例來說,當(dāng)使用者狀態(tài)改變時,使用者狀態(tài)的偵測結(jié)果(例如使用者的人臉角度(user’ s face angle)或是用戶的人臉位置/用戶的位置(user’s face location/user’s location))會做為控制信號,以正確地調(diào)整多媒體內(nèi)容的播放,如此ー來,即便在多媒體內(nèi)容播放的控制過程中沒有使用者的介入,使用者可以具有更佳的多媒體內(nèi)容播放的觀賞/聆聽體驗。進ー步的細節(jié)將說明如下。圖I為本發(fā)明的實施方式中廣義的多媒體播放裝置的模塊示意圖。播放裝置100包含(但并不局限于):接收功能模塊(receiving block) 102、播放功能模塊(playbackblock) 105以及偵測功能模塊(detecting block) 106。接收功能模塊102用來接收多媒體內(nèi)容DATA_IN。播放功能模塊104耦接于接收功能模塊102,用以通過驅(qū)動輸出裝置101來對多媒體內(nèi)容DATA_IN進行播放。偵測功能模塊106耦接于播放功能模塊104,用以偵測使用者狀態(tài)并據(jù)以產(chǎn)生ー個指示所偵測到的使用者狀態(tài)的偵測結(jié)果DR,此外,由偵測功能模塊106所產(chǎn)生的偵測結(jié)果DR會被傳送到播放功能模塊104。在本實施方式中,當(dāng)偵測結(jié)果DR指示出使用者狀態(tài)的改變時,播放功能模塊104會調(diào)整多媒體內(nèi)容DATA_IN的播放,舉例來說,當(dāng)使用者處于第一觀賞/聆聽狀態(tài)時,輸出裝置101會呈現(xiàn)由多媒體內(nèi)容DATA_IN所得的視頻/音頻信息(video/audio information)的第一播放結(jié)果,以及當(dāng)使用者處于第二觀賞/聆聽狀態(tài)時,輸出裝置101會呈現(xiàn)由多媒體內(nèi)容DATA_IN所得的視頻/音頻信息的第二播放結(jié)果。如此ー來,播放裝置100具備自動調(diào)整多媒體內(nèi)容DATA_IN播放的能力,以在多媒體內(nèi)容DATA_IN播放的期間滿足具有不同觀賞/聆聽狀態(tài)的使用者的觀賞/聆聽需求。以下會通過基于圖I所示的架構(gòu)而衍生的多個實施方式,來說明有關(guān)播放裝置100的詳細的技術(shù)特征。請參閱圖2,圖2為本發(fā)明多媒體播放裝置的第一實施方式的模塊示意圖。播放裝置200包含(但并不局限于)接收接ロ(receiving interface) 202、視頻播放模塊(videoplayback module) 204 以及人臉偵測模塊(face detection module)206。請注意,播放裝置200的組態(tài)基于圖I所示之播放裝置架構(gòu),舉例來說,圖I所示的輸出裝置101是由顯示屏幕(display screen) 201來實作、圖I所示的接收功能模塊102是由圖2所示的接收接ロ 202來加以實作、圖I所示的偵測功能模塊106是由人臉偵測模塊206來加以實作,以及圖I所示的播放功能模塊104是由視頻播放模塊204來加以實作。在本實施方式中,多媒體內(nèi)容DATA_IN包含有分別對應(yīng)至多個視角的多個視頻比特流(video bitstream)BS1 BSn,舉例來說(但 本發(fā)明并不局限于此),多媒體內(nèi)容DATA_IN包含足球賽的視頻數(shù)據(jù),其中多個視頻比特流BS1 BSn(例如圖3中的BS_1 BS_5)分別對應(yīng)于足球場的多個視角Al A5,因此,足球賽中的事件可被記錄在多個視頻比特流BS_1 BS_5中,舉例來說,踢角球的事件較適合以視頻比特流BS_2與BS_4來記錄、射門事件較適合以視頻比特流BS_1與BS_5來記錄,以及開球/傳球事件較適合以視頻比特流BS_3來記錄。由接收接ロ 202所接收的視頻比特流BS1 BSn會被傳送至視頻播放模塊204,以進行更進一歩的處理。如圖2所示,視頻播放模塊204包含(但并不局限干)譯碼電路(decoding circuit) 212、選擇電路(selective circuit) 214 以及視頻控制器(videocontroller) 216,其中譯碼電路212包含多個譯碼單兀(decoding unit) 211_1 211_M。請注意,基于實際上的設(shè)計需求/考慮,譯碼単元211_1 211_M的數(shù)量可以等于或小于視頻比特流BS1 BSn的數(shù)量。在譯碼單元211_1 211_M的數(shù)量等于視頻比特流BS1 BSn的數(shù)量的情形下,譯碼單元211_1 211_M用來分別且同時地對視頻比特流BS1-BSn-行譯碼。另外,在譯碼單元211_1 211_M的數(shù)量小于視頻比特流BS1 BSn的數(shù)量的另ー情形下,譯碼單元211_1 211_M便分別且同時地對視頻比特流BS1 BSn中所選擇出來的一部分視頻比特流進行譯碼。此外,譯碼視頻比特流所產(chǎn)生的畫面會從譯碼電路212傳送到選擇電路214。選擇電路214會依據(jù)由人臉偵測模塊206所產(chǎn)生的偵測結(jié)果DR_A,來選擇譯碼單元211_1 211_M所分別產(chǎn)生的多個輸出S_1 S_M中的ー個輸出,并且傳送所選到的輸出S至視頻控制器216。接著,視頻控制器216便驅(qū)動顯示屏幕201以顯示所選到的輸出S中的畫面。于本實施方式中,上述的使用者狀態(tài)為使用者的人臉角度,因此,接收接ロ 202另接收由影像獲取設(shè)備(image capturing device)(例如,視頻攝影機(video camera))218所產(chǎn)生的獲取影像(captured image) IMG。舉例來說,影像獲取設(shè)備218與顯示屏幕201可設(shè)置于同一個顯示設(shè)備(例如,電視機)中。人臉偵測模塊206則會基于獲取影像MG來進行人臉偵測,以偵測使用者狀態(tài)(亦即使用者的人臉角度)。當(dāng)偵測結(jié)果DR_A指示使用者的人臉角度有所改變時,選擇電路214會通過選擇輸出S_1 S_M中的另ー個輸出來改變所選到的輸出S。簡而言之,當(dāng)使用者的人臉對應(yīng)于第一角度吋,視頻播放模塊204會控制顯示屏幕201以顯示對應(yīng)第一視角的第一視頻比特流的畫面,以及當(dāng)使用者的人臉對應(yīng)于第二角度時(亦即使用者的人臉角度有所改變時),則視頻播放模塊204會控制顯示屏幕201以顯示對應(yīng)第二視角(相異于第一視角)的第二視頻比特流的畫面。請ー并參閱圖3與圖4,圖4為運用圖2所示的播放裝置200來進行自動調(diào)整多媒體內(nèi)容播放的操作示意圖。如圖4中的附圖(B)所示,當(dāng)使用者以與圖3所示的視角A3相同或相近的正常視角來觀賞顯示屏幕201吋,視頻播放模塊204會驅(qū)動顯示屏幕201以顯示視頻比特流BS_3所對應(yīng)的畫面Fbs 3。如圖4中附圖(A)所示,當(dāng)使用者想要觀賞于足球場的右邊角落所發(fā)生的事件時,使用者會將臉以逆時鐘方向(counterclockwise)轉(zhuǎn)動,由于使用者的人臉角度與圖3所示的視角A4相同或相近,因此,因應(yīng)偵測結(jié)果DR_A(其指出使用者的人臉角度的逆時鐘方向變化),視頻播放模塊204會通過驅(qū)動顯示屏幕201顯示視頻比特流BS_4的畫面Fbs 4以自動調(diào)整視頻的播放。如圖4中的附圖(C)所示,當(dāng)使用者想要觀賞于足球場的左邊角落所發(fā)生的事件吋,使用者會將臉以順時鐘方向(clockwise)轉(zhuǎn)動,由于使用者的人臉角度與圖3所示的視角A2相同或相近,因此,根據(jù)偵測結(jié)果DR_A(其指出使用者的人臉角度的順時鐘方向變化),視頻播放模塊204會通過驅(qū)動顯示屏幕201顯示視頻比特流BS_2的畫面Fbs 2以自動調(diào)整視頻的播放。請注意,圖4所示的例子僅作為范例說明之用,并非用來作為本發(fā)明之限制,換言之,只要多媒體內(nèi)容的播放會根據(jù)指示出使用者人臉角度產(chǎn)生變化的偵測結(jié)果而自動地調(diào)整時,皆符合本發(fā)明的發(fā)明精神。請參閱圖5,圖5為本發(fā)明多媒體播放裝置的第二實施方式的模塊示意圖。圖5所示的播放裝置500的組態(tài)與圖2所示的播放裝置的組態(tài)相似,而兩者最主要的差異在于 人臉偵測模塊506所偵測的用戶狀態(tài)是用戶的人臉位置(亦即用戶的位置)而不是用戶的人臉角度,因此,人臉偵測模塊506會產(chǎn)生ー個指示用戶的人臉位置的偵測結(jié)果DR_P至選擇電路514。當(dāng)偵測結(jié)果DR_P指出用戶的人臉位置有所改變(亦即用戶的位置產(chǎn)生改變)時,選擇電路514會借著由輸出S_1 S_M中的ー個輸出切換至另一個輸出以改變所選到的輸出S。簡而言之,當(dāng)使用者的人臉對應(yīng)于第一位置吋,視頻播放模塊504會控制顯示屏幕201以顯示對應(yīng)第一視角的第一視頻比特流的畫面,以及當(dāng)使用者的人臉對應(yīng)于第二位置時(亦即用戶的人臉位置有所改變),視頻播放模塊504會控制顯示屏幕201以顯示對應(yīng)第二視角(相異于第一視角)的第二視頻比特流的畫面。請ー并參閱圖3與圖6,圖6為運用圖5所示的播放裝置500來進行自動調(diào)整多媒體內(nèi)容播放的操作示意圖。如圖6中的附圖(B)所示,當(dāng)使用者處在特定位置并以與圖3所示的視角A3相同或相近的正常視角來觀賞顯示屏幕201吋,視頻播放模塊504會驅(qū)動顯示屏幕201以顯示視頻比特流BS_3所對應(yīng)的畫面Fbs 3。如圖6中附圖(A)所示,當(dāng)使用者想要觀賞于足球場的左邊角落所發(fā)生的事件吋,使用者會往左方移動至ー個新的位置,因此,因應(yīng)偵測結(jié)果DR_A(其指出用戶的人臉位置向左移動),視頻播放模塊504會通過驅(qū)動顯示屏幕201顯示視頻比特流BS_2所對應(yīng)的畫面Fbs 2來自動調(diào)整視頻的播放。如圖6中附圖(C)所示,當(dāng)使用者想要觀賞于足球場的右邊角落所發(fā)生的事件吋,使用者會往右方移動至一個新的位置,因此,根據(jù)偵測結(jié)果DR_A (其指出用戶的人臉位置向右移動),視頻播放模塊504會通過驅(qū)動顯示屏幕201顯示視頻比特流BS_4所對應(yīng)的畫面Fbs 4來自動調(diào)整視頻的播放。請注意,圖6所示的例子僅作為范例說明之用,并非用來作為本發(fā)明之限制,換言之,只要多媒體內(nèi)容的播放會因應(yīng)指示出用戶的人臉位置的變化(亦即用戶位置的變化)的偵測結(jié)果而自動地調(diào)整時,皆符合本發(fā)明的發(fā)明精神。請參閱圖7,圖7為本發(fā)明多媒體播放裝置的第三實施方式的模塊示意圖。播放裝置700包含(但不局限于)接收接ロ 702、視頻播放模塊704,以及人臉偵測模塊706。請注意,播放裝置700的組態(tài)基于圖I所示的播放裝置架構(gòu),舉例來說,圖I所示的輸出裝置101是由顯示屏幕201來加以實作、圖I所示的接收功能模塊102是以圖7所示的接收接ロ 702來加以實作、圖I所示的偵測功能模塊106是以人臉偵測模塊706來加以實作,以及圖I所示的播放功能模塊104是以視頻播放模塊704來加以實作。在本實施方式中,多媒體內(nèi)容DATA_IN包含至少ー個視頻比特流BS,舉例來說,視頻比特流BS可以是上述多個視頻比特流BS1 BSn之中的ー個視頻比特流。 由接收接ロ 702所接收的視頻比特流BS會被傳送至視頻播放模塊704,以進行更進ー步的處理。如圖7所示,視頻播放模塊704包含(但并不局限干)譯碼電路712、判斷電路(determining circuit) 714、處理電路(processing circuit) 716 以及視頻控制器718。視頻比特流BS譯碼所產(chǎn)生的多個畫面(亦即譯碼電路712的輸出S_BS),會從譯碼電路712被傳送到判斷電路714。判斷電路714會依據(jù)人臉偵測模塊706所產(chǎn)生的偵測結(jié)果DR_P,來選擇多個畫面中姆ー個畫面的ー個局部影像(partial image)。處理電路716則依據(jù)視頻效果設(shè)定(video effect setting)來處理多個畫面所分別選出的多個局部影像,以產(chǎn)生多個已處理影像(processed image),然后傳送多個已處理影像至視頻控制器718。接著,視頻控制器718會驅(qū)動顯示屏幕201以顯示多個已處理影像。 于本實施方式中,上述的使用者狀態(tài)是用戶的人臉位置/用戶的位置,因此,接收接ロ 702另接收由上述的影像獲取設(shè)備(例如,視頻攝影機)218所產(chǎn)生的獲取影像MG。人臉偵測模塊706的運作與圖5所示的人臉偵測模塊506的運作相同,換言之,人臉偵測模塊706會基于獲取影像IMG來進行人臉偵測,以偵測使用者狀態(tài)(亦即用戶的人臉位置)。當(dāng)偵測結(jié)果DR_P指示用戶的人臉位置有所改變時,判斷電路714可改變自譯碼電路712所產(chǎn)生的每ー個畫面中選取出局部影像的位置,及/或處理電路716可調(diào)整目前正在使用的視頻效果設(shè)定。舉例來說,當(dāng)偵測結(jié)果DR_P傳送用戶的人臉位置/用戶的位置的第一指示值而據(jù)此判斷出使用者的人臉對應(yīng)于第一位置的時候,視頻播放模塊704會依據(jù)第一指示值,自視頻比特流BS所得的多個第一畫面中每ー個第一畫面中選擇第一局部影像、依據(jù)第一視頻效果設(shè)定來處理多個第一畫面所選取的多個第一局部影像以產(chǎn)生多個已處理第一影像,以及依據(jù)多個已處理第一影像來驅(qū)動顯示屏幕201。當(dāng)偵測結(jié)果DR_P傳送用戶的人臉位置/用戶的位置的第二指示值而據(jù)此判斷出使用者的人臉對應(yīng)于第二位置的時候,視頻播放模塊704會依據(jù)第二指示值,自視頻比特流BS所得的多個第二畫面中每ー個第二畫面選擇第二局部影像、依據(jù)與第一視頻效果設(shè)定相異的第二視頻效果設(shè)定來處理多個第二畫面所選取的多個第二局部影像以產(chǎn)生多個已處理第二影像,以及依據(jù)多個已處理第二影像來驅(qū)動顯示屏幕201。請參閱圖8,圖8為運用圖7所示的播放裝置700來進行自動調(diào)整多媒體內(nèi)容播放的操作示意圖。如圖8中的附圖(B)所示,當(dāng)用戶處在位置Pl以及用戶的人臉位置靠近顯示屏幕201的顯示區(qū)802的時候,視頻播放模塊704會顯示因應(yīng)用戶人臉位置的第一縮放設(shè)定(zooming setting)與第一指示值所產(chǎn)生的多個第一已處理影像IMG_1。當(dāng)用戶由位置Pl移動至新的位置P2吋,此時,用戶人臉位置會靠近顯示屏幕201的顯示區(qū)806,因此,如圖8中附圖(A)所示,視頻播放模塊704會顯示因應(yīng)用戶人臉位置的第二縮放設(shè)定與第ニ指示值所產(chǎn)生的多個第二已處理影像頂G_2,具體地說,由于偵測結(jié)果DR_P所指示的用戶人臉位置的第二指示值的緣故,因此顯示區(qū)806中的多個局部影像會被選取,并接著被以第二縮放設(shè)定所定義的放大比例(zoom-in ratio)來放大。當(dāng)用戶由位置Pl移動至新的位置P3時,此時,用戶人臉位置會靠近顯示屏幕201的顯示區(qū)804,因此,如圖8中附圖(C)所示,視頻播放模塊704會顯示因應(yīng)用戶人臉位置的第三縮放設(shè)定與第三指示值所產(chǎn)生的多個第三已處理影像頂G_3,具體地說,由于偵測結(jié)果DR_P所指示的用戶人臉位置的第三指示值的緣故,因此,顯示區(qū)804中多個局部影像會被選取,并接著被以第三縮放設(shè)定所定義的放大比例來放大。請注意,用戶與顯示屏幕201之間的距離D1. D2以及D3,彼此之間是不同的。在設(shè)計范例中,多個縮放設(shè)定會具有不同的放太/縮小(zoom-out)比例,例如,由于D1 > D2,第一縮放設(shè)定會具有一個小于第二縮放設(shè)定的放大比例;以及由于02 > D3,第二縮放設(shè)定會具有一個小于第三縮放設(shè)定的放大比例。然而,以上僅作為范例說明之用,并非用來作為本發(fā)明的限制,也就是說,只要多媒體內(nèi)容的播放會因應(yīng)指示出用戶的人臉位置/用戶的位置的變化的偵測結(jié)果而自動地調(diào)整,皆符合本發(fā)明的發(fā)明精神。請注意,圖7所示的判斷電路714可為選擇性(optional)的組件,換言之,在另ー實施方式中,可以省略判斷電路714。請參閱圖9,圖9為本發(fā)明多媒體播放裝置的第四實施方式的模塊示意圖。播放裝置700與播放裝置900彼此之間主要的不同之處在于圖9所示的播放裝置900中的視頻播放模塊904并沒有判斷電路,因此,譯碼電路712的輸出S_ BS會被傳送至處理電路916。于此實施方式中,處理電路916依據(jù)視頻效果設(shè)定以通過處理視頻比特流BS中多個畫面來產(chǎn)生多個已處理畫面,并接著傳送多個已處理畫面至視頻控制器718,接下來,視頻控制器718會驅(qū)動顯示屏幕201以顯示多個已處理畫面。請注意,當(dāng)偵測結(jié)果DR_P指示用戶的人臉位置/用戶的位置有所改變吋,處理電路916可調(diào)整目前正在使用的視頻效果設(shè)定,因而調(diào)整視頻的播放。舉例來說,當(dāng)偵測結(jié)果DR_P傳送用戶人臉位置的第一指示值而據(jù)此判斷出使用者人臉對應(yīng)于第一位置的時候,視頻播放模塊904會依據(jù)第一視頻設(shè)定來處理視頻比特流BS中多個第一畫面以產(chǎn)生多個第一已處理畫面,并依據(jù)多個第一已處理畫面來驅(qū)動顯示屏幕201。當(dāng)偵測結(jié)果DR_P傳送用戶人臉位置的第二指示值而據(jù)此判斷出使用者人臉對應(yīng)于第二位置的時候,視頻播放模塊904會依據(jù)與第一視頻設(shè)定相異的第二視頻設(shè)定來處理視頻比特流BS中多個第二畫面以產(chǎn)生多個第二已處理畫面,并依據(jù)多個第二已處理畫面來驅(qū)動顯示屏幕201。舉例來說(但本發(fā)明并不局限于此),第一視頻設(shè)定包含第一縮放設(shè)定,以及第ニ視頻設(shè)定包含第二縮放設(shè)定。請參閱圖10,圖10為運用圖9所示的播放裝置900來進行自動調(diào)整多媒體內(nèi)容播放的操作示意圖。如圖10中附圖(B)所示,當(dāng)用戶處在位置Pl來觀賞顯示屏幕201吋,視頻播放模塊904會顯示因應(yīng)用戶人臉位置的第一指示值而配置的第一縮放設(shè)定所產(chǎn)生的多個第一已處理影像頂G_l。如圖10中附圖(A)所示,當(dāng)用戶由位置Pl移動至新的位置P2吋,視頻播放模塊904會顯示因應(yīng)用戶人臉位置的第二指示值而配置的第二縮放設(shè)定所產(chǎn)生的多個第二已處理影像頂G_2’,具體地說,中間顯示區(qū)802的多個局部影像由第二縮放設(shè)定所定義的放大比例來放大。如圖10中附圖(C)所示,當(dāng)用戶由位置Pl移動至新的位置P3吋,視頻播放模塊904會顯示因應(yīng)用戶人臉位置的第三指示值而配置的第三縮放設(shè)定所產(chǎn)生的多個第三已處理影像頂G_3’,具體地說,中間顯示區(qū)802的多個局部影像由第三縮放設(shè)定所定義的放大比例來放大。請注意,用戶與顯示屏幕201之間的距離ロ”ら以及D3,彼此之間是不同的。在設(shè)計范例中,多個縮放設(shè)定會具有不同的放太/縮小比例,例如,由于ロェ> D2,第一縮放設(shè)定會具有一個小于第二縮放設(shè)定的放大比例;以及由于02 > D3,第二縮放設(shè)定會具有一個小于第三縮放設(shè)定的放大比例。由圖10可輕易了解,無論用戶的人臉位置/用戶的位置為何,在同樣的中間顯示區(qū)802內(nèi)的多個局部影像皆可通過多個適當(dāng)?shù)姆糯蟊壤祦矸糯?。然而,以上僅作范例說明之用,并非用來作為本發(fā)明的限制,也就是說,只要多媒體內(nèi)容的播放會因應(yīng)指示出用戶的人臉位置/用戶的位置的變化的偵測結(jié)果而自動地調(diào)整,皆符合本發(fā)明之發(fā)明精神。除了視頻播放控制以外,同樣的概念也可應(yīng)用于音頻(audio)播放控制以提升使用者聆聽的體驗。請參閱圖11,圖11為本發(fā)明多媒體播放裝置的第五實施方式的模塊示意 圖。播放裝置1100包含有(但不局限于)接收接ロ 1102、音頻播放模塊(audio playbackmodule) 1104以及人臉偵測模塊1106。請注意,播放裝置1100的組態(tài)是基于圖I所示的播放裝置架構(gòu),舉例來說,圖I所示的輸出裝置101是由揚聲系統(tǒng)(speak system) 1101來加以實作、圖I所示的接收功能模塊102是以接收接ロ 1102來加以實作、圖I所示的偵測功能模塊106是以人臉偵測模塊1106來加以實作,以及圖I所示的播放功能模塊104是以音頻播放模塊1104來加以實作。在本實施方式中,多媒體內(nèi)容DATA_IN包含音頻數(shù)據(jù)Da,例如是已編碼/已調(diào)變(encoded/modulated)的音頻輸入。接收接ロ 1102所接收的音頻數(shù)據(jù)Da會被傳送到音頻播放模塊1104以供進ー步處理。如圖11所示,音頻播放模塊1104包含有(但不局限干)譯碼電路1112、處理電路1114以及音頻輸出電路(audio output circuit) 1116。音頻數(shù)據(jù)Da譯碼所產(chǎn)生的多個音頻取樣(audio sample)會從譯碼電路1112傳送到處理電路1114,而處理電路1114會依據(jù)音頻效果設(shè)定來對于譯碼電路1112的輸出S_A進行處理,并且傳送多個已處理音頻取樣(processed audio sample)至音頻輸出電路1116,接下來,音頻輸出電路1116會驅(qū)動揚聲系統(tǒng)1101以播放多個已處理音頻取樣。請注意,音頻效果設(shè)定是依據(jù)人臉偵測模塊1106所產(chǎn)生的偵測結(jié)果DR_P來加以設(shè)定。舉例來說(但本發(fā)明不局限于此),揚聲系統(tǒng)1101可以是一個雙聲道揚聲系統(tǒng)(two-channel speaker system),以及音頻效果設(shè)定環(huán)繞音頻設(shè)定(surrounding audiosetting)。多視角立體算法(multi-view stereo algorithm,MVS algorithm)可被應(yīng)用于處理電路1114以創(chuàng)造出用戶所渴望的環(huán)繞音效(surrounding sound effect)。圖12說明了多視角立體算法如何運作以呈現(xiàn)環(huán)繞音效給用戶。如圖12所示,雙聲道揚聲系統(tǒng)包含左聲道揚聲器(left-channel speaker) SPKl 以及右聲道揚聲器(right-channel speaker)SPKk,且由左聲道輸入ん與右聲道輸入Xk所驅(qū)動以呈現(xiàn)環(huán)繞音效給用戶。請注意,圖中所示的多個角度值む與eK系由用戶的位置來決定,換言之,當(dāng)用戶位置有所改變時,多視角立體算法所使用的多個參數(shù)也應(yīng)適度地調(diào)整。如圖12所示,左聲道揚聲器SPI^的音頻輸入可傳送到用戶的左耳與右耳,而其中的傳送方式可利用多個參數(shù)Hu與Hui來模型化;同樣地,右聲道揚聲器SPKk的音頻輸入可傳送到用戶的右耳與左耳,而其中的傳送方式可利用多個參數(shù)Hkk與H&來模型化。為了要呈現(xiàn)環(huán)繞音效給用戶,左聲道輸入\與右聲道輸入Xk可利用下列公式來決定
權(quán)利要求
1.ー種應(yīng)用于多媒體內(nèi)容的播放方法,包含有 接收所述多媒體內(nèi)容; 對所述多媒體內(nèi)容進行播放; 偵測使用者狀態(tài),并據(jù)以產(chǎn)生偵測結(jié)果;以及 當(dāng)所述偵測結(jié)果指示所述使用者狀態(tài)具有變化時,調(diào)整所述多媒體內(nèi)容的播放。
2.如權(quán)利要求I所述的應(yīng)用于多媒體內(nèi)容的播放方法,其特征在于,偵測所述使用者狀態(tài)的步驟,包含 接收獲取影像;以及 對所述獲取影像進行人臉偵測,以偵測所述使用者狀態(tài)。
3.如權(quán)利要求I所述的應(yīng)用于多媒體內(nèi)容的播放方法,其特征在于,所述使用者狀態(tài)是使用者的人臉角度。。
4.如權(quán)利要求3所述的應(yīng)用于多媒體內(nèi)容的播放方法,其特征在于,所述多媒體內(nèi)容包含分別對應(yīng)至多個視角的多個視頻比特流;對所述多媒體內(nèi)容進行播放的步驟包含控制顯示屏幕以顯示對應(yīng)第一視角的第一視頻比特流的畫面;以及調(diào)整所述多媒體內(nèi)容的播放的步驟包含當(dāng)所述使用者的人臉角度改變時,控制所述顯示屏幕以顯示對應(yīng)第二視角的第二視頻比特流的畫面,其中所述第一視角不同于所述第二視角。
5.如權(quán)利要求I所述的應(yīng)用于多媒體內(nèi)容的播放方法,其特征在于,所述使用者狀態(tài)是用戶的位置。
6.如權(quán)利要求5所述的應(yīng)用于多媒體內(nèi)容的播放方法,其特征在于,所述多媒體內(nèi)容包含分別對應(yīng)至多個視角的多個視頻比特流;對所述多媒體內(nèi)容進行播放的步驟包含控制顯示屏幕以顯示對應(yīng)第一視角的第一視頻比特流的畫面;以及調(diào)整所述多媒體內(nèi)容的播放的步驟包含當(dāng)所述用戶的位置改變時,控制所述顯示屏幕以顯示對應(yīng)第二視角的第二視頻比特流的畫面,其中所述第一視角不同于所述第二視角。
7.如權(quán)利要求5所述的應(yīng)用于多媒體內(nèi)容的播放方法,其特征在于,所述多媒體內(nèi)容包含視頻比特流;對所述多媒體內(nèi)容進行播放的步驟包含依據(jù)至少所述視頻比特流的多個第一畫面以及第一視頻效果設(shè)定來驅(qū)動顯示屏幕;以及調(diào)整所述多媒體內(nèi)容的播放的步驟包含當(dāng)所述用戶的位置改變時,依據(jù)至少所述視頻比特流的多個第二畫面以及與所述第一視頻效果設(shè)定相異的第二視頻效果設(shè)定來驅(qū)動所述顯示屏幕。
8.如權(quán)利要求7所述的應(yīng)用于多媒體內(nèi)容的播放方法,其特征在于,依據(jù)至少所述視頻比特流的所述多個第一畫面以及所述第一視頻效果設(shè)定來驅(qū)動所述顯示屏幕的步驟包含依據(jù)所述第一視頻效果設(shè)定來處理所述多個第一畫面以產(chǎn)生多個已處理第一畫面,以及依據(jù)所述多個已處理第一畫面來驅(qū)動所述顯示屏幕;以及依據(jù)至少所述視頻比特流的所述多個第二畫面以及與所述第二視頻效果設(shè)定來驅(qū)動所述顯示屏幕的步驟包含依據(jù)所述第二視頻效果設(shè)定來處理所述多個第二畫面以產(chǎn)生多個已處理第二畫面,以及依據(jù)所述多個已處理第二畫面來驅(qū)動所述顯示屏幕。
9.如權(quán)利要求7所述的應(yīng)用于多媒體內(nèi)容的播放方法,其特征在于,所述第一視頻效果設(shè)定包含第一縮放設(shè)定,以及所述第二視頻效果設(shè)定包含第二縮放設(shè)定。
10.如權(quán)利要求7所述的應(yīng)用于多媒體內(nèi)容的播放方法,其特征在于,依據(jù)至少所述視頻比特流的所述多個第一畫面與所述第一視頻效果設(shè)定來驅(qū)動所述顯示屏幕的步驟包含: 依據(jù)所述用戶位置的第一指示值,選擇所述多個第一畫面的每ー第一畫面中的第一局部影像; 依據(jù)所述第一視頻效果設(shè)定來處理所述多個第一畫面所選取出的多個第一局部影像,以產(chǎn)生多個已處理第一影像;以及 依據(jù)所述多個已處理第一影像來驅(qū)動所述顯示屏幕;以及 依據(jù)至少所述視頻比特流的所述多個第二畫面以及與所述第二視頻效果設(shè)定來驅(qū)動所述顯示屏幕的步驟包含有 依據(jù)所述用戶位置的第二指示值,選擇所述多個第二畫面的每ー第二畫面中的第二局部影像,其中所述第二指示值是不同于所述第一指示值; 依據(jù)所述第二視頻效果設(shè)定來處理所述多個第二畫面所選取出的多個第二局部影像,以產(chǎn)生多個已處理第二影像;以及 依據(jù)所述多個已處理第二影像來驅(qū)動所述顯示屏幕。
11.如權(quán)利要求5所述的應(yīng)用于多媒體內(nèi)容的播放方法,其特征在于,所述多媒體內(nèi)容包含音頻數(shù)據(jù);對所述多媒體內(nèi)容進行播放的步驟包含當(dāng)接收到所述音頻數(shù)據(jù)的第一音頻片段時,依據(jù)第一音頻效果設(shè)定來驅(qū)動揚聲系統(tǒng)以播放所述第一音頻片段;以及調(diào)整所述多媒體內(nèi)容的播放的步驟包含當(dāng)所述用戶的位置改變且接收到所述音頻數(shù)據(jù)的第二音頻片段時,依據(jù)與所述第一音頻效果設(shè)定相異的第二音頻效果設(shè)定來驅(qū)動所述揚聲系統(tǒng)以播放所述第二音頻片段。
12.如權(quán)利要求11所述的應(yīng)用于多媒體內(nèi)容的播放方法,其特征在于,所述第一音頻效果設(shè)定是第一環(huán)繞音頻設(shè)定,以及所述第二音頻效果設(shè)定是第二環(huán)繞音頻設(shè)定。
13.如權(quán)利要求11所述的應(yīng)用于多媒體內(nèi)容的播放方法,其中所述第一環(huán)繞音頻設(shè)定與所述第二環(huán)繞音頻設(shè)定是對應(yīng)于不同的音場深度。
14.如權(quán)利要求11所述的應(yīng)用于多媒體內(nèi)容的播放方法,其特征在于,另包含 接收與立體視頻數(shù)據(jù)的播放相關(guān)的景深參數(shù); 其中所述景深參數(shù)是被參考來設(shè)定所述第一音頻效果設(shè)定與所述第二音頻效果設(shè)定中至少其一。
15.—種應(yīng)用于多媒體內(nèi)容的播放裝置,包含有 接收功能模塊,用以接收所述多媒體內(nèi)容; 播放功能模塊,耦接于所述接收功能模塊,用以對所述多媒體內(nèi)容進行播放; 偵測功能模塊,耦接于所述播放功能模塊,用以偵測使用者狀態(tài),并據(jù)以產(chǎn)生偵測結(jié)果; 其中當(dāng)所述偵測結(jié)果指示所述使用者狀態(tài)有變化時,所述播放功能模塊會調(diào)整所述多媒體內(nèi)容的播放。
16.如權(quán)利要求15所述的應(yīng)用于多媒體內(nèi)容的播放裝置,其特征在于,所述接收功能模塊另接收獲取影像,以及所述偵測功能模塊對所述獲取影像進行人臉偵測以偵測所述使用者狀態(tài)。
17.如權(quán)利要求15所述的應(yīng)用于多媒體內(nèi)容的播放裝置,其特征在于,所述用戶狀態(tài)是使用者的人臉角度。
18.如權(quán)利要求17所述的應(yīng)用于多媒體內(nèi)容的播放裝置,其特征在于,所述多媒體內(nèi)容包含分別對應(yīng)多個視角的多個視頻比特流;所述播放功能模塊控制顯示屏幕顯示對應(yīng)第一視角的第一視頻比特流的畫面;以及當(dāng)所述使用者的人臉角度改變時,所述播放功能模塊控制所述顯示屏幕顯示對應(yīng)第二視角的第二視頻比特流的畫面,其中所述第一視角不同于所述第二視角。
19.如權(quán)利要求15所述的應(yīng)用于多媒體內(nèi)容的播放裝置,其特征在于,所述用戶狀態(tài)是用戶的位置。
20.如權(quán)利要求19所述的應(yīng)用于多媒體內(nèi)容的播放裝置,其特征在于,所述多媒體內(nèi)容包含分別對應(yīng)多個視角的多個視頻比特流;所述播放功能模塊控制顯示屏幕顯示對應(yīng)第一視角的第一視頻比特流的畫面;以及當(dāng)所述用戶的位置改變時,所述播放功能模塊控制所述顯示屏幕顯示對應(yīng)第二視角的第二視頻比特流的畫面,其中所述第一視角不同于所述第二視角。
21.如權(quán)利要求19所述的應(yīng)用于多媒體內(nèi)容的播放裝置,其特征在于,所述多媒體內(nèi) 容包含視頻比特流;所述播放功能模塊依據(jù)至少所述視頻比特流的多個第一畫面以及第一視頻效果設(shè)定來驅(qū)動顯示屏幕;以及當(dāng)所述用戶的位置改變時,依據(jù)至少所述視頻比特流的多個第二畫面以及與所述第一視頻效果設(shè)定相異的第二視頻效果設(shè)定來驅(qū)動所述顯示屏幕。
22.如權(quán)利要求21所述的應(yīng)用于多媒體內(nèi)容的播放裝置,其特征在于,所述播放功能模塊依據(jù)所述第一視頻效果設(shè)定來處理所述多個第一畫面以產(chǎn)生多個已處理第一畫面,以及依據(jù)所述多個已處理第一畫面來驅(qū)動所述顯示屏幕;以及所述播放功能模塊另依據(jù)所述第二視頻效果設(shè)定來處理所述多個第二畫面以產(chǎn)生多個已處理第二畫面,以及依據(jù)所述多個已處理第二畫面來驅(qū)動所述顯示屏幕。
23.如權(quán)利要求21所述的應(yīng)用于多媒體內(nèi)容的播放裝置,其特征在于,所述第一視頻效果設(shè)定包含第一縮放設(shè)定,以及所述第二視頻效果設(shè)定包含第二縮放設(shè)定。
24.如權(quán)利要求21所述的應(yīng)用于多媒體內(nèi)容的播放裝置,其特征在于,所述播放功能模塊會依據(jù)所述用戶位置的第一指示值,選擇所述多個第一畫面的每ー第一畫面中的第一局部影像、依據(jù)所述第一視頻效果設(shè)定來處理所述多個第一畫面所選取出的多個第一局部影像以產(chǎn)生多個已處理第一影像,以及依據(jù)所述多個已處理第一影像來驅(qū)動所述顯示屏幕;以及所述播放功能模塊另依據(jù)所述用戶位置的第二指示值,選擇所述多個第二畫面的每ー第二畫面中的第二局部影像,其中所述第二指示值不同于所述第一指示值、依據(jù)所述第二視頻效果設(shè)定來處理所述多個第二畫面所選取出的多個第二局部影像以產(chǎn)生多個已處理第二影像,以及依據(jù)所述多個已處理第二影像來驅(qū)動所述顯示屏幕。
25.如權(quán)利要求19所述的應(yīng)用于多媒體內(nèi)容的播放裝置,其特征在于,所述多媒體內(nèi)容包含音頻數(shù)據(jù);當(dāng)所述接收功能模塊接收到所述音頻數(shù)據(jù)的第一音頻片段時,所述播放功能模塊會依據(jù)第一音頻效果設(shè)定來驅(qū)動揚聲系統(tǒng)以播放所述音頻數(shù)據(jù)的所述第一音頻片段;以及當(dāng)所述用戶的位置改變與所述接收功能模塊接收到所述音頻數(shù)據(jù)的第二音頻片段時,所述播放功能模塊會依據(jù)與所述第一音頻效果設(shè)定相異的第二音頻效果設(shè)定來驅(qū)動所述揚聲系統(tǒng)以播放所述第二音頻片段。
26.如權(quán)利要求25所述的應(yīng)用于多媒體內(nèi)容的播放裝置,其特征在于,所述第一音頻效果設(shè)定是第一環(huán)繞音頻設(shè)定,以及所述第二音頻效果設(shè)定是第二環(huán)繞音頻設(shè)定。
27.如權(quán)利要求25所述的應(yīng)用于多媒體內(nèi)容的播放裝置,其特征在于,所述第一環(huán)繞音頻設(shè)定與所述第二環(huán)繞音頻設(shè)定對應(yīng)于不同的音場深度。
28.如權(quán)利要求25所述的應(yīng)用于多媒體內(nèi)容的播放裝置,其特征在于,所述接收功能模塊另接收與立體視頻數(shù)據(jù)的播放相關(guān)的景深參數(shù),以及所述景深參數(shù)被參考來設(shè)定所述第一音頻效果設(shè)定與所述第二音頻效果設(shè)定中至少其一。
全文摘要
本發(fā)明提供一種應(yīng)用于多媒體內(nèi)容的播放方法與播放裝置,所述方法包含接收多媒體內(nèi)容;對多媒體內(nèi)容進行播放;偵測使用者狀態(tài)并產(chǎn)生偵測結(jié)果;當(dāng)偵測結(jié)果指示使用者狀態(tài)有所變化時,調(diào)整多媒體內(nèi)容的播放。本發(fā)明的應(yīng)用于多媒體內(nèi)容的播放方法及播放裝置能偵測用戶的狀態(tài)以正確地與自動地調(diào)整包含視頻及/或音頻的多媒體內(nèi)容的播放,用戶可以具有更佳的多媒體內(nèi)容播放的觀賞/聆聽體驗。
文檔編號H04N21/431GK102740154SQ20121007334
公開日2012年10月17日 申請日期2012年3月19日 優(yōu)先權(quán)日2011年4月14日
發(fā)明者方柏凱, 簡敏纮 申請人:聯(lián)發(fā)科技股份有限公司