]A、B、C、D、E:觀賞者
[0036]F1、F2、F3、F4、F5:臉部區(qū)塊
[0037]G1、G2、G3、G4、G5:手勢(shì)
[0038]Imgl-1、Imgl-2、Img2:影像
[0039]P:使用者代表點(diǎn)
[0040]Q:參考基準(zhǔn)點(diǎn)
[0041]M、N:人手特征點(diǎn)
[0042]GP:顯示位置
[0043]Il ?15:物件
[0044]600:畫面
[0045]S301?S304:本發(fā)明一實(shí)施例所述的手勢(shì)控制方法的各步驟
【具體實(shí)施方式】
[0046]為了讓使用者不受限于特定的位置上也能進(jìn)行手勢(shì)操控,本發(fā)明以操控者的臉部為基準(zhǔn)來(lái)進(jìn)行操作平面與顯示平面之間的坐標(biāo)轉(zhuǎn)換,并透過偵測(cè)手勢(shì)操作的位置而對(duì)應(yīng)控制影像流處理裝置執(zhí)行相對(duì)應(yīng)的功能。為了使本發(fā)明之內(nèi)容更為明了,以下列舉實(shí)施例作為本發(fā)明確實(shí)能夠據(jù)以實(shí)施的范例。
[0047]圖1為根據(jù)本發(fā)明的一范例實(shí)施例所繪示的手勢(shì)控制系統(tǒng)的示意圖。請(qǐng)參照?qǐng)D1,手勢(shì)控制系統(tǒng)10包括屏幕110、影像獲取單元120以及視頻流處理裝置130。視頻流處理裝置130電性連接至屏幕110與影像獲取單元120。
[0048]在本范例實(shí)施例中,視頻流處理裝置130例如是數(shù)字機(jī)上盒(Set Top Box, STB)、電視游樂器或DVD播放器等具有視頻信號(hào)處理能力的電子裝置。屏幕110用以顯示一畫面或播放視頻畫面。例如,屏幕110可以接收經(jīng)視頻流處理裝置130進(jìn)行解碼(decoding)或解壓縮(decompressing)等視頻處理操作后的視頻流,并且將其顯示為視頻畫面。
[0049]屏幕110可以例如是液晶顯示器(Liquid Crystal Display, LCD)、發(fā)光二極體(Light-Emitting D1de,LED)顯不器、場(chǎng)發(fā)射顯不器(Field Emiss1n Display,FED)或其他種類的顯示器,本發(fā)明并不限制于此。此外,在一范例實(shí)施例中,視頻流處理裝置130可結(jié)合屏幕110為智能電視(Smart TV)、連網(wǎng)電視(Internet TV)、平板電腦(tablet PC)或筆記型電腦(notebook)等兼具視頻流處理與視頻畫面顯示能力的電子裝置。
[0050]影像獲取單元120例如是具有電荷稱合元件(Charge Coupled Device,CO))或互補(bǔ)式金氧半導(dǎo)體(Complementary Metal-Oxide Semiconductor,CMOS)兀件的影像感測(cè)器,用以擷取屏幕110前方的影像,讓視頻流處理裝置130可偵測(cè)屏幕110前方的使用者在三維空間中所進(jìn)行手勢(shì)操作的位置及種類。舉例來(lái)說(shuō),影像獲取單元120可以是裝設(shè)于智能電視上方的相機(jī)或攝影機(jī),但本發(fā)明并不以此為限。
[0051]于本范例實(shí)施例中,視頻流處理裝置130負(fù)責(zé)接收并辨別使用者的手勢(shì)變化,據(jù)以執(zhí)行相對(duì)應(yīng)的功能?;蛘呤?,視頻流處理裝置130負(fù)責(zé)接收并辨別使用者的手勢(shì)變化,據(jù)以產(chǎn)生相對(duì)應(yīng)的控制訊號(hào),并且將控制訊號(hào)傳送至智能電視,以控制智能電視執(zhí)行對(duì)應(yīng)于手勢(shì)的預(yù)設(shè)程序。
[0052]圖2為根據(jù)本發(fā)明的一范例實(shí)施例所繪示的視頻流處理裝置的示意圖。請(qǐng)參照?qǐng)D2,視頻流處理裝置130包括偵測(cè)模塊131、決定模塊132、坐標(biāo)轉(zhuǎn)換模塊133以及執(zhí)行模塊134。上述模塊可由軟件、硬件或其組合實(shí)作而得,在此不加以限制。軟件例如是原始碼、作業(yè)系統(tǒng)、應(yīng)用軟件或驅(qū)動(dòng)程序等。硬件例如是中央處理單元(Central Processing Unit,CPU),或是其他可程序化的一般用途或特殊用途的微處理器(Microprocessor )。
[0053]圖3是依照本發(fā)明一實(shí)施例所繪示的手勢(shì)控制方法流程圖。請(qǐng)參照?qǐng)D3,本實(shí)施例的方式適用于上述實(shí)施例中的視頻流處理裝置130,以下即搭配圖1與圖2中的各元件與模塊說(shuō)明本實(shí)施例手勢(shì)控制方法的詳細(xì)步驟。
[0054]首先,于步驟S301,偵測(cè)模塊131偵測(cè)第一影像中的第一操作手勢(shì)。詳細(xì)來(lái)說(shuō),視頻流處理裝置130藉由影像獲取單元120取得屏幕110前的第一影像,并對(duì)第一影像進(jìn)行手部影像的偵測(cè)與辨識(shí)。舉例來(lái)說(shuō),偵測(cè)模塊131可藉由影像處理技術(shù)中的膚色偵測(cè)(skincolor detect1n)演算法、邊緣偵測(cè)(edge detect1n)演算法或其他演算法而尋找到第一影像中的手部影像區(qū)塊。再者,偵測(cè)模塊131可同樣利用影像處理技術(shù)而進(jìn)一步辨識(shí)出手部影像區(qū)塊所代表的操作手勢(shì)。
[0055]于是,于步驟S302,若第一操作手勢(shì)符合控制條件,決定模塊132依據(jù)第一操作手勢(shì)決定在第一影像中關(guān)聯(lián)于第一操作手勢(shì)的使用者區(qū)塊。簡(jiǎn)單來(lái)說(shuō),控制條件的判斷用來(lái)決定視頻流處理裝置130的當(dāng)前操控者,控制條件的設(shè)定可視實(shí)際應(yīng)用狀況而定。舉例來(lái)說(shuō),控制條件可依照用者平常較少比劃出來(lái)的手勢(shì)動(dòng)作而定,因此可減少其他觀賞者無(wú)意間做出符合控制條件而導(dǎo)致控制權(quán)轉(zhuǎn)換的情況發(fā)生。
[0056]于本范例實(shí)施例中,若使用者欲取得視頻流處理裝置130的控制權(quán),使用者可于影像獲取單元120的擷取視野范圍內(nèi)做出符合控制條件的手勢(shì)。也就是說(shuō),一旦判定第一操作手勢(shì)符合控制條件,做出第一操作手勢(shì)的使用者將被視為當(dāng)前的主控者,而關(guān)聯(lián)于此主控者的使用者區(qū)塊的信息將被作為獲取坐標(biāo)轉(zhuǎn)換關(guān)系的參考基準(zhǔn)。因此,決定模塊132依據(jù)第一操作手勢(shì)決定在第一影像中關(guān)聯(lián)于第一操作手勢(shì)的使用者區(qū)塊,使用者區(qū)塊可以是一人臉區(qū)塊或是其他一預(yù)設(shè)區(qū)塊,本發(fā)明對(duì)此不限制。但為了清楚說(shuō)明本發(fā)明,以下將以人臉區(qū)塊為例繼續(xù)進(jìn)行說(shuō)明。
[0057]圖4A是依照本發(fā)明一實(shí)施例所繪示的決定使用者區(qū)塊的示意圖。請(qǐng)參照?qǐng)D4A,第一影像Imgl-1為影像獲取單元120所拍攝的影像,且第一影像Imgl-1包括觀賞者A與觀賞者B。于本范例中,假設(shè)控制條件為將雙手握拳至于頭上,由于觀賞者A的手勢(shì)Gl符合控制條件,因此觀賞者A將被識(shí)別為主控者。另一方面,觀賞者B的手勢(shì)G2并不符合控制條件,因此觀賞者B被識(shí)別為一般的觀賞者。
[0058]接著,決定模塊132可依據(jù)觀賞者A的手勢(shì)Gl決定出第一影像Imgl-1中關(guān)聯(lián)于手勢(shì)Gl的臉部區(qū)塊F1。可以知道的是,由于控制條件為將雙手握拳至于頭上,因此決定模塊132可據(jù)以判斷手勢(shì)Gl下方的臉部區(qū)塊Fl代表主控者的臉部,而非將觀賞者B的臉部區(qū)塊F2識(shí)別為主控者的臉部區(qū)塊。
[0059]圖4B是依照本發(fā)明一實(shí)施例所繪示的決定使用者區(qū)塊的示意圖。請(qǐng)參照?qǐng)D4B,第一影像Imgl-2為影像獲取單元120所拍攝的影像,且第一影像Imgl-2包括觀賞者C與觀賞者D。于本范例中,假設(shè)控制條件為將雙手?jǐn)傞_至于臉龐,由于觀賞者D的手勢(shì)G4符合控制條件,因此觀賞者D將被識(shí)別為主控者。另一方面,觀賞者C的手勢(shì)G3并不符合控制條件,因此觀賞者C被識(shí)別為一般的觀賞者。接著,決定模塊同樣可依據(jù)觀賞者D的手勢(shì)G4決定出第一影像Imgl-2中關(guān)聯(lián)于手勢(shì)G4的臉部區(qū)塊F4。
[0060]可以知道的是,由于本范例的控制條件為將雙手?jǐn)傞_至于臉龐,因此決定模塊132可據(jù)以判斷手勢(shì)G4之間的臉部區(qū)塊F4代表主控者的臉部,而非將觀賞者C的臉部區(qū)塊F3識(shí)別為主控者的臉部