專(zhuān)利名稱(chēng):視頻中覆蓋元素的適應(yīng)性放置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電視系統(tǒng)。尤其是,本發(fā)明涉及用于在視頻中適應(yīng)地放置覆蓋元素的方法和設(shè)備。
背景技術(shù):
在電視廣播的產(chǎn)生和顯示過(guò)程中,視頻圖像具有多個(gè)覆蓋在其區(qū)域內(nèi)的元素。這樣的覆蓋元素的一個(gè)典型的例子是一個(gè)封閉字幕窗口,其通常位于圖像的頂端或底端。其它的覆蓋單元可以包括表示所顯示的人物,記分板,新的訂單,標(biāo)識(shí)等的字幕。
圖像中覆蓋元素的精確的位置通常是隨意的,并且通常是觀眾非常期望看到的圖像的阻擋區(qū)域,例如,文本或者人物的臉。這是由于在模擬領(lǐng)域的情況下,沒(méi)有實(shí)用的技術(shù)用于檢測(cè)語(yǔ)義特征并且適應(yīng)性的調(diào)整圖像中覆蓋元素的放置。
因此,在封閉字幕窗口的情況下,在圖像的頂端或者底端的放置目前是以手動(dòng)選擇方法進(jìn)行的。結(jié)果是,尤其在現(xiàn)場(chǎng)直播當(dāng)中,封閉字幕或者其它的覆蓋物或者對(duì)象通常被放置在圖像的期望區(qū)域中,因此產(chǎn)生了同樣的阻礙(阻擋)。
因此,需要用于適應(yīng)性地將覆蓋元素放置在視頻圖像中的方法和設(shè)備,從而使得圖像的期望區(qū)域不被阻礙。
發(fā)明內(nèi)容
根據(jù)本發(fā)明的一個(gè)方面,一種用于在數(shù)字視頻圖像中放置覆蓋元素,從而使圖像的期望觀看區(qū)域不被阻礙的方法,包括從視頻中抽取幀,每一幀都定義了一個(gè)具有一個(gè)或者多個(gè)期望觀看區(qū)域的圖像,該區(qū)域能夠通過(guò)檢測(cè)臉或者文本來(lái)識(shí)別,或者通過(guò)測(cè)量這些幀的不同區(qū)域之間的運(yùn)動(dòng)活性來(lái)識(shí)別。對(duì)于每一幀,區(qū)域是選出來(lái)在圖像中放置覆蓋元素的,而且對(duì)于選出的區(qū)域,確定覆蓋元素覆蓋在期望的觀看區(qū)域的百分比。選出的區(qū)域可以是在多個(gè)預(yù)定位置中的一個(gè)隨意選擇的位置。如果百分比低于所允許的覆蓋百分比的預(yù)定最大值,覆蓋元素就被放置在所選出的區(qū)域。如果不是,圖像中的一個(gè)或者多個(gè)其它的區(qū)域就被選擇并且如上述所述的被估算,直到找到圖像中使期望的觀看圖像的阻礙最小的區(qū)域?yàn)橹?。這些其它的區(qū)域可以是其它的預(yù)定位置或者使用其它的選擇方案所選擇出來(lái)的位置中的一個(gè)。此外,阻礙可以通過(guò)改變覆蓋元素的尺寸,形狀,寬高比等來(lái)最小化,而不用改變其在幀中的位置。還有,阻塞可以通過(guò)改變覆蓋元素的位置,同時(shí)改變其尺寸,形狀,寬高比等來(lái)最小化。
根據(jù)本發(fā)明的另一個(gè)方面,一種用于在數(shù)字視頻圖像中放置覆蓋元素,從而使圖像中的期望觀看區(qū)域不被覆蓋元素所阻礙的設(shè)備,諸如一個(gè)視頻發(fā)射機(jī)或者視頻接收機(jī),包括一個(gè)幀抽取器,用于從視頻中抽取幀,每一幀都定義了一個(gè)具有至少一個(gè)期望觀看區(qū)域的圖像,該區(qū)域能夠通過(guò)檢測(cè)臉或者文本來(lái)識(shí)別,或者通過(guò)測(cè)量這些幀的不同區(qū)域之間的運(yùn)動(dòng)活性來(lái)識(shí)別。一個(gè)圖像處理器,分析圖像幀并且在圖像幀中識(shí)別期望觀看區(qū)域。一個(gè)覆蓋元素定位器,用于將覆蓋元素放置在圖像幀中,放置是以使期望觀看的圖像的阻礙最小的方式進(jìn)行的。
本發(fā)明的優(yōu)點(diǎn),特點(diǎn)和各種附加的特征將在參照附圖對(duì)實(shí)施例的詳盡描述中看得更清楚。
附圖1是一個(gè)表明根據(jù)本發(fā)明的一個(gè)實(shí)施例的覆蓋元素定位設(shè)備的方框圖;附圖2表明根據(jù)本發(fā)明的一個(gè)實(shí)施例所處理的暫時(shí)視頻段的代表幀;以及附圖3是表明根據(jù)本發(fā)明的一個(gè)實(shí)施例的方法的流程圖。
附圖4是表明根據(jù)本發(fā)明的一個(gè)實(shí)施例的視頻接收機(jī)設(shè)備的方框圖;以及附圖5是表明根據(jù)本發(fā)明的一個(gè)實(shí)施例的視頻發(fā)射機(jī)設(shè)備的方框圖。
本發(fā)明的詳細(xì)描述本發(fā)明是一種用于將諸如封閉字幕窗口的覆蓋元素適應(yīng)性地放置在視頻圖像中,從而使得觀眾感興趣的圖像區(qū)域不被覆蓋元素阻礙的方法和設(shè)備。為了描述本發(fā)明的原理,這里所討論的期望的圖像區(qū)域包括人的臉和文本。但是,應(yīng)當(dāng)明白,本發(fā)明對(duì)于視頻圖像中觀眾感興趣的其它圖像區(qū)域同等適用。
除了封閉字幕窗口,覆蓋元素還可以包括屏上命令,頻道識(shí)別信息,或者覆蓋在諸如電視接收機(jī)的顯示設(shè)備所顯示的視頻圖像上的任何其他元素(實(shí)際上通常為正文)。本發(fā)明也可以應(yīng)用到電視廣播系統(tǒng),該系統(tǒng)將諸如顯示的人物,記分板,股票,新的訂單,標(biāo)識(shí)以及在將被廣播的視頻數(shù)據(jù)流中的其它圖像的字幕的元素進(jìn)行覆蓋。
覆蓋元素的適應(yīng)性的放置也可以通過(guò)通常的臉部和文本檢測(cè)技術(shù)來(lái)實(shí)現(xiàn),通常的檢測(cè)技術(shù)是在暫時(shí)視頻段的代表幀中檢測(cè)臉部和文本圖像區(qū)域(或者其它期望的圖像區(qū)域)。覆蓋元素的適應(yīng)性的放置可以通過(guò)使用通常的運(yùn)動(dòng)測(cè)量技術(shù)來(lái)實(shí)現(xiàn),通常的運(yùn)動(dòng)測(cè)量技術(shù)是在暫時(shí)視頻段的代表幀中的不同區(qū)域測(cè)量運(yùn)動(dòng)活性。這樣的技術(shù)在K.Peker和A.Divakaran所著的“視頻段的運(yùn)動(dòng)活性強(qiáng)度的自動(dòng)測(cè)量”,Proc.SPIE有關(guān)多媒體數(shù)據(jù)庫(kù)的存儲(chǔ)和檢索的會(huì)議,SanJose,CA,2001年1月,以及Mohamed AbdelMottaleb等人1998年12月11日提交的序列號(hào)為09/210415的美國(guó)專(zhuān)利申請(qǐng),題目為“用于在數(shù)字圖像中檢測(cè)臉部的方法”,它們的公開(kāi)在此引入作為參考。根據(jù)該基于運(yùn)動(dòng)的技術(shù),具有較小的運(yùn)動(dòng)活性的區(qū)域通常被認(rèn)為比具有較高的運(yùn)動(dòng)活性的區(qū)域更合適用于覆蓋元素。運(yùn)動(dòng)活性能夠在壓縮MPEG域或者在未壓縮的域中計(jì)算。對(duì)于壓縮的視頻,在一個(gè)區(qū)域的運(yùn)動(dòng)活性能夠按照該區(qū)域的運(yùn)動(dòng)補(bǔ)償矢量的幅度的標(biāo)準(zhǔn)偏移來(lái)計(jì)算。對(duì)于未壓縮的視頻,該區(qū)域的運(yùn)動(dòng)活性能夠使用光學(xué)流來(lái)確定。
隨后,利用上述檢測(cè)方法獲得的期望圖像區(qū)域數(shù)據(jù)在本發(fā)明中被使用,用于確定將覆蓋元素放置在幀中的最佳方式,即,將幀的期望圖像區(qū)域的阻礙最小化的放置方式。
現(xiàn)在參照附圖進(jìn)行描述,首先看方框圖1,示出了一個(gè)根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于將視頻中期望圖像區(qū)域被覆蓋元素阻礙最小化的設(shè)備100。設(shè)備100包括一個(gè)幀抽取器101,一個(gè)圖像處理器102以及一個(gè)覆蓋元素窗口定位器103。幀抽取器101從視頻的暫時(shí)視頻段中抽取代表幀。圖像處理器102利用通常的檢測(cè)方法,例如先前描述的臉和/或文本檢測(cè)技術(shù),或基于運(yùn)動(dòng)的檢測(cè)技術(shù),來(lái)分析這些幀并且在這些幀中識(shí)別適于放置覆蓋元素的區(qū)域。覆蓋元素定位器103使用圖像區(qū)域數(shù)據(jù)以使這些幀中的期望圖像區(qū)域的阻礙最小化的方式在這些幀中放置覆蓋元素。圖2是一個(gè)表明一個(gè)覆蓋元素204的六個(gè)典型定位或位置203a-203f的示例幀200,該幀可以包括具有一行或者多行的封閉字幕窗口(圖中示出了一行的封閉字幕窗口)。在上部候選區(qū)域201的箭頭203a-203c表示這些定位中的三個(gè),在下部候選區(qū)域204的箭頭203d-203f表示幀200中的這些定位中的其它三個(gè)。定位203a-203f表示能夠被用來(lái)適應(yīng)性地放置一個(gè)覆蓋元素204從而使幀200中的期望圖像區(qū)域的阻礙最小化的預(yù)定位置。應(yīng)當(dāng)注意幀200中的其它定位也可以用于覆蓋元素204。如圖所示,覆蓋元素204被放置在上部候選區(qū)域201的定位203b。這六個(gè)定位中的最佳的一個(gè)是根據(jù)本發(fā)明的原理,通過(guò)計(jì)算每一個(gè)位置的阻礙比,并根據(jù)它們的阻礙比對(duì)位置進(jìn)行排隊(duì)而選擇的。阻礙比是封閉字幕窗口204覆蓋期望的圖像區(qū)域或者圖像幀的區(qū)域的百分比。具有最不可能的阻礙比,并且能夠避免封閉字幕窗口顯著的突然幀到幀移動(dòng)的位置被選擇用于確定此位置。覆蓋元素的候選位置能夠以另外的一種方式被選擇,而不用使用一組預(yù)定的位置。例如,在本發(fā)明的另一個(gè)實(shí)施例中,候選位置可以這樣來(lái)定位,就是從圖像的第一個(gè)位置開(kāi)始并且將覆蓋元素的位置移動(dòng)一定的數(shù)量,直到找到使該幀中的期望圖像區(qū)域的阻礙最小化的位置。應(yīng)當(dāng)注意,候選覆蓋元素位置能夠在圖像中的任何地方確定。例如,覆蓋元素位置可以定位在圖像的兩側(cè),或者在圖像中正在說(shuō)話(huà)的人的下面。
在本發(fā)明的另一個(gè)實(shí)施例中,阻礙可以通過(guò)改變覆蓋元素的尺寸,形狀,寬高比等來(lái)實(shí)現(xiàn)最小化,而不需要改變其在幀中的位置。在本發(fā)明又一個(gè)實(shí)施例中,阻礙可以通過(guò)改變覆蓋元素的位置,同時(shí)改變其尺寸,形狀,寬高比等來(lái)實(shí)現(xiàn)最小化。
上面描述的方法是在視頻的每一個(gè)暫時(shí)視頻段的代表幀上執(zhí)行的。在每一個(gè)上部或者下部候選區(qū)域內(nèi)的幀到幀位置的改變可以使用任何合適的緩沖技術(shù)來(lái)逐步地實(shí)現(xiàn),所述的緩沖技術(shù)能夠平滑位置改變并且使他們變得流暢和連續(xù),這樣覆蓋元素就不會(huì)呈現(xiàn)不期望的跳動(dòng)或者在圖像的位置之間的突然移動(dòng)。一種典型的能夠被用來(lái)平滑位置,尺寸,形狀和/或?qū)捀弑雀淖兊木彌_技術(shù)包括在一段時(shí)間內(nèi)在兩個(gè)位置,尺寸,形狀和/或?qū)捀弑戎g的內(nèi)插。
圖3是一個(gè)表明本發(fā)明中的方法的流程圖,其可以由圖1所示的設(shè)備來(lái)執(zhí)行。在步驟300中,感興趣的視頻(關(guān)鍵幀)的一個(gè)暫時(shí)視頻段的代表幀被抽取。期望區(qū)域的檢測(cè)在步驟301中執(zhí)行,以獲得關(guān)于包含有期望的觀看區(qū)域的圖像中的定位的數(shù)據(jù),從而能夠識(shí)別這些幀中合適放置覆蓋元素的區(qū)域。在臉和/或文本檢測(cè)的情況下,如果數(shù)字視頻流已經(jīng)根據(jù)MPEG-4或MPEG-7處理,臉和/或文本數(shù)據(jù)或許已經(jīng)存在,步驟301就可被省略。
在步驟302中,一幀中用于覆蓋元素的第一區(qū)域被選擇出來(lái)用于在位置,尺寸,形狀,寬高比等方面的估算。在步驟303中,關(guān)于期望圖像區(qū)域的定位的數(shù)據(jù)被用于判斷第一區(qū)域的阻礙比。包括多于一種類(lèi)型的例如臉和文本,或高運(yùn)動(dòng)活性的期望圖像特征的圖像區(qū)域的阻礙比,能夠通過(guò)使用下面的公式計(jì)算組合阻礙比來(lái)確定組合阻礙比=C1*特征1_阻礙+C2*特征2_阻礙+C3*特征3_運(yùn)動(dòng)活性級(jí)這里C1是關(guān)于圖像的特征1(臉)區(qū)域的重要性的系數(shù)或加權(quán)因子;特征1_阻礙是特征1區(qū)域被覆蓋元素的當(dāng)前位置覆蓋的百分比;C2是關(guān)于圖像的特征2(文本)區(qū)域的重要性的系數(shù)或加權(quán)因子;特征2_阻礙是特征2區(qū)域被覆蓋元素的當(dāng)前位置覆蓋的百分比;以及C3是關(guān)于圖像的特征3(高運(yùn)動(dòng)活性)區(qū)域的重要性的系數(shù)或加權(quán)因子。
系數(shù)C1,C2和C3的使用提供了將重要性分配到特征1(臉),特征2(文本)和特征3(運(yùn)動(dòng)活性)的阻礙數(shù)據(jù)的靈活性。如果期望的圖像區(qū)域僅是臉或者文本,只需要計(jì)算覆蓋元素覆蓋幀中的臉或文本圖像的百分比。在步驟304中,需要判斷第一個(gè)覆蓋元素區(qū)域的阻礙比是否大于一個(gè)可接受的預(yù)定的門(mén)限阻礙比。如果大于,那么在步驟305中,覆蓋元素的區(qū)域移動(dòng)到一個(gè)新的區(qū)域,然后對(duì)于新的區(qū)域執(zhí)行步驟303和304。到新區(qū)域的移動(dòng)可以通過(guò)使用圖2所示的預(yù)定的列表來(lái)實(shí)現(xiàn),或者對(duì)當(dāng)前的區(qū)域進(jìn)行平移,按比例縮放或者旋轉(zhuǎn)。這一過(guò)程一直持續(xù)到該幀中的期望圖像區(qū)域的阻礙最小化的區(qū)域被找到。可以進(jìn)行區(qū)域變化,這樣可能避免刺激觀眾的幀到幀激變,如上所述。
一旦覆蓋元素已經(jīng)被合適的放置在一幀中,在步驟306中,就選擇一個(gè)接下來(lái)的代表幀用來(lái)處理。在步驟307中,判斷下一幀是否是用于放置覆蓋元素的視頻中的最后一幀。如果是,在步驟308中,方法結(jié)束。如果不是,在步驟309中,在下一幀中選擇第一區(qū)域,并且步驟303,304等執(zhí)行。
本發(fā)明的原理可以在任何類(lèi)型的視頻接收設(shè)備中執(zhí)行,例如電視接收機(jī),電視機(jī)頂盒,卡式錄像機(jī)。本發(fā)明的原理也可以在視頻發(fā)射設(shè)備中執(zhí)行,例如在電視廣播中使用的設(shè)備。本發(fā)明可以通過(guò)軟件或者軟件和硬件共同來(lái)完成。
圖4表明了根據(jù)本發(fā)明的原理制成的視頻接收設(shè)備,諸如電視接收機(jī)或機(jī)頂盒。接收機(jī)設(shè)備410用于接收發(fā)送的視頻信號(hào),例如電視廣播信號(hào),其中至少一個(gè)信號(hào)包括一個(gè)視頻和一個(gè)或者多個(gè)覆蓋元素,其是諸如電視廣播發(fā)射器的傳統(tǒng)的視頻發(fā)射器400所發(fā)射的信號(hào)。接收機(jī)設(shè)備可以包括任何合適的信號(hào)接收裝置406,例如一個(gè)天線(xiàn),用于接收視頻信號(hào)。一個(gè)包括有一個(gè)可調(diào)諧接收系統(tǒng),例如一個(gè)電視接收機(jī)的信號(hào)隔離器401,用于將一個(gè)視頻信號(hào)從發(fā)射的其它視頻信號(hào)中隔開(kāi)。一個(gè)幀抽取器402,用于從隔離信號(hào)的視頻部分的暫時(shí)視頻段中抽取代表幀。一個(gè)圖像處理器403,利用傳統(tǒng)的檢測(cè)技術(shù),例如先前描述的臉和/或文本檢測(cè)技術(shù)或基于運(yùn)動(dòng)的檢測(cè)技術(shù),分析這些幀并且在這些幀中識(shí)別合適的區(qū)域用于放置覆蓋信息元素。一個(gè)覆蓋元素定位器404,利用圖像區(qū)域數(shù)據(jù)以使這些幀中期望的圖像區(qū)域的阻礙最小化的方式在這些幀中放置覆蓋元素。一個(gè)顯示設(shè)備405,用于顯示具有覆蓋元素的幀。顯示設(shè)備405可以是一臺(tái)電視機(jī),一個(gè)計(jì)算機(jī)顯示器,一個(gè)液晶顯示器等的顯示屏。
圖5表明了根據(jù)本發(fā)明的原理制成的典型的發(fā)射機(jī)設(shè)備500,諸如一個(gè)電視廣播發(fā)射機(jī)。發(fā)射機(jī)設(shè)備500用于發(fā)射一個(gè)視頻信號(hào),該視頻信號(hào)包括具有選擇放置其中的一個(gè)或者多個(gè)覆蓋元素的視頻圖像,覆蓋元素的選擇使圖像的期望觀看區(qū)域不會(huì)被一個(gè)或者多個(gè)覆蓋元素所阻礙。發(fā)射設(shè)備500包括一個(gè)視頻產(chǎn)生器501,用于產(chǎn)生包括視頻圖像的視頻。一個(gè)幀抽取器502,用于從視頻產(chǎn)生器501所產(chǎn)生的視頻的暫時(shí)視頻段中抽取代表幀。一個(gè)圖像處理器503,利用傳統(tǒng)的檢測(cè)技術(shù),例如先前描述的臉和/或文本檢測(cè)技術(shù)或基于運(yùn)動(dòng)的檢測(cè)技術(shù),分析這些幀并且在這些幀中識(shí)別合適的區(qū)域用于放置覆蓋信息元素。一個(gè)覆蓋元素產(chǎn)生器505,用于產(chǎn)生一個(gè)或者多個(gè)選擇性地放置在視頻圖像中的覆蓋元素。一個(gè)覆蓋元素定位器504,利用圖像區(qū)域數(shù)據(jù)確定在這些幀中放置覆蓋元素的位置,這種選擇放置是以使這些幀中期望圖像區(qū)域的阻礙最小化的方式進(jìn)行的。有一個(gè)傳統(tǒng)的信號(hào)發(fā)射器506耦合到一個(gè)傳統(tǒng)的發(fā)射裝置507上,例如一個(gè)天線(xiàn),有線(xiàn)分配網(wǎng)絡(luò),或者一個(gè)衛(wèi)星網(wǎng)絡(luò),用于向一個(gè)或者多個(gè)遠(yuǎn)程電視接收設(shè)備508,發(fā)射具有放置在其圖像中的覆蓋元素的視頻的一個(gè)視頻信號(hào)。覆蓋元素定位器504確定放置的位置并且將該信息與實(shí)際的圖像數(shù)據(jù)一同發(fā)射。
上面的發(fā)明是參照以上的實(shí)施例進(jìn)行描述的,可以做出各種不背離本發(fā)明的精神的不同的修改和變形。因此,這樣的修改和變形也認(rèn)為是落在本發(fā)明所附的權(quán)利要求的范圍之內(nèi)。
本發(fā)明可以總結(jié)為如下的內(nèi)容。
一種在數(shù)字視頻圖像中放置覆蓋元素從而使得圖像的期望觀看區(qū)域不被覆蓋元素所阻礙的方法,該方法包括從視頻中抽取幀,每一幀都定義了一個(gè)具有一個(gè)或者多個(gè)期望觀看區(qū)域的圖像。對(duì)于每一幀,可以在圖像中選擇區(qū)域用于放置覆蓋元素,并且對(duì)所選擇的區(qū)域確定覆蓋元素覆蓋期望觀看區(qū)域的百分比。如果百分比低于所允許的覆蓋百分比的預(yù)定最大值,覆蓋元素就放置在所選擇的區(qū)域。如果不是,就選擇圖像中的一個(gè)或者多個(gè)其它的區(qū)域,和/或改變覆蓋元素的尺寸,形狀,寬高比,直到找到圖像中使期望的觀看圖像的阻礙最小的位置和/或尺寸,形狀,寬高比為止。還有,一種諸如視頻接收機(jī)或視頻發(fā)射機(jī)的用于在數(shù)字視頻的圖像中放置覆蓋元素,從而使得圖像的期望觀看區(qū)域不被覆蓋元素所阻礙的設(shè)備。在這樣的設(shè)備中,一個(gè)幀抽取器從視頻中抽取幀,每一幀都表示定義了具有至少一個(gè)期望觀看區(qū)域的圖像。一個(gè)圖像處理器,分析這些圖像幀,并在這些圖像幀中識(shí)別期望的觀看區(qū)域。一個(gè)覆蓋元素定位器,以使期望觀看區(qū)域的阻礙最小化的方式將覆蓋元素放置在這些圖像幀中。
權(quán)利要求
1.一種用于在數(shù)字視頻圖像中放置覆蓋元素,從而使圖像的期望觀看區(qū)域不被覆蓋元素所阻礙的方法,該方法包括步驟a)從視頻中抽取(300)幀,幀定義了具有至少一個(gè)期望觀看區(qū)域的圖像;b)在圖像中選擇(302)區(qū)域,用來(lái)放置覆蓋元素;c)對(duì)于所選擇的區(qū)域,確定(303)覆蓋元素覆蓋至少一個(gè)期望觀看區(qū)域的百分比;d)如果百分比高于所允許的覆蓋百分比的預(yù)定最大值,在圖像中選擇另一個(gè)區(qū)域(305),用于放置覆蓋元素,并且繼續(xù)步驟c)。
2.如權(quán)利要求1所述的方法,進(jìn)一步包括步驟如果百分比低于所允許的覆蓋百分比的預(yù)定最大值,就將覆蓋元素放置在所選擇的區(qū)域。
3.如權(quán)利要求2所述的方法,進(jìn)一步包括步驟從定義了具有至少一個(gè)期望觀看區(qū)域的圖像的視頻中抽取另一幀(306),然后繼續(xù)步驟b)。
4.如權(quán)利要求1所述的方法,其中至少一個(gè)期望觀看區(qū)域包括臉部區(qū)域。
5.如權(quán)利要求1所述的方法,其中至少一個(gè)期望觀看區(qū)域包括文本區(qū)域。
6.如權(quán)利要求1所述的方法,其中至少一個(gè)期望觀看區(qū)域包括高運(yùn)動(dòng)活性區(qū)域。
7.如權(quán)利要求1所述的方法,其中覆蓋元素選自封閉字幕,屏上命令,頻道識(shí)別信息,用于顯示的人物,記分板,股票,新的訂單,標(biāo)識(shí)和其它不在原始視頻中的圖像的字幕。
8.如權(quán)利要求1所述的方法,其中在步驟b)和c)之間進(jìn)一步包括步驟獲得關(guān)于圖像幀中的至少一個(gè)期望觀看區(qū)域的定位數(shù)據(jù),并在步驟c)中應(yīng)用該數(shù)據(jù)確定覆蓋元素覆蓋至少一個(gè)期望觀看區(qū)域的百分比。
9.一種用于在數(shù)字視頻圖像中放置覆蓋元素從而使得圖像的期望觀看區(qū)域不被覆蓋元素所阻礙的設(shè)備,該設(shè)備包括幀抽取器(101),用于從視頻中抽取幀,每一幀都定義了具有至少一個(gè)期望觀看區(qū)域的圖像;圖像處理器(102),用于分析這些幀中的圖像,從而在這些幀中識(shí)別期望的觀看區(qū)域;以及覆蓋元素定位器(103),用于以使期望觀看區(qū)域的阻礙最小化的方式在圖像幀中放置覆蓋元素。
10.如權(quán)利要求9所述的設(shè)備,其中至少一個(gè)期望觀看區(qū)域包括臉部區(qū)域。
11.如權(quán)利要求9所述的設(shè)備,其中至少一個(gè)期望觀看區(qū)域包括文本區(qū)域。
12.如權(quán)利要求9所述的設(shè)備,其中至少一個(gè)期望觀看區(qū)域包括高運(yùn)動(dòng)活性區(qū)域。
13.如權(quán)利要求9所述的設(shè)備,其中圖像處理器測(cè)量該幀中的不同區(qū)域的運(yùn)動(dòng)活性。
14.如權(quán)利要求9所述的設(shè)備,其中覆蓋元素選自封閉字幕,屏上命令,頻道識(shí)別信息,用于顯示的人物,記分板,股票,新的訂單,標(biāo)識(shí)和其它不在原始視頻中的圖像的字幕。
15.如權(quán)利要求9所述的設(shè)備,其中定位器(103)包括區(qū)域選擇器,用于在這些幀中的每一幀圖像中選擇區(qū)域用于放置覆蓋元素,以及一個(gè)阻礙計(jì)算器,用于對(duì)于所選擇的區(qū)域計(jì)算覆蓋元素覆蓋至少一個(gè)期望觀看區(qū)域的百分比,如果百分比低于所允許的覆蓋百分比的預(yù)定最大值,定位器就將覆蓋元素放置在所選擇的圖像區(qū)域,如果百分比高于所允許的覆蓋百分比的預(yù)定最大值,定位器就在圖像中選擇另一個(gè)區(qū)域,用于放置覆蓋元素。
16.如權(quán)利要求15所述的設(shè)備,其中阻礙計(jì)算器對(duì)于所選擇的區(qū)域利用下面的公式確定覆蓋元素覆蓋至少一個(gè)期望觀看區(qū)域的百分比組合阻礙比=C1*特征1_阻礙+C2*特征2_阻礙+C3*特征3_運(yùn)動(dòng)活性級(jí)這里C1是關(guān)于圖像的特征1(臉)區(qū)域的重要性的系數(shù)或加權(quán)因子;特征1_阻礙是特征1區(qū)域被覆蓋元素的當(dāng)前位置覆蓋的百分比;C2是關(guān)于圖像的特征2(文本)區(qū)域的重要性的系數(shù)或加權(quán)因子;特征2_阻礙是特征2區(qū)域被覆蓋元素的當(dāng)前位置覆蓋的百分比;以及C3是關(guān)于圖像的特征3(高運(yùn)動(dòng)活性)區(qū)域的重要性的系數(shù)或加權(quán)因子。
17.一種用于在數(shù)字視頻圖像中放置覆蓋元素,從而使得圖像的期望觀看區(qū)域不被覆蓋元素所阻礙的方法,該方法包括步驟a)從視頻中抽取(300)幀,幀定義了具有至少一個(gè)期望觀看區(qū)域的圖像;b)在圖像中選擇(302)區(qū)域,用于覆蓋元素以及覆蓋元素的尺寸,形狀和寬高比中的至少一個(gè);c)對(duì)于所選擇的覆蓋元素的區(qū)域和覆蓋元素的尺寸,形狀和寬高比中的至少一個(gè),確定(303)覆蓋元素覆蓋至少一個(gè)期望觀看區(qū)域的百分比;d)如果百分比高于所允許的覆蓋百分比的預(yù)定最大值,改變圖像中的區(qū)域,覆蓋元素的尺寸,覆蓋元素的形狀以及覆蓋元素的寬高比中的至少一個(gè);以及e)對(duì)于至少一種改變,確定覆蓋元素覆蓋至少一個(gè)期望觀看區(qū)域的百分比。
18.一種用于在數(shù)字視頻圖像中放置覆蓋元素從而使得圖像的期望觀看區(qū)域不被覆蓋元素所阻礙的發(fā)射機(jī)設(shè)備(500),該發(fā)射機(jī)設(shè)備(500)包括視頻產(chǎn)生器(501),用于產(chǎn)生數(shù)字視頻;幀抽取器(502),用于從視頻中抽取幀,每一幀都定義了具有至少一個(gè)期望觀看區(qū)域的圖像;圖像處理器(503),用于分析這些圖像幀,并在這些圖像幀中識(shí)別期望觀看區(qū)域;覆蓋元素產(chǎn)生器(505),用于產(chǎn)生覆蓋元素;覆蓋元素定位器(504),用于以使期望圖像區(qū)域的阻礙最小化的方式,確定在圖像幀中放置覆蓋元素的位置;以及發(fā)射器(506),用于發(fā)射具有覆蓋元素定位信息的視頻的視頻信號(hào)。
19.如權(quán)利要求18所述的發(fā)射機(jī)設(shè)備(500),其中至少一個(gè)期望觀看區(qū)域包括臉部區(qū)域。
20.如權(quán)利要求18所述的發(fā)射機(jī)設(shè)備(500),其中至少一個(gè)期望觀看區(qū)域包括文本區(qū)域。
21.如權(quán)利要求18所述的發(fā)射機(jī)設(shè)備(500),其中至少一個(gè)期望觀看區(qū)域包括高運(yùn)動(dòng)活性區(qū)域。
22.如權(quán)利要求18所述的發(fā)射機(jī)設(shè)備(500),其中圖像處理器測(cè)量該幀中的不同區(qū)域的運(yùn)動(dòng)活性。
全文摘要
一種用于在數(shù)字視頻圖像中放置覆蓋元素,從而使圖像的期望觀看區(qū)域不被覆蓋元素所阻礙的方法,該方法包括從視頻中抽取幀,每一幀都定義了具有一個(gè)或者多個(gè)期望觀看區(qū)域的圖像。對(duì)于每一幀,在圖像中選擇區(qū)域用于放置覆蓋元素,并且為所選擇的區(qū)域確定覆蓋元素覆蓋在期望的觀看區(qū)域的百分比。如果百分比低于所允許的覆蓋百分比的預(yù)定最大值,覆蓋元素就放置在所選擇的區(qū)域。如果不是,就選擇圖像中的一個(gè)或者多個(gè)其它的區(qū)域,和/或改變覆蓋元素的尺寸,形狀,寬高比,直到找到在圖像中使期望的觀看區(qū)域的阻礙最小的位置和/或尺寸,形狀,寬高比為止。還有,一種諸如視頻接收機(jī)或視頻發(fā)射機(jī)的用于在數(shù)字視頻的圖像中放置覆蓋元素,從而使得圖像的期望觀看區(qū)域不被覆蓋元素所阻礙的設(shè)備。在這樣的設(shè)備中,幀抽取器從視頻中抽取幀,每一幀都定義了具有至少一個(gè)期望觀看區(qū)域的圖像。圖像處理器,分析這些圖像幀,并在這些圖像幀中識(shí)別期望的觀看區(qū)域。覆蓋元素定位器,以使期望觀看圖像的阻礙最小化的方式將覆蓋元素放置在這些圖像幀中。
文檔編號(hào)H04N5/445GK1545811SQ02812711
公開(kāi)日2004年11月10日 申請(qǐng)日期2002年6月20日 優(yōu)先權(quán)日2001年6月25日
發(fā)明者S·達(dá)格塔斯, S 達(dá)格塔斯, M·阿夫德?tīng)枴つ胁? 虻露 つ 脅 申請(qǐng)人:皇家菲利浦電子有限公司