活動(dòng)圖像數(shù)據(jù)的編碼方法、解碼方法及實(shí)施這些方法的終端裝置、以及雙向?qū)υ捫拖到y(tǒng)的制作方法

文檔序號(hào)：7633686閱讀：116來源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>電子通信裝置的制造及其應(yīng)用技術(shù)

專利名稱：活動(dòng)圖像數(shù)據(jù)的編碼方法、解碼方法及實(shí)施這些方法的終端裝置、以及雙向?qū)υ捫拖到y(tǒng)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及適用于由接在網(wǎng)絡(luò)上的多個(gè)終端裝置所構(gòu)成的雙向?qū)υ捫拖到y(tǒng)特有的對(duì)話環(huán)境的圖像處理技術(shù)，特別是關(guān)于在該終端裝置間發(fā)送接收的活動(dòng)圖像數(shù)據(jù)的編碼、解碼方法等。
背景技術(shù)：
近年，有提出在遠(yuǎn)隔兩地的對(duì)話者之間，實(shí)現(xiàn)使對(duì)方對(duì)話者的圖像互相成視線一致的狀態(tài)下，一邊顯示在監(jiān)視器上，一邊進(jìn)行電視會(huì)議(televisionsession)，或咨詢輔導(dǎo)(counseling)等的親密的對(duì)話的雙向?qū)υ捫拖到y(tǒng)。此視線一致的技術(shù)有各種不同的提案，通過將CCD攝像機(jī)那樣的攝像裝置配置在顯示對(duì)方對(duì)話者的圖像的監(jiān)視器的規(guī)定位置上而達(dá)成視線一致(參照專利文獻(xiàn)1)。
專利文獻(xiàn)1日本專利第3074677號(hào)公報(bào)非專利文獻(xiàn)1日本昭和42年電氣通信學(xué)會(huì)聯(lián)合大會(huì)(NO.1998)。

發(fā)明內(nèi)容
(發(fā)明欲解決的課題)發(fā)明者等針對(duì)上述那樣的雙向?qū)υ捫拖到y(tǒng)檢討的結(jié)果，發(fā)現(xiàn)下述那樣的課題。即，經(jīng)由規(guī)定的傳送裝置相互發(fā)送對(duì)話者的活動(dòng)圖像數(shù)據(jù)的情況下，目前的通信環(huán)境在線路的發(fā)送容量和圖像修理能力上有其界限，一般是進(jìn)行數(shù)據(jù)壓縮。作為這種活動(dòng)圖像的壓縮方式，MPEG方式被廣泛地利用在電影分配服務(wù)等。不過，此MPEG方式因在時(shí)間軸方向也進(jìn)行壓縮，故在實(shí)時(shí)(realtime)性的雙向?qū)υ捝蠠o法避免顯示延遲，進(jìn)而產(chǎn)生無法達(dá)成在相隔兩地間順暢對(duì)話的雙向?qū)υ挼恼n題。
另外，發(fā)明者等依據(jù)在上述雙向?qū)υ捫拖到y(tǒng)那樣的視線一致的狀態(tài)下的對(duì)話的心理上的考察，發(fā)現(xiàn)對(duì)話時(shí)對(duì)話者因要觀察對(duì)方對(duì)話者的表情，視線大多集中在該對(duì)方對(duì)話者的臉，非語言(non-verbal)表現(xiàn)的手勢(shì)。這種情況下，不必逐次發(fā)送包含對(duì)話時(shí)的對(duì)話者圖像的整個(gè)畫面，若只著重于對(duì)話時(shí)的重要觀察區(qū)域，也即對(duì)話者的臉部，和手勢(shì)等屬于該對(duì)話者的興趣區(qū)域(ROIRegion of Interest)而發(fā)送活動(dòng)圖像的話則能減少發(fā)送量，另外，對(duì)實(shí)現(xiàn)雙向?qū)υ挼母咚夙憫?yīng)性也甚具效果。
這樣，作為僅重視興趣區(qū)域的圖像處理，已知有例如JPEG2000 Part-1方式的ROI編碼。此ROI編碼是一種將興趣區(qū)域的畫質(zhì)提高到比非興趣區(qū)域的畫質(zhì)好的圖像處理技術(shù)。這里，一般JPEG2000方式大家所知者為靜止圖像的壓縮方式，對(duì)圖像數(shù)據(jù)進(jìn)行相當(dāng)于離散小波變換，非向量的量子化(scalar quantization)，熵編碼(entropy encoding)以及發(fā)送率控制的處理(EBCOTEmbedded Block Coding With Optimized Truncation最佳化截?cái)嗟穆裰脭?shù)據(jù)區(qū)塊編碼)以進(jìn)行圖像壓縮。ROI編碼是將設(shè)定在靜止圖像內(nèi)的興趣區(qū)域上小波系數(shù)設(shè)定得比非興趣區(qū)域上小波系數(shù)高，由此使興趣區(qū)域的畫質(zhì)比非興趣區(qū)域的畫質(zhì)高。
不過，JPEG2000 Part-1方式的ROI編碼因在興趣區(qū)域和非興趣區(qū)域上壓縮級(jí)別(level)雖有差別，但合計(jì)碼量不變的緣故，無法減輕編碼處理自身，另外，也無法減少獲得的編碼數(shù)據(jù)的發(fā)送量。再者，ROI編碼雖通過調(diào)節(jié)小波系數(shù)而執(zhí)行，但此小波系數(shù)因?yàn)槭褂枚鄠€(gè)空間像素(spatial pixel)計(jì)算，故解碼后的靜止圖像上興趣區(qū)域和非興趣區(qū)域的境界變成模糊不清，導(dǎo)致有無法執(zhí)行只將興趣區(qū)域置入別的圖像等的圖像處理的課題。
本發(fā)明是為了解決上述課題而創(chuàng)作出者，其目的是提供一種適用于通過連接于網(wǎng)絡(luò)上的多個(gè)終端裝置所構(gòu)成的雙向?qū)υ捫拖到y(tǒng)的圖像處理技術(shù)，其為包括用于有效地減輕各終端裝置上的處理負(fù)載的同時(shí)還實(shí)現(xiàn)該處理的高速化的結(jié)構(gòu)的活動(dòng)圖像數(shù)據(jù)的編碼方法，解碼方法，執(zhí)行它們的計(jì)算機(jī)程序，記錄該計(jì)算機(jī)程序的記錄媒體，實(shí)施上述的終端裝置及含有該終端裝置的雙向?qū)υ捫拖到y(tǒng)。
(解決課題的方法)本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼方法為將構(gòu)成活動(dòng)圖像數(shù)據(jù)的圖像幀分別沿著時(shí)間軸順序地壓縮的圖像處理技術(shù)，如上述的雙向?qū)υ捫拖到y(tǒng)那樣，于僅在應(yīng)顯示的畫面幀內(nèi)的一部分區(qū)域上含有有意義的信息的動(dòng)作環(huán)境下能有效地利用資源，同時(shí)能進(jìn)行實(shí)時(shí)的數(shù)據(jù)發(fā)送接收的圖像處理技術(shù)。另外，構(gòu)成活動(dòng)圖像數(shù)據(jù)的圖像幀分別與靜止圖像等效。另外，人物像等的圖像，能將背景視為靜止圖像。因此，本發(fā)明對(duì)于通過power point(微軟公司的注冊(cè)商標(biāo))，表計(jì)算軟件(例如“Excel”等)，文字處理軟件(例如”Word”等)，瀏覽器(Browser)等的應(yīng)用軟件產(chǎn)生的資料數(shù)據(jù)(文本數(shù)據(jù)(text)，相片，圖像等)的發(fā)送也是有效。也即這樣的應(yīng)用程序產(chǎn)生的顯示數(shù)據(jù)，隨著時(shí)間的經(jīng)過頻繁地產(chǎn)生部分的變化(例如，游標(biāo)(cursor)的移動(dòng)，和字符的追加顯示等)，因此通過將每一定時(shí)間的顯示數(shù)據(jù)作為一個(gè)圖像幀，整體上能當(dāng)作活動(dòng)圖像數(shù)據(jù)處理?；诖它c(diǎn)，本說明書里，在活動(dòng)圖像數(shù)據(jù)上，除了通過攝像裝置等攝取的圖像數(shù)據(jù)外還含有通過上述應(yīng)用軟件等產(chǎn)生的顯示數(shù)據(jù)，靜止圖像和活動(dòng)圖像的組合等。再者，上述應(yīng)用軟件等所產(chǎn)生的數(shù)據(jù)檔一旦轉(zhuǎn)換為圖像數(shù)據(jù)后即被施予壓縮等的處理。
具體說，本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼方法的特征是在圖像壓縮前將構(gòu)成活動(dòng)圖像數(shù)據(jù)的圖像幀中應(yīng)編碼的圖像幀分割成多個(gè)區(qū)域，將該多個(gè)分割區(qū)域分別對(duì)應(yīng)于在圖像幀內(nèi)設(shè)定的興趣區(qū)域及與該興趣區(qū)域不同的非興趣區(qū)域的任一個(gè)。而該活動(dòng)圖像數(shù)據(jù)的編碼方法是使多個(gè)分割區(qū)域中對(duì)應(yīng)興趣區(qū)域(以下，稱ROI)的分割區(qū)域的碼量比對(duì)應(yīng)于非興趣區(qū)域(以下稱非ROI)的分割區(qū)域的碼量多那樣壓縮該多個(gè)分割區(qū)域的各個(gè)區(qū)域，由此產(chǎn)生各個(gè)圖像幀的編碼數(shù)據(jù)。再者，圖像幀的分割區(qū)域的形狀，不限定于正方形，長(zhǎng)方形等的矩形形狀，也可以是為，例如，三角形，菱形，梯形，平行四邊形等種種的多邊形狀。另外，這些分割區(qū)域也可以是由多個(gè)種類的多邊形的組合，和含有構(gòu)成圓形或橢圓形狀等的一部分的曲線等各種不同形狀所構(gòu)成。但是，下文的說明，為了簡(jiǎn)單起見，這些分割區(qū)域用矩形區(qū)域表示。
如上述那樣，本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼方法因?yàn)檠刂鴷r(shí)間軸個(gè)別壓縮構(gòu)成活動(dòng)圖像數(shù)據(jù)的圖像幀，故與在時(shí)間軸方向同時(shí)進(jìn)行壓縮的MPEG方式不同，高速響應(yīng)性出色。另外，該活動(dòng)圖像數(shù)據(jù)的編碼方法因?yàn)閭€(gè)別地壓縮構(gòu)成活動(dòng)圖像數(shù)據(jù)的圖像幀，故能利用例如，屬于靜止圖像壓縮方式的JPEG2000(以下稱JP2)。有關(guān)此JP2，以往已有提出多個(gè)方式，本發(fā)明對(duì)任何方式皆能適用，作為一例，上述的Part-I方式等為即使不經(jīng)許可也能廣泛利用的技術(shù)。例如，將一個(gè)圖像幀分割成多個(gè)矩形區(qū)域的技術(shù)通過利用JP2的馬賽克化(tiling)技術(shù)能容易地實(shí)現(xiàn)。這里，所謂JP2的馬賽克化是指將處理單位變小，由此能進(jìn)行大規(guī)模圖像的編碼和并行處理的技術(shù)，將一個(gè)圖像幀分割成幾個(gè)馬賽克(相當(dāng)于上述的矩形區(qū)域)，能個(gè)別處理被分割的這些馬賽克(tile)。
因此，若將被分割的多個(gè)矩形區(qū)域分別對(duì)應(yīng)于ROI及非ROI的任何一個(gè)，依這些對(duì)應(yīng)關(guān)系調(diào)節(jié)每個(gè)矩形區(qū)域的壓縮級(jí)別，利用既存的JP2技術(shù)，能實(shí)現(xiàn)達(dá)到與以往的ROI編碼同等的效果的該活動(dòng)圖像數(shù)據(jù)的編碼方法。另外，該活動(dòng)圖像數(shù)據(jù)的編碼方法因?yàn)橐烂總€(gè)分割的矩形區(qū)域進(jìn)行壓縮級(jí)別不同的編碼，故不會(huì)像以往的ROI編碼那樣ROI和非ROI的境界模糊不清。
再者，上述ROI的設(shè)定可由使用者自行事先設(shè)定或者在進(jìn)行通信當(dāng)中變更設(shè)定，另外，也可在多個(gè)分割區(qū)域中自動(dòng)地將被檢測(cè)出區(qū)域內(nèi)圖像有移動(dòng)的分割區(qū)域?qū)?yīng)于ROI。
本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼方法，也可將多個(gè)矩形區(qū)域?qū)?yīng)于上述的ROI上，這種情況下，優(yōu)選將各個(gè)矩形區(qū)域壓縮成具有不同的碼量。這是依上述的發(fā)明者的知識(shí)而進(jìn)行的，是從在雙向?qū)υ捫拖到y(tǒng)那樣視線一致的狀態(tài)下的對(duì)話時(shí)的心理上的考察發(fā)現(xiàn)的事實(shí)，也即對(duì)話時(shí)的對(duì)話者為了觀察對(duì)話的對(duì)方的表情，視線大多集中在對(duì)話的對(duì)方的臉和非語言(non-verbal)表現(xiàn)的手勢(shì)。即，若高速地(例如，30幀/秒(fps)，延遲200m sec以下)顯示對(duì)話對(duì)方的表情，頭的移動(dòng)，手勢(shì)，上半身的移動(dòng)等，則不需發(fā)送背影和衣服的詳細(xì)模樣等的信息。但是，對(duì)話對(duì)方的表情除了要求最細(xì)微且高速地顯示視線、眼睛、眉間的微妙的變化等外，非語言表現(xiàn)的手勢(shì)，如手的移動(dòng)、輪廓的高速響應(yīng)移動(dòng)顯示是重要的。這時(shí)手本身的畫質(zhì)縱然降低但對(duì)對(duì)話的本質(zhì)的影響僅止于輕度。因此，考慮上述雙向?qū)υ捫拖到y(tǒng)特有的對(duì)話環(huán)境，上述ROI更優(yōu)選是分成包含對(duì)話時(shí)高精細(xì)高速響應(yīng)的臉部，頭部的高精細(xì)且高速顯示區(qū)域和包含手，手腕，胸部等的中等精細(xì)且高速顯示區(qū)域，這種情況下，包含背景等的低精細(xì)且低速顯示區(qū)域配屬在非ROI。這樣考慮對(duì)對(duì)話的影響度，在圖像幀內(nèi)分類成壓縮級(jí)別分段改變的多個(gè)種類的區(qū)域，對(duì)在減輕圖像處理負(fù)載的狀態(tài)下實(shí)現(xiàn)順暢的雙向?qū)υ捝细行А?br> 若考慮對(duì)圖像幀內(nèi)的各個(gè)區(qū)域的對(duì)話的影響度時(shí)，在上述多個(gè)矩形區(qū)域之中對(duì)對(duì)應(yīng)非ROI的矩形區(qū)域的編碼處理上，也可將該矩形區(qū)域的碼量在一定期間中設(shè)定為0(使非ROI不編碼)。也即，被包含于屬于非ROI的低精細(xì)且低速顯示區(qū)域內(nèi)的背景等不如將靜止圖像高精細(xì)地粘貼顯示來得有效之故。例如，在家里進(jìn)行遠(yuǎn)距離對(duì)話時(shí)對(duì)家中作最小限度的攝像即能應(yīng)付。將來也能想象僅提取人物，背景則是全部貼上從數(shù)據(jù)庫(data base)選出的圖像(矩形區(qū)域)，現(xiàn)實(shí)上，背景等的非ROI僅是一定時(shí)間才編碼，縱使僅將人物的臉部等的ROI編碼，但在該活動(dòng)圖像數(shù)據(jù)的編碼方法上，這些ROI和非ROI的境界明確，因此在非ROI不編碼期間，在該對(duì)應(yīng)的矩形區(qū)域上粘貼已解碼前的圖像是有效的。特別是這種情況下，圖像幀整體的編碼處理能減輕，因此也能期待安裝編碼的軟件。
本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼方法，相當(dāng)于對(duì)應(yīng)上述多個(gè)矩形區(qū)域中的ROI的矩形區(qū)域的編碼數(shù)據(jù)也可以再予以加密(encryption)。但是加密對(duì)象并不是僅限定于ROI，使用者可任意設(shè)定。這對(duì)利用雙向?qū)υ捫拖到y(tǒng)的對(duì)話者的隱私(privacy)的保護(hù)特別重要。如上述那樣實(shí)現(xiàn)對(duì)話者間視線一致的狀態(tài)的雙向?qū)υ捫拖到y(tǒng)，除了單純?cè)谏虅?wù)場(chǎng)面(business scene)上利用的電視會(huì)議(television session)系統(tǒng)之外，也被視為有希望適用于懷有因?yàn)?zāi)害事故等所造成的后遺癥的人的咨詢輔導(dǎo)(counseling)等治療系統(tǒng)。另外，雙向?qū)υ捝弦蝽氁用?encryption)及解密(decryption)，故通過只對(duì)對(duì)話時(shí)興趣區(qū)域加密，能更為有效率地進(jìn)行圖像處理。對(duì)話時(shí)的興趣區(qū)域(ROI)主要是對(duì)話對(duì)方的圖像的臉部，若不能判別這部分時(shí)則個(gè)人的辨識(shí)非常困難。因此，若僅以屬于高精細(xì)(低壓縮率)且高速顯示區(qū)域的ROI為重點(diǎn)進(jìn)行加密時(shí)對(duì)話者的隱私則能獲得充分的保護(hù)。另外，在辨識(shí)個(gè)人上聲音也重要，通過與圖像獨(dú)立的加密，能構(gòu)筑更強(qiáng)固的安全性(security)。
本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼方法，構(gòu)成該活動(dòng)圖像數(shù)據(jù)的圖像幀也可分割為對(duì)ROI成一致的一個(gè)矩形區(qū)域。這種情況下，能減少矩形區(qū)域的分割數(shù)。另外，對(duì)話開始時(shí)設(shè)定的ROI的大小，在對(duì)話中有改變的情況。因此，對(duì)應(yīng)ROI大小的變動(dòng)，動(dòng)態(tài)地變更矩形區(qū)域的分割尺寸，由此，更能有效率地分散圖像處理的負(fù)載。再者，即便矩形區(qū)域的尺寸不對(duì)應(yīng)ROI的尺寸變更時(shí)也能對(duì)應(yīng)ROI的尺寸的變動(dòng)，動(dòng)態(tài)地變更對(duì)應(yīng)于該ROI的矩形區(qū)域。另外，在對(duì)話中，使用者也能利用鼠標(biāo)等的輸入裝置任意地變更ROI的尺寸。本說明書里，所謂「動(dòng)態(tài)」是指除對(duì)應(yīng)狀況的變化自動(dòng)地追隨的情況之外，也含有使用者視狀況任意地變更設(shè)定的情況。
如上述那樣的對(duì)話中的矩形區(qū)域的尺寸和對(duì)應(yīng)關(guān)系的變更，與眼睛，和嘴巴，臉部的動(dòng)作不同，因手的動(dòng)作等依人的不同而有極大的差異而執(zhí)行。也即，對(duì)靜止的手并不是經(jīng)常執(zhí)行一定的壓縮，對(duì)手的動(dòng)作多的人，少的人另加上當(dāng)時(shí)的對(duì)話狀況，不是用固定壓縮率和固定分割，而是自適應(yīng)地(adaptive)設(shè)定壓縮率和分割尺寸，由此能進(jìn)行最佳的圖像處理。
上述那樣的活動(dòng)圖像數(shù)據(jù)編碼方法若采用JP2技術(shù)時(shí)通過馬賽克化(tiling)分割的各個(gè)矩形區(qū)域(tile)，依每個(gè)區(qū)域改變壓縮級(jí)別(壓縮級(jí)別愈高碼量愈少)，由此，除了能獲得實(shí)質(zhì)上與ROI編碼同等的效果，同時(shí)通過JP2技術(shù)能容易解碼。不過，對(duì)應(yīng)屬于編碼對(duì)象的圖像幀內(nèi)的非ROI的矩形區(qū)域的碼量若設(shè)定為0時(shí)，即便通過JP2技術(shù)將圖像幀的編碼數(shù)據(jù)予以解碼也不能獲得非ROI的圖像。這種情況下的解碼(本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的解碼方法)首先對(duì)對(duì)應(yīng)于ROI的矩形區(qū)域被壓縮的編碼數(shù)據(jù)予以解碼，同時(shí)準(zhǔn)備已被解碼后存儲(chǔ)的另外圖像幀的對(duì)應(yīng)矩形區(qū)域作為對(duì)應(yīng)于非ROI的矩形區(qū)域。然后，合成對(duì)應(yīng)已被解碼的ROI的矩形區(qū)域和準(zhǔn)備的另外圖像幀的對(duì)應(yīng)矩形區(qū)域產(chǎn)生新的圖像幀。這里，對(duì)各矩形區(qū)域的壓縮和顯示品質(zhì)的控制優(yōu)選地一邊監(jiān)視執(zhí)行處理的CPU性能和網(wǎng)絡(luò)的線路性能，一邊動(dòng)態(tài)地變更。
再者，本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼方法，應(yīng)編碼的圖像幀的一部分通過例如對(duì)相當(dāng)于非ROI的矩形區(qū)域，填入從與屬于發(fā)送對(duì)象的活動(dòng)圖像數(shù)據(jù)不同的信息源得出的圖像(即使壓縮級(jí)別低，對(duì)對(duì)話不會(huì)產(chǎn)生障礙的靜止圖像的一部分，和活動(dòng)圖像的圖像幀的一部分)而更具臨場(chǎng)感的對(duì)話能不受線路容量，和圖像處理能力等目前的通信環(huán)境的限制。
具體而言，首先，設(shè)定通過多個(gè)分割區(qū)域構(gòu)成的虛擬圖像幀(virtual imageframe)作為須編碼的圖像幀，將這些多個(gè)分割區(qū)域作為屬于JP2的馬賽克化(tiling)的處理單位的馬賽克而進(jìn)行處理。然后，將從構(gòu)成活動(dòng)圖像數(shù)據(jù)(對(duì)話對(duì)方的活動(dòng)圖像)的圖像幀中須編碼的圖像幀分割的多個(gè)分割圖像中的至少任一個(gè)和從與該活動(dòng)圖像數(shù)據(jù)不同的信息源得出的劃出圖像一起分配給這些多個(gè)分割區(qū)域的各個(gè)區(qū)域。這里，被分配的劃出圖像有，例如從鍵盤輸入的監(jiān)視器圖像(靜止圖像)劃出的一部分(以下，稱文本圖像)，利用通過光筆(light-pen)進(jìn)行的白板(white board)功能的手寫文字的監(jiān)視器圖像(從靜止圖像劃出的一部分)(以下，稱白板圖像)，構(gòu)成其它的活動(dòng)圖像數(shù)據(jù)的圖像幀的一部分等，以及從攝像機(jī)，掃描機(jī)等的數(shù)字設(shè)備取入的靜止圖像，和活動(dòng)圖像。另外，新設(shè)定的虛擬圖像幀整體尺寸及分割區(qū)域數(shù)目不必與屬于本來的編碼對(duì)象的活動(dòng)圖像數(shù)據(jù)的圖像幀相同。但是，構(gòu)成該虛擬圖像幀的分割區(qū)域的尺寸雖不必與屬于本來的編碼對(duì)象的活動(dòng)圖像數(shù)據(jù)的圖像幀的分割區(qū)域的尺寸相同，但相同的話因不必執(zhí)行圖像分割處理所以較佳。
如上述那樣被分配在構(gòu)成上述虛擬圖像幀的多個(gè)分割區(qū)域上的多個(gè)種類的圖像，通過JP2的馬賽克化技術(shù)，各個(gè)相當(dāng)于馬賽克的多個(gè)種類的圖像能分別以不同的壓縮級(jí)別進(jìn)行個(gè)別地編碼。由此，對(duì)應(yīng)這些多個(gè)分割區(qū)域的各個(gè)設(shè)定的編碼級(jí)別進(jìn)行個(gè)別壓縮，進(jìn)而產(chǎn)生各虛擬圖像幀的編碼數(shù)據(jù)。
如上述那樣將作為屬于編碼對(duì)象的活動(dòng)圖像數(shù)據(jù)的圖像幀而設(shè)定的虛擬圖像幀沿著時(shí)間軸順序進(jìn)行編碼，由此，得出每個(gè)圖像幀上有混合靜止圖像和活動(dòng)圖像的一個(gè)圖像幀份的活動(dòng)圖像的再現(xiàn)用的編碼數(shù)據(jù)。
另外，構(gòu)成上述虛擬圖像幀的多個(gè)分割區(qū)域的各個(gè)區(qū)域也可與在該虛擬圖像幀內(nèi)設(shè)定的ROI及與該ROI不同的非ROI的任意一個(gè)對(duì)應(yīng)。這時(shí)，與上述的構(gòu)成同樣，多個(gè)分割區(qū)域的各個(gè)區(qū)域優(yōu)選地使對(duì)應(yīng)于ROI的分割區(qū)域的碼量比對(duì)應(yīng)于非ROI的分割區(qū)域的碼量多那樣被進(jìn)行壓縮。
另外，上述ROI的設(shè)定可由使用者本身事先設(shè)定，也可在使用中變更設(shè)定。另外，也可在多個(gè)分割區(qū)域中將檢測(cè)出區(qū)域內(nèi)圖像有移動(dòng)的分割區(qū)域?qū)?yīng)于ROI。
本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼，也可將分配給構(gòu)成上述虛擬圖像幀的多個(gè)分割區(qū)域中的至少一個(gè)的圖像的編碼數(shù)據(jù)另行加密。另外，對(duì)應(yīng)這些多個(gè)分割區(qū)域中至少一個(gè)的編碼處理，也可將該分割區(qū)域的碼量在一定期間中設(shè)定為0。這種情況下，在執(zhí)行編碼處理側(cè)填入事先準(zhǔn)備好的圖像，由此能得出顯示用的圖像幀(由解碼后的圖像和填入碼量為0的區(qū)域的圖像所構(gòu)成)。上述那樣設(shè)定的虛擬圖像幀也是各個(gè)需依JPEG2000進(jìn)行壓縮。
上述那樣的活動(dòng)圖像數(shù)據(jù)的編碼、解碼方法是在雙向?qū)υ捫拖到y(tǒng)的各終端裝置上執(zhí)行。終端裝置至少具備顯示對(duì)話對(duì)方的圖像的顯示裝置，用于攝取坐在該顯示裝置前方的該對(duì)話者的攝像部，執(zhí)行上述的活動(dòng)圖像數(shù)據(jù)的編碼、解碼方法的控制部，以及送出被控制部壓縮的編碼數(shù)據(jù)至上述傳送裝置的輸入輸出部。
上述那樣的活動(dòng)圖像數(shù)據(jù)的編碼、解碼方法，也可為被計(jì)算機(jī)等執(zhí)行的程序，這種情況下，該程序也可不拘有線，無線而經(jīng)網(wǎng)絡(luò)分配，另外，也可存儲(chǔ)在CD，DVD，快閃式存儲(chǔ)器等的記錄媒體里。
再者，本發(fā)明有關(guān)的各實(shí)施例，通過以下的詳細(xì)說明及附圖更能充分地理解。這些實(shí)施例純粹系用于例示，不應(yīng)視為限制本發(fā)明。
另外，本發(fā)明的當(dāng)然的應(yīng)用范圍可從以下的詳細(xì)說明獲得了解。不過，詳細(xì)的說明及特定的事例雖表示在本發(fā)明的優(yōu)選實(shí)施例上，但此僅止于例示而已。本領(lǐng)域技術(shù)人員當(dāng)明白可自此詳細(xì)說明對(duì)本發(fā)明做各種變更及改良而不會(huì)逾越本發(fā)明的精神及范圍。
(發(fā)明的效果)依本發(fā)明，特別地假想在實(shí)現(xiàn)實(shí)時(shí)的雙向?qū)υ捫偷碾p向?qū)υ捫拖到y(tǒng)的特殊環(huán)境下，也即，在發(fā)送數(shù)據(jù)僅集中在顯示圖像的一部分區(qū)域的活動(dòng)圖像數(shù)據(jù)的特殊的對(duì)話環(huán)境下的利用，從圖像幀分割出的多個(gè)矩形區(qū)域?qū)?yīng)于ROI和非ROI的任何之一，改變對(duì)應(yīng)于該ROI的矩形區(qū)域和對(duì)應(yīng)于非ROI的矩形區(qū)域上的壓縮級(jí)別以執(zhí)行各圖像幀的編碼，由此，能減輕及高速化這樣的雙向?qū)υ捫拖到y(tǒng)上的活動(dòng)圖像數(shù)據(jù)的編碼處理。

圖1為表示在不同地點(diǎn)間經(jīng)傳送裝置實(shí)現(xiàn)視線一致的雙向?qū)υ捫拖到y(tǒng)(本發(fā)明有關(guān)的終端裝置及雙向?qū)υ捫拖到y(tǒng))的一構(gòu)成的圖。
圖2為表示圖1所示的攝像裝置的圖，用于說明為了使視線一致，CCD攝像機(jī)的設(shè)置方法。
圖3為用于說明視差角的圖。
圖4為表示應(yīng)設(shè)置CCD攝像機(jī)的區(qū)域的圖。
圖5為表示本發(fā)明有關(guān)的終端裝置的構(gòu)造的方塊圖。
圖6為用于分別說明各終端裝置上執(zhí)行的圖像數(shù)據(jù)的發(fā)送動(dòng)作及接收動(dòng)作的流程圖。
圖7為用于說明圖6中的區(qū)域(a)的活動(dòng)圖像數(shù)據(jù)的發(fā)送動(dòng)作的幀編碼(本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼方法)的流程圖。
圖8為用于說明馬賽克化的圖。
圖9為用于說明ROI(興趣區(qū)域)的設(shè)定方法的一例的圖。
圖10為用于說明馬賽克與ROI的對(duì)應(yīng)關(guān)系的圖(其1)。
圖11是用于說明馬賽克與ROI的對(duì)應(yīng)關(guān)系的圖(其2)。
圖12為用于說明ROI(興趣區(qū)域)的設(shè)定方法的另外例的圖。
圖13為用于說明檢測(cè)各馬賽克上圖像的移動(dòng)的圖。
圖14是用于概念地說明本發(fā)明有關(guān)的雙向?qū)υ捫拖到y(tǒng)的活動(dòng)圖像數(shù)據(jù)的發(fā)送接收動(dòng)作的圖。
圖15是用于概念地說明本發(fā)明有關(guān)的雙向?qū)υ捫拖到y(tǒng)的活動(dòng)圖像數(shù)據(jù)的發(fā)送接收動(dòng)作的另外例的圖。
圖16是用于概念地說明圖14及圖15所示的活動(dòng)圖像數(shù)據(jù)的發(fā)送接收動(dòng)作上幀編碼的第1應(yīng)用例的圖。
圖17是用于概念地說明圖16所示的第1應(yīng)用例的具體的例的圖。
圖18是用于概念地說明圖14所示的活動(dòng)圖像數(shù)據(jù)的發(fā)送接收動(dòng)作上幀編碼的第2應(yīng)用例的圖。
圖19是用于概念地說明圖14所示的活動(dòng)圖像數(shù)據(jù)的發(fā)送接收動(dòng)作上幀編碼的第2應(yīng)用例的圖。
圖20是用于概念地說明圖14所示的活動(dòng)圖像數(shù)據(jù)的發(fā)送接收動(dòng)作上幀編碼的第3應(yīng)用例的圖。
圖21是用于概念地說明通過圖20所示的第3應(yīng)用例有關(guān)的幀編碼得出的編碼數(shù)據(jù)的解碼動(dòng)作的圖。
圖22是表示應(yīng)用圖20及圖21所示的第3應(yīng)用例有關(guān)的幀編碼時(shí)的顯示用圖像幀的一例的圖。
圖23是表示應(yīng)用圖20及圖21所示的第3應(yīng)用例有關(guān)的幀編碼時(shí)的顯示用圖像幀的一例的圖。
主要部分的代表符號(hào)說明3(3A、3B)...對(duì)話者A、B 5(5A、5B)...攝像部(CCD攝像機(jī)) 6(6A、6B)...攝像單元 8(8A、8B)...監(jiān)視器畫面 20A、20B...終端裝置 21(21A、21B)顯示部(顯示裝置) 24(24A、24B)...麥克風(fēng) 26(26A、26B)...圖像處理裝置 80、90...監(jiān)視器圖像 80a...興趣區(qū)域 261、265...輸入輸出部(I/O) 262...圖像數(shù)據(jù)庫(D/B) 263...控制部 264...描繪部 600(600A、600B)攝像裝置 700...外部記錄裝置 800...圖像數(shù)據(jù) 810...馬賽克具體實(shí)施方式
以下將使用圖1～圖23詳細(xì)地說明本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼、解碼方法等的各種實(shí)施方式。另外，在圖面的說明上，相同的部位，相同的構(gòu)件賦與相同的符號(hào)，省略重復(fù)的說明。
本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼、解碼方法能在經(jīng)規(guī)定的傳送裝置連接的終端裝置上執(zhí)行，能適用于在這樣的終端裝置間實(shí)現(xiàn)對(duì)話的例如上述專利文獻(xiàn)1上記載的雙向?qū)υ捫拖到y(tǒng)。
首先，這里將說明執(zhí)行該活動(dòng)圖像數(shù)據(jù)的編碼、解碼方法的終端裝置能適用的雙向?qū)υ捫拖到y(tǒng)。另外，此雙向?qū)υ捫拖到y(tǒng)雖為實(shí)現(xiàn)在視線一致的狀態(tài)下的對(duì)話的系統(tǒng)，但包含該攝像裝置的終端裝置即使是為對(duì)話者間的視線無法一致的結(jié)構(gòu)，也能適用于單純發(fā)送接收對(duì)話者圖像的活動(dòng)圖像數(shù)據(jù)的雙向?qū)υ捫拖到y(tǒng)。
(雙向?qū)υ捫拖到y(tǒng)及終端裝置)圖1是表示能使位于不同地點(diǎn)的對(duì)話者間的視線一致的雙向?qū)υ捫拖到y(tǒng)整體的邏輯構(gòu)成圖。此系統(tǒng)是實(shí)現(xiàn)位在A地點(diǎn)(第1地點(diǎn))的對(duì)話者3A(第1對(duì)話者)和B地點(diǎn)(第2地點(diǎn))的對(duì)話者3B(第2對(duì)話者)間的雙向?qū)υ挼南到y(tǒng)。此系統(tǒng)也是在不同地點(diǎn)的對(duì)話者間確立親密的可靠關(guān)系，實(shí)現(xiàn)親密的溝通(communication)的系統(tǒng)，例如，能用作為以咨詢輔導(dǎo)系統(tǒng)，和家庭學(xué)習(xí)為意向的服務(wù)的提供系統(tǒng)。這種情況下，假想至少一邊的對(duì)話者是教師、醫(yī)師、心理學(xué)者等的服務(wù)提供者。因此，此系統(tǒng)具備能提供這些服務(wù)提供者，提供服務(wù)所需的信息，及理想的對(duì)話環(huán)境那樣的各種功能及構(gòu)成。
具體說，在A地點(diǎn)設(shè)置(a)對(duì)話者3A(例如輔導(dǎo)者)的座椅4A(具有高度調(diào)節(jié)機(jī)構(gòu)40A)，(b)對(duì)話者3A面對(duì)的桌子2A，(c)具備經(jīng)傳送裝置27使對(duì)話者間的視線一致所需的機(jī)構(gòu)的終端裝置20A，對(duì)話者3A通過分隔物22A而被隔離。另一方面，在B地點(diǎn)設(shè)置(a)對(duì)話者3B(例如，接受輔導(dǎo)的客戶)的座椅4B(具有高度調(diào)節(jié)機(jī)構(gòu)40B)，(b)對(duì)話者3B面對(duì)的桌子2B(c)具備經(jīng)傳送裝置27使對(duì)話者間的視線一致所需的機(jī)構(gòu)的終端裝置20B，對(duì)話者3B通過分隔物22B而被隔離。這里，傳送裝置27為了能在A地點(diǎn)的終端裝置20A和B地點(diǎn)的終端裝置20B的間發(fā)送接收?qǐng)D像信息及聲音信息，而包含有光纖發(fā)送路徑31(主發(fā)送路徑)及衛(wèi)星通訊發(fā)送路徑32(備援用發(fā)送路徑)等。另外，此傳送裝置27是有線、無線皆可。另外，傳送裝置除了包含已敷設(shè)的電話線路等網(wǎng)絡(luò)外，還包括具備各種的數(shù)據(jù)庫的電子布告板系統(tǒng)(BBSBulletin Board System)。
在A地點(diǎn)，上述椅子4A的功能是規(guī)定對(duì)話者3A的位置。此椅子4A優(yōu)選地為了與終端裝置20A的顯示部(顯示裝置)21A保持一定距離而被固定。但是，即便該椅子4A未被固定時(shí)在對(duì)話者3A和顯示部21A的間設(shè)置桌子2A，由此也能使椅子4A和顯示部21A的距離保持一定(桌子2A的存在已成為對(duì)話者3A的心理上的距離的基準(zhǔn)的事實(shí)已獲得確認(rèn))。另外，對(duì)話對(duì)方3B(例如接受輔導(dǎo)的人等)所在的B地點(diǎn)的終端裝置20B的結(jié)構(gòu)也是相同。
在A地點(diǎn)上，終端裝置20A具備(1)根據(jù)從B地點(diǎn)的終端裝置20B經(jīng)傳送裝置27傳來的圖像信息，顯示對(duì)話者3B的圖像的配置在桌子2A上的監(jiān)視器TV1A的顯示部21A，(2)用于保持CCD攝像機(jī)(攝像部)5A于規(guī)定位置的本體部6A，(3)根據(jù)從B地點(diǎn)的終端裝置20B經(jīng)傳送裝置27傳來的聲音信息，輸出對(duì)話者3B的聲音所用的聲音輸出部23A(揚(yáng)聲器)，及(4)將對(duì)話者3A的聲音集音作為聲音信息，然后朝B地點(diǎn)的終端裝置20B發(fā)送所用的聲音輸入部24A(麥克風(fēng))。另外，本系統(tǒng)為了作為咨詢輔導(dǎo)系統(tǒng)，實(shí)現(xiàn)更綿密的溝通，另具備(5)對(duì)話者3A輸入文字，和圖形，將輸入的文字，和圖形顯示在顯示部21A的同時(shí)另外作為文字圖形信息朝B地點(diǎn)的終端裝置20B發(fā)送所用的文字圖形輸入部25A(鍵盤，點(diǎn)選裝置(pointing device)，觸板(touch panel)等的接口)，(6)設(shè)在上述各構(gòu)成要素和傳送裝置27之間，執(zhí)行信號(hào)處理，發(fā)送控制，及圖像數(shù)據(jù)的編輯作業(yè)等的圖像處理裝置26A(含控制部)。另外，B地點(diǎn)的終端裝置20B也是與上述的A地點(diǎn)的終端裝置20A做成相同構(gòu)成，具體而言，具備顯示部21B，由CCD攝像機(jī)5B和本體部6B形成的攝像裝置600B，聲音輸出部23B，聲音輸入部24B，文字圖形輸入部25B，及圖像處理裝置26B。
以下將說明A地點(diǎn)及B地點(diǎn)的終端裝置20A，20B上攝像裝置600A，600B的構(gòu)成。另外，為了方便說明，在提及A地點(diǎn)及B地點(diǎn)的各終端裝置20A，20B的共同的構(gòu)成要素時(shí)，例如，像攝像裝置600那樣，省略區(qū)別各地點(diǎn)的文字A，B來進(jìn)行說明。另外，不特別說明時(shí)原則上是針對(duì)A地點(diǎn)的終端裝置20A進(jìn)行說明，而不再重復(fù)說明具有共同構(gòu)成的B地點(diǎn)的終端裝置20B。
此攝像裝置600具備屬于攝像部的CCD攝像機(jī)5(5A)，及用于在支撐該CCD攝像機(jī)5的狀態(tài)下設(shè)置在規(guī)定位置的本體部6。監(jiān)視器TV1(1A)置放在桌子2(2A)上，對(duì)話者3(3A)坐在放置在距監(jiān)視器TV1-L(m)距離的具備高度調(diào)整機(jī)構(gòu)40(40A)的椅子4(4A)上。此距離L(LA)設(shè)定在0.5m以上，5m以下。在被攝像的對(duì)話者3及監(jiān)視器TV1間設(shè)有外徑φ為20mm以下，長(zhǎng)度約100mm的圓筒狀的CCD攝像機(jī)5。另外，此CCD攝像機(jī)5設(shè)置成其攝像方向朝向被攝像的對(duì)話者3。而被CCD攝像機(jī)5攝像的對(duì)話者3的圖像作為圖像信息而被發(fā)送到另一邊的對(duì)話者側(cè)(經(jīng)傳送裝置27被發(fā)送到B地點(diǎn)的終端裝置20B)。再者，依對(duì)話者，顯示部21和該對(duì)話者間的間隔可能有些微的偏移。因此，為了也應(yīng)付此狀況，最好是選擇焦點(diǎn)深度深的CCD攝像機(jī)5。
其次，將使用圖2說明CCD攝像機(jī)5的具體的設(shè)置位置。
首先，攝像裝置600的本體部6設(shè)置在用于顯示傳來的另一邊的對(duì)話者的圖像的顯示部21上。另外，開關(guān)210包含用于接通/關(guān)斷(ON/OFF)監(jiān)視器TV1的電源的電源開關(guān)，用于對(duì)監(jiān)視器畫面8在水平方向，和垂直方向上移動(dòng)被顯示的圖像的圖像位置調(diào)節(jié)開關(guān)，及色補(bǔ)正開關(guān)等。CCD攝像機(jī)5通過本體部6配置在顯示傳來的另一邊的對(duì)話者3B的圖像9的監(jiān)視器畫面8的前方的規(guī)定位置上。另外，此監(jiān)視器畫面8只要有4時(shí)程度即能充分地利用。
具體說，CCD攝像機(jī)5在距監(jiān)視器畫面8前方W(cm)的位置，配置于顯示在該監(jiān)視器畫面8的對(duì)話者圖像9的頭部9a附近。圓筒狀CCD攝像機(jī)5的中心軸位在以虛線表示的對(duì)話者圖像9的眼睛的位置的上方h(cm)的部位。
這樣，CCD攝像機(jī)5因位于顯示于監(jiān)視器TV1的畫面8的對(duì)話者圖像9的眼睛的位置的上方頭部附近，故對(duì)雙向?qū)υ挷粫?huì)產(chǎn)生特別的障礙。例如，若是為CCD攝像機(jī)5設(shè)在顯示于畫面8上的對(duì)話者圖像9的眼睛的位置(圖中虛線所示的位置)的上方h約10(cm)，監(jiān)視器TV1及對(duì)話者3間的距離L設(shè)定為約2.5(m)的系統(tǒng)結(jié)構(gòu)的情況下時(shí)則視差角是2.3°能在充分檢測(cè)界限的視差角3°之下(監(jiān)視器畫面8和CCD攝像機(jī)5的間隔w即便是10(cm)的程度時(shí)，對(duì)視差角的變動(dòng)，無特別的影響)。也即，視線一致時(shí)若能清楚地看到對(duì)方的眼睛(顯示在監(jiān)視器畫面8上的對(duì)方對(duì)話者3B的圖像的眼睛)時(shí)則攝像機(jī)5即便設(shè)在頭部附近，只要監(jiān)視器TV1的畫面8是大型時(shí)對(duì)雙方的對(duì)話幾無障礙一事已獲確認(rèn)。此畫面8的大小，依實(shí)驗(yàn)的結(jié)果，只要是橫35cm，豎26cm程度以上的大小時(shí)則能實(shí)現(xiàn)良好的雙向?qū)υ?，此事也獲得確認(rèn)。再者，相互的對(duì)話者，若是彼此熟識(shí)時(shí)則畫面的尺寸即便是小，心里上的障礙不大，有獲得顯示這種傾向的結(jié)果，有關(guān)畫面的尺寸依用途分別使用即可。
另外，視線一致的狀態(tài)能通過對(duì)監(jiān)視器畫面8調(diào)整CCD攝像機(jī)5的位置而實(shí)現(xiàn)。另外，對(duì)CCD攝像機(jī)5，移動(dòng)顯示在監(jiān)視器畫面8上的圖像也能實(shí)現(xiàn)。例如，若是通過手動(dòng)達(dá)成視線一致的情況下時(shí)則對(duì)話者本身移動(dòng)CCD攝像機(jī)5，或通過調(diào)整開關(guān)210使監(jiān)視器圖像移動(dòng)即可。另外若是通過自動(dòng)實(shí)現(xiàn)視線一致的情況下時(shí)則另設(shè)置使攝像機(jī)移動(dòng)用的驅(qū)動(dòng)機(jī)構(gòu)，或利用畫面識(shí)別技術(shù)使監(jiān)視器圖像移動(dòng)即可。
下面將使用圖3說明視差角。本說明書里，所謂視差角，如圖3所示，是指朝向顯示在監(jiān)視器畫面8的對(duì)話者圖像9的被攝像的對(duì)話者3的視線與朝向CCD攝像機(jī)5的該對(duì)話者3的視線間形成的角度θ。換言之，是指CCD攝像機(jī)5的設(shè)置位置對(duì)對(duì)話者3的視線的偏離角。另外，這里所說的視線一致，如非專利文獻(xiàn)1上報(bào)告的那樣，是指在因CCD攝像機(jī)5的設(shè)置位置所造成的不自然度的容許界限以下。定量上，視差角在左右方向4.5°以下(對(duì)對(duì)話者圖像9的眼睛的中心A，是該圖像9的鬢角側(cè))，正上方向12°(對(duì)圖像中心A，圖像9的頭部9b側(cè))，正下方向8°(對(duì)圖像中心A，是圖像9的身體側(cè))以下視為在視線一致范圍內(nèi)。當(dāng)然，此視差角小較好，左右上下方向3°以下作為檢測(cè)界限。因此，能設(shè)置CCD攝像機(jī)5的區(qū)域是圖4所示的圓錐區(qū)域。另外，此圓錐區(qū)域是對(duì)連結(jié)對(duì)話者3的眼30與顯示于監(jiān)視器畫面8上的對(duì)話者圖像9的中心點(diǎn)A(本實(shí)施方式定義為將對(duì)話者圖像9的兩眼的中心作為該對(duì)話者圖像9的中心點(diǎn)A)的該對(duì)話者3的視線31，依隔規(guī)定距離L(m)時(shí)的監(jiān)視器畫面8上的視線一致區(qū)域9b，及該對(duì)話者3的眼30的位置而被規(guī)定。
另外，顯示于監(jiān)視器畫面8上的對(duì)話者圖像9的尺寸若是小的情況下時(shí)則該CCD攝像機(jī)5和對(duì)話者圖像的頭部并非一定要重疊。不如對(duì)話者圖像9的頭部隱在CCD攝像機(jī)5之后而不易看到。上述那樣，視線一致的條件是CCD攝像機(jī)5和對(duì)話者圖像9的眼位于視差角3°的區(qū)域內(nèi)，具體說，在離畫面50cm的位置上是約3cm程度(圖2的h)。因此，只要是在此范圍內(nèi)時(shí)則CCD攝像機(jī)5和對(duì)話者圖像9的頭部即便偏離也能維持視線一致狀態(tài)。例如，調(diào)整監(jiān)視器畫面8上的圖像顯示位置，或調(diào)節(jié)CCD攝像機(jī)5的支撐部以變更CCD攝像機(jī)5本身的位置，可使對(duì)話者圖像9和CCD攝像機(jī)5偏離。
發(fā)明者等進(jìn)行在具有上述那樣構(gòu)造的雙向?qū)υ捫拖到y(tǒng)上于視線一致的狀態(tài)下對(duì)話的心理上的考察，發(fā)現(xiàn)對(duì)話時(shí)對(duì)話者為了觀察對(duì)話對(duì)方的表現(xiàn)，視線大多集中在該對(duì)話對(duì)方的臉部，和非語言(non-verbal)表現(xiàn)的手勢(shì)，這種情況下，對(duì)話時(shí)不必將包含對(duì)話者圖像的整個(gè)畫面逐次發(fā)送，而若只著重于對(duì)話時(shí)的重要觀察區(qū)域，也即對(duì)話者的臉部和手勢(shì)等對(duì)該對(duì)話者而言是興趣區(qū)域(ROIRegion of interest)，發(fā)送活動(dòng)圖像的話能減少發(fā)送量，另外，也發(fā)現(xiàn)對(duì)實(shí)現(xiàn)雙向?qū)υ挼母咚夙憫?yīng)性很有效果。因此，本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼、解碼方法，在通過雙向?qū)υ捫拖到y(tǒng)等進(jìn)行發(fā)送接收的活動(dòng)圖像數(shù)據(jù)的各個(gè)圖像幀內(nèi)含有ROI的情況下的圖像處理上，對(duì)減輕負(fù)載方面具有效果之外還能實(shí)現(xiàn)該處理的高速化。再者，該活動(dòng)圖像數(shù)據(jù)的編碼、解碼方法在終端裝置上實(shí)施。
(終端裝置)圖5是表示用于實(shí)施本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼、解碼方法的終端裝置的結(jié)構(gòu)的圖。此終端裝置具備監(jiān)視器等的顯示裝置21(相當(dāng)于圖1所示的雙向?qū)υ捫拖到y(tǒng)上的顯示部21A，21B)，圖像處理部26(相當(dāng)于圖1所示的雙向?qū)υ捫拖到y(tǒng)上的圖像處理裝置26A，26B)，外部記錄裝置700，鼠標(biāo)等的點(diǎn)選裝置(Pointing Device)900，觸筆(touch-pen)920，由用于攝像坐在顯示裝置21前方的對(duì)話者的CCD攝像機(jī)5等的攝像部及本體部6所形成的攝像裝置600，及揚(yáng)聲器910。上述圖像處理部26具備用于取入來自含于攝像裝置的本體部6的圖像信息，和其它信息媒體的信息，和經(jīng)傳送裝置27發(fā)送接收的對(duì)方對(duì)話者的活動(dòng)圖像數(shù)據(jù)(編碼數(shù)據(jù))的數(shù)據(jù)輸入輸出部261(圖中的I/O)；執(zhí)行本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼、解碼方法的控制部263；用于存儲(chǔ)被發(fā)送接收的活動(dòng)圖像數(shù)據(jù)的圖像數(shù)據(jù)庫262(圖中的圖像D/B)；依控制部263的指示在顯示裝置21上顯示規(guī)定圖樣(pattern)的描繪部264；取入來自鼠標(biāo)等的點(diǎn)選裝置900的位置信息，和能與外部記錄裝置700進(jìn)行數(shù)據(jù)的授受的數(shù)據(jù)輸入輸出部265(圖的I/O)；及用于控制對(duì)話對(duì)方的聲音的輸出的揚(yáng)聲器的音源控制器930。
另外，外部記錄裝置700包括，例如，磁帶，CD，光盤，硬盤，DVD，快閃式存儲(chǔ)器等，存儲(chǔ)實(shí)施本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼、解碼方法的計(jì)算機(jī)程序，和對(duì)話對(duì)方的活動(dòng)圖像數(shù)據(jù)等。
(活動(dòng)圖像數(shù)據(jù)的編碼、解碼方法)下面將說明在具備上述那樣構(gòu)造的終端裝置的控制部263上執(zhí)行的編碼、解碼動(dòng)作(本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼、解碼方法)。圖6中的區(qū)域(a)是用于說明在各終端裝置上執(zhí)行的活動(dòng)圖像數(shù)據(jù)的發(fā)送動(dòng)作的流程6中的區(qū)域(b)是用于說明在各終端裝置上執(zhí)行的活動(dòng)圖像數(shù)據(jù)的接收動(dòng)作的流程圖。另外，圖7是用于說明圖6中的區(qū)域(a)的活動(dòng)圖像的發(fā)送動(dòng)作的幀編碼(本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)編碼方法)的流程圖。另外，構(gòu)成以下說明的活動(dòng)圖像數(shù)據(jù)的圖像幀的編碼及解碼是依JP2技術(shù)執(zhí)行。
首先，活動(dòng)圖像數(shù)據(jù)的發(fā)送動(dòng)作，如圖6中的區(qū)域(a)的流程圖所示那樣，在對(duì)話開始的前，先執(zhí)行設(shè)定圖像幀內(nèi)的ROI的前處理(步驟ST10)。在此步驟ST10上設(shè)定的ROI信息暫時(shí)存儲(chǔ)在存儲(chǔ)器內(nèi)，控制部263利用此被存儲(chǔ)的ROI信息沿著時(shí)間軸將構(gòu)成活動(dòng)圖像數(shù)據(jù)的圖像幀分別順序編碼(步驟ST20)。另外，此幀編碼是通過控制部263執(zhí)行經(jīng)I/O265自外部記錄裝置700讀入的計(jì)算機(jī)程序而進(jìn)行。
控制部263將通過上述的幀編碼程序(步驟ST20)被編碼的編碼數(shù)據(jù)逐次經(jīng)I/O261送出到傳送裝置27(步驟ST30)。而且，這些幀編碼及編碼數(shù)據(jù)的發(fā)送動(dòng)作是以30幀/秒的處理速度持續(xù)進(jìn)行直到對(duì)話結(jié)束為止(步驟ST40)。
另外一方面，活動(dòng)圖像數(shù)據(jù)的接收動(dòng)作，如圖6中的區(qū)域(b)的流程圖所示，控制部263從傳送裝置27經(jīng)I/O261順序接收?qǐng)D像幀的編碼數(shù)據(jù)(步驟S50)，執(zhí)行構(gòu)成該圖像幀的矩形區(qū)域(馬賽克)的解碼(步驟S60)。然后，控制部263在每個(gè)圖像幀的全部馬賽克的解碼處理結(jié)束時(shí)刻執(zhí)行解碼后的馬賽克的合成作業(yè)，進(jìn)而產(chǎn)生應(yīng)顯示在顯示裝置21上的新的圖像幀(步驟ST70)。另外，相當(dāng)于接收的編碼數(shù)據(jù)中的非ROI的馬賽克的碼量若是0的情況下時(shí)則將預(yù)先存儲(chǔ)在數(shù)據(jù)庫262的圖像作為對(duì)應(yīng)的馬賽克圖像而予以合成，由此，產(chǎn)生應(yīng)顯示的圖像幀。另外，上述的解碼處理是逐次執(zhí)行直到對(duì)話結(jié)束為止(步驟ST80)。
另外，下文將用圖7的流程圖詳細(xì)說明圖6中的區(qū)域(a)的流程圖中的幀編碼。
控制部263利用JP2的馬賽克化(tiling)技術(shù)進(jìn)行圖像幀的分割(步驟ST201)，根據(jù)在前處理(步驟ST10)上設(shè)定的ROI信息，將被分割的全部馬賽克(tile)分類成含于ROI的矩形區(qū)域或含于非ROI的矩形區(qū)域。
另外，步驟ST201的馬賽克化，如圖8所示，將含有被顯示的對(duì)話者圖像9的監(jiān)視器圖像80的圖像幀800分割成若干的相同尺寸的馬賽克810(T17～T77)，而后能將這些馬賽克各張作為一個(gè)獨(dú)立的圖像處理。馬賽克的尺寸對(duì)話者本身能任意選擇，其最小單位是1×1像素，最大是232-1×232-1像素。另外，圖像幀800的尺寸也可與監(jiān)視器圖像80的尺寸一致。但是，監(jiān)視器圖像80的數(shù)據(jù)尺寸小對(duì)執(zhí)行馬賽克化的控制部(例如，CPU)的負(fù)載可有效減輕。因此，也可將廣角透鏡攝像機(jī)攝取的圖像數(shù)據(jù)中的一部分暫行作為監(jiān)視器圖像80而進(jìn)行馬賽克化，當(dāng)顯示于監(jiān)視器畫面8之際則放大顯示處理用的監(jiān)視器圖像80。
在圖像幀800內(nèi)的ROI的設(shè)定優(yōu)選地在對(duì)話開始前對(duì)話者本身一邊在監(jiān)視器上確認(rèn)自己的圖像，一邊設(shè)定。具體說，ROI的設(shè)定如圖3所示，對(duì)話者3本身面對(duì)顯示部21的監(jiān)視器畫面8，利用觸筆920而進(jìn)行。這種情況下，如圖9所示，只要將ROI80a設(shè)定于通過觸筆920在監(jiān)視器畫面8上指示的起點(diǎn)P1和終點(diǎn)P2所規(guī)定的矩形區(qū)域即可。例如，若是在圖8所示的圖像幀800中含有對(duì)話者圖像9的臉部的矩形區(qū)域被設(shè)定ROI80a的情況下時(shí)，則如圖10所示那樣，構(gòu)成圖像幀800的馬賽克T11～T77中的T23，T24，T25，T33，T34，T35對(duì)應(yīng)ROI80a。另外，這樣的ROI的設(shè)定如下述那樣能將一個(gè)圖像幀800分割成多個(gè)區(qū)域而分別設(shè)定。這種情況下，通過對(duì)多個(gè)ROI分別改變壓縮級(jí)別和加密級(jí)別，對(duì)話者自身能具有決定圖像品質(zhì)，安全性，背景圖像的權(quán)力。
另外，圖像幀800，如圖11所示，也能對(duì)ROI80a一致地分割為一張馬賽克T12。這種情況下，能減少圖像幀800的分割數(shù)。另外，在對(duì)話開始時(shí)設(shè)定的ROI80a的尺寸在對(duì)話中有變動(dòng)的情況下(對(duì)話者自身移動(dòng)的情況下)。因此，對(duì)應(yīng)ROI80a的尺寸的變動(dòng)動(dòng)態(tài)地變更馬賽克810的分割尺寸，由此能更有效地分散圖像處理的負(fù)載。另外，如圖8及圖10所示，由多個(gè)馬賽克810構(gòu)成ROI80a的情況下，也能對(duì)應(yīng)ROI80a的尺寸的變動(dòng)動(dòng)態(tài)地變更對(duì)應(yīng)該ROI80a的馬賽克810。再者，對(duì)話中的動(dòng)態(tài)變更包含對(duì)話者自身視狀況而手動(dòng)變更的情況和通過控制部等一邊監(jiān)視狀況變化一邊自動(dòng)變更的情況。
上述那樣對(duì)話中的馬賽克尺寸和對(duì)應(yīng)關(guān)系的動(dòng)態(tài)地變更，是與眼睛，嘴巴，臉部的動(dòng)作不同，因手的動(dòng)作等依人的不同差異甚大而執(zhí)行者。也即，對(duì)靜止的手并不是經(jīng)常執(zhí)行一定的壓縮，對(duì)手的動(dòng)作變化多，變化少的人，更甚者，配合當(dāng)時(shí)的對(duì)話狀況，不是用固定壓縮和固定分割，而是自適應(yīng)地變動(dòng)壓縮率和分割尺寸，由此能進(jìn)行最佳的圖像處理。
其次，接續(xù)在上述那樣的馬賽克化(步驟ST201)之后，對(duì)被分割的馬賽克810各個(gè)通過JP2技術(shù)進(jìn)行編碼。另外，本實(shí)施方式，在步驟ST201上，僅對(duì)對(duì)應(yīng)ROI80a的馬賽克進(jìn)行編碼，而對(duì)對(duì)應(yīng)非ROI的馬賽克則將碼量設(shè)定為0(不進(jìn)行編碼)。另外，本實(shí)施方式，在不進(jìn)行編碼時(shí)對(duì)應(yīng)只表示馬賽克的存在的數(shù)個(gè)字節(jié)(byte)的編碼列，由此，可避免解碼的破綻。
控制部263執(zhí)行的幀編碼是對(duì)每個(gè)馬賽克首先判斷屬于處理對(duì)象的馬賽克究竟是對(duì)應(yīng)于ROI80a，還是對(duì)應(yīng)于非ROI(步驟ST202)，只對(duì)對(duì)應(yīng)于ROI80a的馬賽克進(jìn)行編碼，而對(duì)對(duì)應(yīng)非ROI的馬賽克不進(jìn)行編碼處理(碼量0)。
在步驟ST202上若判斷是對(duì)應(yīng)ROI80a時(shí)則進(jìn)行編碼處理，依次執(zhí)行離散小波轉(zhuǎn)換(DWT步驟ST203)，非向量量子化(步驟ST204)，及EBCOT(步驟ST205)。
這里，步驟ST203的離散小波轉(zhuǎn)換(DWTDiscrete WaveletTransformation)是對(duì)馬賽克圖像進(jìn)行頻寬分割處理。JP2技術(shù)采用基于2分割濾波器組的上升(lifting)構(gòu)成的DWT?；谏仙?lifting)構(gòu)成的DWT上存在有屬于可逆變換的整數(shù)型DWT和屬于不可逆變換的實(shí)數(shù)型DWT兩種。lossy(不可逆)編碼及l(fā)ossless(可逆)編碼分別使用實(shí)數(shù)型DWT及整數(shù)型DWT。
另外，步驟ST204上的非向量量子化是對(duì)DWT系數(shù)在各個(gè)頻寬上執(zhí)行非向量量子化。但是，若是使用整數(shù)型DWT的情況下時(shí)則省略這項(xiàng)處理。用于非向量量子化的量子化階梯(Step)大小由下式表示。
Δb=2Rb-ϵb[1+μb211]]]>這里，Δb是副頻寬(Sub-band)6的量子化階梯，Rb是副頻寬b的動(dòng)態(tài)范圍(dynamic range)。εb和μb分別用5個(gè)位元和11個(gè)位元表示，并送到解碼器以為逆量子化之用。另外，上述量子化階梯(quantization step)大小，對(duì)畫質(zhì)優(yōu)先度高，也即對(duì)希望為高畫質(zhì)的馬賽克設(shè)定為小階梯大小，而對(duì)應(yīng)低畫質(zhì)即可的非ROI的馬賽克階梯大小則設(shè)定得大。另外，若將此量子化階梯大小設(shè)定為1時(shí)則實(shí)質(zhì)上是與不執(zhí)行非向量量子化等效。
其次，在步驟ST205上的EBCOT(Embedded Block Coding With OptimizedTruncation)是負(fù)責(zé)相當(dāng)于熵編碼(entropy encoding)及編碼率控制的處理的算法(Algorithm)，由系數(shù)模式化(coefficient modeling)，算術(shù)編碼及層分割·碼切取(layer dividing·code extracting)三工程所構(gòu)成。此EBCOT內(nèi)存在有所謂碼塊(code block)的編碼單位。碼塊被DWT區(qū)域上的矩形區(qū)域所定義，在全部的頻寬上其大小皆相同。另外，上述三個(gè)工程中除掉算術(shù)編碼的工程外，是以碼塊大小為單位分開執(zhí)行。
系數(shù)模式化是將碼塊內(nèi)的系數(shù)行位元平面(bit-plane)分解，判定各位元平面的系數(shù)位元的文脈信息(context上下文關(guān)聯(lián))。在判定上下文關(guān)聯(lián)時(shí)，準(zhǔn)備有基于事先預(yù)備的統(tǒng)計(jì)模式的上下文關(guān)聯(lián)分配圖(Context AssignmentMap)。上下文關(guān)聯(lián)分配圖(Context Assignment Map)依各個(gè)頻寬而不相同。依具有系數(shù)位元的文脈信息，將一個(gè)位元平面分解，排列為三個(gè)編碼化路徑(Sub-bit Plane副位元平面)。
其次，算術(shù)編碼使用屬于兩值算術(shù)編碼器的MQ編碼器(coder)，將各個(gè)編碼化路徑(path)予以編碼。MQ編碼器需要用于編碼的文脈信息，而這文脈信息即是利用通過系數(shù)位元模式化獲得的文脈信息。
層分割·碼切取是將每個(gè)碼塊產(chǎn)生的編碼數(shù)據(jù)列對(duì)應(yīng)再現(xiàn)圖像幀的SNR(Signal to Noise Ratio)提升的貢獻(xiàn)度的程度，在賦與的編碼率內(nèi)分割成多層的SNR層(layer)。最上層對(duì)畫質(zhì)的影響最大，另外，通過從最上層到最下層的各層依次接收?qǐng)D像數(shù)據(jù)，能階段地提升再現(xiàn)圖像幀的畫質(zhì)。能分層的位置受各編碼化路徑的終端的限制，此終端稱為舍棄點(diǎn)。另外，JP2的編碼率控制與對(duì)畫質(zhì)的貢獻(xiàn)度高的順序并行，對(duì)被改變的數(shù)據(jù)，將超過賦與的編碼率的數(shù)據(jù)以舍棄點(diǎn)為單位予以舍棄而達(dá)成。
如上述，對(duì)構(gòu)成一個(gè)圖像幀的全部馬賽克，在結(jié)束編碼(步驟ST203～ST205)或跳過編碼后(步驟ST206)，將得出的各個(gè)馬賽克的編碼數(shù)據(jù)予以匯總而產(chǎn)生一個(gè)圖像幀的編碼數(shù)據(jù)(步驟ST207)。
另外，上述的步驟ST201利用在前處理(步驟ST10)上對(duì)話者自身設(shè)定的ROI數(shù)據(jù)，將ROI和非ROI對(duì)應(yīng)于分割成規(guī)定尺寸的各個(gè)馬賽克，但此ROI的設(shè)定也可對(duì)被分割的馬賽克中，將檢測(cè)圖像有移動(dòng)的馬賽克自動(dòng)地對(duì)應(yīng)于ROI。圖12是表示ROI設(shè)定方法的另外例。
首先，將圖像幀分割成規(guī)定尺寸的馬賽克以作為分割區(qū)域(步驟S201a)。然后，對(duì)每個(gè)被分割的馬賽克檢測(cè)圖像是否移動(dòng)(步驟ST201b)，將實(shí)際上被檢測(cè)出圖像有移動(dòng)的馬賽克設(shè)定于ROI(步驟S201c)。上述的處理對(duì)全部的馬賽克執(zhí)行完后(步驟ST201d)，則執(zhí)行步驟ST202。
圖13是用于說明檢測(cè)每個(gè)被分割的馬賽克的移動(dòng)的動(dòng)作的圖。圖13中的區(qū)域(a)上示出比較前圖像幀A(由馬賽克T11～T23構(gòu)成)之中馬賽克T22與后圖像幀B(由馬賽克T11～T23構(gòu)成)的對(duì)應(yīng)馬賽克T22的情況。具體的比較是求出前圖像幀A的馬賽克T22內(nèi)的事先指定的像素的亮度值a1，a2，a3和后圖像幀B的馬賽克T22內(nèi)的對(duì)應(yīng)的像素的亮度值b1，b2，b3，通過這些對(duì)應(yīng)的像素彼此間的亮度值的差的合計(jì)以算出移動(dòng)量。也即，馬賽克T22的移動(dòng)量用下式表示。
(a1-b1)+(a2-b2)+(a3-b3)通過上式算出的移動(dòng)量若超過規(guī)定的閾值時(shí)馬賽克T22則設(shè)定于ROI。另外，用于比較亮度值的像素?cái)?shù)也可依各個(gè)馬賽克而異。
圖13中的區(qū)域(b)是概念地表示含有上述移動(dòng)檢測(cè)動(dòng)作的編碼處理的方塊圖。
如圖13中的區(qū)域(b)所示的那樣，對(duì)于是處理對(duì)象的后圖像幀B的各馬賽克，利用屬于比較對(duì)象的前圖像幀A的對(duì)應(yīng)馬賽克以檢測(cè)圖像的移動(dòng)，接著根據(jù)此檢測(cè)結(jié)果，是否編碼成ROI，或非ROI(若是非ROI的情況下時(shí)碼量也可設(shè)定為0)，然后得出圖像幀B的編碼數(shù)據(jù)。
其次，圖14是用于概念地說明應(yīng)用上述那樣的活動(dòng)圖像數(shù)據(jù)的編碼方法的雙向?qū)υ捫拖到y(tǒng)(本發(fā)明有關(guān)的雙向?qū)υ捫拖到y(tǒng))的活動(dòng)圖像數(shù)據(jù)的發(fā)送接收動(dòng)作。另外，以下的說明是示出將CCD攝像機(jī)5攝取的對(duì)話者圖像在監(jiān)視器上顯示的圖像80行6分割的馬賽克化的例。
發(fā)送側(cè)終端裝置20A，首先，將CCD攝像機(jī)5依次攝取的圖像幀(顯示對(duì)話者的監(jiān)視器圖像80)馬賽克化成6個(gè)馬賽克(T11～T23)，依每個(gè)圖像幀，對(duì)對(duì)應(yīng)于ROI80a的馬賽克T12進(jìn)行編碼。另外一方面，對(duì)應(yīng)于非ROI的馬賽克T11，T13，T21～T23則是每一定期間進(jìn)行編碼。這時(shí)，發(fā)送側(cè)終端裝置20A一邊在例如發(fā)送速度為10Mbps的發(fā)送線路上發(fā)送以30幀/秒(fps)的速率送出的圖像幀的編碼數(shù)據(jù)(僅含有被壓縮的馬賽克T12的碼)，一邊每一定期間送出含有全部馬賽克的壓縮數(shù)據(jù)的編碼數(shù)據(jù)。這樣，事先將構(gòu)成一個(gè)圖像幀的馬賽克分類成編碼對(duì)象及非編碼對(duì)象，由此，減輕該發(fā)送側(cè)終端裝置20A的圖像處理的負(fù)載。
另外一方面，接收側(cè)終端裝置20B以30fps的速率對(duì)依次接收的編碼數(shù)據(jù)進(jìn)行解碼。此時(shí)，在一定期間之間，對(duì)對(duì)應(yīng)于ROI80a的馬賽克T12得出解碼的數(shù)據(jù)，但對(duì)對(duì)應(yīng)于非ROI的馬賽克T11，T13，T21～T23則無法得出解碼數(shù)據(jù)(自發(fā)送側(cè)終端裝置20A送出的碼量是0)。這種情況下，接收側(cè)終端裝置20B將相當(dāng)于先前接收的被解碼的別的圖像數(shù)據(jù)的馬賽克T11，T13，T21～T23的馬賽克圖像與解碼的馬賽克圖像合成，由此產(chǎn)生新的應(yīng)顯示的圖像幀90。
這樣，在實(shí)現(xiàn)實(shí)時(shí)雙向?qū)υ挼碾p向?qū)υ捫拖到y(tǒng)那樣的特殊環(huán)境下，也即發(fā)送信息僅集中在顯示圖像的一部分區(qū)域上的活動(dòng)圖像數(shù)據(jù)的特殊環(huán)境下，將從圖像幀分割出的多個(gè)馬賽克對(duì)應(yīng)于ROI和非ROI的任意一個(gè)，對(duì)對(duì)應(yīng)該ROI的馬賽克和對(duì)應(yīng)非ROI的馬賽克改變壓縮級(jí)別以進(jìn)行各圖像的編碼，由此能減輕及高速化這樣的雙向?qū)υ捫拖到y(tǒng)的活動(dòng)圖像的編碼處理。
再者，上述的接收動(dòng)作，通過合成解碼的全部馬賽克，或合成解碼的馬賽克和作為先前的圖像幀的馬賽克而被存儲(chǔ)的馬賽克，以產(chǎn)生顯示用圖像幀90，但顯示用圖像幀的產(chǎn)生并非限定于這樣。圖15是用于概念地說明本發(fā)明有關(guān)的雙向?qū)υ捫拖到y(tǒng)的活動(dòng)圖像數(shù)據(jù)的發(fā)送接收動(dòng)作的另外的例子的圖。
發(fā)送動(dòng)作，與圖14所示的動(dòng)作相同，發(fā)送側(cè)終端裝置20A針對(duì)各個(gè)馬賽克T11～T23執(zhí)行ROI編碼及非ROI編碼的任意一個(gè)，得出的編碼數(shù)據(jù)則發(fā)送到接收側(cè)終端裝置20B。在接收側(cè)終端裝置20B上，對(duì)應(yīng)ROI的馬賽克的編碼數(shù)據(jù)則被解碼，另一方面對(duì)應(yīng)非ROI的馬賽克的編碼數(shù)據(jù)也被解碼。然后，僅放大處理必要的馬賽克T12以產(chǎn)生顯示用圖像幀90。
另外，圖15所示的例子，雖是多個(gè)馬賽克被設(shè)定為ROI，但也可對(duì)應(yīng)會(huì)議的進(jìn)行狀況一邊動(dòng)態(tài)地變更顯示對(duì)象人物的一個(gè)馬賽克，一邊設(shè)定ROI。這種情況下，僅傳送事先放大顯示的馬賽克的碼量，因此更減輕處理的負(fù)載。
例如，多人參加的電視會(huì)議，在發(fā)送側(cè)終端裝置20A上事先分配好顯示各會(huì)議參加者；會(huì)議參加者中任何一個(gè)有舉手的情況下等，則將檢測(cè)出圖像有移動(dòng)的馬賽克設(shè)定為ROI，對(duì)各馬賽克進(jìn)行ROI編碼或非ROI編碼。另一方面，在接收側(cè)終端裝置20B上，也可在解碼的馬賽克中僅對(duì)對(duì)應(yīng)ROI的馬賽克進(jìn)行放大處理以作為顯示用圖像幀90。
另外，在上述的圖14所示的例子中，執(zhí)行馬賽克化以將圖像幀分割成6個(gè)馬賽克，然后將分割的馬賽克T11～T23對(duì)應(yīng)于ROI和非ROI的任一，但也可將ROI進(jìn)一步分成要求的畫質(zhì)級(jí)別不同的多個(gè)區(qū)域。圖16是用于概念地說明圖14所示的活動(dòng)圖像數(shù)據(jù)的發(fā)送接收動(dòng)作的第1應(yīng)用例(特別是發(fā)送動(dòng)作)的圖。
對(duì)話對(duì)方的表情，除了要求最細(xì)微且高速地顯示眼臉，眼睛，眉間的微妙變化等之外還對(duì)非語言表現(xiàn)的手勢(shì)，手的移動(dòng)，輪廓的高速響應(yīng)移動(dòng)顯示也是重要。在當(dāng)時(shí)手本身的畫質(zhì)即便降低但對(duì)對(duì)話的影響本質(zhì)上僅止于輕微。因此，考慮上述雙向?qū)υ捫拖到y(tǒng)特有的對(duì)話環(huán)境，圖16是在發(fā)送側(cè)終端裝置20A上將馬賽克T12對(duì)應(yīng)于包含對(duì)話時(shí)高精細(xì)且高速響應(yīng)的臉部，頭部的高精細(xì)且高速顯示區(qū)域(第1ROI)，將馬賽克T12對(duì)應(yīng)于手，手腕，胸部之中精細(xì)且高速顯示區(qū)域(第2ROI)，而剩余的馬賽克T11，T13，T21，T23則對(duì)應(yīng)于非ROI。這樣，考慮對(duì)對(duì)話的影響，在圖像幀內(nèi)分類成壓縮級(jí)別做階段地變化的多個(gè)種類的區(qū)域，這在對(duì)于減輕圖像處理負(fù)載的狀態(tài)下實(shí)現(xiàn)順暢的雙向?qū)υ捝细鼮橛行А?br> 再者，若考慮對(duì)圖像幀內(nèi)的各區(qū)域的對(duì)話的影響度時(shí)也可將對(duì)應(yīng)于非ROI的馬賽克T11，T13，T21，T23的碼在一定期間中設(shè)定為0。具體說，對(duì)非ROI不進(jìn)行編碼，發(fā)送僅表示不被編碼的馬賽克的存在的數(shù)個(gè)字節(jié)(byte)的編碼列，由此避免解碼上的破綻。
另外，通過對(duì)對(duì)應(yīng)ROI的馬賽克T12進(jìn)行加密，利用雙向?qū)υ捫拖到y(tǒng)的對(duì)話者的隱私能獲得保護(hù)。上述那樣實(shí)現(xiàn)對(duì)話者之間視線一致狀態(tài)的雙向?qū)υ捫拖到y(tǒng)，除了單純?cè)谏虉?chǎng)(business scene)上利用的電視會(huì)議系統(tǒng)之外，另也被視為可望應(yīng)用于具有因?yàn)?zāi)害、事故等所造成的后遺癥的人的咨詢輔導(dǎo)等治療系統(tǒng)。另外一方面，雙向?qū)υ捰斜匾M(jìn)行實(shí)時(shí)的加密和解密，因此，通過只對(duì)對(duì)話時(shí)的興趣區(qū)域加密，能更有效率地執(zhí)行圖像處理。對(duì)話時(shí)的興趣區(qū)域(ROI)主要是對(duì)話對(duì)方圖像的臉部，此部分若無法判別時(shí)則非常難于辨識(shí)個(gè)人。因此，僅重點(diǎn)地對(duì)屬于高精細(xì)(低壓縮率)且高速顯示的區(qū)域的ROI進(jìn)行加密，對(duì)話者的隱私能獲得充分的保護(hù)。另外，個(gè)人的辨識(shí)聲音也是重要的，通過與圖像分開加密，能構(gòu)筑更為強(qiáng)固的安全性。
另外，雙向?qū)υ捪狄贿呑⒁晫?duì)話對(duì)方的臉部(一邊維持視線能一致的狀態(tài))，一邊進(jìn)行對(duì)話，但是僅經(jīng)對(duì)話對(duì)方圖像進(jìn)行對(duì)話說怎樣也無法獲得實(shí)際的面對(duì)面對(duì)話(利用活動(dòng)圖像和數(shù)據(jù)圖像的真實(shí)(visual)對(duì)話)具有的臨場(chǎng)感。有臨場(chǎng)感的對(duì)話環(huán)境，在雙向?qū)υ挄r(shí)，也和面對(duì)面對(duì)話一樣，欲使利用數(shù)據(jù)進(jìn)行順暢對(duì)話，不僅要求播放臉部，也包括上半身和房間整體的多樣的圖像。因此，理想的是顯示對(duì)話對(duì)方的圖像外，還可隨意地顯示文本(text)等的數(shù)據(jù)以實(shí)現(xiàn)具臨場(chǎng)感的對(duì)話。不過，這樣增加發(fā)送來自多個(gè)信息源的靜止圖像和活動(dòng)圖像，須有大容量的通信容量，因此，導(dǎo)致阻礙對(duì)話系統(tǒng)的普及化。
這樣的具有臨場(chǎng)感的雙向?qū)υ挘舶魳?，演戲，各種趣味，各種資格等的遠(yuǎn)距實(shí)際技術(shù)指導(dǎo)，特別是在這樣的對(duì)話環(huán)境下，最好是除了合成在多個(gè)視點(diǎn)上觀察的圖像外，也隨時(shí)顯示對(duì)應(yīng)當(dāng)時(shí)的文本數(shù)據(jù)。另外，不限于遠(yuǎn)距實(shí)際技術(shù)指導(dǎo)，就是對(duì)于現(xiàn)場(chǎng)指導(dǎo)，最好也是合成在多個(gè)視點(diǎn)上的觀察圖像，同時(shí)文本數(shù)據(jù)也顯示錄像和再現(xiàn)觀察指導(dǎo)的內(nèi)容。
圖17是用于概念地說明上述圖16所示的第1應(yīng)用例的具體的例的圖。
圖17是示出顯示于動(dòng)物園的監(jiān)視用的監(jiān)視器上的圖像幀。此圖像幀也是對(duì)每個(gè)馬賽克檢測(cè)圖像的移動(dòng)，設(shè)定加密與否，或?qū)γ總€(gè)馬賽克事先設(shè)定加密與否和強(qiáng)度。另外，這樣的應(yīng)用例，并非僅對(duì)被設(shè)定為ROI的馬賽克加密，對(duì)任意的馬賽克也設(shè)定加密。
也即，顯示欄中的動(dòng)物的馬賽克T11，T12，T13不加密，僅在該動(dòng)物有移動(dòng)時(shí)才發(fā)送編碼數(shù)據(jù)。另一方面，顯示站在欄前面的人物的馬賽克T21，T22，T23從保護(hù)隱私的觀點(diǎn)執(zhí)行低級(jí)別的加密。
應(yīng)編碼的活動(dòng)圖像數(shù)據(jù)也能應(yīng)用power point，表計(jì)算軟件，文字處理軟件，瀏覽器(browser)等的應(yīng)用軟件產(chǎn)生的數(shù)據(jù)，下面將使用圖18及圖19說明編碼動(dòng)作。另外，圖18及圖19皆為概念地說明圖14所示的活動(dòng)圖像數(shù)據(jù)的發(fā)送接收動(dòng)作上的幀編碼化的第2應(yīng)用例的圖。另外，由上述應(yīng)用程序等產(chǎn)生的數(shù)據(jù)檔一旦轉(zhuǎn)換成圖像數(shù)據(jù)后即被執(zhí)行壓縮處理。
由上述應(yīng)用程序產(chǎn)生的顯示數(shù)據(jù)等因隨著時(shí)間的經(jīng)過，頻繁地產(chǎn)生部分的變化(例如，游標(biāo)的移動(dòng)，和文字的追加顯示等)，故通過將每一定時(shí)間的顯示數(shù)據(jù)作為一個(gè)圖像幀，整體也能作為活動(dòng)圖像數(shù)據(jù)處理。因這種情況下，本說明里提及的活動(dòng)圖像數(shù)據(jù)除了通過攝像裝置等攝取的圖像數(shù)據(jù)之外，也包含由上述應(yīng)用軟件等產(chǎn)生的顯示數(shù)據(jù)，靜止圖像和攝像圖像的組合。
首先，圖18所示的例，是對(duì)文本數(shù)據(jù)，和相片(也可是攝像圖像)等的圖像幀進(jìn)行馬賽克化。這時(shí)，通過檢測(cè)指示器(Pointer)的移動(dòng)，對(duì)該指示器所在的馬賽克T22進(jìn)行編碼。
另外一方面，圖19的例，如圖19中的區(qū)域(a)所示那樣，在發(fā)送側(cè)終端裝置的監(jiān)視器畫面8A內(nèi)設(shè)定有發(fā)送用圖像區(qū)域(此區(qū)域系被馬賽克化以形成發(fā)送用圖像幀80)之外，還同時(shí)在該區(qū)域之外顯示power point，表計(jì)算軟件，文字處理軟件，瀏覽器等的應(yīng)用程序產(chǎn)生的資料數(shù)據(jù)。
如圖19中的區(qū)域(b)所示那樣，上述資料數(shù)據(jù)在監(jiān)視器畫面8A上于箭頭S1所示方向被拖引，在其一部分進(jìn)入發(fā)送用圖像區(qū)域后發(fā)送側(cè)終端機(jī)裝置能檢測(cè)出在馬賽克T21內(nèi)發(fā)生圖像的移動(dòng)。由此，發(fā)送側(cè)終端裝置對(duì)這個(gè)馬賽克T21進(jìn)行編碼，然后發(fā)送到接收側(cè)終端裝置。
接收側(cè)終端裝置，如圖19的區(qū)域(c)所示那樣，在監(jiān)視器畫面8B上顯示僅新近合成的解碼的馬賽克T21的圖像幀90。
再者，本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼方法的第3應(yīng)用例應(yīng)被編碼的圖像幀的一部分是將從與屬于發(fā)送對(duì)象的活動(dòng)圖像數(shù)據(jù)不同的信息源得出的圖像(壓縮級(jí)別即便低也不會(huì)對(duì)對(duì)話產(chǎn)生障礙的靜止圖像的一部分，和構(gòu)成別的活動(dòng)圖像的圖像幀的一部分)填入于例如相當(dāng)于非ROI的矩形區(qū)域那樣而構(gòu)成。由此構(gòu)成，更具臨場(chǎng)感的雙向?qū)υ捘懿皇芫€路通信容量，和圖像處理能力等現(xiàn)在的通信環(huán)境的限制。下面，將利用圖20～圖23詳細(xì)說明本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼方法的第3應(yīng)用例。
圖20是用于概念地說明本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的發(fā)送接收動(dòng)作的幀編碼化的第3應(yīng)用例(特別是發(fā)送動(dòng)作)的圖。
此第3應(yīng)用例是設(shè)定由多個(gè)分割區(qū)域VT11～VT33構(gòu)成的虛擬圖像幀以作為須編碼的圖像幀80，這些多個(gè)分割區(qū)域VT11～VT33是作為屬于JP2的馬賽克化(tiling)的處理單位的馬賽克處理。另外，圖像幀80分割為3×3，但虛擬圖像幀分割成4×4(分割尺寸與圖像幀80的矩形區(qū)域T11～T23相同)。
然后，將設(shè)定于圖像幀80的ROI的矩形區(qū)域T12，T22分配給在構(gòu)成虛擬圖像幀的分割區(qū)域中的該虛擬圖像幀的分割區(qū)域VT11～VT22，虛擬圖像幀的分割區(qū)域V13上，分配有對(duì)話者整體被攝取的活動(dòng)圖像幀86的一部分86a。而在虛擬圖像幀的分割區(qū)域VT31～VT32上各自分配有表示從鍵盤輸入的文字信息的文本圖像88的一部分88a，88b。在虛擬圖像幀的分割區(qū)域VT11，VT21上各自分配有表示自光筆920等輸入的手寫文字信息的白板圖像87的一部87a，87b。另外，在虛擬圖像幀的分割區(qū)域VT33上沒有分配圖像。
如上述那樣被分配于分割區(qū)域VT11～VT33的多種圖像上分別，如圖20的編碼級(jí)別的矩陣所示那樣，事先指定編碼級(jí)別。另外，“H”表示高壓縮率，“M”表示中壓縮率，“L”表示低壓縮率。另外，編碼級(jí)別矩陣中的斜線區(qū)域是表示虛擬圖像幀的分割區(qū)域VT33的編碼級(jí)別的區(qū)域，但因分割區(qū)域上未被分配圖像之故，不執(zhí)行編碼(碼量＝0)。依此編碼級(jí)別矩陣所指定的編碼級(jí)別，各分割區(qū)域VT11～VT33通過JP2技術(shù)個(gè)別被壓縮，然后將得出的分割區(qū)域VT11～VT33的編碼數(shù)據(jù)予以合成，由此產(chǎn)生各虛擬圖像幀的編碼數(shù)據(jù)。
將如上述那樣作為屬于編碼化對(duì)象的活動(dòng)圖像數(shù)據(jù)的圖像幀而設(shè)定的虛擬圖像幀沿著時(shí)間軸順序進(jìn)行編碼，由此，能依次得出混合靜止圖像和活動(dòng)圖像的一個(gè)圖像幀份的活動(dòng)圖像再現(xiàn)(regeneration)用的編碼數(shù)據(jù)。
另外一方面，圖21是用于概念地說明通過圖20所示的第3應(yīng)用例有關(guān)的幀編碼得出的編碼數(shù)據(jù)的解碼動(dòng)作的圖。
經(jīng)規(guī)定的傳送裝置27發(fā)送接收的編碼數(shù)據(jù)因系由圖20中所示的虛擬圖像幀的分割區(qū)域VT11～VT33的編碼數(shù)據(jù)所構(gòu)成，故分別對(duì)這些分割區(qū)域VT11～VT33的編碼數(shù)據(jù)所構(gòu)成，故分別對(duì)這些分割區(qū)域VT11～VT33的編碼數(shù)據(jù)進(jìn)行解碼，由此能得出分配給分割區(qū)域VT11～VT33的圖像以作為幀要素。另外，虛擬圖像幀的分割區(qū)域VT33的碼量因是0之故，準(zhǔn)備對(duì)話者本身的圖像85作為對(duì)應(yīng)于此分割區(qū)域VT33的幀要素。
合成如上述那樣被解碼的幀要素和另外準(zhǔn)備的對(duì)話者本身的圖像，由此，能得出圖21所示那樣的顯示圖像幀90。通過將來自對(duì)方的終端裝置的編碼數(shù)據(jù)沿著時(shí)間軸依次解碼，能依次得出混合靜止圖像和活動(dòng)圖像的一個(gè)圖像幀份的活動(dòng)圖像再現(xiàn)用的圖像幀。
圖22及圖23系分別為表示應(yīng)用圖20所示的第3應(yīng)用例有關(guān)的幀編碼時(shí)顯示用圖像幀的一例，此兩顯示用圖像幀皆如圖21所示那樣，通過解碼，或通過解碼及與別的圖像的合成而得出者。
圖22所示的顯示用圖像幀90是由分配給解碼的分割區(qū)域的圖像所構(gòu)成的區(qū)域90a及與對(duì)話者，自身的圖像90b的合成。此圖22所示的顯示用圖像幀90的例，斜線區(qū)域90c上分配文本圖像等的靜止圖像，剩余的區(qū)域上分配對(duì)話對(duì)方的圖像ROI。這樣，本發(fā)明有關(guān)的活動(dòng)圖像數(shù)據(jù)的編碼方法的第3應(yīng)用例，在進(jìn)行編碼處理時(shí)也可將對(duì)話對(duì)方的圖像的ROI分配給虛擬圖像幀的分割區(qū)域VT11～VT33的任一，另外，能隨意地變更對(duì)話對(duì)方的圖像和文本圖像等的靜止圖像的比例。
另外，圖23所示的顯示用圖像幀90是，假想指導(dǎo)者和鋼琴演奏者在進(jìn)行鋼琴教學(xué)(piano lesson)時(shí)，構(gòu)成顯示該指導(dǎo)者側(cè)的活動(dòng)圖像的一個(gè)圖像幀。如圖23所示，在構(gòu)成虛擬圖像幀的4個(gè)分割區(qū)域中3個(gè)分割區(qū)域上分配以多角度攝取的鋼琴演奏者的各個(gè)圖像，而在剩下的區(qū)域上分配顯示樂譜等的文本圖像。另外，將這樣的多角度攝像的圖像分配給虛擬圖像幀的分割區(qū)域的情況下，也可將參加在不同地點(diǎn)間舉行電視會(huì)議的一側(cè)的參加者各個(gè)的圖像分配給構(gòu)成虛擬圖像的若干分割區(qū)域，還同時(shí)將顯示會(huì)議數(shù)據(jù)的文本(text)圖像分配給剩余的分割區(qū)域。
從上述的本發(fā)明的說明，明白可對(duì)本發(fā)明做各種變更。這種變更不能視為逾越本發(fā)明的精神及范圍，所有本領(lǐng)域技術(shù)人員知曉的改良皆包含在所述的權(quán)利要求內(nèi)。
(產(chǎn)業(yè)上利用可能性)本發(fā)明能使用在實(shí)現(xiàn)實(shí)時(shí)的雙向?qū)υ挼碾p向?qū)υ捫拖到y(tǒng)那樣的特殊環(huán)境，也即，發(fā)送信息僅集中在顯示圖像的一部分區(qū)域的活動(dòng)圖像數(shù)據(jù)的特殊環(huán)境。
權(quán)利要求
1.一種活動(dòng)圖像數(shù)據(jù)的編碼方法，是將構(gòu)成活動(dòng)圖像數(shù)據(jù)的圖像幀各自沿著時(shí)間軸依次壓縮的活動(dòng)圖像數(shù)據(jù)的編碼方法，將構(gòu)成上述活動(dòng)圖像數(shù)據(jù)的圖像幀中應(yīng)編碼的圖像幀分割成多個(gè)區(qū)域，將上述多個(gè)分割區(qū)域分別對(duì)應(yīng)于設(shè)定在上述圖像幀內(nèi)的興趣區(qū)域及與該興趣區(qū)域不同的非興趣區(qū)域之一，使上述多個(gè)分割區(qū)域中對(duì)應(yīng)上述興趣區(qū)域的分割區(qū)域的碼量比對(duì)應(yīng)上述非興趣區(qū)域的分割區(qū)域的碼量多那樣對(duì)該多個(gè)分割區(qū)域分別進(jìn)行壓縮，由此產(chǎn)生各圖像幀的編碼數(shù)據(jù)。
2.如權(quán)利要求1所述的活動(dòng)圖像數(shù)據(jù)的編碼方法，其中，在上述多個(gè)分割區(qū)域中，使被檢測(cè)出區(qū)域內(nèi)圖像有移動(dòng)的分割區(qū)域?qū)?yīng)于上述興趣區(qū)域。
3.如權(quán)利要求1或2所述的活動(dòng)圖像數(shù)據(jù)的編碼方法，其中上述興趣區(qū)域?qū)?yīng)多個(gè)分割區(qū)域，對(duì)應(yīng)于興趣區(qū)域的這些分割區(qū)域分別被壓縮成具有不同的碼量。
4.如權(quán)利要求1至3中任一項(xiàng)所述的活動(dòng)圖像數(shù)據(jù)的編碼方法，其中在上述多個(gè)分割區(qū)域中對(duì)應(yīng)上述非興趣區(qū)域的分割區(qū)域的編碼處理中，該分割區(qū)域的碼量在一定期間中為0。
5.如權(quán)利要求1至4中任一項(xiàng)所述的活動(dòng)圖像數(shù)據(jù)的編碼方法，其中相當(dāng)于在上述多個(gè)分割區(qū)域中對(duì)應(yīng)上述興趣區(qū)域的分割區(qū)域的編碼數(shù)據(jù)，進(jìn)一步被加密。
6.如權(quán)利要求1、2、4或5中任一項(xiàng)所述的活動(dòng)圖像數(shù)據(jù)的編碼方法，其中構(gòu)成上述活動(dòng)圖像數(shù)據(jù)的圖像幀被分割成使上述興趣區(qū)域構(gòu)成為一個(gè)分割區(qū)域。
7.如權(quán)利要求6所述的活動(dòng)圖像數(shù)據(jù)的編碼方法，其中對(duì)應(yīng)上述興趣區(qū)域大小的變動(dòng)，動(dòng)態(tài)地變更上述分割區(qū)域的分割大小。
8.如權(quán)利要求1至5中任一項(xiàng)所述的活動(dòng)圖像數(shù)據(jù)的編碼方法，其中對(duì)應(yīng)上述興趣區(qū)域大小的變動(dòng)，動(dòng)態(tài)地變更對(duì)應(yīng)于該興趣區(qū)域的分割區(qū)域。
9.如權(quán)利要求1至8中任一項(xiàng)所述的活動(dòng)圖像數(shù)據(jù)的編碼方法，其中構(gòu)成上述活動(dòng)圖像數(shù)據(jù)的圖像幀分別依照J(rèn)PEG2000而被壓縮。
10.一種計(jì)算機(jī)程序，其通過計(jì)算機(jī)執(zhí)行權(quán)利要求1至9中任一項(xiàng)所述的活動(dòng)圖像數(shù)據(jù)的編碼方法。
11.一種記錄媒體，其記錄通過計(jì)算機(jī)執(zhí)行權(quán)利要求1至9中任一項(xiàng)所述的活動(dòng)圖像數(shù)據(jù)的編碼方法的計(jì)算機(jī)程序。
12.一種雙向?qū)υ捫拖到y(tǒng)，是經(jīng)由規(guī)定的傳送裝置將被攝像的對(duì)話者圖像相互提示給對(duì)方對(duì)話者，由此實(shí)現(xiàn)該對(duì)話者和該對(duì)方對(duì)話者間的對(duì)話的雙向?qū)υ捫拖到y(tǒng)，構(gòu)成經(jīng)由上述傳送裝置發(fā)送接收的活動(dòng)圖像數(shù)據(jù)的圖像幀通過權(quán)利要求1至9中任一項(xiàng)所述的活動(dòng)圖像數(shù)據(jù)的編碼方法而被編碼。
13.如權(quán)利要求12所述的雙向?qū)υ捫拖到y(tǒng)，其中為了調(diào)節(jié)顯示位置，上述興趣區(qū)域相對(duì)于被顯示的上述對(duì)話者自身的圖像而設(shè)定。
14.如權(quán)利要求12或13所述的雙向?qū)υ捫拖到y(tǒng)，其中除了上述興趣區(qū)域的設(shè)定外，還設(shè)定上述分割區(qū)域的壓縮級(jí)別及有無加密。
15.一種活動(dòng)圖像數(shù)據(jù)的解碼方法，對(duì)通過權(quán)利要求4所述的活動(dòng)圖像數(shù)據(jù)的編碼方法壓縮的各個(gè)圖像幀，對(duì)構(gòu)成該圖像幀的各個(gè)分割區(qū)域的編碼數(shù)據(jù)進(jìn)行解碼，然后將該解碼的各個(gè)分割區(qū)域合成而重新產(chǎn)生圖像幀，將當(dāng)作對(duì)應(yīng)上述興趣區(qū)域的分割區(qū)域而被壓縮的編碼數(shù)據(jù)解碼，同時(shí)準(zhǔn)備已解碼后存儲(chǔ)的另外圖像幀的對(duì)應(yīng)區(qū)域以作為對(duì)應(yīng)上述非興趣區(qū)域的分割區(qū)域，以及將對(duì)應(yīng)已解碼的上述興趣區(qū)域的分割區(qū)域和準(zhǔn)備的另外圖像幀的對(duì)應(yīng)區(qū)域合成以產(chǎn)生顯示用圖像幀。
16.一種計(jì)算機(jī)程序，其通過計(jì)算機(jī)執(zhí)行權(quán)利要求15所述的活動(dòng)圖像數(shù)據(jù)的解碼方法。
17.一種記錄媒體，其記錄通過計(jì)算機(jī)執(zhí)行權(quán)利要求15所述的活動(dòng)圖像數(shù)據(jù)的解碼方法的計(jì)算機(jī)程序。
18.一種雙向?qū)υ捫拖到y(tǒng)，是經(jīng)由規(guī)定的傳送裝置將被攝像的對(duì)話者圖像相互提示給對(duì)方對(duì)話者，由此實(shí)現(xiàn)該對(duì)話者和該對(duì)方對(duì)話者間的對(duì)話的雙向?qū)υ捫拖到y(tǒng)，構(gòu)成經(jīng)由上述傳送裝置被發(fā)送接收的活動(dòng)圖像數(shù)據(jù)的圖像幀的編碼數(shù)據(jù)通過權(quán)利要求15所述的活動(dòng)圖像數(shù)據(jù)的解碼方法而被解碼。
19.一種雙向?qū)υ捫拖到y(tǒng)的終端裝置，適用于經(jīng)由規(guī)定的傳送裝置將被攝像的對(duì)話者圖像相互提示給對(duì)方對(duì)話者，由此實(shí)現(xiàn)該對(duì)話者和該對(duì)方對(duì)話者間的對(duì)話的雙向?qū)υ捫拖到y(tǒng)，該終端裝置至少具備顯示該對(duì)方對(duì)話者的圖像的顯示裝置，以及用于攝取位于該顯示裝置的前方的該對(duì)話者的攝像部，該終端裝置還具備實(shí)現(xiàn)權(quán)利要求1至9中任一項(xiàng)所述的活動(dòng)圖像數(shù)據(jù)的編碼方法的控制部；以及將上述控制部壓縮的編碼數(shù)據(jù)送出到上述傳送裝置的輸入輸出部。
20.如權(quán)利要求19所述的雙向?qū)υ捫拖到y(tǒng)的終端裝置，其中還具備對(duì)顯示于上述顯示裝置的上述對(duì)話者自身的圖像設(shè)定上述興趣區(qū)域以調(diào)節(jié)顯示位置的輸入裝置。
21.如權(quán)利要求19或20所述的雙向?qū)υ捫拖到y(tǒng)的終端裝置，其中上述輸入裝置除了設(shè)定上述興趣區(qū)域外，同時(shí)取入有關(guān)上述分割區(qū)域的壓縮級(jí)別及有無加密的信息。
22.如權(quán)利要求19、20或21中任一項(xiàng)所述的雙向?qū)υ捫拖到y(tǒng)的終端裝置，其中上述控制部經(jīng)由上述輸入輸出部接收通過權(quán)利要求4所述的活動(dòng)圖像數(shù)據(jù)的編碼方法壓縮并被送出到上述傳送裝置的圖像數(shù)據(jù)，將構(gòu)成該圖像數(shù)據(jù)的各分割區(qū)域的編碼數(shù)據(jù)解碼，接著將該被解碼的各分割區(qū)域和事先準(zhǔn)備的另外圖像幀的對(duì)應(yīng)區(qū)域合成從而產(chǎn)生顯示用圖像幀。
23.一種活動(dòng)圖像數(shù)據(jù)的編碼方法，是將構(gòu)成活動(dòng)圖像數(shù)據(jù)的圖像幀分別沿著時(shí)間軸依次壓縮的活動(dòng)圖像數(shù)據(jù)的編碼方法，設(shè)定由多個(gè)分割區(qū)域構(gòu)成的虛擬圖像幀以作為應(yīng)編碼的圖像幀，將從構(gòu)成上述活動(dòng)圖像數(shù)據(jù)的圖像幀中應(yīng)編碼的圖像幀分割出的多個(gè)分割圖像中的至少一個(gè)和從與上述活動(dòng)圖像數(shù)據(jù)不同的信息源得到的劃出圖像，一起分配給構(gòu)成上述虛擬圖像幀的上述多個(gè)分割區(qū)域的每一個(gè)，對(duì)應(yīng)設(shè)定在該多個(gè)分割區(qū)域的各個(gè)區(qū)域的編碼級(jí)別而個(gè)別地壓縮被分配給構(gòu)成上述虛擬圖像幀的上述多個(gè)分割區(qū)域的各個(gè)圖像，由此產(chǎn)生包含多個(gè)種類的圖像信息的各虛擬圖像幀的編碼數(shù)據(jù)。
24.如權(quán)利要求23所述的活動(dòng)圖像數(shù)據(jù)的編碼方法，其中上述多個(gè)分割區(qū)域分別對(duì)應(yīng)于被設(shè)定在上述虛擬圖像幀內(nèi)的興趣區(qū)域及與該興趣區(qū)域不同的非興趣區(qū)域之一，上述多個(gè)分割區(qū)域分別被壓縮成對(duì)應(yīng)于上述興趣區(qū)域的分割區(qū)域的碼量比對(duì)應(yīng)于上述非興趣區(qū)域的分割區(qū)域的碼量多。
25.如權(quán)利要求24所述的活動(dòng)圖像數(shù)據(jù)的編碼方法，其中在上述多個(gè)分割區(qū)域中，被檢測(cè)出區(qū)域內(nèi)的圖像有移動(dòng)的分割區(qū)域?qū)?yīng)于上述興趣區(qū)域。
26.如權(quán)利要求23至25中任一項(xiàng)所述的活動(dòng)圖像數(shù)據(jù)的編碼方法，其中分配給構(gòu)成上述虛擬圖像幀的上述多個(gè)分割區(qū)域中的至少一個(gè)的圖像的編碼數(shù)據(jù)進(jìn)一步被加密。
27.如權(quán)利要求23至26中任一項(xiàng)所述的活動(dòng)圖像數(shù)據(jù)的編碼方法，其中在上述多個(gè)分割區(qū)域中的至少一個(gè)的編碼處理中，該分割區(qū)域的碼量在一定期間中為0。
28.如權(quán)利要求23至27中任一項(xiàng)所述的活動(dòng)圖像數(shù)據(jù)的編碼方法，其中上述虛擬圖像幀分別依照J(rèn)PEG2000而被壓縮。
29.一種計(jì)算機(jī)程序，其通過計(jì)算機(jī)執(zhí)行權(quán)利要求23至28中任一項(xiàng)所述的活動(dòng)圖像數(shù)據(jù)的解碼方法。
30.一種記錄媒體，其記錄通過計(jì)算機(jī)執(zhí)行權(quán)利要求23至28中任一項(xiàng)所述的活動(dòng)圖像數(shù)據(jù)的編碼方法的計(jì)算機(jī)程序。
31.一種雙向?qū)υ捫拖到y(tǒng)，是經(jīng)由規(guī)定的傳送裝置將被攝像的對(duì)話者圖像相互提示給對(duì)方對(duì)話者，由此實(shí)現(xiàn)該對(duì)話者和該對(duì)方對(duì)話者間的對(duì)話的雙向?qū)υ捫拖到y(tǒng)，構(gòu)成經(jīng)由上述傳送裝置發(fā)送接收的活動(dòng)圖像數(shù)據(jù)的圖像幀通過權(quán)利要求23至28中任一項(xiàng)所述的活動(dòng)圖像數(shù)據(jù)的編碼方法而被編碼。
32.一種雙向?qū)υ捫拖到y(tǒng)的終端裝置，適用于經(jīng)由規(guī)定的傳送裝置將被攝像的對(duì)話者圖像相互提示給對(duì)方對(duì)話者，由此實(shí)現(xiàn)該對(duì)話者和該對(duì)方對(duì)話者間的對(duì)話的雙向?qū)υ捫拖到y(tǒng)，該終端裝置至少具備顯示該對(duì)方對(duì)話者的圖像的顯示裝置，以及用于攝取位于該顯示裝置的前方的該對(duì)話者的攝像部，該終端裝置還具備實(shí)現(xiàn)權(quán)利要求23至28中任一項(xiàng)所述的活動(dòng)圖像數(shù)據(jù)的編碼方法的控制部；以及將上述控制部壓縮的編碼數(shù)據(jù)送出到上述傳送裝置的輸入輸出部。
33.如權(quán)利要求32所述的雙向?qū)υ捫拖到y(tǒng)的終端裝置，其中還具備取入有關(guān)上述分割區(qū)域的壓縮級(jí)別及有無加密的信息的輸入裝置。
34.如權(quán)利要求29所述的雙向?qū)υ捫拖到y(tǒng)的終端裝置，其中上述控制部經(jīng)由上述輸入輸出部接收通過權(quán)利要求27所述的活動(dòng)圖像數(shù)據(jù)的編碼方法壓縮并被送出到上述傳送裝置的圖像數(shù)據(jù)，將構(gòu)成該圖像數(shù)據(jù)的各個(gè)分割區(qū)域的編碼數(shù)據(jù)解碼，接著將該被解碼的各分割區(qū)域和替換碼量為0的分割區(qū)域而準(zhǔn)備的圖像合成從而產(chǎn)生顯示用圖像數(shù)據(jù)。
全文摘要
本發(fā)明涉及在實(shí)現(xiàn)實(shí)時(shí)的雙向?qū)υ挼碾p向?qū)υ捫拖到y(tǒng)那樣的、發(fā)送信息僅集中在顯示圖像的一部分區(qū)域上的活動(dòng)圖像數(shù)據(jù)的特殊對(duì)話環(huán)境下，有效的活動(dòng)圖像數(shù)據(jù)的編碼方法等。該編碼方法是將構(gòu)成活動(dòng)圖像數(shù)據(jù)的圖像幀分割成多個(gè)矩形區(qū)域，接著，將這些多個(gè)矩形區(qū)域分別對(duì)應(yīng)于事先設(shè)定的ROI和非ROI。然后使對(duì)應(yīng)ROI的矩形區(qū)域的碼量比對(duì)應(yīng)非ROI的矩形區(qū)域的碼量多那樣依次壓縮這些矩形區(qū)域，進(jìn)而產(chǎn)生各個(gè)圖像幀的編碼數(shù)據(jù)。
文檔編號(hào)H04N11/02GK1914915SQ200580003640
公開日2007年2月14日申請(qǐng)日期2005年2月23日優(yōu)先權(quán)日2004年4月23日
發(fā)明者貴家仁志, 柿井俊昭, 牧久雄, 畑洋一申請(qǐng)人:住友電氣工業(yè)株式會(huì)社, 貴家仁志

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：貴家仁志;柿井俊昭;牧久雄;畑洋一
技術(shù)所有人：住友電氣工業(yè)株式會(huì)社;貴家仁志
我是此專利的發(fā)明人

上一篇：用于無線通信的系統(tǒng)、方法、設(shè)備和計(jì)算機(jī)程序的制作方法
上一篇：基于密鑰的加密的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請(qǐng)點(diǎn)此查看客服電話進(jìn)行咨詢。
1、王老師：1.數(shù)字信號(hào)處理 2.傳感器技術(shù)及應(yīng)用 3.機(jī)電一體化產(chǎn)品開發(fā) 4.機(jī)械工程測(cè)試技術(shù) 5.逆向工程技術(shù)研究
2、王老師：1.機(jī)器人 2.嵌入式控制系統(tǒng)開發(fā)
3、孫老師：1.振動(dòng)信號(hào)時(shí)頻分析理論與測(cè)試系統(tǒng)設(shè)計(jì) 2.汽車檢測(cè)系統(tǒng)設(shè)計(jì) 3.汽車電子控制系統(tǒng)設(shè)計(jì)
4、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
5、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

圖像編解碼相關(guān)技術(shù)

jpeg的圖像編解碼相關(guān)技術(shù)

圖像編解碼哈夫曼編碼相關(guān)技術(shù)

關(guān)于jpeg的圖像編解碼相關(guān)技術(shù)

jpeg圖像編解碼相關(guān)技術(shù)

bmp圖像huffman編解碼相關(guān)技術(shù)

dsc圖像編解碼相關(guān)技術(shù)

json數(shù)據(jù)的解碼和編碼相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

活動(dòng)圖像數(shù)據(jù)的編碼方法、解碼方法及實(shí)施這些方法的終端裝置、以及雙向?qū)υ捫拖到y(tǒng)的制作方法

活動(dòng)圖像數(shù)據(jù)的編碼方法、解碼方法及實(shí)施這些方法的終端裝置、以及雙向?qū)υ捫拖到y(tǒng)的制作方法