專利名稱:視頻顯示裝置、視頻記錄裝置、視頻處理裝置以及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻顯示裝置、視頻記錄裝置、視頻處理裝置以及方法。
背景技術(shù):
在通過數(shù)字電視廣播發(fā)送的圖像信號中包含與圖像重疊的字幕(例如時刻顯示、地震速報、新聞速報等的文字信息)。通過該字幕的重疊,除了本來的圖像以外,還能夠得到追加的信息。特別地,關(guān)于針對 地震、洪水、臺風(fēng)等自然災(zāi)害的警報、導(dǎo)彈攻擊或恐怖行動等的突發(fā)事件信息、或新聞速報等的緊急信息,在字幕顯示的前后或字幕顯示中鳴響基于鐘聲、蜂鳴、音樂、電子音等的速報音(或警報音、鐘聲),使視聽者關(guān)注字幕。但是,對于視聽者來說,有時不需要該字幕或速報音。特別是在記錄通過廣播送來的圖像信號或音頻信號并在此后進行再現(xiàn)和視聽的情況下,在從廣播時起到視聽為止經(jīng)過了充分時間的情況下,往往不需要字幕中包含的信息。在專利文獻I中記載有如下技術(shù):利用與第I圖像信號相同內(nèi)容的不存在字幕的第2圖像信號的像素信號,對第I圖像信號中的與字幕區(qū)域?qū)?yīng)的像素信號進行置換,從而刪除字幕。具體而言,第I圖像信號是地面數(shù)字廣播的12波段中進行的高清(HDTV)廣播的圖像信號,第2圖像信號是對地面數(shù)字廣播的部分接收層分配的I波段中進行的廣播(以下稱作單波段廣播)的圖像信號。在非專利文獻I中示出在接收到收音機的緊急地震速報鐘聲后接通音頻的裝置,揭示了如下技術(shù):觀測廣播節(jié)目的音頻信號的頻率特性,將特定的4個頻率的振幅與閾值進行比較,進行緊急地震速報鐘聲的判定。專利文獻I日本特開2007-336405號公報專利文獻2日本特開2009-93472號公報專利文獻3日本特開2007-180669號公報非專利文獻I「緊急地震速報受信機O製作」、[online]、卜9>夕^夕技術(shù)、2009 年 I 月號、CQ 出版社、 1 > 夕一才、'7 卜 <URL:http://torag1.cqpub.c0.jp/tabid/25但是,伴有速報音的字幕是與本來的視頻無關(guān)的字幕的可能性很高,有時期望消除這種子眷。
發(fā)明內(nèi)容
本發(fā)明的目的在于,提供能夠選擇性地消除伴有速報音的字幕的視頻處理裝置、視頻顯示裝置、視頻記錄裝置和視頻處理方法。本發(fā)明的視頻處理裝置的特征在于,該視頻處理裝置具有:字幕檢測部,其從輸入的一連串視頻幀中檢測包含字幕的字幕區(qū)域;速報音檢測部,其與所述一連串視頻幀對應(yīng)地,從輸入的一連串音頻信號中檢測速報音;以及視頻處理部,其將所述一連串視頻幀中被檢測到所述字幕區(qū)域的視頻幀中的所述字幕區(qū)域,置換成根據(jù)所述一連串視頻幀中的所述字幕區(qū)域的字幕出現(xiàn)之前的視頻幀而得到的圖像,輸出對所述字幕區(qū)域進行置換后的視頻幀,所述視頻處理部根據(jù)所述速報音檢測部的檢測結(jié)果,選擇性地對伴有所述速報音的字幕的字幕區(qū)域進行置換。本發(fā)明的視頻顯示裝置的特征在于,該視頻顯示裝置具有:上述視頻處理裝置;以及再現(xiàn)部,其顯示從所述視頻處理裝置的所述視頻處理部輸出的視頻幀。本發(fā)明的視頻記錄裝置的特征在于,該視頻記錄裝置具有:上述視頻處理裝置;以及記錄部,其記錄從所述視頻處理裝置的所述視頻處理部輸出的視頻幀。本發(fā)明的視頻處理方法的特征在于,該視頻處理方法具有以下步驟:字幕檢測步驟,從輸入的一連串視頻幀中檢測包含字幕的字幕區(qū)域;速報音檢測步驟,與所述一連串視頻幀對應(yīng)地,從輸入的一連串音頻信號中檢測速報音;以及視頻處理步驟,將所述一連串視頻幀中被檢測到所述字幕區(qū)域的視頻幀中的所述字幕區(qū)域,置換成根據(jù)所述一連串視頻幀中的所述字幕區(qū)域的字幕出現(xiàn)之前的視頻幀而得到的圖像,輸出對所述字幕區(qū)域進行置換后的視頻幀,在所述視頻處理步驟中,根據(jù)所述速報音檢測步驟的檢測結(jié)果,選擇性地對伴有所述速報音的字幕的字幕區(qū)域進行置換。根據(jù)本發(fā)明,能夠選擇性地消除伴有速報音的字幕。
圖1是示出實施方式I的視頻處理裝置的結(jié)構(gòu)的框圖。圖2是示出視頻記錄部的結(jié)構(gòu)的框圖。圖3是示出視頻幀中包含的字幕區(qū)域的一例的圖。圖4是示出實施方式I的視頻處理裝置的動作的流程圖。圖5是示出字幕遷移的一例的圖。圖6是示出視頻記錄部的狀態(tài)的一例的圖。圖7是示出視頻記錄部的狀態(tài)的另一例的圖。圖8是示出字幕遷移的另一例的圖。圖9是示出實施方式2的視頻處理裝置的結(jié)構(gòu)的框圖。圖10是示出字幕變更檢測部中的檢測信息的圖。圖11是示出字幕的一例的圖。圖12是用于說明字幕變更檢測部中的字幕變更檢測方法的圖。圖13是用于說明將字幕區(qū)域置換成根據(jù)周邊像素而得到的圖像的方法的圖。圖14是用于說明將字幕區(qū)域置換成根據(jù)周邊像素而得到的圖像的方法的圖。圖15是示出實施方式2中的步驟S405的判定結(jié)果的圖。圖16是示出實施方式3的視頻處理裝置的結(jié)構(gòu)的框圖。圖17是示出實施方式3的視頻處理裝置的動作的流程圖。圖18是示出實施方式4的視頻處理裝置的結(jié)構(gòu)的框圖。圖19是示出實施方式5的視頻處理裝置的結(jié)構(gòu)的框圖。圖20是示出實施方式6的視頻處理裝置的結(jié)構(gòu)的框圖。圖21是示出實施方式7的視頻處理裝置的結(jié)構(gòu)的框圖。圖22是示出實施方式7的視頻處理裝置的動作的流程圖。
圖23是不出字幕遷移和速報音的一例的圖。圖24是示出字幕遷移和速報音的另一例的圖。圖25是示出字幕遷移和速報音的又一例的圖。圖26是示出實施方式8的視頻處理裝置的動作的流程圖。圖27是示出實施方式9的視頻處理裝置的動作的流程圖。圖28是示出實施方式10的視頻處理裝置的結(jié)構(gòu)的框圖。圖29是示出實施方式11的視頻顯示裝置的結(jié)構(gòu)的圖。圖30是示出實施方式12的視頻記錄裝置的結(jié)構(gòu)的圖。圖31是示出實施方式13的視頻記錄再現(xiàn)裝置的結(jié)構(gòu)的圖。圖32是示出視頻處理裝置的變形例的框圖。標(biāo)號說明100、900、1600、1800、1900、2000、2400、3100、3202、3302、3403:視頻處理裝置;
101:視頻記錄部;102:子眷檢測部;103:子眷變更檢測部;104:記錄控制部;105:視頻處理部;1601:場景變更檢測部;1801:文字識別部;2001:數(shù)據(jù)廣播解析部;3200:視頻顯示裝置;3201、3301、3401:接收部;3300:視頻記錄裝置;3303、3402:記錄部;3400:視頻記錄再現(xiàn)裝置;2401:速報音檢測部;2402:音頻信號處理部;3101:系統(tǒng)控制部;3203、3404:再現(xiàn)部;3501:字幕/字幕變更檢測部。
具體實施例方式下面,根據(jù)附圖對本發(fā)明的實施方式進行說明。實施方式I圖1是示出實施方式I的視頻處理裝置100的結(jié)構(gòu)的框圖。該視頻處理裝置100接收輸入視頻信號,從該輸入視頻信號中檢測包含字幕的字幕區(qū)域,在檢測到字幕區(qū)域的情況下,對該字幕區(qū)域進行置換(或插值),輸出消除字幕后的輸出視頻信號。輸入視頻信號例如是使用地面數(shù)字廣播中的12波段廣播的高清(HDTV)廣播的視頻信號等。字幕是在視頻(例如主視頻或本來的視頻)中重疊、插入或合成的文字信息、記號信息、圖形信息等的信息,例如是時刻顯示、地震速報、新聞速報、字幕等。根據(jù)地域、內(nèi)容和形式,字幕被稱作解說詞、副標(biāo)題、滾動字幕、警報或疊印字幕等。在圖1中,視頻處理裝置100具有視頻記錄部101、字幕檢測部102、字幕變更檢測部103、記錄控制部104和視頻處理部105。視頻記錄部101從外部接收一連串的視頻信號(具體而言是一連串視頻幀)作為輸入視頻信號,并將其記錄在存儲器中。這里,視頻幀是指構(gòu)成動態(tài)圖像的一個一個的靜止圖像。在以下的說明中,將“視頻幀”適當(dāng)簡稱作“幀”。具體而言,依次對視頻記錄部101輸入一連串視頻巾貞,視頻記錄部101記錄一連串視頻巾貞中的現(xiàn)在的視頻巾貞即當(dāng)前視頻巾貞和該當(dāng)前視頻幀之前的視頻幀。并且,視頻記錄部101記錄一連串視頻幀中的字幕出現(xiàn)(或字幕顯示)之前的視頻幀。字幕出現(xiàn)之前的視頻幀優(yōu)選的是字幕出現(xiàn)緊前的視頻幀,在一個方式中,是字幕出現(xiàn)的視頻幀的前一個視頻幀。針對字幕的出現(xiàn),只要適當(dāng)決定何種程度之前的視頻幀為字幕出現(xiàn)之前的視頻幀即可。具體而言,只要字幕出現(xiàn)之前的視頻幀是能夠良好地對字幕區(qū)域進行置換或插值的程度之前的視頻幀即可,例如可以是字幕出現(xiàn)的視頻幀的數(shù)幀前的視頻幀。在本例子中,如圖2所示,視頻記錄部101包括存儲區(qū)域A、存儲區(qū)域B和存儲區(qū)域C。視頻記錄部101受到后述記錄控制部104的控制,對存儲器進行管理。具體而言,視頻記錄部101根據(jù)來自記錄控制部104的控制信號,將當(dāng)前視頻幀和其緊前的視頻幀保存在存儲區(qū)域B和存儲區(qū)域C中,將字幕出現(xiàn)緊前的視頻幀保存在存儲區(qū)域A中。這里,視頻記錄部101是幀存儲器,分別針對存儲區(qū)域A、B、C記錄I幀的視頻信號。但是,視頻記錄部101也可以在存儲區(qū)域A、B、C的任意一方中記錄I幀中的一部分(具體而言,僅是字幕部分)。在一個例子中,在存儲區(qū)域中記錄的I幀中的一部分是預(yù)先決定的固定位置。例如,在地面數(shù)字廣播中,絕大多數(shù)情況下在視頻的上部顯示字幕,因此,如圖3所示,視頻記錄部101也可以記錄由視頻幀表示的視頻整體區(qū)域301中的上部的部分區(qū)域302的視頻信號。但是,I幀中的一部分可以是可變位置,例如可以利用字幕檢測部102的檢測結(jié)果來決定。再次參照圖1,字幕檢測部102從輸入到視頻處理裝置100的一連串視頻幀中,檢測包含字幕的字幕區(qū)域。具體而言,字幕檢測部102針對由視頻記錄部101記錄的當(dāng)前視頻幀進行字幕區(qū)域的檢測。更具體而言,字幕檢測部102從視頻記錄部101中讀出當(dāng)前視頻幀,對該當(dāng)前視頻幀進行解析,判定在當(dāng)前視頻幀中是否包含字幕。然后,在判定為包含字幕的情況下,字幕檢測部102輸出表示包含該字幕的字幕區(qū)域的區(qū)域信息作為檢測結(jié)果。這里,字幕檢測部102檢測矩形區(qū)域作為字幕區(qū)域,輸出該矩形區(qū)域的坐標(biāo)作為區(qū)域信息。但是,字幕區(qū)域的形狀不限于矩形,例如也可以是梯形、平行四邊形、橢圓形等。并且,字幕區(qū)域也可以是構(gòu)成字幕的像素的集合。另一方面,在判定為在當(dāng)前視頻幀中不包含字幕的情況下,字幕檢測部102輸出表示不包含字幕的信息(例如僅是原點的坐標(biāo))作為檢測結(jié)果。但是,字幕檢測部102也可以構(gòu)成為在判定為不包含字幕的情況下不進行任何輸出。作為字幕檢測部102中的字幕檢測算法,例如使用專利文獻2所示的方法。但是,不限于該方法,只要是能夠檢測字幕區(qū)域的方法即可,也可以使用其它方法。字幕變更檢測部103從輸入到視頻處理裝置100的一連串視頻幀中檢測字幕的出現(xiàn)。具體而言,字幕變更檢測部103針對由視頻記錄部101記錄的當(dāng)前視頻幀進行字幕出現(xiàn)的檢測。在一個方式中,字幕變更檢測部103根據(jù)字幕檢測部102的檢測結(jié)果,在當(dāng)前視頻幀緊前的視頻幀中不包含字幕,在當(dāng)前視頻幀中包含字幕的情況下,輸出表示出現(xiàn)字幕的信息作為檢測結(jié)果。在另一方式中,字幕變更檢測部103從視頻記錄部101中讀出當(dāng)前視頻幀和當(dāng)前視頻幀緊前的視頻幀,對兩個視頻幀進行比較,檢測字幕的出現(xiàn)。例如,字幕變更檢測部103檢測構(gòu)成字幕的文字的邊緣和該文字的輪廓部的邊緣,根據(jù)檢測到的邊緣的變化,檢測字幕的出現(xiàn)。關(guān)于基于該邊緣的字幕變更的檢測,在實施方式2中詳細說明。字幕變更檢測部103也可以從輸入到視頻處理裝置100的一連串視頻幀中,檢測字幕的消失。例如,字幕變更檢測部103可以根據(jù)字幕檢測部102的檢測結(jié)果,在當(dāng)前視頻幀緊前的視頻幀中包含字幕,在當(dāng)前視頻幀中不包含字幕的情況下,輸出表示字幕消失的信息作為檢測結(jié)果。記錄控制部104根據(jù)字幕檢測部102和字幕變更檢測部103的檢測結(jié)果,對視頻記錄部101進行控制。具體而言,記錄控制部104根據(jù)字幕變更檢測部103的檢測結(jié)果,記錄輸入到視頻處理裝置100的一連串視頻幀中的字幕出現(xiàn)之前的視頻幀。更具體而言,在由字幕變更檢測部103針對當(dāng)前視頻幀檢測到字幕的出現(xiàn)的情況下,記錄控制部104對視頻記錄部101進行控制,將記錄在存儲區(qū)域B或C中的當(dāng)前視頻幀緊前的視頻幀作為字幕出現(xiàn)緊前的視頻中貞,記錄在存儲區(qū)域A中。也可以在由字幕變更檢測部103針對當(dāng)前視頻幀檢測到字幕的消失的情況下,或由字幕檢測部102針對當(dāng)前視頻幀檢測到無字幕的情況下,記錄控制部104對視頻記錄部101進行控制,消除在存儲區(qū)域A中記錄的視頻幀。并且,記錄控制部104對視頻記錄部101進行控制,按照每幀,將輸入到視頻處理裝置100的視頻幀交替記錄在存儲區(qū)域B和存儲區(qū)域C的一方中。即,記錄控制部104對視頻記錄部101進行控制,使得在存儲區(qū)域B和存儲區(qū)域C之間,按照每幀調(diào)換當(dāng)前視頻幀用的存儲區(qū)域和當(dāng)前視頻幀緊前的視頻幀用的存儲區(qū)域。視頻處理部105將輸入到視頻處理裝置100的一連串視頻幀中的、由字幕檢測部102檢測到字幕區(qū)域的視頻幀中的字幕區(qū)域,置換成根據(jù)該字幕區(qū)域的字幕出現(xiàn)之前的視頻幀而得到的圖像。即,視頻處理部105根據(jù)該字幕區(qū)域的字幕出現(xiàn)之前的視頻幀,對檢測到字幕區(qū)域的視頻幀中的字幕區(qū)域進行插值。例如,視頻處理部105根據(jù)字幕出現(xiàn)之前的視頻幀取得或生成無字幕的置換圖像,將字幕區(qū)域置換成置換圖像。視頻處理部105可以取得字幕出現(xiàn)之前的視頻幀中的與字幕區(qū)域?qū)?yīng)的區(qū)域的圖像作為置換圖像,也可以對與字幕區(qū)域?qū)?yīng)的區(qū)域的圖像實施圖像處理而生成置換圖像。上述與字幕區(qū)域?qū)?yīng)的區(qū)域可以是與字幕區(qū)域相同的區(qū)域,也可以是包含與字幕區(qū)域的圖像類似的圖像的區(qū)域。在本例子中,在由字幕檢測部102針對當(dāng)前視頻幀檢測到字幕區(qū)域的情況下,視頻處理部105將在存儲區(qū)域B或C中記錄的當(dāng)前視頻幀的字幕區(qū)域置換成根據(jù)在存儲區(qū)域A中記錄的字幕出現(xiàn)緊前的視頻幀而得到的圖像,輸出對字幕區(qū)域進行置換后的當(dāng)前視頻幀作為輸出視頻幀。例如,視頻處理部105從字幕檢測部102受理區(qū)域信息,將當(dāng)前視頻幀中的由該區(qū)域信息所示的區(qū)域(即字幕區(qū)域)的視頻信號,置換成字幕出現(xiàn)緊前的視頻幀中的由該區(qū)域信息所示的區(qū)域(即與字幕區(qū)域?qū)?yīng)的區(qū)域)的視頻信號。圖4是示出實施方式I的視頻處理裝置100的動作的流程圖。下面,參照圖4對視頻處理裝置100的動作進行說明。另外,按照每幀執(zhí)行圖4的處理。視頻處理裝置100將輸入的視頻幀(或I幀的視頻信號)作為當(dāng)前視頻幀,記錄在當(dāng)前視頻幀用的存儲區(qū)域(存儲區(qū)域B或C)中(S401)。接著,視頻處理裝置100針對在當(dāng)前視頻幀用的存儲區(qū)域中記錄的視頻幀進行字幕區(qū)域的檢測(S402)。接著,視頻處理裝置100針對在當(dāng)前視頻幀用的存儲區(qū)域中記錄的當(dāng)前視頻幀進行字幕變更(字幕的出現(xiàn)和消失)的檢測(S403)。接著,視頻處理裝置100判定在步驟S402中是否檢測到字幕區(qū)域(S404),在檢測到字幕區(qū)域的情況下(S404:是),進入步驟S405,在沒有檢測到字幕區(qū)域的情況下(S404:否),進入步驟S408。在步驟S405中,視頻處理裝置100判定在步驟S403中是否檢測到字幕的出現(xiàn),在檢測到字幕的出現(xiàn)的情況下(S405:是),進入步驟S406,在沒有檢測到字幕的出現(xiàn)的情況下(S405:否),進入步驟S407。在步驟S406中,視頻處理裝置100將在當(dāng)前視頻幀緊前的視頻幀用的存儲區(qū)域中記錄的視頻幀(即上次在步驟S401中記錄的視頻幀)記錄在字幕出現(xiàn)緊前的視頻幀用的存儲區(qū)域A中,進入步驟S407。在步驟S407中,視頻處理裝置100從當(dāng)前視頻幀用的存儲區(qū)域中讀出當(dāng)前視頻幀,將該當(dāng)前視頻幀中的在步驟S402中檢測到的字幕區(qū)域的圖像,置換成根據(jù)在存儲區(qū)域A中記錄的字幕出現(xiàn)緊前的視頻幀而得到的圖像,輸出消除字幕后的當(dāng)前視頻幀作為輸出視頻巾貞,進入步驟S411。在步驟S408中,視頻處理裝置100判定在步驟S403中是否檢測到字幕的消失,在檢測到字幕的消失的情況下(S408:是),進入步驟S409,在沒有檢測到字幕的消失的情況下(S408:否),進入步驟S410。在步驟S409中,視頻處理裝置100清除存儲區(qū)域A,進入步驟S410。在步驟S410中,視頻處理裝置100從當(dāng)前視頻幀用的存儲區(qū)域中讀出當(dāng)前視頻幀,輸出該當(dāng)前視頻幀作為輸出視頻幀,進入步驟S411。在步驟S411中,視頻處理裝置100進行在存儲區(qū)域B與存儲區(qū)域C之間調(diào)換當(dāng)前視頻幀用的存儲區(qū)域和當(dāng)前視頻幀緊前的視頻幀用的存儲區(qū)域的處理,結(jié)束處理。在上述動作中,例如,步驟S401由視頻記錄部101執(zhí)行,步驟S402由字幕檢測部102執(zhí)行,步驟S403由字幕變更檢測部103執(zhí)行,步驟S404 S406、S408 S409、S411由記錄控制部104執(zhí)行,步驟S407、S410由視頻處理部105執(zhí)行。另外,在圖4中,可以省略步驟S408,在步驟S404的判定結(jié)果為“否”的情況下,視頻處理裝置100也可以進入步驟S409。并且,可以省略步驟S408和S409,在步驟S404的判定結(jié)果為“否”的情況下,視頻處理裝置100也可以進入步驟S410。圖5是示出字幕遷移的一例的圖。下面,對圖5那樣字幕遷移的情況下的視頻處理裝置100的各部的動作和存儲狀態(tài)進行說明。在期間501中,不存在子眷。因此,在子眷檢測部102中沒有檢測到子眷,在子眷變更檢測部103中沒有檢測到字幕變更。記錄控制部104進行調(diào)換當(dāng)前視頻幀用的存儲區(qū)域和當(dāng)前視頻幀緊前的視頻幀用的存儲區(qū)域的控制。由此,在存儲區(qū)域B和C中,按照每幀而交替保存視頻幀。具體而言,關(guān)于視頻記錄部101的狀態(tài),按照每幀而交替重復(fù)圖6的狀態(tài)601和狀態(tài)602。由于在期間501中不存在字幕,因此,在狀態(tài)601和602中的任意一方中,存儲區(qū)域A為空(沒有任何記錄的狀態(tài))。在狀態(tài)601中,存儲區(qū)域C是當(dāng)前視頻幀用的存儲區(qū)域,存儲區(qū)域B是當(dāng)前視頻幀緊前的視頻幀用的存儲區(qū)域。在狀態(tài)602中,存儲區(qū)域B是當(dāng)前視頻幀用的存儲區(qū)域,存儲區(qū)域C是當(dāng)前視頻幀緊前的視頻幀用的存儲區(qū)域。在期間501中,視頻處理部105不進行置換,輸出當(dāng)前視頻幀作為輸出視頻幀。在期間502中,存在字幕Tl,在從期間501向期間502轉(zhuǎn)移時,產(chǎn)生從無字幕到字眷Tl的子眷變更TCl。在期間502的開頭(最初的巾貞),在子眷檢測部102中檢測到子眷區(qū)域,在字幕變更檢測部103中檢測到字幕的出現(xiàn)。當(dāng)設(shè)字幕變更TCl時刻的存儲狀態(tài)為圖6的狀態(tài)601時,記錄控制部104根據(jù)字幕變更檢測部103的檢測結(jié)果,將在存儲區(qū)域B中記錄的視頻幀(即當(dāng)前視頻幀緊前的視頻幀)復(fù)制到存儲區(qū)域A中。由此,視頻記錄部101的存儲狀態(tài)從圖6的狀態(tài)601遷移到圖7的狀態(tài)701。在期間502之后的期間中,在字幕檢測部102中檢測到字幕區(qū)域,在字幕變更檢測部103中沒有檢測到字幕變更。記錄控制部
104進行調(diào)換當(dāng)前視頻幀用的存儲區(qū)域和當(dāng)前視頻幀緊前的視頻幀用的存儲區(qū)域的控制。由此,在存儲區(qū)域B和C中,按照每幀而交替保存視頻幀。具體而言,關(guān)于視頻記錄部101的狀態(tài),按照每幀而交替重復(fù)圖7的狀態(tài)702和狀態(tài)703。在狀態(tài)702中,存儲區(qū)域B是當(dāng)前視頻幀用的存儲區(qū)域,存儲區(qū)域C是當(dāng)前視頻幀緊前的視頻幀用的存儲區(qū)域。在狀態(tài)703中,存儲區(qū)域C是當(dāng)前視頻幀用的存儲區(qū)域,存儲區(qū)域B是當(dāng)前視頻幀緊前的視頻幀用的存儲區(qū)域。在存儲區(qū)域A中依然保持字幕Tl出現(xiàn)緊前的視頻幀。在期間502中,視頻處理部105通過存儲區(qū)域A的視頻幀對當(dāng)前視頻幀的字幕區(qū)域進行置換,輸出消除字幕Tl后的當(dāng)前視頻巾貞作為輸出視頻中貞。在期間503中,存在字幕T2,在從期間502向期間503轉(zhuǎn)移時,產(chǎn)生字幕從字幕Tl切換成子眷T2的子眷變更TC2。在期間503中,在子眷檢測部102中檢測到子眷區(qū)域,在子幕變更檢測部103中沒有檢測到字幕的出現(xiàn)。記錄控制部104進行調(diào)換當(dāng)前視頻幀用的存儲區(qū)域和當(dāng)前視頻幀緊前的視頻幀用的存儲區(qū)域的控制。由此,關(guān)于視頻記錄部101的狀態(tài),按照每幀而交替重復(fù)圖7的狀態(tài)702和狀態(tài)703。在存儲區(qū)域A中依然保持字幕Tl出現(xiàn)緊前的視頻幀。在期間 503中,視頻處理部105通過存儲區(qū)域A的視頻幀對當(dāng)前視頻幀的字幕區(qū)域進行置換,輸出消除字幕T2后的當(dāng)前視頻幀作為輸出視頻幀。在期間504中,不存在字幕,在從期間503向期間504轉(zhuǎn)移時,產(chǎn)生從字幕T2到無字幕的字幕變更TC3。在期間504的開頭(最初的幀),在字幕檢測部102中沒有檢測到字幕區(qū)域,在字幕變更檢測部103中檢測到字幕的消失。記錄控制部104根據(jù)字幕變更檢測部103的檢測結(jié)果,將存儲區(qū)域A的內(nèi)容更新成空。由此,視頻記錄部101的存儲狀態(tài)例如從圖 的狀態(tài)703遷移到圖6的狀態(tài)601。在期間504之后的期間中,在字幕檢測部102中沒有檢測到字幕區(qū)域,在字幕變更檢測部103中沒有檢測到字幕變更。記錄控制部104進行調(diào)換當(dāng)前視頻幀用的存儲區(qū)域和當(dāng)前視頻幀緊前的視頻幀用的存儲區(qū)域的控制。由此,在存儲區(qū)域B和C中,按照每幀而交替保存視頻幀。具體而言,關(guān)于視頻記錄部101的狀態(tài),按照每幀而交替重復(fù)圖6的狀態(tài)601和狀態(tài)602。存儲區(qū)域A依然為空。在期間504中,視頻處理部105不進行置換,輸出當(dāng)前視頻幀作為輸出視頻幀。圖8是示出字幕遷移的另一例的圖。圖8示出在從字幕Tl向字幕T2遷移的期間內(nèi)字幕消失的情況。下面,對圖8那樣字幕遷移的情況下的視頻處理裝置100的各部的動作和存儲狀態(tài)進行說明。在期間801中,不存在字幕。視頻處理裝置100的各部的動作和存儲狀態(tài)與圖5的期間501的情況相同。在期間802中,存在字幕Tl,在從期間801向期間802轉(zhuǎn)移時,產(chǎn)生從無字幕到字幕Tl的字幕變更TC11。視頻處理裝置100的各部的動作和存儲狀態(tài)與圖5的期間502的情況相同。在期間803中,不存在字幕,在從期間802向期間803轉(zhuǎn)移時,產(chǎn)生從字幕Tl到無字幕的字幕變更TC12。視頻處理裝置100的各部的動作和存儲狀態(tài)與圖5的期間504的情況相同。在期間804中,存在字幕T2,在從期間803向期間804轉(zhuǎn)移時,產(chǎn)生從無字幕到字幕T2的字幕變更TC13。視頻處理裝 置100的各部的動作和存儲狀態(tài)與圖5的期間502的情況相同。該情況下,視頻處理部105通過在存儲區(qū)域A中記錄的字幕T2出現(xiàn)緊前的視頻幀對當(dāng)前視頻幀的字幕區(qū)域進行置換,輸出消除字幕T2后的當(dāng)前視頻幀作為輸出視頻幀。
在期間805中,不存在字幕,在從期間804向期間805轉(zhuǎn)移時,產(chǎn)生從字幕T2到無字幕的字幕變更TC14。視頻處理裝置100的各部的動作和存儲狀態(tài)與圖5的期間504的情況相同。根據(jù)以上說明的本實施方式1,能夠得到下述(I) (3)的效果。(I)在本實施方式中,視頻處理裝置將視頻幀的字幕區(qū)域置換成根據(jù)該字幕區(qū)域的字幕出現(xiàn)之前的視頻幀而得到的圖像。因此,根據(jù)本實施方式,能夠根據(jù)I種視頻信號對視頻幀中包含的字幕區(qū)域進行置換。具體而言,僅通過I種視頻信號,就能夠正確且沒有不舒適感地對字幕區(qū)域進行置換,能夠生成或顯示消除字幕后的(或無字幕的)良好的視頻幀。另一方面,如專利文獻I記載的技術(shù)那樣,在使用與視頻信號不同種類的視頻信號消除該視頻信號中包含的字幕的結(jié)構(gòu)中,在不存在不同種類的視頻信號的情況下,無法消除字幕。例如,在2008年3月底以前,義務(wù)進行從一個廣播站通過12波段廣播和單波段廣播播放同一節(jié)目的聯(lián)播,但是,目前沒有這種義務(wù),在一部分廣播中不實施聯(lián)播。即,有時不存在其它種類的視頻信號。(2)視頻處理裝置從一連串視頻幀中檢測字幕的出現(xiàn),根據(jù)該檢測結(jié)果記錄上述一連串視頻幀中的上述字幕出現(xiàn)之前的視頻幀。根據(jù)本方式,能夠選擇性地記錄在字幕區(qū)域的置換中使用的視頻幀。(3)視頻處理裝置具有視頻記錄部,該視頻記錄部依次被輸入一連串視頻幀,記錄當(dāng)前視頻幀和此前的視頻幀,針對記錄的當(dāng)前視頻幀進行字幕區(qū)域的檢測和字幕的出現(xiàn)的檢測。然后,在檢測到字幕出現(xiàn)的情況下,記錄已記錄的當(dāng)前視頻幀之前的視頻幀作為字幕出現(xiàn)之前的視頻幀。并且,在檢測到字幕區(qū)域的情況下,將當(dāng)前視頻幀的字幕區(qū)域置換成根據(jù)已記錄的字幕出現(xiàn)之前的視頻幀而得到的圖像,輸出對字幕區(qū)域進行置換后的當(dāng)前視頻幀。根據(jù)本方式,能夠依次對依次輸入的視頻幀進行處理。實施方式2圖9是示出實施方式2的視頻處理裝置900的結(jié)構(gòu)的框圖。該視頻處理裝置900相對于實施方式I的視頻處理裝置100,不同之處在于,根據(jù)字幕變更的檢測結(jié)果對字幕置換方法進行切換,其它部分大致相同。在以下的說明中,省略或簡化與實施方式I相同的部分的說明,對與實施方式I相同或?qū)?yīng)的要素標(biāo)注相同標(biāo)號。字幕變更檢測部103從輸入的一連串視頻幀中檢測字幕的出現(xiàn)和字幕的切換作為字幕變更。在一個方式中,字幕變更檢測部103檢測構(gòu)成字幕的文字(字幕文字)的邊緣和該文字的輪廓部的邊緣,根據(jù)檢測到的邊緣的變化對字幕的切換進行檢測。具體而言,字幕變更檢測部103檢測當(dāng)前視頻幀緊前的視頻幀中的字幕區(qū)域內(nèi)的文字和輪廓部的邊緣,檢測當(dāng)前視頻幀中的字幕區(qū)域內(nèi)的文字和輪廓部的邊緣,如果兩個視頻幀之間的邊緣的變化為預(yù)先確定的水平以上,則判定為產(chǎn)生字幕的切換,如果不是這樣,則判定為沒有產(chǎn)生字眷的切換。字幕變更檢測部103也可以進一步檢測字幕的消失作為字幕變更。在本例子中,字幕變更檢測部103進行字幕變更的檢測,輸出表示其檢測結(jié)果的標(biāo)志。圖10示出從字幕變更檢測部103輸出的標(biāo)志的一覽。具體而言,字幕變更檢測部103根據(jù)字幕檢測部102的檢測結(jié)果,如下所述進行字幕變更的檢測。在當(dāng)前視頻幀緊前的視頻幀中無字幕,在當(dāng)前視頻幀中也無字幕的情況下,輸出表示無字幕和字幕變更的“無字幕”標(biāo)志。在當(dāng)前視頻幀緊前的視頻幀中無字幕,在當(dāng)前視頻幀中存在字幕的情況下,輸出表示從無字幕到有字幕的變化(字幕的出現(xiàn))的“無一有”標(biāo)志。在當(dāng)前視頻幀緊前的視頻幀中存在字幕,在當(dāng)前視頻幀中無字幕的情況下,輸出表示從有字幕到無字幕的變化(字幕的消失)的“有一無”標(biāo)志。在當(dāng)前視頻幀緊前的視頻幀中存在字幕,在當(dāng)前視頻幀中也存在字幕的情況下,判定字幕的切換,在判定為字幕已切換時,輸出表示從有字幕到其它字幕的變化(字幕的切換)的“有一有”標(biāo)志。另一方面,在判定為沒有切換字幕時,輸出表示存在字幕但無字幕變更的“有字幕”標(biāo)志。下面,參照圖11示出上述字幕的切換判定的一例。圖11中示出由視頻幀表示的視頻整體的區(qū)域1101、該區(qū)域1101中包含的字幕區(qū)域1102、該字幕區(qū)域1102中包含的字幕 1103。字幕區(qū)域1102由字幕檢測部102檢測。為了簡便,設(shè)字幕區(qū)域1102中的字幕1103以外的區(qū)域的各像素的亮度值為相同亮度值kc。一般地,如圖12的(a)所示,字幕包括具有一定文字色的文字1201和具有一定輪廓色的文字的輪廓部1202。這里,亮度值由8bit的整數(shù)值(O 255)表示,設(shè)文字色為白色(亮度值255),輪廓色為黑色(亮度值O)。圖12的(b)示出圖12的(a)的線LA (通過字幕文字“ f ”最上部的輪廓部的線)中的亮度分布。圖12的(c)示出圖12的(a)的線LB (通過字幕文字“ ^ ”的中心部的線)中的亮度分布。在圖12的(b)中,按照背景色(亮度值kc)、輪廓色(亮度值O)、背景色(亮度值kc)的順序發(fā)生變化,亮度值急劇變化的邊緣存在2處。在圖12的(c)中,按照背景色(亮度值kc)、數(shù)像素的輪廓部的輪廓色(亮度值O)、文字色(亮度值255)、數(shù)像素的輪廓部的輪廓色(亮度值O)、背景色(亮度值kc)的順序發(fā)生變化,亮度值急劇變化的邊緣存在4處。字幕變更檢測部103針對視頻幀的整體或字幕區(qū)域,在水平方向和垂直方向上進行上述邊緣檢測,根據(jù)其檢測結(jié)果檢測字幕的切換。在字幕已切換的情況下,邊緣的個數(shù)和位置變化,因此,在一個方式中,字幕變更檢測部103根據(jù)檢測到的邊緣的個數(shù)和位置的信息檢測字幕的切換。例如,字幕變更檢測部103設(shè)圖11的字幕區(qū)域1102左上端位置的坐標(biāo)為(0、0),利用二維矢量表示檢測到的各邊緣,求出各個矢量的大小之和,根據(jù)該和的大小的變化來判定字幕變更。并且,例如,字幕變更檢測部103也可以根據(jù)檢測到的邊緣坐標(biāo)的個數(shù)的差分來判定字幕變更。另外,也可以僅在水平方向上或僅在垂直方向上實施上述邊緣的檢測。在上述字幕的邊緣的檢測中,例如,在彼此相鄰的2個像素的亮度值的差分的絕對值d為預(yù)先確定的閾值kd以上的情況下,即滿足d > kd的情況下,字幕變更檢測部103判定為在兩個像素之間存在邊緣。 字幕變更檢測部103不僅可以使用亮度值來檢測邊緣,而且可以使用顏色信息來檢測邊緣。例如,在像素的信息由亮度信號Y和色差信號(Cb、Cr)表示的情況下,也可以將它們視為三維矢量,使用彼此相鄰的2個像素之間的像素信息的矢量的大小的差分的絕對值來檢測邊緣。另外,上述字幕的切換的判定方法是一例,只要能夠檢測當(dāng)前視頻幀與當(dāng)前視頻幀緊前的視頻幀之間的字幕的切換即可,也可以使用其它方法。并且,在上述的說明中,例示出使用字幕檢測部102的檢測結(jié)果來檢測字幕變更(出現(xiàn)、消失和切換)的結(jié)構(gòu),但是,字幕變更檢測部103也可以通過其它方法檢測字幕變更。例如,字幕變更檢測部103也可以從視頻記錄部101中讀出當(dāng)前視頻幀和當(dāng)前視頻幀緊前的視頻幀。對兩個視頻幀進行比較,檢測字幕變更(出現(xiàn)、消失和切換)。該情況下,字幕變更檢測部103例如通過上述的邊緣檢測方法檢測構(gòu)成字幕的文字的邊緣和該文字的輪廓部的邊緣,根據(jù)檢測到的邊緣的變化來檢測字幕變更。另外,字幕變更檢測部103也可以從I幀的視頻信號中檢測字幕變更,還可以根據(jù)字幕檢測部102的檢測結(jié)果,從字幕區(qū)域的視頻信號中檢測字幕變更。視頻處理部105在對檢測到字幕區(qū)域的視頻幀中的字幕區(qū)域進行置換的情況下,根據(jù)字幕變更檢測部103的檢測結(jié)果,在置換對象視頻幀緊前的字幕變更為字幕的出現(xiàn)時,置換成根據(jù)字幕區(qū)域的字幕出現(xiàn)之前的視頻幀而得到的圖像,在置換對象視頻幀緊前的字幕變更為字幕的切換時,置換成根據(jù)置換對象視頻幀的字幕區(qū)域的周邊像素而得到的圖像。即,視頻處理部105在對檢測到字幕區(qū)域的視頻幀中的字幕區(qū)域進行插值的情況下,根據(jù)字幕變更檢測部103的檢測結(jié)果,在插值對象的視頻幀緊前的字幕變更為字幕的出現(xiàn)時,根據(jù)字幕區(qū)域的字幕出現(xiàn)之前的視頻幀進行插值,在插值對象的視頻幀緊前的字幕變更為字幕的切換時,根據(jù)插值對象的視頻幀的字幕區(qū)域的周邊像素進行插值。下面,參照圖13和圖14示出將字幕區(qū)域置換成根據(jù)其周邊像素而得到的圖像的方法的一例。圖13示出包含字幕1301的字幕區(qū)域1302、該字幕區(qū)域1302的外側(cè)區(qū)域1303。外側(cè)區(qū)域1303由在水平方向和垂直方向上與字幕區(qū)域1302相鄰的像素構(gòu)成。視頻處理部105將字幕區(qū)域1302內(nèi)的像素的像素值置換成根據(jù)外側(cè)區(qū)域1303的像素(字幕區(qū)域1302外側(cè)的像素)的像素值而得到的像素值。例如如圖14所示,視頻處理部105在求出字幕區(qū)域1302內(nèi)的像素PI的置換后的像素值的情況下,求出外側(cè)區(qū)域1303的像素中的、相對于置換對象像素PI位于上下左右的4個像素PA、PB、PC、PD的像素值的平均值。例如,在 像素由RGB三原色的像素值(R、G、B)表示的情況下,視頻處理部105通過下述式(I),根據(jù)像素PA的像素值(RA、GA、BA)、像素PB的像素值(Rb、Gb、Bb)、像素PC的像素值(Rc、Gc、Bc)、像素TO的像素值(Rd、Gd、Bd)求出置換對象像素PI的像素值(R1、G1、B1)。另夕卜,各色的像素值例如由8bit (O 255)表示。
權(quán)利要求
1.一種視頻處理裝置,其特征在于,該視頻處理裝置具有: 字幕檢測部,其從輸入的一連串視頻幀中檢測包含字幕的字幕區(qū)域; 速報音檢測部,其與所述一連串視頻幀對應(yīng)地,從輸入的一連串音頻信號中檢測速報音;以及 視頻處理部,其將所述一連串視頻幀中被檢測到所述字幕區(qū)域的視頻幀中的所述字幕區(qū)域,置換成根據(jù)所述一連串視頻幀中的所述字幕區(qū)域的字幕出現(xiàn)之前的視頻幀而得到的圖像,輸出對所述字幕區(qū)域進行置換后的視頻幀, 所述視頻處理部根據(jù)所述速報音檢測部的檢測結(jié)果,選擇性地對伴有所述速報音的字幕的字幕區(qū)域進行置換。
2.根據(jù)權(quán)利要求1所述的視頻處理裝置,其特征在于, 所述視頻處理裝置還具有: 字幕變更檢測部,其從所述一連串視頻幀中檢測字幕的出現(xiàn);以及置換用視頻記錄部,其根據(jù)所述字幕變更檢測部的檢測結(jié)果,記錄所述一連串視頻幀中的所述字幕出現(xiàn)之前的視頻幀, 所述視頻處理部將所述字幕區(qū)域置換成根據(jù)所述記錄的視頻幀而得到的圖像。
3.根據(jù)權(quán)利要求2所述的視頻處理裝置,其特征在于, 所述視頻處理裝置還具有視頻記錄部,該視頻記錄部被依次輸入所述一連串視頻幀,記錄當(dāng)前視頻幀和此前的視頻幀, 所述字幕檢測部針對所述記錄的當(dāng)前視頻幀進行所述字幕區(qū)域的檢測,` 所述字幕變更檢測部針對所述記錄的當(dāng)前視頻幀檢測所述字幕的出現(xiàn), 在由所述字幕變更檢測部檢測到所述字幕的出現(xiàn)的情況下,所述置換用視頻記錄部記錄所述記錄的當(dāng)前視頻幀之前的視頻幀,作為所述字幕出現(xiàn)之前的視頻幀, 在由所述字幕檢測部檢測到所述字幕區(qū)域的情況下,所述視頻處理部將所述當(dāng)前視頻幀中的所述字幕區(qū)域,置換成根據(jù)所述記錄的所述字幕出現(xiàn)之前的視頻幀而得到的圖像,輸出對所述字幕區(qū)域進行置換后的當(dāng)前視頻幀。
4.根據(jù)權(quán)利要求2或3所述的視頻處理裝置,其特征在于, 所述字幕變更檢測部從所述一連串視頻幀中檢測字幕的出現(xiàn)和切換,作為字幕變更,所述視頻處理部在對被檢測到所述字幕區(qū)域的視頻幀中的所述字幕區(qū)域進行置換的情況下,根據(jù)所述字幕變更檢測部的檢測結(jié)果,在所述置換對象視頻幀緊前的字幕變更為字幕的出現(xiàn)時,置換成根據(jù)所述字幕區(qū)域的字幕出現(xiàn)之前的視頻幀而得到的圖像,在所述置換對象視頻幀緊前的字幕變更為字幕的切換時,置換成根據(jù)所述置換對象視頻幀的所述字幕區(qū)域的周邊像素而得到的圖像。
5.根據(jù)權(quán)利要求2 4中的任意一項所述的視頻處理裝置,其特征在于, 所述字幕變更檢測部檢測構(gòu)成字幕的文字的邊緣和該文字的輪廓部的邊緣,根據(jù)檢測到的邊緣的變化來檢測所述字幕的出現(xiàn)或切換。
6.根據(jù)權(quán)利要求1 5中的任意一項所述的視頻處理裝置,其特征在于, 所述視頻處理裝置還具有場景變更檢測部,該場景變更檢測部從所述一連串視頻幀中檢測場景變更, 所述視頻處理部在對被檢測到所述字幕區(qū)域的視頻幀中的所述字幕區(qū)域進行置換的情況下,根據(jù)所述場景變更檢測部的檢測結(jié)果,在所述字幕區(qū)域的字幕出現(xiàn)之前的視頻幀與所述置換對象視頻幀之間沒有產(chǎn)生場景變更時,置換成根據(jù)所述字幕區(qū)域的字幕出現(xiàn)之前的視頻幀而得到的圖像,在所述視頻幀之間產(chǎn)生場景變更時,置換成根據(jù)所述置換對象視頻幀的所述字幕區(qū)域的周邊像素而得到的圖像。
7.根據(jù)權(quán) 利要求1 6中的任意一項所述的視頻處理裝置,其特征在于, 所述字幕檢測部針對所述視頻幀進行文字識別,根據(jù)該文字識別的結(jié)果,檢測包含文字信息的區(qū)域作為所述字幕區(qū)域。
8.根據(jù)權(quán)利要求1 7中的任意一項所述的視頻處理裝置,其特征在于, 在接收到緊急警報廣播信號的情況下,不進行所述字幕區(qū)域的置換。
9.根據(jù)權(quán)利要求1 8中的任意一項所述的視頻處理裝置,其特征在于, 在接收到數(shù)據(jù)廣播信號,且在該數(shù)據(jù)廣播信號中包含預(yù)先確定的信息的情況下,不進行所述字幕區(qū)域的置換。
10.根據(jù)權(quán)利要求1 9中的任意一項所述的視頻處理裝置,其特征在于, 所述視頻處理部選擇性地對在以檢測到所述速報音的時刻為基準(zhǔn)的預(yù)先確定的期間內(nèi)檢測到的字幕區(qū)域進行置換。
11.根據(jù)權(quán)利要求1 9中的任意一項所述的視頻處理裝置,其特征在于, 所述視頻處理裝置具有字幕變更檢測部,該字幕變更檢測部從所述一連串視頻幀中檢測字幕的出現(xiàn), 在以檢測到所述速報音的時刻為基準(zhǔn)的預(yù)先確定的第I期間內(nèi)檢測到所述字幕的出現(xiàn)的情況下,所述視頻處理部選擇性地對在以檢測到該速報音的時刻為基準(zhǔn)的預(yù)先確定的第2期間內(nèi)檢測到的字幕區(qū)域進行置換。
12.根據(jù)權(quán)利要求1 9中的任意一項所述的視頻處理裝置,其特征在于, 所述視頻處理裝置具有字幕變更檢測部,該字幕變更檢測部從所述一連串視頻幀中檢測字幕的出現(xiàn), 在以檢測到所述速報音的時刻為基準(zhǔn)的預(yù)先確定的期間內(nèi)檢測到所述字幕的出現(xiàn)的情況下,所述視頻處理部選擇性地對包含該字幕的字幕區(qū)域進行置換。
13.根據(jù)權(quán)利要求1 12中的任意一項所述的視頻處理裝置,其特征在于, 所述視頻處理裝置還具有音頻信號處理部,該音頻信號處理部針對所述音頻信號進行降低由所述速報音檢測部檢測到的速報音的音量的處理。
14.一種視頻顯示裝置,其特征在于,該視頻顯示裝置具有: 權(quán)利要求1 13中的任意一項所述的視頻處理裝置;以及 再現(xiàn)部,其顯示從所述視頻處理裝置的所述視頻處理部輸出的視頻幀。
15.一種視頻記錄裝置,其特征在于,該視頻記錄裝置具有: 權(quán)利要求1 13中的任意一項所述的視頻處理裝置;以及 記錄部,其記錄從所述視頻處理裝置的所述視頻處理部輸出的視頻幀。
16.一種視頻處理方法,其特征在于,該視頻處理方法具有以下步驟: 字幕檢測步驟,從輸入的一連串視頻幀中檢測包含字幕的字幕區(qū)域; 速報音檢測步驟,與所述一連串視頻幀對應(yīng)地,從輸入的一連串音頻信號中檢測速報音;以及視頻處理步驟,將所述一連串視頻幀中被檢測到所述字幕區(qū)域的視頻幀中的所述字幕區(qū)域,置換成根據(jù)所述一連串視頻幀中的所述字幕區(qū)域的字幕出現(xiàn)之前的視頻幀而得到的圖像,輸出對所述字幕區(qū)域進行置換后的視頻幀,在所述視頻處理步驟中,根據(jù)所述速報音檢測步驟的檢測結(jié)果,選擇性地對伴有所述速報音的字幕的字幕區(qū)域進行置換。
全文摘要
本發(fā)明提供視頻顯示裝置、視頻記錄裝置、視頻處理裝置以及方法,能夠選擇性地消除伴有速報音的字幕。視頻處理裝置(2400)具有字幕檢測部(102),其從輸入的一連串視頻幀中檢測包含字幕的字幕區(qū)域;速報音檢測部(2401),其與一連串視頻幀對應(yīng)地,從輸入的一連串音頻信號中檢測速報音;以及視頻處理部(105),其將一連串視頻幀中被檢測到字幕區(qū)域的視頻幀中的字幕區(qū)域,置換成根據(jù)一連串視頻幀中的字幕區(qū)域的字幕出現(xiàn)之前的視頻幀而得到的圖像,輸出對字幕區(qū)域進行置換后的視頻幀。視頻處理部(105)根據(jù)速報音檢測部(2401)的檢測結(jié)果,選擇性地對伴有速報音的字幕的字幕區(qū)域進行置換。
文檔編號H04N9/82GK103106911SQ201210396280
公開日2013年5月15日 申請日期2012年10月18日 優(yōu)先權(quán)日2011年10月19日
發(fā)明者大塚功, 福田智教 申請人:三菱電機株式會社