專利名稱:從電視信號中提取文字信息并顯示的方法及電視機的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻圖像與處理領(lǐng)域,特別設(shè)計一種從電視信號中提取文字信息并顯示的方法及運用該方法的電視機。
背景技術(shù):
為了更好地滿足用戶的需求,很多電視節(jié)目都帶有字幕,這些字幕在吵雜的環(huán)境下和需要翻譯的情況下給用戶提供了極大的幫助。隨著數(shù)字電視的普及,現(xiàn)在市場上許多電視機顯示屏幕的寬高比例都是16:9,而現(xiàn)在電視臺播放的電視節(jié)目的畫面圖像都是4:3的標(biāo)準(zhǔn)寬高比,從而造成電視畫面與電視機顯示屏幕的寬高比例不一致。為此,許多電視機具有多種顯示模式以供用戶選擇I) 16:9 全屏模式。
·
即將4:3標(biāo)準(zhǔn)寬高比的電視視頻圖像拉伸為16:9的寬高比,從而可以在電視機屏幕上全屏顯示。但是這種模式下電視圖像被一定程度地拉寬,畫面會變形,如畫面中的人物形象會變得矮胖,降低了電視節(jié)目的視覺效果。2)4:3比例模式。即電視節(jié)目畫面與電視機屏幕的高度相同。這種模式下電視畫面顯示的比例正常,但是由于相同高度的前提下,電視機屏幕的寬度比電視節(jié)目畫面的寬度更寬,電視節(jié)目畫面無法填滿電視機屏幕的寬度,導(dǎo)致電視機屏幕兩邊出現(xiàn)黑屏,屏幕利用不充分且電視畫面顯得較小。3)放大模式。即電視節(jié)目畫面與電視機屏幕的寬度相同。這種模式下畫面比例正常,但是由于相同寬度的前提下,電視節(jié)目畫面的高度比電視機屏幕的高度更高,導(dǎo)致電視節(jié)目畫面上下兩邊無法顯示,如果不能顯示的部分對整體電視觀看影響不大,這是充分利用電視機寬屏幕的好方法。但是電視節(jié)目的字幕往往位于電視畫面的底端,而且多數(shù)電視信號中的字幕是嵌在電視圖像里面的,并不是單獨的,所以從中提取字幕有一定的難度,如果用戶選擇放大模式,那么畫面底端的字幕用戶就無法看到或者無法完整地看到,這使得用戶在需要觀看字幕時不得不切換畫面顯示模式,造成觀看上的不便。中國申請?zhí)?5119442. 9的發(fā)明專利提出了一種“在寬寬高比屏幕上控制字幕顯示的裝置”,其可以從電視信號中檢測并提取出字幕信號,從而可以將字幕顯示在屏幕的合適的位置。但是該發(fā)明僅適用于“帶有字幕信息的電視信號”,也即該發(fā)明提取的字幕信息并非嵌在電視圖像里,而是獨立包含在電視信號中的,使該發(fā)明的應(yīng)用具有一定局限性,特別對于中國的不包括獨立字幕信息的電視節(jié)目信號,該發(fā)明的裝置并不適用。中國申請?zhí)?2801652. I的發(fā)明專利提出了一種“在視頻信號中檢測字幕的方法和裝置”、中國申請?zhí)?01110315054.3的專利申請?zhí)岢隽艘环N“視頻字幕文本提取和識別的方法”、中國申請?zhí)?00710178831. 8的發(fā)明專利提出了一種“視頻字幕信息提取方法”,這三種方案均可以從視頻信號中檢測并提取出文字信息,但是這三種方案均要在視頻圖像的全屏范圍內(nèi)檢索文字區(qū)域,且計算方式復(fù)雜,運算量大,會對硬件設(shè)備造成較大的負擔(dān),在現(xiàn)在高清視頻信號普及的情況下尤其明顯。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種從電視信號中提取文字信息并顯示的方法及電視機,以解決電視信號與顯示屏幕的寬高比不符而造成字幕無法顯示的問題。本發(fā)明提出一種從電視信號中提取文字信息并顯示的方法,包括以下步驟接收至少一幀電視信號;從電視信號中獲得靜態(tài)圖像;從所述靜態(tài)圖像上的設(shè)定區(qū)域截取檢測圖像,所述設(shè)定區(qū)域位于所述靜態(tài)圖像的底部; 對所述檢測圖像進行識別,提取其中的文字信息;顯示提取出的所述文字信息。依照本發(fā)明較佳實施例所述的從電視信號中提取文字信息并顯示的方法,所述靜態(tài)圖像上的設(shè)定區(qū)域的高度為(l_r/R)*B/2,其中,r為靜態(tài)圖像的寬高比,R為電視屏幕的寬高比,B為電視屏幕高度。依照本發(fā)明較佳實施例所述的從電視信號中提取文字信息并顯示的方法,從所述靜態(tài)圖像上的設(shè)定區(qū)域截取檢測圖像的步驟包括對所述靜態(tài)圖像的灰度進行提取,得到與所述靜態(tài)圖像對應(yīng)的黑白圖片;檢測所述黑白圖片上灰度高于預(yù)設(shè)的第一閾值的區(qū)域,并將所述灰度高于所述第一閾值的區(qū)域定義為所述靜態(tài)圖像的設(shè)定區(qū)域;從所述靜態(tài)圖像上的設(shè)定區(qū)域的范圍截取所述檢測圖像。依照本發(fā)明較佳實施例所述的從電視信號中提取文字信息并顯示的方法,所述對所述檢測圖像進行識別,提取其中的文字信息的步驟之前還包括去除所述檢測圖像上的背景部分。依照本發(fā)明較佳實施例所述的從電視信號中提取文字信息并顯示的方法,所述去除所述檢測圖像上的背景部分的步驟包括將相鄰兩幀或相隔多幀的所述檢測圖像上對應(yīng)像素的灰度值進行比對;將所述檢測圖像上灰度值變化小于預(yù)設(shè)的第二閾值的像素所在的區(qū)域作為背景部分去除。依照本發(fā)明較佳實施例所述的從電視信號中提取文字信息并顯示的方法,對所述檢測圖像進行識別的步驟之前包括對所述檢測圖像進行檢測,以確認所述檢測圖像上是否有文字信息。依照本發(fā)明較佳實施例所述的從電視信號中提取文字信息并顯示的方法,所述對所述檢測圖像進行檢測,以確認所述檢測圖像上是否有文字信息的步驟包括對所述檢測圖像上相鄰像素的灰度值作減法運算;統(tǒng)計所述檢測圖像上每行像素的跳變次數(shù);根據(jù)所述檢測圖像上各行上像素的跳變次數(shù)確認所述檢測圖像上是否有文字信肩、O依照本發(fā)明較佳實施例所述的從電視信號中提取文字信息并顯示的方法,對所述檢測圖像進行識別,提取其中的文字信息的步驟包括檢測所述檢測圖像上所述文字信息的起始點和終止點,以確認所述文字信息的區(qū)域;對所述檢測圖像上所述文字信息的區(qū)域進行行切分和字切分,以形成單字圖像;提取所述單字圖像的統(tǒng)計特征或結(jié)構(gòu)特征;根據(jù)提取出的所述單字圖像的統(tǒng)計特征或結(jié)構(gòu)特征,識別出所述檢測圖像上的文
字信息。
·
依照本發(fā)明較佳實施例所述的從電視信號中提取文字信息并顯示的方法,所述根據(jù)提取出的所述單字圖像的統(tǒng)計特征或結(jié)構(gòu)特征,識別出所述檢測圖像上的文字信息的步驟之后進一步包括對識別結(jié)果進行校正。依照本發(fā)明較佳實施例所述的從電視信號中提取文字信息并顯示的方法,所述根據(jù)提取出的所述單字圖像的統(tǒng)計特征或結(jié)構(gòu)特征,識別出所述檢測圖像上的文字信息的步驟之后進一步包括記錄所述文字信息的大小和/或間距和/或相對位置;所述顯示提取出的所述文字信息的步驟包括根據(jù)記錄的所述文字信息的大小和/或間距和/或相對位置,顯示與原文字形狀相同的文字信息。本發(fā)明另提出一種電視機,包括顯示屏和文字信息提取模塊,所述文字信息提取模塊包括靜態(tài)圖像獲取單元,用于從電視節(jié)目信號中獲得靜態(tài)圖像;檢測圖像獲取單元,用于從所述靜態(tài)圖像上的設(shè)定區(qū)域截取檢測圖像,所述設(shè)定區(qū)域位于所述靜態(tài)圖像的底部;文字信息識別單元,用于對所述檢測圖像進行識別,提取其中的文字信息,以在所述顯示屏上顯示提取出的所述文字信息。依照本發(fā)明較佳實施例所述的電視機,所述靜態(tài)圖像上的設(shè)定區(qū)域的高度為(l-r/R)*B/2,其中,r為靜態(tài)圖像的寬高比,R為所述顯示屏的寬高比,B為所述顯示屏的高度。依照本發(fā)明較佳實施例所述的電視機,所述檢測圖像獲取單元進一步包括灰度提取子單元,用于對所述靜態(tài)圖像的灰度進行提取,得到與所述靜態(tài)圖像對應(yīng)的黑白圖片;設(shè)定區(qū)域定義子單元,用于檢測所述黑白圖片上灰度高于預(yù)設(shè)的第一閾值的區(qū)域,以將所述灰度高于預(yù)設(shè)所述第一閾值的區(qū)域定義為所述靜態(tài)圖像的設(shè)定區(qū)域;截取子單元,用于依照所述靜態(tài)圖像上的設(shè)定區(qū)域的范圍截取所述檢測圖像。依照本發(fā)明較佳實施例所述的電視機,所述文字信息提取模塊還包括背景去除單元,用于去除所述檢測圖像上的背景部分。依照本發(fā)明較佳實施例所述的電視機,所述背景去除單元進一步包括
灰度比對子單元,用于將相鄰兩幀或相隔多幀的所述檢測圖像上對應(yīng)像素的灰度值進行比對;背景去除子單元,用于將所述檢測圖像上灰度值變化小于預(yù)設(shè)的第二閾值的像素所在的區(qū)域作為背景部分去除。依照本發(fā)明較佳實施例所述的電視機,所述文字信息提取模塊還包括文字信息確認單元,用于對所述檢測圖像進行檢測,以確認所述檢測圖像上是否有文字信息。依照本發(fā)明較佳實施例所述的電視機,所述文字信息確認單元進一步包括灰度計算子單元,用于對所述檢測圖像上相鄰像素的灰度值作減法運算;統(tǒng)計子單元,用于統(tǒng)計所述檢測圖像上每行像素的跳變次數(shù),以根據(jù)所述檢測圖像上各行上像素的跳變次數(shù)確認所述檢測圖像上是否有文字信息。依照本發(fā)明較佳實施例所述的電視機,所述文字信息識別單元進一步包括 區(qū)域檢測子單元,用于檢測所述檢測圖像上所述文字信息的起始點和終止點,以確認所述文字信息的區(qū)域;切分子單元,用于對所述檢測圖像上所述文字信息的區(qū)域進行行切分和字切分,以形成單字圖像;特征提取子單元,用于提取所述單字圖像的統(tǒng)計特征或結(jié)構(gòu)特征,以根據(jù)提取出的所述單字圖像的統(tǒng)計特征或結(jié)構(gòu)特征,識別出所述檢測圖像上的文字信息。依照本發(fā)明較佳實施例所述的電視機,所述文字信息提取模塊還包括校正單元,用于對所述文字信息識別單元的識別結(jié)果進行校正。依照本發(fā)明較佳實施例所述的電視機,所述文字信息提取模塊還包括記錄單元,用于記錄所述文字信息的大小和/或間距和/或相對位置,以使所述顯示屏顯示與原文字形狀相同的文字信息。相對于現(xiàn)有技術(shù),本發(fā)明的有益效果是本發(fā)明特別針對電視圖像上文字信息的特點,通過對靜態(tài)圖像上含有文字的部分進行截取,形成檢測區(qū)域較小的檢測圖像,因此相對于現(xiàn)有技術(shù),降低運算要求的同時,提高了識別效率。另一方面,本發(fā)明根據(jù)電視信號的特殊性,通過對兩幀圖像進行比較,可以將圖像背景去除,能夠方便地提取出文本信息。當(dāng)然,實施本、發(fā)明的任一產(chǎn)品并不一定需要同時達到以上所述的所有優(yōu)點。上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其他目的、特征和優(yōu)點能夠更明顯易懂,以下特舉較佳實施例,并配合附圖,詳細說明如下。
圖I為本發(fā)明實施例從電視信號中提取文字信息并顯示的方法的一種流程圖;圖2為電視靜態(tài)圖像上字幕信息所在的設(shè)定區(qū)域的示意圖;圖3為本發(fā)明實施例的一種從靜態(tài)圖像上的設(shè)定區(qū)域截取檢測圖像的流程圖;圖4為本發(fā)明實施例的一種從檢測圖像上提取文字信息的流程圖;圖5為本發(fā)明實施例的另一種從電視信號中提取文字信息并顯示的方法的另一種流程圖;圖6為本發(fā)明實施例的一種確認檢測圖像上是否有文字信息的流程圖7為本發(fā)明實施例的一種去除所述檢測圖像上的背景部分的流程圖;圖8為本發(fā)明實施例的一種電視機結(jié)構(gòu)圖;圖9為本發(fā)明實施例的另一種電視機結(jié)構(gòu)圖;圖10為本發(fā)明實施例的再一種較為詳盡的電視機結(jié)構(gòu)圖。
具體實施例方式為更進一步闡述本發(fā)明達成預(yù)定發(fā)明目的所采取的技術(shù)手段及功效,以下結(jié)合附圖及較佳實施例,對依據(jù)本發(fā)明提出的從電視信號中提取文字信息并顯示的方法及電視機其具體實施方式
、方法、步驟及功效,詳細說明如后。有關(guān)本發(fā)明的前述及其他技術(shù)內(nèi)容、特點及功效,在以下配合參考圖式的較佳實施例詳細說明中將可清楚的呈現(xiàn)。通過具體實施方式
的說明,當(dāng)可對本發(fā)明為達成預(yù)定目 的所采取的技術(shù)手段及功效得以更加深入且具體的了解,然而所附圖式僅是提供參考與說明之用,并非用來對本發(fā)明加以限制。請參見圖1,其為本發(fā)明實施例從電視信號中提取文字信息并顯示的方法的一種流程圖,其包括以下步驟S10,接收至少一幀電視信號。S11,從電視信號中獲得靜態(tài)圖像。即將電視信號連續(xù)的影像畫面分隔成一幀一幀的單幅影像畫面,而每一幀最小單位的單幅影像畫面即為所述的靜態(tài)圖像。S12,從所述靜態(tài)圖像上的設(shè)定區(qū)域截取檢測圖像。所述設(shè)定區(qū)域為所述靜態(tài)圖像上覆蓋文字信息的區(qū)域。和現(xiàn)有的文字信息檢測和識別技術(shù)不同,本發(fā)明僅對靜態(tài)圖像的一小部分圖像(即設(shè)定區(qū)域中的圖像)進行文本檢測和識別,進而可以減小運算量,提高識別效率。其中本發(fā)明所要提取的文字信息是電視節(jié)目的字幕信息,因為電視節(jié)目的字幕一般都是出現(xiàn)在電視畫面的底部,因此針對電視節(jié)目信號中的字幕信息進行提取時,設(shè)定區(qū)域就設(shè)置位于所述靜態(tài)圖像的底部。具體來說,假設(shè)電視顯示屏的寬高比為R,電視信號的靜態(tài)圖像的寬高比為r,電視顯示屏的寬度為A,高度為B。這樣,當(dāng)電視信號的顯示圖像寬度被拉伸達到電視顯示屏的寬度A時,則此時電視信號的顯示高度為B’。根據(jù)A/B’=r, A/B=R 得知 B’ =RB/r。當(dāng)電視信號以放大模式顯示在電視顯示屏上時,有高度為B’ -B的電視圖像沒有顯示出來,如果電視圖像上下對稱顯示(即上下兩端沒有顯示的部分相同),則底端有高度為(B’ -B)/2的電視畫面沒有顯示出來。由于B’ =RB/r,通過計算,則底端有高度為(l_r/R)/2的畫面沒有顯示出來。因此,當(dāng)本發(fā)明用于提取并顯示電視節(jié)目信號中的字幕信息時,電視畫面的設(shè)定區(qū)域位于靜態(tài)圖像的底部,且設(shè)定區(qū)域的高度優(yōu)選為(l_r/R)*B/2,其中,r為靜態(tài)圖像的寬高比,R為電視屏幕的寬高比,B為電視屏幕高度。以在寬高比為16:9的電視顯示屏中放大顯示寬高比為4:3的圖像為例,上下兩邊沒有顯示的畫面各占整個圖像的1/8,因此,本發(fā)明只需以電視圖像下端的1/8部分作為設(shè)定區(qū)域并截取檢測圖像以提取其中的字幕。當(dāng)然,此設(shè)定區(qū)域也可以適當(dāng)放大(例如文字信息僅僅被遮擋一半時,為了提取完整的文字信息,需要擴大設(shè)定區(qū)域),一般其高度不需要超過(l_r/R)*B。如圖2所示。為了截取合理的檢測圖像,就需要對文字信息所處的設(shè)定區(qū)域進行檢測。一般情況下,靜態(tài)圖像上文字信息的灰度都比較高,因此只需要對靜態(tài)圖像的灰度進行提取,通過灰度信號就可以識別出文字信息來。請參見圖3,從所述靜態(tài)圖像上的設(shè)定區(qū)域截取檢測圖像可以包括以下步驟S121,對所述靜態(tài)圖像的灰度進行提取。相當(dāng)于得到與所述靜態(tài)圖像對應(yīng)的黑白圖片。S122,檢測灰度高于預(yù)設(shè)的第一閾值的區(qū)域,并將所述灰度高于預(yù)設(shè)第一閾值的區(qū)域定義為所述靜態(tài)圖像的設(shè)定區(qū)域。由于文字在靜態(tài)圖像上的灰度相對較高,所以根據(jù)實際需要或經(jīng)驗設(shè)定第一閾值來找出文字區(qū)域(即設(shè)定區(qū)域),從而可以提高文字信息的檢測效率。S123,從所述靜態(tài)圖像上的設(shè)定區(qū)域的范圍截取所述檢測圖像。
S13,對所述檢測圖像進行識別,提取其中的文字信息。當(dāng)截取出檢測圖像之后,就需要對檢測圖像上所包含的文字信息進行識別,請參見圖4,其進一步可以包括以下步驟S131,檢測所述檢測圖像上所述文字信息的起始點和終止點,以確認所述文字信息的區(qū)域。由于電視的字幕信息一般只有一行,最多不過兩行,因此其起始點和終止點的判斷比較方便。S132,對所述檢測圖像上所述文字信息的區(qū)域進行行切分和字切分,以形成單字圖像。為了后續(xù)的識別,還需要將文字信息進行分割。此步驟的目的是將單個文字從檢測圖像上提取出來,行切分是將檢測圖像先切割為行,字切分是在切割為行的圖像中分離出單個文字的圖像。行切分和字切分的方法很多,比如可以采用水平、垂直分割的方法,即通過在水平、垂直方向的投影找出各個文字的坐標(biāo)。S133,提取所述單字圖像的統(tǒng)計特征或結(jié)構(gòu)特征。對單字圖像進行特征提取的過程,包括細化、歸一化等步驟,單字圖像的統(tǒng)計特征或結(jié)構(gòu)特征的提取均是現(xiàn)有的較為成熟的技術(shù),在此不再贅述。值得注意的是,文字的模式表達形式和相應(yīng)的字典形成方法有許多種,每種形式又可以選擇不同的特征,每種特征又有不同的抽取方法,這就使得判別方法和準(zhǔn)則以及所用的數(shù)學(xué)工具不同,形成了種類繁多、形式各異的文字識別方法??偟膩碚f,不同的特征抽取和分類器的設(shè)計方法決定了識別系統(tǒng)采用不同的處理方法,通??梢苑譃榻Y(jié)構(gòu)模式識別方法、統(tǒng)計模式識別方法、統(tǒng)計與結(jié)構(gòu)相結(jié)合的識別方法以及人工神經(jīng)網(wǎng)絡(luò)方法等。S134,根據(jù)提取出的所述單字圖像的統(tǒng)計特征或結(jié)構(gòu)特征,識別出所述檢測圖像上的文字信息。文字信息的識別即是從已有的特征庫中找到與待識文字相似度最高的字符類的過程。S14,顯示提取出的所述文字信息。文字信息顯示的位置可以是由用戶指定的位置,也可以是默認的位置。為了保證用戶可以看到提取出的文字信息,默認的位置必須位于靜態(tài)圖像上設(shè)定區(qū)域以外的圖像區(qū)域。當(dāng)然,如果用戶設(shè)置為不顯示,也可以不顯示。
請參見圖5,其為本發(fā)明實施例從電視信號中提取文字信息并顯示的方法的另一種流程圖,其包括以下步驟S50,接收至少一幀電視信號。S51,從電視信號中獲得靜態(tài)圖像。即將電視信號連續(xù)的影像畫面分隔成一幀一幀的單幅影像畫面,而每一幀最小單位的單幅影像畫面即為所述的靜態(tài)圖像。S52,從所述靜態(tài)圖像上的設(shè)定區(qū)域截取檢測圖像。所述設(shè)定區(qū)域位于靜態(tài)圖像的底部。S53,對所述檢測圖像進行檢測,以確認所述檢測圖像上是否有文字信息。為提高識別效率,減少不必要的運算,可以在獲得檢測圖像之后進一步檢測確認其上是否含有文字信息,由于文本與背景圖像之間存在灰度差,如果對圖像上相鄰兩個像·素的灰度進行減法運算,有文本的地方灰度差值會有跳變。那么如果對每一行像素都進行減法運算,得出每行像素的跳變次數(shù),那么包含文字信息的行的跳變次數(shù)要明顯多于沒有文字的行。具體來說,請參見圖6,步驟S53可以進一步包括以下步驟S531,對所述檢測圖像上相鄰像素的灰度值作減法運算。S532,統(tǒng)計所述檢測圖像上每行像素的跳變次數(shù),所述跳變是指相鄰像素灰度值的差值大于一個第三閾值。此第三閾值可以根據(jù)實際情況或經(jīng)驗來設(shè)定與調(diào)整。S533,根據(jù)所述檢測圖像上各行上像素的跳變次數(shù)確認所述檢測圖像上是否有文字信息。如果一張檢測圖像每行的跳變次數(shù)都比較少而且平均,就可以判斷出這張圖像上沒有文本信息。反之則判斷有。S54,去除所述檢測圖像上的背景部分。由于電視信號本身是連續(xù)變化的,而文字信息一般會持續(xù)數(shù)秒鐘才變化一次,如果通過相鄰的兩幀圖像或者相隔幾幀的兩幀圖像進行對比,去除其變化的部分而保留不變的部分,則可以很大限度的去除掉背景,這樣,文本識別的準(zhǔn)確度就更高。具體來說,請參見圖7,步驟S54可以進一步包括以下步驟S541,將相鄰兩幀或相隔多幀的所述檢測圖像上對應(yīng)像素的灰度值進行比對。S542,將所述檢測圖像上灰度值變化小于預(yù)設(shè)的第二閾值的像素所在的區(qū)域作為背景部分去除。這里所述的第二閾值可以根據(jù)實際情況或經(jīng)驗來設(shè)定或調(diào)整。比如說,假設(shè)當(dāng)前正在識別的檢測圖像為第N幀,那么通過將第N幀圖像與其前η幀的第Ν-η幀圖像進行比對,比較兩者之間對應(yīng)的各像素的灰度,如果發(fā)現(xiàn)有對應(yīng)的像素灰度之差的絕對值大于某一特定值i,則認為該像素是背景圖片,從而可以確定圖像上背景的區(qū)域并去除。這樣,就可以進一步地過濾掉檢測圖像上背景的部分,使文字的識別更加比較方便。對本發(fā)明來說,優(yōu)選的η取值小于5,i可以取值10。S55,對所述檢測圖像進行識別,提取其中的文字信息。當(dāng)經(jīng)處理后獲取了檢測圖像之后,就需要對檢測圖像上所包含的文字信息進行識別,識別的過程與前述步驟S13相同,在此不再贅述。S56,對識別結(jié)果進行校正。校正是利用詞義、詞頻、語法規(guī)則或語料庫等對提取出的文字信息進行驗證的過程。S57,記錄所述文字信息的大小和/或間距和/或相對位置。本發(fā)明可以在對文字信息進行識別的同時,對文字的位置進行計算,記錄其文字間距和/或大小和/或相對位置等信息、以便在顯示的時候保持原來的文字形狀?;蛘咴陲@示的時候用戶也可以利用記錄的文字信息的大小和/或間距和/或相對位置,調(diào)整要顯示的文字信息的文本大小、顏色、邊框等。S58,顯示提 取出的所述文字信息。文字信息顯示的位置可以是由用戶指定的位置,也可以是默認的位置。為了保證用戶可以看到提取出的文字信息,默認的位置必須位于靜態(tài)圖像上設(shè)定區(qū)域以外的圖像區(qū)域。當(dāng)然,如果用戶設(shè)置為不顯示,也可以不顯示。本發(fā)明特別針對電視圖像上文字信息的特點,通過對靜態(tài)圖像上含有文字的部分進行截取,形成檢測區(qū)域較小的檢測圖像,因此相對于現(xiàn)有技術(shù),降低運算要求的同時,提高了識別效率。另一方面,本發(fā)明根據(jù)電視信號的特殊性,通過對兩幀圖像進行比較,可以將圖像背景去除,能夠方便地提取出文本信息。本發(fā)明另提出一種電視機,請參見圖8,其包括顯示屏81和文字信息提取模塊82,文字信息提取模塊82用于從電視信號的圖像中提取出文字信息,并在顯示屏81上顯示。特別對于放大模式,文字信息提取模塊82可以將電視畫面底部無法顯示的字幕提取出來,并在顯示屏81的有效放映范圍內(nèi)進行顯示,可以避免用戶因需要看字幕而頻繁地切換電視機的播放模式。其中,文字信息提取模塊82又進一步包括靜態(tài)圖像獲取單元821、檢測圖像獲取單元822和文字信息識別單元823,檢測圖像獲取單元822分別與靜態(tài)圖像獲取單元821及文字信息識別單元823相連,文字信息識別單元823與顯示屏81相連。工作時,首先靜態(tài)圖像獲取單元821會從電視節(jié)目信號中獲得靜態(tài)圖像,即將電視信號連續(xù)的影像畫面分隔成一幀一幀的單幅影像畫面,而每一幀最小單位的單幅影像畫面即為所述的靜態(tài)圖像。接著檢測圖像獲取單元822從靜態(tài)圖像上的設(shè)定區(qū)域截取檢測圖像,所述設(shè)定區(qū)域為靜態(tài)圖像上覆蓋文字信息的區(qū)域。對于電視畫面的字幕而言,因為電視節(jié)目的字幕一般都是出現(xiàn)在電視畫面的底部,因此針對電視節(jié)目信號中的字幕信息進行提取時,設(shè)定區(qū)域就設(shè)置位于所述靜態(tài)圖像的底部。具體來說,假設(shè)顯示屏81的寬高比為R,電視信號的靜態(tài)圖像的寬高比為r,顯示屏81的寬度為A,高度為B。這樣,當(dāng)電視信號的顯示圖像寬度被拉伸達到電視顯示屏的寬度A時,則此時電視信號的顯示高度為B’。根據(jù)A/B’=r, A/B=R 得知 B’ =RB/r。當(dāng)電視信號以放大模式顯示在顯示屏81上時,有高度為B’ -B的電視圖像沒有顯示出來,如果電視圖像上下對稱顯示(即上下兩端沒有顯示的部分相同),則底端有高度為(B’-B)/2的電視畫面沒有顯示出來。由于B’=RB/r,通過計算,則底端有高度為(l_r/R)/2的畫面沒有顯示出來。因此,設(shè)定區(qū)域的高度優(yōu)選為(l_r/R)*B/2,其中,r為靜態(tài)圖像的寬高比,R為顯示屏81的寬高比,B為顯示屏81高度。以在寬高比為16:9的顯示屏81中放大顯示寬高比為4:3的圖像為例,上下兩邊沒有顯示的畫面各占整個圖像的1/8,因此,本發(fā)明只需以電視圖像下端的1/8部分作為設(shè)定區(qū)域并截取檢測圖像以提取其中的字幕。當(dāng)然,此設(shè)定區(qū)域也可以適當(dāng)放大(例如文字信息僅僅被遮擋一半時,為了提取完整的文字信息,需要擴大設(shè)定區(qū)域),一般其高度不需要超過(l_r/R)*B。如圖2所示。最后,文字信息識別單元823會對檢測圖像進行識別,提取其中的文字信息,以在顯示屏81上顯示提取出的文字信息。文字信息顯示的位置可以是由用戶指定的位置,也可以是默認的位置。為了保證用戶可以看到提取出的文字信息,默認的位置必須位于靜態(tài)圖像上設(shè)定區(qū)域以外的圖像區(qū)域。當(dāng)然,如果用戶設(shè)置為不顯示,也可以不顯示。請參見圖9,其為本發(fā)明實施例的另一種電視機結(jié)構(gòu)圖,其包括顯示屏81和文字信息提取模塊82。其中,文字信息提取模塊82又進一步包括靜態(tài)圖像獲取單元821、檢測圖像獲取單元822、文字信息識別單元823、文字信息確認單元824、背景去除單元825、校正單元826和記錄單元827。檢測圖像獲取單元822分別與靜態(tài)圖像獲取單元821及文字信息識別單元823相連,文字信息識別單元823與顯示屏81相連,文字信息確認單元824和背景去除單元825均與檢測圖像獲取單元822相連,校正單元826和記錄單元827均與文字信息識別單元823相連。本實施例的電視機是在圖8的基礎(chǔ)上增加了文字信息確認單元824、背景去除單元825、校正單元826和記錄單元827。檢測圖像獲取單元822在截取了檢測圖像之后,會 先交由文字信息確認單元824對檢測圖像進行檢測,以確認所述檢測圖像上是否有文字信息。在確認檢測圖像上有文字信息之后檢測圖像獲取單元822會再將檢測圖像交由背景去除單元825去除檢測圖像上的背景部分,以提高文字信息的檢測效率。去除背景之后的檢測圖像才會傳送給文字信息識別單元823進行文字識別。在文字信息識別單元823識別出檢測圖像上的文字信息后,校正單元826會對識別結(jié)果進行校正,即利用詞義、詞頻、語法規(guī)則或語料庫等對提取出的文字信息進行驗證。驗證通過后,再由記錄單元827記錄文字信息的大小和/或間距和/或相對位置,以便在顯示的時候保持原來的文字形狀?;蛘咴陲@示的時候用戶也可以利用記錄的文字信息的大小和/或間距和/或相對位置,調(diào)整要顯示的文字信息的文本大小、顏色、邊框等。請參見圖10,其為本發(fā)明實施例的再一種較為詳盡的電視機結(jié)構(gòu)圖,其包括顯示屏81和文字信息提取模塊82。其中,文字信息提取模塊82又包括靜態(tài)圖像獲取單元821、檢測圖像獲取單元822、文字信息識別單元823、文字信息確認單元824、背景去除單元825、校正單元826和記錄單元827。檢測圖像獲取單元822又進一步包括灰度提取子單元8221、設(shè)定區(qū)域定義子單元8222及截取子單元8223。文字信息識別單元823又進一步包括區(qū)域檢測子單元8231、切分子單元8232及特征提取子單元8233。文字信息確認單元824又進一步包括灰度計算子單元8241及統(tǒng)計子單元8242。背景去除單元825又包括灰度比對子單元8251及背景去除子單元8252。當(dāng)靜態(tài)圖像獲取單元821從電視節(jié)目信號中獲得靜態(tài)圖像后,首先發(fā)送給灰度提取子單元8221,由灰度提取子單元8221對靜態(tài)圖像的灰度進行提取,相當(dāng)于得到與靜態(tài)圖像對應(yīng)的黑白圖片。然后灰度提取子單元8221將黑白圖片發(fā)送給設(shè)定區(qū)域定義子單元8222,設(shè)定區(qū)域定義子單元8222會檢測黑白圖片上灰度高于預(yù)設(shè)的第一閾值的區(qū)域,以將灰度高于所述第一閾值的區(qū)域定義為靜態(tài)圖像的設(shè)定區(qū)域。由于文字在靜態(tài)圖像上的灰度相對較高,所以根據(jù)實際需要或經(jīng)驗設(shè)定第一閾值來找出文字區(qū)域(即設(shè)定區(qū)域),從而可以提高文字信息的檢測效率。定義了設(shè)定區(qū)域之后,截取子單元8223便根據(jù)定義的設(shè)定區(qū)域的范圍從靜態(tài)圖像上截取出檢測圖像。
截取子單元8223截取出檢測圖像后,灰度計算子單元8241會獲取該檢測圖像,并對檢測圖像上相鄰像素的灰度值作減法運算。然后統(tǒng)計子單元8242根據(jù)灰度計算子單元8241的運算結(jié)果統(tǒng)計檢測圖像上每行像素的跳變次數(shù),這里所述的跳變是指相鄰像素灰度值的差值大于一個第三閾值(此第三閾值可以根據(jù)實際情況或經(jīng)驗來設(shè)定與調(diào)整),以根據(jù)檢測圖像上各行上像素的跳變次數(shù)確認檢測圖像上是否有文字信息。如果一張檢測圖像每行的跳變次數(shù)都比較少而且平均,就可以判斷出這張圖像上沒有文本信息,從而放棄對這張檢測圖像的后續(xù)文字識別。反之則判斷有。同時,灰度比對子單元8251也會獲取該檢測圖像,并將相鄰兩幀或相隔多幀的所述檢測圖像上對應(yīng)像素的灰度值進行比對。然后背景去除子單元8252會根據(jù)灰度比對子單元8251的比對結(jié)果,將檢測圖像上灰度值變化小于預(yù)設(shè)的第二閾值的像素所在的區(qū)域作為背景部分去除(此處第二閾值也可以根據(jù)實際情況或經(jīng)驗來設(shè)定或調(diào)整)。比如說,假設(shè)當(dāng)前正在識別的檢測圖像為第N巾貞,那么通過將第N幀圖像與其前η幀的第Ν-η幀圖像進行比對,比較兩者之間對應(yīng)的各像素的灰度,如果發(fā)現(xiàn)有對應(yīng)的像素灰度之差的絕對值·大于某一特定值i,則認為該像素是背景圖片,從而可以確定圖像上背景的區(qū)域并去除。這樣,就可以進一步地過濾掉檢測圖像上背景的部分,使文字的識別更加比較方便。對本發(fā)明來說,優(yōu)選的η取值小于5,i可以取值10。之后,區(qū)域檢測子單元8231會檢測檢測圖像上文字信息的起始點和終止點,以確認所述文字信息的區(qū)域。對于電視節(jié)目的圖像來說,由于電視的字幕信息一般只有一行,最多不過兩行,因此其起始點和終止點的判斷比較方便。文字信息的起始點和終止點確定以后,切分子單元8232會對檢測圖像上文字信息的區(qū)域進行行切分和字切分,以形成單字圖像。切分的目的是將單個文字從檢測圖像上提取出來,行切分是將檢測圖像先切割為行,字切分是在切割為行的圖像中分離出單個文字的圖像。行切分和字切分的方法很多,比如可以采用水平、垂直分割的方法,即通過在水平、垂直方向的投影找出各個文字的坐標(biāo)。切分完成后,特征提取子單元8233便能提取出單字圖像的統(tǒng)計特征或結(jié)構(gòu)特征,以識別檢測圖像上的文字信息。對單字圖像進行特征提取的過程,包括細化、歸一化等步驟,單字圖像的統(tǒng)計特征或結(jié)構(gòu)特征的提取均是現(xiàn)有的較為成熟的技術(shù),在此不再贅述。值得注意的是,文字的模式表達形式和相應(yīng)的字典形成方法有許多種,每種形式又可以選擇不同的特征,每種特征又有不同的抽取方法,這就使得判別方法和準(zhǔn)則以及所用的數(shù)學(xué)工具不同,形成了種類繁多、形式各異的文字識別方法??偟膩碚f,不同的特征抽取和分類器的設(shè)計方法決定了識別系統(tǒng)采用不同的處理方法,通常可以分為結(jié)構(gòu)模式識別方法、統(tǒng)計模式識別方法、統(tǒng)計與結(jié)構(gòu)相結(jié)合的識別方法以及人工神經(jīng)網(wǎng)絡(luò)方法等。最后,顯示屏81獲取電視畫面上的文字信息,并顯示在顯示屏81上可見的區(qū)域。以上所述,僅是本發(fā)明的較佳實施例而已,并非對本發(fā)明作任何形式上的限制,雖然本發(fā)明已以較佳實施例揭露如上,然而并非用以限定本發(fā)明,任何熟悉本專業(yè)的技術(shù)人員,在不脫離本發(fā)明技術(shù)方案范圍內(nèi),當(dāng)可利用上述揭示的技術(shù)內(nèi)容作出些許更動或修飾為等同變化的等效實施例,但凡是未脫離本發(fā)明技術(shù)方案內(nèi)容,依據(jù)本發(fā)明的技術(shù)實質(zhì)對以上實施例所作的任何簡單修改、等同變化與修飾,均仍屬于本發(fā)明技術(shù)方案的范圍內(nèi)。
權(quán)利要求
1.ー種從電視信號中提取文字信息并顯示的方法,其特征在于,包括 接收至少一幀電視信號; 從電視信號中獲得靜態(tài)圖像; 從所述靜態(tài)圖像上的設(shè)定區(qū)域截取檢測圖像,所述設(shè)定區(qū)域位于所述靜態(tài)圖像的底部; 對所述檢測圖像進行識別,提取其中的文字信息; 顯示提取出的所述文字信息。
2.如權(quán)利要求I所述的從電視信號中提取文字信息并顯示的方法,其特征在于,所述靜態(tài)圖像上的設(shè)定區(qū)域的高度為(l_r/R)*B/2,其中,r為靜態(tài)圖像的寬高比,R為電視屏幕的寬高比,B為電視屏幕高度。
3.如權(quán)利要求I所述的從電視信號中提取文字信息并顯示的方法,其特征在于,從所述靜態(tài)圖像上的設(shè)定區(qū)域截取檢測圖像的步驟包括 對所述靜態(tài)圖像的灰度進行提取; 檢測灰度高于預(yù)設(shè)的第一閾值的區(qū)域,并將所述灰度高于預(yù)設(shè)的第一閾值的區(qū)域定義為所述靜態(tài)圖像的設(shè)定區(qū)域; 從所述靜態(tài)圖像上的設(shè)定區(qū)域的范圍截取所述檢測圖像。
4.如權(quán)利要求I所述的從電視信號中提取文字信息并顯示的方法,其特征在于,所述對所述檢測圖像進行識別,提取其中的文字信息的步驟之前還包括 去除所述檢測圖像上的背景部分。
5.如權(quán)利要求4所述的從電視信號中提取文字信息并顯示的方法,其特征在于,所述去除所述檢測圖像上的背景部分的步驟包括 將相鄰兩幀或相隔多幀的所述檢測圖像上對應(yīng)像素的灰度值進行比對; 將所述檢測圖像上灰度值變化小于預(yù)設(shè)的第二閾值的像素所在的區(qū)域作為背景部分去除。
6.ー種電視機,包括顯示屏,其特征在干,還包括文字信息提取模塊,所述文字信息提取模塊包括 靜態(tài)圖像獲取單元,用于從電視節(jié)目信號中獲得靜態(tài)圖像; 檢測圖像獲取單元,用于從所述靜態(tài)圖像上的設(shè)定區(qū)域截取檢測圖像,所述設(shè)定區(qū)域位于所述靜態(tài)圖像的底部; 文字信息識別單元,用于對所述檢測圖像進行識別,提取其中的文字信息,以在所述顯示屏上顯示提取出的所述文字信息。
7.如權(quán)利要求6所述的電視機,其特征在于,所述靜態(tài)圖像上的設(shè)定區(qū)域的高度為(l-r/R)*B/2,其中,r為靜態(tài)圖像的寬高比,R為所述顯示屏的寬高比,B為所述顯示屏的高度。
8.如權(quán)利要求6所述的電視機,其特征在于,所述檢測圖像獲取単元進ー步包括 灰度提取子単元,用于對所述靜態(tài)圖像的灰度進行提?。? 設(shè)定區(qū)域定義子単元,用于檢測灰度高于預(yù)設(shè)的第一閾值的區(qū)域,以將所述灰度高于所述第一閾值的區(qū)域定義為所述靜態(tài)圖像的設(shè)定區(qū)域; 截取子単元,用于依照所述靜態(tài)圖像上的設(shè)定區(qū)域的范圍截取所述檢測圖像。
9.如權(quán)利要求6所述的電視機,其特征在于,所述文字信息提取模塊還包括 背景去除単元,用于去除所述檢測圖像上的背景部分。
10.如權(quán)利要求9所述的電視機,其特征在于,所述背景去除単元進ー步包括 灰度比對子單元,用于將相鄰兩幀或相隔多幀的所述檢測圖像上對應(yīng)像素的灰度值進行比對; 背景去除子単元,用于將所述檢測圖像上灰度值變化小于預(yù)設(shè)的第二閾值的像素所在的區(qū)域作為背景部分去除。
全文摘要
本發(fā)明提出一種從電視信號中提取文字信息并顯示的方法及電視機,其方法包括接收至少一幀電視信號;從電視信號中獲得靜態(tài)圖像;從所述靜態(tài)圖像上的設(shè)定區(qū)域截取檢測圖像,所述設(shè)定區(qū)域為所述靜態(tài)圖像上覆蓋文字信息的區(qū)域;對所述檢測圖像進行識別,提取其中的文字信息;顯示提取出的所述文字信息。本發(fā)明特別針對電視圖像上文字信息的特點,通過對靜態(tài)圖像上含有文字的部分進行截取,形成檢測區(qū)域較小的檢測圖像,因此相對于現(xiàn)有技術(shù),降低運算要求的同時,提高了識別效率。另一方面,本發(fā)明根據(jù)電視信號的特殊性,通過對兩幀圖像進行比較,可以將圖像背景去除,能夠方便地提取出文本信息。
文檔編號H04N21/431GK102802074SQ20121028836
公開日2012年11月28日 申請日期2012年8月14日 優(yōu)先權(quán)日2012年8月14日
發(fā)明者張文軍 申請人:海信集團有限公司