一種視頻內(nèi)容文字感知定位系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本實(shí)用新型涉及數(shù)字圖像處理領(lǐng)域,具體涉及一種系統(tǒng)結(jié)構(gòu)簡(jiǎn)單、文字定位精確的視頻內(nèi)容文字感知定位系統(tǒng)。
【背景技術(shù)】
[0002]針對(duì)大量視頻圖像中出現(xiàn)的各種文字信息自動(dòng)地抽取并識(shí)別,在圖像數(shù)據(jù)庫(kù)的組織與管理、視頻索引等方面將有著極其廣泛的應(yīng)用。在基于內(nèi)容的視頻檢索和瀏覽中,可供利用的一個(gè)重要線(xiàn)索是視頻中所包含的字符。因此,自動(dòng)地檢測(cè)和識(shí)別字符是抽取視頻語(yǔ)義內(nèi)容的基礎(chǔ)和關(guān)鍵所在。監(jiān)控視頻圖像由于數(shù)據(jù)量龐大,冗余多,通常以壓縮后的視頻流形式進(jìn)行存儲(chǔ)和傳輸,目前h.264的編碼標(biāo)準(zhǔn)被大量采納。若將視頻流解碼,再進(jìn)行字符定位檢測(cè),計(jì)算量大,也嚴(yán)重地影響了處理速度。若在壓縮域中對(duì)視頻流直接處理,有利于提尚實(shí)時(shí)性。但該算法的準(zhǔn)確性仍有待進(jìn)一步提尚,因此本專(zhuān)利提出將抽取視頻流中的IDR關(guān)鍵幀進(jìn)行像素域處理,結(jié)合DCT的頻域特征,進(jìn)行互補(bǔ)制約的對(duì)視頻流中的文字進(jìn)行識(shí)別與定位,在保證精度的同時(shí),也保障了算法的實(shí)時(shí)性。
【實(shí)用新型內(nèi)容】
[0003]針對(duì)上述問(wèn)題,本實(shí)用新型的主要目的在于提供一種系統(tǒng)結(jié)構(gòu)簡(jiǎn)單、文字定位精確的視頻內(nèi)容文字感知定位系統(tǒng)。
[0004]本實(shí)用新型是通過(guò)下述技術(shù)方案來(lái)解決上述技術(shù)問(wèn)題的:一種視頻內(nèi)容文字感知定位系統(tǒng),所述視頻內(nèi)容文字感知定位系統(tǒng)包括圖像采集裝置、接口、熵編碼器、文字識(shí)別器、文字采集器、文字處理器、解碼器、文字顯示器、發(fā)送端口,需要識(shí)別文字的壓縮視頻流進(jìn)入圖像采集裝置,圖像采集裝置和熵編碼器通過(guò)接口連接在一起,熵編碼器上連接有識(shí)別文字信息的文字識(shí)別器,文字識(shí)別器上連接有采集文字信息的文字采集器,文字采集器上連接有處理文字信息的文字處理器,文字處理器上連接有將文字信息解碼為可以顯示識(shí)別的文字的解碼器,解碼器上連接有顯示文字信息的文字顯示器。
[0005]在本實(shí)用新型的一個(gè)具體實(shí)施例子中,所述文字處理器還連接有將文字輸入計(jì)算機(jī)進(jìn)行存儲(chǔ)的發(fā)送端口。
[0006]在本實(shí)用新型的一個(gè)具體實(shí)施例子中,所述圖像采集裝置為攝像頭。
[0007]本實(shí)用新型的積極進(jìn)步效果在于:本實(shí)用新型提供的視頻內(nèi)容文字感知定位系統(tǒng)具有以下優(yōu)點(diǎn):本實(shí)用新型提供了高精度的視頻中文字定位,使用方便、直觀、提高視頻內(nèi)容感知檢測(cè)效率。復(fù)雜背景下也能取得較高的檢測(cè)率和定位精度,具有良好的魯棒性和實(shí)用性。
【附圖說(shuō)明】
[0008]圖1為本實(shí)用新型的整體結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0009]下面結(jié)合附圖給出本實(shí)用新型較佳實(shí)施例,以詳細(xì)說(shuō)明本實(shí)用新型的技術(shù)方案。
[0010]圖1為本實(shí)用新型的整體結(jié)構(gòu)示意圖。如圖1所示,本實(shí)用新型提供的視頻內(nèi)容文字感知定位系統(tǒng),包括圖像采集裝置1、接口 2、熵編碼器3、文字識(shí)別器4、文字采集器5、文字處理器6、解碼器7、文字顯示器8、發(fā)送端口 9,需要識(shí)別文字的壓縮視頻流進(jìn)入圖像采集裝置1,圖像采集裝置I和熵編碼器3通過(guò)接口 2連接在一起,熵編碼器3上連接有識(shí)別文字信息的文字識(shí)別器4,文字識(shí)別器4上連接有采集文字信息的文字采集器5,文字采集器5上連接有處理文字信息的文字處理器6,文字處理器6上連接有將文字信息解碼為可以顯示識(shí)別的文字的解碼器7,解碼器7上連接有顯示文字信息的文字顯示器8。
[0011]文字處理器6還連接有將文字輸入計(jì)算機(jī)10進(jìn)行存儲(chǔ)的發(fā)送端口 9。
[0012]在一般情況下,本實(shí)用新型中的圖像采集裝置I可以選為攝像頭。
[0013]本實(shí)用新型提供了高精度的視頻中文字定位,使用方便、直觀、提高視頻內(nèi)容感知檢測(cè)效率。復(fù)雜背景下也能取得較高的檢測(cè)率和定位精度,具有良好的魯棒性和實(shí)用性。
[0014]以上顯示和描述了本實(shí)用新型的基本原理和主要特征和本實(shí)用新型的優(yōu)點(diǎn)。本行業(yè)的技術(shù)人員應(yīng)該了解,本實(shí)用新型不受上述實(shí)施例的限制,上述實(shí)施例和說(shuō)明書(shū)中描述的只是說(shuō)明本實(shí)用新型的原理,在不脫離本實(shí)用新型精神和范圍的前提下,本實(shí)用新型還會(huì)有各種變化和改進(jìn),這些變化和改進(jìn)都落入要求保護(hù)的本實(shí)用新型范圍內(nèi),本實(shí)用新型要求保護(hù)范圍由所附的權(quán)利要求書(shū)及其等效物界定。
【主權(quán)項(xiàng)】
1.一種視頻內(nèi)容文字感知定位系統(tǒng),其特征在于:所述視頻內(nèi)容文字感知定位系統(tǒng)包括圖像采集裝置、接口、熵編碼器、文字識(shí)別器、文字采集器、文字處理器、解碼器、文字顯示器、發(fā)送端口,需要識(shí)別文字的壓縮視頻流進(jìn)入圖像采集裝置,圖像采集裝置和熵編碼器通過(guò)接口連接在一起,熵編碼器上連接有識(shí)別文字信息的文字識(shí)別器,文字識(shí)別器上連接有采集文字信息的文字采集器,文字采集器上連接有處理文字信息的文字處理器,文字處理器上連接有將文字信息解碼為可以顯示識(shí)別的文字的解碼器,解碼器上連接有顯示文字信息的文字顯示器。
2.根據(jù)權(quán)利要求1所述的視頻內(nèi)容文字感知定位系統(tǒng),其特征在于:所述文字處理器還連接有將文字輸入計(jì)算機(jī)進(jìn)行存儲(chǔ)的發(fā)送端口。
3.根據(jù)權(quán)利要求1所述的視頻內(nèi)容文字感知定位系統(tǒng),其特征在于:所述圖像采集裝置為攝像頭。
【專(zhuān)利摘要】本實(shí)用新型涉及一種視頻內(nèi)容文字感知定位系統(tǒng),包括圖像采集裝置、接口、熵編碼器、文字識(shí)別器、文字采集器、文字處理器、解碼器、文字顯示器、發(fā)送端口,需要識(shí)別文字的壓縮視頻流進(jìn)入圖像采集裝置,圖像采集裝置和熵編碼器通過(guò)接口連接在一起,熵編碼器上連接有識(shí)別文字信息的文字識(shí)別器,文字識(shí)別器上連接有采集文字信息的文字采集器,文字采集器上連接有處理文字信息的文字處理器,文字處理器上連接有將文字信息解碼為可以顯示識(shí)別的文字的解碼器,解碼器上連接有文字顯示器。本實(shí)用新型提供了高精度的視頻中文字定位,使用方便、直觀、提高視頻內(nèi)容感知檢測(cè)效率,復(fù)雜背景下也能取得較高的檢測(cè)率和定位精度,具有良好的魯棒性和實(shí)用性。
【IPC分類(lèi)】G06K9-20, G06F17-30
【公開(kāi)號(hào)】CN204406433
【申請(qǐng)?zhí)枴緾N201520049677
【發(fā)明人】賈莉莉, 曹寧, 王成龍
【申請(qǐng)人】上海國(guó)際技貿(mào)聯(lián)合有限公司
【公開(kāi)日】2015年6月17日
【申請(qǐng)日】2015年1月23日