專利名稱:一種基于視覺中心原理的視頻傳輸裝置及其傳輸方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻傳輸技術(shù)領(lǐng)域,尤其是指一種基于視覺中心原理的視頻傳輸裝置及其傳輸方法。
背景技術(shù):
網(wǎng)絡(luò)技術(shù)的迅速發(fā)展使多媒體通信的應(yīng)用和研究受到前所未有的重視。視頻的數(shù)據(jù)量巨大,但由于目前網(wǎng)絡(luò)有限的帶寬、hternet的分組丟失率、無線網(wǎng)絡(luò)的高誤碼率、網(wǎng)絡(luò)異構(gòu)性以及網(wǎng)絡(luò)延遲等多種因素的影響,如何降低視頻的存儲(chǔ)、傳輸量都是計(jì)算機(jī)科技界一直在研究的問題。在窄帶高噪聲無線網(wǎng)絡(luò)信道環(huán)境下,如何利用人體視覺模型的特性來合理地使用有限的網(wǎng)絡(luò)帶寬,即讓有限的視頻比特流合理地分配,從而提高視頻重建圖像的主觀質(zhì)量是非常有意義的。
公開日為1998年9月30日、公開號(hào)為CN11M934A的專利公開了一種視頻傳輸裝置,具有傳輸經(jīng)復(fù)接的視頻信息的多個(gè)傳輸媒體,每個(gè)視頻信息接收單元與相應(yīng)的傳輸媒體相連,以在系統(tǒng)傳輸媒體上接收特定視頻信息,圖像顯示單元顯示視頻信息,把圖像顯示單元與任一視頻信息接收單元相連以向圖像顯示單元提供視頻信息的開關(guān),和圖像顯示請(qǐng)求單元與每個(gè)視頻信息接收單元和開關(guān)進(jìn)行通信,并通過向可以接收特定視頻信息的相關(guān)視頻信息接收單元和開關(guān)發(fā)出命令以請(qǐng)求在圖像顯示單元上顯示特定視頻信息。但是,該發(fā)明所使用的傳輸方法,數(shù)據(jù)量依然可能很龐大,在有限帶寬條件下傳輸緩慢。
發(fā)明內(nèi)容
為了解決現(xiàn)有視頻數(shù)據(jù)傳輸量較大的問題,本發(fā)明提出了一種基于視覺中心原理的視頻傳輸裝置及其傳輸方法,在視頻編解碼時(shí)保證視覺中心部分逼真再現(xiàn),而其余部分降低圖像質(zhì)量,從而在不影響觀看效果的前提下增加壓縮比、減少視頻的數(shù)據(jù)傳輸量,提高視頻圖像的主觀質(zhì)量。本發(fā)明所采用的技術(shù)方案是一種基于視覺中心原理的視頻傳輸裝置,包括依次連接的視覺中心分析模塊、視頻編碼模塊和視頻傳輸模塊,所述的視覺中心分析模塊用于查找視頻的視覺中心區(qū),所述的視頻編碼模塊采用不同壓縮率的編碼對(duì)視頻的視覺中心區(qū)和其他區(qū)分別編碼,所述的視頻傳輸模塊用于將編碼后的視頻傳輸至外部的視頻輸出設(shè)備。“視覺中心” 一詞一般出現(xiàn)于視覺藝術(shù)類的領(lǐng)域中,可以指平面藝術(shù)(如繪畫)中的主體,即畫面中以構(gòu)圖、色彩等畫面元素所表現(xiàn)出來的畫面的主要元素,也可以指人的視野在一個(gè)平面中的中心點(diǎn),通常人的視覺中心會(huì)在物理中心的偏上方。在本發(fā)明中,視頻中吸引人視覺注意的部分定義為視覺中心。因?yàn)橐欢我曨l的內(nèi)容往往變化很多,如千軍萬馬的場(chǎng)面、城市喧鬧的市區(qū)等,人眼無法全都注意到每個(gè)細(xì)節(jié),故人們只會(huì)注意圖像中的特殊部分,如動(dòng)作變化情況、色彩、形狀的不同等,如千軍萬馬向前奔時(shí),會(huì)特別注意紅旗、特殊顏色的馬、速度最快的領(lǐng)袖等等。利用人眼的這一現(xiàn)象,在視頻壓縮時(shí),當(dāng)整個(gè)圖像變化很大時(shí),只需保證特殊部分逼真再現(xiàn),而其余部分可以做省略壓縮,如降低幀頻,或降低分辨率,甚至轉(zhuǎn)為黑白色等,從而在不影響觀看效果的前提下達(dá)到增加壓縮比、減少視頻傳輸量的目的。這種技術(shù)適用于網(wǎng)絡(luò)視頻傳輸、高壓縮比的MP4播放器等。作為優(yōu)選,所述的視覺中心的類型包括亮度視覺中心、色彩視覺中心、運(yùn)動(dòng)視覺中心。視覺中心的主要表現(xiàn)就是視覺中心部分會(huì)與其他部分形成較大的反差,如顏色變化、運(yùn)動(dòng)變化、亮度變化等等。如在黑白的背景上出現(xiàn)彩色的物體,周圍全是冷色調(diào)的圖像中出現(xiàn)一個(gè)暖色體(如雪地里出現(xiàn)一個(gè)紅色旗幟)或周圍全是暖色調(diào)的圖像中出現(xiàn)冷色體(如艷陽天里出現(xiàn)一個(gè)樹蔭),這就是顏色上的反差,而這里的視覺中心定義為色彩視覺中心;如環(huán)境都在運(yùn)動(dòng),只有中間一個(gè)人或物不動(dòng),或環(huán)境都是不動(dòng)的,只有一個(gè)物體在動(dòng),這是運(yùn)動(dòng)上的反差,而這里的視覺中心定義為運(yùn)動(dòng)視覺中心;如黑天里出現(xiàn)一盞燈,或太陽光里出現(xiàn)一個(gè)黑影,這是亮度上的反差,而這里的視覺中心定義為亮度視覺中心;如一個(gè)人的目光從一個(gè)地方轉(zhuǎn)向另外一個(gè)地方,那觀眾就會(huì)關(guān)注他要看什么,而這里的視覺中心定義為其他視覺中心。一種基于視覺中心原理的視頻傳輸方法,步驟如下a.視覺中心分析模塊對(duì)視頻進(jìn)行分析,分析出該視頻的視覺中心位置和類型,將視頻劃分為視覺中心區(qū)和其他區(qū);b.視頻編碼模塊對(duì)視覺中心區(qū)和其他區(qū)壓縮編碼,給視覺中心區(qū)分配較多的碼字,而其他區(qū)則分配較少的碼字;C.視頻傳輸模塊將重新編碼后的視頻傳輸至視頻輸出設(shè)備,視覺中心區(qū)采用彩色畫質(zhì),分辨率大于800*600,且以大于30幀/秒的幀頻傳輸,其他區(qū)以低于或等于視覺中心區(qū)的分辨率和幀頻傳輸。找出視覺中心后,對(duì)視覺中心區(qū)做低壓縮率的傳輸,保證視覺中心區(qū)是清晰的,然后以視覺中心為中心向其他區(qū)擴(kuò)展,其他區(qū)擴(kuò)展優(yōu)先采用低分辨率傳輸。作為優(yōu)選,所述的步驟c中,若傳輸速度小于ΙΟΟΙΛ/s時(shí),其他區(qū)采用黑白畫質(zhì),分辨率小于或等于320松40,且以小于25幀/秒的幀頻傳輸。傳輸速度較小時(shí),其他區(qū)在分辨率、色彩、幀頻等方面做犧牲來保證視覺中心的質(zhì)量。作為優(yōu)選,所述的步驟c中,若傳輸速度為ΙΟΟΙΛ/s至3001A/S時(shí),其他區(qū)采用彩色畫質(zhì),分辨率在32(^240和800*600之間,且以25幀/秒至30幀/秒的幀頻傳輸。在傳輸速度略有富余,可以提高其他區(qū)的分辨率,有條件可使用彩色畫質(zhì)。作為優(yōu)選,所述的步驟c中,若傳輸速度大于3001A/S時(shí),其他區(qū)采用彩色畫質(zhì),分辨率大于或等于800*600,且以大于30幀/秒的幀頻傳輸。若傳輸速度足夠快,其他區(qū)和視覺中心區(qū)可采用同樣的幀頻和分辨率。作為優(yōu)選,步驟b中視頻編碼模塊所選用的編碼方式為MPEG-2或MPEG-4或 H. 264。本發(fā)明的有益效果是視頻編解碼時(shí)保證視覺中心部分逼真再現(xiàn),而其余部分省略壓縮,從而在不影響觀看效果的前提下增加壓縮比,減少視頻的數(shù)據(jù)傳輸量,提高視頻的圖像主觀質(zhì)量。
圖1是本發(fā)明的一種結(jié)構(gòu)框圖;圖2是本發(fā)明的一種工作流程圖。其中,1-視覺中心分析模塊,2-視頻編碼模塊,3-視頻傳輸模塊,4-視頻輸出設(shè)備。
具體實(shí)施例方式下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說明。實(shí)施例1如圖1所示,一種基于視覺中心原理的視頻傳輸裝置,包括依次連接的視覺中心分析模塊1、視頻編碼模塊2和視頻傳輸模塊3。視覺中心分析模塊1用于查找視頻的視覺中心區(qū)。視覺中心的類型包括亮度視覺中心、色彩視覺中心、運(yùn)動(dòng)視覺中心和其他視覺中心。對(duì)于顏色、運(yùn)動(dòng)、亮度等的視覺中心比較好找,或?qū)ふ翌伾膶?duì)比度,或查找兩幀圖像相減后與其它大區(qū)域明顯不同的小區(qū)域,或?qū)⒒叶榷祷?,但?duì)于其他視覺中心,特別是隱含的視覺中心則相對(duì)難找。視頻編碼模塊2采用不同壓縮率的編碼對(duì)視頻的視覺中心區(qū)和其他區(qū)分別編碼。 視頻編碼模塊2采用的編碼方式為MPEG-2或MPEG-4或H. 264等。視頻傳輸模塊3用于將編碼后的視頻傳輸至視頻輸出設(shè)備4。傳輸速度較小時(shí),其他區(qū)擴(kuò)展采用黑白畫質(zhì),采用低分辨率傳輸,在分辨率、色彩、幀頻等方面做犧牲來保證視覺中心的質(zhì)量。本發(fā)明的工作流程如圖2所示。首先,視覺中心分析模塊1對(duì)視頻進(jìn)行分析,分析出該視頻的視覺中心位置和類型,將視頻劃分為視覺中心區(qū)和其他區(qū)。在尋找視覺中心時(shí)我們以圖像塊為單位,所謂圖像塊就是將整幅圖像分為若干區(qū)域,每個(gè)區(qū)域?yàn)橐粔K。若視頻中有亮度反差,則存在亮度視覺中心。先將每塊的亮度取塊內(nèi)的平均值,然后求各個(gè)塊的灰度增量,如果一個(gè)塊的灰度增量大于一個(gè)閾值,則它就是亮度反差大的視覺中心?;叶仍隽康那蠼夥椒梢园凑账髫悹査阕?SOBEL)的求解方法進(jìn)行。對(duì)于索貝爾算子的求解結(jié)果,如果某一個(gè)塊的SOBEL邊緣提取結(jié)果是孤立的一個(gè)點(diǎn),那它就是亮度視覺中心。若視頻中有冷暖色反差,則存在色彩視覺中心。冷暖色是美術(shù)里的術(shù)語,彩色是由紅綠藍(lán)三種顏色組成,本發(fā)明將冷暖色定義為紅色與藍(lán)色的比例,該比例值大就為暖色,該比例值小就為冷色。計(jì)算各個(gè)塊的冷暖色比例,然后用索貝爾算子邊緣提取求各個(gè)塊比例值的變化量,再判斷變化量大且孤立的塊,這樣的塊就是色彩視覺中心。如果不孤立,則就是連片的變化,不算是中心。若視頻中有運(yùn)動(dòng)的反差,則存在運(yùn)動(dòng)視覺中心。為了降低計(jì)算量,提高判別速度, 將一幀圖中每4X4小塊的平均灰度生成該幀的簡(jiǎn)圖,利用圖像空間幾何知識(shí)求取各個(gè)幀簡(jiǎn)圖之間的仿射參數(shù)。根據(jù)仿射參數(shù)可以知道相鄰幀之間縮放、旋轉(zhuǎn)、平移等運(yùn)動(dòng)狀態(tài),若某個(gè)參數(shù)大于一定閥值,則它即為運(yùn)動(dòng)視覺中心。至于其他視覺中心,比如說隱含視覺中心,如一個(gè)人的目光從一個(gè)地方轉(zhuǎn)向另外一個(gè)地方,那觀眾就會(huì)關(guān)注他要看什么,這一類涉及目標(biāo)識(shí)別等復(fù)雜算法,暫時(shí)不考慮。
找出視覺中心后視頻編碼模塊2對(duì)視覺中心區(qū)和其他區(qū)壓縮編碼,給視覺中心區(qū)分配較多的碼字,而其他區(qū)則分配較少的碼字。這里,視頻編碼模塊可選用的編碼方式為 MPEG-2、MPEG-4、H. 264 等多種方式。然后,視頻傳輸模塊3將重新編碼后的視頻傳輸至視頻輸出設(shè)備4,視覺中心區(qū)采用彩色畫質(zhì),分辨率大于800*600,且以大于30幀/秒的幀頻傳輸,其他區(qū)以低于或等于視覺中心區(qū)的分辨率和幀頻傳輸。若傳輸速度小于ΙΟΟΙΛ/s時(shí),其他區(qū)采用黑白畫質(zhì),分辨率小于或等于320拉40,且以小于25幀/秒的幀頻傳輸;若傳輸速度為ΙΟΟΙΛ/s至3001cb/S 時(shí),其他區(qū)采用彩色畫質(zhì),分辨率在32(^240和800*600之間,且以25幀/秒至30幀/秒的幀頻傳輸;若傳輸速度大于3001A/S時(shí),其他區(qū)采用彩色畫質(zhì),分辨率大于或等于800*600, 且以大于30幀/秒的幀頻傳輸??傊诒WC視覺中心為高質(zhì)量傳輸?shù)那疤嵯拢绻麄鬏斔俾什粔蚓驮诜直媛?、色彩、幀頻等方面做犧牲來保證視覺中心的質(zhì)量,這樣對(duì)觀看者的影響不大。以上實(shí)施例僅為說明本發(fā)明的技術(shù)思想,不能以此限定本發(fā)明的保護(hù)范圍,凡是按照本發(fā)明提出的技術(shù)思想,在技術(shù)方案基礎(chǔ)上所做的任何改動(dòng),均落入本發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種基于視覺中心原理的視頻傳輸裝置,其特征在于包括依次連接的視覺中心分析模塊、視頻編碼模塊和視頻傳輸模塊,所述的視覺中心分析模塊用于查找視頻的視覺中心區(qū),所述的視頻編碼模塊采用不同壓縮率的編碼對(duì)視頻的視覺中心區(qū)和其他區(qū)分別編碼,所述的視頻傳輸模塊用于將編碼后的視頻傳輸至外部的視頻輸出設(shè)備。
2.根據(jù)權(quán)利要求1所述的一種基于視覺中心原理的視頻傳輸裝置,其特征在于所述的視覺中心的類型包括亮度視覺中心、色彩視覺中心、運(yùn)動(dòng)視覺中心。
3.一種基于視覺中心原理的視頻傳輸方法,其特征在于步驟如下a.視覺中心分析模塊對(duì)視頻進(jìn)行分析,分析出該視頻的視覺中心位置和類型,將視頻劃分為視覺中心區(qū)和其他區(qū);b.視頻編碼模塊對(duì)視覺中心區(qū)和其他區(qū)壓縮編碼,給視覺中心區(qū)分配較多的碼字,而其他區(qū)則分配較少的碼字;c.視頻傳輸模塊將重新編碼后的視頻傳輸至視頻輸出設(shè)備,視覺中心區(qū)采用彩色畫質(zhì),分辨率大于800*600,以大于30幀/秒的幀頻傳輸,其他區(qū)以低于或等于視覺中心區(qū)的分辨率和幀頻傳輸。
4.根據(jù)權(quán)利要求3所述的一種基于視覺中心原理的視頻傳輸方法,其特征在于所述的步驟c中,若傳輸速度為ΙΟΟΙΛ/s至3001A/S時(shí),其他區(qū)采用彩色畫質(zhì),分辨率在32(^240 和800*600之間,以25幀/秒至30幀/秒的幀頻傳輸。
5.根據(jù)權(quán)利要求3所述的一種基于視覺中心原理的視頻傳輸方法,其特征在于所述的步驟c中,若傳輸速度大于3001A/S時(shí),其他區(qū)采用彩色畫質(zhì),分辨率大于或等于 800*600,且以大于30幀/秒的幀頻傳輸。
6.根據(jù)權(quán)利要求3所述的一種基于視覺中心原理的視頻傳輸方法,其特征在于所述的步驟c中,若傳輸速度小于ΙΟΟΙΛ/s時(shí),其他區(qū)采用黑白色畫質(zhì),分辨率小于或等于 320拉40,且以小于25幀/秒的幀頻傳輸。
7.根據(jù)權(quán)利要求3或4或5或6所述的一種基于視覺中心原理的視頻傳輸方法,其特征在于步驟b中視頻編碼模塊所選用的編碼方式為MPEG-2或MPEG-4或H. 264.
全文摘要
本發(fā)明公開了一種基于視覺中心原理的視頻傳輸裝置及其傳輸方法,裝置包括依次連接的視覺中心分析模塊、視頻編碼模塊和視頻傳輸模塊,視覺中心分析模塊用于查找視頻的視覺中心區(qū),視頻編碼模塊采用不同壓縮率的編碼對(duì)視頻的視覺中心區(qū)和其他區(qū)分別編碼,視頻傳輸模塊用于將編碼后的視頻傳輸至視頻輸出設(shè)備。本發(fā)明可以在視頻編解碼時(shí)保證視覺中心部分逼真再現(xiàn),而其余部分省略壓縮,從而在不影響觀看效果的前提下增加壓縮比,減少視頻的數(shù)據(jù)傳輸量,提高視頻的圖像主觀質(zhì)量。
文檔編號(hào)H04N7/26GK102438134SQ201110372060
公開日2012年5月2日 申請(qǐng)日期2011年11月22日 優(yōu)先權(quán)日2011年11月22日
發(fā)明者雷志輝, 鞠怡明 申請(qǐng)人:蘇州科雷芯電子科技有限公司