一種基于視覺顯著性分析的恐怖圖像識別方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種基于視覺顯著性分析的恐怖圖像識別方法及系統(tǒng)。該方法包括:建立包括恐怖圖像樣本和非恐怖圖像樣本的訓(xùn)練集;利用圖像視覺顯著性分析算法對每一幅訓(xùn)練樣本圖像進(jìn)行視覺顯著性分析,以得到每幅訓(xùn)練樣本圖像的視覺顯著圖;將每幅訓(xùn)練樣本圖像劃分成W×W小圖像塊,并對每個(gè)圖像塊提取視覺和情感特征,并利用基于視覺顯著性的詞包表示模型得到每幅訓(xùn)練樣本圖像的視覺單詞直方圖表示;利用得到的每幅訓(xùn)練樣本圖像的視覺單詞直方圖及其對應(yīng)的標(biāo)簽訓(xùn)練支持向量機(jī)以得到恐怖圖像的分類模型,并利用該分量模型對新的測試圖像進(jìn)行識別,判斷其是否為恐怖圖像。本發(fā)明可應(yīng)用到Web恐怖圖像過濾以及圖像情感語義識別等領(lǐng)域,具有廣闊的應(yīng)用前景。
【專利說明】一種基于視覺顯著性分析的恐怖圖像識別方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及模式識別、計(jì)算機(jī)網(wǎng)絡(luò)內(nèi)容安全,以及圖像情感理解【技術(shù)領(lǐng)域】,尤其涉及一種基于視覺顯著性分析的恐怖圖像識別方法及系統(tǒng)。
【背景技術(shù)】
[0002]在過去的數(shù)十年間,互聯(lián)網(wǎng)上信息和資源的爆增使我們可以非常方便地、跨地域地分享文字,圖像和視頻等多媒體信息。然而,互聯(lián)網(wǎng)信息監(jiān)管的缺失使得越來越多的有害和非法內(nèi)容,例如色情、暴力、恐怖、恐怖主義等,泛濫于整個(gè)互聯(lián)網(wǎng)。因此,一個(gè)有效的不良網(wǎng)頁過濾系統(tǒng)對于防止不良信息的非法傳播、保護(hù)青少年身心健康都具有重要的意義。
[0003]近來,互聯(lián)網(wǎng)中廣泛傳播的恐怖文本、圖像以及視頻等內(nèi)容正在侵入青少年的日常生活。大量的心理學(xué)和生理學(xué)的研究表明,過多的恐怖圖像或文字會嚴(yán)重影響孩子的身心健康。恐怖內(nèi)容的嚴(yán)重泛濫使得研發(fā)一種網(wǎng)絡(luò)恐怖信息過濾系統(tǒng)具有重要的必要性?,F(xiàn)有的各種Web過濾算法主要關(guān)注色情網(wǎng)頁過濾或暴力的內(nèi)容過濾。與色情圖像過濾相比,目前也還沒有太多的研究關(guān)注互聯(lián)網(wǎng)中恐怖圖像的過濾。
【發(fā)明內(nèi)容】
[0004]有鑒于此,本發(fā)明的主要目的是提供一種基于視覺顯著性分析的恐怖圖像識別方法與系統(tǒng)。
[0005]為達(dá)到上述目的,本發(fā)明提供了一種基于視覺顯著性分析的恐怖圖像識別方法,該方法包括:
[0006]一種基于視覺顯著性分析的恐怖圖像識別方法,其特征在于,該方法包括:
[0007]步驟1:建立包括恐怖圖像樣本和非恐怖圖像樣本的訓(xùn)練集;
[0008]步驟2:利用圖像視覺顯著性分析算法對每一幅訓(xùn)練樣本圖像進(jìn)行視覺顯著性分析,以得到每幅訓(xùn)練樣本圖像的視覺顯著圖;
[0009]步驟3:將每幅訓(xùn)練樣本圖像劃分成WXW小圖像塊,并對每個(gè)圖像塊提取視覺和情感特征,并利用基于視覺顯著性的詞包表示模型得到每幅訓(xùn)練樣本圖像的視覺單詞直方圖表示,其中W為自然數(shù);
[0010]步驟4:利用得到的每幅訓(xùn)練樣本圖像的視覺單詞直方圖及其對應(yīng)的標(biāo)簽訓(xùn)練支持向量機(jī)以得到恐怖圖像的分類模型,并利用該分量模型對新的測試圖像進(jìn)行識別,判斷其是否為恐怖圖像。
[0011]一種基于視覺顯著性分析的恐怖圖像識別系統(tǒng),其特征在于,該系統(tǒng)包括:
[0012]訓(xùn)練集建立模塊:其用于建立包括恐怖圖像樣本和非恐怖圖像樣本的訓(xùn)練集;
[0013]視覺顯著性分析模塊,其用于利用圖像視覺顯著性分析算法對每一幅樣本圖像進(jìn)行視覺顯著性分析,以得到每幅樣本圖像的視覺顯著圖;
[0014]圖像特征提取模塊,其用于將每幅樣本圖像劃分成WXW小圖像塊,并對每個(gè)圖像塊提視覺與情感特征,并利用基于視覺顯著性的詞包表示模型得到每個(gè)訓(xùn)練樣本圖像的視覺單詞直方圖特征,其中W為自然數(shù);
[0015]恐怖圖像識別模塊,其利用得到的每幅樣本圖像的詞包表示模型及其對應(yīng)的標(biāo)簽訓(xùn)練支持向量機(jī)以得到恐怖圖像的分類模型,并利用該分量模型對新的測試圖像進(jìn)行識別,判斷其是否為恐怖圖像。
[0016]從上述技術(shù)方案可以看出,本發(fā)明具有以下優(yōu)點(diǎn):
[0017]1、本發(fā)明提供的這種恐怖圖像識別方法,將視覺注意機(jī)制、顏色情感認(rèn)知等視覺認(rèn)知理論引入到恐怖圖像識別當(dāng)中。充分利用人的視覺認(rèn)知和情感認(rèn)知的過程來指導(dǎo)恐怖圖像的識別。
[0018]2、本發(fā)明提供的這種恐怖圖像識別方法充分利用了圖像視覺顯著區(qū)域和非顯著區(qū)域之間的上下文關(guān)系來表達(dá)圖像的情感特征。而恐怖圖像往往就是通過這種上下文關(guān)系來表達(dá)恐怖情感的。
[0019]3、本系統(tǒng)的所有模塊都是完全自動(dòng)的,不需要人工干預(yù),因此能夠非常容易地嵌入到各類Web信息過濾系統(tǒng)中去。此外,本系統(tǒng)還可以作為恐怖情感識別的一個(gè)子系統(tǒng)擴(kuò)展到通用情感識別系統(tǒng)當(dāng)中。具有廣泛的應(yīng)用前景。
【專利附圖】
【附圖說明】
[0020]圖1是本發(fā)明提供的恐怖圖像識別方法流程圖。
[0021]圖2為本發(fā)明提供的基于顯著性分析的詞包模型。
[0022]圖3為本發(fā)明提供的恐怖圖像識別系統(tǒng)的訓(xùn)練流程圖。
[0023]圖4為本發(fā)明提供的恐怖圖像識別系統(tǒng)的測試流程圖。 【具體實(shí)施方式】
[0024]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,以下結(jié)合具體實(shí)施例,并參照附圖,對本發(fā)明作進(jìn)一步的詳細(xì)說明。
[0025]圖1示出了本發(fā)明公開的一種基于視覺顯著性分析的恐怖圖像識別方法流程圖。如圖1所示,該方法包括以下步驟:
[0026]步驟1:首先搜集盡可能多的恐怖和非恐怖圖像樣本形成訓(xùn)練集;并使7個(gè)用戶對每一幅恐怖圖像進(jìn)行“恐怖、有點(diǎn)恐怖、不恐怖”投票。如果一幅恐怖圖像獲得少于4票“恐怖”,將其剔出訓(xùn)練集以獲得典型的訓(xùn)練集。恐怖圖像的搜集可以從大量的圖像共享網(wǎng)站上獲取。而非恐怖圖像需要盡可能的多樣性,可包含:人物、動(dòng)物、風(fēng)景、卡通等。
[0027]步驟2:利用圖像視覺顯著性分析算法對所述典型訓(xùn)練集中的每一幅訓(xùn)練圖像進(jìn)行視覺顯著性分析,以得到每幅圖像的視覺顯著圖。
[0028]本發(fā)明提供了一種基于高斯差分融合的圖像顯著性分析方法。假設(shè)輸入圖像中像素點(diǎn)X處的RGB顏色值為:I (X) = [R(X),G(X),B(X)]τ,那么第k個(gè)高斯差分值Sk (X)定義如下:
【權(quán)利要求】
1.一種基于視覺顯著性分析的恐怖圖像識別方法,其特征在于,該方法包括:步驟1:建立包括恐怖圖像樣本和非恐怖圖像樣本的訓(xùn)練集;步驟2:利用圖像視覺顯著性分析算法對每一幅訓(xùn)練樣本圖像進(jìn)行視覺顯著性分析,以得到每幅訓(xùn)練樣本圖像的視覺顯著圖;步驟3:將每幅訓(xùn)練樣本圖像劃分成WXW小圖像塊,并對每個(gè)圖像塊提取視覺和情感特征,并利用基于視覺顯著性的詞包表示模型得到每幅訓(xùn)練樣本圖像的視覺單詞直方圖表示,其中W為自然數(shù);步驟4:利用得到的每幅訓(xùn)練樣本圖像的視覺單詞直方圖及其對應(yīng)的標(biāo)簽訓(xùn)練支持向量機(jī)以得到恐怖圖像的分類模型,并利用該分量模型對新的測試圖像進(jìn)行識別,判斷其是否為恐怖圖像。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述訓(xùn)練集的建立包括如下步驟:步驟11、搜集大量的恐怖圖像和非恐怖圖像;步驟12、由多個(gè)用戶對每一幅恐怖圖像樣本進(jìn)行“恐怖、有點(diǎn)恐怖、不恐怖”的投票;如果一幅恐怖圖像樣本獲得少于一定數(shù)量的“恐怖”投票,則將其剔出訓(xùn)練集以獲得最終的訓(xùn)練集。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的圖像視覺顯著性分析算法是基于高斯差分融合的圖像視覺顯著性分析方法,其利用閔可夫斯基范數(shù)將不同尺度上的高斯差分圖像融合得到最終的圖像的視覺顯著圖。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的圖像的視覺和情感特征包括顏色特征、紋理特征以及顏色情感特征;所述的基于視覺顯著性的詞包表示模型包含兩種視覺單詞:恐怖視覺單詞和通用視覺單詞;該詞包表示模型根據(jù)得到的視覺顯著圖按不同的權(quán)重將每個(gè)圖像塊分配給不同的視覺單詞,以構(gòu)建每幅樣本圖像的視覺單詞直方圖特征。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述每幅樣本圖像的視覺顯著圖中每個(gè)像素的視覺顯著值如下計(jì)算:
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述視覺單詞包含恐怖視覺單詞集合HV與通用視覺單詞的集合UV ;對于一幅圖像的恐怖視覺單詞對應(yīng)的直方圖定義如下:
7.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述顏色特征包括每個(gè)圖像塊Ik的HSV顏色和當(dāng)前圖像塊與整幅圖像的HSV顏色差;所述紋理特征包括圖像塊的符合威布爾分布的寬度參數(shù)和峰值參數(shù)特征、以及其與整幅圖像的紋理特征差異;顏色情感特征包括圖像塊的平均顏色情感值以及其與整幅圖像的顏色情感值的差值。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,顏色情感特征涉及三個(gè)因素:活動(dòng)性CA、重要性CW和熱度CH ;這三個(gè)因素如下計(jì)算:
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟4中采用支持向量機(jī)分類算法對測試圖像進(jìn)行識別。
10.一種基于視覺顯著性分析的恐怖圖像識別系統(tǒng),其特征在于,該系統(tǒng)包括:訓(xùn)練集建立模塊:其用于建立包括恐怖圖像樣本和非恐怖圖像樣本的訓(xùn)練集;視覺顯著性分析模塊,其用于利用圖像視覺顯著性分析算法對每一幅樣本圖像進(jìn)行視覺顯著性分析,以得到每幅樣本圖像的視覺顯著圖;
【文檔編號】G06K9/62GK103440494SQ201310279120
【公開日】2013年12月11日 申請日期:2013年7月4日 優(yōu)先權(quán)日:2013年7月4日
【發(fā)明者】李兵, 胡衛(wèi)明, 吳偶 申請人:中國科學(xué)院自動(dòng)化研究所