專利名稱:一種針對htm/html信息隱藏系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明應(yīng)用于信息安全,信息數(shù)字化,信息傳輸和移動(dòng)存儲(chǔ)。
背景技術(shù):
隱寫術(shù)是關(guān)于信息隱藏,即不讓計(jì)劃的接收者之外的任何人知道信息的傳遞事件 (而不只是信息的內(nèi)容)的一門技巧與科學(xué)。隱寫術(shù)英文作“steganography”,來源于約翰尼斯·特里特米烏斯的一本看上去是有關(guān)黑魔法,實(shí)際上是講密碼學(xué)與隱寫術(shù)的一本書 《Steganographia》中。此書書名來源于希臘語,意為“隱秘書寫”。信息隱藏是指在設(shè)計(jì)和確定模塊時(shí),使得一個(gè)模塊內(nèi)包含的特定信息(過程或數(shù)據(jù)),對于不需要這些信息的其他模塊來說是透明的。HTML (Hyper Text Mark-up Language)即超文本標(biāo)記語言或超文本鏈接標(biāo)示語言,是目前網(wǎng)絡(luò)上應(yīng)用最為廣泛的語言,也是構(gòu)成網(wǎng)頁文檔的主要語言。HTML文本是由 HTML命令組成的描述性文本,HTML命令可以說明文字、圖形、動(dòng)畫、聲音、表格、鏈接等。 HTML的結(jié)構(gòu)包括頭部(Head)和主體(Body)兩大部分,其中頭部描述瀏覽器所需的信息,而主體則包含所要說明的具體內(nèi)容。針對三者特色,我們將其綜合到一塊。針對htm/html的信息隱藏,即針對htm/ html的信息隱寫,就是將敏感信息通過打包編碼后使其作為一個(gè)整體,主要解決不同類型信息,比如多個(gè)文件。將信息打包后,我們將其放大到原來的八倍,并按照特定的算法將信息嵌入到原始的html載體中,新形成的信息巧妙的利用html自解析,偽裝后的html和普通html外觀上無任何區(qū)別,通過偽裝自己,迷惑攻擊者,使得傳輸原有信息的基礎(chǔ)上,為敏感信息的傳遞開啟了一條綠色通道。敏感信息還可以通過加密算法使得即使信息不幸泄漏,仍留有最后一道屏障,為信息的安全傳輸提供了一道新的防護(hù)墻。
發(fā)明內(nèi)容
1、本發(fā)明是一種針對htm/html文本格式的信息隱藏系統(tǒng),此系統(tǒng)由htm/html超文本識別模塊、信息收集模塊、信息處理模塊和提取模塊組成。2、發(fā)明內(nèi)容1所述的二維條碼信息索引生成模塊包含以下實(shí)現(xiàn)步驟(1) htm/html文本被序列化后,我們將其看做一個(gè)bitstream,對于bitstream按照官方對htm/html的解釋,將其信息分為<HTML><HEAD><title>, <base>, <link>, <isindex>, <meta></HEAD><B0DY>HTML文件的正文寫在這里......</B0DY>
</HTML>(2)在1的基礎(chǔ)上計(jì)算出正文的內(nèi)容(3)計(jì)算失敗則整個(gè)隱藏過程宣告失敗3、發(fā)明內(nèi)容1所述的信息收集模塊包含以下實(shí)現(xiàn)步驟(1)將需要被隱藏的信息通過標(biāo)準(zhǔn)的算法進(jìn)行打包;(2)將打包后的文件序列化為特定符號供信息處理模塊進(jìn)行進(jìn)一步加工;4、發(fā)明內(nèi)容1所述的信息處理模塊包含以下實(shí)現(xiàn)步驟(1)在2(1)所提取出的文本信息中找到合適的位置并將該位置作為隱藏信息的入口,入口的選定上按照特定的算法生成。(2)信息隱藏的入口和信息提取的入口作為共享點(diǎn),首先判斷原文是否已經(jīng)被處理過,如果被處理過,則先將曾經(jīng)藏匿在此的信息剔除。(3)按照1 8的比例放大被3所序列化的信息,將其直接寫入html中,放大后的序列根據(jù)html的解析規(guī)則,這些信息肉眼是不可見的。(4)信息提取,提取過程和隱藏過程類似,得到入口點(diǎn)后,檢測是否有信息,如果沒有,則提取失??;否則按照8 1的比例對信息進(jìn)行縮小,縮小后所得即為打包后的信息,將信息拆包即得到原始信息。
具體實(shí)施例方式本發(fā)明的目的、優(yōu)點(diǎn)和特色由以下數(shù)個(gè)實(shí)施例之詳細(xì)說明及圖式當(dāng)可更加明白, 這些實(shí)施例作為實(shí)施方式之舉例說明,其目的是為方便詳加說明本發(fā)明,而非用以限定本發(fā)明。實(shí)施案例-編碼任給一段htm網(wǎng)頁文檔,我們以mm. baidu. com網(wǎng)頁為例,生成一張含有隱寫信息的htm網(wǎng)頁文件。假設(shè)要隱藏的信息為’ china’ .通過查詢ascii碼表得知 china = 63H,68H,69H,6EH,61H = 0110 0011(B),0110 1000 (B),0110 1001(B),0110 1110 (B) 01100001 (B),將此信息通過算法三序列化后得到09 20 20 09 09 09 20 20 09 20 20 09 20 09 09 09 09 20 20 09 20 09 09 20 09 20 20 0920 20 20 09 09 20 20 09 09 09 09 20這樣信息就被放大了 8倍,并且由于這些數(shù)字在網(wǎng)頁或者記事本中都是不可見的,可以直接被寫到網(wǎng)頁的內(nèi)容中。假設(shè)我們以body之前為此信息的潛入口,則直接將此序列插入到原始文本中即可。實(shí)施案例-解碼由于事先我們知道在<body>之前是隱寫信息之所在,在<body>之前檢測是否存在隱寫標(biāo)記,如果存在,則去尋找信息頭,找到后的信息是09和20組成的偽二進(jìn)制流,只需要做一個(gè)8 1的解碼即可得到原始數(shù)據(jù)流,通過對這個(gè)流進(jìn)行運(yùn)算最終得到隱藏前的信息。通過掃描將得到 09 20 20 09 09 09 20 20 09 20 20 09 2009 09 09 09 20 20 09 20 09 09 20 09 20 20 09 20 20 20 09 09 20 20 09 09 09 09 20 序列,按照 09 為 0, 20 為 1 的原則,得到 0110 001101101000011010010110111001100001,轉(zhuǎn)化為 16 進(jìn)制后得 6368696E61,查詢ASCII表得china.與隱藏前信息剛好一致。
權(quán)利要求
1.本發(fā)明是一種針對htm/html超文本協(xié)議的信息隱藏系統(tǒng),其特征是包含如下模塊 htm/html超文本識別模塊、信息收集模塊、信息處理模塊和信息提取模塊。
2.根據(jù)權(quán)利要求1所述的信息收集模塊,其特征是原始信息通過標(biāo)準(zhǔn)的zlib算法將原有信息進(jìn)行壓縮和打包處理,處理后的文件使用高級加密標(biāo)準(zhǔn)(Advanced Encryption Standard, AES)Rijndael 算法進(jìn)行加密。
3.根據(jù)權(quán)利要求1所述的信息處理模塊,其特征是數(shù)據(jù)處理部分將2過程所得到的信息按照1 8的比例放大,放大后的信息類似于原文中一個(gè)bit現(xiàn)在用一個(gè)byte來表示, 新形成的信息按照html自解釋的規(guī)則進(jìn)行嵌入,嵌入的方法是直接嵌入到原有htm/html 主干中。嵌入的信息由于有特殊標(biāo)記,所以能夠被提取模塊準(zhǔn)確無誤的提取出。
4.根據(jù)權(quán)利1所述的信息提取模塊,在3的基礎(chǔ)上被標(biāo)記后能夠被輕易的識別出,提取算法即為嵌入算法的逆算法。
全文摘要
本發(fā)明是一種針對htm/html的信息隱藏系統(tǒng),屬于信息安全領(lǐng)域。本發(fā)明的目的在于解決用戶隱私,用戶敏感信息不被他人所窺視,使得htm在傳輸網(wǎng)頁的同時(shí)傳輸了私有信息,存儲(chǔ)的文件中看似一個(gè)普通的文檔,里面其實(shí)包含用戶隱私。此系統(tǒng)是通過對htm/html標(biāo)簽的解讀和運(yùn)用,實(shí)現(xiàn)了信息的藏匿,得到了一個(gè)針對htm/html的信息隱藏系統(tǒng)。
文檔編號G06F21/00GK102226906SQ201110148640
公開日2011年10月26日 申請日期2011年6月3日 優(yōu)先權(quán)日2011年6月3日
發(fā)明者張無忌, 王秋池, 董新宇 申請人:張無忌, 王秋池, 董新宇