本發(fā)明涉及一種應(yīng)用內(nèi)容的自動化安全監(jiān)管系統(tǒng)與方法。
背景技術(shù):
隨著計算機(jī)技術(shù),通信技術(shù)和多媒體技術(shù)的不斷發(fā)展和融合,各種多媒體應(yīng)用迅速在社會各個領(lǐng)域發(fā)展壯大;用戶在享受海量應(yīng)用帶來的便利時,大量不法信息也隨著這些應(yīng)用廣泛傳播,嚴(yán)重干擾了正常的國家秩序,進(jìn)而產(chǎn)生巨大的社會輿論壓力,讓任何政府部門和機(jī)構(gòu)都無法忽視。
由于網(wǎng)絡(luò)中海量的應(yīng)用程序如果采用人工審核的方式,必然會造成大量人力和財力資源的浪費(fèi);因此如何有效實(shí)現(xiàn)對網(wǎng)上信息的監(jiān)管,及時發(fā)現(xiàn)服務(wù)器上的反動、邪教、色情等不良內(nèi)容, 提供一個健康的互聯(lián)網(wǎng)成長環(huán)境, 是我們面臨的一個嚴(yán)肅的問題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種應(yīng)用內(nèi)容的自動化安全監(jiān)管系統(tǒng)與方法,首先對互聯(lián)網(wǎng)上存在的應(yīng)用程序進(jìn)行抓取和安裝,再對安裝好的應(yīng)用程序中所有頁面的文字和圖像進(jìn)行抓包操作,最后對抓包得到的文字圖像進(jìn)行識別,發(fā)現(xiàn)不良信息時通知管理員,實(shí)現(xiàn)了應(yīng)用內(nèi)容的自動化安全監(jiān)管。
本發(fā)明的目的是通過以下技術(shù)方案來實(shí)現(xiàn)的: 一種應(yīng)用內(nèi)容的自動化安全監(jiān)管系統(tǒng),包括:
應(yīng)用抓取子系統(tǒng),用于從互聯(lián)網(wǎng)中抓取和下載應(yīng)用程序;
內(nèi)容安全監(jiān)管子系統(tǒng),用于安裝抓取到的應(yīng)用程序,并對應(yīng)用程序中的圖片和文字進(jìn)行抓包處理;
內(nèi)容識別子系統(tǒng),用于記錄當(dāng)前監(jiān)管的應(yīng)用程序,并對文本、圖片信息進(jìn)行識別,在出現(xiàn)不良信息時通知管理員。
所述的應(yīng)用抓取子系統(tǒng)包括:
抓取模塊,用于抓取互聯(lián)網(wǎng)中存在的應(yīng)用程序;
下載模塊,用于對抓取到的應(yīng)用程序進(jìn)行下載;
推送模塊,用于將下載的應(yīng)用程序推送給內(nèi)容安全監(jiān)管子系統(tǒng)并進(jìn)行通知。
所述的內(nèi)容安全監(jiān)管子系統(tǒng)包括:
安裝模塊,用于對應(yīng)用抓取子系統(tǒng)下載的應(yīng)用程序進(jìn)行安裝;
抓包模塊,用于啟動安裝好的應(yīng)用程序,并對應(yīng)用程序中所有頁面的文字和圖像進(jìn)行抓包;
傳輸模塊,用于將抓包得到的文字和圖像傳輸給內(nèi)容識別子系統(tǒng)。
所述的內(nèi)容識別子系統(tǒng)包括:
記錄模塊,用于記錄當(dāng)前監(jiān)管的應(yīng)用程序;
識別模塊,用于對抓包得到的文字和圖像進(jìn)行識別;
通知模塊,用于在識別到不良信息時通知管理員。
所述的一種應(yīng)用內(nèi)容的自動化安全監(jiān)管系統(tǒng)的監(jiān)管方法,包括以下步驟:
S1.應(yīng)用抓取子系統(tǒng)從互聯(lián)網(wǎng)中抓取和下載應(yīng)用程序;
S2.內(nèi)容安全監(jiān)管子系統(tǒng)安裝抓取到的應(yīng)用程序,并對應(yīng)用程序中的圖片和文字進(jìn)行抓包處理;
S3.內(nèi)容識別子系統(tǒng)記錄當(dāng)前監(jiān)管的應(yīng)用程序,并對文本、圖片信息進(jìn)行識別,在出現(xiàn)不良信息時通知管理員。
所述的步驟S1包括以下子步驟:
S11.應(yīng)用抓取子系統(tǒng)抓取互聯(lián)網(wǎng)中存在的應(yīng)用程序;
S12.應(yīng)用抓取子系統(tǒng)對抓取到的應(yīng)用程序進(jìn)行下載;
S13.應(yīng)用抓取子系統(tǒng)將下載的應(yīng)用程序推送給內(nèi)容安全監(jiān)管子系統(tǒng)并進(jìn)行通知。
所述的步驟S2包括以下子步驟:
S21.內(nèi)容安全監(jiān)管子系統(tǒng)對應(yīng)用抓取子系統(tǒng)下載的應(yīng)用程序進(jìn)行安裝;
S22.內(nèi)容安全監(jiān)管子系統(tǒng),啟動安裝好的應(yīng)用程序,并對應(yīng)用程序中所有頁面的文字和圖像進(jìn)行抓包;
S23.內(nèi)容安全監(jiān)管子系統(tǒng)將抓包得到的文字和圖像傳輸給內(nèi)容識別子系統(tǒng)。
所述的步驟S3包括以下子步驟:
S31.內(nèi)容識別子系統(tǒng)記錄當(dāng)前監(jiān)管的應(yīng)用程序;
S32.內(nèi)容識別子系統(tǒng)對從當(dāng)前監(jiān)管的應(yīng)用程序中抓包得到的文字和圖像進(jìn)行識別;
S33.內(nèi)容識別子系統(tǒng)識別到不良信息時,對管理員進(jìn)行通知。
所述的步驟S22包括以下子步驟:
S221.啟動安裝好的應(yīng)用程序,進(jìn)入應(yīng)用程序首頁;
S222.內(nèi)容安全監(jiān)管子系統(tǒng)抓取當(dāng)前頁面中的圖片和文本信息,傳輸?shù)絻?nèi)容識別子系統(tǒng);
S223.內(nèi)容安全監(jiān)管子系統(tǒng)計算當(dāng)前頁面中能夠點(diǎn)擊的控件數(shù)量進(jìn)行計算并記錄每個控件的坐標(biāo)信息;
S224.判斷當(dāng)前頁面是否存在未點(diǎn)擊的控件:
(1)如果當(dāng)前頁面中存在未點(diǎn)擊的控件,點(diǎn)擊對應(yīng)控件,進(jìn)入下一級頁面,并轉(zhuǎn)至步驟S222;
(2)如果當(dāng)前頁面不存在未點(diǎn)擊的控件,進(jìn)入步驟S225;
進(jìn)一步地,本申請中的控件指的是應(yīng)用程序中的界面按鈕;點(diǎn)擊控件即調(diào)用系統(tǒng)的API接口來實(shí)現(xiàn)。
S225.判斷當(dāng)前頁面是否為應(yīng)用程序首頁;
(1)當(dāng)前頁面不是應(yīng)用程序首頁,返回上一級頁面,并轉(zhuǎn)至步驟S224;
(2)當(dāng)前頁面是應(yīng)用程序首頁,返回步驟S1,進(jìn)行下一個應(yīng)用程序的抓取。
本發(fā)明的有益效果是:本發(fā)明中首先對互聯(lián)網(wǎng)上存在的應(yīng)用程序進(jìn)行抓取和安裝,再對安裝好的應(yīng)用程序中所有頁面的文字和圖像進(jìn)行抓包操作,最后對抓包得到的文字圖像進(jìn)行識別,發(fā)現(xiàn)不良信息時通知管理員,實(shí)現(xiàn)了應(yīng)用內(nèi)容的自動化安全監(jiān)管。
附圖說明
圖1為本發(fā)明的系統(tǒng)原理框圖;
圖2為本發(fā)明的方法流程圖;
圖3為應(yīng)用程序圖片和文字的抓包流程圖。
具體實(shí)施方式
下面結(jié)合附圖進(jìn)一步詳細(xì)描述本發(fā)明的技術(shù)方案,但本發(fā)明的保護(hù)范圍不局限于以下所述。
如圖1所示,一種應(yīng)用內(nèi)容的自動化安全監(jiān)管系統(tǒng),包括:
應(yīng)用抓取子系統(tǒng),用于從互聯(lián)網(wǎng)中抓取和下載應(yīng)用程序;
內(nèi)容安全監(jiān)管子系統(tǒng),用于安裝抓取到的應(yīng)用程序,并對應(yīng)用程序中的圖片和文字進(jìn)行抓包處理;
內(nèi)容識別子系統(tǒng),用于記錄當(dāng)前監(jiān)管的應(yīng)用程序,并對文本、圖片信息進(jìn)行識別,在出現(xiàn)不良信息時通知管理員。
本申請可以應(yīng)用于android系統(tǒng)、iOS系統(tǒng)、以及PC端的各種操作系統(tǒng)中,其中在android系統(tǒng)中的應(yīng)用尤為重要。
在一個實(shí)施例中,本申請的內(nèi)容安全監(jiān)管子系統(tǒng)可以只有一個,內(nèi)容安全監(jiān)管子系統(tǒng)分別與應(yīng)用抓取子系統(tǒng)和內(nèi)容識別子系統(tǒng)連接和通訊。
在另一個實(shí)施例中,本申請的內(nèi)容安全監(jiān)管子系統(tǒng)也可以是多個,每個內(nèi)容安全監(jiān)管子系統(tǒng)均分別與應(yīng)用抓取子系統(tǒng)和內(nèi)容識別子系統(tǒng)連接和通訊;這種情況下,可以同時對多個應(yīng)用程序進(jìn)行安裝和文字圖片的抓包。
所述的應(yīng)用抓取子系統(tǒng)包括:
抓取模塊,用于抓取互聯(lián)網(wǎng)中存在的應(yīng)用程序;
下載模塊,用于對抓取到的應(yīng)用程序進(jìn)行下載;
在本申請中,可以通過網(wǎng)絡(luò)爬蟲的方式或者手動下載,并保存應(yīng)用程序名稱和MD5值,避免對相同應(yīng)用做重復(fù)的鑒定。
MD5即Message-Digest Algorithm 5(信息-摘要算法5),用于確保信息傳輸完整一致。是計算機(jī)廣泛使用的雜湊算法之一(又譯摘要算法、哈希算法),主流編程語言普遍已有MD5實(shí)現(xiàn)。
推送模塊,用于將下載的應(yīng)用程序推送給內(nèi)容安全監(jiān)管子系統(tǒng)并進(jìn)行通知。
所述的內(nèi)容安全監(jiān)管子系統(tǒng)包括:
安裝模塊,用于對應(yīng)用抓取子系統(tǒng)下載的應(yīng)用程序進(jìn)行安裝;
抓包模塊,用于啟動安裝好的應(yīng)用程序,并對應(yīng)用程序中所有頁面的文字和圖像進(jìn)行抓包;
傳輸模塊,用于將抓包得到的文字和圖像傳輸給內(nèi)容識別子系統(tǒng)。
所述的內(nèi)容識別子系統(tǒng)包括:
記錄模塊,用于記錄當(dāng)前監(jiān)管的應(yīng)用程序;
識別模塊,用于對抓包得到的文字和圖像進(jìn)行識別;
通知模塊,用于在識別到不良信息時通知管理員。
如圖2所示,所述的一種應(yīng)用內(nèi)容的自動化安全監(jiān)管系統(tǒng)的監(jiān)管方法,包括以下步驟:
S1.應(yīng)用抓取子系統(tǒng)從互聯(lián)網(wǎng)中抓取和下載應(yīng)用程序;
S2.內(nèi)容安全監(jiān)管子系統(tǒng)安裝抓取到的應(yīng)用程序,并對應(yīng)用程序中的圖片和文字進(jìn)行抓包處理;
S3.內(nèi)容識別子系統(tǒng)記錄當(dāng)前監(jiān)管的應(yīng)用程序,并對文本、圖片信息進(jìn)行識別,在出現(xiàn)不良信息時通知管理員。
所述的步驟S1包括以下子步驟:
S11.應(yīng)用抓取子系統(tǒng)抓取互聯(lián)網(wǎng)中存在的應(yīng)用程序;
S12.應(yīng)用抓取子系統(tǒng)對抓取到的應(yīng)用程序進(jìn)行下載;
S13.應(yīng)用抓取子系統(tǒng)將下載的應(yīng)用程序推送給內(nèi)容安全監(jiān)管子系統(tǒng)并進(jìn)行通知。
所述的步驟S2包括以下子步驟:
S21.內(nèi)容安全監(jiān)管子系統(tǒng)對應(yīng)用抓取子系統(tǒng)下載的應(yīng)用程序進(jìn)行安裝;
S22.內(nèi)容安全監(jiān)管子系統(tǒng),啟動安裝好的應(yīng)用程序,并對應(yīng)用程序中所有頁面的文字和圖像進(jìn)行抓包;
S23.內(nèi)容安全監(jiān)管子系統(tǒng)將抓包得到的文字和圖像傳輸給內(nèi)容識別子系統(tǒng)。
所述的步驟S3包括以下子步驟:
S31.內(nèi)容識別子系統(tǒng)記錄當(dāng)前監(jiān)管的應(yīng)用程序;
S32.內(nèi)容識別子系統(tǒng)對從當(dāng)前監(jiān)管的應(yīng)用程序中抓包得到的文字和圖像進(jìn)行識別;
S33.內(nèi)容識別子系統(tǒng)識別到不良信息時,對管理員進(jìn)行通知。
如圖3所示,所述的步驟S22包括以下子步驟:
S221.啟動安裝好的應(yīng)用程序,進(jìn)入應(yīng)用程序首頁;
S222.內(nèi)容安全監(jiān)管子系統(tǒng)抓取當(dāng)前頁面中的圖片和文本信息,傳輸?shù)絻?nèi)容識別子系統(tǒng);
S223.內(nèi)容安全監(jiān)管子系統(tǒng)計算當(dāng)前頁面中能夠點(diǎn)擊的控件數(shù)量進(jìn)行計算并記錄每個控件的坐標(biāo)信息;
S224.判斷當(dāng)前頁面是否存在未點(diǎn)擊的控件:
(1)如果當(dāng)前頁面中存在未點(diǎn)擊的控件,點(diǎn)擊對應(yīng)控件(任意一個未點(diǎn)擊控件),進(jìn)入下一級頁面,并轉(zhuǎn)至步驟S222;
(2)如果當(dāng)前頁面不存在未點(diǎn)擊的控件,進(jìn)入步驟S225;
進(jìn)一步地,本申請中的控件指的是應(yīng)用程序中的界面按鈕;點(diǎn)擊控件通過調(diào)用系統(tǒng)的API接口來實(shí)現(xiàn),如在android系統(tǒng)可調(diào)用android系統(tǒng)的API接口實(shí)現(xiàn)控件點(diǎn)擊。
S225.判斷當(dāng)前頁面是否為應(yīng)用程序首頁;
(1)當(dāng)前頁面不是應(yīng)用程序首頁,返回上一級頁面,并轉(zhuǎn)至步驟S224;
(2)當(dāng)前頁面是應(yīng)用程序首頁,返回步驟S1,進(jìn)行下一個應(yīng)用程序的抓取。
在本申請中,當(dāng)某個頁面不存在能夠點(diǎn)擊控件時,認(rèn)為其未點(diǎn)擊的控件為0(不存在未點(diǎn)擊控件)。
基于圖3所示的應(yīng)用程序圖片和文字的抓包流程,在啟動應(yīng)用程序后,首先對首頁信息進(jìn)行抓包,計算控件數(shù)量和坐標(biāo)(此時首頁必然存在未點(diǎn)擊控件),點(diǎn)擊其中一個控件進(jìn)入下一級頁面(二級頁面),返回步驟S222,并按照步驟S222~S225進(jìn)行循環(huán)操作:這樣能夠保證首頁中各個控件對應(yīng)的二級頁面及其下屬頁面(三級頁面、四級頁面、五級頁面等)的圖像和文字全部被抓包;循環(huán)過程中如果返回了首頁,且首頁不存在未點(diǎn)擊控件,說明整個應(yīng)用程序抓包結(jié)束,這時返回步驟S1,進(jìn)行下一個應(yīng)用程序的抓??;對應(yīng)用程序中所有頁面的文字和圖像實(shí)現(xiàn)了抓包。
需要說明的是,以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案而非限制,盡管參照較佳實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解,可以對本發(fā)明的技術(shù)方案進(jìn)行修改或者等同替換,而不脫離本發(fā)明技術(shù)方案的宗旨和范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求范圍當(dāng)中。