本申請涉及計算機領(lǐng)域,特別是涉及一種檢測敏感信息的方法和設(shè)備。
背景技術(shù):
對于用戶的一些敏感信息,例如銀行卡號,證件號,聯(lián)系信息等,不能直接全部顯示在網(wǎng)頁上,以防止信息泄露導(dǎo)致后續(xù)用戶被釣魚,詐騙,威脅用戶的賬戶資金安全,在現(xiàn)有技術(shù)中對于整個網(wǎng)站上是否存在這種不符合規(guī)范的情況的解決方法如圖1所示,用戶終端在訪問某網(wǎng)站時,所述服務(wù)器從數(shù)據(jù)庫中獲取相應(yīng)的數(shù)據(jù)返回給用戶,在返回的過程中對所有的數(shù)據(jù)進行檢測,查看是否包含敏感信息,然后進行記錄。
在實現(xiàn)本申請的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在如下問題:
因為對于敏感信息監(jiān)測的過程是發(fā)生在服務(wù)器端,且數(shù)據(jù)監(jiān)測過程中數(shù)據(jù)匹配的性能消耗很大,返回的數(shù)據(jù)量大或大量用戶同時訪問同一個網(wǎng)站的情況下,會造成明顯的延遲,同時對服務(wù)器性能的要求也越來越高。隨著業(yè)務(wù)量的不斷增長,只能通過增加服務(wù)器的方式保障業(yè)務(wù)的正常運行,大幅增加運營成本。
技術(shù)實現(xiàn)要素:
本申請的目的在于提供一種檢測敏感信息的方法和設(shè)備,本申請通過用戶的終端設(shè)備對用戶訪問的網(wǎng)頁進行敏感信息的檢測,來達到敏感信息泄露點的檢測,從而降低了對服務(wù)器性能的要求,同時也大幅度降低了運營成本。
一種檢測敏感信息的方法,其特征在于,所述方法包括:
終端設(shè)備接收服務(wù)器根據(jù)終端設(shè)備的訪問請求返回的相應(yīng)訪問網(wǎng)頁的數(shù) 據(jù)信息;
所述終端設(shè)備通過自身的瀏覽器對所述數(shù)據(jù)信息進行加載生成相應(yīng)的網(wǎng)頁;
所述終端設(shè)備根據(jù)預(yù)先設(shè)定的規(guī)則庫遍歷所述網(wǎng)頁所對應(yīng)的超文本標記語言HTML源碼進行敏感信息的檢測。
所述終端設(shè)備根據(jù)預(yù)先設(shè)定的規(guī)則庫遍歷所述網(wǎng)頁所對應(yīng)的HTML源碼進行敏感信息的檢測,具體為:
所述終端設(shè)備調(diào)用所述網(wǎng)頁上的直譯式腳本語言JS,并通過JS腳本中預(yù)先設(shè)定的敏感信息的規(guī)則庫遍歷所述網(wǎng)頁所對應(yīng)的HTML源碼進行敏感信息的檢測。
所述方法還包括:
當(dāng)所述終端設(shè)備根據(jù)預(yù)先設(shè)定的規(guī)則庫沒有檢測到敏感信息時,則停止對所述網(wǎng)頁的檢測;
當(dāng)所述終端設(shè)備根據(jù)預(yù)先設(shè)定的規(guī)則庫檢測到敏感信息時,則將檢測到的所述敏感信息相應(yīng)的信息發(fā)送給所述服務(wù)器,以使所述服務(wù)器根據(jù)所述敏感信息相應(yīng)的信息對所述網(wǎng)頁的數(shù)據(jù)信息進行清洗。
所述敏感信息相應(yīng)的信息,具體為:
所述敏感信息所對應(yīng)的網(wǎng)頁地址、所述敏感信息的類型和所述敏感信息在所述網(wǎng)頁的位置信息。
所述敏感信息在所述網(wǎng)頁的位置信息,具體為:
所述敏感信息在所述網(wǎng)頁的位置的前后各預(yù)定字符個數(shù)的代碼片段。
一種終端設(shè)備,其特征在于,所述設(shè)備包括:
接收模塊,用于接收服務(wù)器根據(jù)終端設(shè)備的訪問請求返回的相應(yīng)訪問網(wǎng)頁的數(shù)據(jù)信息;
加載模塊,用于通過自身的瀏覽器對所述數(shù)據(jù)信息進行加載生成相應(yīng)的網(wǎng)頁;
檢測模塊,用于根據(jù)預(yù)先設(shè)定的規(guī)則庫遍歷所述網(wǎng)頁所對應(yīng)的HTML源碼進行敏感信息的檢測。
所述檢測模塊,具體用于:
調(diào)用所述網(wǎng)頁上的JS腳本,并通過JS腳本中預(yù)先設(shè)定的敏感信息的規(guī)則庫遍歷所述網(wǎng)頁所對應(yīng)的HTML源碼進行敏感信息的檢測。
所述檢測模塊,還具體用于:
當(dāng)所述檢測模塊根據(jù)預(yù)先設(shè)定的規(guī)則庫沒有檢測到敏感信息時,則停止對所述網(wǎng)頁的檢測;
當(dāng)所述檢測模塊根據(jù)預(yù)先設(shè)定的規(guī)則庫檢測到敏感信息時,則將檢測到的所述敏感信息相應(yīng)的信息發(fā)送給所述服務(wù)器,以使所述服務(wù)器根據(jù)所述敏感信息相應(yīng)的信息對所述網(wǎng)頁的數(shù)據(jù)信息進行清洗。
所述敏感信息相應(yīng)的信息,具體為:
所述敏感信息所對應(yīng)的網(wǎng)頁地址、所述敏感信息的類型和所述敏感信息在所述網(wǎng)頁的位置信息。
所述敏感信息在所述網(wǎng)頁的位置信息,具體為:
所述敏感信息在所述網(wǎng)頁的位置的前后各預(yù)定字符個數(shù)的代碼片段。
與現(xiàn)有技術(shù)相比,本申請實施例至少具有以下優(yōu)點:
本申請通過用戶的終端設(shè)備對用戶訪問的網(wǎng)頁進行敏感信息的檢測,來達到敏感信息泄露點的檢測,從而降低了對服務(wù)器性能的要求,同時也大幅度降低了運營成本。
附圖說明
圖1為本申請現(xiàn)有技術(shù)中中的一種檢測敏感信息的方法流程圖;
圖2為本申請實施例中的一種檢測敏感信息的方法流程圖;
圖3位本申請實施例中的一種檢測敏感信息的流程示意圖;
圖4為本申請實施例中的一種終端設(shè)備的結(jié)構(gòu)意圖。
具體實施方式
本申請通過終端設(shè)備檢測自身獲取的網(wǎng)頁中是否存在敏感信息,來達到檢測相應(yīng)網(wǎng)站中是否存在敏感信息的目的,從而避免用戶信息泄露的目的。
下面將結(jié)合本申請中的附圖,對本申請中的技術(shù)方案進行清楚、完整的描述,顯然,所描述的實施例是本申請的一部分實施例,而不是全部的實施例。基于本申請中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本申請保護的范圍。
如圖2所示,為本申請實施例中一種檢測敏感信息的方法,所述方法包括:
步驟201,終端設(shè)備接收服務(wù)器根據(jù)終端設(shè)備的訪問請求返回的相應(yīng)訪問網(wǎng)頁的數(shù)據(jù)信息。
終端設(shè)備在訪問某個網(wǎng)頁時需要向該網(wǎng)頁所對應(yīng)的服務(wù)器發(fā)送訪問請求,所述服務(wù)器根據(jù)所述訪問請求在其數(shù)據(jù)庫中查找相應(yīng)的數(shù)據(jù)信息,并將所述數(shù)據(jù)信息反饋給所述終端設(shè)備。
步驟202,所述終端設(shè)備通過自身的瀏覽器對所述數(shù)據(jù)信息進行加載生成相應(yīng)的網(wǎng)頁。
步驟203,所述終端設(shè)備根據(jù)預(yù)先設(shè)定的規(guī)則庫遍歷所述網(wǎng)頁所對應(yīng)的超文本標記語言HTML源碼進行敏感信息的檢測。
所述終端設(shè)備根據(jù)預(yù)先設(shè)定的規(guī)則庫遍歷所述網(wǎng)頁所對應(yīng)的HTML源碼進行敏感信息的檢測,具體為:
所述終端設(shè)備調(diào)用所述網(wǎng)頁上的直譯式腳本語言JS,并通過JS腳本中預(yù)先設(shè)定的敏感信息的規(guī)則庫遍歷所述網(wǎng)頁所對應(yīng)的HTML源碼進行敏感信息的檢測。
具體的,終端設(shè)備的瀏覽器在接受到所述服務(wù)器返回的相應(yīng)網(wǎng)頁的數(shù)據(jù)信息并對所述數(shù)據(jù)信息加載完成后,調(diào)用網(wǎng)頁上的JS,使網(wǎng)頁上的JS監(jiān)控腳本開始運行,其中,在JS監(jiān)控腳本中包含敏感信息檢測的規(guī)則庫,例如:身份 證號規(guī)則、銀行卡號規(guī)則、手機號規(guī)則等有關(guān)用戶信息的規(guī)則,所述JS根據(jù)敏感信息檢測的規(guī)則庫遍歷所述網(wǎng)頁對應(yīng)的HTML源碼來對檢測所述網(wǎng)頁中是否存在用戶的敏感信息。
在遍歷所述網(wǎng)頁對應(yīng)的HTML源碼后,所述方法還包括:
當(dāng)所述終端設(shè)備根據(jù)預(yù)先設(shè)定的規(guī)則庫沒有檢測到敏感信息時,則停止對所述網(wǎng)頁的檢測;
當(dāng)所述終端設(shè)備根據(jù)預(yù)先設(shè)定的規(guī)則庫檢測到敏感信息時,則將檢測到的所述敏感信息相應(yīng)的信息發(fā)送給所述服務(wù)器,以使所述服務(wù)器根據(jù)所述敏感信息相應(yīng)的信息對所述網(wǎng)頁的數(shù)據(jù)信息進行清洗。
具體的,服務(wù)器對敏感信息主要通過數(shù)據(jù)校驗和去重工作進行數(shù)據(jù)清洗,并對接受到的敏感信息相應(yīng)的信息存儲。
所述敏感信息相應(yīng)的信息,具體為:
所述敏感信息所對應(yīng)的網(wǎng)頁地址、所述敏感信息的類型和所述敏感信息在所述網(wǎng)頁的位置信息。
服務(wù)器可以根據(jù)敏感信息相應(yīng)的信息來判斷所述敏感信息出現(xiàn)的具體網(wǎng)頁的具體位置,以及是何種類型的敏感信息。以使在對敏感信息進行清洗時能夠快速準確的找到其位置和確定清洗方案。
所述敏感信息在所述網(wǎng)頁的位置信息,具體為:
所述敏感信息在所述網(wǎng)頁的位置的前后各預(yù)定字符個數(shù)的代碼片段。
網(wǎng)頁中的所有信息都有其對應(yīng)的代碼,所述代碼可以表示相應(yīng)信息的內(nèi)容、位置等,所述信息的在網(wǎng)頁中的位置可以根據(jù)其位置的前后特定個數(shù)的代碼片段來表示,例如,敏感信息所在網(wǎng)頁位置前后各20個字符的代碼片段,當(dāng)然據(jù)使用多少個字符代碼片段可以根據(jù)實際情況確定。
與現(xiàn)有技術(shù)相比,本申請實施例至少具有以下優(yōu)點:
本申請通過用戶的終端設(shè)備對用戶訪問的網(wǎng)頁進行敏感信息的檢測,來達到敏感信息泄露點的檢測,從而降低了對服務(wù)器性能的要求,同時也大幅度降 低了運營成本。
為了進一步闡述本申請的技術(shù)思想,現(xiàn)結(jié)合具體的應(yīng)用場景,對本申請的技術(shù)方案進行說明,在實際應(yīng)用中,具體場景的變化并不會影響本申請的保護范圍。
在萬維網(wǎng)上的一個超媒體文檔稱之為一個頁面,作為一個組織或個人在萬維網(wǎng)上開始點的頁面稱為主頁Homepage,或首頁,主頁中通常包括有指向其他相關(guān)頁面或其他節(jié)點的指針(超級鏈接)。在邏輯上將視為一個整體的一系列頁面的有機集合稱為網(wǎng)站(Website或Site)。
HTML源碼時一個網(wǎng)頁的重要組成部分,一個網(wǎng)頁有很多信息,一個網(wǎng)頁中的信息是根據(jù)HTML源碼來進行展示的,HTML源碼能夠描述相應(yīng)信息的文字和圖片,如:文字如何處理,圖片如何安排,圖片如何顯示等,并且是根據(jù)相應(yīng)信息的出現(xiàn)順序進行編碼的。
如圖3所示,終端設(shè)備向某個網(wǎng)站的服務(wù)器發(fā)起訪問請求,請求訪問該網(wǎng)站下的某個頁面,所述服務(wù)器根據(jù)接收的訪問請求查找所述訪問請求所對應(yīng)的網(wǎng)頁的數(shù)據(jù)信息,所述服務(wù)器將請求訪問的頁面的數(shù)據(jù)信息發(fā)送給所述終端設(shè)備,所述終端設(shè)備通過自身攜帶的瀏覽器對所述數(shù)據(jù)信息進行加載得到相應(yīng)的頁面,所述終端設(shè)備通過瀏覽器調(diào)用頁面中的JS檢測腳本根據(jù)JS檢測腳本中包含的敏感信息檢測的規(guī)則庫遍歷所述頁面所對應(yīng)的HTML源碼,檢測所述頁面是否存在敏感信息。
例如:對當(dāng)前訪問頁面中是否存在某個用戶的身份證號的檢測,所述終端設(shè)備調(diào)用所述頁面中的JS檢測腳本根據(jù)身份證號規(guī)則,如:身份證號的位數(shù)、身份證號中的數(shù)字排布的規(guī)律,以及身份證號制定的規(guī)則等遍歷當(dāng)前訪問頁面的HTML源碼,來判斷當(dāng)前訪問頁面中是否存在某個用戶的身份證號。
如果不存在,所述終端設(shè)備停止對當(dāng)前頁面的檢測;
如果存在,所述終端設(shè)備將檢測到的敏感信息所在頁面的地址、敏感信息的類型和敏感信息所在位置前后各20個字符的代碼片段反饋給服務(wù)器。
服務(wù)器的根據(jù)所述敏感信息的所在頁面的地址、敏感信息的類型和敏感信息所在位置前后各20個字符的代碼片段確定所述敏感信息出現(xiàn)的具體位置,即所述敏感信息出現(xiàn)的具體頁面以及出現(xiàn)在具體頁面中具體位置,和采用何種類型的清洗規(guī)則對所述敏感信息進行清洗,進一步的,根據(jù)身份證號的清洗規(guī)則對網(wǎng)頁中的身份證號進行清洗。
所述服務(wù)器對清洗完后的所述頁面的數(shù)據(jù)信息進行保存,以使其他終端設(shè)備在訪問該網(wǎng)頁時保證使終端設(shè)備加載后的頁面中不會再次出現(xiàn)用戶的敏感信息,從而保證了用戶敏感信息的安全。
基于與上述方法同樣的申請構(gòu)思,本申請還提出了一種終端設(shè)備,如圖4所述,該設(shè)備包括:
接收模塊41,用于接收服務(wù)器根據(jù)終端設(shè)備的訪問請求返回的相應(yīng)訪問網(wǎng)頁的數(shù)據(jù)信息;
加載模塊42,用于通過自身的瀏覽器對所述數(shù)據(jù)信息進行加載生成相應(yīng)的網(wǎng)頁;
檢測模塊43,用于根據(jù)預(yù)先設(shè)定的規(guī)則庫遍歷所述網(wǎng)頁所對應(yīng)的HTML源碼進行敏感信息的檢測。
所述檢測模塊43,具體用于:
調(diào)用所述網(wǎng)頁上的JS腳本,并通過JS腳本中預(yù)先設(shè)定的敏感信息的規(guī)則庫遍歷所述網(wǎng)頁所對應(yīng)的HTML源碼進行敏感信息的檢測。
所述檢測模塊43,還具體用于:
當(dāng)所述檢測模塊根據(jù)預(yù)先設(shè)定的規(guī)則庫沒有檢測到敏感信息時,則停止對所述網(wǎng)頁的檢測;
當(dāng)所述檢測模塊根據(jù)預(yù)先設(shè)定的規(guī)則庫檢測到敏感信息時,則將檢測到的所述敏感信息相應(yīng)的信息發(fā)送給所述服務(wù)器,以使所述服務(wù)器根據(jù)所述敏感信息相應(yīng)的信息對所述網(wǎng)頁的數(shù)據(jù)信息進行清洗。
所述敏感信息相應(yīng)的信息,具體為:
所述敏感信息所對應(yīng)的網(wǎng)頁地址、所述敏感信息的類型和所述敏感信息在所述網(wǎng)頁的位置信息。
所述敏感信息在所述網(wǎng)頁的位置信息,具體為:
所述敏感信息在所述網(wǎng)頁的位置的前后各預(yù)定字符個數(shù)的代碼片段。
與現(xiàn)有技術(shù)相比,本申請實施例至少具有以下優(yōu)點:
本申請通過用戶的終端設(shè)備對用戶訪問的網(wǎng)頁進行敏感信息的檢測,來達到敏感信息泄露點的檢測,從而降低了對服務(wù)器性能的要求,同時也大幅度降低了運營成本。
本領(lǐng)域技術(shù)人員可以理解實施例中的設(shè)備中的模塊可以按照實施例描述進行分布于實施例的裝置中,也可以進行相應(yīng)變化位于不同于本實施例的一個或多個裝置中。上述實施例的模塊可以合并為一個模塊,也可以進一步拆分成多個子模塊。
通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本申請可借助軟件加必需的通用硬件平臺的方式來實現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實施方式?;谶@樣的理解,本申請的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式提現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺設(shè)備設(shè)備(可以是手機,個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請各個實施例所述的方法。
以上所述僅是本申請的優(yōu)選實施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本申請原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應(yīng)視本申請的保護范圍。
以上公開的僅為本申請的幾個具體實施例,但是,本申請并非局限于此,任何本領(lǐng)域的技術(shù)人員能思之的變化都應(yīng)落入本申請的保護范圍。