專利名稱:一種基于特征識別的欺詐信息過濾系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息安全領(lǐng)域,尤其涉及一種基于特征識別的欺詐信息過濾系統(tǒng)及方法。
背景技術(shù):
隨著網(wǎng)上銀行的普及,網(wǎng)銀欺詐類短信和郵件日益猖獗,通常這類欺詐短信或郵件中內(nèi)嵌有釣魚網(wǎng)站鏈接,由于其網(wǎng)址和網(wǎng)頁內(nèi)容與銀行的官方網(wǎng)站高度相仿,用戶很容易受其誘導(dǎo)而訪問釣魚網(wǎng)站,并在釣魚網(wǎng)站上輸入自己的網(wǎng)上銀行賬號和密碼等信息,從而導(dǎo)致用戶的銀行賬戶被盜,給用戶造成直接的經(jīng)濟損失?,F(xiàn)有的垃圾短信過濾系統(tǒng)主要是通過貝葉斯、支持向量機(SVM)等分類算法來判斷并向用戶提示垃圾信息的。貝葉斯分類是利用概率統(tǒng)計知識進行分類的算法,而支持向量機(SVM)是通過構(gòu)造最優(yōu)線性分類面來指導(dǎo)分類的,這兩種算法都是統(tǒng)計學(xué)習(xí)分類算法,即基于一定的特征集,通過自適應(yīng)的學(xué)習(xí),判斷出垃圾信息。上述垃圾短信過濾系統(tǒng)在判斷出垃圾信息后的處理也比較簡單,只是將短信或郵件標(biāo)記為垃圾信息,不區(qū)分危害性更大的網(wǎng)銀欺詐類信息與一般的廣告類垃圾信息,更不會結(jié)合檢測出的垃圾信息做聯(lián)動的防釣魚處理,因此無法防范用戶被釣魚。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種基于特征識別的欺詐信息過濾系統(tǒng),它可以有效過濾欺詐類信息,降低用戶因資金賬號被盜而遭受經(jīng)濟損失的概率。為解決上述技術(shù)問題,本發(fā)明的基于特征識別的欺詐信息過濾系統(tǒng),包括客戶端和服務(wù)端,客戶端包括特征識別子系統(tǒng)、分類過濾子系統(tǒng)和信息攔截中心,特征識別子系統(tǒng)設(shè)置在分類過濾子系統(tǒng)之前,用于根據(jù)接收到的信息的特征,識別出欺詐信息;分類過濾子系統(tǒng)與特征識別子系統(tǒng)連接,用于對進入分類過濾子系統(tǒng)的信息進行分類,識別出垃圾信息;信息攔截中心用于攔截上述兩個子系統(tǒng)識別出的欺詐信息和垃圾信息;服務(wù)端通過網(wǎng)絡(luò)連接與客戶端連接,且服務(wù)端設(shè)置有安全服務(wù)云中心,用于監(jiān)控客戶端的進程,并通過網(wǎng)絡(luò)與客戶端保持?jǐn)?shù)據(jù)同步。所述特征識別子系統(tǒng)進一步包括特征數(shù)據(jù)庫,用于存儲欺詐信息的來源特征、行為特征以及內(nèi)容特征;來源識別模塊,與特征數(shù)據(jù)庫連接,用于根據(jù)特征數(shù)據(jù)庫中的來源特征,判斷用戶收到的信息是否是欺詐信息;行為識別模塊,與特征數(shù)據(jù)庫連接,用于根據(jù)特征數(shù)據(jù)庫中的行為特征,判斷用戶收到的信息是否是欺詐信息;可選的行為特征包括被叫號碼是否相鄰、短信發(fā)送頻率、短、信發(fā)送量、發(fā)送成功率、回復(fù)率等,相應(yīng)的判斷結(jié)果可以補充黑名單及分類模塊的學(xué)習(xí)素材;內(nèi)容識別模塊,與特征數(shù)據(jù)庫連接,用于根據(jù)特征數(shù)據(jù)庫中的內(nèi)容特征,判斷用戶收到的信息是否是欺詐信息??蛇x的內(nèi)容特征包括銀行名稱、官方網(wǎng)址、客服電話,短信中出現(xiàn)的網(wǎng)址、客服電話等。本發(fā)明要解決的另一技術(shù)問題是提供上述系統(tǒng)的實現(xiàn)方法。為解決上述技術(shù)問題,本發(fā)明的基于特征識別的欺詐信息過濾方法,包括以下步驟I)用戶收到新信息;
2)檢測該信息是否是欺詐信息,若是,則將該信息標(biāo)識為欺詐信息,并對其進行攔截;若否,則轉(zhuǎn)到步驟3);3)檢測該彳目息是否是垃圾/[目息,若是,則將該 目息標(biāo)識為垃圾 目息,并對其進行攔截;若否,則將該信息顯示給用戶。所述步驟2)中,通過將該信息的特征與欺詐信息的特征進行比對,來判斷該信息是否是欺詐息。所述特征包括信息的來源特征、行為特征以及內(nèi)容特征。識別出欺詐信息后,可以進一步通知后臺的安全服務(wù)云中心監(jiān)控該欺詐信息,并進行聯(lián)動的防釣魚處理。與現(xiàn)有的垃圾信息過濾系統(tǒng)相比,本發(fā)明的欺詐信息過濾系統(tǒng)及其實現(xiàn)方法,具有以下優(yōu)點和有益效果I、通過特征檢測,準(zhǔn)確識別出欺詐信息,從而能夠?qū)⑽:π愿蟮木W(wǎng)銀欺詐類信息與普通的廣告類垃圾信息區(qū)分開來,避免用戶受欺詐信息誘導(dǎo)而導(dǎo)致資金賬戶被盜。2、后臺的安全服務(wù)云中心能夠結(jié)合檢測出的欺詐信息做聯(lián)動處理,同時根據(jù)后臺的賬號體系聯(lián)動保護該手機用戶的網(wǎng)游賬號,第三方支付賬號等,從而進一步降低了用戶資金賬戶被盜的概率。
附圖是本發(fā)明的欺詐信息過濾系統(tǒng)架構(gòu)圖。
具體實施例方式為對本發(fā)明的技術(shù)內(nèi)容、特點與功效有更具體的了解,現(xiàn)結(jié)合圖示的實施方式,詳述如下該實施例的欺詐信息過濾系統(tǒng)的具體架構(gòu)如圖I所示,包括客戶端和服務(wù)端??蛻舳宋挥谑謾C終端,主要包括特征識別子系統(tǒng),用于根據(jù)接收到的短信的特征,判斷該短信是否是欺詐短信;該特征識別子系統(tǒng)進一步包括來源識別模塊、行為識別模塊、內(nèi)容識別模塊以及特征數(shù)據(jù)庫;特征數(shù)據(jù)庫與前述三個模塊分別連接,用于存儲黑名單(例如,惡意號碼黑名單、惡意號碼常在地黑名單等)、白名單(主要是用戶手機通訊錄中的號碼、銀行官方號碼以及用戶手工添加的號碼)以及欺詐短信的行為特征(例如,被叫號碼是否相鄰、短信發(fā)送頻率、短信發(fā)送量、發(fā)送成功率等)和文本特征(例如銀行名稱、釣魚網(wǎng)址、官方網(wǎng)址、卡號、客服電話等關(guān)鍵字),在手機聯(lián)網(wǎng)時,該特征數(shù)據(jù)庫(除白名單外)與后臺安全服務(wù)云中心的數(shù)據(jù)同步;來源識別模塊用于根據(jù)特征數(shù)據(jù)庫中的黑、白名單,判斷用戶收到的短信是否是欺詐短信;行為識別模塊與來源識別模塊連接,用于根據(jù)特征數(shù)據(jù)庫中的行為特征數(shù)據(jù),判斷通過來源識別模塊檢測的短信是否是欺詐短信;內(nèi)容識別模塊與行為識別模塊連接,是特征識別子系統(tǒng)的核心模塊,用于根據(jù)特征數(shù)據(jù)庫中的文本特征,判斷通過行為識別模塊檢測的短信是否是欺詐短信。分類過濾子系統(tǒng),用于過濾垃圾短信,其架構(gòu)與現(xiàn)有的垃圾短信過濾系統(tǒng)的架構(gòu)相同,包括短信預(yù)處理模塊、樸素貝葉斯分類模塊、支持向量機分類模塊以及分類數(shù)據(jù)庫,因此不再贅述;短信攔截中心,用于攔截特征識別子系統(tǒng)識別出的欺詐短信和分類過濾子系統(tǒng)過濾出的垃圾短信。服務(wù)端通過網(wǎng)絡(luò)與客戶端連接,且服務(wù)端設(shè)置有安全服務(wù)云中心,用于監(jiān)控客戶端的信息過濾進程,并定期與客戶端的數(shù)據(jù)同步。以下對上述欺詐信息過濾系統(tǒng)的具體實現(xiàn)流程再做一詳細(xì)地說明。 用戶手機接收到新短信后,首先進入特征識別子系統(tǒng),檢測其是否是釣魚欺詐短信,具體步驟是(a)來源識別模塊首先將新短信的發(fā)送號碼與白名單中的號碼進行比對,如果發(fā)送號碼在白名單中,則檢測通過;如果發(fā)送號碼不屬于白名單,再繼續(xù)查找黑名單;如果發(fā)送號碼在黑名單中,就將該短信標(biāo)識為欺詐短信,如果不在黑名單中,則轉(zhuǎn)到步驟(b)繼續(xù)檢測;(b)行為識別模塊將該短信的發(fā)送行為屬性和特征數(shù)據(jù)庫中欺詐短信的行為特征進行比對,如果行為屬性匹配,則將該短信標(biāo)識為欺詐短信,并將該其發(fā)送行為特征記錄下來,在聯(lián)網(wǎng)時同步到安全服務(wù)云中心;如果行為屬性不匹配,則轉(zhuǎn)到步驟(C)繼續(xù)檢測;為了提高識別的效率,在手機聯(lián)網(wǎng)時,由安全服務(wù)云中心根據(jù)短信的行為特征來判斷該短信是否是惡意欺詐短信;(C)內(nèi)容識別模塊提取該短信的內(nèi)容關(guān)鍵字(例如,銀行名稱,網(wǎng)址,客服電話等),與特征數(shù)據(jù)庫中欺詐信息的文本特征進行比對,例如,可以首先識別出短信中的銀行名稱和網(wǎng)址,再與官方網(wǎng)站進行比對;如果特征匹配,則將該短信標(biāo)識為欺詐短信;如果不匹配,則檢測通過。特征識別子系統(tǒng)檢測通過的短信,再進入分類過濾子系統(tǒng),根據(jù)特征分類集和自學(xué)習(xí)的樸素貝葉斯或SVM算法判斷其是否是垃圾短信,若是,則將其標(biāo)識為垃圾短信,并通知短信攔截中心對其進行攔截;若否,則正常顯示給用戶,并根據(jù)用戶后續(xù)的操作,判斷分類的正確與否,并用于反饋學(xué)習(xí)。特征識別子系統(tǒng)檢測未通過的短信,即被標(biāo)識為欺詐短信的短信,由短信攔截中心對其進行攔截,同時通知后臺的安全服務(wù)云中心進程聯(lián)動,對該欺詐短信進行監(jiān)控,防范用戶在手機上訪問釣魚網(wǎng)站,保護該手機用戶的網(wǎng)游賬號、第三方支付賬號等資金賬號不被盜取。
權(quán)利要求
1.一種基于特征識別的欺詐信息過濾系統(tǒng),包括客戶端和服務(wù)端,客戶端設(shè)置有分類過濾子系統(tǒng),用于對信息進行分類,識別出垃圾信息,其特征在于 客戶端還包括有特征識別子系統(tǒng)和信息攔截中心,特征識別子系統(tǒng)與分類過濾子系統(tǒng)連接,并設(shè)置在分類過濾子系統(tǒng)之前,用于根據(jù)信息的特征,識別出欺詐信息; 信息攔截中心用于攔截特征識別子系統(tǒng)識別出的欺詐信息和分類過濾子系統(tǒng)識別出的垃圾信息; 服務(wù)端通過網(wǎng)絡(luò)與客戶端連接,且服務(wù)端設(shè)置有安全服務(wù)云中心,用于監(jiān)控客戶端的進程,并通過網(wǎng)絡(luò)與客戶端保持?jǐn)?shù)據(jù)同步。
2.如權(quán)利要求I所述的欺詐信息過濾系統(tǒng),其特征在于,所述特征識別子系統(tǒng)進一步包括 特征數(shù)據(jù)庫,用于存儲欺詐信息的來源特征、行為特征和內(nèi)容特征; 來源識別模塊,與特征數(shù)據(jù)庫連接,用于根據(jù)特征數(shù)據(jù)庫中的來源特征,判斷用戶收到的息是否是欺詐息; 行為識別模塊,與特征數(shù)據(jù)庫連接,用于根據(jù)特征數(shù)據(jù)庫中的行為特征,判斷用戶收到的息是否是欺詐息; 內(nèi)容識別模塊,與特征數(shù)據(jù)庫連接,用于根據(jù)特征數(shù)據(jù)庫中的內(nèi)容特征,判斷用戶收到的息是否是欺詐息。
3.如權(quán)利要求2所述的欺詐信息過濾系統(tǒng),其特征在于,所述行為特征包括被叫號碼是否相鄰、短信發(fā)送頻率、短信發(fā)送量、發(fā)送成功率以及回復(fù)率。
4.如權(quán)利要求2所述的欺詐信息過濾系統(tǒng),其特征在于,所述內(nèi)容特征包括銀行名稱、官方網(wǎng)址和客服電話;短信中出現(xiàn)的網(wǎng)址和客服電話。
5.一種基于權(quán)利要求I的系統(tǒng)實現(xiàn)的欺詐信息過濾方法,其特征在于,包括以下步驟 1)用戶收到新信息; 2)檢測該信息是否是欺詐信息,若是,則將該信息標(biāo)識為欺詐信息,并對其進行攔截;若否,則轉(zhuǎn)到步驟3); 3)檢測該信息是否是垃圾信息,若是,則將該信息標(biāo)識為垃圾信息,并對其進行攔截;若否,則將該信息顯示給用戶。
6.如權(quán)利要求5所述的欺詐信息過濾方法,其特征在于步驟2)中,通過將該信息的特征與欺詐信息的特征進行比對,來判斷該信息是否是欺詐信息。
7.如權(quán)利要求6所述的欺詐信息過濾方法,其特征在于所述特征包括信息的來源特征、行為特征以及內(nèi)容特征。
8.如權(quán)利要求7所述的欺詐信息過濾方法,其特征在于所述行為特征包括被叫號碼是否相鄰、短信發(fā)送頻率、短信發(fā)送量、發(fā)送成功率以及回復(fù)率。
9.如權(quán)利要求7所述的欺詐信息過濾方法,其特征在于所述內(nèi)容特征包括銀行名稱、官方網(wǎng)址、客服電話、短信中出現(xiàn)的網(wǎng)址和客服電話。
10.如權(quán)利要求5所述的欺詐信息過濾方法,其特征在于,步驟2)之后,還包括步驟安全服務(wù)云中心對檢測出的欺詐信息進行監(jiān)控。
全文摘要
本發(fā)明公開了一種基于特征識別的欺詐信息過濾系統(tǒng),包括通過網(wǎng)絡(luò)連接的客戶端和服務(wù)端,客戶端包括特征識別子系統(tǒng)、分類過濾子系統(tǒng)和信息攔截中心,特征識別子系統(tǒng)設(shè)置在分類過濾子系統(tǒng)之前,用于識別欺詐信息,分類過濾子系統(tǒng)用于識別垃圾信息,信息攔截中心用于攔截前述兩個子系統(tǒng)識別出的欺詐信息和垃圾信息;服務(wù)端設(shè)有安全服務(wù)云中心,用于監(jiān)控客戶端的進程,并通過網(wǎng)絡(luò)與客戶端數(shù)據(jù)同步。本發(fā)明還公開了基于上述系統(tǒng)的欺詐信息過濾方法。該欺詐信息過濾系統(tǒng)及方法通過特征檢測,在過濾垃圾信息之前,先過濾出危害性更大的欺詐信息,并通過客戶端與服務(wù)端的進程聯(lián)動,進一步防范用戶訪問惡意網(wǎng)站,從而降低了用戶資金賬戶被盜的概率。
文檔編號H04L29/08GK102790752SQ20111013143
公開日2012年11月21日 申請日期2011年5月20日 優(yōu)先權(quán)日2011年5月20日
發(fā)明者吳銳, 夏紅衛(wèi), 季昕華, 張赟, 楊暉, 林金明 申請人:盛樂信息技術(shù)(上海)有限公司