本發(fā)明涉及計(jì)算機(jī)及其軟件技術(shù)領(lǐng)域,特別地涉及一種惡意訂單地址的判定方法和裝置。
背景技術(shù):
隨著互聯(lián)網(wǎng)的蓬勃發(fā)展,電子商務(wù)的規(guī)模成倍增長。特別是近幾年,電子商務(wù)體系的不斷完善和用戶習(xí)慣的不斷養(yǎng)成造就越來越多的人開始選擇網(wǎng)上購物。為了吸引更多用戶到自家平臺購物,電商營銷發(fā)揮著重要作用。搶購作為一種重要的營銷手段,能夠十分有效地為購物平臺吸引大量人氣,幫助引來新的用戶,增加訪問量和點(diǎn)擊量,提高電商網(wǎng)站的知名度和用戶活躍度。
搶購商品通常具有實(shí)惠力度大、稀缺性明顯的特點(diǎn),所以在吸引大批正常用戶的同時,也引來了大量的惡意訂單用戶(俗稱黃牛)。搶購商品成為眾多黃牛賺取利潤差的理想目標(biāo)。對于一個互聯(lián)網(wǎng)購物平臺,運(yùn)營設(shè)計(jì)的搶購活動通常只包含至多上千件的商品,但是最終能產(chǎn)生上百萬的下單請求,其中充斥著大量黃牛以及其它惡意訂單,不僅給整個系統(tǒng)增加了沉重負(fù)擔(dān)也損害了普通消費(fèi)者正常利益。
早期傳統(tǒng)的人工審核在面對如此眾多的訂單,往往也是力不從心,人工審核不僅處理速度慢,而且容易出現(xiàn)錯誤,于是搶購系統(tǒng)中針對惡意訂單,特別是惡意搶單的自動判定系統(tǒng)應(yīng)運(yùn)而生。
現(xiàn)有比較流行的處理系統(tǒng)都是針對客戶的訂單請求分別采用了多個模型串行過濾的處理方式,方法流程如圖1所示。圖1示出了現(xiàn)有技術(shù)的實(shí)現(xiàn)訂單請求過濾的方法流程示意圖,如圖1所示,用戶的下 單請求信息可以分為多個維度,如ip地址、uid、手機(jī)號、商品限購信息等。根據(jù)每個維度的信息,都可以設(shè)計(jì)對應(yīng)的模型進(jìn)行過濾判斷。所有下單請求從第一個模型開始依次逐步過濾,凡是判定未通過模型的請求隨即被打上惡意標(biāo)識,為客服是否進(jìn)一步審核訂單提供重要的參考依據(jù)。這種技術(shù)方案從設(shè)計(jì)上思路比較清晰,一定程度上替代了人工審單的工作,降低了客服的工作量。
然而,上述現(xiàn)有模型都是針對每個維度信息采用單獨(dú)的標(biāo)準(zhǔn)進(jìn)行判斷,并沒有對各個模型的判斷結(jié)果進(jìn)行統(tǒng)一整合。以ip地址為例,通常的思路是對相同ip地址的請求采用頻率限制,如一個時間段內(nèi),相同ip地址訪問次數(shù)超過一定的閾值就會被打上標(biāo)識,此時間段內(nèi)同一ip地址的后續(xù)請求都會被認(rèn)為是黃牛刷單請求,將被直接拒絕。但是現(xiàn)在的ip地址大多采用動態(tài)分配,黃牛刷單時也很有可能使用動態(tài)ip地址和代理ip地址的技術(shù)來不斷變化下單請求的ip地址,從而規(guī)避了搶購系統(tǒng)中對ip地址的監(jiān)控。同樣的,黃??梢酝瑫r使用上千個不同的賬號來輪流搶購。這樣針對現(xiàn)在考慮到的這些維度信息采用模型串行過濾的方式并不能很好地實(shí)現(xiàn)對黃牛搶購下單請求的攔截。
綜上所述,現(xiàn)有的方法不能很好地判定眾多訂單信息中的惡意訂單,從而不能有效地對惡意訂單進(jìn)行過濾和攔截。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明提供一種惡意訂單地址的判定方法和裝置,能夠快速判定和查找出惡意訂單用戶,特別是能快速判定和查找出頻繁搶單的惡意訂單用戶并將其進(jìn)行攔截,保證了普通用戶的利益,地址查詢時間短且查詢效率高。
為實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,提供了一種惡意訂單地址的判定方法。
一種惡意訂單地址的判定方法,包括:接收訂單地址,并按照預(yù)定層次順序從地址庫中查找出與所述訂單地址相同部分最多的地址作為相似地址;計(jì)算所述相似地址與所述訂單地址的相似度和查找時間差,并獲取所述相似地址的累計(jì)查找次數(shù),其中,所述查找時間差為所述訂單地址的當(dāng)前查找時間和所述相似地址的查找時間之差中的最小值;根據(jù)所述相似度、所述查找時間差和所述累計(jì)查找次數(shù)計(jì)算所述訂單地址的得分;將所述得分大于預(yù)設(shè)的得分閾值的訂單地址判定為惡意訂單地址。
可選地,所述地址庫中存儲的地址信息根據(jù)預(yù)定的地址層次順序按詞進(jìn)行分層存儲;并且,按照預(yù)定層次順序從地址庫中查找出與所述訂單地址相同部分最多的地址作為相似地址的步驟,包括:將所述訂單地址按詞拆分,得到多個地址分詞;按照所述地址庫中詞的存儲層次,將所述地址分詞與所述地址庫中的詞逐個匹配;將所述地址庫中與所述地址分詞匹配一致最多的地址作為相似地址。
可選地,所述地址庫中存儲的地址信息根據(jù)預(yù)定的地址層次順序按字進(jìn)行分層存儲;并且,按照預(yù)定層次順序從地址庫中查找出與所述訂單地址相同部分最多的地址作為相似地址的步驟,包括:將所述訂單地址按字拆分,得到多個地址字符;按照所述地址庫中字的存儲層次,將所述地址字符與所述地址庫中的字逐個匹配;將所述地址庫中與所述地址字符匹配一致最多的地址作為相似地址。
可選地,計(jì)算所述相似地址與所述訂單地址的相似度的步驟,包括:記錄所述地址庫中與所述地址分詞匹配一致的詞所對應(yīng)的存儲層次的最大值,作為相似地址的最大匹配層次;將所述相似地址的最大匹配層次與所述地址分詞的個數(shù)的比值作為所述相似度。
可選地,計(jì)算所述相似地址與所述訂單地址的相似度的步驟,包括:記錄所述地址庫中與所述地址字符匹配一致的字所對應(yīng)的存儲層 次的最大值,作為相似地址的最大匹配層次;將所述相似地址的最大匹配層次與所述地址字符的個數(shù)的比值作為所述相似度。
可選地,按照預(yù)定順序在地址庫中查找出與所述訂單地址相同部分最多的地址作為相似地址的步驟之后,還包括:根據(jù)所述訂單地址更新所述地址庫中的地址信息。
根據(jù)本發(fā)明的另一方面,提供了一種惡意訂單地址的判定裝置。
一種惡意訂單地址的判定裝置,包括:地址查找模塊,用于接收訂單地址,并按照預(yù)定層次順序從地址庫中查找出與所述訂單地址相同部分最多的地址作為相似地址;第一計(jì)算模塊,用于計(jì)算所述相似地址與所述訂單地址的相似度和查找時間差,并獲取所述相似地址的累計(jì)查找次數(shù),其中,所述查找時間差為所述訂單地址的當(dāng)前查找時間和所述相似地址的查找時間之差中的最小值;第二計(jì)算模塊,用于根據(jù)所述相似度、所述查找時間差和所述累計(jì)查找次數(shù)計(jì)算所述訂單地址的得分;地址判定模塊,用于將所述得分大于預(yù)設(shè)的得分閾值的訂單地址判定為惡意訂單地址。
可選地,所述地址庫中存儲的地址信息根據(jù)預(yù)定的地址層次順序按詞進(jìn)行分層存儲;并且,所述地址查找模塊還用于:將所述訂單地址按詞拆分,得到多個地址分詞;按照所述地址庫中詞的存儲層次,將所述地址分詞與所述地址庫中的詞逐個匹配;將所述地址庫中與所述地址分詞匹配一致最多的地址作為相似地址。
可選地,所述地址庫中存儲的地址信息根據(jù)預(yù)定的地址層次順序按字進(jìn)行分層存儲;并且,所述地址查找模塊還用于:將所述訂單地址按字拆分,得到多個地址字符;按照所述地址庫中字的存儲層次,將所述地址字符與所述地址庫中的字逐個匹配;將所述地址庫中與所述地址字符匹配一致最多的地址作為相似地址。
可選地,所述第一計(jì)算模塊還用于:記錄所述地址庫中與所述地址分詞匹配一致的詞所對應(yīng)的存儲層次的最大值,作為相似地址的最大匹配層次;將所述相似地址的最大匹配層次與所述地址分詞的個數(shù)的比值作為所述相似度。
可選地,所述第一計(jì)算模塊還用于:記錄所述地址庫中與所述地址字符匹配一致的字所對應(yīng)的存儲層次的最大值,作為相似地址的最大匹配層次;將所述相似地址的最大匹配層次與所述地址字符的個數(shù)的比值作為所述相似度。
可選地,還包括:地址更新模塊,用于根據(jù)所述訂單地址更新所述地址庫中的地址信息。
根據(jù)本發(fā)明的技術(shù)方案,接收到訂單地址之后,按照預(yù)定的層次順序從地址庫中查找出相似地址,計(jì)算相似地址與訂單地址的相似度和查找時間差,并獲取相似地址的累計(jì)查找次數(shù),根據(jù)相似度、查找時間差及累計(jì)查找次數(shù)計(jì)算地址得分,將地址得分大于得分閾值的訂單地址判定為惡意訂單地址,從而相應(yīng)的訂單為惡意訂單。解決了目前對惡意訂單判定困難的問題,最大限度地減少了無謂的信息比較,能夠快速判定和查找出惡意訂單用戶,特別是能快速判定和查找出頻繁搶單的惡意訂單用戶并將其進(jìn)行攔截,保證了普通用戶的利益,地址查詢時間短且查詢效率高。
附圖說明
附圖用于更好地理解本發(fā)明,不構(gòu)成對本發(fā)明的不當(dāng)限定。其中:
圖1是現(xiàn)有技術(shù)的實(shí)現(xiàn)訂單請求過濾的方法流程示意圖;
圖2是根據(jù)本發(fā)明實(shí)施例的訂單系統(tǒng)與惡意訂單地址的判定裝置的交互關(guān)系示意圖;
圖3是根據(jù)本發(fā)明實(shí)施例的惡意訂單地址的判定方法的主要步驟 示意圖;
圖4是根據(jù)本發(fā)明實(shí)施例的字典樹按字存儲地址信息的示意圖;
圖5是根據(jù)本發(fā)明實(shí)施例的字典樹按詞存儲地址信息的示意圖;
圖6是根據(jù)本發(fā)明實(shí)施例的惡意訂單地址的判定裝置的主要模塊示意圖。
具體實(shí)施方式
以下結(jié)合附圖對本發(fā)明的示范性實(shí)施例做出說明,其中包括本發(fā)明實(shí)施例的各種細(xì)節(jié)以助于理解,應(yīng)當(dāng)將它們認(rèn)為僅僅是示范性的。因此,本領(lǐng)域普通技術(shù)人員應(yīng)當(dāng)認(rèn)識到,可以對這里描述的實(shí)施例做出各種改變和修改,而不會背離本發(fā)明的范圍和精神。同樣,為了清楚和簡明,以下的描述中省略了對公知功能和結(jié)構(gòu)的描述。
圖2是根據(jù)本發(fā)明實(shí)施例的訂單系統(tǒng)與惡意訂單地址的判定裝置的交互關(guān)系示意圖。
本發(fā)明實(shí)施例主要通過訂單系統(tǒng)與惡意訂單地址的判定裝置的交互來實(shí)現(xiàn)惡意訂單地址的判定。如圖2所示,惡意訂單地址的判定裝置接收訂單系統(tǒng)發(fā)送來的訂單地址信息,然后,在惡意訂單地址的判定裝置內(nèi)部對訂單地址信息執(zhí)行分析判定過程,最后,惡意訂單地址的判定裝置將判定的結(jié)果返回訂單系統(tǒng)。其中,惡意訂單地址的判定裝置用于對訂單地址信息進(jìn)行分析以判定出惡意訂單地址,從而判定出惡意訂單,惡意訂單例如電子商務(wù)平臺搶購系統(tǒng)中的惡意頻繁搶單。惡意訂單地址的判定裝置包含存有地址信息的地址庫,地址庫中存儲的地址信息主要是經(jīng)惡意訂單地址的判定裝置分析過的地址信息,這些分析過的地址信息為過去訂單系統(tǒng)發(fā)送來的用戶訂單地址信息,例如用戶訂單的收貨地址信息。
圖3是根據(jù)本發(fā)明實(shí)施例的惡意訂單地址的判定方法的主要步驟示意圖。
如圖3所示,本發(fā)明實(shí)施例的惡意訂單地址的判定方法主要包括如下的步驟s31至步驟s34。
步驟s31:接收訂單地址,并按照預(yù)定層次順序從地址庫中查找出與訂單地址相同部分最多的地址作為相似地址。
訂單地址可以是收貨地址,并且形式上為一個字符串,該字符串可拆分為字符或詞等形式。地址庫可以根據(jù)預(yù)定的地址層次順序按詞或按字分層存儲地址信息。對于地址庫根據(jù)預(yù)定的地址層次順序按詞分層存儲地址信息的情況,預(yù)定的地址層次順序即地址庫中詞的存儲層次順序,具體可以為地址信息中表示地名的詞的自然排列順序,在我國,通常是根據(jù)表示地名的各詞的地理范圍的大小由大到小來排序,例如:可按照國家、省份、城市或鄉(xiāng)村、街道、門牌號碼等來進(jìn)行排序。地址庫可以按照地址信息中表示地名的語義來劃分詞,然后按照各地名表示的地理范圍大小來分層存儲各個詞。例如“上海市黃浦區(qū)九江路”,按詞分為三個層次進(jìn)行存儲:“上海市”、“黃浦區(qū)”、“九江路”,每個詞對應(yīng)一個存儲的層次,例如“九江路”的存儲層次為3。對于地址庫根據(jù)預(yù)定的地址層次順序按字分層存儲地址信息的情況,預(yù)定的地址層次順序即地址庫中字的存儲層次順序,具體可以為地址信息中字符的自然排列順序,例如“上海市黃浦區(qū)九江路”,按字分為九個層次進(jìn)行存儲:“上”、“?!薄ⅰ笆小?、“黃”、“浦”、“區(qū)”、“九”、“江”、“路”,每個字對應(yīng)一個存儲的層次,例如“路”的存儲層次為9。
地址庫中地址信息的分層存儲結(jié)構(gòu)具體為字典樹結(jié)構(gòu)。當(dāng)?shù)刂穾煲宰值錁浣Y(jié)構(gòu)存儲地址信息時,根據(jù)存儲的情況(例如按詞存儲或按字存儲),字典樹的每個節(jié)點(diǎn)(除了根節(jié)點(diǎn))的節(jié)點(diǎn)信息中保存有該節(jié)點(diǎn)對應(yīng)的存儲層次(又稱節(jié)點(diǎn)深度值)、該節(jié)點(diǎn)被查找的時間、查找次數(shù)以及存儲在該節(jié)點(diǎn)上的地址等信息。具體的存儲結(jié)構(gòu)如圖4和 圖5所示,圖4是根據(jù)本發(fā)明實(shí)施例的字典樹按字存儲地址信息的示意圖,如圖4所示,“上海市黃浦區(qū)漢口路”中“路”對應(yīng)的節(jié)點(diǎn)深度值為9,即字的存儲層次為9。圖5是根據(jù)本發(fā)明實(shí)施例的字典樹按詞存儲地址信息的示意圖,如圖5所示,“上海市徐匯區(qū)古美路1515號”中,“1515號”對應(yīng)的節(jié)點(diǎn)的深度值為4,即詞的存儲層次為4。通過讀取節(jié)點(diǎn)信息可以獲取相應(yīng)的存儲層次(節(jié)點(diǎn)深度值),每一次查找完成后,都會更新節(jié)點(diǎn)信息中的內(nèi)容。
對于地址庫按詞分層存儲地址信息的情況,按照預(yù)定層次順序從地址庫中查找出與訂單地址相同部分最多的地址作為相似地址的步驟,可以包括:將訂單地址按詞拆分,得到多個地址分詞;按照地址庫中詞的存儲層次,將地址分詞與地址庫中的詞逐個匹配;將地址庫中與地址分詞匹配一致最多的地址作為相似地址。
對于地址庫按字分層存儲地址信息的情況,按照預(yù)定層次順序從地址庫中查找出與訂單地址相同部分最多的地址作為相似地址的步驟,可以包括:將訂單地址按字拆分,得到多個地址字符;按照地址庫中字的存儲層次,將地址字符與地址庫中的字逐個匹配;將地址庫中與地址字符匹配一致最多的地址作為相似地址。
其中,將訂單地址按詞拆分或按字拆分,取決于地址庫中地址信息的存儲形式為按詞存儲還是按字存儲,訂單地址的拆分形式需要與地址庫中地址信息的存儲形式保持一致。其中將訂單地址拆分為多個地址分詞可以通過分詞算法實(shí)現(xiàn),可以按照表示地名的語義來進(jìn)行分詞,以便能夠與地址庫中的詞準(zhǔn)確匹配。預(yù)定層次順序?yàn)榘凑盏刂穾熘械刂沸畔⒌拇鎯哟蔚捻樞?,具體可以包括地址庫中詞的存儲層次或字的存儲層次,對于采用字典樹結(jié)構(gòu)存儲地址信息的地址庫,該預(yù)定層次順序?yàn)樽值錁涞墓?jié)點(diǎn)順序。以圖4所示的字典樹為例,訂單地址為“上海市黃浦區(qū)漢口路23號”,字典樹中地址信息按字分層存儲,那么,按照字典樹節(jié)點(diǎn)的順序,依次將訂單地址中的字符與字典樹節(jié) 點(diǎn)中的字符逐個匹配,得到字典樹中與訂單地址“上海市黃浦區(qū)漢口路23號”匹配一致最多的地址為“上海市黃浦區(qū)漢口路27號”和“上海市黃浦區(qū)漢口路9號”,將得到的該兩個地址作為相似地址。按照字典樹的節(jié)點(diǎn)順序進(jìn)行查找,可以減少查詢時間,最大限度地減少無謂的字符串比較,查詢效率高。
按照預(yù)定順序在地址庫中查找出與訂單地址相同部分最多的地址作為相似地址的步驟之后,還可以根據(jù)訂單地址更新地址庫中的地址信息。更新地址庫中的地址信息主要是將地址庫中沒有存儲的訂單地址信息添加到地址庫中,以便之后能夠更加準(zhǔn)確地查找和匹配到惡意訂單地址??梢酝ㄟ^插入新的存儲節(jié)點(diǎn)來更新地址庫中的地址信息,該存儲節(jié)點(diǎn)用于保存新添加到地址庫中的字或詞。
步驟s32:計(jì)算相似地址與訂單地址的相似度和查找時間差,并獲取相似地址的累計(jì)查找次數(shù),其中,查找時間差為訂單地址的當(dāng)前查找時間和相似地址的查找時間之差中的最小值。
對于地址庫按詞分層存儲地址信息的情況,計(jì)算相似地址與訂單地址的相似度的步驟,可以包括:記錄地址庫中與地址分詞匹配一致的詞所對應(yīng)的存儲層次的最大值,作為相似地址的最大匹配層次;將該相似地址的最大匹配層次與地址分詞的個數(shù)的比值作為相似度。
對于地址庫按字分層存儲地址信息的情況,計(jì)算相似地址與訂單地址的相似度的步驟,包括:記錄地址庫中與地址字符匹配一致的字所對應(yīng)的存儲層次的最大值,作為相似地址的最大匹配層次;將該相似地址的最大匹配層次與地址字符的個數(shù)的比值作為相似度。
下面以地址庫中按照字典樹結(jié)構(gòu)存儲地址信息的情況為例,分別如圖4和圖5所示。圖4的字典樹中,根據(jù)訂單地址“上海市黃浦區(qū)漢口路23號”查找到相似地址為“上海市黃浦區(qū)漢口路27號”和“上 海市黃浦區(qū)漢口路9號”,其中該兩個相似地址與訂單地址匹配一致的部分為“上海市黃浦區(qū)漢口路”,則相似地址的最大匹配層次為“上海市黃浦區(qū)漢口路”中“路”的存儲層次9,字符“路”對應(yīng)的節(jié)點(diǎn)的深度值。訂單地址“上海市黃浦區(qū)漢口路23號”含12個地址字符,那么,相似度為:9/12=75%。同理,圖5所示的字典樹中,如果訂單地址為“上海市徐匯區(qū)古美路1515”,查找到相似地址為“上海市徐匯區(qū)古美路1515號”,該相似地址與訂單地址匹配一致的部分為“上海市徐匯區(qū)古美路1515號”,則相似地址的最大匹配層次為4,訂單地址為“上海市徐匯區(qū)古美路1515”包含4個地址分詞,那么,相似度為4/4=100%。
通過讀取相似地址的存儲信息可以得到相似地址被查找的時間,例如通過讀取字典樹的節(jié)點(diǎn)信息可以得到保存該節(jié)點(diǎn)的詞或字被查找的時間。由于相似地址可能為多個,每個相似地址都有各自的最后查找時間,計(jì)算查找時間差是為了得出最近一次相似地址被查找的時間(即最后查找時間)中距離當(dāng)前查找時間間隔最短的時間差值,即訂單地址的當(dāng)前查找時間和相似地址的查找時間之差中的最小值,將該得出的最小值作為查找時間差。
相似地址的累計(jì)查找次數(shù)是所有相似地址的查找次數(shù)之和,由于查找出的相似地址可能為很多個,每個相似地址的查找次數(shù)是該相似地址自第一次被查找開始至當(dāng)前查找為止總共被查找的次數(shù),相似地址的查找次數(shù)可以通過讀取相似地址的存儲信息來獲取,例如,地址信息存儲在字典樹節(jié)點(diǎn)中,那么通過讀取保存相似地址的節(jié)點(diǎn)信息可以獲取該相似地址的查找次數(shù)。如圖4所示,例如,訂單地址“上海市黃浦區(qū)漢口路23號”的相似地址為“上海市黃浦區(qū)漢口路27號”和“上海市黃浦區(qū)漢口路9號”,那么通過分別讀取該兩個相似地址中的字符“號”對應(yīng)的節(jié)點(diǎn)信息,可以獲取該兩個相似地址各自的查找次數(shù),累計(jì)查找次數(shù)可以通過讀取該兩個相似地址公共部分的最大深度值節(jié)點(diǎn)的節(jié)點(diǎn)信息來獲取,如圖4所示,通過讀取字符“路”對 應(yīng)的節(jié)點(diǎn)信息可以獲得該累計(jì)查找次數(shù),該累計(jì)查找次數(shù)反映了“上海市黃浦區(qū)漢口路”這個地址信息片段被累計(jì)查找的次數(shù),該地址信息片段被累計(jì)查找的次數(shù)越多,表示包含“上海市黃浦區(qū)漢口路”的訂單地址出現(xiàn)的次數(shù)越頻繁。
步驟s33:根據(jù)相似度、查找時間差和累計(jì)查找次數(shù)計(jì)算訂單地址的得分。
具體可以通過如下的公式計(jì)算訂單地址的地址得分:
地址得分=相似度×a–(查找時間差)2+b+c×累計(jì)查找次數(shù),
其中,累計(jì)查找次數(shù)為所有相似地址的查找次數(shù)的加和;a、b和c為常量,可以自定義這些常量的數(shù)值,設(shè)置該三個常量的具體數(shù)值時,要使得相似度、查找時間差、累計(jì)查找次數(shù)與計(jì)算出的地址得分滿足如下關(guān)系:相似度和累計(jì)查找次數(shù)越大,計(jì)算出的地址得分越大;查找時間差越小,計(jì)算出的地址得分越大。在實(shí)際情況中,有時需要人為調(diào)整對惡意訂單地址判定的結(jié)果,通過改變a、b、c三個常量的具體數(shù)值,即可以達(dá)到人為調(diào)整判定結(jié)果的目的。a、b、c的具體數(shù)值可以影響對訂單地址的判定結(jié)果,即影響訂單地址的地址得分公式的計(jì)算結(jié)果。例如,設(shè)置a=50;b=64;c=3時,使得訂單系統(tǒng)發(fā)送過來的訂單地址中,80%的訂單地址都被判定為惡意訂單地址,通過改變a、b、c的數(shù)值,可以使得更大比例(例如90%)或更小比例(例如60%)的訂單地址被判定為惡意訂單地址,從而可以人為地根據(jù)實(shí)際需要來修正地址得分公式的計(jì)算結(jié)果,以便得到更符合實(shí)際的判定結(jié)果。
步驟s34:將得分大于預(yù)設(shè)的得分閾值的訂單地址判定為惡意訂單地址。
根據(jù)本發(fā)明的實(shí)施例,相似度越高、查找時間差越小、累計(jì)查找次數(shù)越大,則計(jì)算出的訂單地址的地址得分分?jǐn)?shù)就越高,將該地址得分與預(yù)設(shè)的得分閾值相比較,如果大于得分閾值,則該訂單地址為惡 意訂單地址,否則為正常訂單地址,得分閾值可以設(shè)置為上述常量a的值或根據(jù)實(shí)際需要設(shè)置為其他數(shù)值。
圖6是根據(jù)本發(fā)明實(shí)施例的惡意訂單地址的判定裝置的主要模塊示意圖。
本發(fā)明實(shí)施例的惡意訂單地址的判定裝置60,主要包括地址查找模塊61、第一計(jì)算模塊62、第二計(jì)算模塊63、地址判定模塊64,其中:地址查找模塊61,用于接收訂單地址,并按照預(yù)定層次順序從地址庫中查找出與訂單地址相同部分最多的地址作為相似地址;第一計(jì)算模塊62,用于計(jì)算相似地址與訂單地址的相似度和查找時間差,并獲取相似地址的累計(jì)查找次數(shù),其中,查找時間差為訂單地址的當(dāng)前查找時間和相似地址的查找時間之差中的最小值;第二計(jì)算模塊63,用于根據(jù)相似度、查找時間差和累計(jì)查找次數(shù)計(jì)算訂單地址的得分;地址判定模塊64,用于將得分大于預(yù)設(shè)的得分閾值的訂單地址判定為惡意訂單地址。
地址庫中存儲的地址信息可以根據(jù)預(yù)定的地址層次順序按詞進(jìn)行分層存儲,相應(yīng)地,地址查找模塊61還可以用于:將訂單地址按詞拆分,得到多個地址分詞;按照地址庫中詞的存儲層次,將地址分詞與地址庫中的詞逐個匹配;將地址庫中與地址分詞匹配一致最多的地址作為相似地址。
地址庫中存儲的地址信息可以根據(jù)預(yù)定的地址層次順序按字進(jìn)行分層存儲;相應(yīng)地,地址查找模塊61還可以用于:將訂單地址按字拆分,得到多個地址字符;按照地址庫中字的存儲層次,將地址字符與地址庫中的字逐個匹配;將地址庫中與地址字符匹配一致最多的地址作為相似地址。
第一計(jì)算模塊62還可以用于:記錄地址庫中與地址分詞匹配一致 的詞所對應(yīng)的存儲層次的最大值,作為相似地址的最大匹配層次;將相似地址的最大匹配層次與地址分詞的個數(shù)的比值作為相似度。
第一計(jì)算模塊62還可以用于:記錄地址庫中與地址字符匹配一致的字所對應(yīng)的存儲層次的最大值,作為相似地址的最大匹配層次;將相似地址的最大匹配層次與地址字符的個數(shù)的比值作為相似度。
根據(jù)本發(fā)明實(shí)施例的技術(shù)方案,接收到訂單地址之后,按照預(yù)定的層次順序從地址庫中查找出相似地址,計(jì)算相似地址與訂單地址的相似度和查找時間差,并獲取相似地址的累計(jì)查找次數(shù),根據(jù)相似度、查找時間差及累計(jì)查找次數(shù)計(jì)算地址得分,將地址得分大于得分閾值的訂單地址判定為惡意訂單地址,從而相應(yīng)的訂單為惡意訂單。解決了目前對惡意訂單判定困難的問題,最大限度地減少了無謂的信息比較,能夠快速判定和查找出惡意訂單用戶,特別是能快速判定和查找出頻繁搶單的惡意訂單用戶并將其進(jìn)行攔截,保證了普通用戶的利益,地址查詢時間短且查詢效率高。
上述具體實(shí)施方式,并不構(gòu)成對本發(fā)明保護(hù)范圍的限制。本領(lǐng)域技術(shù)人員應(yīng)該明白的是,取決于設(shè)計(jì)要求和其他因素,可以發(fā)生各種各樣的修改、組合、子組合和替代。任何在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)范圍之內(nèi)。