亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

信息處理方法及裝置與流程

文檔序號(hào):12379934閱讀:239來源:國(guó)知局
信息處理方法及裝置與流程
本發(fā)明涉及計(jì)算機(jī)應(yīng)用領(lǐng)域,具體而言,涉及一種信息處理方法及裝置。
背景技術(shù)
:目前,對(duì)垃圾短信的發(fā)現(xiàn)主要是依賴于客戶舉報(bào)處理,但是現(xiàn)在垃圾短信的發(fā)送手段很隱蔽,通過短信群發(fā)器和偽基站等以手機(jī)號(hào)碼的形式群發(fā)消息,同時(shí)短信的內(nèi)容也多樣化,使得原有的治理方案和識(shí)別規(guī)則產(chǎn)生誤攔、漏攔等問題,無法有針對(duì)性的提升垃圾短信監(jiān)控和識(shí)別的能力。技術(shù)實(shí)現(xiàn)要素:有鑒于此,本發(fā)明實(shí)施例的目的在于提供一種信息處理方法及裝置,以解決上述問題。第一方面,本發(fā)明實(shí)施例提供一種信息處理方法,所述方法包括:獲取待處理數(shù)據(jù),所述待處理數(shù)據(jù)包括多個(gè)用戶終端手機(jī)號(hào)、所述各個(gè)用戶終端手機(jī)號(hào)分別對(duì)應(yīng)的各個(gè)預(yù)設(shè)字段的值、以及所述用戶終端手機(jī)號(hào)對(duì)應(yīng)的號(hào)碼類別,所述號(hào)碼類別包括普遍號(hào)碼類別或異常號(hào)碼類別;計(jì)算不同號(hào)碼類別下,所述各個(gè)預(yù)設(shè)字段值的分布,根據(jù)所述不同用戶類別下,所述各個(gè)預(yù)設(shè)字段值的分布,從所述多個(gè)預(yù)設(shè)字段中選取預(yù)設(shè)模型的輸入變量;根據(jù)所述輸入變量以及待處理數(shù)據(jù),從各個(gè)預(yù)設(shè)模型中選取一個(gè)作為篩選模型,并獲取所述篩選模型對(duì)應(yīng)的篩選標(biāo)準(zhǔn);獲取待測(cè)試數(shù)據(jù),所述待測(cè)試數(shù)據(jù)包括待測(cè)試用戶終端手機(jī)號(hào)及所述待測(cè)試用戶終端手機(jī)號(hào)對(duì)應(yīng)的多個(gè)預(yù)設(shè)字段的值;根據(jù)所述篩選標(biāo)準(zhǔn),獲取所述待測(cè)試用戶終端手機(jī)號(hào)分別屬于各個(gè)號(hào)碼類別的概率值;判斷所述待測(cè)試用戶終端手機(jī)號(hào)屬于異常號(hào)碼類別的概率值是否大于預(yù)設(shè)閾值;如果是,確定所述待測(cè)試用戶終端手機(jī)號(hào)為異常號(hào)碼類別,并根據(jù)所述概率值,確定所述待測(cè)試用戶終端手機(jī)號(hào)的監(jiān)控等級(jí)。第二方面,本發(fā)明實(shí)施例提供一種信息處理裝置,所述裝置包括:第一獲取模塊,用于獲取待處理數(shù)據(jù),所述待處理數(shù)據(jù)包括多個(gè)用戶終端手機(jī)號(hào)、所述各個(gè)用戶終端手機(jī)號(hào)分別對(duì)應(yīng)的各個(gè)預(yù)設(shè)字段的值、以及所述用戶終端手機(jī)號(hào)對(duì)應(yīng)的號(hào)碼類別,所述號(hào)碼類別包括普遍號(hào)碼類別或異常號(hào)碼類別;計(jì)算模塊,用于計(jì)算不同號(hào)碼類別下,所述各個(gè)預(yù)設(shè)字段值的分布,根據(jù)所述不同用戶類別下,所述各個(gè)預(yù)設(shè)字段值的分布,從所述多個(gè)預(yù)設(shè)字段中選取預(yù)設(shè)模型的輸入變量;選取模塊,用于根據(jù)所述輸入變量以及待處理數(shù)據(jù),從各個(gè)預(yù)設(shè)模型中選取一個(gè)作為篩選模型,并獲取所述篩選模型對(duì)應(yīng)的篩選標(biāo)準(zhǔn);第二獲取模塊,用于獲取待測(cè)試數(shù)據(jù),所述待測(cè)試數(shù)據(jù)包括待測(cè)試用戶終端手機(jī)號(hào)及所述待測(cè)試用戶終端手機(jī)號(hào)對(duì)應(yīng)的多個(gè)預(yù)設(shè)字段的值;第三獲取模塊,用于根據(jù)所述篩選標(biāo)準(zhǔn),獲取所述待測(cè)試用戶終端手機(jī)號(hào)分別屬于各個(gè)號(hào)碼類別的概率值;判斷模塊,用于判斷所述待測(cè)試用戶終端手機(jī)號(hào)屬于異常號(hào)碼類別的概率值是否大于預(yù)設(shè)閾值;如果是,確定所述待測(cè)試用戶終端手機(jī)號(hào)為異常號(hào)碼類別,并根據(jù)所述概率值,確定所述待測(cè)試用戶終端手機(jī)號(hào)的監(jiān)控等級(jí)。與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例提供的一種信息處理方法及裝置,通過獲取到不同號(hào)碼類別對(duì)應(yīng)的數(shù)據(jù),并根據(jù)所述輸入變量以及待處理數(shù)據(jù),從各個(gè)預(yù)設(shè)模型中選取一個(gè)作為篩選模型,并獲取所述篩選模型對(duì)應(yīng)的篩選標(biāo)準(zhǔn),通過所述篩選標(biāo)準(zhǔn),就能識(shí)別出待測(cè)試用戶終端手機(jī)號(hào)是否為異常號(hào)碼類別,如果是,則可以確定所述待測(cè)試用戶終端手機(jī)號(hào)的監(jiān)控等級(jí)。這種方式,使得監(jiān)控垃圾短信的方式可以不再被動(dòng)的只依賴于客戶舉報(bào),而是可以主動(dòng)的發(fā)現(xiàn)待測(cè)試用戶終端手機(jī)號(hào)是否為異常號(hào)碼類別,并且主動(dòng)進(jìn)行監(jiān)控,提升了垃圾短信監(jiān)控和識(shí)別的能力。為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例,并配合所附附圖,作詳細(xì)說明如下。附圖說明為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,應(yīng)當(dāng)理解,以下附圖僅示出了本發(fā)明的某些實(shí)施例,因此不應(yīng)被看作是對(duì)范圍的限定,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他相關(guān)的附圖。圖1是本發(fā)明實(shí)施例提供的服務(wù)器的方框示意圖。圖2是本發(fā)明實(shí)施例提供的一種信息處理方法的流程圖。圖3是本發(fā)明實(shí)施例提供的一種信息處理方法的部分流程圖。圖4是本發(fā)明實(shí)施例提供的一種信息處理方法的部分流程圖。圖5是本發(fā)明實(shí)施例提供的一種信息處理方法的部分流程圖。圖6是本發(fā)明實(shí)施例提供的一種信息處理裝置的功能模塊示意圖。圖7是本發(fā)明實(shí)施例提供的一種信息處理裝置中計(jì)算模塊的功能模塊示意圖。具體實(shí)施方式下面將結(jié)合本發(fā)明實(shí)施例中附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。通常在此處附圖中描述和示出的本發(fā)明實(shí)施例的組件可以以各種不同的配置來布置和設(shè)計(jì)。因此,以下對(duì)在附圖中提供的本發(fā)明的實(shí)施例的詳細(xì)描述并非旨在限制要求保護(hù)的本發(fā)明的范圍,而是僅僅表示本發(fā)明的選定實(shí)施例?;诒景l(fā)明的實(shí)施例,本領(lǐng)域技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)的前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。應(yīng)注意到:相似的標(biāo)號(hào)和字母在下面的附圖中表示類似項(xiàng),因此,一旦某一項(xiàng)在一個(gè)附圖中被定義,則在隨后的附圖中不需要對(duì)其進(jìn)行進(jìn)一步定義和解釋。同時(shí),在本發(fā)明的描述中,術(shù)語“第一”、“第二”等僅用于區(qū)分描述,而不能理解為指示或暗示相對(duì)重要性或時(shí)間先后。如圖1所示,是所述服務(wù)器200的方框示意圖。所述服務(wù)器200包括信息處理裝置210、存儲(chǔ)器220、存儲(chǔ)控制器230、處理器240。所述存儲(chǔ)器220、存儲(chǔ)控制器230、處理器240各元件相互之間直接或間接地電性連接,以實(shí)現(xiàn)數(shù)據(jù)的傳輸或交互。例如,這些元件相互之間可通過一條或多條通訊總線或信號(hào)線實(shí)現(xiàn)電性連接。所述信息處理裝置210包括至少一個(gè)可以軟件或固件(firmware)的形式存儲(chǔ)于所述存儲(chǔ)器中或固化在所述服務(wù)端200的操作系統(tǒng)(operatingsystem,OS)中的軟件功能模塊。所述處理器240用于執(zhí)行存儲(chǔ)器220中存儲(chǔ)的可執(zhí)行模塊,例如所述信息處理裝置210包括的軟件功能模塊或計(jì)算機(jī)程序。其中,存儲(chǔ)器220可以是,但不限于,隨機(jī)存取存儲(chǔ)器(RandomAccessMemory,RAM),只讀存儲(chǔ)器(ReadOnlyMemory,ROM),可編程只讀存儲(chǔ)器(ProgrammableRead-OnlyMemory,PROM),可擦除只讀存儲(chǔ)器(ErasableProgrammableRead-OnlyMemory,EPROM),電可擦除只讀存儲(chǔ)器(ElectricErasableProgrammableRead-OnlyMemory,EEPROM)等。其中,存儲(chǔ)器220用于存儲(chǔ)程序,所述處理器240在接收到執(zhí)行指令后,執(zhí)行所述程序,前述本發(fā)明實(shí)施例任一實(shí)施例揭示的流過程定義的服務(wù)端所執(zhí)行的方法可以應(yīng)用于處理器中,或者由處理器實(shí)現(xiàn)。處理器240可能是一種集成電路芯片,具有信號(hào)的處理能力。上述的處理器可以是通用處理器,包括中央處理器(CentralProcessingUnit,簡(jiǎn)稱CPU)、網(wǎng)絡(luò)處理器(NetworkProcessor,簡(jiǎn)稱NP)等;還可以是數(shù)字信號(hào)處理器(DSP)、專用集成電路(ASIC)、現(xiàn)成可編程門陣列(FPGA)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件。可以實(shí)現(xiàn)或者執(zhí)行本發(fā)明實(shí)施例中的公開的各方法、步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規(guī)的處理器等??梢岳斫?,圖1所示的結(jié)構(gòu)僅為示意,服務(wù)器200還可包括比圖1中所示更多或者更少的組件,或者具有與圖1所示不同的配置。圖1中所示的各組件可以采用硬件、軟件或其組合實(shí)現(xiàn)。圖2示出了本發(fā)明實(shí)施例提供的一種信息處理方法的流程圖,請(qǐng)參閱圖2,本實(shí)施例描述的是服務(wù)器的處理流程,所述方法包括:步驟S310,獲取待處理數(shù)據(jù),所述待處理數(shù)據(jù)包括多個(gè)用戶終端手機(jī)號(hào)、所述各個(gè)用戶終端手機(jī)號(hào)分別對(duì)應(yīng)的各個(gè)預(yù)設(shè)字段的值、以及所述用戶終端手機(jī)號(hào)對(duì)應(yīng)的號(hào)碼類別,所述號(hào)碼類別包括普遍號(hào)碼類別或異常號(hào)碼類別。其中,所述待處理數(shù)據(jù)的來源可以有很多,例如,可以來源于集團(tuán)公司10086999平臺(tái)中被投訴的垃圾短信發(fā)送者號(hào)碼,也可以來源于省公司華為垃圾短信監(jiān)控系統(tǒng)中被捕獲并確認(rèn)為垃圾短信發(fā)送者的號(hào)碼,將這些號(hào)碼作為異常號(hào)碼類別,可以來源于經(jīng)分系統(tǒng)中隨機(jī)用戶的數(shù)據(jù),將這些號(hào)碼作為普通號(hào)碼類別。當(dāng)然,所述待處理數(shù)據(jù)的來源并不局限于此。預(yù)設(shè)字段的實(shí)施方式也可以有多種,例如,用戶終端手機(jī)號(hào)的位置信息,IMEI信息,上周點(diǎn)對(duì)點(diǎn)短信發(fā)送量,上周點(diǎn)對(duì)點(diǎn)短信接收量,入網(wǎng)時(shí)間,號(hào)碼歸屬城市等等,當(dāng)然,并不局限于此。作為一種實(shí)施方式,步驟S310可以包括:步驟S311,獲取待處理數(shù)據(jù),所述待處理數(shù)據(jù)包括多個(gè)用戶終端手機(jī)號(hào)及所述各個(gè)用戶終端手機(jī)號(hào)分別對(duì)應(yīng)的第一預(yù)設(shè)字段集合中各個(gè)預(yù)設(shè)字段的值。步驟S312,對(duì)所述待處理數(shù)據(jù)進(jìn)行預(yù)處理,分別獲取所述各個(gè)用戶終端手機(jī)號(hào)分別對(duì)應(yīng)的第二預(yù)設(shè)字段集合中各個(gè)預(yù)設(shè)字段的值。所述預(yù)處理可以包括:值檢查,類型轉(zhuǎn)換,列轉(zhuǎn)換,分組,聚集,缺失值處理,孤立點(diǎn)處理等。其中,值檢查,是指初步查看預(yù)設(shè)字段的值是否符合常規(guī),是否有明顯錯(cuò)誤。例如,在一次值檢查中發(fā)現(xiàn)發(fā)送目標(biāo)用戶人數(shù)的值只有0、1和2,明顯值有問題,反饋問題并重新提取數(shù)據(jù)。類型轉(zhuǎn)換,是指數(shù)據(jù)類型的轉(zhuǎn)換,主要是不同的數(shù)據(jù)挖掘算法需要更適合的數(shù)據(jù)類型。例如,將入網(wǎng)時(shí)間轉(zhuǎn)換為網(wǎng)齡,如下表1所示:表1入網(wǎng)時(shí)間網(wǎng)段200909195.9200901216.7201410251.7201507080.1列轉(zhuǎn)換,是指連續(xù)列的轉(zhuǎn)換,典型的轉(zhuǎn)換是把這些數(shù)據(jù)分成不同的分支,如年齡段;分組,是指為減少模型的復(fù)雜性,把許多不同的值(狀態(tài))按分類類別進(jìn)行分組。聚集,即對(duì)數(shù)據(jù)進(jìn)行初步處理,如將2個(gè)字段合成一個(gè)新的字段或?qū)?個(gè)字段的值相除,產(chǎn)生派生列等。例如:將短信發(fā)送量和短信接收量這兩個(gè)字段合成為一個(gè)新的派生列:短信發(fā)送量發(fā)收比,所述短信發(fā)送量發(fā)收比的值為短信發(fā)送量/短信接收量,如下表2所示:表2短信發(fā)送量短信接收量短信發(fā)送量發(fā)收比46202.38361555.3910422247.3615216822.37缺失值處理,是指缺省值處理,如null值自定義解釋或?qū)⑷笔У闹档恼杏涗泟h除,保證數(shù)據(jù)的完整性;孤立點(diǎn)處理,是指孤立點(diǎn)清除,如清除不規(guī)范或者異常的基礎(chǔ)數(shù)據(jù)??梢岳斫獾氖?,所述預(yù)處理過程,既能提高建模的準(zhǔn)確度,又能提高建模的工作效率。步驟S320,計(jì)算不同號(hào)碼類別下,所述各個(gè)預(yù)設(shè)字段值的分布,根據(jù)所述不同用戶類別下,所述各個(gè)預(yù)設(shè)字段值的分布,從所述多個(gè)預(yù)設(shè)字段中選取預(yù)設(shè)模型的輸入變量。其中,所述預(yù)設(shè)模型包括神經(jīng)網(wǎng)絡(luò)算法模塊、決策樹算法模型、邏輯回歸算法模型。進(jìn)一步的是,所述決策樹算法模型包括C5.0算法模型、CHAID算法模型、或QUEST(QuickUnbiasedEfficientStatisticalTree)算法模型。作為一種實(shí)施方法,所述步驟S320可以包括:步驟S321,分別計(jì)算各個(gè)預(yù)設(shè)字段下,不同用戶類別對(duì)應(yīng)的字段值的差異值。作為一種實(shí)施方式,可以通過基本統(tǒng)計(jì)方法,分析異常號(hào)碼類別和普通號(hào)碼類別相對(duì)于某個(gè)預(yù)設(shè)字段的差異性,描述統(tǒng)計(jì)分布檢驗(yàn),觀察是否有顯著差異特征。例如,普通號(hào)碼類別對(duì)“發(fā)送目標(biāo)用戶人數(shù)”這預(yù)設(shè)字段的分布如下表3所示:表3F概率F<=5098.14%50<F<=1001.03%F>1000.83%異常號(hào)碼類別對(duì)“發(fā)送目標(biāo)用戶人數(shù)”這預(yù)設(shè)字段的分布如下表4所示:表4F概率F<=5014.14%50<F<=10030.03%F>10055.83%可以看出,異常號(hào)碼類別和普通號(hào)碼類別相對(duì)于“發(fā)送目標(biāo)用戶人數(shù)”這個(gè)預(yù)設(shè)字段的差異性,因此所述“發(fā)送目標(biāo)用戶人數(shù)”這個(gè)字段在建模時(shí)的重要程度大,即發(fā)送目標(biāo)用戶人數(shù)越大,成為異常號(hào)碼類別的可能性越大。步驟S322,分別計(jì)算各個(gè)字段對(duì)應(yīng)的信息增益。例如,假設(shè)獲取到的號(hào)碼類別的分布及各個(gè)字段的分布如下表所示,其中各個(gè)字段包括:黑名單用戶(S)、發(fā)送目標(biāo)用戶人數(shù)(F)、網(wǎng)齡(W)。根據(jù)以上信息熵介紹里的三大公式計(jì)算各變量的熵,用H表示熵,如下表5至表7所示:表5S數(shù)量概率信息量信息熵是11002315.67%0.370.06否59192584.33%4.073.43合計(jì)701948100.00%4.443.49表6F數(shù)量概率信息量信息熵F<=5068890298.14%3.313.2506650<F<=10072061.03%0.001E-05F>10057860.82%0.009E-06合計(jì)701948100%3.313.25表7W數(shù)量概率信息量信息熵W<=650191971.50%2.481.776<W<=1217408824.80%18.004E+00F>12259413.70%39.561E+00合計(jì)701948100%60.047.70根據(jù)信息熵的公式可以計(jì)算得出:H(S)=3.49;H(F)=3.25;H(W)=7.70。進(jìn)一步的,計(jì)算計(jì)算各個(gè)字段對(duì)應(yīng)的信息增益:(1)預(yù)設(shè)字段“發(fā)送目標(biāo)用戶人數(shù)”對(duì)應(yīng)的信息增益為:Gain(F)=H(S)-H(F)=3.49-3.25=0.24。(2)預(yù)設(shè)字段“網(wǎng)齡”對(duì)應(yīng)的信息增益為:Gain(W)=H(S)-H(W)=3.49-7.70=-4.21。步驟S323,根據(jù)所述差異值以及所述信息增益,從所述多個(gè)預(yù)設(shè)字段中選取預(yù)設(shè)模型的輸入變量。接上例,比較各增益結(jié)果:Gain(F)>Gain(X)。若此時(shí)只選擇一個(gè)預(yù)設(shè)字段,則選擇預(yù)設(shè)字段“發(fā)送目標(biāo)用戶人數(shù)”??梢岳斫獾氖牵鰧?shí)施方式,主要從兩個(gè)方面確定輸入變量,一是基本的統(tǒng)計(jì)分析,分析異常號(hào)碼類別和普通號(hào)碼類別相對(duì)于某個(gè)預(yù)設(shè)字段的差異性,從而判定所述預(yù)設(shè)字段作用的重要程度;二是數(shù)據(jù)挖掘中信息熵的計(jì)算,根據(jù)各變量信息熵的增益對(duì)比,確定所述預(yù)設(shè)字段作用的重要性;最后綜合2個(gè)方面的分析結(jié)果,確定建模所需的輸入變量。步驟S330,根據(jù)所述輸入變量以及待處理數(shù)據(jù),從各個(gè)預(yù)設(shè)模型中選取一個(gè)作為篩選模型,并獲取所述篩選模型對(duì)應(yīng)的篩選標(biāo)準(zhǔn)。優(yōu)選的,在步驟S330之后,所述方法還可以包括:步驟S331,獲取待驗(yàn)證數(shù)據(jù),所述待驗(yàn)證數(shù)據(jù)包括多個(gè)用戶終端手機(jī)號(hào)、所述各個(gè)用戶終端手機(jī)號(hào)分別對(duì)應(yīng)的各個(gè)預(yù)設(shè)字段的值、以及所述用戶終端手機(jī)號(hào)對(duì)應(yīng)的號(hào)碼類別。步驟S332,根據(jù)所述篩選標(biāo)準(zhǔn),分別確定所述待驗(yàn)證數(shù)據(jù)中各個(gè)用戶終端手機(jī)號(hào)的預(yù)測(cè)號(hào)碼類別。步驟S333,根據(jù)所述預(yù)測(cè)號(hào)碼類別與獲取到的待驗(yàn)證數(shù)據(jù)中的用戶終端手機(jī)號(hào)碼的號(hào)碼類別,計(jì)算預(yù)測(cè)的準(zhǔn)確率及召回率。步驟S334,當(dāng)所述準(zhǔn)確率小于第一預(yù)設(shè)閾值或所述召回率小于第二預(yù)設(shè)閾值時(shí),重新從所述多個(gè)預(yù)設(shè)字段中選取預(yù)設(shè)模型的輸入變量。步驟S335,根據(jù)重新確定的輸入變量以及待處理數(shù)據(jù),從各個(gè)預(yù)設(shè)模型中選取一個(gè)作為篩選模型,并獲取所述篩選模型對(duì)應(yīng)的篩選標(biāo)準(zhǔn)。例如:假設(shè)根據(jù)待處理數(shù)據(jù)得出的篩選標(biāo)準(zhǔn)為:發(fā)送目標(biāo)用戶人數(shù)>15and信用等級(jí)<=2and短信發(fā)送量>85.根據(jù)所述預(yù)測(cè)號(hào)碼類別與獲取到的待驗(yàn)證數(shù)據(jù)中的用戶終端手機(jī)號(hào)碼的號(hào)碼類別,計(jì)算得出預(yù)測(cè)的準(zhǔn)確率為31%,如下表8所示,假設(shè)第一預(yù)設(shè)閾值為90%,此時(shí),所述準(zhǔn)確率小于第一預(yù)設(shè)閾值,準(zhǔn)確率偏低,說明篩選模型可靠性低,需優(yōu)化。表8總記錄數(shù)符合條件的記錄數(shù)準(zhǔn)確率1074453330831%當(dāng)所述準(zhǔn)確率小于第一預(yù)設(shè)閾值或所述召回率小于第二預(yù)設(shè)閾值時(shí)時(shí),需重新回到建模過程,重新建模、訓(xùn)練,得出新的模型,輸出更合理的篩選標(biāo)準(zhǔn)。當(dāng)篩選標(biāo)準(zhǔn)確定后,可以用來判斷待測(cè)試用戶終端手機(jī)號(hào)是否為異常號(hào)碼。步驟S340,獲取待測(cè)試數(shù)據(jù),所述待測(cè)試數(shù)據(jù)包括待測(cè)試用戶終端手機(jī)號(hào)及所述待測(cè)試用戶終端手機(jī)號(hào)對(duì)應(yīng)的多個(gè)預(yù)設(shè)字段的值。步驟S350,根據(jù)所述篩選標(biāo)準(zhǔn),獲取所述待測(cè)試用戶終端手機(jī)號(hào)分別屬于各個(gè)號(hào)碼類別的概率值。步驟S360,判斷所述待測(cè)試用戶終端手機(jī)號(hào)屬于異常號(hào)碼類別的概率值是否大于預(yù)設(shè)閾值。步驟S370,如果是,確定所述待測(cè)試用戶終端手機(jī)號(hào)為異常號(hào)碼類別,并根據(jù)所述概率值,確定所述待測(cè)試用戶終端手機(jī)號(hào)的監(jiān)控等級(jí)。優(yōu)選的,也可以將所述概率值或者所述監(jiān)控等級(jí)發(fā)送到用戶終端,以使用戶終端可以根據(jù)所述概率值或者所述監(jiān)控等級(jí)確定進(jìn)一步用于指導(dǎo)垃圾短信政治的策略。本發(fā)明實(shí)施例提供的信息處理方法,通過獲取到不同號(hào)碼類別對(duì)應(yīng)的數(shù)據(jù),并根據(jù)所述輸入變量以及待處理數(shù)據(jù),從各個(gè)預(yù)設(shè)模型中選取一個(gè)作為篩選模型,并獲取所述篩選模型對(duì)應(yīng)的篩選標(biāo)準(zhǔn),通過所述篩選標(biāo)準(zhǔn),就能識(shí)別出待測(cè)試用戶終端手機(jī)號(hào)是否為異常號(hào)碼類別,如果是,則可以確定所述待測(cè)試用戶終端手機(jī)號(hào)的監(jiān)控等級(jí)。這種方式,使得監(jiān)控垃圾短信的方式可以不再被動(dòng)的只依賴于客戶舉報(bào),而是可以主動(dòng)的發(fā)現(xiàn)待測(cè)試用戶終端手機(jī)號(hào)是否為異常號(hào)碼類別,并且主動(dòng)進(jìn)行監(jiān)控,提升了垃圾短信監(jiān)控和識(shí)別的能力。請(qǐng)參閱圖6,是本發(fā)明實(shí)施例提供的圖1所示的信息處理裝置210的功能模塊示意圖。所述信息處理裝置210運(yùn)行于所述服務(wù)器200。所述信息處理裝置210包括第一獲取模塊211、計(jì)算模塊212、選取模塊213、第二獲取模塊214、第三獲取模塊215以及判斷模塊216。所述第一獲取模塊211,用于獲取待處理數(shù)據(jù),所述待處理數(shù)據(jù)包括多個(gè)用戶終端手機(jī)號(hào)、所述各個(gè)用戶終端手機(jī)號(hào)分別對(duì)應(yīng)的各個(gè)預(yù)設(shè)字段的值、以及所述用戶終端手機(jī)號(hào)對(duì)應(yīng)的號(hào)碼類別,所述號(hào)碼類別包括普遍號(hào)碼類別或異常號(hào)碼類別。優(yōu)選的,所述第一獲取模塊211,具體用于獲取待處理數(shù)據(jù),所述待處理數(shù)據(jù)包括多個(gè)用戶終端手機(jī)號(hào)及所述各個(gè)用戶終端手機(jī)號(hào)分別對(duì)應(yīng)的第一預(yù)設(shè)字段集合中各個(gè)預(yù)設(shè)字段的值;對(duì)所述待處理數(shù)據(jù)進(jìn)行預(yù)處理,分別獲取所述各個(gè)用戶終端手機(jī)號(hào)分別對(duì)應(yīng)的第二預(yù)設(shè)字段集合中各個(gè)預(yù)設(shè)字段的值。所述計(jì)算模塊212,用于計(jì)算不同號(hào)碼類別下,所述各個(gè)預(yù)設(shè)字段值的分布,根據(jù)所述不同用戶類別下,所述各個(gè)預(yù)設(shè)字段值的分布,從所述多個(gè)預(yù)設(shè)字段中選取預(yù)設(shè)模型的輸入變量。所述選取模塊213,用于根據(jù)所述輸入變量以及待處理數(shù)據(jù),從各個(gè)預(yù)設(shè)模型中選取一個(gè)作為篩選模型,并獲取所述篩選模型對(duì)應(yīng)的篩選標(biāo)準(zhǔn)。其中,所述預(yù)設(shè)模型包括神經(jīng)網(wǎng)絡(luò)算法模塊、決策樹算法模型、邏輯回歸算法模型。所述第二獲取模塊214,用于獲取待測(cè)試數(shù)據(jù),所述待測(cè)試數(shù)據(jù)包括待測(cè)試用戶終端手機(jī)號(hào)及所述待測(cè)試用戶終端手機(jī)號(hào)對(duì)應(yīng)的多個(gè)預(yù)設(shè)字段的值。所述第三獲取模塊215,用于根據(jù)所述篩選標(biāo)準(zhǔn),獲取所述待測(cè)試用戶終端手機(jī)號(hào)分別屬于各個(gè)號(hào)碼類別的概率值。所述判斷模塊216,用于判斷所述待測(cè)試用戶終端手機(jī)號(hào)屬于異常號(hào)碼類別的概率值是否大于預(yù)設(shè)閾值;如果是,確定所述待測(cè)試用戶終端手機(jī)號(hào)為異常號(hào)碼類別,并根據(jù)所述概率值,確定所述待測(cè)試用戶終端手機(jī)號(hào)的監(jiān)控等級(jí)。優(yōu)選的,所述裝置還包括優(yōu)化模塊216,用于獲取待驗(yàn)證數(shù)據(jù),所述待驗(yàn)證數(shù)據(jù)包括多個(gè)用戶終端手機(jī)號(hào)、所述各個(gè)用戶終端手機(jī)號(hào)分別對(duì)應(yīng)的各個(gè)預(yù)設(shè)字段的值、以及所述用戶終端手機(jī)號(hào)對(duì)應(yīng)的號(hào)碼類別;根據(jù)所述篩選標(biāo)準(zhǔn),分別確定所述待驗(yàn)證數(shù)據(jù)中各個(gè)用戶終端手機(jī)號(hào)的預(yù)測(cè)號(hào)碼類別;根據(jù)所述預(yù)測(cè)號(hào)碼類別與獲取到的待驗(yàn)證數(shù)據(jù)中的用戶終端手機(jī)號(hào)碼的號(hào)碼類別,計(jì)算預(yù)測(cè)的準(zhǔn)確率及召回率;當(dāng)所述準(zhǔn)確率小于第一預(yù)設(shè)閾值或所述召回率小于第二預(yù)設(shè)閾值時(shí),重新從所述多個(gè)預(yù)設(shè)字段中選取預(yù)設(shè)模型的輸入變量;根據(jù)重新確定的輸入變量以及待處理數(shù)據(jù),從各個(gè)預(yù)設(shè)模型中選取一個(gè)作為篩選模型,并獲取所述篩選模型對(duì)應(yīng)的篩選標(biāo)準(zhǔn)。請(qǐng)參閱圖7,是本發(fā)明實(shí)施例提供的圖1所示的信息處理裝置210中計(jì)算模塊212的功能模塊示意圖。所述計(jì)算模塊212包括第一計(jì)算子模塊2121,第二計(jì)算子模塊2122以及處理模塊2123。所述第一計(jì)算子模塊2121,用于分別計(jì)算各個(gè)預(yù)設(shè)字段下,不同用戶類別對(duì)應(yīng)的字段值的差異值;所述第二計(jì)算子模塊2122,用于分別計(jì)算各個(gè)字段對(duì)應(yīng)的信息增益;所述處理模塊2123,用于根據(jù)所述差異值以及所述信息增益,從所述多個(gè)預(yù)設(shè)字段中選取預(yù)設(shè)模型的輸入變量。以上各模塊可以是由軟件代碼實(shí)現(xiàn),此時(shí),上述的各模塊可存儲(chǔ)于中間服務(wù)器200的存儲(chǔ)器220內(nèi)。以上各模塊同樣可以由硬件例如集成電路芯片實(shí)現(xiàn)。需要說明的是,本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部分互相參見即可。本發(fā)明實(shí)施例所提供的信息處理裝置,其實(shí)現(xiàn)原理及產(chǎn)生的技術(shù)效果和前述方法實(shí)施例相同,為簡(jiǎn)要描述,裝置實(shí)施例部分未提及之處,可參考前述方法實(shí)施例中相應(yīng)內(nèi)容。在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的裝置和方法,也可以通過其它的方式實(shí)現(xiàn)。以上所描述的裝置實(shí)施例僅僅是示意性的,例如,附圖中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個(gè)實(shí)施例的裝置、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代表一個(gè)模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)方式中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)連續(xù)的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或動(dòng)作的專用的基于硬件的系統(tǒng)來實(shí)現(xiàn),或者可以用專用硬件與計(jì)算機(jī)指令的組合來實(shí)現(xiàn)。另外,在本發(fā)明各個(gè)實(shí)施例中的各功能模塊可以集成在一起形成一個(gè)獨(dú)立的部分,也可以是各個(gè)模塊單獨(dú)存在,也可以兩個(gè)或兩個(gè)以上模塊集成形成一個(gè)獨(dú)立的部分。所述功能如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)端,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、移動(dòng)硬盤、只讀存儲(chǔ)器(ROM,Read-OnlyMemory)、隨機(jī)存取存儲(chǔ)器(RAM,RandomAccessMemory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技術(shù)人員來說,本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。應(yīng)注意到:相似的標(biāo)號(hào)和字母在下面的附圖中表示類似項(xiàng),因此,一旦某一項(xiàng)在一個(gè)附圖中被定義,則在隨后的附圖中不需要對(duì)其進(jìn)行進(jìn)一步定義和解釋。以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本
技術(shù)領(lǐng)域
的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)所述以權(quán)利要求的保護(hù)范圍為準(zhǔn)。當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1