所有短信領(lǐng)域中每一短 信領(lǐng)域?qū)?yīng)的短信模板集合確定分類器的訓(xùn)練數(shù)據(jù)集;
[0184] 第三確定模塊73,被配置為根據(jù)在設(shè)定時(shí)間段內(nèi)統(tǒng)計(jì)到的每一短信領(lǐng)域?qū)?yīng)的短 信模板集合中的每一短信模板各自對應(yīng)的頻次確定每一短信模板對應(yīng)的用于訓(xùn)練所述分 類器次數(shù);
[0185] 訓(xùn)練模塊74,被配置為通過第二確定模塊72確定的訓(xùn)練數(shù)據(jù)集以及第三確定模 塊74確定的短信模板集合中的每一短信模板對應(yīng)的用于訓(xùn)練分類器的次數(shù)分類器,分類 器用于得到相應(yīng)短信領(lǐng)域?qū)?yīng)的分類結(jié)果。
[0186] 圖8是根據(jù)一示例性實(shí)施例示出的另一種短信領(lǐng)域分類裝置的框圖,如圖8所示, 在上述圖7所示實(shí)施例的基礎(chǔ)上,在一實(shí)施例中,第二確定模塊72可包括:
[0187] 第一確定子模塊721,被配置為確定所有短信領(lǐng)域中的每一短信模板與每一短信 領(lǐng)域的第一映射集合,第一映射集合為所有短信模板中的每一短信模板、每一短信模板在 設(shè)定時(shí)間段內(nèi)統(tǒng)計(jì)到的頻次與每一短信領(lǐng)域的對應(yīng)關(guān)系;
[0188] 第二確定子模塊722,被配置為確定第一確定子模塊721確定的第一映射集合中 的每一短信模板中的關(guān)鍵字集合;
[0189] 標(biāo)注子模塊723,被配置為標(biāo)注第二確定子模塊722確定的每一短信模板中的關(guān) 鍵字集合,得到第二映射集合,第二映射集合為所有短信模板中的每一短信模板中的關(guān)鍵 字集合、每一短信模板在設(shè)定時(shí)間段內(nèi)統(tǒng)計(jì)到的頻次與每一短信領(lǐng)域的對應(yīng)關(guān)系,將第二 映射集合作為訓(xùn)練數(shù)據(jù)集。
[0190] 在一實(shí)施例中,裝置還可包括:
[0191] 第四確定模塊75,被配置為確定所有短信領(lǐng)域中每一短信領(lǐng)域?qū)?yīng)的號碼集合;
[0192] 第五確定模塊76,被配置為確定第四確定模塊75確定的每一短信領(lǐng)域?qū)?yīng)的號 碼集合對應(yīng)的頻繁前綴集合和頻繁后綴集合;
[0193] 第六確定模塊77,被配置為確定第五確定模塊76確定的頻繁前綴集合與所有短 信領(lǐng)域中每一短信領(lǐng)域的第三映射集合,以及確定頻繁后綴集合與所有短信領(lǐng)域中每一短 信領(lǐng)域的第四映射集合,其中,第三映射集合和第四映射集合用于基于待分類短信的發(fā)送 方號碼確定待分類短信的候選短信領(lǐng)域,以便根據(jù)候選短信領(lǐng)域?qū)?yīng)的分類器得到待分類 短信的分類結(jié)果。
[0194] 在一實(shí)施例中,第五確定模塊76可包括:
[0195] 第三確定子模塊761,被配置為確定每一短信領(lǐng)域?qū)?yīng)的號碼集合中的每一發(fā)送 方號碼的前綴和每一發(fā)送方號碼的后綴;
[0196] 統(tǒng)計(jì)子模塊762,被配置為統(tǒng)計(jì)第三確定子模塊761確定的號碼集合中的每一個(gè) 前綴出現(xiàn)的第一次數(shù)和號碼集合中的每一個(gè)后綴出現(xiàn)的第二次數(shù);
[0197] 第四確定子模塊763,被配置為將統(tǒng)計(jì)子模塊762統(tǒng)計(jì)到的第一次數(shù)大于第一設(shè) 定閾值的前綴確定為每一短信領(lǐng)域?qū)?yīng)的號碼集合對應(yīng)的頻繁前綴集合,將統(tǒng)計(jì)子模塊 762統(tǒng)計(jì)到的第二次數(shù)大于第二設(shè)定閾值的后綴確定為每一短信領(lǐng)域?qū)?yīng)的號碼集合對應(yīng) 的頻繁后綴集合。
[0198] 在一實(shí)施例中,裝置還可包括:
[0199] 發(fā)送模塊78,被配置為將訓(xùn)練模塊74訓(xùn)練后的分類器、第六確定模塊77確定的第 三映射集合和第四映射集合發(fā)送給移動終端,以使移動終端根據(jù)第三映射集合、第四映射 集合、分類器得到短信所屬的短信領(lǐng)域。
[0200] 圖9是根據(jù)一示例性實(shí)施例示出的一種短信領(lǐng)域識別裝置的框圖,可以應(yīng)用在移 動終端上,如圖9所示,短信領(lǐng)域識別裝置包括:
[0201] 第七確定模塊91,被配置為在短信應(yīng)用程序接收到短信后,根據(jù)短信的發(fā)送方號 碼確定短信對應(yīng)的短信領(lǐng)域集合;
[0202] 統(tǒng)計(jì)模塊92,被配置為如果第七確定模塊91確定的短信領(lǐng)域集合包括兩個(gè)以上 的短信領(lǐng)域,通過分類器對短信的內(nèi)容進(jìn)行概率統(tǒng)計(jì),得到兩個(gè)以上的統(tǒng)計(jì)結(jié)果;
[0203] 第八確定模塊93,被配置為將統(tǒng)計(jì)模塊92統(tǒng)計(jì)得到的兩個(gè)以上的統(tǒng)計(jì)結(jié)果中的 最大值對應(yīng)的短信領(lǐng)域確定為短信所屬的短信領(lǐng)域。
[0204] 圖10是根據(jù)一示例性實(shí)施例示出的另一種短信領(lǐng)域識別裝置的框圖,可以應(yīng)用 在移動終端上,如圖10所示,在上述圖9所示實(shí)施例的基礎(chǔ)上,在一實(shí)施例中,第七確定模 塊91可包括:
[0205] 第五確定子模塊911,被配置為確定短信的發(fā)送方號碼的前綴和后綴;
[0206] 查詢子模塊912,被配置為分別在第三映射集合和第四映射集合查詢第五確定子 模塊911確定的前綴和后綴,得到前綴和后綴分別對應(yīng)的第一領(lǐng)域集合和第二領(lǐng)域集合, 其中,第三映射集合和第四映射集合分別用于表示發(fā)送方號碼的前綴與短信領(lǐng)域的第一對 應(yīng)關(guān)系和發(fā)送方號碼的后綴與短信領(lǐng)域的第二對應(yīng)關(guān)系;
[0207] 第六確定子模塊913,被配置為通過查詢子模塊912得到的第一領(lǐng)域集合和第二 領(lǐng)域集合確定短信所屬的短信領(lǐng)域集合。
[0208] 在一實(shí)施例中,裝置還可包括:
[0209] 第九確定模塊94,被配置為如果第七確定模塊91確定的短信領(lǐng)域集合包括一個(gè) 短信領(lǐng)域,將短信領(lǐng)域集合所包括的該短信領(lǐng)域確定為短信所屬的短信領(lǐng)域。
[0210] 關(guān)于上述實(shí)施例中的裝置,其中各個(gè)模塊執(zhí)行操作的具體方式已經(jīng)在有關(guān)該方法 的實(shí)施例中進(jìn)行了詳細(xì)描述,此處將不做詳細(xì)闡述說明。
[0211] 圖11是根據(jù)一示例性實(shí)施例示出的一種適用于用于短信領(lǐng)域分類的裝置的框 圖。例如,裝置1100可以被提供為一服務(wù)器。參照圖11裝置1100包括處理組件1122,其 進(jìn)一步包括一個(gè)或多個(gè)處理器,以及由存儲器1132所代表的存儲器資源,用于存儲可由處 理部件1122的執(zhí)行的指令,例如應(yīng)用程序。存儲器1132中存儲的應(yīng)用程序可以包括一個(gè) 或一個(gè)以上的每一個(gè)對應(yīng)于一組指令的模塊。此外,處理組件1122被配置為執(zhí)行指令,以 執(zhí)行上述用于短信領(lǐng)域分類的方法。
[0212] 裝置1100還可以包括一個(gè)電源組件1126被配置為執(zhí)行裝置1100的電源管理,一 個(gè)有線或無線網(wǎng)絡(luò)接口 1150被配置為將裝置1100連接到網(wǎng)絡(luò),和一個(gè)輸入輸出(I/O)接 口 1158。裝置1100可以操作基于存儲在存儲器1132的操作系統(tǒng),例如Windows ServerTM, Mac OS XTM,UnixTM,LinuxTM,F(xiàn)reeBSDTM 或類似。
[0213] 在示例性實(shí)施例中,還提供了一種包括指令的非臨時(shí)性計(jì)算機(jī)可讀存儲介質(zhì),例 如包括指令的存儲器1132,上述指令可由裝置1100的處理組件1122執(zhí)行以完成上述方 法。例如,所述非臨時(shí)性計(jì)算機(jī)可讀存儲介質(zhì)可以是R0M、隨機(jī)存取存儲器(RAM)、CD-ROM、 磁帶、軟盤和光數(shù)據(jù)存儲設(shè)備等。
[0214] 圖12是根據(jù)一示例性實(shí)施例示出的一種適用于短信領(lǐng)域識別裝置的框圖。例如, 裝置1200可以是移動電話,計(jì)算機(jī),數(shù)字廣播終端,消息收發(fā)設(shè)備,游戲控制臺,平板設(shè)備, 醫(yī)療設(shè)備,健身設(shè)備,個(gè)人數(shù)字助理等。
[0215] 參照圖12,裝置1200可以包括以下一個(gè)或多個(gè)組件:處理組件1202,存儲器 1204,電源組件1206,多媒體組件1208,音頻組件1210,輸入/輸出(I/O)的接口 1210,傳 感器組件1214,以及通信組件1216。
[0216] 處理組件1202通??刂蒲b置1200的整體操作,諸如與顯示,電話呼叫,數(shù)據(jù)通信, 相機(jī)操作和記錄操作相關(guān)聯(lián)的操作。處理元件1202可以包括一個(gè)或多個(gè)處理器1220來執(zhí) 行指令,以完成上述的方法的全部或部分步驟。此外,處理組件1202可以包括一個(gè)或多個(gè) 模塊,便于處理組件1202和其他組件之間的交互。例如,處理部件1202可以包括多媒體模 塊,以方便多媒體組件1208和處理組件1202之間的交互。
[0217] 存儲器1204被配置為存儲各種類型的數(shù)據(jù)以支持在設(shè)備1200的操作。這些數(shù)據(jù) 的示例包括用于在裝置1200上操作的任何應(yīng)用程序或方法的指令,聯(lián)系人數(shù)據(jù),電話簿數(shù) 據(jù),消息,圖片,視頻等。存儲器1204可以由任何類型的易失性或非易失性存儲設(shè)備或者它 們的組合實(shí)現(xiàn),如靜態(tài)隨機(jī)存取存儲器(SRAM),電可擦除可編程只讀存儲器(EEPROM),可 擦除可編程只讀存儲器(EPROM),可編程只讀存儲器(PROM),只讀存儲器(R0M),磁存儲器, 快閃存儲器,磁盤或光盤。
[0218] 電力組件1206為裝置1200的各種組件提供電力。電力組件1206可以包括電源 管理系統(tǒng),一個(gè)或多個(gè)電源,及其他與為裝置1200生成、管理和分配電力相關(guān)聯(lián)的組件。
[0219] 多媒體組件1208包括在所述裝置1200和用戶之間的提供一個(gè)輸出接口的屏幕。 在一些實(shí)施例中,屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面 板,屏幕可以被實(shí)現(xiàn)為觸摸屏,以接收來自用戶的輸入信號。觸摸面板包括一個(gè)或多個(gè)觸摸 傳感器以感測觸摸、滑動和觸摸面板上的手勢。所述觸摸傳感器可以不僅感測觸摸或滑動 動作的邊界,而且還檢測與所述觸摸或滑動操作相關(guān)的持續(xù)時(shí)間和壓力。在一些實(shí)施例中, 多媒體組件1208包括一個(gè)前置攝像頭和/或后置攝像頭。當(dāng)設(shè)備1200處于操作模式,如 拍攝模式或視頻模式時(shí),前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個(gè) 前置攝像頭和后置攝像頭可以是一個(gè)固定的光學(xué)透鏡系統(tǒng)或具有焦距和光學(xué)變焦能力。
[0220] 音頻組件1210被配置為輸出和/或輸入音頻信號。例如,音頻組件1210包括一 個(gè)麥克風(fēng)(MIC),當(dāng)裝置1200處于操作模式,如呼叫模式、記錄模式和語音識別模式時(shí),麥 克風(fēng)被配置為接收外部音頻信號。所接收的音頻信號可以被進(jìn)一步存儲在存儲器1204或 經(jīng)由通信組件1216發(fā)送。在一些實(shí)施例中,音頻組件1210還包括一個(gè)揚(yáng)聲器,用于輸出音 頻信號。
[0221] I/0接口 1210為處理組件1202和外圍接口模塊之間提供接口,上述外圍接口模塊 可以是鍵盤,點(diǎn)擊輪,按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動按鈕和 鎖定按鈕。
[0222] 傳感器組件1214包括一個(gè)或多個(gè)傳感器,用于為裝置1200提供各個(gè)方面的狀態(tài) 評估。例如,傳感器組件1214可以檢測到設(shè)備1200的打開/關(guān)閉狀態(tài),組件的相對定位, 例如所述組件為裝置1200的顯示器和小鍵盤,傳感器組件1214還可以檢測裝置1200或裝 置1200 -個(gè)組件的位置改變,用戶與裝置1200接觸的存在或不存在,裝置1200方位或加 速/減速和裝置1200的溫度變化。傳感器組件1214可以包括接近傳感器,被配置用來在 沒有任何的物理接觸時(shí)檢測附近物體的存在。傳感器組件1214還可以包括光傳感器,如 CMOS或C⑶圖像傳感器,用于在成像應(yīng)用中使用。在一些實(shí)施例中,該傳感器組件1214還 可以包括加速度傳感器,陀螺儀傳感器,磁傳感器,壓力傳感器或溫度傳感器。
[0223] 通信組件1216被配置為便于裝置1200和其他設(shè)備之間有線或無線方式的通信。 裝置1200可以接入基于通信標(biāo)準(zhǔn)的無線網(wǎng)絡(luò),如WiFi,2G或3G,或它們的組合。在一個(gè)示 例性實(shí)施例中,通信部件1216經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣 播相關(guān)信息。在一個(gè)示例性實(shí)施例中,所述通信部件1216還包括近場通信(NFC)模塊,以促 進(jìn)短程通信。例如,在NFC模塊可基于射頻識別(RFID)技術(shù),紅外數(shù)據(jù)協(xié)會(IrDA)技術(shù), 超寬帶(UWB)技術(shù),藍(lán)牙(BT)技術(shù)和其他技術(shù)來實(shí)現(xiàn)。
[0224] 在示例性實(shí)施例中,裝置1200可以被一個(gè)或多個(gè)應(yīng)用專用集成電路(ASIC)、數(shù)字 信號處理器(DSP)、數(shù)字信號處理設(shè)備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列 (FPGA)、控制器、微控制器、微處理器或其他電子元件實(shí)現(xiàn),用于執(zhí)行上述方法。
[0225] 在示例性實(shí)施例中,還提供了一種包括指令的非臨