亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

模板構(gòu)建方法和裝置、信息識別方法和裝置的制造方法_5

文檔序號:9727302閱讀:來源:國知局
0是根據(jù)一示例性實(shí)施例示出的一種模板構(gòu)建裝置1000的框圖。例如,裝置1000可以被提供為一服務(wù)器等。參照圖10,裝置1000包括處理組件1022,其進(jìn)一步包括一個(gè)或多個(gè)處理器,以及由存儲器1032所代表的存儲器資源,用于存儲可由處理部件1022的執(zhí)行的指令,例如應(yīng)用程序。存儲器1032中存儲的應(yīng)用程序可以包括一個(gè)或一個(gè)以上的每一個(gè)對應(yīng)于一組指令的模塊。此外,處理組件1022被配置為執(zhí)行指令,以執(zhí)行本公開的模板構(gòu)建方法。
[0168]裝置1000還可以包括一個(gè)電源組件1026被配置為執(zhí)行裝置1000的電源管理,一個(gè)有線或無線網(wǎng)絡(luò)接口 1050被配置為將裝置1000連接到網(wǎng)絡(luò),和一個(gè)輸入輸出(I/O)接口1058。裝置1000可以操作基于存儲在存儲器1032的操作系統(tǒng),例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,F(xiàn)reeBSDTM或類似。
[0169]本領(lǐng)域技術(shù)人員在考慮說明書及實(shí)踐這里公開的發(fā)明后,將容易想到本公開的其它實(shí)施方案。本申請旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識或慣用技術(shù)手段。說明書和實(shí)施例僅被視為示例性的,本公開的真正范圍和精神由下面的權(quán)利要求指出。
[0170]應(yīng)當(dāng)理解的是,本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求來限制。
【主權(quán)項(xiàng)】
1.一種模板構(gòu)建方法,其特征在于,所述方法包括: 獲取原始信息樣本集,所述原始信息樣本集包括至少一條預(yù)設(shè)類別的原始信息; 在所述原始信息中包括預(yù)設(shè)關(guān)鍵詞時(shí),根據(jù)預(yù)設(shè)關(guān)鍵詞集合對所述預(yù)設(shè)關(guān)鍵詞進(jìn)行標(biāo)注,得到樣本訓(xùn)練集; 對所述樣本訓(xùn)練集中的包括所述預(yù)設(shè)關(guān)鍵詞的分句進(jìn)行分詞,得到若干個(gè)詞語; 從所述若干個(gè)詞語中提取出指定特征集合,所述指定特征集合包括至少一個(gè)特征詞; 根據(jù)所述預(yù)設(shè)關(guān)鍵詞和所述指定特征集合中的所述特征詞構(gòu)建所述模板; 根據(jù)所述樣本訓(xùn)練集中的標(biāo)注結(jié)果對所述模板進(jìn)行訓(xùn)練。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從所述若干個(gè)詞語中提取出指定特征集合,包括以下兩個(gè)步驟中的其中一個(gè): 根據(jù)卡方檢驗(yàn)從所述若干個(gè)詞語中提取出所述指定特征集合;或 根據(jù)信息增益從所述若干個(gè)詞語中提取出所述指定特征集合。3.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述預(yù)設(shè)關(guān)鍵詞和所述指定特征集合中的所述特征詞構(gòu)建所述模板,包括: 將所述指定特征集合中的所述特征詞和所述預(yù)設(shè)關(guān)鍵詞構(gòu)建樸素貝葉斯分類器,各個(gè)特征詞在所述樸素貝葉斯分類器中互相獨(dú)立。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述樣本訓(xùn)練集中的標(biāo)注結(jié)果對所述模板進(jìn)行訓(xùn)練,包括: 對于所述樸素貝葉斯分類器中的每個(gè)所述特征詞,根據(jù)所述樣本訓(xùn)練集中的標(biāo)注結(jié)果,統(tǒng)計(jì)出攜帶有所述特征詞和所述預(yù)設(shè)關(guān)鍵詞的分句為第一分句的數(shù)量; 根據(jù)各個(gè)所述特征詞、所述預(yù)設(shè)關(guān)鍵詞和所述數(shù)量,得到訓(xùn)練后的所述樸素貝葉斯分類器。5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述在所述原始信息中包括預(yù)設(shè)關(guān)鍵詞時(shí),根據(jù)預(yù)設(shè)關(guān)鍵詞集合對所述預(yù)設(shè)關(guān)鍵詞進(jìn)行標(biāo)注,得到樣本訓(xùn)練集,包括: 在所述原始信息中包括數(shù)字信息時(shí),根據(jù)預(yù)設(shè)關(guān)鍵詞集合對所述數(shù)字信息進(jìn)行標(biāo)注,得到樣本訓(xùn)練集,其中,所述預(yù)設(shè)關(guān)鍵詞集合包括指示所述數(shù)字信息的屬性的信息。6.一種信息識別方法,其特征在于,所述方法包括: 獲取待識別的目標(biāo)信息中的至少一個(gè)分句,所述分句中包括預(yù)設(shè)關(guān)鍵詞; 對所述分句進(jìn)行分詞得到若干個(gè)詞語,并從所述若干個(gè)詞語中提取出指定特征集合,所述指定特征集合包括至少一個(gè)特征詞; 根據(jù)所述預(yù)設(shè)關(guān)鍵詞、特征詞以及預(yù)先構(gòu)建的模板,識別所述分句中的預(yù)設(shè)關(guān)鍵詞的標(biāo)注結(jié)果。7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述方法還包括: 若識別的標(biāo)注結(jié)果是預(yù)設(shè)標(biāo)注結(jié)果的分句的數(shù)量為多個(gè),則將識別概率最大的分句中的預(yù)設(shè)關(guān)鍵詞作為預(yù)設(shè)標(biāo)注結(jié)果的信息。8.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述從所述若干個(gè)詞語中提取出指定特征集合,包括以下兩個(gè)步驟中的其中一個(gè): 根據(jù)卡方檢驗(yàn)從所述若干個(gè)詞語中提取出所述指定特征集合;或 根據(jù)信息增益從所述若干個(gè)詞語中提取出所述指定特征集合。9.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述預(yù)設(shè)關(guān)鍵詞為數(shù)字信息,所述標(biāo)注結(jié)果為所述數(shù)字信息的屬性。10.一種模板構(gòu)建裝置,其特征在于,所述裝置包括: 樣本獲取模塊,用于獲取原始信息樣本集,所述原始信息樣本集包括至少一條預(yù)設(shè)類別的原始信息; 樣本處理模塊,用于在所述原始信息中包括預(yù)設(shè)關(guān)鍵詞時(shí),根據(jù)預(yù)設(shè)關(guān)鍵詞集合對所述預(yù)設(shè)關(guān)鍵詞進(jìn)行標(biāo)注,得到樣本訓(xùn)練集; 分詞處理模塊,用于對所述樣本訓(xùn)練集中的包括所述預(yù)設(shè)關(guān)鍵詞的分句進(jìn)行分詞,得到若干個(gè)詞語; 特征提取模塊,用于從所述若干個(gè)詞語中提取出指定特征集合,所述指定特征集合包括至少一個(gè)特征詞; 模板構(gòu)建模塊,用于根據(jù)所述預(yù)設(shè)關(guān)鍵詞和所述指定特征集合中的所述特征詞構(gòu)建所述模板; 模板訓(xùn)練模塊,用于根據(jù)所述樣本訓(xùn)練集中的標(biāo)注結(jié)果對所述模板進(jìn)行訓(xùn)練。11.根據(jù)權(quán)利要求10所述的裝置,其特征在于, 所述特征提取模塊,用于通過如下兩個(gè)步驟中的其中一個(gè)從若干個(gè)詞語中提取出指定特征集合:根據(jù)卡方檢驗(yàn)從所述若干個(gè)詞語中提取出所述指定特征集合;或者,根據(jù)信息增益從所述若干個(gè)詞語中提取出指定特征集合。12.根據(jù)權(quán)利要求10所述的裝置,其特征在于, 所述模板構(gòu)建模塊,用于將所述指定特征集合中的所述特征詞和所述預(yù)設(shè)關(guān)鍵詞構(gòu)建樸素貝葉斯分類器,各個(gè)特征詞在所述樸素貝葉斯分類器中互相獨(dú)立。13.根據(jù)權(quán)利要求12所述的裝置,其特征在于, 所述模板訓(xùn)練模塊,用于對于所述樸素貝葉斯分類器中的每個(gè)所述特征詞,根據(jù)所述樣本訓(xùn)練集中的標(biāo)注結(jié)果,統(tǒng)計(jì)出攜帶有所述特征詞和所述預(yù)設(shè)關(guān)鍵詞的分句為第一分句的數(shù)量;根據(jù)各個(gè)所述特征詞、所述預(yù)設(shè)關(guān)鍵詞和所述數(shù)量,得到訓(xùn)練后的所述樸素貝葉斯分類器。14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述預(yù)設(shè)關(guān)鍵詞為數(shù)字信息,所述標(biāo)注結(jié)果為所述數(shù)字信息的屬性。15.一種信息識別裝置,其特征在于,所述裝置包括: 分句獲取模塊,用于獲取待識別的目標(biāo)信息中的至少一個(gè)分句,所述分句中包括預(yù)設(shè)關(guān)鍵詞; 詞語提取模塊,用于對所述分句進(jìn)行分詞得到若干個(gè)詞語,并從所述若干個(gè)詞語中提取出指定特征集合,所述指定特征集合包括至少一個(gè)特征詞; 識別處理模塊,用于根據(jù)所述預(yù)設(shè)關(guān)鍵詞、特征詞以及預(yù)先構(gòu)建的模板,識別所述分句中的預(yù)設(shè)關(guān)鍵詞的標(biāo)注結(jié)果。16.根據(jù)權(quán)利要求15所述的裝置,其特征在于, 所述識別處理模塊,用于若識別的標(biāo)注結(jié)果是預(yù)設(shè)標(biāo)注結(jié)果的分句的數(shù)量為多個(gè),將識別概率最大的分句中的預(yù)設(shè)關(guān)鍵詞作為預(yù)設(shè)標(biāo)注結(jié)果的信息。17.根據(jù)權(quán)利要求15所述的裝置,其特征在于, 所述詞語提取模塊,用于通過如下兩個(gè)步驟中的其中一個(gè)從若干個(gè)詞語中提取出指定特征集合:根據(jù)卡方檢驗(yàn)從所述若干個(gè)詞語中提取出所述指定特征集合;或者根據(jù)信息增益從所述若干個(gè)詞語中提取出所述指定特征集合。18.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述預(yù)設(shè)關(guān)鍵詞為數(shù)字信息,所述標(biāo)注結(jié)果為所述數(shù)字信息的屬性。19.一種模板構(gòu)建裝置,其特征在于,包括: 處理器; 用于存儲處理器可執(zhí)行指令的存儲器; 其中,所述處理器被配置為:獲取原始信息樣本集,所述原始信息樣本集包括至少一條預(yù)設(shè)類別的原始信息;在所述原始信息中包括預(yù)設(shè)關(guān)鍵詞時(shí),根據(jù)預(yù)設(shè)關(guān)鍵詞集合對所述預(yù)設(shè)關(guān)鍵詞進(jìn)行標(biāo)注,得到樣本訓(xùn)練集;對所述樣本訓(xùn)練集中的包括所述預(yù)設(shè)關(guān)鍵詞的分句進(jìn)行分詞,得到若干個(gè)詞語;從所述若干個(gè)詞語中提取出指定特征集合,所述指定特征集合包括至少一個(gè)特征詞;根據(jù)所述預(yù)設(shè)關(guān)鍵詞和所述指定特征集合中的所述特征詞構(gòu)建所述模板;根據(jù)所述樣本訓(xùn)練集中的標(biāo)注結(jié)果對所述模板進(jìn)行訓(xùn)練。20.一種信息識別裝置,其特征在于,包括: 處理器; 用于存儲處理器可執(zhí)行指令的存儲器; 其中,所述處理器被配置為:獲取待識別的目標(biāo)信息中的至少一個(gè)分句,所述分句中包括預(yù)設(shè)關(guān)鍵詞;對所述分句進(jìn)行分詞得到若干個(gè)詞語,并從所述若干個(gè)詞語中提取出指定特征集合,所述指定特征集合包括至少一個(gè)特征詞;根據(jù)所述預(yù)設(shè)關(guān)鍵詞、特征詞以及預(yù)先構(gòu)建的模板,識別所述分句中的預(yù)設(shè)關(guān)鍵詞的標(biāo)注結(jié)果。
【專利摘要】本公開提供一種模板構(gòu)建方法和裝置、信息識別方法和裝置,其中方法包括:獲取原始信息樣本集,所述原始信息樣本集包括至少一條預(yù)設(shè)類別的原始信息;在所述原始信息中包括預(yù)設(shè)關(guān)鍵詞時(shí),根據(jù)預(yù)設(shè)關(guān)鍵詞集合對所述預(yù)設(shè)關(guān)鍵詞進(jìn)行標(biāo)注,得到樣本訓(xùn)練集;對所述樣本訓(xùn)練集中的包括所述預(yù)設(shè)關(guān)鍵詞的分句進(jìn)行分詞,得到若干個(gè)詞語;從所述若干個(gè)詞語中提取出指定特征集合,所述指定特征集合包括至少一個(gè)特征詞;根據(jù)所述預(yù)設(shè)關(guān)鍵詞和所述指定特征集合中的所述特征詞構(gòu)建所述模板;根據(jù)所述樣本訓(xùn)練集中的標(biāo)注結(jié)果對所述模板進(jìn)行訓(xùn)練。本公開提高了信息識別的準(zhǔn)確度。
【IPC分類】G06F17/27, G06K9/62
【公開號】CN105488025
【申請?zhí)枴緾N201510827530
【發(fā)明人】汪平仄, 張濤, 陳志軍
【申請人】小米科技有限責(zé)任公司
【公開日】2016年4月13日
【申請日】2015年11月24日
當(dāng)前第5頁1 2 3 4 5 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1