技術(shù)編號:6518359
提示:您尚未登錄,請點(diǎn) 登 陸 后下載,如果您還沒有賬戶請點(diǎn) 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細(xì)信息。本發(fā)明,包括網(wǎng)絡(luò)文本預(yù)處理模塊、文本分詞模塊、詞袋模型模塊、文本空間向量表示模塊、分類結(jié)果計(jì)算模塊五個模塊。本發(fā)明能夠?qū)崿F(xiàn)對網(wǎng)絡(luò)文本進(jìn)行規(guī)范化預(yù)處理、去除無意義停用詞及標(biāo)點(diǎn)符號、分類類別確定、特征詞-類別相關(guān)度計(jì)算、組成詞袋模型、文本轉(zhuǎn)換為空間向量、計(jì)算文本所屬類別等功能,完成文本類別特征的抽取和量化分析,對語料庫處理、自動文摘、信息過濾以及信息檢索等具有重要的作用。專利說明[0001]本發(fā)明涉及,本發(fā)明采用計(jì)算詞與類別相關(guān)度技術(shù)實(shí)現(xiàn)對文本的分類或文本的主...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。