技術(shù)編號:9471530
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細信息。 本發(fā)明屬于文本挖掘與機器學(xué)習(xí),特別設(shè)及一種基于信息賭的文本特征 量化方法和裝置及文本分類方法和裝置。背景技術(shù) 大規(guī)模文本數(shù)據(jù)的組織和挖掘經(jīng)常依賴于自動文本分類技術(shù)。自動文本分類技 術(shù)一般在分類之前需要對文本的特征進行量化,W便于計算機用有監(jiān)督的機器學(xué)習(xí)方法進 行分類處理。文本的特征可用一些詞匯來描述,文本特征的量化就是從文本中挑選一些詞 匯作為特征詞,并為它們分配不同的權(quán)重,從而把每個文本文檔都表示成由多個特征詞的 權(quán)重值所組成的向量(稱為特征向量)。可...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。