技術(shù)編號(hào):12596643
提示:您尚未登錄,請(qǐng)點(diǎn) 登 陸 后下載,如果您還沒有賬戶請(qǐng)點(diǎn) 注 冊(cè) ,登陸完成后,請(qǐng)刷新本頁(yè)查看技術(shù)詳細(xì)信息。本發(fā)明涉及文本分類領(lǐng)域,更具體地,涉及一種基于Xgboost分類算法的文本分類方法。背景技術(shù)文本分類方法已經(jīng)在搜索引擎、個(gè)性化推薦系統(tǒng)、輿情監(jiān)控等領(lǐng)域得到了廣泛的應(yīng)用,是實(shí)現(xiàn)高效管理和準(zhǔn)確定位海量信息的重要一環(huán)。文本分類方法的常用框架是基于機(jī)器學(xué)習(xí)分類算法,即包含數(shù)據(jù)預(yù)處理、接著特征提取、特征選擇、特征分類等步驟。特征提取即利用統(tǒng)一的方法和模型對(duì)文本進(jìn)行標(biāo)識(shí),該方法或者模型可以表示文本的特征并且能夠方便的轉(zhuǎn)化成數(shù)學(xué)語(yǔ)言,進(jìn)而轉(zhuǎn)化成計(jì)算機(jī)能夠處理的數(shù)學(xué)模型?,F(xiàn)有的比較流行的文本表示方法有向量空間模...
注意:該技術(shù)已申請(qǐng)專利,請(qǐng)尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識(shí)儲(chǔ)備,不適合論文引用。
請(qǐng)注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。