技術編號:11177139
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本申請涉及計算機技術領域,具體涉及計算機網(wǎng)絡技術領域,尤其涉及用于分類數(shù)據(jù)的方法和裝置。背景技術在處理上千億的文本數(shù)據(jù),為文本分類模型準備質(zhì)量較高的訓練數(shù)據(jù)時,也即為無類別信息的用戶搜索Query及點擊Title這樣的原始數(shù)據(jù)設計學習方法時,可以為其打上相應的類別標簽,再通過設計過濾方法及增補方法來保證各類樣本的純度及數(shù)量,從而為用戶畫像的興趣屬性分類問題,挖掘訓練樣本,也即對用于用戶畫像的數(shù)據(jù)進行分類。目前,對用于用戶畫像的數(shù)據(jù)進行分類的方法,可以采用人工審查的方法,或者采用編制領域?qū)C~匯來...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。