技術(shù)編號:40394200
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細信息。本發(fā)明涉及自然語言處理,尤其涉及一種文本聚類方法、裝置、電子設(shè)備和存儲介質(zhì)。背景技術(shù)、文本聚類是自然語言處理領(lǐng)域的一個重要任務(wù),其主要目的是將相似的文本歸類到同一類中,以便于信息組織、管理和檢索。而且在一些特定領(lǐng)域內(nèi),需要根據(jù)文本字面相似性進行文本聚類。、現(xiàn)有的文本聚類方法主要是通過將文本轉(zhuǎn)換成向量表示,再結(jié)合k-means,層次聚類等方法進行聚類。然而向量表示在捕捉語義相似性方面效果顯著,但對于字面相似性的判斷卻不夠準確;傳統(tǒng)的聚類方法在處理大規(guī)模文本數(shù)據(jù)時,計算成本高,效率低,難以滿足實...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。