技術編號:6357484
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本申請屬于信息檢索、數(shù)據(jù)挖掘、人工智能領域。 背景技術為了揭示隱藏在Web數(shù)據(jù)之后具有潛在價值的信息或結構,近年來Web挖掘技術 取得了較快的發(fā)展和廣泛的應用。文檔聚類是Web挖掘領域中最重要的工具之一,其目的 是將一個文檔集合分成若干個簇,要求同一個簇內(nèi)的文本內(nèi)容具有較高的相似度,而不同 簇之間的相似度盡可能小。每個聚類過程主要包括相似度計算方法和聚類算法兩個部分。目前,研究者已經(jīng)提出多種文檔聚類算法,大致可分為4個類別,即層次化聚類算 法、劃分式聚類算...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。