技術編號:11990994
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術詳細信息。本發(fā)明涉及中醫(yī)藥信息檢索領域,特別涉及一種基于LDA主題模型的中醫(yī)藥數(shù)據(jù)挖掘方法。背景技術本發(fā)明涉及機器學習領域內(nèi)主題模型的相關內(nèi)容,主要有向量空間模型,奇異值分解與LSA,概率隱含語義分析pLSA,潛在狄利克雷分配LDA等。向量空間模型被廣泛應用在信息檢索領域,最初由Salton在TREC項目中使用BOW(BagOfWords)模型,即文檔中單詞具有可交換性(Exchangeability)來刻畫單詞和文本的關系。在他的模型中,單詞的語義是獨立于文本的,每個單詞是單詞空間中的一個維度,用這樣的...
注意:該技術已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權人授權前,僅供技術研究參考不得用于商業(yè)用途。
該專利適合技術人員進行技術研發(fā)參考以及查看自身技術是否侵權,增加技術思路,做技術知識儲備,不適合論文引用。
請注意,此類技術沒有源代碼,用于學習研究技術思路。