技術(shù)編號:9750788
提示:您尚未登錄,請點 登 陸 后下載,如果您還沒有賬戶請點 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細(xì)信息。 現(xiàn)有技術(shù)中,對于新詞匯的發(fā)現(xiàn)方法主要有兩種基于單字散串的方法和高頻重 復(fù)模式方法。 圖1是現(xiàn)有技術(shù)中的基于單字散串的方法確定新詞匯的流程圖,如圖1所示,主要 步驟包括步驟110、獲取文檔集;步驟120、利用現(xiàn)有分詞系統(tǒng)和詞典,對文檔集進(jìn)行分詞, 因新詞在分詞過程中無法被識別,會被分成獨(dú)立的單字和相鄰單字組成的字串,他們有可 能就是候選的新詞匯;步驟130、利用統(tǒng)計或規(guī)則的方法對所獲取的候選詞進(jìn)行檢測和過 濾,得到新詞匯?;诟哳l重復(fù)模式方法的出發(fā)點是新詞...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。