技術(shù)編號:6383701
提示:您尚未登錄,請點(diǎn) 登 陸 后下載,如果您還沒有賬戶請點(diǎn) 注 冊 ,登陸完成后,請刷新本頁查看技術(shù)詳細(xì)信息。本發(fā)明涉及評價文檔之間相似性的信息處理。背景技術(shù)評價不同文檔之間相似性的方法廣泛用于評價科學(xué)論文之間的相似性或者檢測公司文檔之間的相似性。專利文檔I至3公開了文檔相似性確定系統(tǒng)。在專利文檔I至2中公開的文檔相似性確定系統(tǒng)中,首先針對每一頁分離整個文檔,或者在出現(xiàn)特定字符串的每個位置處分割整個文檔(在下文中,一個分離出(或分割出)的單元被稱作“片段”),并且針對每個片段計算特性值。按照文檔中從第一個片段到最后一個片段的順序,通過比較片段的特性值,基于特性值彼...
注意:該技術(shù)已申請專利,請尊重研發(fā)人員的辛勤研發(fā)付出,在未取得專利權(quán)人授權(quán)前,僅供技術(shù)研究參考不得用于商業(yè)用途。
該專利適合技術(shù)人員進(jìn)行技術(shù)研發(fā)參考以及查看自身技術(shù)是否侵權(quán),增加技術(shù)思路,做技術(shù)知識儲備,不適合論文引用。
請注意,此類技術(shù)沒有源代碼,用于學(xué)習(xí)研究技術(shù)思路。