技術(shù)總結(jié)
本發(fā)明屬于數(shù)據(jù)查詢技術(shù)領域,提供了一種基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法及裝置。該方法包括獲取指定的關(guān)鍵詞,根據(jù)關(guān)鍵詞和預獲取語料庫的語種間關(guān)聯(lián)關(guān)系,獲取關(guān)鍵詞翻譯為不同語種時的名詞,根據(jù)每個名詞和該名詞在語料庫中所屬語種的語種內(nèi)關(guān)聯(lián)關(guān)系,獲取該名詞的同義詞、近義詞、音似詞和形似詞四種關(guān)聯(lián)詞匯中的至少一種,將每個數(shù)據(jù)集名稱分別與關(guān)鍵詞和關(guān)聯(lián)詞匯進行比較,獲取與關(guān)鍵詞或關(guān)聯(lián)詞匯匹配的目標數(shù)據(jù)集,形成目標數(shù)據(jù)集數(shù)組,對目標數(shù)據(jù)集數(shù)組進行去重處理和排序,形成關(guān)鍵詞的查詢結(jié)果。本發(fā)明基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法及裝置,能夠在多源異構(gòu)海量數(shù)據(jù)集的場景下,快速、準確地進行數(shù)據(jù)集查詢,提高數(shù)據(jù)集查詢效率。
技術(shù)研發(fā)人員:張軍;賈西貝
受保護的技術(shù)使用者:深圳市華傲數(shù)據(jù)技術(shù)有限公司
文檔號碼:201611235535
技術(shù)研發(fā)日:2016.12.28
技術(shù)公布日:2017.05.31