1.一種基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法,其特征在于,包括:
關(guān)鍵詞獲取步驟:獲取指定的關(guān)鍵詞;
關(guān)鍵詞翻譯步驟:根據(jù)所述關(guān)鍵詞和預(yù)獲取語料庫的語種間關(guān)聯(lián)關(guān)系,獲取所述關(guān)鍵詞翻譯為不同語種時(shí)的名詞;
關(guān)聯(lián)詞匯獲取步驟:根據(jù)每個(gè)名詞和該名詞在所述語料庫中所屬語種的語種內(nèi)關(guān)聯(lián)關(guān)系,獲取該名詞的同義詞、近義詞、音似詞和形似詞四種關(guān)聯(lián)詞匯中的至少一種;
數(shù)據(jù)集名稱匹配步驟:將每個(gè)數(shù)據(jù)集名稱分別與所述關(guān)鍵詞和所述關(guān)聯(lián)詞匯進(jìn)行比較,獲取與所述關(guān)鍵詞或所述關(guān)聯(lián)詞匯匹配的目標(biāo)數(shù)據(jù)集,形成目標(biāo)數(shù)據(jù)集數(shù)組,所述數(shù)據(jù)集名稱為預(yù)獲取數(shù)據(jù)集的名稱;
查詢結(jié)果形成步驟:對(duì)所述目標(biāo)數(shù)據(jù)集數(shù)組進(jìn)行去重處理和排序,形成所述關(guān)鍵詞的查詢結(jié)果。
2.根據(jù)權(quán)利要求1所述基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法,其特征在于,根據(jù)每個(gè)名詞和該名詞在所述語料庫中所屬語種的語種內(nèi)關(guān)聯(lián)關(guān)系,獲取該名詞的同義詞、近義詞、音似詞和形似詞四種關(guān)聯(lián)詞匯中的至少一種,具體包括:
根據(jù)每個(gè)名詞和該名詞在所述語料庫中所屬語種的同義關(guān)聯(lián)關(guān)系,獲取該名詞的同義詞;
根據(jù)每個(gè)名詞和該名詞在所述語料庫中所屬語種的近義關(guān)聯(lián)關(guān)系,獲取該名詞的近義詞;
根據(jù)每個(gè)名詞和該名詞在所述語料庫中所屬語種的發(fā)音相似度閾值,獲取該名詞的音似詞;
根據(jù)每個(gè)名詞和該名詞在所述語料庫中所屬語種的結(jié)構(gòu)相似度閾值,獲取該名詞的形似詞,所述語種內(nèi)關(guān)聯(lián)關(guān)系包括所述同義關(guān)聯(lián)關(guān)系、所述近義關(guān)聯(lián)關(guān)系、所述發(fā)音相似度閾值和所述結(jié)構(gòu)相似度閾值。
3.根據(jù)權(quán)利要求1所述基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法,其特征在于,在查詢結(jié)果形成步驟之后,該方法還包括查詢結(jié)果再處理步驟:
獲取第一查詢結(jié)果和第二查詢結(jié)果,所述第一查詢結(jié)果為第一關(guān)鍵詞的查詢結(jié)果,所述第二查詢結(jié)果為第二關(guān)鍵詞的查詢結(jié)果;
根據(jù)指定的運(yùn)算關(guān)系,對(duì)所述第一查詢結(jié)果和所述第二查詢結(jié)果進(jìn)行運(yùn)算處理,形成再處理查詢結(jié)果。
4.根據(jù)權(quán)利要求3所述基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法,其特征在于,根據(jù)指定的運(yùn)算關(guān)系,對(duì)所述第一查詢結(jié)果和所述第二查詢結(jié)果進(jìn)行運(yùn)算處理,形成再處理查詢結(jié)果,具體包括:
根據(jù)指定的交集運(yùn)算關(guān)系,遍歷所述第一查詢結(jié)果和所述第二查詢結(jié)果中的每項(xiàng)目標(biāo)數(shù)據(jù)集,篩選出同時(shí)存在于所述第一查詢結(jié)果和所述第二查詢結(jié)果中的目標(biāo)數(shù)據(jù)集,并將篩選出的目標(biāo)數(shù)據(jù)集更新至交集查詢結(jié)果;
根據(jù)指定的并集運(yùn)算關(guān)系,將所述第一查詢結(jié)果與所述第二查詢結(jié)果合并,并進(jìn)行去重處理和排序,形成并集查詢結(jié)果;
根據(jù)指定的差集運(yùn)算關(guān)系,遍歷所述第一查詢結(jié)果和所述第二查詢結(jié)果中的每項(xiàng)目標(biāo)數(shù)據(jù)集,篩選出存在于所述第一查詢結(jié)果且不存在所述第二查詢結(jié)果中的目標(biāo)數(shù)據(jù)集,并將篩選出的目標(biāo)數(shù)據(jù)集更新至差集查詢結(jié)果;所述運(yùn)算關(guān)系包括所述交集運(yùn)算關(guān)系、所述并集運(yùn)算關(guān)系和所述差集運(yùn)算關(guān)系,所述再處理查詢結(jié)果包括所述交集查詢結(jié)果、所述并集查詢結(jié)果和所述差集查詢結(jié)果。
5.根據(jù)權(quán)利要求1所述基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法,其特征在于,在所述關(guān)聯(lián)詞匯獲取步驟之后,數(shù)據(jù)集名稱匹配步驟之前,該方法還包括關(guān)聯(lián)詞匯篩選步驟:
根據(jù)預(yù)設(shè)置的關(guān)聯(lián)詞匯篩選原則,檢驗(yàn)所述關(guān)聯(lián)詞匯,獲取符合所述關(guān)聯(lián)詞匯篩選原則的目標(biāo)關(guān)聯(lián)詞匯;
將每個(gè)數(shù)據(jù)集名稱分別與所述關(guān)鍵詞和所述關(guān)聯(lián)詞匯進(jìn)行比較,獲取與所述關(guān)鍵詞或所述關(guān)聯(lián)詞匯匹配的目標(biāo)數(shù)據(jù)集,具體包括:
將每個(gè)數(shù)據(jù)集名稱分別與所述關(guān)鍵詞和所述目標(biāo)關(guān)聯(lián)詞匯進(jìn)行比較,獲取與所述關(guān)鍵詞或所述目標(biāo)關(guān)聯(lián)詞匯匹配的目標(biāo)數(shù)據(jù)集。
6.根據(jù)權(quán)利要求5所述基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法,其特征在于,根據(jù)預(yù)設(shè)置的關(guān)聯(lián)詞匯篩選原則,檢驗(yàn)所述關(guān)聯(lián)詞匯,獲取符合所述關(guān)聯(lián)詞匯篩選原則的目標(biāo)關(guān)聯(lián)詞匯,具體包括:
根據(jù)預(yù)設(shè)置的語種篩選原則,檢驗(yàn)所述關(guān)聯(lián)詞匯,保留所述關(guān)鍵詞在目標(biāo)語種中的目標(biāo)關(guān)聯(lián)詞匯;
根據(jù)預(yù)設(shè)置的關(guān)聯(lián)詞匯種類篩選原則,檢驗(yàn)所述關(guān)聯(lián)詞匯,保留該關(guān)鍵詞指定種類的目標(biāo)關(guān)聯(lián)詞匯。
7.根據(jù)權(quán)利要求5所述基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法,其特征在于,將每個(gè)數(shù)據(jù)集名稱分別與所述關(guān)鍵詞和所述目標(biāo)關(guān)聯(lián)詞匯進(jìn)行比較,獲取與所述關(guān)鍵詞或所述目標(biāo)關(guān)聯(lián)詞匯匹配的目標(biāo)數(shù)據(jù)集,具體包括:
將每個(gè)數(shù)據(jù)集名稱分別與所述關(guān)鍵詞和所述目標(biāo)關(guān)聯(lián)詞匯進(jìn)行比較:
若該數(shù)據(jù)集名稱與所述關(guān)鍵詞中均包含預(yù)指定順序的字符,則判斷該數(shù)據(jù)集為目標(biāo)數(shù)據(jù)集;或
若該數(shù)據(jù)集名稱與所述目標(biāo)關(guān)聯(lián)詞匯中均包含所述預(yù)指定順序的字符,則判斷該數(shù)據(jù)集為目標(biāo)數(shù)據(jù)集。
8.一種基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢裝置,其特征在于,包括:
關(guān)鍵詞獲取模塊:用于獲取指定的關(guān)鍵詞;
關(guān)鍵詞翻譯模塊:用于根據(jù)所述關(guān)鍵詞和預(yù)獲取語料庫的語種間關(guān)聯(lián)關(guān)系,獲取所述關(guān)鍵詞翻譯為不同語種時(shí)的名詞;
關(guān)聯(lián)詞匯獲取模塊:用于根據(jù)每個(gè)名詞和該名詞在所述語料庫中所屬語種的語種內(nèi)關(guān)聯(lián)關(guān)系,獲取該名詞的同義詞、近義詞、音似詞和形似詞四種關(guān)聯(lián)詞匯中的至少一種;
數(shù)據(jù)集名稱匹配模塊:用于將每個(gè)數(shù)據(jù)集名稱分別與所述關(guān)鍵詞和所述關(guān)聯(lián)詞匯進(jìn)行比較,獲取與所述關(guān)鍵詞或所述關(guān)聯(lián)詞匯匹配的目標(biāo)數(shù)據(jù)集,形成目標(biāo)數(shù)據(jù)集數(shù)組,所述數(shù)據(jù)集名稱為預(yù)獲取數(shù)據(jù)集的名稱;
查詢結(jié)果形成模塊:用于對(duì)所述目標(biāo)數(shù)據(jù)集數(shù)組進(jìn)行去重處理和排序,形成所述關(guān)鍵詞的查詢結(jié)果。
9.根據(jù)權(quán)利要求8所述基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢裝置,其特征在于,所述關(guān)聯(lián)詞匯獲取模塊具體包括:
同義詞獲取子模塊,用于根據(jù)每個(gè)名詞和該名詞在所述語料庫中所屬語種的同義關(guān)聯(lián)關(guān)系,獲取該名詞的同義詞;
近義詞獲取子模塊,用于根據(jù)每個(gè)名詞和該名詞在所述語料庫中所屬語種的近義關(guān)聯(lián)關(guān)系,獲取該名詞的近義詞;
音似詞獲取子模塊,用于根據(jù)每個(gè)名詞和該名詞在所述語料庫中所屬語種的發(fā)音相似度閾值,獲取該名詞的音似詞;
形似詞獲取子模塊,用于根據(jù)每個(gè)名詞和該名詞在所述語料庫中所屬語種的結(jié)構(gòu)相似度閾值,獲取該名詞的形似詞,所述語種內(nèi)關(guān)聯(lián)關(guān)系包括所述同義關(guān)聯(lián)關(guān)系、所述近義關(guān)聯(lián)關(guān)系、所述發(fā)音相似度閾值和所述結(jié)構(gòu)相似度閾值。
10.根據(jù)權(quán)利要求8所述基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢裝置,其特征在于,該裝置還包括查詢結(jié)果再處理模塊,包括:
查詢結(jié)果獲取子模塊,用于獲取第一查詢結(jié)果和第二查詢結(jié)果,所述第一查詢結(jié)果為第一關(guān)鍵詞的查詢結(jié)果,所述第二查詢結(jié)果為第二關(guān)鍵詞的查詢結(jié)果;
查詢結(jié)果運(yùn)算子模塊,用于根據(jù)指定的運(yùn)算關(guān)系,對(duì)所述第一查詢結(jié)果和所述第二查詢結(jié)果進(jìn)行運(yùn)算處理,形成再處理查詢結(jié)果。