亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法及裝置與流程

文檔序號(hào):12465942閱讀:366來(lái)源:國(guó)知局
基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法及裝置與流程

本發(fā)明涉及數(shù)據(jù)查詢技術(shù)領(lǐng)域,具體涉及一種基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法及裝置。



背景技術(shù):

目前,在信息化及大數(shù)據(jù)應(yīng)用越來(lái)越深入的情況下,產(chǎn)生了越來(lái)越多的數(shù)據(jù)集。在海量超多數(shù)據(jù)集的場(chǎng)景下,中文名、英文名、同義詞的中文關(guān)鍵詞、近義詞的中文關(guān)鍵詞常常混雜在一起,使得用戶很難精確的指定目標(biāo)數(shù)據(jù)集,進(jìn)行業(yè)務(wù)處理,致使業(yè)務(wù)查詢效率降低,無(wú)法滿足用戶快速查詢信息的業(yè)務(wù)需求。

在多源異構(gòu)海量數(shù)據(jù)集的場(chǎng)景下,提高數(shù)據(jù)集查詢能力,成為未來(lái)發(fā)展的趨勢(shì)。



技術(shù)實(shí)現(xiàn)要素:

針對(duì)現(xiàn)有技術(shù)中的缺陷,本發(fā)明提供基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法及裝置,能夠在多源異構(gòu)海量數(shù)據(jù)集的場(chǎng)景下,快速、準(zhǔn)確地進(jìn)行數(shù)據(jù)集查詢,提高數(shù)據(jù)集查詢效率。

第一方面,本發(fā)明提供一種基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法,該方法包括:

關(guān)鍵詞獲取步驟:獲取指定的關(guān)鍵詞;

關(guān)鍵詞翻譯步驟:根據(jù)關(guān)鍵詞和預(yù)獲取語(yǔ)料庫(kù)的語(yǔ)種間關(guān)聯(lián)關(guān)系,獲取關(guān)鍵詞翻譯為不同語(yǔ)種時(shí)的名詞;

關(guān)聯(lián)詞匯獲取步驟:根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的語(yǔ)種內(nèi)關(guān)聯(lián)關(guān)系,獲取該名詞的同義詞、近義詞、音似詞和形似詞四種關(guān)聯(lián)詞匯中的至少一種;

數(shù)據(jù)集名稱匹配步驟:將每個(gè)數(shù)據(jù)集名稱分別與關(guān)鍵詞和關(guān)聯(lián)詞匯進(jìn)行比較,獲取與關(guān)鍵詞或關(guān)聯(lián)詞匯匹配的目標(biāo)數(shù)據(jù)集,形成目標(biāo)數(shù)據(jù)集數(shù)組,數(shù)據(jù)集名稱為預(yù)獲取數(shù)據(jù)集的名稱;

查詢結(jié)果形成步驟:對(duì)目標(biāo)數(shù)據(jù)集數(shù)組進(jìn)行去重處理和排序,形成關(guān)鍵詞的查詢結(jié)果。

進(jìn)一步地,根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的語(yǔ)種內(nèi)關(guān)聯(lián)關(guān)系,獲取該名詞的同義詞、近義詞、音似詞和形似詞四種關(guān)聯(lián)詞匯中的至少一種,具體包括:

根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的同義關(guān)聯(lián)關(guān)系,獲取該名詞的同義詞;

根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的近義關(guān)聯(lián)關(guān)系,獲取該名詞的近義詞;

根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的發(fā)音相似度閾值,獲取該名詞的音似詞;

根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的結(jié)構(gòu)相似度閾值,獲取該名詞的形似詞,語(yǔ)種內(nèi)關(guān)聯(lián)關(guān)系包括同義關(guān)聯(lián)關(guān)系、近義關(guān)聯(lián)關(guān)系、發(fā)音相似度閾值和結(jié)構(gòu)相似度閾值。

基于上述任意基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法實(shí)施例,進(jìn)一步地,在查詢結(jié)果形成步驟之后,該方法還包括查詢結(jié)果再處理步驟:

獲取第一查詢結(jié)果和第二查詢結(jié)果,第一查詢結(jié)果為第一關(guān)鍵詞的查詢結(jié)果,第二查詢結(jié)果為第二關(guān)鍵詞的查詢結(jié)果;

根據(jù)指定的運(yùn)算關(guān)系,對(duì)第一查詢結(jié)果和第二查詢結(jié)果進(jìn)行運(yùn)算處理,形成再處理查詢結(jié)果。

進(jìn)一步地,根據(jù)指定的運(yùn)算關(guān)系,對(duì)第一查詢結(jié)果和第二查詢結(jié)果進(jìn)行運(yùn)算處理,形成再處理查詢結(jié)果,具體包括:

根據(jù)指定的交集運(yùn)算關(guān)系,遍歷第一查詢結(jié)果和第二查詢結(jié)果中的每項(xiàng)目標(biāo)數(shù)據(jù)集,篩選出同時(shí)存在于第一查詢結(jié)果和第二查詢結(jié)果中的目標(biāo)數(shù)據(jù)集,并將篩選出的目標(biāo)數(shù)據(jù)集更新至交集查詢結(jié)果;

根據(jù)指定的并集運(yùn)算關(guān)系,將第一查詢結(jié)果與第二查詢結(jié)果合并,并進(jìn)行去重處理和排序,形成并集查詢結(jié)果;

根據(jù)指定的差集運(yùn)算關(guān)系,遍歷第一查詢結(jié)果和第二查詢結(jié)果中的每項(xiàng)目標(biāo)數(shù)據(jù)集,篩選出存在于第一查詢結(jié)果且不存在第二查詢結(jié)果中的目標(biāo)數(shù)據(jù)集,并將篩選出的目標(biāo)數(shù)據(jù)集更新至差集查詢結(jié)果;運(yùn)算關(guān)系包括交集運(yùn)算關(guān)系、并集運(yùn)算關(guān)系和差集運(yùn)算關(guān)系,再處理查詢結(jié)果包括交集查詢結(jié)果、并集查詢結(jié)果和差集查詢結(jié)果。

基于上述任意基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法實(shí)施例,進(jìn)一步地,在關(guān)聯(lián)詞匯獲取步驟之后,數(shù)據(jù)集名稱匹配步驟之前,該方法還包括關(guān)聯(lián)詞匯篩選步驟:

根據(jù)預(yù)設(shè)置的關(guān)聯(lián)詞匯篩選原則,檢驗(yàn)關(guān)聯(lián)詞匯,獲取符合關(guān)聯(lián)詞匯篩選原則的目標(biāo)關(guān)聯(lián)詞匯;

將每個(gè)數(shù)據(jù)集名稱分別與關(guān)鍵詞和關(guān)聯(lián)詞匯進(jìn)行比較,獲取與關(guān)鍵詞或關(guān)聯(lián)詞匯匹配的目標(biāo)數(shù)據(jù)集,具體包括:

將每個(gè)數(shù)據(jù)集名稱分別與關(guān)鍵詞和目標(biāo)關(guān)聯(lián)詞匯進(jìn)行比較,獲取與關(guān)鍵詞或目標(biāo)關(guān)聯(lián)詞匯匹配的目標(biāo)數(shù)據(jù)集。

進(jìn)一步地,根據(jù)預(yù)設(shè)置的關(guān)聯(lián)詞匯篩選原則,檢驗(yàn)關(guān)聯(lián)詞匯,獲取符合關(guān)聯(lián)詞匯篩選原則的目標(biāo)關(guān)聯(lián)詞匯,具體包括:

根據(jù)預(yù)設(shè)置的語(yǔ)種篩選原則,檢驗(yàn)關(guān)聯(lián)詞匯,保留關(guān)鍵詞在目標(biāo)語(yǔ)種中的目標(biāo)關(guān)聯(lián)詞匯;

根據(jù)預(yù)設(shè)置的關(guān)聯(lián)詞匯種類篩選原則,檢驗(yàn)關(guān)聯(lián)詞匯,保留該關(guān)鍵詞指定種類的目標(biāo)關(guān)聯(lián)詞匯。

進(jìn)一步地,將每個(gè)數(shù)據(jù)集名稱分別與關(guān)鍵詞和目標(biāo)關(guān)聯(lián)詞匯進(jìn)行比較,獲取與關(guān)鍵詞或目標(biāo)關(guān)聯(lián)詞匯匹配的目標(biāo)數(shù)據(jù)集,具體包括:

將每個(gè)數(shù)據(jù)集名稱分別與關(guān)鍵詞和目標(biāo)關(guān)聯(lián)詞匯進(jìn)行比較:

若該數(shù)據(jù)集名稱與關(guān)鍵詞中均包含預(yù)指定順序的字符,則判斷該數(shù)據(jù)集為目標(biāo)數(shù)據(jù)集;或

若該數(shù)據(jù)集名稱與目標(biāo)關(guān)聯(lián)詞匯中均包含預(yù)指定順序的字符,則判斷該數(shù)據(jù)集為目標(biāo)數(shù)據(jù)集。

第二方面,本發(fā)明提供一種基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢裝置,該裝置包括關(guān)鍵詞獲取模塊、關(guān)鍵詞翻譯模塊、關(guān)聯(lián)詞匯獲取模塊、數(shù)據(jù)集名稱匹配模塊和查詢結(jié)果形成模塊,關(guān)鍵詞獲取模塊用于獲取指定的關(guān)鍵詞;關(guān)鍵詞翻譯模塊用于根據(jù)關(guān)鍵詞和預(yù)獲取語(yǔ)料庫(kù)的語(yǔ)種間關(guān)聯(lián)關(guān)系,獲取關(guān)鍵詞翻譯為不同語(yǔ)種時(shí)的名詞;關(guān)聯(lián)詞匯獲取模塊用于根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的語(yǔ)種內(nèi)關(guān)聯(lián)關(guān)系,獲取該名詞的同義詞、近義詞、音似詞和形似詞四種關(guān)聯(lián)詞匯中的至少一種;數(shù)據(jù)集名稱匹配模塊用于將每個(gè)數(shù)據(jù)集名稱分別與關(guān)鍵詞和關(guān)聯(lián)詞匯進(jìn)行比較,獲取與關(guān)鍵詞或關(guān)聯(lián)詞匯匹配的目標(biāo)數(shù)據(jù)集,形成目標(biāo)數(shù)據(jù)集數(shù)組,數(shù)據(jù)集名稱為預(yù)獲取數(shù)據(jù)集的名稱;查詢結(jié)果形成模塊用于對(duì)目標(biāo)數(shù)據(jù)集數(shù)組進(jìn)行去重處理和排序,形成關(guān)鍵詞的查詢結(jié)果。

進(jìn)一步地,關(guān)聯(lián)詞匯獲取模塊具體包括同義詞獲取子模塊、近義詞獲取子模塊、音似詞獲取子模塊和形似詞獲取子模塊,同義詞獲取子模塊用于根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的同義關(guān)聯(lián)關(guān)系,獲取該名詞的同義詞;近義詞獲取子模塊用于根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的近義關(guān)聯(lián)關(guān)系,獲取該名詞的近義詞;音似詞獲取子模塊用于根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的發(fā)音相似度閾值,獲取該名詞的音似詞;形似詞獲取子模塊用于根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的結(jié)構(gòu)相似度閾值,獲取該名詞的形似詞,語(yǔ)種內(nèi)關(guān)聯(lián)關(guān)系包括同義關(guān)聯(lián)關(guān)系、近義關(guān)聯(lián)關(guān)系、發(fā)音相似度閾值和結(jié)構(gòu)相似度閾值。

基于上述任意基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢裝置實(shí)施例,進(jìn)一步地,該裝置還包括查詢結(jié)果再處理模塊,查詢結(jié)果再處理模塊包括查詢結(jié)果獲取子模塊和查詢結(jié)果運(yùn)算子模塊,查詢結(jié)果獲取子模塊用于獲取第一查詢結(jié)果和第二查詢結(jié)果,第一查詢結(jié)果為第一關(guān)鍵詞的查詢結(jié)果,第二查詢結(jié)果為第二關(guān)鍵詞的查詢結(jié)果;查詢結(jié)果運(yùn)算子模塊用于根據(jù)指定的運(yùn)算關(guān)系,對(duì)第一查詢結(jié)果和第二查詢結(jié)果進(jìn)行運(yùn)算處理,形成再處理查詢結(jié)果。

由上述技術(shù)方案可知,本實(shí)施例提供的基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法及裝置,通過(guò)語(yǔ)料庫(kù)快速獲取指定關(guān)鍵詞在各種語(yǔ)種的關(guān)聯(lián)詞匯,并且,在多源異構(gòu)海量數(shù)據(jù)集中,該方法根據(jù)關(guān)鍵詞和延伸出的關(guān)聯(lián)詞匯進(jìn)行查找,能夠更全面、準(zhǔn)確地查找到目標(biāo)數(shù)據(jù)集,滿足用戶多樣化的業(yè)務(wù)查詢需求,經(jīng)過(guò)去重處理和排序后的數(shù)據(jù)集查詢結(jié)果,方便用戶快速查看,有助于提高業(yè)務(wù)查詢效率。

因此,本實(shí)施例基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法及裝置,能夠在多源異構(gòu)海量數(shù)據(jù)集的場(chǎng)景下,快速、準(zhǔn)確地進(jìn)行數(shù)據(jù)集查詢,提高數(shù)據(jù)集查詢效率。

附圖說(shuō)明

為了更清楚地說(shuō)明本發(fā)明具體實(shí)施方式或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)具體實(shí)施方式或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹。在所有附圖中,類似的元件或部分一般由類似的附圖標(biāo)記標(biāo)識(shí)。附圖中,各元件或部分并不一定按照實(shí)際的比例繪制。

圖1示出了本發(fā)明實(shí)施例所提供的一種基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法的流程圖;

圖2示出了本發(fā)明實(shí)施例所提供的一種基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢裝置的結(jié)構(gòu)框圖;

圖3示出了本發(fā)明實(shí)施例所提供的另一種基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢裝置的結(jié)構(gòu)框圖。

具體實(shí)施方式

下面將結(jié)合附圖對(duì)本發(fā)明技術(shù)方案的實(shí)施例進(jìn)行詳細(xì)的描述。以下實(shí)施例僅用于更加清楚地說(shuō)明本發(fā)明的技術(shù)方案,因此只是作為示例,而不能以此來(lái)限制本發(fā)明的保護(hù)范圍。

需要注意的是,除非另有說(shuō)明,本申請(qǐng)使用的技術(shù)術(shù)語(yǔ)或者科學(xué)術(shù)語(yǔ)應(yīng)當(dāng)為本發(fā)明所屬領(lǐng)域技術(shù)人員所理解的通常意義。

第一方面,本發(fā)明實(shí)施例所提供的一種基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法,結(jié)合圖1,該方法包括:

關(guān)鍵詞獲取步驟S1:獲取指定的關(guān)鍵詞,如獲取某個(gè)指定的關(guān)鍵詞“公司”。

關(guān)鍵詞翻譯步驟S2:根據(jù)關(guān)鍵詞和預(yù)獲取語(yǔ)料庫(kù)的語(yǔ)種間關(guān)聯(lián)關(guān)系,獲取關(guān)鍵詞翻譯為不同語(yǔ)種時(shí)的名詞,在此,語(yǔ)料庫(kù)包括眾多詞匯,且每個(gè)詞匯在所有語(yǔ)種中均有相應(yīng)的名詞,以此形成語(yǔ)種間關(guān)聯(lián)關(guān)系,并且,在每種語(yǔ)種內(nèi),該語(yǔ)料庫(kù)能夠建立各個(gè)詞匯之間的語(yǔ)種內(nèi)關(guān)聯(lián)關(guān)系,如同義詞關(guān)聯(lián)關(guān)系、同義詞關(guān)聯(lián)關(guān)系等,且該語(yǔ)料庫(kù)還設(shè)有發(fā)音相似度閾值和結(jié)構(gòu)相似度閾值,以查詢音似詞和形似詞。例如,從語(yǔ)料庫(kù)中獲取該“公司”的所有語(yǔ)種的翻譯,如英文“company”。

關(guān)聯(lián)詞匯獲取步驟S3:根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的語(yǔ)種內(nèi)關(guān)聯(lián)關(guān)系,獲取該名詞的同義詞、近義詞、音似詞和形似詞四種關(guān)聯(lián)詞匯中的至少一種,在此,從語(yǔ)料庫(kù)中獲取該“公司”的關(guān)聯(lián)詞匯“企業(yè)”、“firm”。

數(shù)據(jù)集名稱匹配步驟S4:將每個(gè)數(shù)據(jù)集名稱分別與關(guān)鍵詞和關(guān)聯(lián)詞匯進(jìn)行比較,獲取與關(guān)鍵詞或關(guān)聯(lián)詞匯匹配的目標(biāo)數(shù)據(jù)集,形成目標(biāo)數(shù)據(jù)集數(shù)組,數(shù)據(jù)集名稱為預(yù)獲取數(shù)據(jù)集的名稱。

查詢結(jié)果形成步驟S5:對(duì)目標(biāo)數(shù)據(jù)集數(shù)組進(jìn)行去重處理和排序,形成關(guān)鍵詞的查詢結(jié)果,在此,查詢結(jié)果為目標(biāo)數(shù)據(jù)集的名稱,而不是目標(biāo)數(shù)據(jù)集中的具體數(shù)據(jù)。

由上述技術(shù)方案可知,本實(shí)施例提供的基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法,通過(guò)語(yǔ)料庫(kù)快速獲取指定關(guān)鍵詞在各種語(yǔ)種的關(guān)聯(lián)詞匯,并且,在多源異構(gòu)海量數(shù)據(jù)集中,該方法根據(jù)關(guān)鍵詞和延伸出的關(guān)聯(lián)詞匯進(jìn)行查找,能夠更全面、準(zhǔn)確地查找到目標(biāo)數(shù)據(jù)集,滿足用戶多樣化的業(yè)務(wù)查詢需求,經(jīng)過(guò)去重處理和排序后的數(shù)據(jù)集查詢結(jié)果,方便用戶快速查看,有助于提高業(yè)務(wù)查詢效率。

因此,本實(shí)施例基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法,能夠在多源異構(gòu)海量數(shù)據(jù)集的場(chǎng)景下,快速、準(zhǔn)確地進(jìn)行數(shù)據(jù)集查詢,提高數(shù)據(jù)集查詢效率。

為了進(jìn)一步提高本實(shí)施例基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法的準(zhǔn)確性,具體地,在關(guān)聯(lián)詞匯獲取方面,該方法的實(shí)現(xiàn)過(guò)程如下:

根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的同義關(guān)聯(lián)關(guān)系,獲取該名詞的同義詞。

根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的近義關(guān)聯(lián)關(guān)系,獲取該名詞的近義詞。

根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的發(fā)音相似度閾值,獲取該名詞的音似詞。

根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的結(jié)構(gòu)相似度閾值,獲取該名詞的形似詞,語(yǔ)種內(nèi)關(guān)聯(lián)關(guān)系包括同義關(guān)聯(lián)關(guān)系、近義關(guān)聯(lián)關(guān)系、發(fā)音相似度閾值和結(jié)構(gòu)相似度閾值。在此,該方法能夠根據(jù)不同的語(yǔ)種內(nèi)關(guān)聯(lián)關(guān)系,如同義關(guān)聯(lián)關(guān)系、近義關(guān)聯(lián)關(guān)系、發(fā)音相似度閾值和結(jié)構(gòu)相似度閾值,獲取同義詞、近義詞、音似詞和形似詞,預(yù)設(shè)置的發(fā)音相似度閾值和結(jié)構(gòu)相似度閾值,能夠限制音似詞和形似詞的納入范圍,有助于提高關(guān)聯(lián)詞匯的準(zhǔn)確性,為獲取可靠的數(shù)據(jù)集查詢結(jié)果提供有效的信息支持。

為了進(jìn)一步方便用戶應(yīng)用本實(shí)施例基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法,具體地,在查詢結(jié)果形成步驟S5之后,該方法還包括查詢結(jié)果再處理步驟:

獲取第一查詢結(jié)果和第二查詢結(jié)果,第一查詢結(jié)果為第一關(guān)鍵詞的查詢結(jié)果,第二查詢結(jié)果為第二關(guān)鍵詞的查詢結(jié)果。如第一關(guān)鍵詞為“企業(yè)”,第一查詢結(jié)果為DList1,第二關(guān)鍵詞為“中國(guó)”,第二查詢結(jié)果為DList2。

根據(jù)指定的運(yùn)算關(guān)系,對(duì)第一查詢結(jié)果和第二查詢結(jié)果進(jìn)行運(yùn)算處理,形成再處理查詢結(jié)果。指定的運(yùn)算關(guān)系可以是交集運(yùn)算關(guān)系、并集運(yùn)算關(guān)系、差集運(yùn)算關(guān)系和補(bǔ)集運(yùn)算關(guān)系,以及其他對(duì)查詢結(jié)果進(jìn)行二次處理的運(yùn)算處理規(guī)則等,相應(yīng)的,再處理查詢結(jié)果包括交集查詢結(jié)果、并集查詢結(jié)果、差集查詢結(jié)果和補(bǔ)集查詢結(jié)果,以及其他類型查詢結(jié)果,以滿足用戶多樣化的業(yè)務(wù)需求,拓寬應(yīng)用場(chǎng)景,方便用戶使用,有助于提高用戶體驗(yàn)。

例如,根據(jù)指定的交集運(yùn)算關(guān)系,遍歷第一查詢結(jié)果和第二查詢結(jié)果中的每項(xiàng)目標(biāo)數(shù)據(jù)集,篩選出同時(shí)存在于第一查詢結(jié)果和第二查詢結(jié)果中的目標(biāo)數(shù)據(jù)集,并將篩選出的目標(biāo)數(shù)據(jù)集更新至交集查詢結(jié)果。在此,即遍歷DList1和DList2的每一項(xiàng)目標(biāo)數(shù)據(jù)集,如果某項(xiàng)目標(biāo)數(shù)據(jù)集同時(shí)存在于DList1和DList2中,則將該項(xiàng)目標(biāo)數(shù)據(jù)集記錄到交集查詢結(jié)果DList3,并進(jìn)行輸出。

根據(jù)指定的并集運(yùn)算關(guān)系,將第一查詢結(jié)果與第二查詢結(jié)果合并,并進(jìn)行去重處理和排序,形成并集查詢結(jié)果。即合并DList1、DList2,再進(jìn)行去重和排序,輸出并集查詢結(jié)果DList4。

根據(jù)指定的差集運(yùn)算關(guān)系,遍歷第一查詢結(jié)果和第二查詢結(jié)果中的每項(xiàng)目標(biāo)數(shù)據(jù)集,篩選出存在于第一查詢結(jié)果且不存在第二查詢結(jié)果中的目標(biāo)數(shù)據(jù)集,并將篩選出的目標(biāo)數(shù)據(jù)集更新至差集查詢結(jié)果。如果某項(xiàng)目標(biāo)數(shù)據(jù)集存在于DList1,但不存在于DList2中,或某項(xiàng)目標(biāo)數(shù)據(jù)集不存在于DList1,但存在于DList2中,則將該項(xiàng)目標(biāo)數(shù)據(jù)集記錄到差集查詢結(jié)果DList5,并進(jìn)行輸出。

相應(yīng)的,對(duì)于補(bǔ)集運(yùn)算關(guān)系,若第一查詢結(jié)果包括且不僅限于第二查詢結(jié)果中的目標(biāo)數(shù)據(jù)集,根據(jù)指定的補(bǔ)集運(yùn)算關(guān)系,遍歷第一查詢結(jié)果和第二查詢結(jié)果中的每項(xiàng)目標(biāo)數(shù)據(jù)集,篩選出存在于第一查詢結(jié)果且不存在第二查詢結(jié)果中的目標(biāo)數(shù)據(jù)集,并將篩選出的目標(biāo)數(shù)據(jù)集更新至補(bǔ)集查詢結(jié)果。如果某項(xiàng)目標(biāo)數(shù)據(jù)集存在于DList1,但不存在于DList2中,則將該項(xiàng)目標(biāo)數(shù)據(jù)集記錄到補(bǔ)集查詢結(jié)果DList6,并進(jìn)行輸出。

為了進(jìn)一步提高本實(shí)施例基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢方法的處理效率,該方法還能夠根據(jù)用戶需求,對(duì)目標(biāo)數(shù)據(jù)集進(jìn)行過(guò)濾與篩選。在關(guān)聯(lián)詞匯獲取步驟S3之后,數(shù)據(jù)集名稱匹配步驟S4之前,該方法還包括關(guān)聯(lián)詞匯篩選步驟:

根據(jù)預(yù)設(shè)置的關(guān)聯(lián)詞匯篩選原則,檢驗(yàn)關(guān)聯(lián)詞匯,獲取符合關(guān)聯(lián)詞匯篩選原則的目標(biāo)關(guān)聯(lián)詞匯,再將每個(gè)數(shù)據(jù)集名稱分別與關(guān)鍵詞和目標(biāo)關(guān)聯(lián)詞匯進(jìn)行比較,獲取與關(guān)鍵詞或目標(biāo)關(guān)聯(lián)詞匯匹配的目標(biāo)數(shù)據(jù)集。其中,關(guān)聯(lián)詞篩選原則可以根據(jù)用戶需求設(shè)置,如語(yǔ)種限制,則設(shè)置語(yǔ)種篩選原則,根據(jù)預(yù)設(shè)置的語(yǔ)種篩選原則,檢驗(yàn)關(guān)聯(lián)詞匯,保留關(guān)鍵詞在目標(biāo)語(yǔ)種中的目標(biāo)關(guān)聯(lián)詞匯。若用戶需要關(guān)聯(lián)詞匯種類的限制,則設(shè)置關(guān)聯(lián)詞匯種類篩選原則,根據(jù)預(yù)設(shè)置的關(guān)聯(lián)詞匯種類篩選原則,檢驗(yàn)關(guān)聯(lián)詞匯,保留該關(guān)鍵詞指定種類的目標(biāo)關(guān)聯(lián)詞匯,如指定的篩選出同義詞、近義詞等,關(guān)聯(lián)詞匯篩選原則包括語(yǔ)種篩選原則和關(guān)聯(lián)詞匯種類篩選原則。此時(shí),目標(biāo)數(shù)據(jù)集的數(shù)量會(huì)大大降低,有助于提高后續(xù)數(shù)據(jù)處理效率。在此,用戶可以根據(jù)實(shí)際需求,進(jìn)行篩選,既增強(qiáng)了用戶體驗(yàn),又有助于提高數(shù)據(jù)處理效率。

同時(shí),在獲取目標(biāo)數(shù)據(jù)集時(shí),針對(duì)數(shù)據(jù)集名稱、關(guān)鍵詞和目標(biāo)關(guān)聯(lián)詞匯均含有字符的情形,該方法的匹配規(guī)則為包含預(yù)指定順序的字符,即將每個(gè)數(shù)據(jù)集名稱分別與關(guān)鍵詞和目標(biāo)關(guān)聯(lián)詞匯進(jìn)行比較:若該數(shù)據(jù)集名稱與關(guān)鍵詞中均包含預(yù)指定順序的字符,則判斷該數(shù)據(jù)集為目標(biāo)數(shù)據(jù)集;或若該數(shù)據(jù)集名稱與目標(biāo)關(guān)聯(lián)詞匯中均包含預(yù)指定順序的字符,則判斷該數(shù)據(jù)集為目標(biāo)數(shù)據(jù)集。在此,若含有預(yù)指定順序的字符,即可達(dá)到匹配的要求,該方法并不要求大小寫(xiě)一致,能夠保證獲取目標(biāo)數(shù)據(jù)集的準(zhǔn)確性,同時(shí),也有助于提供數(shù)據(jù)處理效率。

第二方面,本發(fā)明實(shí)施例提供一種基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢裝置,結(jié)合圖2,該裝置包括關(guān)鍵詞獲取模塊1、關(guān)鍵詞翻譯模塊2、關(guān)聯(lián)詞匯獲取模塊3、數(shù)據(jù)集名稱匹配模塊4和查詢結(jié)果形成模塊5,關(guān)鍵詞獲取模塊1用于獲取指定的關(guān)鍵詞;關(guān)鍵詞翻譯模塊2用于根據(jù)關(guān)鍵詞和預(yù)獲取語(yǔ)料庫(kù)的語(yǔ)種間關(guān)聯(lián)關(guān)系,獲取關(guān)鍵詞翻譯為不同語(yǔ)種時(shí)的名詞;關(guān)聯(lián)詞匯獲取模塊3用于根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的語(yǔ)種內(nèi)關(guān)聯(lián)關(guān)系,獲取該名詞的同義詞、近義詞、音似詞和形似詞四種關(guān)聯(lián)詞匯中的至少一種;數(shù)據(jù)集名稱匹配模塊4用于將每個(gè)數(shù)據(jù)集名稱分別與關(guān)鍵詞和關(guān)聯(lián)詞匯進(jìn)行比較,獲取與關(guān)鍵詞或關(guān)聯(lián)詞匯匹配的目標(biāo)數(shù)據(jù)集,形成目標(biāo)數(shù)據(jù)集數(shù)組,數(shù)據(jù)集名稱為預(yù)獲取數(shù)據(jù)集的名稱;查詢結(jié)果形成模塊5用于對(duì)目標(biāo)數(shù)據(jù)集數(shù)組進(jìn)行去重處理和排序,形成關(guān)鍵詞的查詢結(jié)果。

由上述技術(shù)方案可知,本實(shí)施例提供的基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢裝置,通過(guò)語(yǔ)料庫(kù)快速獲取指定關(guān)鍵詞在各種語(yǔ)種的關(guān)聯(lián)詞匯,并且,在多源異構(gòu)海量數(shù)據(jù)集中,該裝置根據(jù)關(guān)鍵詞和延伸出的關(guān)聯(lián)詞匯進(jìn)行查找,能夠更全面、準(zhǔn)確地查找到目標(biāo)數(shù)據(jù)集,滿足用戶多樣化的業(yè)務(wù)查詢需求,經(jīng)過(guò)去重處理和排序后的數(shù)據(jù)集查詢結(jié)果,方便用戶快速查看,有助于提高業(yè)務(wù)查詢效率。

因此,本實(shí)施例基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢裝置,能夠在多源異構(gòu)海量數(shù)據(jù)集的場(chǎng)景下,快速、準(zhǔn)確地進(jìn)行數(shù)據(jù)集查詢,提高數(shù)據(jù)集查詢效率。

具體地,結(jié)合圖3,關(guān)聯(lián)詞匯獲取模塊3具體包括同義詞獲取子模塊、近義詞獲取子模塊、音似詞獲取子模塊和形似詞獲取子模塊,同義詞獲取子模塊用于根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的同義關(guān)聯(lián)關(guān)系,獲取該名詞的同義詞;近義詞獲取子模塊用于根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的近義關(guān)聯(lián)關(guān)系,獲取該名詞的近義詞;音似詞獲取子模塊用于根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的發(fā)音相似度閾值,獲取該名詞的音似詞;形似詞獲取子模塊用于根據(jù)每個(gè)名詞和該名詞在語(yǔ)料庫(kù)中所屬語(yǔ)種的結(jié)構(gòu)相似度閾值,獲取該名詞的形似詞,語(yǔ)種內(nèi)關(guān)聯(lián)關(guān)系包括同義關(guān)聯(lián)關(guān)系、近義關(guān)聯(lián)關(guān)系、發(fā)音相似度閾值和結(jié)構(gòu)相似度閾值。在此,該關(guān)聯(lián)詞匯獲取模塊3能夠根據(jù)不同的語(yǔ)種內(nèi)關(guān)聯(lián)關(guān)系,如同義關(guān)聯(lián)關(guān)系、近義關(guān)聯(lián)關(guān)系、發(fā)音相似度閾值和結(jié)構(gòu)相似度閾值,獲取同義詞、近義詞、音似詞和形似詞,預(yù)設(shè)置的發(fā)音相似度閾值和結(jié)構(gòu)相似度閾值,能夠限制音似詞和形似詞的納入范圍,有助于提高關(guān)聯(lián)詞匯的準(zhǔn)確性,為獲取可靠的數(shù)據(jù)集查詢結(jié)果提供有效的信息支持。

具體地,結(jié)合圖3,本實(shí)施例基于多源異構(gòu)數(shù)據(jù)集的數(shù)據(jù)查詢裝置還包括查詢結(jié)果再處理模塊,查詢結(jié)果再處理模塊包括查詢結(jié)果獲取子模塊和查詢結(jié)果運(yùn)算子模塊,查詢結(jié)果獲取子模塊用于獲取第一查詢結(jié)果和第二查詢結(jié)果,所述第一查詢結(jié)果為第一關(guān)鍵詞的查詢結(jié)果,所述第二查詢結(jié)果為第二關(guān)鍵詞的查詢結(jié)果;查詢結(jié)果運(yùn)算子模塊用于根據(jù)指定的運(yùn)算關(guān)系,對(duì)所述第一查詢結(jié)果和所述第二查詢結(jié)果進(jìn)行運(yùn)算處理,形成再處理查詢結(jié)果。指定的運(yùn)算關(guān)系可以是交集運(yùn)算關(guān)系、并集運(yùn)算關(guān)系、差集運(yùn)算關(guān)系和補(bǔ)集運(yùn)算關(guān)系,以及其他對(duì)查詢結(jié)果進(jìn)行二次處理的運(yùn)算處理規(guī)則等,相應(yīng)的,再處理查詢結(jié)果包括交集查詢結(jié)果、并集查詢結(jié)果、差集查詢結(jié)果和補(bǔ)集查詢結(jié)果,以及其他類型查詢結(jié)果,以滿足用戶多樣化的業(yè)務(wù)需求,拓寬應(yīng)用場(chǎng)景,方便用戶使用,有助于提高用戶體驗(yàn)。

例如,查詢結(jié)果運(yùn)算子模塊能夠根據(jù)指定的交集運(yùn)算關(guān)系,遍歷第一查詢結(jié)果和第二查詢結(jié)果中的每項(xiàng)目標(biāo)數(shù)據(jù)集,篩選出同時(shí)存在于第一查詢結(jié)果和第二查詢結(jié)果中的目標(biāo)數(shù)據(jù)集,并將篩選出的目標(biāo)數(shù)據(jù)集更新至交集查詢結(jié)果。查詢結(jié)果運(yùn)算子模塊根據(jù)指定的并集運(yùn)算關(guān)系,將第一查詢結(jié)果與第二查詢結(jié)果合并,并進(jìn)行去重處理和排序,形成并集查詢結(jié)果。查詢結(jié)果運(yùn)算子模塊根據(jù)指定的差集運(yùn)算關(guān)系,遍歷第一查詢結(jié)果和第二查詢結(jié)果中的每項(xiàng)目標(biāo)數(shù)據(jù)集,篩選出存在于第一查詢結(jié)果且不存在第二查詢結(jié)果中的目標(biāo)數(shù)據(jù)集,并將篩選出的目標(biāo)數(shù)據(jù)集更新至差集查詢結(jié)果。相應(yīng)的,對(duì)于補(bǔ)集運(yùn)算關(guān)系,若第一查詢結(jié)果包括且不僅限于第二查詢結(jié)果中的目標(biāo)數(shù)據(jù)集,查詢結(jié)果運(yùn)算子模塊根據(jù)指定的補(bǔ)集運(yùn)算關(guān)系,遍歷第一查詢結(jié)果和第二查詢結(jié)果中的每項(xiàng)目標(biāo)數(shù)據(jù)集,篩選出存在于第一查詢結(jié)果且不存在第二查詢結(jié)果中的目標(biāo)數(shù)據(jù)集,并將篩選出的目標(biāo)數(shù)據(jù)集更新至補(bǔ)集查詢結(jié)果。

最后應(yīng)說(shuō)明的是:以上各實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述各實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分或者全部技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的范圍,其均應(yīng)涵蓋在本發(fā)明的權(quán)利要求和說(shuō)明書(shū)的范圍當(dāng)中。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1