專利名稱:一種基于檢索結(jié)果相關(guān)性判斷的檢索方法及裝置的制作方法
一種基于檢索結(jié)果相關(guān)性判斷的檢索方法及裝置
技術(shù)領(lǐng)域:
本發(fā)明涉及搜索引擎領(lǐng)域,特別涉及一種基于檢索結(jié)果相關(guān)性判斷的檢索方法及
直O(jiān)
背景技術(shù):
目前的搜索引擎,在對(duì)用戶的查詢?cè)~進(jìn)行檢索時(shí),通常有兩種方式,第一種是完全按照用戶的查詢?cè)~進(jìn)行檢索,如果檢索效果不好,由用戶修改查詢?cè)~后再次進(jìn)行檢索,這種方式下,可能存在再次檢索效果仍然不佳,造成用戶的體驗(yàn)不夠理想,同時(shí)也浪費(fèi)了搜索引擎的計(jì)算資源的缺陷。為了對(duì)上述情況進(jìn)行改進(jìn),有一些搜索引擎采用了查詢擴(kuò)展的策略, 對(duì)用戶輸入的檢索詞進(jìn)行擴(kuò)展,以得到更大范圍的檢索結(jié)果,但是在這種方式下,搜索引擎會(huì)對(duì)所有的用戶查詢?cè)~采用同樣的計(jì)算方法,即對(duì)所有符合擴(kuò)展邏輯的查詢?cè)~進(jìn)行擴(kuò)展處理,再一次性對(duì)用戶查詢?cè)~和所有的擴(kuò)展查詢?cè)~都進(jìn)行檢索。然而可能用戶查詢?cè)~和擴(kuò)展查詢?cè)~中的某個(gè)或某些查詢?cè)~得到的檢索結(jié)果已經(jīng)能夠滿足用戶的需要,顯然,現(xiàn)有技術(shù)中的檢索方法浪費(fèi)了搜索引擎資源。
發(fā)明內(nèi)容本發(fā)明所要解決的技術(shù)問題是提供一種基于檢索結(jié)果相關(guān)性判斷的檢索方法及裝置,以解決現(xiàn)有技術(shù)中,搜索引擎對(duì)用戶查詢?cè)~和所有擴(kuò)展查詢?cè)~都進(jìn)行檢索,從而導(dǎo)致搜索引擎計(jì)算資源浪費(fèi)的缺陷。本發(fā)明為解決技術(shù)問題而采用的技術(shù)方案是提供一種基于檢索結(jié)果相關(guān)性判斷的檢索方法,包括:A.利用用戶的原始查詢生成包含一個(gè)以上查詢候選的查詢候選序列; B.對(duì)所述查詢候選序列中一個(gè)尚未檢索的查詢候選進(jìn)行檢索得到當(dāng)前檢索結(jié)果;C.利用所述當(dāng)前檢索結(jié)果得到參與相關(guān)性計(jì)算的目標(biāo)檢索結(jié)果,并計(jì)算所述目標(biāo)檢索結(jié)果與所述原始查詢的相關(guān)性;D.判斷所述目標(biāo)檢索結(jié)果與所述原始查詢是否足夠相關(guān)或預(yù)設(shè)的終結(jié)條件是否滿足,如果所述目標(biāo)檢索結(jié)果與所述原始查詢足夠相關(guān)或所述終結(jié)條件滿足, 則執(zhí)行步驟E ;否則返回執(zhí)行所述步驟B ;E.將所有已檢索的查詢候選對(duì)應(yīng)的檢索結(jié)果作為最終檢索結(jié)果返回給所述用戶。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,所述步驟C中,將所述當(dāng)前檢索結(jié)果作為所述目標(biāo)
檢索結(jié)果。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,所述步驟E包括E1.將所述當(dāng)前檢索結(jié)果與先前所有已檢索的查詢候選得到的檢索結(jié)果合并得到所述最終檢索結(jié)果;E2.向所述用戶返回所述最終檢索結(jié)果。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,所述步驟C包括C1.將所述當(dāng)前檢索結(jié)果與先前所有已檢索的查詢候選得到的檢索結(jié)果合并,并將合并后的檢索結(jié)果作為所述目標(biāo)檢索結(jié)果;C2.計(jì)算所述目標(biāo)檢索結(jié)果與所述原始查詢的相關(guān)性。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,所述步驟A包括:A1.對(duì)所述原始查詢進(jìn)行分詞處理,得到分詞類查詢候選;A2.利用所述分詞類查詢候選對(duì)所述原始查詢進(jìn)行擴(kuò)展處理,得到擴(kuò)展類查詢候選;A3.對(duì)所述分詞類查詢候選和所述擴(kuò)展類查詢候選進(jìn)行排序得到所述查詢候選序列。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,所述相關(guān)性的計(jì)算依據(jù)至少包括所述目標(biāo)檢索結(jié)果的權(quán)值或所述目標(biāo)檢索結(jié)果的數(shù)目?jī)烧咂渲兄弧8鶕?jù)本發(fā)明之一優(yōu)選實(shí)施例,所述相關(guān)性至少體現(xiàn)為下列參數(shù)之一所述目標(biāo)檢索結(jié)果的第一頁結(jié)果的平均權(quán)值、所述目標(biāo)檢索結(jié)果的最高權(quán)值、所述目標(biāo)檢索結(jié)果的最低權(quán)值、所述目標(biāo)檢索結(jié)果中權(quán)值滿足第一閾值的檢索結(jié)果的數(shù)目或所述目標(biāo)檢索結(jié)果的總數(shù)目。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,所述終結(jié)條件包括所述查詢候選序列中的所有查詢候選均已檢索完畢或所述基于檢索結(jié)果相關(guān)性判斷的檢索方法的執(zhí)行時(shí)間達(dá)到設(shè)定的第
二閾值。本發(fā)明還提供了一種基于檢索結(jié)果相關(guān)性判斷的檢索裝置,包括生成單元,用于利用用戶的原始查詢生成包含一個(gè)以上查詢候選的查詢候選序列;檢索單元,用于對(duì)所述查詢候選序列中一個(gè)尚未檢索的查詢候選進(jìn)行檢索得到當(dāng)前檢索結(jié)果;相關(guān)性計(jì)算單元, 用于利用所述當(dāng)前檢索結(jié)果得到參與相關(guān)性計(jì)算的目標(biāo)檢索結(jié)果,并計(jì)算所述目標(biāo)檢索結(jié)果與所述原始查詢的相關(guān)性;判斷單元,用于判斷所述目標(biāo)檢索結(jié)果與所述原始查詢是否足夠相關(guān)或預(yù)設(shè)的終結(jié)條件是否滿足,如果所述目標(biāo)檢索結(jié)果與所述原始查詢足夠相關(guān)或所述終結(jié)條件滿足,則觸發(fā)結(jié)果返回單元;否則觸發(fā)所述檢索單元執(zhí)行所述檢索;結(jié)果返回單元,用于受到所述判斷單元的觸發(fā)后,將所有已檢索的查詢候選對(duì)應(yīng)的檢索結(jié)果作為最終檢索結(jié)果返回給所述用戶。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,所述相關(guān)性計(jì)算單元將所述當(dāng)前檢索結(jié)果作為所述目標(biāo)檢索結(jié)果。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,所述結(jié)果返回單元包括合并子單元,用于將所述當(dāng)前檢索結(jié)果與先前所有已檢索的查詢候選得到的檢索結(jié)果合并得到所述最終檢索結(jié)果;發(fā)送子單元,用于向所述用戶返回所述最終檢索結(jié)果。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,所述相關(guān)性計(jì)算單元包括合并子單元,用于將所述當(dāng)前檢索結(jié)果與先前所有已檢索的查詢候選得到的檢索結(jié)果合并,并將合并后檢索結(jié)果作為所述目標(biāo)檢索結(jié)果;計(jì)算子單元,用于計(jì)算所述目標(biāo)檢索結(jié)果與所述原始查詢的相關(guān)性。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,所述生成單元包括分詞子單元,用于對(duì)所述原始查詢進(jìn)行分詞處理,得到分詞類查詢候選;擴(kuò)展子單元,用于利用所述分詞類查詢候選對(duì)所述原始查詢進(jìn)行擴(kuò)展處理,得到擴(kuò)展類查詢候選;排序子單元,用于對(duì)所述分詞類查詢候選和所述擴(kuò)展類查詢候選進(jìn)行排序得到所述查詢候選序列。根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,所述相關(guān)性的計(jì)算依據(jù)至少包括所述目標(biāo)檢索結(jié)果的權(quán)值或所述目標(biāo)檢索結(jié)果的數(shù)目?jī)烧咂渲兄?。根?jù)本發(fā)明之一優(yōu)選實(shí)施例,所述相關(guān)性至少體現(xiàn)為下列參數(shù)之一所述目標(biāo)檢索結(jié)果的第一頁結(jié)果的平均權(quán)值、所述目標(biāo)檢索結(jié)果的最高權(quán)值、所述目標(biāo)檢索結(jié)果的最低權(quán)值、所述目標(biāo)檢索結(jié)果中權(quán)值滿足第一閾值的檢索結(jié)果的數(shù)目或所述目標(biāo)檢索結(jié)果的總數(shù)目。
根據(jù)本發(fā)明之一優(yōu)選實(shí)施例,所述終結(jié)條件包括所述查詢候選序列中的所有查詢候選均已檢索完畢或所述基于檢索結(jié)果相關(guān)性判斷的檢索裝置的執(zhí)行時(shí)間達(dá)到設(shè)定的第
二閾值。由以上方式可以看出,通過在逐一檢索過程中對(duì)檢索結(jié)果的相關(guān)性進(jìn)行判斷,可以很好地在滿足用戶需求與降低搜索引擎計(jì)算復(fù)雜度從而減少搜索引擎計(jì)算資源之間取得平衡。當(dāng)在逐一檢索過程中發(fā)現(xiàn)檢索結(jié)果的相關(guān)性滿足條件或者終結(jié)條件滿足時(shí),本發(fā)明的方法就會(huì)停止對(duì)擴(kuò)展查詢?cè)~進(jìn)行檢索,從而與現(xiàn)有技術(shù)相比,在滿足用戶需求的前提下減小了搜索引擎的系統(tǒng)開銷,加快了搜索引擎的響應(yīng)速度。
圖1為本發(fā)明實(shí)施例中基于檢索結(jié)果相關(guān)性判斷的檢索方法的流程示意圖;圖2為本發(fā)明中基于檢索結(jié)果相關(guān)性判斷的檢索方法的實(shí)施例一的流程示意圖;圖3為本發(fā)明實(shí)施例中生成查詢候選序列的方法的流程示意圖;圖4為本發(fā)明實(shí)施例中決策樹的示意圖;圖5為本發(fā)明中基于檢索結(jié)果相關(guān)性判斷的檢索方法的實(shí)施例二的流程示意圖;圖6為本發(fā)明中基于檢索結(jié)果相關(guān)性判斷的檢索裝置的實(shí)施例一的結(jié)構(gòu)示意框圖;圖7為本發(fā)明中基于檢索結(jié)果相關(guān)性判斷的檢索裝置的實(shí)施例二的結(jié)構(gòu)示意框圖。
具體實(shí)施方式為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明進(jìn)行詳細(xì)描述。請(qǐng)參考圖1,圖1為本發(fā)明實(shí)施例中基于檢索結(jié)果相關(guān)性判斷的檢索方法的流程示意圖。如圖1所示,所述方法包括步驟101 利用用戶的原始查詢生成包含一個(gè)以上查詢候選的查詢候選序列。步驟102 對(duì)查詢候選序列中的一個(gè)尚未檢索的查詢候選進(jìn)行檢索得到當(dāng)前檢索結(jié)果。步驟103 利用當(dāng)前檢索結(jié)果得到參與相關(guān)性計(jì)算的目標(biāo)檢索結(jié)果,并計(jì)算目標(biāo)檢索結(jié)果與原始查詢的相關(guān)性。步驟104 判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān)或預(yù)設(shè)的終結(jié)條件是否滿足,如果目標(biāo)檢索結(jié)果與原始查詢足夠相關(guān)或預(yù)設(shè)的終結(jié)條件滿足,則執(zhí)行步驟105,否則返回執(zhí)行步驟102。步驟105 將所有已檢索的查詢候選對(duì)應(yīng)的檢索結(jié)果作為最終檢索結(jié)果返回給用戶。下面結(jié)合具體的實(shí)施例,對(duì)上述方法進(jìn)行說明。實(shí)施例一請(qǐng)一并參考圖1與圖2,圖2為本發(fā)明中基于檢索結(jié)果相關(guān)性判斷的檢索方法的實(shí)施例一的流程示意圖。如圖1、圖2所示,步驟1011與步驟101對(duì)應(yīng),在步驟1011中,利用用戶的原始查詢生成包含一個(gè)以上查詢候選的查詢候選序列。用戶的原始查詢,指的是用戶輸入的查詢語句,例如用戶輸入“西紅柿燒牛腩怎么做才好吃”,這個(gè)“西紅柿燒牛腩怎么做才好吃”就是用戶的原始查詢。請(qǐng)參考圖3,圖3為本發(fā)明實(shí)施例中生成查詢候選序列的方法的流程示意圖。如圖 3所示,為了利用用戶的原始查詢生成查詢候選序列,步驟1011包括步驟1011A 對(duì)用戶的原始查詢進(jìn)行分詞處理,得到分詞類查詢候選。例如對(duì)上面的用戶查詢“西紅柿燒牛腩怎么做才好吃”,經(jīng)過分詞處理后,可以得到“西紅柿燒牛腩/怎么做/才/好吃”或“西紅柿/燒/牛腩/怎么做/才/好吃”等查詢候選,“/”表示關(guān)鍵詞的分隔符。對(duì)原始查詢進(jìn)行分詞處理,可以采用現(xiàn)有分詞技術(shù)進(jìn)行,在此不再贅述。步驟1011B 利用分詞類查詢候選對(duì)用戶的原始查詢進(jìn)行擴(kuò)展處理,得到擴(kuò)展類查詢候選。例如對(duì)上面的用戶查詢“西紅柿燒牛腩怎么做才好吃”,經(jīng)過擴(kuò)展處理后,可以得到“西紅柿/燒/牛腩/好吃/做法”或“番茄/燒/牛腩/做法”等。對(duì)原始查詢進(jìn)行擴(kuò)展處理,也可采用現(xiàn)有技術(shù)進(jìn)行,例如同義詞擴(kuò)展、同范疇擴(kuò)展、利用省略原始查詢中部分詞語進(jìn)行擴(kuò)展等等,在此不再詳述。步驟1011C 對(duì)分詞類查詢候選和擴(kuò)展類查詢候選進(jìn)行排序得到查詢候選序列。 對(duì)分詞類查詢候選和擴(kuò)展類查詢候選進(jìn)行排序可采用現(xiàn)有技術(shù)進(jìn)行,例如按照分詞類查詢候選和擴(kuò)展類查詢候選分別與原始查詢的相似度進(jìn)行排序,相似度可用編輯距離進(jìn)行衡量,所述編輯距離是指兩個(gè)字串之間,由一個(gè)轉(zhuǎn)成另一個(gè)所需的最少編輯操作次數(shù),可采用的編輯操作包括將一個(gè)字符替換成另一個(gè)字符,插入一個(gè)字符,或刪除一個(gè)字符。仍以上面的用戶查詢“西紅柿燒牛腩怎么做才好吃”為例,可以得到查詢候選序列①“西紅柿燒牛腩 /怎么做/才/好吃”、②“西紅柿/燒/牛腩/怎么做/才/好吃”、③“西紅柿/燒/牛腩 /好吃/做法”、④“番茄/燒/牛腩/做法”等等。需要說明的是,圖3所示的生成查詢候選序列的方法只是示意性的描述,如果采用其他方法獲取到查詢候選序列,并不超出本發(fā)明思想。請(qǐng)繼續(xù)參考圖2。步驟1021與步驟102對(duì)應(yīng),在步驟1021中,對(duì)查詢候選序列中一個(gè)尚未檢索的查詢候選進(jìn)行檢索得到當(dāng)前檢索結(jié)果。在本發(fā)明中,獲取到查詢候選序列后,不會(huì)一次同時(shí)對(duì)其中所有的查詢候選進(jìn)行檢索,而是每次只對(duì)其中的一個(gè)尚未檢索的查詢候選進(jìn)行檢索得到與該查詢候選有關(guān)的檢索結(jié)果,作為當(dāng)前檢索結(jié)果,而是否對(duì)其他查詢候選進(jìn)行檢索,則依賴后續(xù)的操作。對(duì)查詢候選進(jìn)行檢索的順序可按照查詢候選序列的位置順序進(jìn)行,即排在序列前面的查詢候選將先被檢索。步驟1031與步驟103對(duì)應(yīng),在步驟1031中,將當(dāng)前檢索結(jié)果作為參與相關(guān)性計(jì)算的目標(biāo)檢索結(jié)果并計(jì)算目標(biāo)檢索結(jié)果與原始查詢的相關(guān)性。所謂目標(biāo)檢索結(jié)果指的是參與相關(guān)性計(jì)算的檢索結(jié)果,例如對(duì)用戶查詢“西紅柿燒牛腩怎么做才好吃”,在步驟1021中從查詢候選序列中取出查詢候選“西紅柿燒牛腩/怎么做/才/好吃”進(jìn)行檢索,得到包含5000條結(jié)果的當(dāng)前檢索結(jié)果,在步驟1031中,將把這 5000條結(jié)果的當(dāng)前檢索結(jié)果作為目標(biāo)檢索結(jié)果參與相關(guān)性計(jì)算。相關(guān)性指的是目標(biāo)檢索結(jié)果與原始查詢的相關(guān)性,在本實(shí)施例中,其計(jì)算依據(jù)至少包括目標(biāo)檢索結(jié)果的權(quán)值和目標(biāo)檢索結(jié)果的數(shù)目?jī)烧咂渲兄?。所謂目標(biāo)檢索結(jié)果的權(quán)值,指的是目標(biāo)檢索結(jié)果中每個(gè)結(jié)果形成的〈query,URL>的得分,該得分描述了檢索結(jié)果的鏈接(URL)與原始查詢(query)各個(gè)維度的匹配程度。例如對(duì)上文提到的query “西紅柿燒牛腩怎么做才好吃”,得到了 5000條目標(biāo)檢索結(jié)果,因此就有5000個(gè)URL,可以得到5000個(gè)<qUery,URL>的得分,其分別描述了該條檢索結(jié)果與原始查詢的匹配程度。由于〈query,URL>的得分可由現(xiàn)有技術(shù)得到,因此在此不再詳述。所述目標(biāo)檢索結(jié)果的數(shù)目,既包括目標(biāo)檢索結(jié)果每一頁包含的檢索結(jié)果的數(shù)目,也包括目標(biāo)檢索結(jié)果的總數(shù)目。在本實(shí)施例中,相關(guān)性至少體現(xiàn)為下列參數(shù)之一目標(biāo)檢索結(jié)果的第一頁結(jié)果的平均權(quán)值、目標(biāo)檢索結(jié)果的最高權(quán)值、目標(biāo)檢索結(jié)果的最低權(quán)值、目標(biāo)檢索結(jié)果中權(quán)值滿足設(shè)定閾值的檢索結(jié)果的數(shù)目、或目標(biāo)檢索結(jié)果的總數(shù)目。第一頁結(jié)果的平均權(quán)值,可由目標(biāo)檢索結(jié)果中第一頁檢索結(jié)果的各個(gè)條目的權(quán)值 (即〈query,URL>的得分)之和除以該頁的條目之和得到,而目標(biāo)檢索結(jié)果的最高權(quán)值或最低權(quán)值,指的是目標(biāo)檢索結(jié)果的所有條目的各個(gè)權(quán)值里的最高或最低值。需要說明的是,本實(shí)施例所舉的相關(guān)性計(jì)算依據(jù)以及由此導(dǎo)致的體現(xiàn)相關(guān)性的參數(shù),只是示意性的描述,在本發(fā)明的其他實(shí)施例中,相關(guān)性的計(jì)算依據(jù)還可以是其他的特征,例如檢索結(jié)果的用戶點(diǎn)擊數(shù)等等,由于采用不同的相關(guān)性計(jì)算依據(jù)而導(dǎo)致體現(xiàn)相關(guān)性的參數(shù)發(fā)生改變,仍在本發(fā)明的思想范圍之內(nèi)。步驟1041和步驟1042與步驟104對(duì)應(yīng),在步驟1041中,根據(jù)步驟1031中計(jì)算的相關(guān)性判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān),如果足夠相關(guān),則執(zhí)行步驟1051,否則執(zhí)行步驟1042。根據(jù)相關(guān)性判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān),可采用現(xiàn)有技術(shù)中的預(yù)置策略、機(jī)器學(xué)習(xí)或決策樹的方法來進(jìn)行。當(dāng)體現(xiàn)相關(guān)性的參數(shù)比較少時(shí),可采用判斷參數(shù)是否滿足設(shè)定閾值的策略來判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān)。例如預(yù)置策略為當(dāng)目標(biāo)檢索結(jié)果的第一頁結(jié)果的平均權(quán)值大于設(shè)定閾值時(shí),認(rèn)為目標(biāo)檢索結(jié)果與原始查詢足夠相關(guān)。當(dāng)體現(xiàn)相關(guān)性的參數(shù)較多時(shí),可采用機(jī)器學(xué)習(xí)及決策樹的方法。以機(jī)器學(xué)習(xí)方法為例進(jìn)行說明,例如采用支持向量機(jī)(SVM)的方法對(duì)目標(biāo)檢索結(jié)果進(jìn)行分類,將目標(biāo)檢索結(jié)果分為與原始查詢足夠相關(guān)和不夠相關(guān)兩類。在本實(shí)施例中, SVM方法中采用的特征就是步驟1031中體現(xiàn)相關(guān)性的幾個(gè)參數(shù)目標(biāo)檢索結(jié)果的第一頁結(jié)果的平均權(quán)值、目標(biāo)檢索結(jié)果的最高權(quán)值、目標(biāo)檢索結(jié)果的最低權(quán)值、目標(biāo)檢索結(jié)果中權(quán)值滿足設(shè)定閾值的檢索結(jié)果的數(shù)目、和目標(biāo)檢索結(jié)果的總數(shù)目。首先用標(biāo)注好類別(足夠相關(guān)或不夠相關(guān))的訓(xùn)練語料針對(duì)上述特征對(duì)SVM模型進(jìn)行訓(xùn)練,得到模型的參數(shù),然后就可以用該參數(shù)的模型對(duì)目標(biāo)檢索結(jié)果進(jìn)行分類,進(jìn)而得知目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān)。對(duì)利用決策樹的方法判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān),實(shí)際上就是利用決策樹對(duì)目標(biāo)檢索結(jié)果進(jìn)行分類,分為足夠相關(guān)或不夠相關(guān)。請(qǐng)參考圖4,圖4為本發(fā)明實(shí)施例中決策樹的示意圖。在決策樹的方法中采用的特征與機(jī)器學(xué)習(xí)方法中一樣,包括目標(biāo)檢索結(jié)果的第一頁結(jié)果的平均權(quán)值、目標(biāo)檢索結(jié)果的最高權(quán)值、目標(biāo)檢索結(jié)果的最低權(quán)值、目標(biāo)檢索結(jié)果中權(quán)值滿足設(shè)定閾值的檢索結(jié)果的數(shù)目、和目標(biāo)檢索結(jié)果的總數(shù)目。通過用標(biāo)注好的訓(xùn)練語料進(jìn)行訓(xùn)練,就可以得到位于每個(gè)節(jié)點(diǎn)處的特征與相應(yīng)的參數(shù),再利用這樣的決策樹,就可以對(duì)目標(biāo)檢索結(jié)果進(jìn)行分類,進(jìn)而得知目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān)。請(qǐng)繼續(xù)參考圖2。步驟1042 判斷預(yù)設(shè)的終結(jié)條件是否滿足,如果滿足,則執(zhí)行步驟1051,否則返回執(zhí)行步驟1021。終結(jié)條件是指結(jié)束對(duì)查詢候選序列中尚未檢索的其他查詢候選進(jìn)行檢索的條件,其包括查詢候選序列中所有的查詢候選均已檢索完畢或本發(fā)明的檢索方法的執(zhí)行時(shí)間達(dá)到了設(shè)定的閾值。值得注意的是,本實(shí)施例的步驟1041、步驟1042描述的相關(guān)判斷與終結(jié)條件判斷的順序僅為示意性描述,在其他實(shí)施例中,也可以先判斷終結(jié)條件是否滿足,再判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān),這兩者沒有必然的順序關(guān)系。步驟1051和步驟1052與步驟105對(duì)應(yīng)。在步驟1051中,將當(dāng)前檢索結(jié)果與先前所有已檢索的查詢候選得到的檢索結(jié)果合并作為最終檢索結(jié)果。對(duì)首個(gè)查詢候選得到的當(dāng)前檢索結(jié)果而言,先前所有已檢索的查詢候選得到的檢索結(jié)果為零,因此合并后的檢索結(jié)果還是當(dāng)前檢索結(jié)果,對(duì)非首個(gè)查詢候選得到的當(dāng)前檢索結(jié)果,與先前所有已檢索的查詢候選得到的檢索結(jié)果進(jìn)行合并,其方式包括按權(quán)值合并或按位置合并。按權(quán)值合并,就是對(duì)當(dāng)前檢索結(jié)果與先前所有已檢索的查詢候選得到的檢索結(jié)果,按權(quán)值的高低進(jìn)行排序,然后形成總的檢索結(jié)果即為合并后的最終檢索結(jié)果。這里權(quán)值的概念與步驟1031中描述的相同,指的是每個(gè)結(jié)果形成的〈query,URL>的得分。按位置合并,就是根據(jù)各個(gè)已檢索的查詢候選的檢索順序與各個(gè)已檢索的查詢候選對(duì)應(yīng)的檢索結(jié)果自身的順序進(jìn)行插值處理,例如第一、二、三個(gè)查詢候選得到的檢索結(jié)果,其得到的首條檢索結(jié)果分別位于合并后得到的最終檢索結(jié)果的第一、二、三個(gè)位置,得到的第二條檢索結(jié)果分別位于合并后得到的最終檢索結(jié)果的第四、五、六個(gè)位置,以此類推。步驟1052 向用戶返回最終的檢索結(jié)果,也就是將步驟1051中得到的最終檢索結(jié)果發(fā)送到用戶界面。實(shí)施例二 實(shí)施例二與實(shí)施例一的區(qū)別,是將合并操作提前到相關(guān)性計(jì)算之前進(jìn)行,然后在計(jì)算相關(guān)性的時(shí)候,將合并的檢索結(jié)果作為參與相關(guān)性計(jì)算的目標(biāo)檢索結(jié)果,下面對(duì)其進(jìn)行具體說明。請(qǐng)一并參考圖1與圖5,圖5為本發(fā)明中基于檢索結(jié)果相關(guān)性判斷的檢索方法的實(shí)施例二的流程示意圖。如圖1、圖5所示,步驟IOla與步驟101對(duì)應(yīng),在步驟IOla中,利用用戶的原始查詢生成包含一個(gè)以上查詢候選的查詢候選序列,這與所述檢索方法實(shí)施例一中的步驟1011 —致,在此不再重述。步驟10 與步驟102對(duì)應(yīng),在步驟10 中,對(duì)查詢候選序列中一個(gè)尚未檢索的查詢候選進(jìn)行檢索得到當(dāng)前檢索結(jié)果。這與所述檢索方法實(shí)施例一中的步驟1021 —致,在此不再重述。步驟103a、步驟10 與步驟103對(duì)應(yīng),在步驟103a中,將當(dāng)前檢索結(jié)果與先前所有已檢索的查詢候選得到的檢索結(jié)果合并,并將合并后的檢索結(jié)果作為目標(biāo)檢索結(jié)果。步驟103a與所述檢索方法實(shí)施例一的步驟1051中的合并操作類似,對(duì)首個(gè)查詢候選得到的當(dāng)前檢索結(jié)果而言,先前所有已檢索的查詢候選得到的檢索結(jié)果為零,因此合并后的檢索結(jié)果還是當(dāng)前檢索結(jié)果,對(duì)非首個(gè)查詢候選得到的當(dāng)前檢索結(jié)果,與先前所有已檢索的查詢候選得到的檢索結(jié)果進(jìn)行合并,其方式包括按權(quán)值合并或按位置合并。按權(quán)值合并或按位置合并均與所述檢索方法實(shí)施例一的步驟1051中介紹的相同,在此不再重述。步驟10 計(jì)算目標(biāo)檢索結(jié)果與原始查詢的相關(guān)性。相關(guān)性的計(jì)算依據(jù)與所述檢索方法實(shí)施例一中相同,包括目標(biāo)檢索結(jié)果的權(quán)值或目標(biāo)檢索結(jié)果的數(shù)目,由此產(chǎn)生的體現(xiàn)相關(guān)性的參數(shù)也與所述檢索方法實(shí)施例一中類似,至少包括下列參數(shù)中的一個(gè)目標(biāo)檢索結(jié)果的第一頁結(jié)果的平均權(quán)值、目標(biāo)檢索結(jié)果的最高權(quán)值、目標(biāo)檢索結(jié)果的最低權(quán)值、目標(biāo)檢索結(jié)果中權(quán)值滿足設(shè)定閾值的檢索結(jié)果的數(shù)目、或目標(biāo)檢索結(jié)果的總數(shù)目。步驟104a、步驟104b與步驟104對(duì)應(yīng),在步驟10 中,根據(jù)步驟10 中計(jì)算的相關(guān)性判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān),如果足夠相關(guān),則執(zhí)行步驟105a,否則執(zhí)行步驟104b。判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān)的方法,與所述檢索方法實(shí)施例一的步驟1041中介紹的類似,在此不再重述。步驟104b 判斷終結(jié)條件是否滿足,如果滿足,則執(zhí)行步驟105a,否則返回執(zhí)行步驟10加。終結(jié)條件與所述檢索方法實(shí)施例一中相同,包括查詢候選序列中所有的查詢候選均已檢索完畢或本發(fā)明的檢索方法的執(zhí)行時(shí)間達(dá)到了設(shè)定的閾值。值得注意的是,與所述檢索方法的實(shí)施例一相同,本實(shí)施例的步驟104a、步驟 104b描述的相關(guān)判斷與終結(jié)條件判斷的順序僅為示意性描述,在其他實(shí)施例中,也可以先判斷終結(jié)條件是否滿足,再判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān),這兩者沒有必然的順序關(guān)系。步驟10 與步驟105對(duì)應(yīng),在步驟10 中,將目標(biāo)檢索結(jié)果作為最終檢索結(jié)果向用戶展示,在本實(shí)施例中,目標(biāo)檢索結(jié)果就是當(dāng)前檢索結(jié)果與先前所有已檢索的查詢候選得到的檢索結(jié)果合并后的檢索結(jié)果。請(qǐng)參考圖6,圖6為本發(fā)明中基于檢索結(jié)果相關(guān)性判斷的檢索裝置的實(shí)施例一的結(jié)構(gòu)示意框圖。如圖6所示,所述裝置包括生成單元201、檢索單元202、相關(guān)性計(jì)算單元 203、判斷單元204及結(jié)果返回單元205。其中生成單元201,用于利用用戶的原始查詢生成包含一個(gè)以上查詢候選的查詢候選序列。用戶的原始查詢,指的是用戶輸入的查詢語句,例如用戶輸入“西紅柿燒牛腩怎么做才好吃”,這個(gè)“西紅柿燒牛腩怎么做才好吃”就是用戶的原始查詢。生成單元201包括分詞子單元2011、擴(kuò)展子單元2012及排序子單元2013。其中分詞子單元2011,用于對(duì)用戶的原始查詢進(jìn)行分詞處理,得到分詞類查詢候選。例如對(duì)上面的用戶查詢“西紅柿燒牛腩怎么做才好吃”,經(jīng)過分詞處理后,可以得到“西紅柿燒牛腩/怎么做/才/好吃”或“西紅柿/燒/牛腩/怎么做/才/好吃”等查詢候選,“/”表示關(guān)鍵詞的分隔符。對(duì)原始查詢進(jìn)行分詞處理,可以采用現(xiàn)有分詞技術(shù)進(jìn)行,在此不再贅述。擴(kuò)展子單元2012,用于利用分詞類查詢候選對(duì)用戶的原始查詢進(jìn)行擴(kuò)展處理,得到擴(kuò)展類查詢候選。例如對(duì)上面的用戶查詢“西紅柿燒牛腩怎么做才好吃”,經(jīng)過擴(kuò)展處理后,可以得到“西紅柿/燒/牛腩/好吃/做法”或“番茄/燒/牛腩/做法”等。對(duì)原始查詢進(jìn)行擴(kuò)展處理,也可采用現(xiàn)有技術(shù)進(jìn)行,例如同義詞擴(kuò)展、同范疇擴(kuò)展、利用省略原始查詢中部分詞語進(jìn)行擴(kuò)展等等,在此不再詳述。
排序子單元2013,用于對(duì)分詞類查詢候選和擴(kuò)展類查詢候選進(jìn)行排序得到查詢候選序列。對(duì)分詞類查詢候選和擴(kuò)展類查詢候選進(jìn)行排序可采用現(xiàn)有技術(shù)進(jìn)行,例如按照分詞類查詢候選和擴(kuò)展類查詢候選與原始查詢的相似度進(jìn)行排序,相似度可用編輯距離進(jìn)行衡量,所述編輯距離是指兩個(gè)字串之間,由一個(gè)轉(zhuǎn)成另一個(gè)所需的最少編輯操作次數(shù),可采用的編輯操作包括將一個(gè)字符替換成另一個(gè)字符,插入一個(gè)字符,刪除一個(gè)字符。仍以上面的用戶查詢“西紅柿燒牛腩怎么做才好吃”為例,可以得到查詢候選序列①“西紅柿燒牛腩 /怎么做/才/好吃”、②“西紅柿/燒/牛腩/怎么做/才/好吃”、③“西紅柿/燒/牛腩 /好吃/做法”、④“番茄/燒/牛腩/做法”等等。需要說明的是,生成單元201的實(shí)施方式并不僅限于上面的方式,如果生成單元 201采用了其他方式獲取到查詢候選序列,并不超出本發(fā)明思想。檢索單元202,用于對(duì)查詢候選序列中一個(gè)尚未檢索的查詢候選進(jìn)行檢索得到當(dāng)前檢索結(jié)果。在本發(fā)明中,獲取到查詢候選序列后,不會(huì)一次同時(shí)對(duì)其中所有的查詢候選進(jìn)行檢索,而是每次只對(duì)其中的一個(gè)尚未檢索的查詢候選進(jìn)行檢索得到與該查詢候選有關(guān)的檢索結(jié)果,作為當(dāng)前檢索結(jié)果,而是否對(duì)其他查詢候選進(jìn)行檢索,則依賴后續(xù)的操作。對(duì)查詢候選進(jìn)行檢索的順序可按照查詢候選序列的位置順序進(jìn)行,即排在序列前面的查詢候選將先被檢索。相關(guān)性計(jì)算單元203,用于將當(dāng)前檢索結(jié)果作為參與相關(guān)性計(jì)算的目標(biāo)檢索結(jié)果并計(jì)算目標(biāo)檢索結(jié)果與原始查詢的相關(guān)性。所謂目標(biāo)檢索結(jié)果指的是參與相關(guān)性計(jì)算的檢索結(jié)果,例如對(duì)用戶查詢“西紅柿燒牛腩怎么做才好吃”,檢索單元202從查詢候選序列中取出查詢候選“西紅柿燒牛腩/怎么做/才/好吃”進(jìn)行檢索,得到包含5000條結(jié)果的當(dāng)前檢索結(jié)果,相關(guān)性計(jì)算單元203把這5000條結(jié)果的當(dāng)前檢索結(jié)果作為目標(biāo)檢索結(jié)果參與相關(guān)性計(jì)算。相關(guān)性指的是目標(biāo)檢索結(jié)果與原始查詢的相關(guān)性,在本實(shí)施例中,其計(jì)算依據(jù)至少包括目標(biāo)檢索結(jié)果的權(quán)值或目標(biāo)檢索結(jié)果的數(shù)目?jī)烧咂渲兄弧K^目標(biāo)檢索結(jié)果的權(quán)值,指的是目標(biāo)檢索結(jié)果中每個(gè)結(jié)果形成的〈query,URL> 的得分,該得分描述了檢索結(jié)果的鏈接(URL)與原始查詢(query)各個(gè)維度的匹配程度。例如對(duì)上文提到的query “西紅柿燒牛腩怎么做才好吃”,得到了 5000條目標(biāo)檢索結(jié)果,因此就有5000個(gè)URL,可以得到5000個(gè)<qUery,URL>的得分,其分別描述了該條檢索結(jié)果與原始查詢的匹配程度。由于〈query,URL>的得分可由現(xiàn)有技術(shù)得到,因此在此不再詳述。所述目標(biāo)檢索結(jié)果的數(shù)目,既包括目標(biāo)檢索結(jié)果每一頁包含的檢索結(jié)果的條數(shù),也包括目標(biāo)檢索結(jié)果的總條數(shù)。在本實(shí)施例中,相關(guān)性至少體現(xiàn)為下列參數(shù)之一目標(biāo)檢索結(jié)果的第一頁結(jié)果的平均權(quán)值、目標(biāo)檢索結(jié)果的最高權(quán)值、目標(biāo)檢索結(jié)果的最低權(quán)值、目標(biāo)檢索結(jié)果中權(quán)值滿足設(shè)定閾值的檢索結(jié)果的數(shù)目、或目標(biāo)檢索結(jié)果的總數(shù)目。第一頁結(jié)果的平均權(quán)值,可由目標(biāo)檢索結(jié)果中第一頁檢索結(jié)果的各個(gè)條目的權(quán)值 (即〈query,URL>的得分)之和除以該頁的條目之和得到,而目標(biāo)檢索結(jié)果的最高權(quán)值或最低權(quán)值,指的是目標(biāo)檢索結(jié)果的所有條目的各個(gè)權(quán)值里的最高或最低值。需要說明的是,本實(shí)施例所舉的相關(guān)性計(jì)算依據(jù)以及由此導(dǎo)致的體現(xiàn)相關(guān)性的參數(shù),只是示意性的描述,在本發(fā)明的其他實(shí)施例中,相關(guān)性的計(jì)算依據(jù)還可以是其他的特征,例如檢索結(jié)果的用戶點(diǎn)擊數(shù)等等,由于采用不同的相關(guān)性計(jì)算依據(jù)而導(dǎo)致體現(xiàn)相關(guān)性的參數(shù)發(fā)生改變,仍在本發(fā)明的思想范圍之內(nèi)。判斷單元204,用于判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān)或預(yù)設(shè)的終結(jié)條件是否滿足,如果目標(biāo)檢索結(jié)果與原始查詢足夠相關(guān)或預(yù)設(shè)的終結(jié)條件滿足,則觸發(fā)結(jié)果返回單元205 ;否則觸發(fā)檢索單元202執(zhí)行檢索的操作。判斷單元204包括相關(guān)判斷子單元2041、終結(jié)條件判斷子單元2042。其中相關(guān)判斷子單元2041,用于根據(jù)相關(guān)性計(jì)算單元203計(jì)算的相關(guān)性判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān),如果足夠相關(guān),則觸發(fā)結(jié)果返回單元205中的合并子單元2051,否則觸發(fā)終結(jié)條件判斷子單元2042。根據(jù)相關(guān)性判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān),可采用現(xiàn)有技術(shù)中的預(yù)置策略、機(jī)器學(xué)習(xí)或決策樹的方法來進(jìn)行。當(dāng)體現(xiàn)相關(guān)性的參數(shù)比較少時(shí),可采用判斷參數(shù)是否滿足設(shè)定閾值的策略來判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān)。例如預(yù)置策略為當(dāng)目標(biāo)檢索結(jié)果的第一頁結(jié)果的平均權(quán)值大于設(shè)定閾值時(shí),認(rèn)為目標(biāo)檢索結(jié)果與原始查詢足夠相關(guān)。當(dāng)體現(xiàn)相關(guān)性的參數(shù)較多時(shí),可采用機(jī)器學(xué)習(xí)及決策樹的方法。以機(jī)器學(xué)習(xí)方法為例進(jìn)行說明,例如采用支持向量機(jī)(SVM)的方法對(duì)目標(biāo)檢索結(jié)果進(jìn)行分類,將目標(biāo)檢索結(jié)果分為與原始查詢足夠相關(guān)和不夠相關(guān)兩類。在本實(shí)施例中, SVM方法中采用的特征就是相關(guān)性計(jì)算單元203中所述體現(xiàn)相關(guān)性的幾個(gè)參數(shù)目標(biāo)檢索結(jié)果的第一頁結(jié)果的平均權(quán)值、目標(biāo)檢索結(jié)果的最高權(quán)值、目標(biāo)檢索結(jié)果的最低權(quán)值、目標(biāo)檢索結(jié)果中權(quán)值滿足設(shè)定閾值的檢索結(jié)果的數(shù)目、和目標(biāo)檢索結(jié)果的總條數(shù)。首先用標(biāo)注好類別(足夠相關(guān)或不夠相關(guān))的訓(xùn)練語料針對(duì)上述特征對(duì)SVM模型進(jìn)行訓(xùn)練,得到模型的參數(shù),然后就可以用該參數(shù)的模型對(duì)目標(biāo)檢索結(jié)果進(jìn)行分類,進(jìn)而得知目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān)。對(duì)利用決策樹的方法判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān),實(shí)際上就是利用決策樹對(duì)目標(biāo)檢索結(jié)果進(jìn)行分類,分為足夠相關(guān)或不夠相關(guān)。請(qǐng)參考圖4,圖4為本發(fā)明實(shí)施例中決策樹的示意圖。在決策樹的方法中采用的特征與機(jī)器學(xué)習(xí)方法中一樣,包括目標(biāo)檢索結(jié)果的第一頁結(jié)果的平均權(quán)值、目標(biāo)檢索結(jié)果的最高權(quán)值、目標(biāo)檢索結(jié)果的最低權(quán)值、目標(biāo)檢索結(jié)果中權(quán)值滿足設(shè)定閾值的檢索結(jié)果的數(shù)目、和目標(biāo)檢索結(jié)果的總數(shù)目。通過用標(biāo)注好的訓(xùn)練語料進(jìn)行訓(xùn)練,就可以得到位于每個(gè)節(jié)點(diǎn)處的特征與相應(yīng)的參數(shù),再利用這樣的決策樹,就可以對(duì)目標(biāo)檢索結(jié)果進(jìn)行分類,進(jìn)而得知目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān)。請(qǐng)繼續(xù)參考圖6。終結(jié)條件判斷子單元2042,用于判斷預(yù)設(shè)的終結(jié)條件是否滿足, 如果滿足,則觸發(fā)結(jié)果返回單元205中的合并子單元2051,否則觸發(fā)檢索單元202。終結(jié)條件是指結(jié)束對(duì)查詢候選序列中尚未檢索的其他查詢候選進(jìn)行檢索的條件,其包括查詢候選序列中所有的查詢候選均已檢索完畢或本發(fā)明的檢索裝置的執(zhí)行時(shí)間達(dá)到了設(shè)定的閾值。值得注意的是,本實(shí)施例的相關(guān)判斷子單元2041、終結(jié)條件判斷子單元2042的連接關(guān)系僅為示意性描述,在其他實(shí)施例中,由于判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān)或終結(jié)條件是否滿足的順序可以與本實(shí)施例相反,由此導(dǎo)致相關(guān)判斷子單元2041與終結(jié)條件判斷子單元2042的連接關(guān)系也會(huì)發(fā)生相應(yīng)的改變。
結(jié)果返回單元205,用于受到判斷單元204的觸發(fā)后,將所有已檢索的查詢候選對(duì)應(yīng)的檢索結(jié)果作為最終檢索結(jié)果返回給用戶。結(jié)果返回單元205包括合并子單元2051和發(fā)送子單元2052。合并子單元2051,用于受到判斷單元204的觸發(fā)后,將當(dāng)前檢索結(jié)果與先前所有已檢索的查詢候選得到的檢索結(jié)果合并得到最終檢索結(jié)果。對(duì)首個(gè)查詢候選得到的當(dāng)前檢索結(jié)果而言,先前所有已檢索的查詢候選得到的檢索結(jié)果為零,因此合并后的檢索結(jié)果還是當(dāng)前檢索結(jié)果,對(duì)非首個(gè)查詢候選得到的當(dāng)前檢索結(jié)果,與先前所有已檢索的查詢候選得到的檢索結(jié)果進(jìn)行合并,其方式包括按權(quán)值合并或按位置合并。按權(quán)值合并,就是對(duì)當(dāng)前檢索結(jié)果與先前所有已檢索的查詢候選得到的檢索結(jié)果,按權(quán)值的高低進(jìn)行排序,然后形成總的檢索結(jié)果即為合并后的最終檢索結(jié)果。這里權(quán)值的概念與相關(guān)性計(jì)算單元203中描述的相同,指的是每個(gè)結(jié)果形成的<qUery,URL>的得分。按位置合并,就是根據(jù)各個(gè)已檢索的查詢候選的檢索順序與各個(gè)已檢索的查詢候選對(duì)應(yīng)的檢索結(jié)果自身的順序進(jìn)行插值處理,例如第一、二、三個(gè)查詢候選得到的檢索結(jié)果,其得到的首條檢索結(jié)果分別位于合并后得到的最終檢索結(jié)果的第一、二、三個(gè)位置,得到的第二條檢索結(jié)果分別位于合并后得到的最終檢索結(jié)果的第四、五、六個(gè)位置,以此類推。發(fā)送子單元2052,用于向用戶返回最終的檢索結(jié)果,也就是將合并子單元2051確定的最終檢索結(jié)果發(fā)送到用戶界面。請(qǐng)參考圖7,圖7為本發(fā)明中基于檢索結(jié)果相關(guān)性判斷的檢索裝置的實(shí)施例二的結(jié)構(gòu)示意框圖。如圖7所示,所述裝置包括生成單元301、檢索單元302、相關(guān)性計(jì)算單元 303、判斷單元304及結(jié)果返回單元305。其中生成單元301,用于利用用戶的原始查詢生成包含一個(gè)以上查詢候選的查詢候選序列,其包括分詞子單元3011、擴(kuò)展子單元3012及排序子單元3013,這與所述檢索裝置實(shí)施例一中的分詞子單元2011、擴(kuò)展子單元2012及排序子單元2013 —致,在此不再重述。檢索單元302,用于對(duì)查詢候選序列中一個(gè)尚未檢索的查詢候選進(jìn)行檢索得到當(dāng)前檢索結(jié)果。這與所述檢索裝置實(shí)施例一中的檢索單元202 —致,在此不再重述。相關(guān)性計(jì)算單元303,用于利用當(dāng)前檢索結(jié)果得到參與相關(guān)性計(jì)算的目標(biāo)檢索結(jié)果,并計(jì)算目標(biāo)檢索結(jié)果與原始查詢的相關(guān)性。相關(guān)性計(jì)算單元303包括合并子單元3031 及計(jì)算子單元3032。其中合并子單元3031,用于將當(dāng)前檢索結(jié)果與先前所有已檢索的查詢候選得到的檢索結(jié)果合并,并將合并后的檢索結(jié)果作為目標(biāo)檢索結(jié)果。合并子單元3031與所述檢索裝置實(shí)施例一的合并子單元2051中的合并操作類似,對(duì)首個(gè)查詢候選得到的當(dāng)前檢索結(jié)果而言,先前所有已檢索的查詢候選得到的檢索結(jié)果為零,因此合并后的檢索結(jié)果還是當(dāng)前檢索結(jié)果,對(duì)非首個(gè)查詢候選得到的當(dāng)前檢索結(jié)果,與先前所有已檢索的查詢候選得到的檢索結(jié)果進(jìn)行合并,其方式包括按權(quán)值合并或按位置合并。按權(quán)值合并或按位置合并均與所述檢索裝置實(shí)施例一的合并子單元2051中介紹的相同,在此不再重述。計(jì)算子單元3032,用于計(jì)算目標(biāo)檢索結(jié)果與原始查詢的相關(guān)性。相關(guān)性的計(jì)算依據(jù)與所述檢索裝置實(shí)施例一中相同,包括目標(biāo)檢索結(jié)果的權(quán)值或目標(biāo)檢索結(jié)果的數(shù)目,由此產(chǎn)生的體現(xiàn)相關(guān)性的參數(shù)也與所述檢索裝置實(shí)施例一中類似,至少包括下列參數(shù)中的一個(gè)目標(biāo)檢索結(jié)果的第一頁結(jié)果的平均權(quán)值、目標(biāo)檢索結(jié)果的最高權(quán)值、目標(biāo)檢索結(jié)果的最低權(quán)值、目標(biāo)檢索結(jié)果中權(quán)值滿足設(shè)定閾值的檢索結(jié)果的數(shù)目、或目標(biāo)檢索結(jié)果的總數(shù)目。判斷單元304,用于判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān)或預(yù)設(shè)的終結(jié)條件是否滿足,如果目標(biāo)檢索結(jié)果與原始查詢足夠相關(guān)或終結(jié)條件滿足,則觸發(fā)結(jié)果返回單元305,否則觸發(fā)檢索單元302執(zhí)行檢索的操作。確定單元304包括相關(guān)判斷子單元3041、 終結(jié)條件判斷子單元3042。其中相關(guān)判斷子單元3041,用于根據(jù)計(jì)算子單元3032計(jì)算的相關(guān)性判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān),如果足夠相關(guān),則觸發(fā)結(jié)果返回單元305,否則觸發(fā)終結(jié)條件判斷子單元3042。判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān)與所述檢索裝置實(shí)施例一的相關(guān)判斷子單元2041中介紹的類似,在此不再重述。終結(jié)條件判斷子單元3042,用于判斷終結(jié)條件是否滿足,如果滿足,則觸發(fā)結(jié)果返回單元305,否則觸發(fā)檢索單元302。終結(jié)條件與所述檢索裝置實(shí)施例一中相同,包括查詢候選序列中所有的查詢候選均已檢索完畢或本發(fā)明的檢索裝置的執(zhí)行時(shí)間達(dá)到了設(shè)定的閾值。值得注意的是,與所述檢索裝置的實(shí)施例一相同,本實(shí)施例的相關(guān)判斷子單元 3041、終結(jié)條件判斷子單元3042的連接關(guān)系僅為示意性描述,在其他實(shí)施例中,由于判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān)或終結(jié)條件是否滿足的順序可以與本實(shí)施例相反, 由此導(dǎo)致相關(guān)判斷子單元3041與終結(jié)條件判斷子單元3042的連接關(guān)系也會(huì)發(fā)生相應(yīng)的改變。結(jié)果返回單元305,用于受到判斷單元304的觸發(fā)后,將目標(biāo)檢索結(jié)果作為最終檢索結(jié)果向用戶返回。在本實(shí)施例中,目標(biāo)檢索結(jié)果就是當(dāng)前檢索結(jié)果與先前所有已檢索的查詢候選得到的檢索結(jié)果合并后的檢索結(jié)果。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
權(quán)利要求
1.一種基于檢索結(jié)果相關(guān)性判斷的檢索方法,其特征在于,所述方法包括A.利用用戶的原始查詢生成包含一個(gè)以上查詢候選的查詢候選序列;B.對(duì)所述查詢候選序列中一個(gè)尚未檢索的查詢候選進(jìn)行檢索得到當(dāng)前檢索結(jié)果;C.利用所述當(dāng)前檢索結(jié)果得到參與相關(guān)性計(jì)算的目標(biāo)檢索結(jié)果,并計(jì)算所述目標(biāo)檢索結(jié)果與所述原始查詢的相關(guān)性;D.判斷所述目標(biāo)檢索結(jié)果與所述原始查詢是否足夠相關(guān)或預(yù)設(shè)的終結(jié)條件是否滿足, 如果所述目標(biāo)檢索結(jié)果與所述原始查詢足夠相關(guān)或所述終結(jié)條件滿足,則執(zhí)行步驟E ;否則返回執(zhí)行所述步驟B;E.將所有已檢索的查詢候選對(duì)應(yīng)的檢索結(jié)果作為最終檢索結(jié)果返回給所述用戶。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟C中,將所述當(dāng)前檢索結(jié)果作為所述目標(biāo)檢索結(jié)果。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述步驟E包括El.將所述當(dāng)前檢索結(jié)果與先前所有已檢索的查詢候選得到的檢索結(jié)果合并得到所述最終檢索結(jié)果;E2.向所述用戶返回所述最終檢索結(jié)果。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟C包括Cl.將所述當(dāng)前檢索結(jié)果與先前所有已檢索的查詢候選得到的檢索結(jié)果合并,并將合并后的檢索結(jié)果作為所述目標(biāo)檢索結(jié)果;C2.計(jì)算所述目標(biāo)檢索結(jié)果與所述原始查詢的相關(guān)性。
5.根據(jù)權(quán)利要求1至4任一權(quán)項(xiàng)所述的方法,其特征在于,所述步驟A包括Al.對(duì)所述原始查詢進(jìn)行分詞處理,得到分詞類查詢候選;A2.利用所述分詞類查詢候選對(duì)所述原始查詢進(jìn)行擴(kuò)展處理,得到擴(kuò)展類查詢候選;A3.對(duì)所述分詞類查詢候選和所述擴(kuò)展類查詢候選進(jìn)行排序得到所述查詢候選序列。
6.根據(jù)權(quán)利要求1至4任一權(quán)項(xiàng)所述的方法,其特征在于,所述相關(guān)性的計(jì)算依據(jù)至少包括所述目標(biāo)檢索結(jié)果的權(quán)值或所述目標(biāo)檢索結(jié)果的數(shù)目?jī)烧咂渲兄弧?br>
7.根據(jù)權(quán)利要求1至4任一權(quán)項(xiàng)所述的方法,其特征在于,所述相關(guān)性至少體現(xiàn)為下列參數(shù)之一所述目標(biāo)檢索結(jié)果的第一頁結(jié)果的平均權(quán)值、所述目標(biāo)檢索結(jié)果的最高權(quán)值、所述目標(biāo)檢索結(jié)果的最低權(quán)值、所述目標(biāo)檢索結(jié)果中權(quán)值滿足第一閾值的檢索結(jié)果的數(shù)目或所述目標(biāo)檢索結(jié)果的總數(shù)目。
8.根據(jù)權(quán)利要求1至4任一權(quán)項(xiàng)所述的方法,其特征在于,所述終結(jié)條件包括所述查詢候選序列中的所有查詢候選均已檢索完畢或所述基于檢索結(jié)果相關(guān)性判斷的檢索方法的執(zhí)行時(shí)間達(dá)到設(shè)定的第二閾值。
9.一種基于檢索結(jié)果相關(guān)性判斷的檢索裝置,其特征在于,所述裝置包括生成單元,用于利用用戶的原始查詢生成包含一個(gè)以上查詢候選的查詢候選序列;檢索單元,用于對(duì)所述查詢候選序列中一個(gè)尚未檢索的查詢候選進(jìn)行檢索得到當(dāng)前檢索結(jié)果;相關(guān)性計(jì)算單元,用于利用所述當(dāng)前檢索結(jié)果得到參與相關(guān)性計(jì)算的目標(biāo)檢索結(jié)果, 并計(jì)算所述目標(biāo)檢索結(jié)果與所述原始查詢的相關(guān)性;判斷單元,用于判斷所述目標(biāo)檢索結(jié)果與所述原始查詢是否足夠相關(guān)或預(yù)設(shè)的終結(jié)條件是否滿足,如果所述目標(biāo)檢索結(jié)果與所述原始查詢足夠相關(guān)或所述終結(jié)條件滿足,則觸發(fā)結(jié)果返回單元;否則觸發(fā)所述檢索單元執(zhí)行所述檢索;結(jié)果返回單元,用于受到所述判斷單元的觸發(fā)后,將所有已檢索的查詢候選對(duì)應(yīng)的檢索結(jié)果作為最終檢索結(jié)果返回給所述用戶。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述相關(guān)性計(jì)算單元將所述當(dāng)前檢索結(jié)果作為所述目標(biāo)檢索結(jié)果。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述結(jié)果返回單元包括合并子單元,用于將所述當(dāng)前檢索結(jié)果與先前所有已檢索的查詢候選得到的檢索結(jié)果合并得到所述最終檢索結(jié)果;發(fā)送子單元,用于向所述用戶返回所述最終檢索結(jié)果。
12.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述相關(guān)性計(jì)算單元包括合并子單元,用于將所述當(dāng)前檢索結(jié)果與先前所有已檢索的查詢候選得到的檢索結(jié)果合并,并將合并后檢索結(jié)果作為所述目標(biāo)檢索結(jié)果;計(jì)算子單元,用于計(jì)算所述目標(biāo)檢索結(jié)果與所述原始查詢的相關(guān)性。
13.根據(jù)權(quán)利要求9至12任一權(quán)項(xiàng)所述的裝置,其特征在于,所述生成單元包括分詞子單元,用于對(duì)所述原始查詢進(jìn)行分詞處理,得到分詞類查詢候選;擴(kuò)展子單元,用于利用所述分詞類查詢候選對(duì)所述原始查詢進(jìn)行擴(kuò)展處理,得到擴(kuò)展類查詢候選;排序子單元,用于對(duì)所述分詞類查詢候選和所述擴(kuò)展類查詢候選進(jìn)行排序得到所述查詢候選序列。
14.根據(jù)權(quán)利要求9至12任一權(quán)項(xiàng)所述的裝置,其特征在于,所述相關(guān)性的計(jì)算依據(jù)至少包括所述目標(biāo)檢索結(jié)果的權(quán)值或所述目標(biāo)檢索結(jié)果的數(shù)目?jī)烧咂渲兄弧?br>
15.根據(jù)權(quán)利要求9至12任一權(quán)項(xiàng)所述的裝置,其特征在于,所述相關(guān)性至少體現(xiàn)為下列參數(shù)之一所述目標(biāo)檢索結(jié)果的第一頁結(jié)果的平均權(quán)值、所述目標(biāo)檢索結(jié)果的最高權(quán)值、 所述目標(biāo)檢索結(jié)果的最低權(quán)值、所述目標(biāo)檢索結(jié)果中權(quán)值滿足第一閾值的檢索結(jié)果的數(shù)目或所述目標(biāo)檢索結(jié)果的總數(shù)目。
16.根據(jù)權(quán)利要求9至12任一權(quán)項(xiàng)所述的裝置,其特征在于,所述終結(jié)條件包括所述查詢候選序列中的所有查詢候選均已檢索完畢或所述基于檢索結(jié)果相關(guān)性判斷的檢索裝置的執(zhí)行時(shí)間達(dá)到設(shè)定的第二閾值。
全文摘要
本發(fā)明提供了一種基于檢索結(jié)果相關(guān)性判斷的檢索方法及裝置,其中所述方法包括A.利用用戶的原始查詢生成查詢候選序列;B.對(duì)查詢候選序列中一個(gè)尚未檢索的查詢候選進(jìn)行檢索得到當(dāng)前檢索結(jié)果;C.利用當(dāng)前檢索結(jié)果得到參與相關(guān)性計(jì)算的目標(biāo)檢索結(jié)果,并計(jì)算目標(biāo)檢索結(jié)果與原始查詢的相關(guān)性;D.判斷目標(biāo)檢索結(jié)果與原始查詢是否足夠相關(guān)或預(yù)設(shè)的終結(jié)條件是否滿足;E.將所有已檢索的查詢候選對(duì)應(yīng)的檢索結(jié)果作為最終檢索結(jié)果返回給所述用戶。通過上述方式,本發(fā)明節(jié)約了搜索引擎的系統(tǒng)開銷,加快了搜索引擎的響應(yīng)速度。
文檔編號(hào)G06F17/30GK102207968SQ20111015199
公開日2011年10月5日 申請(qǐng)日期2011年6月8日 優(yōu)先權(quán)日2011年6月8日
發(fā)明者石遠(yuǎn) 申請(qǐng)人:北京百度網(wǎng)訊科技有限公司