專利名稱:按業(yè)務(wù)檢索的方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信息應(yīng)用技術(shù)領(lǐng)域,更具體地,涉及一種按業(yè)務(wù)檢索的方法及系統(tǒng)。
背景技術(shù):
信息檢索是電信信息臺(tái)需要具備的主要功能。目前,實(shí)現(xiàn)信息檢索主要有兩種方法數(shù)據(jù)庫(kù)檢索和搜索引擎檢索。由于電信信息臺(tái)主要進(jìn)行模糊查詢而不是精確查詢,數(shù)據(jù)庫(kù)檢索的方式很難利用到數(shù)據(jù)庫(kù)的傳統(tǒng)索引,檢索速度會(huì)有數(shù)量級(jí)的下降,而且數(shù)據(jù)庫(kù)查詢?nèi)鄙僭~元(term)匹配和匹配度控制等,所以相比較搜索引擎檢索更適合在電信信息臺(tái)中使用。
電信信息臺(tái)的主要業(yè)務(wù)功能是向用戶準(zhǔn)確地提供所要查詢的信息,并且盡可能地把與運(yùn)營(yíng)商有簽約關(guān)系的企業(yè)推薦給用戶,所以用于電信信息臺(tái)的搜索引擎系統(tǒng)與傳統(tǒng)的搜索引擎系統(tǒng)相比,對(duì)查詢的速度和排序有更高的要求 (1)查詢速度要求更高與網(wǎng)頁(yè)搜索不同,電信信息臺(tái)采用人工話務(wù)服務(wù),搜索速度提高1秒,對(duì)服務(wù)的提高就有很大影響。
(2)查詢結(jié)果排序復(fù)雜撥打電話到電信信息臺(tái)的用戶和信息服務(wù)提供商的訴求有時(shí)是不同的,用戶想了解他(她)想查詢的信息,而信息服務(wù)提供商則希望將簽約的商業(yè)信息提供給用戶,所以電信信息臺(tái)的話務(wù)員根據(jù)用戶的要求輸入檢索關(guān)鍵詞后,搜索引擎的返回結(jié)果要盡量將簽約的商業(yè)信息和與客戶要求最相關(guān)的信息排在前面。
另外,不同城市或者不同地區(qū)的排序規(guī)則經(jīng)常是不同的,所以搜索引擎還必須能適應(yīng)各種不同的業(yè)務(wù)規(guī)則排序。
目前中國(guó)的電信行業(yè)正處于轉(zhuǎn)型期,很多新業(yè)務(wù)正處于探索階段,不同地區(qū)的業(yè)務(wù)經(jīng)常有較大差異,這必然會(huì)導(dǎo)致業(yè)務(wù)規(guī)則的變動(dòng)?,F(xiàn)有的用于電信信息臺(tái)的搜索系統(tǒng),對(duì)按業(yè)務(wù)功能排序的實(shí)現(xiàn)是比較有限的,難以滿足不同地區(qū)不同業(yè)務(wù)規(guī)則的排序要求。
發(fā)明內(nèi)容
本發(fā)明要解決的一個(gè)技術(shù)問(wèn)題是提供一種按業(yè)務(wù)檢索的方法及系統(tǒng),能夠滿足不同地區(qū)不同業(yè)務(wù)規(guī)則的排序要求。
為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種按業(yè)務(wù)檢索的方法,包括通過(guò)預(yù)先部署的檢索預(yù)處理組件對(duì)輸入的查詢關(guān)鍵詞進(jìn)行分詞獲得分詞查詢串,根據(jù)業(yè)務(wù)類型對(duì)分詞查詢串進(jìn)行分解獲得基于分詞查詢串的多個(gè)業(yè)務(wù)查詢串,并根據(jù)業(yè)務(wù)類型的優(yōu)先級(jí)對(duì)多個(gè)業(yè)務(wù)查詢串進(jìn)行排序;通過(guò)預(yù)先部署的檢索組件對(duì)排序后的多個(gè)業(yè)務(wù)查詢串分別進(jìn)行檢索;通過(guò)預(yù)先部署的檢索后處理組件計(jì)算輸出結(jié)果的排序值,并根據(jù)輸出結(jié)果的排序值對(duì)檢索出的結(jié)果進(jìn)行排序。
根據(jù)本發(fā)明方法的一個(gè)實(shí)施例,預(yù)先部署檢索預(yù)處理組件、檢索組件及檢索后處理組件的操作具體為根據(jù)不同地區(qū)的業(yè)務(wù)排序規(guī)則從組件庫(kù)中選擇檢索預(yù)處理組件、檢索組件及檢索后處理組件,配置并級(jí)連檢索預(yù)處理組件、檢索組件及檢索后處理組件。
根據(jù)本發(fā)明方法的另一實(shí)施例,該方法還包括檢索預(yù)處理組件根據(jù)期望輸出的頁(yè)號(hào)和每頁(yè)顯示的條目數(shù)設(shè)置預(yù)分頁(yè)區(qū)間;檢索組件根據(jù)預(yù)分頁(yè)區(qū)間對(duì)檢索出的結(jié)果進(jìn)行預(yù)分頁(yè),并緩存預(yù)分頁(yè)后的結(jié)果;檢索后處理組件根據(jù)輸出結(jié)果的排序值對(duì)緩存的預(yù)分頁(yè)后的結(jié)果進(jìn)行排序。
根據(jù)本發(fā)明方法的又一實(shí)施例,分詞查詢串包括查詢關(guān)鍵詞及查詢關(guān)鍵詞分詞后的各單詞的“邏輯與”和/或“邏輯或”關(guān)系。
根據(jù)本發(fā)明方法的再一實(shí)施例,通過(guò)如下步驟計(jì)算輸出結(jié)果的排序值在不同業(yè)務(wù)類型下的分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)不相同的情況下,根據(jù)分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)確定輸出結(jié)果的排序值P(f,w,b);或在不同業(yè)務(wù)類型下的分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)相同的情況下,根據(jù)業(yè)務(wù)類型對(duì)應(yīng)的排序值P2(b)確定輸出結(jié)果的排序值P(f,w,b);或在不同業(yè)務(wù)類型下的分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)相同并且業(yè)務(wù)類型對(duì)應(yīng)的排序值P2(b)相同的情況下,根據(jù)業(yè)務(wù)排序規(guī)則對(duì)應(yīng)的排序值s(b)確定輸出結(jié)果的排序值P(f,w,b),其中,業(yè)務(wù)排序規(guī)則包括按比例播報(bào)、隨機(jī)輪循、按天輪循、固定排序及相關(guān)度排序;其中,f是查詢關(guān)鍵詞分詞后是否有單字的標(biāo)志,w是查詢關(guān)鍵詞分詞后的關(guān)系,b是業(yè)務(wù)類型。
根據(jù)本發(fā)明方法的再一實(shí)施例,檢索組件根據(jù)預(yù)分頁(yè)區(qū)間對(duì)檢索出的結(jié)果進(jìn)行預(yù)分頁(yè),并緩存預(yù)分頁(yè)后的結(jié)果的步驟具體為從檢索出的結(jié)果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區(qū)間中的結(jié)果作為預(yù)分頁(yè)后的結(jié)果;其中,max((i-k)*p,0)為緩存的起始條目編號(hào),max((i-k)*p,0)+(i+k)*p為緩存的結(jié)束條目編號(hào),i為期望輸出的頁(yè)號(hào),k為緩存系數(shù),p為每頁(yè)顯示的條目數(shù)。
為了實(shí)現(xiàn)上述目的,本發(fā)明還提供了一種按業(yè)務(wù)檢索的系統(tǒng),該系統(tǒng)包括預(yù)先配置并級(jí)連的檢索預(yù)處理組件、檢索組件及檢索后處理組件,其中,檢索預(yù)處理組件包括分詞模塊、業(yè)務(wù)分解模塊及業(yè)務(wù)排序模塊,分詞模塊用于對(duì)輸入的查詢關(guān)鍵詞進(jìn)行分詞獲得分詞查詢串,業(yè)務(wù)分解模塊用于根據(jù)業(yè)務(wù)類型對(duì)分詞查詢串進(jìn)行分解獲得基于分詞查詢串的多個(gè)業(yè)務(wù)查詢串,業(yè)務(wù)排序模塊用于根據(jù)業(yè)務(wù)類型的優(yōu)先級(jí)對(duì)多個(gè)業(yè)務(wù)查詢串進(jìn)行排序;檢索組件包括檢索模塊,檢索模塊用于對(duì)排序后的多個(gè)業(yè)務(wù)查詢串分別進(jìn)行檢索;檢索后處理組件包括排序值計(jì)算模塊及結(jié)果排序模塊,排序值計(jì)算模塊用于計(jì)算輸出結(jié)果的排序值,結(jié)果排序模塊用于根據(jù)輸出結(jié)果的排序值對(duì)檢索出的結(jié)果進(jìn)行排序。
根據(jù)本發(fā)明系統(tǒng)的一個(gè)實(shí)施例,檢索預(yù)處理組件還包括預(yù)分頁(yè)區(qū)間設(shè)置模塊,預(yù)分頁(yè)區(qū)間設(shè)置模塊用于根據(jù)期望輸出的頁(yè)號(hào)和每頁(yè)顯示的條目數(shù)設(shè)置預(yù)分頁(yè)區(qū)間;檢索組件還包括預(yù)分頁(yè)模塊,預(yù)分頁(yè)模塊用于根據(jù)預(yù)分頁(yè)區(qū)間對(duì)檢索出的結(jié)果進(jìn)行預(yù)分頁(yè),并緩存預(yù)分頁(yè)后的結(jié)果;結(jié)果排序模塊還用于根據(jù)輸出結(jié)果的排序值對(duì)緩存的預(yù)分頁(yè)后的結(jié)果進(jìn)行排序。
根據(jù)本發(fā)明系統(tǒng)的另一實(shí)施例,分詞查詢串包括查詢關(guān)鍵詞及查詢關(guān)鍵詞分詞后的各單詞的“邏輯與”和/或“邏輯或”關(guān)系。
根據(jù)本發(fā)明系統(tǒng)的又一實(shí)施例,排序值計(jì)算模塊包括第一判斷單元,用于在不同業(yè)務(wù)類型下的分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)不相同的情況下,根據(jù)分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)確定輸出結(jié)果的排序值P(f,w,b);第二判斷單元,用于在不同業(yè)務(wù)類型下的分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)相同的情況下,根據(jù)業(yè)務(wù)類型對(duì)應(yīng)的排序值P2(b)確定輸出結(jié)果的排序值P(f,w,b);第三判斷單元,用于在不同業(yè)務(wù)類型下的分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)相同并且業(yè)務(wù)類型對(duì)應(yīng)的排序值P2(b)相同的情況下,根據(jù)業(yè)務(wù)排序規(guī)則對(duì)應(yīng)的排序值s(b)確定輸出結(jié)果的排序值P(f,w,b),其中,業(yè)務(wù)排序規(guī)則包括按比例播報(bào)、隨機(jī)輪循、按天輪循、固定排序及相關(guān)度排序;其中,f是查詢關(guān)鍵詞分詞后是否有單字的標(biāo)志,w是查詢關(guān)鍵詞分詞后的關(guān)系,b是業(yè)務(wù)類型。
根據(jù)本發(fā)明系統(tǒng)的再一實(shí)施例,預(yù)分頁(yè)模塊還用于從檢索出的結(jié)果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區(qū)間中的結(jié)果作為預(yù)分頁(yè)后的結(jié)果;其中,max((i-k)*p,0)為緩存的起始條目編號(hào),max((i-k)*p,0)+(i+k)*p為緩存的結(jié)束條目編號(hào),i為期望輸出的頁(yè)號(hào),k為緩存系數(shù),p為每頁(yè)顯示的條目數(shù)。
本發(fā)明提供的按業(yè)務(wù)檢索的方法及系統(tǒng),為話務(wù)員提供了快速的查詢服務(wù),并且搜索返回的結(jié)果能根據(jù)預(yù)先配置的業(yè)務(wù)規(guī)則進(jìn)行排序,將最符合用戶要求和最有商業(yè)價(jià)值的信息排在前面以便話務(wù)員選擇。另外,該系統(tǒng)還能夠在統(tǒng)一的框架下根據(jù)不同地區(qū)配置不同的業(yè)務(wù)規(guī)則,實(shí)現(xiàn)不同地區(qū)的個(gè)性化業(yè)務(wù)排序功能,適應(yīng)新業(yè)務(wù)的發(fā)展。
此處所說(shuō)明的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分。在附圖中 圖1是本發(fā)明采用的Filter-Chain架構(gòu)示意圖。
圖2是本發(fā)明方法的一個(gè)實(shí)施例的流程示意圖。
圖3是本發(fā)明方法的另一實(shí)施例的流程示意圖。
圖4是本發(fā)明系統(tǒng)的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。
圖5是本發(fā)明系統(tǒng)的另一實(shí)施例的結(jié)構(gòu)示意圖。
具體實(shí)施例方式 下面參照附圖對(duì)本發(fā)明進(jìn)行更全面的描述,其中說(shuō)明本發(fā)明的示例性實(shí)施例。本發(fā)明的示例性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,但并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。
現(xiàn)在的搜索引擎系統(tǒng)通常是根據(jù)相關(guān)度進(jìn)行排序的,但是用于電信信息臺(tái)的搜索系統(tǒng)更多是要求按照業(yè)務(wù)規(guī)則進(jìn)行排序(在業(yè)務(wù)規(guī)則框架中再兼顧相關(guān)度的排序),尤其是對(duì)全省甚至全國(guó)范圍的電信信息臺(tái)搜索系統(tǒng)來(lái)說(shuō),各個(gè)地區(qū)的業(yè)務(wù)排序規(guī)則很可能是不一樣的甚至是矛盾的,這就很難利用已有搜索引擎的排序算法來(lái)實(shí)現(xiàn)。
如圖1所示,是本發(fā)明采用的Filter-Chain架構(gòu)示意圖。該架構(gòu)實(shí)現(xiàn)了檢索的預(yù)處理和后處理,并支持級(jí)連方式。Filter-Chain架構(gòu)是一個(gè)完整的組成部分,貫穿檢索的全過(guò)程,共同實(shí)現(xiàn)高性能的查詢和業(yè)務(wù)排序功能,下面分別介紹各個(gè)部分的功能和實(shí)現(xiàn)方法。
S101,PreFilter是檢索的預(yù)處理,由一組預(yù)處理任務(wù)組成,組成PreFilter的預(yù)處理任務(wù)可以根據(jù)不同地區(qū)的情況分別進(jìn)行配置,如果需求出現(xiàn)變動(dòng),還可以根據(jù)接口開(kāi)發(fā)新的預(yù)處理任務(wù)進(jìn)行配置。預(yù)處理任務(wù)的接口可以定義為 public interface PreFilterTask { List<Message>exec(Message msg)throws BtirException; } 其中,Message記錄了客戶查詢串、分頁(yè)要求、本次檢索的頁(yè)面和頁(yè)面大小,例如,查詢第1頁(yè),每頁(yè)顯示20條記錄,則Message中的頁(yè)面大小是客戶端的每頁(yè)顯示記錄數(shù)的整數(shù)倍,假如客戶端一頁(yè)顯示20條記錄,則客戶端向服務(wù)器請(qǐng)求的頁(yè)面大小可以是20、40、60......,具體的頁(yè)數(shù)和頁(yè)面大小可以由客戶端確定。
預(yù)處理任務(wù)的目的是在使用搜索引擎檢索之前,根據(jù)業(yè)務(wù)規(guī)則對(duì)待查詢的關(guān)鍵詞進(jìn)行分詞、分詞后的查詢串的分解??蛇x地還可以進(jìn)行預(yù)分頁(yè)條件的設(shè)置。
(1)分詞本發(fā)明使用現(xiàn)有的分詞算法對(duì)查詢關(guān)鍵詞進(jìn)行分詞獲得分詞查詢串,具體規(guī)則是 如果查詢關(guān)鍵詞分詞后不包括單字,則將查詢關(guān)鍵詞分解為“原詞”、“分詞后各單詞的AND關(guān)系”以及“分詞后各單詞的OR關(guān)系”。例如,客戶查詢關(guān)鍵詞為“長(zhǎng)城潤(rùn)滑油”,分詞后的分詞查詢串為“長(zhǎng)城潤(rùn)滑油”、“長(zhǎng)城AND潤(rùn)滑油”以及“長(zhǎng)城OR潤(rùn)滑油”三個(gè)查詢串。
如果查詢關(guān)鍵詞分詞后包含單字,則分詞后的詞組去掉單字,查詢關(guān)鍵詞分解為“原詞”、“分詞后各單詞的AND關(guān)系”以及“分詞后各單詞的OR關(guān)系”。例如,客戶查詢關(guān)鍵詞為“佳億五金維修店”,分詞后的分詞查詢串為“佳億五金維修店”、“五金AND維修”以及“五金OR維修”三個(gè)查詢串。
(2)查詢串分解將上述分詞后的查詢串再進(jìn)行分解是為了實(shí)現(xiàn)按業(yè)務(wù)檢索做準(zhǔn)備,根據(jù)訂購(gòu)關(guān)鍵字的有關(guān)業(yè)務(wù)(包括直通車、優(yōu)先報(bào)號(hào)、品牌推薦、百事通加盟等)將用戶的查詢串分解成多個(gè),并根據(jù)業(yè)務(wù)的優(yōu)先級(jí)從高到低排序。例如,客戶的查詢串為“送水”,查詢串按業(yè)務(wù)分解后變成四個(gè)查詢串“話務(wù)轉(zhuǎn)接送水”、“優(yōu)先報(bào)號(hào)送水”、“品牌查詢送水”以及“百事通加盟送水”。
(3)預(yù)分頁(yè)條件的設(shè)置如果在獲得搜索引擎全部結(jié)果集后再進(jìn)行排序,數(shù)據(jù)交換量太大(因?yàn)橐@得數(shù)據(jù)結(jié)果集的全部記錄,數(shù)據(jù)加載的時(shí)間消耗會(huì)很大),這必然導(dǎo)致查詢速度的下降,對(duì)查詢性能非常敏感的系統(tǒng)是不能接受的,預(yù)分頁(yè)的目標(biāo)是查詢時(shí)只返回部分?jǐn)?shù)據(jù)進(jìn)行排序。例如,可以通過(guò)如下方式實(shí)現(xiàn)當(dāng)要求查詢第i頁(yè)的記錄,每頁(yè)顯示的條目數(shù)為p時(shí),預(yù)分頁(yè)設(shè)置一個(gè)緩存參數(shù)k(根據(jù)測(cè)試情況和經(jīng)驗(yàn)進(jìn)行配置,一般取3-5),預(yù)分頁(yè)后搜索引擎返回的查詢結(jié)果是max(0,(i-k)*p)到max(0,(i-k)*p)+(i+k)*p之間的記錄。
S102,客戶的原始查詢關(guān)鍵詞通過(guò)PreFilter分解后開(kāi)始進(jìn)行檢索。檢索過(guò)程由一組檢索任務(wù)組成,與預(yù)處理任務(wù)類似,檢索任務(wù)也可以根據(jù)地區(qū)進(jìn)行靈活的配置,檢索任務(wù)的接口是 public interface SearchTask { void doQuery(StructuredQuery sq,InformList list)throws BtirException; } 檢索任務(wù)根據(jù)PreFilter分解后的查詢串進(jìn)行檢索,并實(shí)現(xiàn)結(jié)果集的去重與合并。
(1)檢索將PreFilter分解后的查詢串轉(zhuǎn)換成lucene(lucene是基于Java的全文索引工具包)語(yǔ)法格式,采用lucene進(jìn)行多次檢索,獲得結(jié)果集但不取出以避免大的輸入和輸出。
(2)構(gòu)造結(jié)果集根據(jù)PreFilter設(shè)置的預(yù)分頁(yè)條件,將檢索結(jié)果去重與合并后再取出部分記錄。
S103,PostFilter是檢索的后處理,由一組后處理任務(wù)組成。與前面的PreFilter和Search類似,PostFilter可以根據(jù)地區(qū)對(duì)后處理任務(wù)進(jìn)行靈活地配置。后處理任務(wù)的接口是 public interface PostFilterTask { Object exec(int len,Object[]objs)throws BtirException; } PostFilter主要實(shí)現(xiàn)和業(yè)務(wù)相關(guān)的排序權(quán)重??蛇x地,基于PreFilter中設(shè)置的預(yù)分頁(yè)條件可以進(jìn)行分頁(yè)處理。
(1)業(yè)務(wù)排序根據(jù)每種業(yè)務(wù)的排序策略和業(yè)務(wù)之間的權(quán)重關(guān)系,重新計(jì)算每條查詢結(jié)果的綜合值,再根據(jù)綜合值進(jìn)行排序。例如,可以根據(jù)下述函數(shù)計(jì)算一條記錄的綜合值P(f,w,b)=[P1(f,w,b),P2(b),s(b)]。
其中,P1(f,w,b)是一個(gè)三輸入?yún)?shù)的函數(shù),根據(jù)業(yè)務(wù)規(guī)則配置每種業(yè)務(wù)在不同分詞情況下的權(quán)重值;f是查詢關(guān)鍵詞分詞后是否有單字的標(biāo)志;w是分詞后的關(guān)系,取值有3個(gè)“原詞”、“分詞后各單詞的AND關(guān)系”以及“分詞后各單詞的OR關(guān)系”;P2(b)是排序相關(guān)的業(yè)務(wù),取值有5個(gè)話務(wù)呼轉(zhuǎn)、優(yōu)先報(bào)號(hào)、品牌推薦、百事通加盟、語(yǔ)音名片;s(b)是根據(jù)業(yè)務(wù)規(guī)定的業(yè)務(wù)排序規(guī)則計(jì)算的分值,至少有以下幾種計(jì)算方法 輪循或按比例播報(bào)sendNum/privalue,sendNum是記錄的播報(bào)次數(shù),privalue是信息的權(quán)重; 隨機(jī)輪循s(b)等于一個(gè)0-1之間的隨機(jī)值; 按天輪循Floor([d-Floor(d/n)*n]/p)*n+p,其中p是每個(gè)記錄的信息權(quán)重,d是合同開(kāi)始天數(shù),n是購(gòu)買同一產(chǎn)品的記錄總數(shù); 固定排序直接取信息的權(quán)重值privalue; 直接取搜索引擎排序的score值。
(2)分頁(yè)根據(jù)客戶原始請(qǐng)求的頁(yè)面信息返回相應(yīng)的查詢結(jié)果。
上述Filter-Chain的搜索引擎系統(tǒng)架構(gòu)用于構(gòu)建類似支持號(hào)碼百事通業(yè)務(wù)的電信信息臺(tái),特別能滿足系統(tǒng)對(duì)查詢速度和對(duì)搜索結(jié)果進(jìn)行復(fù)雜業(yè)務(wù)排序的要求。該系統(tǒng)實(shí)現(xiàn)了可方便擴(kuò)展的排序規(guī)則配置和接口,適應(yīng)業(yè)務(wù)靈活變化的情況,能快速支持新業(yè)務(wù)的推出。在統(tǒng)一的框架下實(shí)現(xiàn)了不同地區(qū)的個(gè)性化排序策略。同時(shí)該系統(tǒng)還充分考慮了搜索引擎排序的性能,完全滿足電信信息臺(tái)實(shí)時(shí)查詢的需求。
如圖2所示,是本發(fā)明方法的一個(gè)實(shí)施例的流程示意圖。該實(shí)施例可以包括以下步驟 S201,通過(guò)預(yù)先部署的檢索預(yù)處理組件對(duì)輸入的查詢關(guān)鍵詞進(jìn)行分詞獲得分詞查詢串,根據(jù)業(yè)務(wù)類型對(duì)分詞查詢串進(jìn)行分解獲得基于分詞查詢串的多個(gè)業(yè)務(wù)查詢串,并根據(jù)業(yè)務(wù)類型的優(yōu)先級(jí)對(duì)多個(gè)業(yè)務(wù)查詢串進(jìn)行排序; S202,通過(guò)預(yù)先部署的檢索組件對(duì)排序后的多個(gè)業(yè)務(wù)查詢串分別進(jìn)行檢索; S203,通過(guò)預(yù)先部署的檢索后處理組件計(jì)算輸出結(jié)果的排序值,并根據(jù)輸出結(jié)果的排序值對(duì)檢索出的結(jié)果進(jìn)行排序。
其中,預(yù)先部署檢索預(yù)處理組件、檢索組件及檢索后處理組件的操作具體為根據(jù)不同地區(qū)的業(yè)務(wù)排序規(guī)則從組件庫(kù)中選擇檢索預(yù)處理組件、檢索組件及檢索后處理組件,配置并級(jí)連檢索預(yù)處理組件、檢索組件及檢索后處理組件。
具體地,如果輸出結(jié)果的排序值為P(f,w,b)=[P1(f,w,b),P2(b),s(b)],則可以通過(guò)如下步驟計(jì)算輸出結(jié)果的排序值在不同業(yè)務(wù)類型下的分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)不相同的情況下,根據(jù)分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)確定輸出結(jié)果的排序值P(f,w,b);或在不同業(yè)務(wù)類型下的分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)相同的情況下,根據(jù)業(yè)務(wù)類型對(duì)應(yīng)的排序值P2(b)確定輸出結(jié)果的排序值P(f,w,b);或在不同業(yè)務(wù)類型下的分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)相同并且業(yè)務(wù)類型對(duì)應(yīng)的排序值P2(b)相同的情況下,根據(jù)業(yè)務(wù)排序規(guī)則對(duì)應(yīng)的排序值s(b)確定輸出結(jié)果的排序值P(f,w,b),其中,業(yè)務(wù)排序規(guī)則包括按比例播報(bào)、隨機(jī)輪循、按天輪循、固定排序及相關(guān)度排序。
其中,f是查詢關(guān)鍵詞分詞后是否有單字的標(biāo)志,w是查詢關(guān)鍵詞分詞后的關(guān)系,b是業(yè)務(wù)類型,各個(gè)城市可以靈活地配置P1(f,w,b)、P2(b)和s(b)。
對(duì)于參數(shù)w,如果分詞后無(wú)單字,例如,“體育器材”,分詞后的結(jié)果是“體育”和“器材”,則分詞順序w是“體育器材”、“體育AND器材”、“體育OR器材”;如果分詞后有單字,例如,“佳藝五金維修”,分詞后的結(jié)果是“佳”、“藝”、“五金”和“維修”,則去掉單字后的結(jié)果是“五金”和“維修”,分詞順序w是“佳藝五金維修”、“五金AND維修”、“五金OR維修”。
在排序的時(shí)候,先比較P1(f,w,b)的大小,如果P1(f,w,b)相等再比較P2(b),如果P2(b)相等再比較s(b)的大小。
下述表1是P1(f,w,b)的含義
表1 下述表2是P2(b)的含義 表2 s(b)是根據(jù)業(yè)務(wù)規(guī)定的業(yè)務(wù)排序規(guī)則計(jì)算的分值,有以下5種取值按比例播報(bào)、隨機(jī)輪循、按天輪循、固定排序、相關(guān)度排序。
例如,假設(shè)系統(tǒng)配置的業(yè)務(wù)類型包括話務(wù)呼轉(zhuǎn)、優(yōu)先報(bào)號(hào)、品牌推薦、百事通加盟、語(yǔ)音名片及其他,客戶待查詢的關(guān)鍵詞為“佳億五金維修店”,則系統(tǒng)按下述順序返回查詢結(jié)果 (1)訂購(gòu)關(guān)鍵字包括原詞“佳億五金維修店”的話務(wù)呼轉(zhuǎn)記錄,其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (2)訂購(gòu)關(guān)鍵字包括原詞“佳億五金維修店”的優(yōu)先報(bào)號(hào)記錄,其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (3)訂購(gòu)關(guān)鍵字包括原詞“佳億五金維修店”的品牌推薦記錄,其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (4)業(yè)務(wù)說(shuō)明中包括原詞“佳億五金維修店”的百事通加盟記錄,記錄之間隨機(jī)輪循; (5)企業(yè)名稱中包括原詞“佳億五金維修店”的語(yǔ)音名片記錄,記錄之間根據(jù)相關(guān)度排序; (6)企業(yè)名稱中包括原詞“佳億五金維修店”的其它記錄,記錄之間根據(jù)相關(guān)度排序; (7)訂購(gòu)關(guān)鍵字包括“五金”AND“維修”的話務(wù)呼轉(zhuǎn)記錄,其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (8)訂購(gòu)關(guān)鍵字包括“五金”AND“維修”的優(yōu)先報(bào)號(hào),其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (9)訂購(gòu)關(guān)鍵字包括“五金”AND“維修”的品牌推薦記錄,其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (10)業(yè)務(wù)說(shuō)明中包括“五金”AND“維修”的百事通加盟記錄,記錄之間隨機(jī)輪循; (11)企業(yè)名稱中包括“五金”AND“維修”的語(yǔ)音名片記錄,記錄之間根據(jù)相關(guān)度排序; (12)企業(yè)名稱中包括“五金”AND“維修”的其它記錄,記錄之間根據(jù)相關(guān)度排序; (13)訂購(gòu)關(guān)鍵字包括“五金”O(jiān)R“維修”的話務(wù)呼轉(zhuǎn)記錄,其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (14)訂購(gòu)關(guān)鍵字包括“五金”O(jiān)R“維修”的優(yōu)先報(bào)號(hào)記錄,其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (15)訂購(gòu)關(guān)鍵字包括“五金”O(jiān)R“維修”的品牌推薦記錄,其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (16)業(yè)務(wù)說(shuō)明中包括“五金”O(jiān)R“維修”的百事通加盟記錄,記錄之間隨機(jī)輪循‘ (17)企業(yè)名稱中包括“五金”O(jiān)R“維修”的語(yǔ)音名片記錄,記錄之間根據(jù)相關(guān)度排序; (18)企業(yè)名稱中包括“五金”O(jiān)R“維修”的其它記錄,記錄之間根據(jù)相關(guān)度排序。
該實(shí)施例能夠根據(jù)預(yù)先配置的業(yè)務(wù)規(guī)則進(jìn)行排序,將最符合用戶要求和最有商業(yè)價(jià)值的信息排在前面以便話務(wù)員選擇。另外,該實(shí)施例還能為不同地區(qū)配置不同的業(yè)務(wù)規(guī)則,實(shí)現(xiàn)不同地區(qū)的個(gè)性化業(yè)務(wù)排序功能,適應(yīng)新業(yè)務(wù)的發(fā)展。
如圖3所示,是本發(fā)明方法的另一實(shí)施例的流程示意圖。該實(shí)施例包括以下步驟 S301,通過(guò)預(yù)先部署的檢索預(yù)處理組件對(duì)輸入的查詢關(guān)鍵詞進(jìn)行分詞獲得分詞查詢串,根據(jù)業(yè)務(wù)類型對(duì)分詞查詢串進(jìn)行分解獲得基于分詞查詢串的多個(gè)業(yè)務(wù)查詢串,并根據(jù)業(yè)務(wù)類型的優(yōu)先級(jí)對(duì)多個(gè)業(yè)務(wù)查詢串進(jìn)行排序。
S302,檢索預(yù)處理組件根據(jù)期望輸出的頁(yè)號(hào)和每頁(yè)顯示的條目數(shù)設(shè)置預(yù)分頁(yè)區(qū)間。
S303,通過(guò)預(yù)先部署的檢索組件對(duì)排序后的多個(gè)業(yè)務(wù)查詢串分別進(jìn)行檢索。
S304,檢索組件根據(jù)預(yù)分頁(yè)區(qū)間對(duì)檢索出的結(jié)果進(jìn)行預(yù)分頁(yè),并緩存預(yù)分頁(yè)后的結(jié)果; 其中,檢索組件根據(jù)預(yù)分頁(yè)區(qū)間對(duì)檢索出的結(jié)果進(jìn)行預(yù)分頁(yè),并緩存預(yù)分頁(yè)后的結(jié)果的步驟可以具體為從檢索出的結(jié)果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區(qū)間中的結(jié)果作為預(yù)分頁(yè)后的結(jié)果;其中,max((i-k)*p,0)為緩存的起始條目編號(hào),max((i-k)*p,0)+(i+k)*p為緩存的結(jié)束條目編號(hào),i為期望輸出的頁(yè)號(hào),k為緩存系數(shù),p為每頁(yè)顯示的條目數(shù)。
例如,假設(shè)客戶要檢索第1頁(yè),每頁(yè)顯示20條記錄,檢索預(yù)處理組件設(shè)置預(yù)分頁(yè)條件的時(shí)候(假設(shè)k=3)要求搜索引擎返回0(根據(jù)max(0,(1-3)*20)=0計(jì)算得到)到80(根據(jù)(1+3)*20=80計(jì)算得到)的記錄,檢索組件檢索后從結(jié)果集中取出第0到第80條記錄,檢索后處理組件根據(jù)業(yè)務(wù)規(guī)則排序后,取出0到20條記錄返回給調(diào)用者。
再例如,假設(shè)客戶端要檢索第4頁(yè),每頁(yè)顯示20條記錄,檢索預(yù)處理組件設(shè)置預(yù)分頁(yè)條件的時(shí)候(假設(shè)k=3)要求搜索引擎返回20(根據(jù)max(0,(4-3)*20)=20計(jì)算得到)到140(根據(jù)(4+3)*20=140計(jì)算得到)的記錄,檢索組件檢索后從結(jié)果集中取出第20到第140條記錄,檢索后處理組件根據(jù)業(yè)務(wù)規(guī)則排序后,取出80到120條記錄返回給調(diào)用者。
進(jìn)一步地,檢索預(yù)處理組件將一個(gè)查詢關(guān)鍵詞根據(jù)業(yè)務(wù)規(guī)則分解成多個(gè)查詢串,例如,查詢關(guān)鍵詞“體育器材”被檢索預(yù)處理組件分解成18個(gè)查詢串(如下所示),并且檢索預(yù)處理組件設(shè)置預(yù)分頁(yè)時(shí)要求搜索引擎返回20至140條之間的記錄。檢索組件對(duì)這18個(gè)查詢條件依次進(jìn)行檢索,當(dāng)前面n個(gè)查詢條件檢索出的記錄總數(shù)大于等于140后,就停止檢索,取其中第20條至140條之間的記錄返回。
查詢關(guān)鍵詞“體育器材”被檢索預(yù)處理組件分解成的18個(gè)查詢串如下所示 (1)訂購(gòu)關(guān)鍵字包括原詞“體育器材”的話務(wù)呼轉(zhuǎn)記錄,其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (2)訂購(gòu)關(guān)鍵字包括原詞“體育器材”的優(yōu)先報(bào)號(hào)記錄,其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (3)訂購(gòu)關(guān)鍵字包括原詞“體育器材”的品牌推薦記錄,其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (4)訂購(gòu)關(guān)鍵字包括“體育”AND“器材”的話務(wù)呼轉(zhuǎn)記錄,其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (5)訂購(gòu)關(guān)鍵字包括“體育”AND“器材”的優(yōu)先報(bào)號(hào),其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (6)訂購(gòu)關(guān)鍵字包括“體育”AND“器材”的品牌推薦記錄,其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (7)業(yè)務(wù)說(shuō)明中包括原詞“體育器材”的百事通加盟記錄,記錄之間隨機(jī)輪循; (8)業(yè)務(wù)說(shuō)明中包括“體育”AND“器材”的百事通加盟記錄,記錄之間隨機(jī)輪循; (9)企業(yè)名稱中包括原詞“體育器材”的語(yǔ)音名片記錄,記錄之間根據(jù)相關(guān)度排序; (10)企業(yè)名稱中包括“體育”AND“器材”的語(yǔ)音名片記錄,記錄之間根據(jù)相關(guān)度排序; (11)企業(yè)名稱中包括原詞“體育器材”的其它記錄,記錄之間根據(jù)相關(guān)度排序; (12)企業(yè)名稱中包括“體育”AND“器材”的其它記錄,記錄之間根據(jù)相關(guān)度排序; (13)訂購(gòu)關(guān)鍵字包括“體育”O(jiān)R“器材”的話務(wù)呼轉(zhuǎn)記錄,其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (14)訂購(gòu)關(guān)鍵字包括“體育”O(jiān)R“器材”的優(yōu)先報(bào)號(hào)記錄,其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (15)訂購(gòu)關(guān)鍵字包括“體育”O(jiān)R“器材”的品牌推薦記錄,其中訂購(gòu)?fù)粋€(gè)關(guān)鍵字的記錄根據(jù)播報(bào)次數(shù)按比例輪循; (16)業(yè)務(wù)說(shuō)明中包括“體育”O(jiān)R“器材”的百事通加盟記錄,記錄之間隨機(jī)輪循; (17)企業(yè)名稱中包括“體育”O(jiān)R“器材”的語(yǔ)音名片記錄,記錄之間根據(jù)相關(guān)度排序; (18)企業(yè)名稱中包括“體育”O(jiān)R“器材”的其它記錄,記錄之間根據(jù)相關(guān)度排序。
S305,通過(guò)預(yù)先部署的檢索后處理組件計(jì)算輸出結(jié)果的排序值,并根據(jù)輸出結(jié)果的排序值對(duì)緩存的預(yù)分頁(yè)后的結(jié)果進(jìn)行排序。
在上述實(shí)施例中,分詞查詢串包括查詢關(guān)鍵詞及查詢關(guān)鍵詞分詞后的各單詞的“邏輯與”和/或“邏輯或”關(guān)系。
采用預(yù)分頁(yè)方法是有前提條件的,根據(jù)搜索引擎檢索出排在第n位的記錄(搜索引擎是根據(jù)相關(guān)度檢索的),根據(jù)業(yè)務(wù)規(guī)則排序的范圍應(yīng)該在[n-C,n+C]的范圍內(nèi)(C是一個(gè)常數(shù))。即,業(yè)務(wù)規(guī)則排序是和相關(guān)度排序有一定關(guān)聯(lián)性。如果不能滿足這個(gè)條件,就不宜采用預(yù)分頁(yè)方法。例如,根據(jù)“體育器材”檢索到的符合百事通加盟業(yè)務(wù)的記錄數(shù)有200條,記錄A在搜索引擎檢索出的順序中排第160位,檢索組件只取前面20-140條記錄給檢索后處理組件進(jìn)行排序,A就不在排序范圍之內(nèi),但是根據(jù)業(yè)務(wù)規(guī)則,A是應(yīng)該排在前面的,這時(shí)排序的結(jié)果就不準(zhǔn)確了。
但是,在電信信息臺(tái)的應(yīng)用中采用預(yù)分頁(yè)方法是合適的,因?yàn)閺臉I(yè)務(wù)規(guī)則的制定上看,一個(gè)關(guān)鍵字銷售給商家的數(shù)量必然是有限的,否則商家購(gòu)買關(guān)鍵字就失去了意義,所以檢索預(yù)處理組件的參數(shù)k設(shè)置足夠大,肯定能將訂購(gòu)了關(guān)鍵字的記錄全部取出來(lái),預(yù)分頁(yè)參數(shù)k是排序準(zhǔn)確性和排序效率的一個(gè)權(quán)衡值。
如果要做到預(yù)分頁(yè)的情況下仍然滿足業(yè)務(wù)排序規(guī)則的準(zhǔn)確性,可以用更復(fù)雜的技術(shù),但是沒(méi)有太大的實(shí)用價(jià)值。本發(fā)明提出的預(yù)分頁(yè)方法,在排序的性能和效果上已經(jīng)可以達(dá)到很好的平衡。
如圖4所示,是本發(fā)明系統(tǒng)的一個(gè)實(shí)施例的結(jié)構(gòu)示意圖。該實(shí)施例可以包括預(yù)先配置并級(jí)連的檢索預(yù)處理組件11、檢索組件12及檢索后處理組件13,其中,檢索預(yù)處理組件11包括分詞模塊111、業(yè)務(wù)分解模塊112及業(yè)務(wù)排序模塊113,分詞模塊111用于對(duì)輸入的查詢關(guān)鍵詞進(jìn)行分詞獲得分詞查詢串,業(yè)務(wù)分解模塊112用于根據(jù)業(yè)務(wù)類型對(duì)分詞查詢串進(jìn)行分解獲得基于分詞查詢串的多個(gè)業(yè)務(wù)查詢串,業(yè)務(wù)排序模塊113用于根據(jù)業(yè)務(wù)類型的優(yōu)先級(jí)對(duì)多個(gè)業(yè)務(wù)查詢串進(jìn)行排序;檢索組件12包括檢索模塊121,檢索模塊121用于對(duì)排序后的多個(gè)業(yè)務(wù)查詢串分別進(jìn)行檢索;檢索后處理組件13包括排序值計(jì)算模塊131及結(jié)果排序模塊132,排序值計(jì)算模塊131用于計(jì)算輸出結(jié)果的排序值,結(jié)果排序模塊132用于根據(jù)輸出結(jié)果的排序值對(duì)檢索出的結(jié)果進(jìn)行排序。
該實(shí)施例能夠根據(jù)預(yù)先配置的業(yè)務(wù)規(guī)則進(jìn)行排序,將最符合用戶要求和最有商業(yè)價(jià)值的信息排在前面以便話務(wù)員選擇。另外,該實(shí)施例還能為不同地區(qū)配置不同的業(yè)務(wù)規(guī)則,實(shí)現(xiàn)不同地區(qū)的個(gè)性化業(yè)務(wù)排序功能,適應(yīng)新業(yè)務(wù)的發(fā)展。
如圖5所示,是本發(fā)明系統(tǒng)的另一實(shí)施例的結(jié)構(gòu)示意圖。與圖4中的實(shí)施例相比,該實(shí)施例中的檢索預(yù)處理組件21還包括預(yù)分頁(yè)區(qū)間設(shè)置模塊211,預(yù)分頁(yè)區(qū)間設(shè)置模塊211用于根據(jù)期望輸出的頁(yè)號(hào)和每頁(yè)顯示的條目數(shù)設(shè)置預(yù)分頁(yè)區(qū)間;檢索組件22還包括預(yù)分頁(yè)模塊221,預(yù)分頁(yè)模塊221用于根據(jù)預(yù)分頁(yè)區(qū)間對(duì)檢索出的結(jié)果進(jìn)行預(yù)分頁(yè),并緩存預(yù)分頁(yè)后的結(jié)果;結(jié)果排序模塊132還用于根據(jù)輸出結(jié)果的排序值對(duì)緩存的預(yù)分頁(yè)后的結(jié)果進(jìn)行排序。
根據(jù)本發(fā)明系統(tǒng)的又一實(shí)施例,預(yù)分頁(yè)模塊221還用于從檢索出的結(jié)果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區(qū)間中的結(jié)果作為預(yù)分頁(yè)后的結(jié)果;其中,max((i-k)*p,0)為緩存的起始條目編號(hào),max((i-k)*p,0)+(i+k)*p為緩存的結(jié)束條目編號(hào),i為期望輸出的頁(yè)號(hào),k為緩存系數(shù),p為每頁(yè)顯示的條目數(shù)。
上述兩個(gè)實(shí)施例進(jìn)行預(yù)分頁(yè)處理后可以減少取記錄的輸入和輸出,提高了排序的速度。
在本發(fā)明系統(tǒng)的再一實(shí)施例中,與圖4中的實(shí)施例相比,該實(shí)施例中的排序值計(jì)算模塊可以包括第一判斷單元,用于在不同業(yè)務(wù)類型下的分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)不相同的情況下,根據(jù)分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)確定輸出結(jié)果的排序值P(f,w,b);第二判斷單元,用于在不同業(yè)務(wù)類型下的分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)相同的情況下,根據(jù)業(yè)務(wù)類型對(duì)應(yīng)的排序值P2(b)確定輸出結(jié)果的排序值P(f,w,b);第三判斷單元,用于在不同業(yè)務(wù)類型下的分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)相同并且業(yè)務(wù)類型對(duì)應(yīng)的排序值P2(b)相同的情況下,根據(jù)業(yè)務(wù)排序規(guī)則對(duì)應(yīng)的排序值s(b)確定輸出結(jié)果的排序值P(f,w,b),其中,業(yè)務(wù)排序規(guī)則包括按比例播報(bào)、隨機(jī)輪循、按天輪循、固定排序及相關(guān)度排序;其中,f是查詢關(guān)鍵詞分詞后是否有單字的標(biāo)志,w是查詢關(guān)鍵詞分詞后的關(guān)系,b是業(yè)務(wù)類型。
在上述實(shí)施例中,分詞查詢串包括查詢關(guān)鍵詞及查詢關(guān)鍵詞分詞后的各單詞的“邏輯與”和/或“邏輯或”關(guān)系。
該實(shí)施例為話務(wù)員提供了快速的查詢服務(wù),并且搜索返回的結(jié)果能根據(jù)預(yù)先配置的業(yè)務(wù)規(guī)則進(jìn)行排序,將最符合用戶要求和最有商業(yè)價(jià)值的信息排在前面以便話務(wù)員選擇。
本發(fā)明的描述是為了示例和描述起見(jiàn)而給出的,而并不是無(wú)遺漏的或者將本發(fā)明限于所公開(kāi)的形式。很多修改和變化對(duì)于本領(lǐng)域的普通技術(shù)人員而言是顯而易見(jiàn)的。選擇和描述實(shí)施例是為了更好說(shuō)明本發(fā)明的原理和實(shí)際應(yīng)用,并且使本領(lǐng)域的普通技術(shù)人員能夠理解本發(fā)明從而設(shè)計(jì)適于特定用途的帶有各種修改的各種實(shí)施例。
權(quán)利要求
1.一種按業(yè)務(wù)檢索的方法,其特征在于,所述方法包括
通過(guò)預(yù)先部署的檢索預(yù)處理組件對(duì)輸入的查詢關(guān)鍵詞進(jìn)行分詞獲得分詞查詢串,根據(jù)業(yè)務(wù)類型對(duì)所述分詞查詢串進(jìn)行分解獲得基于所述分詞查詢串的多個(gè)業(yè)務(wù)查詢串,并根據(jù)所述業(yè)務(wù)類型的優(yōu)先級(jí)對(duì)所述多個(gè)業(yè)務(wù)查詢串進(jìn)行排序;
通過(guò)預(yù)先部署的檢索組件對(duì)所述排序后的多個(gè)業(yè)務(wù)查詢串分別進(jìn)行檢索;
通過(guò)預(yù)先部署的檢索后處理組件計(jì)算輸出結(jié)果的排序值,并根據(jù)所述輸出結(jié)果的排序值對(duì)檢索出的結(jié)果進(jìn)行排序。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,預(yù)先部署所述檢索預(yù)處理組件、所述檢索組件及所述檢索后處理組件的操作具體為
根據(jù)不同地區(qū)的業(yè)務(wù)排序規(guī)則從組件庫(kù)中選擇所述檢索預(yù)處理組件、所述檢索組件及所述檢索后處理組件,配置并級(jí)連所述檢索預(yù)處理組件、所述檢索組件及所述檢索后處理組件。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括
所述檢索預(yù)處理組件根據(jù)期望輸出的頁(yè)號(hào)和每頁(yè)顯示的條目數(shù)設(shè)置預(yù)分頁(yè)區(qū)間;
所述檢索組件根據(jù)所述預(yù)分頁(yè)區(qū)間對(duì)所述檢索出的結(jié)果進(jìn)行預(yù)分頁(yè),并緩存預(yù)分頁(yè)后的結(jié)果;
所述檢索后處理組件根據(jù)所述輸出結(jié)果的排序值對(duì)緩存的所述預(yù)分頁(yè)后的結(jié)果進(jìn)行排序。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,
所述分詞查詢串包括所述查詢關(guān)鍵詞及所述查詢關(guān)鍵詞分詞后的各單詞的“邏輯與”和/或“邏輯或”關(guān)系。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,通過(guò)如下步驟計(jì)算所述輸出結(jié)果的排序值
在不同業(yè)務(wù)類型下的所述分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)不相同的情況下,根據(jù)所述分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)確定所述輸出結(jié)果的排序值P(f,w,b);或
在不同業(yè)務(wù)類型下的所述分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)相同的情況下,根據(jù)所述業(yè)務(wù)類型對(duì)應(yīng)的排序值P2(b)確定所述輸出結(jié)果的排序值P(f,w,b);或
在不同業(yè)務(wù)類型下的所述分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)相同并且所述業(yè)務(wù)類型對(duì)應(yīng)的排序值P2(b)相同的情況下,根據(jù)業(yè)務(wù)排序規(guī)則對(duì)應(yīng)的排序值s(b)確定所述輸出結(jié)果的排序值P(f,w,b),其中,所述業(yè)務(wù)排序規(guī)則包括按比例播報(bào)、隨機(jī)輪循、按天輪循、固定排序及相關(guān)度排序;
其中,f是所述查詢關(guān)鍵詞分詞后是否有單字的標(biāo)志,w是所述查詢關(guān)鍵詞分詞后的關(guān)系,b是所述業(yè)務(wù)類型。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述檢索組件根據(jù)所述預(yù)分頁(yè)區(qū)間對(duì)所述檢索出的結(jié)果進(jìn)行預(yù)分頁(yè),并緩存預(yù)分頁(yè)后的結(jié)果的步驟具體為
從所述檢索出的結(jié)果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區(qū)間中的結(jié)果作為所述預(yù)分頁(yè)后的結(jié)果;
其中,max((i-k)*p,0)為緩存的起始條目編號(hào),max((i-k)*p,0)+(i+k)*p為緩存的結(jié)束條目編號(hào),i為所述期望輸出的頁(yè)號(hào),k為緩存系數(shù),p為每頁(yè)顯示的條目數(shù)。
7.一種按業(yè)務(wù)檢索的系統(tǒng),其特征在于,所述系統(tǒng)包括預(yù)先配置并級(jí)連的檢索預(yù)處理組件、檢索組件及檢索后處理組件,其中,
所述檢索預(yù)處理組件包括分詞模塊、業(yè)務(wù)分解模塊及業(yè)務(wù)排序模塊,所述分詞模塊用于對(duì)輸入的查詢關(guān)鍵詞進(jìn)行分詞獲得分詞查詢串,所述業(yè)務(wù)分解模塊用于根據(jù)業(yè)務(wù)類型對(duì)所述分詞查詢串進(jìn)行分解獲得基于所述分詞查詢串的多個(gè)業(yè)務(wù)查詢串,所述業(yè)務(wù)排序模塊用于根據(jù)所述業(yè)務(wù)類型的優(yōu)先級(jí)對(duì)所述多個(gè)業(yè)務(wù)查詢串進(jìn)行排序;
所述檢索組件包括檢索模塊,所述檢索模塊用于對(duì)所述排序后的多個(gè)業(yè)務(wù)查詢串分別進(jìn)行檢索;
所述檢索后處理組件包括排序值計(jì)算模塊及結(jié)果排序模塊,所述排序值計(jì)算模塊用于計(jì)算輸出結(jié)果的排序值,所述結(jié)果排序模塊用于根據(jù)所述輸出結(jié)果的排序值對(duì)檢索出的結(jié)果進(jìn)行排序。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,
所述檢索預(yù)處理組件還包括預(yù)分頁(yè)區(qū)間設(shè)置模塊,所述預(yù)分頁(yè)區(qū)間設(shè)置模塊用于根據(jù)期望輸出的頁(yè)號(hào)和每頁(yè)顯示的條目數(shù)設(shè)置預(yù)分頁(yè)區(qū)間;
所述檢索組件還包括預(yù)分頁(yè)模塊,所述預(yù)分頁(yè)模塊用于根據(jù)所述預(yù)分頁(yè)區(qū)間對(duì)所述檢索出的結(jié)果進(jìn)行預(yù)分頁(yè),并緩存預(yù)分頁(yè)后的結(jié)果;
所述結(jié)果排序模塊還用于根據(jù)所述輸出結(jié)果的排序值對(duì)緩存的所述預(yù)分頁(yè)后的結(jié)果進(jìn)行排序。
9.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,
所述分詞查詢串包括所述查詢關(guān)鍵詞及所述查詢關(guān)鍵詞分詞后的各單詞的“邏輯與”和/或“邏輯或”關(guān)系。
10.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述排序值計(jì)算模塊包括
第一判斷單元,用于在不同業(yè)務(wù)類型下的所述分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)不相同的情況下,根據(jù)所述分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)確定所述輸出結(jié)果的排序值P(f,w,b);
第二判斷單元,用于在不同業(yè)務(wù)類型下的所述分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)相同的情況下,根據(jù)所述業(yè)務(wù)類型對(duì)應(yīng)的排序值P2(b)確定所述輸出結(jié)果的排序值P(f,w,b);
第三判斷單元,用于在不同業(yè)務(wù)類型下的所述分詞查詢串對(duì)應(yīng)的排序值P1(f,w,b)相同并且所述業(yè)務(wù)類型對(duì)應(yīng)的排序值P2(b)相同的情況下,根據(jù)業(yè)務(wù)排序規(guī)則對(duì)應(yīng)的排序值s(b)確定所述輸出結(jié)果的排序值P(f,w,b),其中,所述業(yè)務(wù)排序規(guī)則包括按比例播報(bào)、隨機(jī)輪循、按天輪循、固定排序及相關(guān)度排序;
其中,f是所述查詢關(guān)鍵詞分詞后是否有單字的標(biāo)志,w是所述查詢關(guān)鍵詞分詞后的關(guān)系,b是所述業(yè)務(wù)類型。
11.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述預(yù)分頁(yè)模塊還用于從所述檢索出的結(jié)果中取出[max((i-k)*p,0),max((i-k)*p,0)+(i+k)*p]區(qū)間中的結(jié)果作為所述預(yù)分頁(yè)后的結(jié)果;
其中,max((i-k)*p,0)為緩存的起始條目編號(hào),max((i-k)*p,0)+(i+k)*p為緩存的結(jié)束條目編號(hào),i為所述期望輸出的頁(yè)號(hào),k為緩存系數(shù),p為每頁(yè)顯示的條目數(shù)。
全文摘要
本發(fā)明公開(kāi)了一種按業(yè)務(wù)檢索的方法及系統(tǒng)。其中,該方法包括通過(guò)預(yù)先部署的檢索預(yù)處理組件對(duì)輸入的查詢關(guān)鍵詞進(jìn)行分詞獲得分詞查詢串,根據(jù)業(yè)務(wù)類型對(duì)分詞查詢串進(jìn)行分解獲得基于分詞查詢串的多個(gè)業(yè)務(wù)查詢串,并根據(jù)業(yè)務(wù)類型的優(yōu)先級(jí)對(duì)多個(gè)業(yè)務(wù)查詢串進(jìn)行排序;通過(guò)預(yù)先部署的檢索組件對(duì)排序后的多個(gè)業(yè)務(wù)查詢串分別進(jìn)行檢索;通過(guò)預(yù)先部署的檢索后處理組件計(jì)算輸出結(jié)果的排序值,并根據(jù)輸出結(jié)果的排序值對(duì)檢索出的結(jié)果進(jìn)行排序。本發(fā)明的方法及系統(tǒng),能夠在統(tǒng)一的框架下根據(jù)不同地區(qū)配置不同的排序規(guī)則,實(shí)現(xiàn)多個(gè)地區(qū)的個(gè)性化業(yè)務(wù)排序功能,適應(yīng)新業(yè)務(wù)的發(fā)展。
文檔編號(hào)G06F17/30GK101699440SQ20091022359
公開(kāi)日2010年4月28日 申請(qǐng)日期2009年11月24日 優(yōu)先權(quán)日2009年11月24日
發(fā)明者梁冰, 蔡堅(jiān)錚, 張玉忠, 林全疆, 方艾, 宋平波, 李云, 金鐸, 趙華, 陳康 申請(qǐng)人:中國(guó)電信股份有限公司