專利名稱:一種檢索方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本申請涉及網(wǎng)絡(luò)數(shù)據(jù)處理領(lǐng)域,特別涉及一種檢索方法和系統(tǒng)。
背景技術(shù):
在搜索引擎的搜索過程中,對搜索結(jié)果按照某些屬性(例如地域、來源或主題 等)進(jìn)行二次排序,使得前η (η >= 1)條搜索結(jié)果在屬性上呈現(xiàn)分布的多樣性,這樣的現(xiàn) 象稱為搜索結(jié)果多樣化。在電子商務(wù)搜索中,搜索結(jié)果通常按照結(jié)果的相關(guān)性或者時間來 排序,這樣的話將會導(dǎo)致供應(yīng)商不斷的發(fā)布同一種產(chǎn)品的信息,以使得自己的產(chǎn)品能夠占 據(jù)搜索結(jié)果的前幾頁,從而惡意地擠掉其他供應(yīng)商的產(chǎn)品展示機(jī)會,而且給普通用戶找到 其他產(chǎn)品造成一定的困難。為了避免這種現(xiàn)象,現(xiàn)有技術(shù)中,有一種通過抽取并按照相關(guān)性分級的方式進(jìn)行 檢索的方法,其具體實現(xiàn)過程為預(yù)先對搜索結(jié)果按照相關(guān)性進(jìn)行分檔,相關(guān)性分?jǐn)?shù)值相近 的搜索結(jié)果被劃分到同一個檔,然后再針對每個檔中的搜索結(jié)果進(jìn)行抽取,該抽取的方式 為選取一個字段作為多樣化的依據(jù),例如uid(供應(yīng)商的唯一標(biāo)識),則搜索結(jié)果中就包 括了多樣化的供應(yīng)商產(chǎn)品。在實際中,需要把搜索結(jié)果按照Uid的值劃分成很多子集合,屬 于同一個Uid的搜索結(jié)果被劃分到一個子集合中,并在該子集合內(nèi)按照相關(guān)性分?jǐn)?shù)值從大 到小排序,然后抽取每個子集合中m(m>= 1)個最相關(guān)的搜索結(jié)果,并把抽取出來的這些 結(jié)果展現(xiàn)在搜索頁面的前幾頁,這就能使得前幾頁的搜索結(jié)果中包含了多個不同uid的產(chǎn)品。 從上述過程中可以看出,在現(xiàn)有技術(shù)中,需要按照Uid進(jìn)行子集合劃分并排序,雖 然也在一定程度上可以實現(xiàn)搜索結(jié)果的多樣化,但是現(xiàn)有技術(shù)在抽取和分檔的過程中會對 全部的搜索結(jié)果進(jìn)行一次重新組織,這需要在系統(tǒng)內(nèi)存中重新拷貝一份搜索結(jié)果集,這樣 就造成了大量的搜索引擎服務(wù)器端的資源消耗,例如時間,硬件系統(tǒng)的耗費等,從而導(dǎo)致了 搜索引擎服務(wù)器端的性能降低;進(jìn)一步的,每個子集合內(nèi)部的排序其實并不是完全必要的, 所以現(xiàn)有技術(shù)還進(jìn)行了一部分無用的運算,這就浪費了用來進(jìn)行這部分運算的系統(tǒng)資源; 另外,現(xiàn)有技術(shù)采用相關(guān)性分檔的做法雖然在一定程度上可以平衡搜索結(jié)果的多樣性和相 關(guān)性,但是也無法用一個固定的分檔區(qū)間正確切分所有搜索結(jié)果集合的分布情況。如圖1 所示,該檔位的劃分對查詢(Query)A是合適的,但是對于Query B的檔位劃分就不合適 了,可以看出對于QueryA來說,相關(guān)性接近的搜索結(jié)果被劃分在相同的分檔區(qū)間,而對于 QueryB,相關(guān)性接近的搜索結(jié)果并沒有被規(guī)律的劃分在同一分檔區(qū)間。因此現(xiàn)有技術(shù)的靈 活性也不夠好。總之,目前需要本領(lǐng)域技術(shù)人員迫切解決的一個技術(shù)問題就是如何能夠創(chuàng)新的 提出一種檢索方法,以解決現(xiàn)有技術(shù)中在服務(wù)器端資源過量消耗的問題。
發(fā)明內(nèi)容
本申請所要解決的技術(shù)問題是提供一種檢索方法,用以解決現(xiàn)有技術(shù)中在服務(wù)器端資源過量消耗導(dǎo)致的搜索引擎服務(wù)器段性能降低的問題,更進(jìn)一步的,還可以提升檢索 方法的靈活性。本申請還提供了一種檢索系統(tǒng),用以保證上述方法在實際中的實現(xiàn)及應(yīng)用。為了解決上述問題,本申請公開了一種檢索方法,包括根據(jù)客戶端提交的查詢數(shù)據(jù),獲得與所述查詢數(shù)據(jù)相關(guān)的第一檢索結(jié)果集合;根據(jù)所述集合中各個第一檢索結(jié)果的第一相關(guān)性分值和預(yù)置的多樣性字段,計算 獲取所述各個第一檢索結(jié)果的第二相關(guān)性分值;所述多樣性字段用于表示所述第一檢索結(jié) 果的屬性類別;根據(jù)所述第一相關(guān)性分值和第二相關(guān)性分值生成所述各個第一檢索結(jié)果的相關(guān) 性參數(shù)值;按照第二檢索結(jié)果的預(yù)置個數(shù)和所述相關(guān)性參數(shù)值,從所述第一檢索結(jié)果集合中 抽取需要向客戶端展示的第二檢索結(jié)果。本申請還提供了一種檢索系統(tǒng),該系統(tǒng)包括獲取單元,用于根據(jù)客戶端提交的查詢數(shù)據(jù),獲得與所述查詢數(shù)據(jù)相關(guān)的第一檢 索結(jié)果集合;計算單元,用于根據(jù)所述集合中各個第一檢索結(jié)果的第一相關(guān)性分值和預(yù)置的多 樣性字段,計算獲取所述各個第一檢索結(jié)果的第二相關(guān)性分值;所述多樣性字段用于表示 所述第一檢索結(jié)果的屬性類別;設(shè)置單元,用于根據(jù)所述第一相關(guān)性分值和第二相關(guān)性分值生成所述各個第一檢 索結(jié)果的相關(guān)性參數(shù)值;抽取單元,用于按照第二檢索結(jié)果的預(yù)置個數(shù)和所述相關(guān)性參數(shù)值從所述第一檢 索結(jié)果集合中抽取需要向客戶端展示的第二檢索結(jié)果。與現(xiàn)有技術(shù)相比,本申請包括以下優(yōu)點在本申請中,將現(xiàn)有技術(shù)中的第一相關(guān)性分?jǐn)?shù)值和計算得到的第二相關(guān)性分?jǐn)?shù)值 之和作為相關(guān)性參數(shù),以該相關(guān)性參數(shù)來對檢索結(jié)果進(jìn)行二次抽取,以使得搜索結(jié)果中能 夠盡量包括多樣化的搜索結(jié)果,并且本申請在多樣化的過程中進(jìn)行了優(yōu)化,使得運用本實 施例所述的方法過程中系統(tǒng)資源的消耗更小、運算更快以及擴(kuò)展更靈活,從而提升了搜索 引擎服務(wù)器段的性能。當(dāng)然,實施本申請的任一產(chǎn)品并不一定需要同時達(dá)到以上所述的所 有優(yōu)點。
為了更清楚地說明本申請實施例中的技術(shù)方案,下面將對實施例描述中所需要使 用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施例,對于 本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其 他的附圖。圖1是現(xiàn)有技術(shù)中檔位劃分的界面示意圖;圖2是本申請的一種檢索方法實施例1的流程圖;圖3是本申請的一種檢索方法實施例2的流程圖;圖4是本申請的一種檢索方法實施例3的流程圖5是本申請的一種檢索系統(tǒng)實施例1的結(jié)構(gòu)框圖;圖6是本申請的一種檢索系統(tǒng)實施例2的結(jié)構(gòu)框圖;圖7是本申請的一種檢索系統(tǒng)實施例3的結(jié)構(gòu)框圖。
具體實施例方式下面將結(jié)合本申請實施例中的附圖,對本申請實施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例?;?本申請中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本申請保護(hù)的范圍。本申請可用于眾多通用或?qū)S玫挠嬎阊b置環(huán)境或配置中。例如個人計算機(jī)、服務(wù) 器計算機(jī)、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處理器裝置、包括以上任何裝置或設(shè)備 的分布式計算環(huán)境等等。本申請可以在由計算機(jī)執(zhí)行的計算機(jī)可執(zhí)行指令的一般上下文中描述,例如程序 模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對象、組 件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計算環(huán)境中實踐本申請,在這些分布式計算環(huán)境中,由 通過通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來執(zhí)行任務(wù)。在分布式計算環(huán)境中,程序模塊可以 位于包括存儲設(shè)備在內(nèi)的本地和遠(yuǎn)程計算機(jī)存儲介質(zhì)中。本申請的主要思想之一可以包括,首先采用現(xiàn)有技術(shù)中的方法,根據(jù)客戶端提交 的查詢數(shù)據(jù),獲得與所述查詢數(shù)據(jù)相關(guān)的第一檢索結(jié)果集合;本申請實施例中,關(guān)鍵是根 據(jù)所述集合中各個第一檢索結(jié)果的第一相關(guān)性分值和預(yù)置的多樣性字段,計算獲取所述各 個第一檢索結(jié)果的第二相關(guān)性分值,所述多樣性字段用于表示所述第一檢索結(jié)果的屬性類 別;然后將所述第一相關(guān)性分值和第二相關(guān)性分值之和作為所述各個第一檢索結(jié)果的相關(guān) 性參數(shù)值;最后按照第二檢索結(jié)果的預(yù)置個數(shù)和所述相關(guān)性參數(shù)值,從所述第一檢索結(jié)果 集合中抽取需要向客戶端展示的第二檢索結(jié)果。這樣抽出的第二檢索結(jié)果就可以更加明顯 的體現(xiàn)出搜索結(jié)果多樣化;也避免了大量的搜索引擎服務(wù)器端的資源消耗,例如時間,硬件 系統(tǒng)的耗費等,從而提升了搜索引擎服務(wù)器端的性能;進(jìn)一步的,還能夠使得本申請實施例 的方法適應(yīng)更多的搜索結(jié)果集合的分布情況,增加了靈活性。參考圖2,示出了本申請一種檢索方法實施例1的流程圖,可以包括以下步驟步驟201 根據(jù)客戶端提交的查詢數(shù)據(jù),獲得與所述查詢數(shù)據(jù)相關(guān)的第一檢索結(jié)
果集合。在搜索引擎相關(guān)的技術(shù)領(lǐng)域中,通常把用戶的查詢表示為符號Query,把與此 Query匹配的一條結(jié)果表示為Doc,那么與Query匹配的所有結(jié)果集就是Doc集合,表示為 {Doc}。在本步驟中,當(dāng)客戶端提交Query之后,搜索引擎服務(wù)器內(nèi)部處理過程的第一步 就是把Query映射到{Doc},即Query- > {Doc},其中,符號“- >”表示映射的意思。同時, 搜索引擎服務(wù)器為{Doc}中的每個Doc計算出第一相關(guān)性分值(&01^1),所述&01^1用來 表示當(dāng)前Doc與當(dāng)前Query的匹配程度,用符號表示即{Doc}-> {Doc,Scorel}。其中,所 述映射過程即是根據(jù)Query匹配檢索結(jié)果的過程,在計算korel時,可以采用任何相關(guān)性 算法來計算,譬如經(jīng)典的TF-IDF算法,當(dāng)然還可以采用其他方式,例如信息增益(IG)、互信息(MI)以及熵的方法等。需要說明的是,第一檢索結(jié)果獲得的算法可以由搜索引擎服務(wù)器任意定義,本申 請并不限制搜索引擎服務(wù)器端采用何種算法獲取第一檢索結(jié)果集合。因此,如果本步驟中 的相關(guān)性算法不一樣,那么后續(xù)得到的第一檢索結(jié)果也會有差別,可以理解的是,這并不會 對本申請的后續(xù)流程產(chǎn)生影響,因為本申請是針對給定第一檢索結(jié)果的多樣化處理,而無 需限制獲得第一檢索結(jié)果的方式。步驟202 根據(jù)所述集合中各個第一檢索結(jié)果的第一相關(guān)性分值和預(yù)置的多樣性 字段,計算獲取所述各個第一檢索結(jié)果的第二相關(guān)性分值;所述多樣性字段用于表示所述 第一檢索結(jié)果的屬性類別。在計算出第一檢索結(jié)果集合中各個第一檢索結(jié)果的korel之后,需要根據(jù)預(yù)置 的多樣性字段和該&01^1來計算各個第一檢索結(jié)果的第二相關(guān)性分值6c0re2),其中,多 樣性字段用于標(biāo)識第一檢索結(jié)果的屬性類別,例如,在電子商務(wù)垂直搜索中,各個檢索結(jié)果 的uid(供應(yīng)商的標(biāo)識)或者地理位置信息等;所述&01^2用來表示根據(jù)korel的值和各 個第一檢索結(jié)果在該多樣性字段下排名位置相關(guān)的一個數(shù)值,在實際應(yīng)用中,所述 可以采用預(yù)先設(shè)置函數(shù),并將該函數(shù)的參數(shù)設(shè)置為&01^2和各個第一檢索結(jié)果的排名位 置,則該函數(shù)的返回值即是kore2的值。該函數(shù)中設(shè)置排名位置和kore2具有某種關(guān)聯(lián), 例如,第一檢索結(jié)果的排名越靠前,得到的&01^2越大。當(dāng)然,根據(jù)實際情況的不同,本領(lǐng) 域技術(shù)人員也可以在該函數(shù)中采取排名位置和的其他關(guān)聯(lián)方式。步驟203 根據(jù)所述第一相關(guān)性分值和第二相關(guān)性分值生成所述各個第一檢索結(jié) 果的相關(guān)性參數(shù)值。本步驟的內(nèi)容是與現(xiàn)有技術(shù)中區(qū)別所在,即是在步驟102中計算了 kore2的基 礎(chǔ)上,根據(jù)korel和生成所述各個第一檢索結(jié)果的相關(guān)性參數(shù)值。具體生成所 述各個第一檢索結(jié)果的相關(guān)性參數(shù)值的方法可以包括將korel和SCore2之和作為所 述各個第一檢索結(jié)果的相關(guān)性參數(shù)值;或者設(shè)定一權(quán)重值,使得相關(guān)性參數(shù)值等于kore2 乘以該權(quán)重值所得的積加ikorel,例如設(shè)定所述權(quán)重值為2,則所述相關(guān)性參數(shù)值= k0rel+2*SC0re2。本申請對如何根據(jù)korel和kore2生成所述各個第一檢索結(jié)果的相關(guān) 性參數(shù)值并不做具體限定,任何根據(jù)本申請思想的簡單變形都包括在本申請的保護(hù)范圍之 內(nèi)。在本實施例中,并不是僅僅通過korel對第一檢索結(jié)果集合進(jìn)行劃分,而是將korel 和&ore2兩個參數(shù)共同生成的一個新的參數(shù)來對第一檢索結(jié)果做后續(xù)的處理。步驟204 按照第二檢索結(jié)果的預(yù)置個數(shù)和所述相關(guān)性參數(shù)值,從所述第一檢索結(jié)果集合中抽取需要 向客戶端展示的第二檢索結(jié)果。在本步驟中,假設(shè)多樣化字段預(yù)置的為Uid,本實施例需要的參數(shù)還包括第二檢索 結(jié)果的預(yù)置個數(shù),其中,具體的,預(yù)置個數(shù)的第二檢索結(jié)果可以通過預(yù)設(shè)多樣性值個數(shù)以及 循環(huán)抽取次數(shù)獲得,即,通過預(yù)設(shè)的多樣性值個數(shù)與循環(huán)抽取次數(shù)的乘積計算獲得需要抽 取的第二檢索結(jié)果的個數(shù)。該多樣性值個數(shù)用于表示在后續(xù)抽取的第二檢索結(jié)果中,不同 uid的第一檢索結(jié)果中需要抽取的檢索結(jié)果的個數(shù),例如,當(dāng)個數(shù)為3時,表示不同的uid的 搜索結(jié)果中均抽取3個。多樣化操作的循環(huán)次數(shù),用于表示將抽取的第二檢索結(jié)果在后續(xù) 向客戶端展示時,共需向客戶端展示多少個第二檢索結(jié)果,例如,當(dāng)循環(huán)次數(shù)為1時,則返 回3個第二檢索結(jié)果,當(dāng)循環(huán)次數(shù)為2時,則返回6個第二檢索結(jié)果,以此類推。這樣抽取出的第二檢索結(jié)果就包括了與不同Uid相關(guān)的檢索結(jié)果。在本實施例中,在避免大量的搜索引擎服務(wù)器端的資源消耗,例如時間,硬件系統(tǒng) 的耗費等,提升搜索引擎服務(wù)器端的性能的同時,進(jìn)一步的,還允許用戶可以很靈活的配置 檢索結(jié)果多樣化的個數(shù);同時可以通過定義不同的f(Positi0n,Scorel)函數(shù)來平衡檢索 結(jié)果的相關(guān)性和多樣性,帶給用戶以最好的搜索體驗。參考圖3,示出了本申請一種檢索方法實施例2的流程圖,可以包括以下步驟步驟301 根據(jù)客戶端提交的查詢數(shù)據(jù),獲得與所述查詢數(shù)據(jù)相關(guān)的第一檢索結(jié)
果集合。當(dāng)然,在實際應(yīng)用中,本申請實施例適用于搜索引擎服務(wù)器的檢索結(jié)果并沒有實 現(xiàn)多樣化的情況,即在獲得第一檢索結(jié)果并按照第一相關(guān)性分值進(jìn)行排序后,該第一檢索 結(jié)果中相同屬性的檢索結(jié)果仍聚集在一起。例如,在搜索引擎服務(wù)器端的檢索結(jié)果的前若 干位均為與同一個供應(yīng)商相關(guān)的檢索結(jié)果。那么,在所述步驟301之后,可以首先對第一檢 索結(jié)果集合進(jìn)行判斷,例如,判斷前若干個檢索結(jié)果是否屬于同一類別等,如果第一檢索結(jié) 果集合中的前若干位均為同一類別的檢索結(jié)果,則可以執(zhí)行后續(xù)步驟。步驟302 按照預(yù)置的多樣性字段對第一檢索結(jié)果集合進(jìn)行分類,獲取所述第一 檢索結(jié)果集合中每一個類別對應(yīng)的子集合。在本實施例中,假設(shè)接收得到的預(yù)置的多樣性字段即是Uid,那么如表1所示,多 樣性字段uid有{A,B,C}三個值,本實施例中第一檢索結(jié)果集合{Doc}的關(guān)于uid的子集 合為{A1,A2,A3},{B1,B2,B3},{Cl,C2,C3},其中 Al A3 的 uid = A, Al A3 為 A 供應(yīng) 商下的檢索結(jié)果,Bl B3的uid = B,Bl B3為C供應(yīng)商下的檢索結(jié)果,Cl C3的uid =C,Cl C3為C供應(yīng)商下的檢索結(jié)果。步驟303 按照所述各個子集合中第一相關(guān)性分值大小獲取相應(yīng)的第一檢索結(jié)果 的位置。在本實施例中,具體需要按照korel的大小對子集合中的各個第一檢索結(jié)果進(jìn) 行排序。具體如表1所示,表1為本實施例中的第一檢索結(jié)果集合{Doc}以及每個Doc對 應(yīng)的uid和第一相關(guān)性分?jǐn)?shù)值(Scorel)表 權(quán)利要求
1.一種檢索方法,其特征在于,該方法包括根據(jù)客戶端提交的查詢數(shù)據(jù),獲得與所述查詢數(shù)據(jù)相關(guān)的第一檢索結(jié)果集合;根據(jù)所述集合中各個第一檢索結(jié)果的第一相關(guān)性分值和預(yù)置的多樣性字段,計算獲取 所述各個第一檢索結(jié)果的第二相關(guān)性分值;所述多樣性字段用于表示所述第一檢索結(jié)果的 屬性類別;根據(jù)所述第一相關(guān)性分值和第二相關(guān)性分值生成所述各個第一檢索結(jié)果的相關(guān)性參 數(shù)值;按照第二檢索結(jié)果的預(yù)置個數(shù)和所述相關(guān)性參數(shù)值,從所述第一檢索結(jié)果集合中抽取 需要向客戶端展示的第二檢索結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述集合中各個第一檢索結(jié)果 的第一相關(guān)性分值和預(yù)置的多樣性字段,計算獲取所述各個第一檢索結(jié)果的第二相關(guān)性分 值,具體包括按照預(yù)置的多樣性字段對第一檢索結(jié)果集合進(jìn)行分類,獲取所述第一檢索結(jié)果集合中 每一個類別對應(yīng)的子集合;按照所述各個子集合中第一相關(guān)性分值大小獲取相應(yīng)的第一檢索結(jié)果的位置;根據(jù)預(yù)置的第二相關(guān)性分值與各個第一檢索結(jié)果在所述分類后的各子集合中的位置 的關(guān)系,匹配獲取到各個第一檢索結(jié)果的第二相關(guān)性分值。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述按照第二檢索結(jié)果的預(yù)置個數(shù)和相 關(guān)性參數(shù)值,從所述第一檢索結(jié)果集合中抽取需要向客戶端展示的第二檢索結(jié)果,具體包 括按照所述相關(guān)性參數(shù)值對所述第一檢索結(jié)果分類后的各子集合進(jìn)行排序;從排序后的各子集合中,按照排序的先后順序分別抽取預(yù)置個數(shù)的第二檢索結(jié)果,所 述預(yù)置個數(shù)為多樣性值個數(shù)和循環(huán)抽取次數(shù)的乘積。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述從所述第一檢索結(jié)果集合中抽取需 要向客戶端展示的第二檢索結(jié)果之前,還包括將查詢數(shù)據(jù)、第二檢索結(jié)果以及兩者的對應(yīng)關(guān)系保存至數(shù)據(jù)庫中。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)客戶端提交的查詢數(shù)據(jù),獲得與 所述查詢數(shù)據(jù)相關(guān)的第一檢索結(jié)果集合,具體包括按照第一相關(guān)性分值對所述客戶端提交的查詢數(shù)據(jù)進(jìn)行檢索;將檢索結(jié)果按照預(yù)先選取的多樣化字段抽取出第一檢索結(jié)果。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述抽取需要向客戶端展示的第二檢索 結(jié)果之后,還包括將所述第二檢索結(jié)果向客戶端進(jìn)行展示。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述第一相關(guān)性分值和第二相 關(guān)性分值生成所述各個第一檢索結(jié)果的相關(guān)性參數(shù)值具體包括將第一相關(guān)性分值和第二 相關(guān)性分值之后作為所述各個第一檢索結(jié)果的相關(guān)性參數(shù)值。
8.一種檢索系統(tǒng),其特征在于,該系統(tǒng)包括獲取單元,用于根據(jù)客戶端提交的查詢數(shù)據(jù),獲得與所述查詢數(shù)據(jù)相關(guān)的第一檢索結(jié) 果集合;計算單元,用于根據(jù)所述集合中各個第一檢索結(jié)果的第一相關(guān)性分值和預(yù)置的多樣性 字段,計算獲取所述各個第一檢索結(jié)果的第二相關(guān)性分值;所述多樣性字段用于表示所述 第一檢索結(jié)果的屬性類別;設(shè)置單元,用于根據(jù)所述第一相關(guān)性分值和第二相關(guān)性分值生成所述各個第一檢索結(jié) 果的相關(guān)性參數(shù)值;抽取單元,用于按照第二檢索結(jié)果的預(yù)置個數(shù)和所述相關(guān)性參數(shù)值從所述第一檢索結(jié) 果集合中抽取需要向客戶端展示的第二檢索結(jié)果。
9.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述計算單元具體包括第一獲取子單元,用于按照預(yù)置的多樣性字段對第一檢索結(jié)果集合進(jìn)行分類,獲取所 述第一檢索結(jié)果集合中每一個類別對應(yīng)的子集合;第二獲取子單元,用于按照所述各個子集合中第一相關(guān)性分值大小獲取相應(yīng)的第一檢 索結(jié)果的順序;匹配子單元,用于根據(jù)預(yù)置的所述第一檢索結(jié)果的順序與第二相關(guān)性分值的關(guān)系,匹 配獲取到各個第一檢索結(jié)果的第二相關(guān)性分值。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述抽取單元具體包括排序子單元,用于按照所述相關(guān)性參數(shù)值對第一檢索結(jié)果進(jìn)行排序;第一抽取子單元,用于從排序后的各子集合中,按照排序的先后順序分別抽取預(yù)置個 數(shù)的第二檢索結(jié)果,所述預(yù)置個數(shù)為多樣性值個數(shù)和循環(huán)抽取次數(shù)的乘積。
11.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括保存單元,用于將查詢數(shù)據(jù)、第二檢索結(jié)果以及兩者的對應(yīng)關(guān)系保存至數(shù)據(jù)庫中。
12.根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于,所述獲取單元具體包括檢索子單元,用于按照第一相關(guān)性分值對所述客戶端提交的查詢數(shù)據(jù)進(jìn)行檢索;第二抽取子單元,用于將檢索結(jié)果按照預(yù)先選取的多樣化字段抽取出第一檢索結(jié)果。
13.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,還包括展示單元,用于將所述第二檢索結(jié)果向客戶端進(jìn)行展示。
14.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述設(shè)置單元,具體用于將第一相關(guān)性 分值和第二相關(guān)性分值之后作為所述各個第一檢索結(jié)果的相關(guān)性參數(shù)值。
全文摘要
本申請?zhí)峁┝艘环N檢索方法和系統(tǒng),所述方法包括根據(jù)客戶端提交的查詢數(shù)據(jù),獲得與所述查詢數(shù)據(jù)相關(guān)的第一檢索結(jié)果集合;根據(jù)所述集合中各個第一檢索結(jié)果的第一相關(guān)性分值和預(yù)置的多樣性字段,計算獲取各個第一檢索結(jié)果的第二相關(guān)性分值;多樣性字段用于表示所述第一檢索結(jié)果的屬性類別;根據(jù)第一相關(guān)性分值和第二相關(guān)性分值生成各個第一檢索結(jié)果的相關(guān)性參數(shù)值;按照第二檢索結(jié)果的預(yù)置個數(shù)和所述相關(guān)性參數(shù)值,從所述第一檢索結(jié)果集合中抽取需要向客戶端展示的第二檢索結(jié)果。采用本申請的方法或系統(tǒng),在搜索結(jié)果多樣性過程中系統(tǒng)資源的消耗更小、運算更快以及擴(kuò)展更靈活。
文檔編號G06F17/30GK102063432SQ200910211788
公開日2011年5月18日 申請日期2009年11月12日 優(yōu)先權(quán)日2009年11月12日
發(fā)明者張理, 李金輝, 郭瑞杰 申請人:阿里巴巴集團(tuán)控股有限公司