一種檢索方法和系統(tǒng)的制作方法

文檔序號：6583170閱讀：226來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計算;推算;計數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：一種檢索方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本申請涉及網(wǎng)絡(luò)數(shù)據(jù)處理領(lǐng)域，特別涉及一種檢索方法和系統(tǒng)。
背景技術(shù)：
在搜索引擎的搜索過程中，對搜索結(jié)果按照某些屬性(例如地域、來源或主題等)進(jìn)行二次排序，使得前η (η >= 1)條搜索結(jié)果在屬性上呈現(xiàn)分布的多樣性，這樣的現(xiàn) 象稱為搜索結(jié)果多樣化。在電子商務(wù)搜索中，搜索結(jié)果通常按照結(jié)果的相關(guān)性或者時間來排序，這樣的話將會導(dǎo)致供應(yīng)商不斷的發(fā)布同一種產(chǎn)品的信息，以使得自己的產(chǎn)品能夠占據(jù)搜索結(jié)果的前幾頁，從而惡意地擠掉其他供應(yīng)商的產(chǎn)品展示機(jī)會，而且給普通用戶找到其他產(chǎn)品造成一定的困難。為了避免這種現(xiàn)象，現(xiàn)有技術(shù)中，有一種通過抽取并按照相關(guān)性分級的方式進(jìn)行檢索的方法，其具體實現(xiàn)過程為預(yù)先對搜索結(jié)果按照相關(guān)性進(jìn)行分檔，相關(guān)性分?jǐn)?shù)值相近的搜索結(jié)果被劃分到同一個檔，然后再針對每個檔中的搜索結(jié)果進(jìn)行抽取，該抽取的方式為選取一個字段作為多樣化的依據(jù)，例如uid(供應(yīng)商的唯一標(biāo)識)，則搜索結(jié)果中就包括了多樣化的供應(yīng)商產(chǎn)品。在實際中，需要把搜索結(jié)果按照Uid的值劃分成很多子集合，屬于同一個Uid的搜索結(jié)果被劃分到一個子集合中，并在該子集合內(nèi)按照相關(guān)性分?jǐn)?shù)值從大到小排序，然后抽取每個子集合中m(m>= 1)個最相關(guān)的搜索結(jié)果，并把抽取出來的這些結(jié)果展現(xiàn)在搜索頁面的前幾頁，這就能使得前幾頁的搜索結(jié)果中包含了多個不同uid的產(chǎn)品。從上述過程中可以看出，在現(xiàn)有技術(shù)中，需要按照Uid進(jìn)行子集合劃分并排序，雖然也在一定程度上可以實現(xiàn)搜索結(jié)果的多樣化，但是現(xiàn)有技術(shù)在抽取和分檔的過程中會對全部的搜索結(jié)果進(jìn)行一次重新組織，這需要在系統(tǒng)內(nèi)存中重新拷貝一份搜索結(jié)果集，這樣就造成了大量的搜索引擎服務(wù)器端的資源消耗，例如時間，硬件系統(tǒng)的耗費等，從而導(dǎo)致了搜索引擎服務(wù)器端的性能降低；進(jìn)一步的，每個子集合內(nèi)部的排序其實并不是完全必要的，所以現(xiàn)有技術(shù)還進(jìn)行了一部分無用的運算，這就浪費了用來進(jìn)行這部分運算的系統(tǒng)資源；另外，現(xiàn)有技術(shù)采用相關(guān)性分檔的做法雖然在一定程度上可以平衡搜索結(jié)果的多樣性和相關(guān)性，但是也無法用一個固定的分檔區(qū)間正確切分所有搜索結(jié)果集合的分布情況。如圖1 所示，該檔位的劃分對查詢(Query)A是合適的，但是對于Query B的檔位劃分就不合適了，可以看出對于QueryA來說，相關(guān)性接近的搜索結(jié)果被劃分在相同的分檔區(qū)間，而對于 QueryB，相關(guān)性接近的搜索結(jié)果并沒有被規(guī)律的劃分在同一分檔區(qū)間。因此現(xiàn)有技術(shù)的靈活性也不夠好。總之，目前需要本領(lǐng)域技術(shù)人員迫切解決的一個技術(shù)問題就是如何能夠創(chuàng)新的提出一種檢索方法，以解決現(xiàn)有技術(shù)中在服務(wù)器端資源過量消耗的問題。

發(fā)明內(nèi)容
本申請所要解決的技術(shù)問題是提供一種檢索方法，用以解決現(xiàn)有技術(shù)中在服務(wù)器端資源過量消耗導(dǎo)致的搜索引擎服務(wù)器段性能降低的問題，更進(jìn)一步的，還可以提升檢索方法的靈活性。本申請還提供了一種檢索系統(tǒng)，用以保證上述方法在實際中的實現(xiàn)及應(yīng)用。為了解決上述問題，本申請公開了一種檢索方法，包括根據(jù)客戶端提交的查詢數(shù)據(jù)，獲得與所述查詢數(shù)據(jù)相關(guān)的第一檢索結(jié)果集合；根據(jù)所述集合中各個第一檢索結(jié)果的第一相關(guān)性分值和預(yù)置的多樣性字段，計算獲取所述各個第一檢索結(jié)果的第二相關(guān)性分值；所述多樣性字段用于表示所述第一檢索結(jié) 果的屬性類別；根據(jù)所述第一相關(guān)性分值和第二相關(guān)性分值生成所述各個第一檢索結(jié)果的相關(guān) 性參數(shù)值；按照第二檢索結(jié)果的預(yù)置個數(shù)和所述相關(guān)性參數(shù)值，從所述第一檢索結(jié)果集合中抽取需要向客戶端展示的第二檢索結(jié)果。本申請還提供了一種檢索系統(tǒng)，該系統(tǒng)包括獲取單元，用于根據(jù)客戶端提交的查詢數(shù)據(jù)，獲得與所述查詢數(shù)據(jù)相關(guān)的第一檢索結(jié)果集合；計算單元，用于根據(jù)所述集合中各個第一檢索結(jié)果的第一相關(guān)性分值和預(yù)置的多樣性字段，計算獲取所述各個第一檢索結(jié)果的第二相關(guān)性分值；所述多樣性字段用于表示所述第一檢索結(jié)果的屬性類別；設(shè)置單元，用于根據(jù)所述第一相關(guān)性分值和第二相關(guān)性分值生成所述各個第一檢索結(jié)果的相關(guān)性參數(shù)值；抽取單元，用于按照第二檢索結(jié)果的預(yù)置個數(shù)和所述相關(guān)性參數(shù)值從所述第一檢索結(jié)果集合中抽取需要向客戶端展示的第二檢索結(jié)果。與現(xiàn)有技術(shù)相比，本申請包括以下優(yōu)點在本申請中，將現(xiàn)有技術(shù)中的第一相關(guān)性分?jǐn)?shù)值和計算得到的第二相關(guān)性分?jǐn)?shù)值之和作為相關(guān)性參數(shù)，以該相關(guān)性參數(shù)來對檢索結(jié)果進(jìn)行二次抽取，以使得搜索結(jié)果中能夠盡量包括多樣化的搜索結(jié)果，并且本申請在多樣化的過程中進(jìn)行了優(yōu)化，使得運用本實施例所述的方法過程中系統(tǒng)資源的消耗更小、運算更快以及擴(kuò)展更靈活，從而提升了搜索引擎服務(wù)器段的性能。當(dāng)然，實施本申請的任一產(chǎn)品并不一定需要同時達(dá)到以上所述的所有優(yōu)點。

為了更清楚地說明本申請實施例中的技術(shù)方案，下面將對實施例描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本申請的一些實施例，對于本領(lǐng)域普通技術(shù)人員來講，在不付出創(chuàng)造性勞動性的前提下，還可以根據(jù)這些附圖獲得其他的附圖。圖1是現(xiàn)有技術(shù)中檔位劃分的界面示意圖；圖2是本申請的一種檢索方法實施例1的流程圖；圖3是本申請的一種檢索方法實施例2的流程圖；圖4是本申請的一種檢索方法實施例3的流程圖5是本申請的一種檢索系統(tǒng)實施例1的結(jié)構(gòu)框圖；圖6是本申請的一種檢索系統(tǒng)實施例2的結(jié)構(gòu)框圖；圖7是本申請的一種檢索系統(tǒng)實施例3的結(jié)構(gòu)框圖。
具體實施例方式下面將結(jié)合本申請實施例中的附圖，對本申請實施例中的技術(shù)方案進(jìn)行清楚、完整地描述，顯然，所描述的實施例僅僅是本申請一部分實施例，而不是全部的實施例?；?本申請中的實施例，本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例，都屬于本申請保護(hù)的范圍。本申請可用于眾多通用或?qū)Ｓ玫挠嬎阊b置環(huán)境或配置中。例如個人計算機(jī)、服務(wù) 器計算機(jī)、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處理器裝置、包括以上任何裝置或設(shè)備的分布式計算環(huán)境等等。本申請可以在由計算機(jī)執(zhí)行的計算機(jī)可執(zhí)行指令的一般上下文中描述，例如程序模塊。一般地，程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計算環(huán)境中實踐本申請，在這些分布式計算環(huán)境中，由通過通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來執(zhí)行任務(wù)。在分布式計算環(huán)境中，程序模塊可以位于包括存儲設(shè)備在內(nèi)的本地和遠(yuǎn)程計算機(jī)存儲介質(zhì)中。本申請的主要思想之一可以包括，首先采用現(xiàn)有技術(shù)中的方法，根據(jù)客戶端提交的查詢數(shù)據(jù)，獲得與所述查詢數(shù)據(jù)相關(guān)的第一檢索結(jié)果集合；本申請實施例中，關(guān)鍵是根據(jù)所述集合中各個第一檢索結(jié)果的第一相關(guān)性分值和預(yù)置的多樣性字段，計算獲取所述各個第一檢索結(jié)果的第二相關(guān)性分值，所述多樣性字段用于表示所述第一檢索結(jié)果的屬性類別；然后將所述第一相關(guān)性分值和第二相關(guān)性分值之和作為所述各個第一檢索結(jié)果的相關(guān) 性參數(shù)值；最后按照第二檢索結(jié)果的預(yù)置個數(shù)和所述相關(guān)性參數(shù)值，從所述第一檢索結(jié)果集合中抽取需要向客戶端展示的第二檢索結(jié)果。這樣抽出的第二檢索結(jié)果就可以更加明顯的體現(xiàn)出搜索結(jié)果多樣化；也避免了大量的搜索引擎服務(wù)器端的資源消耗，例如時間，硬件系統(tǒng)的耗費等，從而提升了搜索引擎服務(wù)器端的性能；進(jìn)一步的，還能夠使得本申請實施例的方法適應(yīng)更多的搜索結(jié)果集合的分布情況，增加了靈活性。參考圖2，示出了本申請一種檢索方法實施例1的流程圖，可以包括以下步驟步驟201 根據(jù)客戶端提交的查詢數(shù)據(jù)，獲得與所述查詢數(shù)據(jù)相關(guān)的第一檢索結(jié)
果集合。在搜索引擎相關(guān)的技術(shù)領(lǐng)域中，通常把用戶的查詢表示為符號Query，把與此 Query匹配的一條結(jié)果表示為Doc，那么與Query匹配的所有結(jié)果集就是Doc集合，表示為 {Doc}。在本步驟中，當(dāng)客戶端提交Query之后，搜索引擎服務(wù)器內(nèi)部處理過程的第一步就是把Query映射到{Doc}，即Query- > {Doc}，其中，符號“- >”表示映射的意思。同時，搜索引擎服務(wù)器為{Doc}中的每個Doc計算出第一相關(guān)性分值(&01^1)，所述&01^1用來表示當(dāng)前Doc與當(dāng)前Query的匹配程度，用符號表示即{Doc}-> {Doc，Scorel}。其中，所述映射過程即是根據(jù)Query匹配檢索結(jié)果的過程，在計算korel時，可以采用任何相關(guān)性算法來計算，譬如經(jīng)典的TF-IDF算法，當(dāng)然還可以采用其他方式，例如信息增益(IG)、互信息(MI)以及熵的方法等。需要說明的是，第一檢索結(jié)果獲得的算法可以由搜索引擎服務(wù)器任意定義，本申請并不限制搜索引擎服務(wù)器端采用何種算法獲取第一檢索結(jié)果集合。因此，如果本步驟中的相關(guān)性算法不一樣，那么后續(xù)得到的第一檢索結(jié)果也會有差別，可以理解的是，這并不會對本申請的后續(xù)流程產(chǎn)生影響，因為本申請是針對給定第一檢索結(jié)果的多樣化處理，而無需限制獲得第一檢索結(jié)果的方式。步驟202 根據(jù)所述集合中各個第一檢索結(jié)果的第一相關(guān)性分值和預(yù)置的多樣性字段，計算獲取所述各個第一檢索結(jié)果的第二相關(guān)性分值；所述多樣性字段用于表示所述第一檢索結(jié)果的屬性類別。在計算出第一檢索結(jié)果集合中各個第一檢索結(jié)果的korel之后，需要根據(jù)預(yù)置的多樣性字段和該&01^1來計算各個第一檢索結(jié)果的第二相關(guān)性分值6c0re2)，其中，多樣性字段用于標(biāo)識第一檢索結(jié)果的屬性類別，例如，在電子商務(wù)垂直搜索中，各個檢索結(jié)果的uid(供應(yīng)商的標(biāo)識)或者地理位置信息等；所述&01^2用來表示根據(jù)korel的值和各個第一檢索結(jié)果在該多樣性字段下排名位置相關(guān)的一個數(shù)值，在實際應(yīng)用中，所述可以采用預(yù)先設(shè)置函數(shù)，并將該函數(shù)的參數(shù)設(shè)置為&01^2和各個第一檢索結(jié)果的排名位置，則該函數(shù)的返回值即是kore2的值。該函數(shù)中設(shè)置排名位置和kore2具有某種關(guān)聯(lián)，例如，第一檢索結(jié)果的排名越靠前，得到的&01^2越大。當(dāng)然，根據(jù)實際情況的不同，本領(lǐng) 域技術(shù)人員也可以在該函數(shù)中采取排名位置和的其他關(guān)聯(lián)方式。步驟203 根據(jù)所述第一相關(guān)性分值和第二相關(guān)性分值生成所述各個第一檢索結(jié) 果的相關(guān)性參數(shù)值。本步驟的內(nèi)容是與現(xiàn)有技術(shù)中區(qū)別所在，即是在步驟102中計算了 kore2的基礎(chǔ)上，根據(jù)korel和生成所述各個第一檢索結(jié)果的相關(guān)性參數(shù)值。具體生成所述各個第一檢索結(jié)果的相關(guān)性參數(shù)值的方法可以包括將korel和SCore2之和作為所述各個第一檢索結(jié)果的相關(guān)性參數(shù)值；或者設(shè)定一權(quán)重值，使得相關(guān)性參數(shù)值等于kore2 乘以該權(quán)重值所得的積加ikorel，例如設(shè)定所述權(quán)重值為2，則所述相關(guān)性參數(shù)值= k0rel+2*SC0re2。本申請對如何根據(jù)korel和kore2生成所述各個第一檢索結(jié)果的相關(guān) 性參數(shù)值并不做具體限定，任何根據(jù)本申請思想的簡單變形都包括在本申請的保護(hù)范圍之內(nèi)。在本實施例中，并不是僅僅通過korel對第一檢索結(jié)果集合進(jìn)行劃分，而是將korel 和&ore2兩個參數(shù)共同生成的一個新的參數(shù)來對第一檢索結(jié)果做后續(xù)的處理。步驟204 按照第二檢索結(jié)果的預(yù)置個數(shù)和所述相關(guān)性參數(shù)值，從所述第一檢索結(jié)果集合中抽取需要向客戶端展示的第二檢索結(jié)果。在本步驟中，假設(shè)多樣化字段預(yù)置的為Uid，本實施例需要的參數(shù)還包括第二檢索結(jié)果的預(yù)置個數(shù)，其中，具體的，預(yù)置個數(shù)的第二檢索結(jié)果可以通過預(yù)設(shè)多樣性值個數(shù)以及循環(huán)抽取次數(shù)獲得，即，通過預(yù)設(shè)的多樣性值個數(shù)與循環(huán)抽取次數(shù)的乘積計算獲得需要抽取的第二檢索結(jié)果的個數(shù)。該多樣性值個數(shù)用于表示在后續(xù)抽取的第二檢索結(jié)果中，不同 uid的第一檢索結(jié)果中需要抽取的檢索結(jié)果的個數(shù)，例如，當(dāng)個數(shù)為3時，表示不同的uid的搜索結(jié)果中均抽取3個。多樣化操作的循環(huán)次數(shù)，用于表示將抽取的第二檢索結(jié)果在后續(xù) 向客戶端展示時，共需向客戶端展示多少個第二檢索結(jié)果，例如，當(dāng)循環(huán)次數(shù)為1時，則返回3個第二檢索結(jié)果，當(dāng)循環(huán)次數(shù)為2時，則返回6個第二檢索結(jié)果，以此類推。這樣抽取出的第二檢索結(jié)果就包括了與不同Uid相關(guān)的檢索結(jié)果。在本實施例中，在避免大量的搜索引擎服務(wù)器端的資源消耗，例如時間，硬件系統(tǒng) 的耗費等，提升搜索引擎服務(wù)器端的性能的同時，進(jìn)一步的，還允許用戶可以很靈活的配置檢索結(jié)果多樣化的個數(shù)；同時可以通過定義不同的f(Positi0n，Scorel)函數(shù)來平衡檢索結(jié)果的相關(guān)性和多樣性，帶給用戶以最好的搜索體驗。參考圖3，示出了本申請一種檢索方法實施例2的流程圖，可以包括以下步驟步驟301 根據(jù)客戶端提交的查詢數(shù)據(jù)，獲得與所述查詢數(shù)據(jù)相關(guān)的第一檢索結(jié)
果集合。當(dāng)然，在實際應(yīng)用中，本申請實施例適用于搜索引擎服務(wù)器的檢索結(jié)果并沒有實現(xiàn)多樣化的情況，即在獲得第一檢索結(jié)果并按照第一相關(guān)性分值進(jìn)行排序后，該第一檢索結(jié)果中相同屬性的檢索結(jié)果仍聚集在一起。例如，在搜索引擎服務(wù)器端的檢索結(jié)果的前若干位均為與同一個供應(yīng)商相關(guān)的檢索結(jié)果。那么，在所述步驟301之后，可以首先對第一檢索結(jié)果集合進(jìn)行判斷，例如，判斷前若干個檢索結(jié)果是否屬于同一類別等，如果第一檢索結(jié) 果集合中的前若干位均為同一類別的檢索結(jié)果，則可以執(zhí)行后續(xù)步驟。步驟302 按照預(yù)置的多樣性字段對第一檢索結(jié)果集合進(jìn)行分類，獲取所述第一檢索結(jié)果集合中每一個類別對應(yīng)的子集合。在本實施例中，假設(shè)接收得到的預(yù)置的多樣性字段即是Uid，那么如表1所示，多樣性字段uid有{A，B，C}三個值，本實施例中第一檢索結(jié)果集合{Doc}的關(guān)于uid的子集合為{A1，A2，A3}，{B1，B2，B3}，{Cl，C2，C3}，其中 Al A3 的 uid = A, Al A3 為 A 供應(yīng) 商下的檢索結(jié)果，Bl B3的uid = B，Bl B3為C供應(yīng)商下的檢索結(jié)果，Cl C3的uid =C，Cl C3為C供應(yīng)商下的檢索結(jié)果。步驟303 按照所述各個子集合中第一相關(guān)性分值大小獲取相應(yīng)的第一檢索結(jié)果的位置。在本實施例中，具體需要按照korel的大小對子集合中的各個第一檢索結(jié)果進(jìn) 行排序。具體如表1所示，表1為本實施例中的第一檢索結(jié)果集合{Doc}以及每個Doc對應(yīng)的uid和第一相關(guān)性分?jǐn)?shù)值(Scorel)表 權(quán)利要求
1.一種檢索方法，其特征在于，該方法包括根據(jù)客戶端提交的查詢數(shù)據(jù)，獲得與所述查詢數(shù)據(jù)相關(guān)的第一檢索結(jié)果集合；根據(jù)所述集合中各個第一檢索結(jié)果的第一相關(guān)性分值和預(yù)置的多樣性字段，計算獲取所述各個第一檢索結(jié)果的第二相關(guān)性分值；所述多樣性字段用于表示所述第一檢索結(jié)果的屬性類別；根據(jù)所述第一相關(guān)性分值和第二相關(guān)性分值生成所述各個第一檢索結(jié)果的相關(guān)性參數(shù)值；按照第二檢索結(jié)果的預(yù)置個數(shù)和所述相關(guān)性參數(shù)值，從所述第一檢索結(jié)果集合中抽取需要向客戶端展示的第二檢索結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述根據(jù)所述集合中各個第一檢索結(jié)果的第一相關(guān)性分值和預(yù)置的多樣性字段，計算獲取所述各個第一檢索結(jié)果的第二相關(guān)性分值，具體包括按照預(yù)置的多樣性字段對第一檢索結(jié)果集合進(jìn)行分類，獲取所述第一檢索結(jié)果集合中每一個類別對應(yīng)的子集合；按照所述各個子集合中第一相關(guān)性分值大小獲取相應(yīng)的第一檢索結(jié)果的位置；根據(jù)預(yù)置的第二相關(guān)性分值與各個第一檢索結(jié)果在所述分類后的各子集合中的位置的關(guān)系，匹配獲取到各個第一檢索結(jié)果的第二相關(guān)性分值。
3.根據(jù)權(quán)利要求2所述的方法，其特征在于，所述按照第二檢索結(jié)果的預(yù)置個數(shù)和相關(guān)性參數(shù)值，從所述第一檢索結(jié)果集合中抽取需要向客戶端展示的第二檢索結(jié)果，具體包括按照所述相關(guān)性參數(shù)值對所述第一檢索結(jié)果分類后的各子集合進(jìn)行排序；從排序后的各子集合中，按照排序的先后順序分別抽取預(yù)置個數(shù)的第二檢索結(jié)果，所述預(yù)置個數(shù)為多樣性值個數(shù)和循環(huán)抽取次數(shù)的乘積。
4.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述從所述第一檢索結(jié)果集合中抽取需要向客戶端展示的第二檢索結(jié)果之前，還包括將查詢數(shù)據(jù)、第二檢索結(jié)果以及兩者的對應(yīng)關(guān)系保存至數(shù)據(jù)庫中。
5.根據(jù)權(quán)利要求3所述的方法，其特征在于，所述根據(jù)客戶端提交的查詢數(shù)據(jù)，獲得與所述查詢數(shù)據(jù)相關(guān)的第一檢索結(jié)果集合，具體包括按照第一相關(guān)性分值對所述客戶端提交的查詢數(shù)據(jù)進(jìn)行檢索；將檢索結(jié)果按照預(yù)先選取的多樣化字段抽取出第一檢索結(jié)果。
6.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述抽取需要向客戶端展示的第二檢索結(jié)果之后，還包括將所述第二檢索結(jié)果向客戶端進(jìn)行展示。
7.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述根據(jù)所述第一相關(guān)性分值和第二相關(guān)性分值生成所述各個第一檢索結(jié)果的相關(guān)性參數(shù)值具體包括將第一相關(guān)性分值和第二相關(guān)性分值之后作為所述各個第一檢索結(jié)果的相關(guān)性參數(shù)值。
8.一種檢索系統(tǒng)，其特征在于，該系統(tǒng)包括獲取單元，用于根據(jù)客戶端提交的查詢數(shù)據(jù)，獲得與所述查詢數(shù)據(jù)相關(guān)的第一檢索結(jié) 果集合；計算單元，用于根據(jù)所述集合中各個第一檢索結(jié)果的第一相關(guān)性分值和預(yù)置的多樣性字段，計算獲取所述各個第一檢索結(jié)果的第二相關(guān)性分值；所述多樣性字段用于表示所述第一檢索結(jié)果的屬性類別；設(shè)置單元，用于根據(jù)所述第一相關(guān)性分值和第二相關(guān)性分值生成所述各個第一檢索結(jié) 果的相關(guān)性參數(shù)值；抽取單元，用于按照第二檢索結(jié)果的預(yù)置個數(shù)和所述相關(guān)性參數(shù)值從所述第一檢索結(jié) 果集合中抽取需要向客戶端展示的第二檢索結(jié)果。
9.根據(jù)權(quán)利要求8所述的系統(tǒng)，其特征在于，所述計算單元具體包括第一獲取子單元，用于按照預(yù)置的多樣性字段對第一檢索結(jié)果集合進(jìn)行分類，獲取所述第一檢索結(jié)果集合中每一個類別對應(yīng)的子集合；第二獲取子單元，用于按照所述各個子集合中第一相關(guān)性分值大小獲取相應(yīng)的第一檢索結(jié)果的順序；匹配子單元，用于根據(jù)預(yù)置的所述第一檢索結(jié)果的順序與第二相關(guān)性分值的關(guān)系，匹配獲取到各個第一檢索結(jié)果的第二相關(guān)性分值。
10.根據(jù)權(quán)利要求9所述的系統(tǒng)，其特征在于，所述抽取單元具體包括排序子單元，用于按照所述相關(guān)性參數(shù)值對第一檢索結(jié)果進(jìn)行排序；第一抽取子單元，用于從排序后的各子集合中，按照排序的先后順序分別抽取預(yù)置個數(shù)的第二檢索結(jié)果，所述預(yù)置個數(shù)為多樣性值個數(shù)和循環(huán)抽取次數(shù)的乘積。
11.根據(jù)權(quán)利要求8所述的系統(tǒng)，其特征在于，所述系統(tǒng)還包括保存單元，用于將查詢數(shù)據(jù)、第二檢索結(jié)果以及兩者的對應(yīng)關(guān)系保存至數(shù)據(jù)庫中。
12.根據(jù)權(quán)利要求11所述的系統(tǒng)，其特征在于，所述獲取單元具體包括檢索子單元，用于按照第一相關(guān)性分值對所述客戶端提交的查詢數(shù)據(jù)進(jìn)行檢索；第二抽取子單元，用于將檢索結(jié)果按照預(yù)先選取的多樣化字段抽取出第一檢索結(jié)果。
13.根據(jù)權(quán)利要求8所述的系統(tǒng)，其特征在于，還包括展示單元，用于將所述第二檢索結(jié)果向客戶端進(jìn)行展示。
14.根據(jù)權(quán)利要求8所述的系統(tǒng)，其特征在于，所述設(shè)置單元，具體用于將第一相關(guān)性分值和第二相關(guān)性分值之后作為所述各個第一檢索結(jié)果的相關(guān)性參數(shù)值。
全文摘要
本申請?zhí)峁┝艘环N檢索方法和系統(tǒng)，所述方法包括根據(jù)客戶端提交的查詢數(shù)據(jù)，獲得與所述查詢數(shù)據(jù)相關(guān)的第一檢索結(jié)果集合；根據(jù)所述集合中各個第一檢索結(jié)果的第一相關(guān)性分值和預(yù)置的多樣性字段，計算獲取各個第一檢索結(jié)果的第二相關(guān)性分值；多樣性字段用于表示所述第一檢索結(jié)果的屬性類別；根據(jù)第一相關(guān)性分值和第二相關(guān)性分值生成各個第一檢索結(jié)果的相關(guān)性參數(shù)值；按照第二檢索結(jié)果的預(yù)置個數(shù)和所述相關(guān)性參數(shù)值，從所述第一檢索結(jié)果集合中抽取需要向客戶端展示的第二檢索結(jié)果。采用本申請的方法或系統(tǒng)，在搜索結(jié)果多樣性過程中系統(tǒng)資源的消耗更小、運算更快以及擴(kuò)展更靈活。
文檔編號G06F17/30GK102063432SQ200910211788
公開日2011年5月18日申請日期2009年11月12日優(yōu)先權(quán)日2009年11月12日
發(fā)明者張理, 李金輝, 郭瑞杰申請人:阿里巴巴集團(tuán)控股有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：張理;李金輝;郭瑞杰
技術(shù)所有人：阿里巴巴集團(tuán)控股有限公司
我是此專利的發(fā)明人

上一篇：計算機(jī)裝置及其開機(jī)方法
上一篇：數(shù)據(jù)組的相關(guān)值的圖形表示方法及裝置的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.計算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計算機(jī)網(wǎng)絡(luò)安全 2.計算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

佰騰網(wǎng)專利檢索系統(tǒng)相關(guān)技術(shù)

法律法規(guī)檢索系統(tǒng)相關(guān)技術(shù)

二十五史全文檢索系統(tǒng)相關(guān)技術(shù)

ccl語料庫檢索系統(tǒng)相關(guān)技術(shù)

專利之星專利檢索系統(tǒng)相關(guān)技術(shù)

中國專利檢索系統(tǒng)相關(guān)技術(shù)

專利檢索系統(tǒng)相關(guān)技術(shù)

歐洲專利檢索系統(tǒng)相關(guān)技術(shù)

圖書檢索系統(tǒng)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種檢索方法和系統(tǒng)的制作方法