專利名稱:搜索引擎的結(jié)果排序方法
技術(shù)領(lǐng)域:
本申請(qǐng)涉及一種互聯(lián)網(wǎng)領(lǐng)域的搜索引擎,特別是涉及搜索引擎對(duì)結(jié)果進(jìn)行排序的方法。
背景技術(shù):
搜索引擎是指搜集大量的網(wǎng)頁(yè)信息,對(duì)這些網(wǎng)頁(yè)信息進(jìn)行整理,并為用戶提供檢索服務(wù)的計(jì)算機(jī)系統(tǒng)。搜索引擎通常都包括網(wǎng)頁(yè)抓取程序、索引程序、檢索程序等,其實(shí)現(xiàn)方法如下
首先,由網(wǎng)頁(yè)抓取程序自動(dòng)搜集網(wǎng)頁(yè)內(nèi)容。其次,由索引程序?yàn)樗鸭木W(wǎng)頁(yè)內(nèi)容建立索引。最典型的方法是將每個(gè)網(wǎng)頁(yè)中的文本內(nèi)容(包括多媒體內(nèi)容的名稱、描述、評(píng)論中的文本內(nèi)容)全部作為該網(wǎng)頁(yè)的關(guān)鍵詞索引,所有網(wǎng)頁(yè)的關(guān)鍵詞索引就形成了關(guān)鍵詞索引庫(kù)。最后,由檢索程序響應(yīng)用戶的查詢請(qǐng)求。最典型的方法是在關(guān)鍵詞索引庫(kù)中查找與用戶輸入的查詢內(nèi)容相匹配的記錄,并對(duì)輸出結(jié)果按照匹配加權(quán)的方式排序,并按照該順序展示給用戶。所述匹配就是指檢索結(jié)果與查詢內(nèi)容之間的相關(guān)性。所述加權(quán)就是指網(wǎng)絡(luò)資源的重要性,可通過(guò)詞頻、全部匹配或部分匹配、詞序是否一致、詞與詞之間的距離、關(guān)鍵詞在網(wǎng)頁(yè)中的位置(例如標(biāo)題或正文)、超鏈接數(shù)量、點(diǎn)擊數(shù)量、用戶停留時(shí)間等綜合考慮。還有一類特殊的搜索引擎是基于分類目錄查詢,用戶并不輸入任何查詢內(nèi)容,而是根據(jù)搜索引擎預(yù)設(shè)的分類目錄逐層訪問(wèn),得到該目錄下的所有網(wǎng)頁(yè)資源。此時(shí),網(wǎng)頁(yè)資源僅按照加權(quán)方式排序,由于沒(méi)有查詢內(nèi)容而不考慮匹配情況。上述兩種搜索引擎的結(jié)果排序方法具有如下缺點(diǎn)其一,研究統(tǒng)計(jì)發(fā)現(xiàn),多數(shù)用戶在檢索時(shí),只會(huì)瀏覽前面幾頁(yè)的檢索結(jié)果。搜索引擎在執(zhí)行檢索工作(或?qū)W(wǎng)頁(yè)進(jìn)行目錄分類工作)時(shí)需要耗費(fèi)大量的軟件和硬件資源,但排列在后的大量檢索結(jié)果并未被用戶瀏覽,這是對(duì)搜索引擎運(yùn)算資源的浪費(fèi)。其二,搜索引擎通常采用匹配加權(quán)方式(或加權(quán)方式)計(jì)算出各網(wǎng)頁(yè)資源的得分,并按照得分由高到低排序展示。每個(gè)搜索引擎的排序算法都不是完美的,以百分制為例,很難說(shuō)99分的檢索結(jié)果比98分的檢索結(jié)果更有價(jià)值,這帶來(lái)了搜索結(jié)果的排序不公平。其三,對(duì)用戶而言,一個(gè)99分的檢索結(jié)果和一個(gè)98分的檢索結(jié)果可能具有相同的使用價(jià)值。但是99分的檢索結(jié)果可能有多個(gè),用戶在尚未瀏覽到98分的檢索結(jié)果時(shí)就放棄瀏覽了。這導(dǎo)致大量實(shí)際上富有價(jià)值的檢索結(jié)果由于排序得分略低,而基本喪失了被用戶瀏覽的機(jī)會(huì)。
發(fā)明內(nèi)容
本申請(qǐng)所要解決的技術(shù)問(wèn)題是提供一種搜索引擎的結(jié)果排序方法,可以在一定程度上抵消由于得分略有差異而導(dǎo)致的得分較低的網(wǎng)絡(luò)資源始終排序在后的問(wèn)題。為解決上述技術(shù)問(wèn)題,本申請(qǐng)搜索引擎的結(jié)果排序方法為第I步、檢索程序響應(yīng)用戶的查詢請(qǐng)求,得到多個(gè)網(wǎng)頁(yè)資源,并計(jì)算出各個(gè)網(wǎng)頁(yè)資源與用戶所輸入的查詢內(nèi)容之間的匹配度得分;第2步,檢索程序?qū)⒕哂邢嗤ヅ涠鹊梅值木W(wǎng)頁(yè)資源劃分為X個(gè)集合,X為> 2的自然數(shù)第一集合中任意網(wǎng)頁(yè)資源的加權(quán)度得分>第二集合中任意網(wǎng)頁(yè)資源的加權(quán)度得分>……>第X集合中任意網(wǎng)頁(yè)資源的加權(quán)度得分;第3步,檢索程序總是將匹配度得分高的網(wǎng)頁(yè)資源排序在匹配度得分低的網(wǎng)頁(yè)資源之前,在具有相同匹配度得分的網(wǎng)頁(yè)資源中,則將加權(quán)度得分高的集合排序在加權(quán)度得分低的集合之前,但第一集合中隨機(jī)排序各個(gè)網(wǎng)頁(yè)資源,并以此展示給用戶。
本申請(qǐng)搜索引擎的結(jié)果排序方法也可以是第I’步,用戶根據(jù)搜索引擎的分類目錄訪問(wèn)該目錄下的網(wǎng)頁(yè)資源; 第2’步,檢索程序?qū)⒂脩羲L問(wèn)的目錄下的網(wǎng)頁(yè)資源劃分為X個(gè)集合,X為> 2的自然數(shù)第一集合中任意網(wǎng)頁(yè)資源的加權(quán)度得分>第二集合中任意網(wǎng)頁(yè)資源的加權(quán)度得分>……>第X集合中任意網(wǎng)頁(yè)資源的加權(quán)度得分;第3’步,檢索程序?qū)⒓訖?quán)度得分高的集合排序在加權(quán)度得分低的集合之前,但第一集合中隨機(jī)排序各個(gè)網(wǎng)頁(yè)資源,并以此展示給用戶。本申請(qǐng)搜索引擎的結(jié)果排序方法可以讓加權(quán)度得分略有差異的更多的搜索結(jié)果得到被公平展示的機(jī)會(huì),從而使得搜索引擎的工作成果得到最大化利用,同時(shí)也使用戶得以瀏覽更多富有價(jià)值的信息。
圖I是本申請(qǐng)的搜索引擎的結(jié)果排序方法的流程圖一;圖2a是現(xiàn)有的搜索引擎的結(jié)果排序方法對(duì)實(shí)施例一的排序示意圖;圖2b是本申請(qǐng)的搜索引擎的結(jié)果排序方法對(duì)實(shí)施例一的排序示意圖;圖3是本申請(qǐng)的搜索引擎的結(jié)果排序方法的流程圖二 ;圖4a是現(xiàn)有的搜索引擎的結(jié)果排序方法對(duì)實(shí)施例二的排序示意圖;圖4b是本申請(qǐng)的搜索引擎的結(jié)果排序方法對(duì)實(shí)施例二的排序示意圖;圖5是對(duì)一個(gè)集合的搜索結(jié)果隨機(jī)排序的一種實(shí)現(xiàn)方式。
具體實(shí)施例方式請(qǐng)參閱圖1,本申請(qǐng)搜索引擎的結(jié)果排序方法為第I步,用戶輸入查詢內(nèi)容,搜索引擎的檢索程序根據(jù)該查詢內(nèi)容在網(wǎng)頁(yè)的索引庫(kù)中進(jìn)行檢索,得到多個(gè)網(wǎng)頁(yè)資源。檢索程序還計(jì)算出各個(gè)網(wǎng)頁(yè)資源與用戶所輸入的查詢內(nèi)容之間基于匹配度的得分。各個(gè)網(wǎng)頁(yè)資源還具有基于加權(quán)度的得分,這是搜索引擎的索引程序在將各個(gè)網(wǎng)頁(yè)資源加入到索引庫(kù)時(shí)計(jì)算的。第2步,檢索程序?qū)⒕哂邢嗤ヅ涠鹊梅值木W(wǎng)頁(yè)資源劃分為至少兩個(gè)集合第一集合中任意網(wǎng)頁(yè)資源的加權(quán)度得分>第二集合中任意網(wǎng)頁(yè)資源的加權(quán)度得分;第3步,檢索程序總是將匹配度得分高的網(wǎng)頁(yè)資源排列在匹配度得分低的網(wǎng)頁(yè)資源之前,但在具有相同匹配度得分的網(wǎng)頁(yè)資源中,則將第一集合的任意網(wǎng)頁(yè)資源均排序在第二集合的任意網(wǎng)頁(yè)資源之前,但第一集合中隨機(jī)排序各個(gè)網(wǎng)頁(yè)資源,并以此展示給用戶。所述方法第2步中,檢索程序可為匹配度得分相同的網(wǎng)頁(yè)資源的加權(quán)度得分設(shè)置一個(gè)閾值,將加權(quán)度得分> 該閾值的網(wǎng)頁(yè)資源作為第一集合,將加權(quán)度得分< 該閾值的網(wǎng)頁(yè)資源作為第二集合。加權(quán)度得分=該閾值的網(wǎng)頁(yè)資源或者加入第一集合,或者加入第二集合。對(duì)于Y個(gè)(Y為彡3的自然數(shù))集合也可照此處理,設(shè)置Y — I個(gè)閾值。所述方法第3步中,如果有三個(gè)以上集合,則加權(quán)度得分高的集合總是排序在加權(quán)度得分低的集合之前??蛇x地,所述方法第3步中,檢索程序?qū)⒊谝患弦酝獾母鱾€(gè)集合中也隨機(jī)排序各個(gè)網(wǎng)頁(yè)資源,并以此展示給用戶??蛇x地,所述方法第3步中,檢索程序?qū)⒊谝患弦酝獾母鱾€(gè)集合中按照加權(quán)度得分由高到低地排序各個(gè)網(wǎng)頁(yè)資源,并以此展示給用戶。 實(shí)施例一假設(shè)某個(gè)搜索引擎對(duì)查詢內(nèi)容A的檢索可得到1000個(gè)網(wǎng)頁(yè)資源,這些網(wǎng)頁(yè)資源的匹配度得分的分布情況是大于98分的有20個(gè)且匹配度得分互不相同,同為98分的有100個(gè),其余均小于98分且匹配度得分互不相同。而匹配度得分同為98分的100個(gè)網(wǎng)頁(yè)資源的加權(quán)度得分分布情況是大于90分的有20個(gè),90分以下但大于85分的有20個(gè),85分以下但大于80分的有10個(gè),80分以下但大于75分的有10個(gè),75分以下但大于50分的有20個(gè),50分以下的有20個(gè)。該搜索引擎每頁(yè)可顯示20個(gè)檢索結(jié)果。請(qǐng)參閱圖2a,根據(jù)現(xiàn)有的搜索引擎排序方法,其每一頁(yè)的顯示內(nèi)容嚴(yán)格按照匹配度得分高低排列,在匹配度得分相同的情況下則按照加權(quán)度得分高低排列。在搜索引擎的索引庫(kù)未發(fā)生變化的前提下,只要查詢內(nèi)容A不變,任何用戶都會(huì)得到相同排序的搜索結(jié)果網(wǎng)頁(yè)。請(qǐng)參閱圖2b,而采用本申請(qǐng)所述的搜索引擎的結(jié)果排序方法,首先是對(duì)檢索結(jié)果按照匹配度得分高低排列,在匹配度得分相同的情況下則劃分為兩個(gè)以上的集合。例如將匹配度得分同為98分的100個(gè)網(wǎng)頁(yè)資源中,加權(quán)度得分大于80分的50個(gè)網(wǎng)頁(yè)資源設(shè)為第一集合,加權(quán)度得分在80分以下的50個(gè)網(wǎng)頁(yè)資源設(shè)為第二集合。然后對(duì)各集合之間按照得分高低排序,第一集合內(nèi)部則隨機(jī)排序,其余集合內(nèi)部或者按加權(quán)度得分由高到低排序,或者隨機(jī)排序。在搜索引擎的索引庫(kù)未發(fā)生變化的前提下,不同用戶對(duì)內(nèi)容A的查詢請(qǐng)求會(huì)得到不同排序的搜索結(jié)果網(wǎng)頁(yè)。之所以采用這種排序方式,是考慮到一個(gè)集合內(nèi)部的網(wǎng)頁(yè)資源在加權(quán)度得分上只是略有差異,應(yīng)使其得到公平的展示機(jī)會(huì)。請(qǐng)參閱圖3,本申請(qǐng)搜索引擎的結(jié)果排序方法也可以是第I’步,用戶不輸入任何查詢內(nèi)容,而是根據(jù)搜索引擎的分類目錄訪問(wèn)該目錄下的網(wǎng)頁(yè)資源列表。每個(gè)網(wǎng)頁(yè)資源都具有加權(quán)度得分,這是搜索引擎的索引程序在將各個(gè)網(wǎng)頁(yè)資源收錄到分類目錄中的時(shí)候計(jì)算的;第2’步,檢索程序?qū)⒂脩羲L問(wèn)的目錄下的網(wǎng)頁(yè)資源劃分為至少兩個(gè)集合第一集合中任意網(wǎng)頁(yè)資源的加權(quán)度得分>第二集合中任意網(wǎng)頁(yè)資源的加權(quán)度得分;第3’步,檢索程序?qū)⒌谝患系娜我饩W(wǎng)頁(yè)資源均排序在第二集合的任意網(wǎng)頁(yè)資源之前,但第一集合中隨機(jī)排序各個(gè)網(wǎng)頁(yè)資源,并以此展示給用戶。所述方法第2’步中,檢索程序可為用戶所訪問(wèn)的目錄下的網(wǎng)頁(yè)資源的加權(quán)度得分設(shè)置一個(gè)閾值,將加權(quán)度得分> 該閾值的網(wǎng)頁(yè)資源作為第一集合,將加權(quán)度得分< 該閾值的網(wǎng)頁(yè)資源作為第二集合。加權(quán)度得分=該閾值的網(wǎng)頁(yè)資源或者加入第一集合,或者加入第二集合。對(duì)于Y個(gè)(Y為彡3的自然數(shù))集合也可照此處理,設(shè)置Y — I個(gè)閾值。所述方法第3’步中,如果有三個(gè)以上集合,則加權(quán)度得分高的集合總是排序在加權(quán)度得分低的集合之前。
可選地,所述方法第3’步中,檢索程序?qū)⒊谝患弦酝獾母鱾€(gè)集合中也隨機(jī)排序各個(gè)網(wǎng)頁(yè)資源,并以此展示給用戶。可選地,所述方法第3’步中,檢索程序?qū)⒊谝患弦酝獾母鱾€(gè)集合中按照加權(quán)度得分由高到低地排序各個(gè)網(wǎng)頁(yè)資源,并以此展示給用戶。實(shí)施例二 假設(shè)某個(gè)搜索引擎的分類目錄中具有目錄項(xiàng)B,其下又具有子目錄BI、B2。子目錄BI下收錄有100個(gè)網(wǎng)頁(yè)資源,這些網(wǎng)頁(yè)資源的加權(quán)度得分分布情況是大于90分的有20個(gè),90以下但大于85分的有20個(gè),85分以下但大于80分的有10個(gè),80分以下但大于75分的有10個(gè),75分以下但大于50分的有20個(gè),50分以下的有20個(gè)。該搜索引擎每頁(yè)可顯示20個(gè)檢索結(jié)果。請(qǐng)參閱圖4a,根據(jù)現(xiàn)有的搜索引擎排序方法,用戶訪問(wèn)子目錄BI時(shí),每一頁(yè)的顯示內(nèi)容嚴(yán)格按照加權(quán)度得分由高到低排列。在搜索引擎的索引庫(kù)未發(fā)生變化的前提下,只要所訪問(wèn)的目錄不變,任何用戶都會(huì)得到相同排序的搜索結(jié)果網(wǎng)頁(yè)。請(qǐng)參閱圖4b,而采用本申請(qǐng)所述的搜索引擎的結(jié)果排序方法,用戶訪問(wèn)子目錄BI時(shí),檢索程序?qū)⑵湎碌木W(wǎng)頁(yè)資源劃分為兩個(gè)以上的集合。例如將加權(quán)度得分大于80分的50個(gè)網(wǎng)頁(yè)資源設(shè)為第一集合,加權(quán)度得分在80分以下的50個(gè)網(wǎng)頁(yè)資源設(shè)為第二集合。然后對(duì)各集合之間按照得分高低排序,第一集合內(nèi)部則隨機(jī)排序,其余集合內(nèi)部或者按加權(quán)度得分由高到低排序,或者隨機(jī)排序。在搜索引擎的索引庫(kù)未發(fā)生變化的前提下,不同用戶訪問(wèn)同一個(gè)目錄時(shí)會(huì)得到不同排序的搜索結(jié)果網(wǎng)頁(yè)。之所以采用這種排序方式,是考慮到一個(gè)集合內(nèi)部的網(wǎng)頁(yè)資源在加權(quán)度得分上只是略有差異,應(yīng)使其得到公平的展示機(jī)會(huì)。上述圖I或圖3所示的兩種搜索引擎的結(jié)果排序方法中,對(duì)一個(gè)集合中的網(wǎng)頁(yè)資源進(jìn)行隨機(jī)排序具有多種實(shí)現(xiàn)方式,本申請(qǐng)僅給出一種優(yōu)選的實(shí)現(xiàn)方式作為示例。該方法將一個(gè)集合內(nèi)部的網(wǎng)頁(yè)資源分為多段,優(yōu)選為均分。搜索引擎的檢索程序根據(jù)一定的時(shí)間間隔將開(kāi)頭的一段挪至末尾,將第二段及其后各段均向前遞進(jìn),從而使各段得以公平展示。優(yōu)選為固定的時(shí)間間隔,也可是不定的時(shí)間間隔。請(qǐng)參閱圖5,例如,檢索程序?qū)W(wǎng)頁(yè)資源根據(jù)加權(quán)度得分高低劃分為兩個(gè)以上的集合,其中第一集合又分為Al A5共五段,每隔一分鐘將開(kāi)頭的一端挪至末尾,將第二段挪至開(kāi)頭,第三段及其后各段向前依次遞進(jìn)。三個(gè)用戶都向搜索引擎提交相同的查詢內(nèi)容A,并且時(shí)間間隔恰為一分鐘,那么他們所得到的網(wǎng)頁(yè)資源將首先按照與查詢內(nèi)容A的匹配度得分由高到低排列,在匹配度得分相同的網(wǎng)頁(yè)資源的第一集合中,則分別以Al段、A2段、A3段開(kāi)頭,這便成功地實(shí)現(xiàn)了搜索結(jié)果的排序公平化?;蛘撸齻€(gè)用戶都訪問(wèn)搜索引擎的相同的目錄B,并且時(shí)間間隔恰為一分鐘,那么他們所得到的網(wǎng)頁(yè)資源將分別以Al段、A2段、A3段開(kāi)頭,這便成功地實(shí)現(xiàn)了搜索結(jié)果的排序公平化。
對(duì)于網(wǎng)頁(yè)資源與用戶輸入的查詢內(nèi)容之間的匹配度得分,目前已有較為成熟的算法加以實(shí)現(xiàn),本申請(qǐng)不再贅述。對(duì)于加權(quán)度得分,本申請(qǐng)僅以一個(gè)應(yīng)用在房屋房產(chǎn)領(lǐng)域、主要用于搜索出租出售的房源信息的搜索引擎為例進(jìn)行詳細(xì)說(shuō)明。這個(gè)房地產(chǎn)搜索引擎兼具垂直搜索引擎(Vertical Search Engine)和分類目錄搜索引擎兩種功能。索引程序在對(duì)房源信息建立索引時(shí),就為各個(gè)房源計(jì)算加權(quán)度得分。每隔一定的時(shí)間周期,例如一天,索引程序就會(huì)重建一次索引,同時(shí)重新計(jì)算各個(gè)房源信息的加權(quán)度得分。房源信息通常包括價(jià)格、地理位置、圖片、描述等方面的內(nèi)容,這些內(nèi)容越全面具體,加權(quán)度得分就越高,相應(yīng)地對(duì)找房用戶的幫助就越大。例如,房源的加權(quán)度得分={[(圖片質(zhì)量分X圖片質(zhì)量權(quán)重)+ (新鮮度得分X新鮮度權(quán)重)]X房源權(quán)重+ (經(jīng)紀(jì)人得分X經(jīng)紀(jì)人權(quán)重)} X付費(fèi)權(quán)重所述圖片質(zhì)量分是根據(jù)房源圖片的數(shù)量、質(zhì)量得到算出的得分。圖片質(zhì)量越高、數(shù)量越多,給找房用戶的參考價(jià)值越大。
以商業(yè)地產(chǎn)中的寫(xiě)字樓為例,用戶在發(fā)布房源圖片時(shí)需要指定每張圖片的分類,總共有平面圖、樓內(nèi)圖、外部環(huán)境圖三大類。樓內(nèi)圖又包括大樓入口、大堂、電梯廳、公共走廊、衛(wèi)生間、樓內(nèi)配套、辦公區(qū)域、停車場(chǎng)等小類。外部環(huán)境圖又包括外立面、高層景觀、周邊環(huán)境等小類。圖片質(zhì)量分=基礎(chǔ)圖片質(zhì)量分X0. 5 +多圖得分X0. 5如果房源信息中的圖片為平面圖> I張、且樓內(nèi)圖> 3張、且外部環(huán)境圖> I張,則認(rèn)為該房源信息中的圖片為優(yōu)質(zhì)圖片。如果房源信息中為優(yōu)質(zhì)圖片,則基礎(chǔ)圖片質(zhì)量分為10000分。如果房源信息中不是優(yōu)質(zhì)圖片、且圖片總數(shù)> 3張,則基礎(chǔ)圖片質(zhì)量分為8000分。如果房源信息中不是優(yōu)質(zhì)圖片、且圖片總數(shù)< 3張,則基礎(chǔ)圖片質(zhì)量分=4000 +1000X圖片總數(shù)。而多圖得分=750X平面圖數(shù)量+ 500X樓內(nèi)圖數(shù)量+ 250X外部環(huán)境圖數(shù)量+4000。當(dāng)多圖得分超過(guò)10000分時(shí),最大以10000分計(jì)算。所述新鮮度得分是根據(jù)房源的在線時(shí)長(zhǎng)(即從發(fā)布日到建立索引或重建索引時(shí)所過(guò)去的天數(shù))算出的得分。越是新鮮的房源,給找房用戶的參考價(jià)值越大。仍以商業(yè)地產(chǎn)中的寫(xiě)字樓為例,當(dāng)在線時(shí)長(zhǎng)< 15天,新鮮度得分= 400X (15 —在線時(shí)長(zhǎng))+ 4000。當(dāng)在線時(shí)長(zhǎng)> 15天且< 45天,新鮮度得分=100X (45 一在線時(shí)長(zhǎng))。當(dāng)在線時(shí)長(zhǎng)> 45天,新鮮度得分=O。所述經(jīng)紀(jì)人得分是根據(jù)經(jīng)紀(jì)人的質(zhì)量算出的得分。即使是同樣的房源,不同的經(jīng)紀(jì)人不同給找房用戶帶來(lái)的收益也不同,用戶聯(lián)系一個(gè)更活躍的經(jīng)紀(jì)人會(huì)給用戶帶來(lái)更多的幫助。例如,經(jīng)紀(jì)人首次付費(fèi)至今彡10天且< 30天,則經(jīng)紀(jì)人得分=10000。其余情況下,經(jīng)紀(jì)人得分=8000。所述圖片質(zhì)量權(quán)重、新鮮度權(quán)重、房源權(quán)重、經(jīng)紀(jì)人權(quán)重是根據(jù)不同的城市、不同類型的房源(一手房、二手房,商業(yè)地產(chǎn)等)的差異,加以設(shè)置。所述付費(fèi)權(quán)重是由于付費(fèi)經(jīng)紀(jì)人提供的房源信息通常是高質(zhì)量的,同時(shí)為了保證他們所發(fā)布的房源信息的展示效果,引入此權(quán)重,增加其所發(fā)布的房源信息的得分。
如上,索引程序?qū)τ诿恳惶追吭炊紩?huì)計(jì)算出一個(gè)加權(quán)度得分,并存儲(chǔ)于數(shù)據(jù)庫(kù)中。由于加權(quán)得分和日期相關(guān),因此索引程序每天都會(huì)重建索引,并重新計(jì)算所有房源的加權(quán)度得分,并更新數(shù)據(jù)庫(kù)。在一個(gè)典型的實(shí)施例中,檢索程序在響應(yīng)用戶的查詢請(qǐng)求時(shí),首先是根據(jù)文本匹配的算法得到多個(gè)檢索結(jié)果,然后就根據(jù)這多個(gè)檢索結(jié)果的匹配度得分進(jìn)行排序,在匹配度得分相同的房源信息再按照本申請(qǐng)所述方法根據(jù)加權(quán)度得分進(jìn)行排序,即分為至少兩個(gè)集合,并至少在第一集合內(nèi)部隨機(jī)排列各個(gè)檢索結(jié)果。在另一個(gè)典型的實(shí)施例中,檢索程序在響應(yīng)用戶對(duì)分類目錄的訪問(wèn)請(qǐng)求時(shí),將用戶所訪問(wèn)目錄下的網(wǎng)頁(yè)資源按照本申請(qǐng)所述方法根據(jù)加權(quán)度得分進(jìn)行排序,即分為至少兩個(gè)集合,并至少在第一集合內(nèi)部隨機(jī)排列各個(gè)檢索結(jié)果。綜上所述,本申請(qǐng)搜索引擎的結(jié)果排序方法可以讓加權(quán)度得分大致相同的更多的搜索結(jié)果得到被展示的機(jī)會(huì),從而使得搜索引擎的工作成果得到最大化利用,同時(shí)也使用 戶得以瀏覽更多富有價(jià)值的信息。以上僅為本申請(qǐng)的優(yōu)選實(shí)施例,并不用于限定本申請(qǐng)。對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),本申請(qǐng)可以有各種更改和變化。凡在本申請(qǐng)的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本申請(qǐng)的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種搜索引擎的結(jié)果排序方法,其特征是,所述方法為 第I步、檢索程序響應(yīng)用戶的查詢請(qǐng)求,得到多個(gè)網(wǎng)頁(yè)資源,并計(jì)算出各個(gè)網(wǎng)頁(yè)資源與用戶所輸入的查詢內(nèi)容之間的匹配度得分; 第2步,檢索程序?qū)⒕哂邢嗤ヅ涠鹊梅值木W(wǎng)頁(yè)資源劃分為X個(gè)集合,X為> 2的自然數(shù)第一集合中任意網(wǎng)頁(yè)資源的加權(quán)度得分>第二集合中任意網(wǎng)頁(yè)資源的加權(quán)度得分>……>第X集合中任意網(wǎng)頁(yè)資源的加權(quán)度得分; 第3步,檢索程序總是將匹配度得分高的網(wǎng)頁(yè)資源排序在匹配度得分低的網(wǎng)頁(yè)資源之前,在具有相同匹配度得分的網(wǎng)頁(yè)資源中,則將加權(quán)度得分高的集合排序在加權(quán)度得分低的集合之前,但第一集合中隨機(jī)排序各個(gè)網(wǎng)頁(yè)資源,并以此展示給用戶。
2.根據(jù)權(quán)利要求I所述的搜索引擎的結(jié)果排序方法,其特征是,所述方法第2步中,檢索程序?yàn)榫哂邢嗤ヅ涠鹊梅值臋z索結(jié)果的加權(quán)度得分設(shè)置X-I個(gè)閾值,X為> 2的自然數(shù);將得分 > 第一閾值的檢索結(jié)果作為第一集合,將得分< 第一閾值且 >第二閾值的檢索結(jié)果作為第二集合,……,將得分<第X-2閾值且>第X-I閾值的檢索結(jié)果作為第X-I集合,將得分<第乂_1閾值的檢索結(jié)果作為第X集合;得分等于各個(gè)閾值的檢索結(jié)果或者加入小于該閾值的集合,或者加入大于該閾值的集合。
3.根據(jù)權(quán)利要求I所述的搜索引擎的結(jié)果排序方法,其特征是,所述方法第3步中,檢索程序?qū)⒊谝患弦酝獾母鱾€(gè)集合中也隨機(jī)排序各個(gè)檢索結(jié)果,并以此展示給用戶。
4.根據(jù)權(quán)利要求I或3所述的搜索引擎的結(jié)果排序方法,其特征是,所述方法第3步中,對(duì)一個(gè)集合中隨機(jī)排序網(wǎng)頁(yè)資源的方法為檢索程序?qū)⒁粋€(gè)集合內(nèi)部的檢索結(jié)果分為多段,根據(jù)一定的時(shí)間間隔將開(kāi)頭的一段挪至末尾,將第二段及其后各段依次遞進(jìn)。
5.根據(jù)權(quán)利要求I所述的搜索引擎的結(jié)果排序方法,其特征是,所述網(wǎng)頁(yè)資源的加權(quán)度得分是由搜索引擎的索引程序在為網(wǎng)頁(yè)資源建立索引時(shí)計(jì)算的。
6.一種搜索引擎的結(jié)果排序方法,其特征是,所述方法為 第I’步,用戶根據(jù)搜索引擎的分類目錄訪問(wèn)該目錄下的網(wǎng)頁(yè)資源; 第2’步,檢索程序?qū)⒂脩羲L問(wèn)的目錄下的網(wǎng)頁(yè)資源劃分為X個(gè)集合,X為> 2的自然數(shù)第一集合中任意網(wǎng)頁(yè)資源的加權(quán)度得分>第二集合中任意網(wǎng)頁(yè)資源的加權(quán)度得分>……>第X集合中任意網(wǎng)頁(yè)資源的加權(quán)度得分; 第3’步,檢索程序?qū)⒓訖?quán)度得分高的集合排序在加權(quán)度得分低的集合之前,但第一集合中隨機(jī)排序各個(gè)網(wǎng)頁(yè)資源,并以此展示給用戶。
7.根據(jù)權(quán)利要求6所述的搜索引擎的結(jié)果排序方法,其特征是,所述方法第2’步中,檢索程序?yàn)榫哂邢嗤ヅ涠鹊梅值臋z索結(jié)果的加權(quán)度得分設(shè)置X-I個(gè)閾值,X為> 2的自然數(shù);將得分 > 第一閾值的檢索結(jié)果作為第一集合,將得分< 第一閾值且 >第二閾值的檢索結(jié)果作為第二集合,……,將得分<第X-2閾值且>第X-I閾值的檢索結(jié)果作為第X-I集合,將得分<第乂_1閾值的檢索結(jié)果作為第X集合;得分等于各個(gè)閾值的檢索結(jié)果或者加入小于該閾值的集合,或者加入大于該閾值的集合。
8.根據(jù)權(quán)利要求6所述的搜索引擎的結(jié)果排序方法,其特征是,所述方法第3’步中,檢索程序?qū)⒊谝患弦酝獾母鱾€(gè)集合中也隨機(jī)排序各個(gè)檢索結(jié)果,并以此展示給用戶。
9.根據(jù)權(quán)利要求6或8所述的搜索引擎的結(jié)果排序方法,其特征是,所述方法第3’步中,對(duì)一個(gè)集合中隨機(jī)排序網(wǎng)頁(yè)資源的方法為檢索程序?qū)⒁粋€(gè)集合內(nèi)部的檢索結(jié)果分為多段,根據(jù)一定的時(shí)間間隔將開(kāi)頭的一段挪至末尾,將第二段及其后各段依次遞進(jìn)。
10.根據(jù)權(quán)利要求6所述的搜索引擎的結(jié)果排序方法,其特征是,所述網(wǎng)頁(yè)資源的加權(quán)度得分是由搜索引擎的索引程序在為網(wǎng)頁(yè)資源建立索引時(shí)計(jì)算的。
全文摘要
本申請(qǐng)公開(kāi)了一種搜索引擎的結(jié)果排序方法第1步、檢索程序響應(yīng)用戶的查詢請(qǐng)求,得到多個(gè)網(wǎng)頁(yè)資源,并計(jì)算出各個(gè)網(wǎng)頁(yè)資源與用戶所輸入的查詢內(nèi)容之間的匹配度得分。第2步,檢索程序?qū)⒕哂邢嗤ヅ涠鹊梅值木W(wǎng)頁(yè)資源根據(jù)加權(quán)度得分的高度劃分為多個(gè)集合。第3步,檢索程序總是將匹配度得分高的網(wǎng)頁(yè)資源排序在匹配度得分低的網(wǎng)頁(yè)資源之前,在具有相同匹配度得分的網(wǎng)頁(yè)資源中,則將加權(quán)度得分高的集合排序在加權(quán)度得分低的集合之前,但第一集合中隨機(jī)排序各個(gè)網(wǎng)頁(yè)資源,并以此展示給用戶。本申請(qǐng)可讓更多的搜索結(jié)果得到被公平展示的機(jī)會(huì),從而使得搜索引擎的工作成果得到最大化利用,同時(shí)也使用戶得以瀏覽更多富有價(jià)值的信息。
文檔編號(hào)G06F17/30GK102890725SQ201210435060
公開(kāi)日2013年1月23日 申請(qǐng)日期2012年11月2日 優(yōu)先權(quán)日2012年11月2日
發(fā)明者賈勝謇, 張爾寧, 胡亮晶 申請(qǐng)人:瑞庭網(wǎng)絡(luò)技術(shù)(上海)有限公司