亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

查詢偏好排序方法和裝置制造方法

文檔序號:6499757閱讀:171來源:國知局
查詢偏好排序方法和裝置制造方法
【專利摘要】本發(fā)明公開了一種查詢偏好排序方法和裝置,屬于計算機【技術(shù)領(lǐng)域】。所述方法包括:接收用戶輸入的指定搜索關(guān)鍵字;根據(jù)所述指定搜索關(guān)鍵字,獲取與所述指定搜索關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接;獲取所述至少一個網(wǎng)頁鏈接的歷史偏好信息,所述網(wǎng)頁鏈接的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到;根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù);根據(jù)所述至少一個網(wǎng)頁鏈接的排序分數(shù),輸出排序后的網(wǎng)頁鏈接。本發(fā)明通過獲取對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到的歷史偏好信息以及對至少一個網(wǎng)頁鏈接的排序分數(shù)的計算,使得搜索更加準確,為用戶的搜索提供了導(dǎo)向作用,提高了搜索的效率。
【專利說明】查詢偏好排序方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,特別涉及一種查詢偏好排序方法和裝置。
【背景技術(shù)】
[0002]隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,搜索引擎所提供的服務(wù)越來越強大,通過搜索引擎獲取相關(guān)信息已經(jīng)成為工作、生活、學(xué)習(xí)的重要部分。因此,如何提高搜索引擎的準確性成為網(wǎng)絡(luò)發(fā)展的關(guān)鍵技術(shù)。
[0003]在實現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下問題:
[0004]在現(xiàn)有技術(shù)中,搜索引擎根據(jù)用戶輸入的搜索關(guān)鍵字進行匹配以獲取搜索結(jié)果,并按照與關(guān)鍵字之間的相關(guān)度輸出搜索結(jié)果,由于用戶輸入的搜索關(guān)鍵字有可能很短,包含的信息量有限,造成了搜索結(jié)果的不準確和片面性,輸出的搜索結(jié)果沒有規(guī)律性,不具有導(dǎo)向性,導(dǎo)致搜索效率低。

【發(fā)明內(nèi)容】

[0005]為了解決搜索效率低的問題,本發(fā)明實施例提供了一種查詢偏好排序方法和裝置。所述技術(shù)方案如下:
[0006]一方面,提供了一種查詢偏好排序方法,所述方法包括:
[0007]接收用戶輸入的指定搜索關(guān)鍵字;
[0008]根據(jù)所述指定搜索關(guān)鍵字,獲取與所述指定搜索關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接;
[0009]獲取所述至少一個網(wǎng)頁鏈接的歷史偏好信息,所述網(wǎng)頁鏈接的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到;
[0010]根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù);
[0011]根據(jù)所述至少一個網(wǎng)頁鏈接的排序分數(shù),輸出排序后的網(wǎng)頁鏈接。
[0012]另一方面,提供了一種查詢偏好排序裝置,所述裝置包括:
[0013]接收模塊,用于接收用戶輸入的指定搜索關(guān)鍵字;
[0014]網(wǎng)頁鏈接獲取模塊,用于根據(jù)所述指定搜索關(guān)鍵字,獲取與所述指定搜索關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接;
[0015]網(wǎng)頁鏈接信息獲取模塊,用于獲取所述至少一個網(wǎng)頁鏈接的歷史偏好信息,所述網(wǎng)頁鏈接的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到;
[0016]排序分數(shù)計算模塊,用于根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù);
[0017]輸出模塊,用于根據(jù)所述至少一個網(wǎng)頁鏈接的排序分數(shù),輸出排序后的網(wǎng)頁鏈接。
[0018]本發(fā)明實施例提供的技術(shù)方案帶來的有益效果是:
[0019]本發(fā)明提供了一種查詢偏好排序方法和裝置,通過接收用戶輸入的指定搜索關(guān)鍵字;根據(jù)所述指定搜索關(guān)鍵字,獲取與所述指定搜索關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接;獲取所述至少一個網(wǎng)頁鏈接的歷史偏好信息,所述網(wǎng)頁鏈接的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到;根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù);根據(jù)所述至少一個網(wǎng)頁鏈接的排序分數(shù),輸出排序后的網(wǎng)頁鏈接。采用本發(fā)明提供的技術(shù)方案,通過獲取對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到的歷史偏好信息以及對至少一個網(wǎng)頁鏈接的排序分數(shù)的計算,使得搜索引擎輸出的排序后的網(wǎng)頁鏈接能夠綜合歷史搜索過程中用戶的偏好,根據(jù)其排序分數(shù)進行排序,使得搜索更加準確,為用戶的搜索提供了導(dǎo)向作用,提高了搜索的效率。
【專利附圖】

【附圖說明】
[0020]為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0021]圖1是本發(fā)明實施例中提供的一種查詢偏好排序方法流程圖;
[0022]圖2是本發(fā)明實施例中提供的一種查詢偏好排序方法流程圖;
[0023]圖3是本發(fā)明實施例中提供的一種查詢偏好排序裝置結(jié)構(gòu)示意圖。
【具體實施方式】
[0024]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合附圖對本發(fā)明實施方式作進一步地詳細描述。
[0025]圖1是本發(fā)明實施例中提供的一種查詢偏好排序方法流程圖,該實施例的執(zhí)行主題可以為搜索服務(wù)器,參見圖1,該方法包括:
[0026]101:接收用戶輸入的指定搜索關(guān)鍵字;
[0027]在本發(fā)明實施例中,指定搜索關(guān)鍵字是指本次搜索所使用的搜索關(guān)鍵字。搜索關(guān)鍵字泛指用戶在進行搜索時輸入的信息,可以是符號、字、詞、句子等。在進行搜索之前,用戶進入搜索頁面,在搜索頁面中輸入搜索關(guān)鍵字。
[0028]需要說明的是,該搜索的過程可以通過搜索引擎完成,搜索引擎是指根據(jù)一定的策略、運用特定的計算機程序從互聯(lián)網(wǎng)上搜集信息,在對信息進行組織和處理后,為用戶提供檢索服務(wù),將用戶檢索相關(guān)的信息展示給用戶的系統(tǒng)。
[0029]102:根據(jù)所述指定搜索關(guān)鍵字,獲取與所述指定搜索關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接;
[0030]對于指定搜索關(guān)鍵字來說,可以根據(jù)指定搜索關(guān)鍵字的具體情況進行如分詞處理、去除停止詞等處理,
[0031]進一步地,在搜索到和指定關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接后,根據(jù)排名算法計算出至少一個網(wǎng)頁鏈接的排序。排名算法是指根據(jù)網(wǎng)頁中關(guān)鍵詞的匹配程度、出現(xiàn)的位置、頻次、鏈接質(zhì)量等計算出各網(wǎng)頁的相關(guān)度及排名等級。
[0032]在本發(fā)明實施例執(zhí)行過程中,為了提高搜索引擎的排序結(jié)果準確度和搜索結(jié)果的分類效率,還需在后續(xù)步驟中對搜索得到的至少一個頁面鏈接進一步進行處理。
[0033]103:獲取所述至少一個網(wǎng)頁鏈接的歷史偏好信息,所述網(wǎng)頁鏈接的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到;
[0034]其中,歷史偏好信息由兩部分組成:主題偏好以及意圖偏好。
[0035]其中,主題偏好由一組主題類別的向量組成,向量中的每一個元素由一個主題類別以及其支持度組成;主題類別通常是根據(jù)用戶的內(nèi)容需求進行的分類,用于解決查詢的歧義性,比如針對蘋果這樣的一個查詢,它既可以表示手機,也可以表示一種水果,在主題類別中蘋果包括至少兩個類別,手機和水果。
[0036]意圖偏好由一組意圖類別的向量組成,向量中的每一個元素由一個意圖類別以及其支持度組成;意圖類別通常根據(jù)用戶的行為需求進行分類,意圖類別包括:導(dǎo)航、信息、事務(wù)。當(dāng)大多數(shù)用戶只對相同的搜索結(jié)果中的某個網(wǎng)頁鏈接進行點擊時,認為該查詢類別是導(dǎo)航類,當(dāng)用戶對搜索結(jié)果中的不同網(wǎng)頁鏈接進行點擊時,認為該查詢類別是信息類,當(dāng)用戶對網(wǎng)頁鏈接中的資源下載、進行游戲、娛樂等,認為該查詢類別是事務(wù)類。
[0037]網(wǎng)頁鏈接的類別相當(dāng)于給每個網(wǎng)頁鏈接打上了不同的標簽,每個網(wǎng)頁鏈接具備意圖類標簽和/或主題類標簽。搜索引擎可以獲取一個時間段內(nèi)的網(wǎng)頁鏈接的歷史點擊數(shù)據(jù),根據(jù)網(wǎng)頁鏈接的歷史點擊數(shù)據(jù)計算該網(wǎng)頁鏈接的類別的支持度。網(wǎng)頁鏈接的類別可以通過網(wǎng)頁中的元信息獲取,也可以根據(jù)用戶的點擊操作獲取,對于用戶的網(wǎng)頁鏈接點擊操作,搜索引擎根據(jù)對該網(wǎng)頁鏈接的類別對應(yīng)記錄點擊次數(shù),同一個網(wǎng)頁鏈接某個類別的點擊次數(shù)越高,該網(wǎng)頁鏈接的某個類別的支持度越高。搜索引擎通過分析網(wǎng)頁鏈接在歷史搜索過程中的用戶點擊數(shù)據(jù),獲取網(wǎng)頁鏈接的各個類別及其對應(yīng)的支持度,即網(wǎng)頁鏈接的歷史偏好息。
[0038]在本發(fā)明實施例中,通過根據(jù)網(wǎng)頁鏈接與歷史偏好信息的映射關(guān)系獲取網(wǎng)頁鏈接的歷史偏好信息,當(dāng)根據(jù)歷史搜索過程中的用戶點擊數(shù)據(jù)分析得到網(wǎng)頁鏈接的歷史偏好信息后,建立歷史偏好信息與網(wǎng)頁鏈接之間的映射關(guān)系,以便在后續(xù)的搜索過程中,為用戶提供網(wǎng)頁鏈接時可以進行傾向性的排序。
[0039]104:根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù);
[0040]歷史偏好信息包括:主題偏好和/或意圖偏好。在計算網(wǎng)頁鏈接的排序分數(shù)時需要考慮網(wǎng)頁鏈接的歷史偏好信息中的各個類別的支持度。
[0041]對于只有一個類別的網(wǎng)頁,可以將其類別對應(yīng)的支持度直接作為排序的分數(shù),或者綜合考慮支持度、相關(guān)度等信息進行計算,以獲取該網(wǎng)頁鏈接的排序分數(shù)。對于有兩個或兩個以上類別的網(wǎng)頁,可以將各個類別的支持度進行加權(quán)求和或疊加,也可以在計算時加入相關(guān)度、網(wǎng)頁屬性等信息,以獲取該網(wǎng)頁鏈接的排序分數(shù)。
[0042]105:根據(jù)所述至少一個網(wǎng)頁鏈接的排序分數(shù),輸出排序后的網(wǎng)頁鏈接。
[0043]搜索引擎返回至少一個網(wǎng)頁鏈接后,對各個網(wǎng)頁鏈接進行了如步驟104的排序分數(shù)的計算,該排序分數(shù)由該網(wǎng)頁鏈接的類別、不同時間段的用戶的點擊情況確定,是對用戶的歷史搜索情況的統(tǒng)計。
[0044]搜索引擎按照排序分數(shù)將各個網(wǎng)頁鏈接進行排序,輸出排序后的網(wǎng)頁鏈接,排序后的網(wǎng)頁鏈接將用戶可能使用的重要網(wǎng)頁鏈接放置在靠前的位置,便于用戶對信息的獲取。
[0045]本發(fā)明通過接收用戶輸入的指定搜索關(guān)鍵字;根據(jù)所述指定搜索關(guān)鍵字,獲取與所述指定搜索關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接;獲取所述至少一個網(wǎng)頁鏈接的歷史偏好信息,所述網(wǎng)頁鏈接的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到;根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù);根據(jù)所述至少一個網(wǎng)頁鏈接的排序分數(shù),輸出排序后的網(wǎng)頁鏈接。采用本發(fā)明提供的技術(shù)方案,通過獲取對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到的歷史偏好信息以及對至少一個網(wǎng)頁鏈接的排序分數(shù)的計算,使得搜索引擎輸出的排序后的網(wǎng)頁鏈接能夠綜合歷史搜索過程中用戶的偏好,根據(jù)其排序分數(shù)進行排序,使得搜索更加準確,為用戶的搜索提供了導(dǎo)向作用,提高了搜索的效率。
[0046]可選地,圖1所示實施例的技術(shù)方案的基礎(chǔ)上,步驟101 “接收用戶輸入的指定搜索關(guān)鍵字”之后,102 “根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù)”之前,包括:獲取所述指定搜索關(guān)鍵字的歷史偏好信息,所述指定搜索關(guān)鍵字的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到。
[0047]在本發(fā)明實施例中,通過根據(jù)搜索關(guān)鍵字與歷史偏好信息的映射關(guān)系獲取搜索關(guān)鍵字的歷史偏好信息,當(dāng)根據(jù)歷史搜索過程中的用戶點擊數(shù)據(jù)分析得到指定搜索關(guān)鍵字的歷史偏好信息后,建立歷史偏好信息與搜索關(guān)鍵字之間的映射關(guān)系,以便在后續(xù)的搜索過程中,為用戶提供網(wǎng)頁鏈接時可以進行傾向性的排序。
[0048]獲取了搜索關(guān)鍵字的歷史偏好信息,也就獲取了關(guān)鍵字的意圖類別和/或主題類另IJ,以及意圖類別的支持度和/或主題類別的支持度。
[0049]本發(fā)明通過接收用戶輸入的指定搜索關(guān)鍵字;根據(jù)所述指定搜索關(guān)鍵字,獲取與所述指定搜索關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接;獲取所述至少一個網(wǎng)頁鏈接的歷史偏好信息,所述網(wǎng)頁鏈接的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到;根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù);根據(jù)所述至少一個網(wǎng)頁鏈接的排序分數(shù),輸出排序后的網(wǎng)頁鏈接。采用本發(fā)明提供的技術(shù)方案,通過獲取對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到的歷史偏好信息以及對至少一個網(wǎng)頁鏈接的排序分數(shù)的計算,使得搜索引擎輸出的排序后的網(wǎng)頁鏈接能夠綜合歷史搜索過程中用戶的偏好,根據(jù)其排序分數(shù)進行排序,使得搜索更加準確,為用戶的搜索提供了導(dǎo)向作用,提高了搜索的效率。進一步地,通過對關(guān)鍵字的歷史偏好信息的獲取,增強了網(wǎng)頁鏈接的排序的導(dǎo)向作用。
[0050]可選地,圖1所示實施例的技術(shù)方案的基礎(chǔ)上,步驟101 “接收用戶輸入的搜索關(guān)鍵字”之前,所述方法還包括:步驟1011和1012:
[0051]1011:按照搜索關(guān)鍵字的類別,統(tǒng)計所述搜索關(guān)鍵字的歷史搜索過程的用戶點擊數(shù)據(jù)中所述搜索關(guān)鍵字各個類別對應(yīng)的網(wǎng)頁鏈接的被點擊次數(shù);
[0052]在搜索引擎中,針對每個搜索關(guān)鍵字的搜索均保留有歷史記錄,通過對該歷史記錄的分析可以獲知該搜索關(guān)鍵字匹配的多個網(wǎng)頁鏈接,并通過歷史記錄中的用戶點擊數(shù)據(jù)獲知每個網(wǎng)頁鏈接的被點擊次數(shù),進而獲取到搜索關(guān)鍵字的各個類別對應(yīng)的網(wǎng)頁鏈接的被點擊次數(shù)。通過統(tǒng)計用戶對各個網(wǎng)頁鏈接的被點擊次數(shù),以獲取搜索關(guān)鍵字的歷史偏好信息。網(wǎng)頁鏈接的被點擊次數(shù)能夠有助于對搜索關(guān)鍵字類別傾向的判斷,某類別的網(wǎng)頁鏈接的被點擊次數(shù)越多,說明該搜索關(guān)鍵字的類別越傾向于被點擊次數(shù)多的網(wǎng)頁鏈接的類別,某類別的網(wǎng)頁鏈接被點擊次數(shù)越少,說明該搜索關(guān)鍵字的類別越偏離被點擊次數(shù)少的網(wǎng)頁鏈接的類別。[0053]按照搜索關(guān)鍵字的所包括的意圖類別和/或主題類別,統(tǒng)計意圖類別的支持度和/或主題類別對應(yīng)的被點擊次數(shù)。
[0054]1012:根據(jù)各個類別對應(yīng)的網(wǎng)頁鏈接的被點擊次數(shù),獲取所述搜索關(guān)鍵字各個類別的支持度,將所述搜索關(guān)鍵字各個類別的支持度作為所述搜索關(guān)鍵字的歷史偏好信息。
[0055]搜索引擎在對搜索關(guān)鍵字的各個類別的網(wǎng)頁鏈接的被點擊次數(shù)進行統(tǒng)計后,可以獲取一個預(yù)設(shè)時間段內(nèi),該搜索關(guān)鍵字的各個類別的支持度。各個類別的支持度可以通過對每個類別的多個網(wǎng)頁鏈接的被點擊次數(shù)的疊加或者加權(quán)求和等方法獲取。
[0056]在搜索關(guān)鍵字的各個類別的支持度的計算過程中,需要考慮同一類別的網(wǎng)頁鏈接多次點擊的邊際遞減效應(yīng)。隨著對同一個類別的網(wǎng)頁鏈接的點擊數(shù)據(jù)的增大,支持度也在不斷上升,為了使支持度在一定的范圍之內(nèi),支持度的計算需要符合邊際遞減效應(yīng),如可以采用反正切函數(shù),該函數(shù)為遞增函數(shù),但是隨著自變量的值的增加,因變量增加的幅度越來越小,將點擊數(shù)據(jù)作為自變量,支持度作為因變量,支持度的值域在[0,π/2]α還可以采用底數(shù)大于I的對數(shù)函數(shù),將點擊數(shù)據(jù)映射到該函數(shù)的部分定義域內(nèi),如[1,100],則支持度對應(yīng)值域范圍為[0,1gaIOO],其中a是底數(shù)。
[0057]上述是根據(jù)同一時間段內(nèi)的用戶點擊數(shù)據(jù)計算支持度的方法,對于不同時間段內(nèi)的用戶點擊數(shù)據(jù),需要考慮用戶點擊數(shù)據(jù)對支持度的貢獻,與當(dāng)前時間間隔越小的時間段的用戶點擊數(shù)據(jù),貢獻要大一些,而與當(dāng)前時間間隔越大的時間段的用戶點擊數(shù)據(jù),貢獻相對要小一些,例如,當(dāng)前時間為I月5號,則I月3號的用戶點擊數(shù)據(jù)和I月4號的用戶點擊數(shù)據(jù)相比較來說,如果該兩個點擊數(shù)據(jù)中所表示的被點擊次數(shù)相同,則I月4號的用戶點擊數(shù)據(jù)對支持度的貢獻較大。
[0058]同一個類別的網(wǎng)頁鏈接會不斷地被點擊,從而產(chǎn)生點擊數(shù)據(jù),點擊數(shù)據(jù)可以每隔一定時間段,疊加到對應(yīng)類別的支持度中,以實現(xiàn)搜索關(guān)鍵字的歷史偏好信息的更新。由于距統(tǒng)計時刻越近的點擊數(shù)據(jù)越有價值,因此最近時間段的點擊數(shù)據(jù)對支持度的貢獻是邊際遞增的。在預(yù)設(shè)時間段內(nèi)對搜索關(guān)鍵字的歷史偏好信息進行更新時,降低已有的支持度,將當(dāng)前的點擊數(shù)據(jù)運算產(chǎn)生的支持度疊加到降低后的支持度中,產(chǎn)生新的支持度。如可以對已有的支持度進行線性衰減,或者指數(shù)衰減等來降低已有的支持度。而對當(dāng)前時間段的點擊數(shù)據(jù)進行支持度計算后,將該支持度疊加到衰減后的支持度中,或者賦予根據(jù)當(dāng)前時間段的點擊數(shù)據(jù)獲得的支持度一個較大的權(quán)值,將當(dāng)前時間段的點擊數(shù)據(jù)獲得的支持度經(jīng)過權(quán)值運算后疊加到衰減后的支持度中,更新關(guān)鍵字的歷史偏好信息。
[0059]按照搜索關(guān)鍵字的所包括的意圖類別和/或主題類別,及意圖類別的支持度和/或主題類別對應(yīng)的被點擊次數(shù),分別計算意圖類別和/或主題類別的支持度,更新關(guān)鍵字的歷史偏好息。
[0060]對關(guān)鍵字的歷史偏好信息的更新的預(yù)設(shè)時間段由開發(fā)人員在設(shè)計過程中或維護過程中進行設(shè)置,可以是I秒、I小時、I天、I周等,本發(fā)明實施例對此不作具體限定。
[0061]本發(fā)明通過接收用戶輸入的指定搜索關(guān)鍵字;根據(jù)所述指定搜索關(guān)鍵字,獲取與所述指定搜索關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接;獲取所述至少一個網(wǎng)頁鏈接的歷史偏好信息,所述網(wǎng)頁鏈接的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到;根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù);根據(jù)所述至少一個網(wǎng)頁鏈接的排序分數(shù),輸出排序后的網(wǎng)頁鏈接。采用本發(fā)明提供的技術(shù)方案,通過獲取對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到的歷史偏好信息以及對至少一個網(wǎng)頁鏈接的排序分數(shù)的計算,使得搜索引擎輸出的排序后的網(wǎng)頁鏈接能夠綜合歷史搜索過程中用戶的偏好,根據(jù)其排序分數(shù)進行排序,使得搜索更加準確,為用戶的搜索提供了導(dǎo)向作用,提高了搜索的效率。進一步地,通過對關(guān)鍵字的歷史偏好信息的獲取,增強了網(wǎng)頁鏈接的排序的導(dǎo)向作用。
[0062]可選地,圖1所示實施例的技術(shù)方案的基礎(chǔ)上,步驟101 “接收用戶輸入的搜索關(guān)鍵字”之前,包括IOla和IOlb:
[0063]IOla:根據(jù)網(wǎng)頁鏈接的各個類別,分別統(tǒng)計所述網(wǎng)頁鏈接作為與所述各個類別匹配的搜索結(jié)果時被點擊的次數(shù);
[0064]在搜索引擎中,針對每個網(wǎng)頁鏈接的各個類別的被點擊次數(shù)均保留有歷史記錄,通過對該歷史記錄的分析可以獲知該網(wǎng)頁鏈接的歷史偏好信息。網(wǎng)頁鏈接的被點擊次數(shù)能夠有助于對網(wǎng)頁鏈接類別傾向的判斷,網(wǎng)頁鏈接的某個類別對應(yīng)的被點擊次數(shù)越多,說明該網(wǎng)頁鏈接的類別越傾向于被點擊次數(shù)多的網(wǎng)頁鏈接的類別,網(wǎng)頁鏈接的某類別對應(yīng)的被點擊次數(shù)越少,說明該網(wǎng)頁鏈接的類別越偏離被點擊次數(shù)少的網(wǎng)頁鏈接的類別。按照網(wǎng)頁鏈接所包括的意圖類別和/或主題類別,統(tǒng)計意圖類別的支持度和/或主題類別對應(yīng)的被點擊次數(shù)。
[0065]IOlb:根據(jù)各個類別對應(yīng)的被點擊次數(shù),獲取所述網(wǎng)頁鏈接各個類別的支持度,將所述網(wǎng)頁鏈接各個類別的支持度作為所述網(wǎng)頁鏈接的歷史偏好信息。
[0066]搜索引擎在對網(wǎng)頁鏈接各個類別的被點擊次數(shù)進行統(tǒng)計后,可以獲取一個預(yù)設(shè)時間段內(nèi),該網(wǎng)頁鏈接各個類別的支持度。
[0067]在網(wǎng)頁鏈接各個類別的支持度的計算過程中,需要考慮網(wǎng)頁鏈接各個類別的多次點擊的邊際遞減效應(yīng)。隨著對網(wǎng)頁鏈接各個類別的點擊數(shù)據(jù)的增大,支持度也在不斷上升,為了使支持度在一定的范圍之內(nèi),支持度的計算需要符合邊際遞減效應(yīng),如可以采用反正切函數(shù),該函數(shù)為遞增函數(shù),但是隨著自變量的值的增加,因變量增加的幅度越來越小,將點擊數(shù)據(jù)作為自變量,支持度作為因變量,支持度的值域在[0,π/2]。還可以采用底數(shù)大于I的對數(shù)函數(shù),將點擊數(shù)據(jù)映射到該函數(shù)的部分定義域內(nèi),如[1,100],則支持度對應(yīng)值域范圍為[O, 1gaIOO],其中a是底數(shù)。
[0068]上述是根據(jù)同一時間段內(nèi)的用戶點擊數(shù)據(jù)計算支持度的方法,對于不同時間段內(nèi)的用戶點擊數(shù)據(jù),需要考慮用戶點擊數(shù)據(jù)對支持度的貢獻,與當(dāng)前時間間隔越小的時間段的用戶點擊數(shù)據(jù),貢獻要大一些,而與當(dāng)前時間間隔越大的時間段的用戶點擊數(shù)據(jù),貢獻相對要小一些,例如,當(dāng)前時間為I月5號,則I月3號的用戶點擊數(shù)據(jù)和I月4號的用戶點擊數(shù)據(jù)相比較來說,如果該兩個點擊數(shù)據(jù)中所表示的被點擊次數(shù)相同,則I月4號的用戶點擊數(shù)據(jù)對支持度的貢獻較大。
[0069]網(wǎng)頁鏈接各個類別對應(yīng)的被點擊數(shù)據(jù)不斷增大,用戶的點擊數(shù)據(jù)可以每隔一定時間段,疊加到對應(yīng)類別的支持度中,以實現(xiàn)搜索關(guān)鍵字的歷史偏好信息的更新。由于距統(tǒng)計時刻越近的點擊數(shù)據(jù)越有價值,因此最近時間段的點擊數(shù)據(jù)對支持度的貢獻是邊際遞增的。在預(yù)設(shè)時間段內(nèi)對搜索關(guān)鍵字的歷史偏好信息進行更新時,降低已有的支持度,將當(dāng)前的點擊數(shù)據(jù)運算產(chǎn)生的支持度疊加到降低后的支持度中,產(chǎn)生新的支持度。如可以對已有的支持度進行線性衰減,或者指數(shù)衰減等來降低已有的支持度。而對當(dāng)前時間段的點擊數(shù)據(jù)進行支持度計算后,將該支持度疊加到衰減后的支持度中,或者賦予根據(jù)當(dāng)前時間段的點擊數(shù)據(jù)獲得的支持度一個較大的權(quán)值,將根據(jù)當(dāng)前時間段的點擊數(shù)據(jù)獲得的支持度經(jīng)過權(quán)值運算后疊加到衰減后的支持度中,更新關(guān)鍵字的歷史偏好信息。
[0070]按照網(wǎng)頁鏈接所包括的意圖類別和/或主題類別,及意圖類別的支持度和/或主題類別對應(yīng)的被點擊次數(shù),分別計算意圖類別和/或主題類別的支持度,更新網(wǎng)頁鏈接的歷史偏好息。
[0071]對網(wǎng)頁鏈接的歷史偏好信息更新的預(yù)設(shè)時間段由開發(fā)人員在設(shè)計過程中或維護過程中進行設(shè)置,可以是I秒、I小時、I天、I周等,本發(fā)明實施例對此不作具體限定。
[0072]本發(fā)明通過接收用戶輸入的指定搜索關(guān)鍵字;根據(jù)所述指定搜索關(guān)鍵字,獲取與所述指定搜索關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接;獲取所述至少一個網(wǎng)頁鏈接的歷史偏好信息,所述網(wǎng)頁鏈接的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到;根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù);根據(jù)所述至少一個網(wǎng)頁鏈接的排序分數(shù),輸出排序后的網(wǎng)頁鏈接。采用本發(fā)明提供的技術(shù)方案,通過獲取對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到的歷史偏好信息以及對至少一個網(wǎng)頁鏈接的排序分數(shù)的計算,使得搜索引擎輸出的排序后的網(wǎng)頁鏈接能夠綜合歷史搜索過程中用戶的偏好,根據(jù)其排序分數(shù)進行排序,使得搜索更加準確,為用戶的搜索提供了導(dǎo)向作用,提高了搜索的效率。進一步地,通過對關(guān)鍵字的歷史偏好信息的獲取,增強了網(wǎng)頁鏈接的排序的導(dǎo)向作用。
[0073]可選地,圖1所示實施例的技術(shù)方案的基礎(chǔ)上,步驟1011、1012、101a、IOlb中所述
類別至少包括主題類別和意圖類別中任一項。
[0074]不同的網(wǎng)頁鏈接的類別各不相同,有的是主題類別,有的是意圖類別,有的網(wǎng)頁既有主題類別也有意圖類別。主題類別又分為導(dǎo)航、信息、事務(wù)類別,而意圖類別又根據(jù)內(nèi)容分為不同的類別。
[0075]—個網(wǎng)頁鏈接最多具有兩個大類別,而兩個大類別中又包含了各個小類別,所以對于一個網(wǎng)頁鏈接來說,它的總類別數(shù)量是不確定的。在計算各個類別的支持度時,需要根據(jù)類別的數(shù)量進行對應(yīng)的支持度的計算,在計算排序分數(shù)時,也要充分考慮各個類別及其支持度,根據(jù)預(yù)設(shè)算法、意圖類別和/或主題類別、意圖類別的支持度和/或主題類別的支持度等信息,計算排序分數(shù)。
[0076]本發(fā)明通過接收用戶輸入的指定搜索關(guān)鍵字;根據(jù)所述指定搜索關(guān)鍵字,獲取與所述指定搜索關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接;獲取所述至少一個網(wǎng)頁鏈接的歷史偏好信息,所述網(wǎng)頁鏈接的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到;根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù);根據(jù)所述至少一個網(wǎng)頁鏈接的排序分數(shù),輸出排序后的網(wǎng)頁鏈接。采用本發(fā)明提供的技術(shù)方案,通過獲取對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到的歷史偏好信息以及對至少一個網(wǎng)頁鏈接的排序分數(shù)的計算,使得搜索引擎輸出的排序后的網(wǎng)頁鏈接能夠綜合歷史搜索過程中用戶的偏好,根據(jù)其排序分數(shù)進行排序,使得搜索更加準確,為用戶的搜索提供了導(dǎo)向作用,提高了搜索的效率。進一步地,通過對關(guān)鍵字的歷史偏好信息的獲取,增強了網(wǎng)頁鏈接的排序的導(dǎo)向作用。進一步地,通過對網(wǎng)頁進行詳細地分類,以及分類計算支持度,有利于提高排序的效率。
[0077]可選地,圖1所示實施例的技術(shù)方案的基礎(chǔ)上,步驟104 “根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù)”,包括:根據(jù)獲取到的歷史偏好信息中類別的支持度,應(yīng)用預(yù)設(shè)算法計算至少一個網(wǎng)頁鏈接的排序分數(shù)。
[0078]其中,預(yù)設(shè)算法是指根據(jù)關(guān)鍵字的歷史偏好信息和/或網(wǎng)頁鏈接的歷史偏好信息中的支持度,計算至少一個網(wǎng)頁鏈接的排序分數(shù)。
[0079]該預(yù)設(shè)算法可以先計算關(guān)鍵字的歷史偏好信息的支持度,將關(guān)鍵字的歷史偏好信息的各個類別對應(yīng)的支持度進行疊加,獲取網(wǎng)頁鏈接的排序分數(shù);
[0080]該預(yù)設(shè)算法還可以是先計算網(wǎng)頁鏈接的歷史偏好信息的支持度,將網(wǎng)頁鏈接的歷史偏好信息的各個類別對應(yīng)的支持度進行疊加,獲取網(wǎng)頁鏈接的排序分數(shù);
[0081]該預(yù)設(shè)算法還可以是將關(guān)鍵字的歷史偏好信息的支持度和網(wǎng)頁鏈接的歷史偏好信息的支持度進行疊加,獲取網(wǎng)頁鏈接的排序分數(shù);
[0082]除此之外,該預(yù)設(shè)算法還可以是將關(guān)鍵字的歷史偏好信息的支持度、網(wǎng)頁鏈接的歷史偏好信息的支持度以及相關(guān)度等其他信息進行疊加或者加權(quán)求和,獲取網(wǎng)頁鏈接的排序分數(shù)。在計算過程中,還可以為各個類別的支持度設(shè)置不同的系數(shù),本發(fā)明實施例對此不作具體限定,如對意圖類別的支持度系數(shù)設(shè)置為0.7,而主題類別的支持度系數(shù)設(shè)置為
0.3。
[0083]本發(fā)明通過接收用戶輸入的指定搜索關(guān)鍵字;根據(jù)所述指定搜索關(guān)鍵字,獲取與所述指定搜索關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接;獲取所述至少一個網(wǎng)頁鏈接的歷史偏好信息,所述網(wǎng)頁鏈接的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到;根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù);根據(jù)所述至少一個網(wǎng)頁鏈接的排序分數(shù),輸出排序后的網(wǎng)頁鏈接。采用本發(fā)明提供的技術(shù)方案,通過獲取對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到的歷史偏好信息以及對至少一個網(wǎng)頁鏈接的排序分數(shù)的計算,使得搜索引擎輸出的排序后的網(wǎng)頁鏈接能夠綜合歷史搜索過程中用戶的偏好,根據(jù)其排序分數(shù)進行排序,使得搜索更加準確,為用戶的搜索提供了導(dǎo)向作用,提高了搜索的效率。進一步地,通過對關(guān)鍵字的歷史偏好信息的獲取,增強了網(wǎng)頁鏈接的排序的導(dǎo)向作用。進一步地,通過對預(yù)設(shè)算法的靈活應(yīng)用,充分考慮了網(wǎng)頁鏈接各種信息,增加了返回網(wǎng)頁鏈接的全面性。
[0084]圖2是本發(fā)明實施例中提供的一種查詢偏好排序方法流程圖,參見圖2,該方法包括:
[0085]201:根據(jù)網(wǎng)頁鏈接的各個類別,分別統(tǒng)計所述網(wǎng)頁鏈接作為與所述各個類別匹配的搜索結(jié)果時被點擊的次數(shù);
[0086]其中,所述類別包括:主題類別和/或意圖類別。
[0087]搜索引擎根據(jù)預(yù)設(shè)時間段和的網(wǎng)頁鏈接的各個類別,分別統(tǒng)計網(wǎng)頁鏈接作為與所述各個類別匹配的搜索結(jié)果時被點擊的次數(shù)。在搜索引擎中存儲有幾十到幾百個億的網(wǎng)頁鏈接,每個網(wǎng)頁鏈接中包括多個類別,所以,如果將預(yù)設(shè)時間段選的過于短,增加了搜索引擎的工作量,影響正常的用戶業(yè)務(wù),優(yōu)選地,預(yù)設(shè)時間段可以為一天。
[0088]如在一天內(nèi),一個網(wǎng)頁鏈接被點擊了 100次,該網(wǎng)頁鏈接包括導(dǎo)航、信息、事務(wù)、主題四個類別,需要統(tǒng)計該網(wǎng)頁鏈接作為與所述各個類別匹配的搜索結(jié)果時的被點擊次數(shù),統(tǒng)計結(jié)果可以為如導(dǎo)航一10次,彳目息一20次,事務(wù)一30次,主題一40次的形式。
[0089]202:根據(jù)各個類別對應(yīng)的被點擊次數(shù),獲取所述網(wǎng)頁鏈接各個類別的支持度,將所述網(wǎng)頁鏈接各個類別的支持度作為所述網(wǎng)頁鏈接的歷史偏好信息;
[0090]對于同一個時間段的支持度計算,需要根據(jù)網(wǎng)頁鏈接的各個類別對應(yīng)的被點擊次數(shù)和邊際遞減效應(yīng)計算各個類別的支持度,使得不論網(wǎng)頁鏈接的各個類別對應(yīng)的被點擊次數(shù)增加到任意值時,支持度的值始終在一定的范圍之內(nèi),以便于計算、存儲和比較。
[0091]對于不同時間計算的支持度,需要累加到已有的支持度上。由于當(dāng)前時間段的支持度代表了最近的一段時間內(nèi)用戶的基本點擊需求,所以具有較高的導(dǎo)向性。對于不同的時間段,根據(jù)邊際遞增效應(yīng)進行計算??梢栽黾赢?dāng)前時間段的支持度的權(quán)重,即對當(dāng)前時間段的支持度乘以一個較大的系數(shù),或者降低已有的支持度的權(quán)重,即對已有的支持度進行線性衰減或非線性衰減,從而使當(dāng)前時間段的支持度計算具有邊際遞增效應(yīng)。
[0092]在計算完各個網(wǎng)頁鏈接的主題類別和/或意圖類別的支持度后,將該主題類別和/或意圖類別及主題類別和/或意圖類別的支持度作為網(wǎng)頁鏈接的歷史偏好信息。
[0093]基于步驟202中的例子,在獲取到網(wǎng)頁鏈接的主題類別和/或意圖類別的點擊次數(shù)后,根據(jù)主題類別和/或意圖類別的點擊次數(shù)獲取主題類別和/或意圖類別的支持度。例如采用反正切函數(shù)進行計算y=arc tan x,該函數(shù)符合邊際遞減效果,當(dāng)導(dǎo)航類別的點擊次數(shù)為10,帶入公式計算可以獲取到對應(yīng)的支持度為1.47,若已有的支持度為3,則可以將已有的支持度乘以一個系數(shù)如0.9,通過計算獲取的支持度乘以一個系數(shù)如0.6,再將二者相加,即3*0.9+1.47*0.6=3.582,將3.582作為導(dǎo)航類別的支持度,使用同樣的方法計算信息、事務(wù)、主題類別的支持度,將各個類別的支持度作為該網(wǎng)頁鏈接的歷史偏好信息的支持度。
[0094]203:按照搜索關(guān)鍵字的類別,統(tǒng)計所述搜索關(guān)鍵字的歷史搜索過程的用戶點擊數(shù)據(jù)中所述搜索關(guān)鍵字各個類別對應(yīng)的網(wǎng)頁鏈接的被點擊次數(shù);
[0095]搜索引擎在歷史記錄中根據(jù)搜索關(guān)鍵字的歷史搜索過程的用戶點擊數(shù)據(jù)中,統(tǒng)計搜索關(guān)鍵字各個類別對應(yīng)的網(wǎng)頁鏈接的被點擊次數(shù)。
[0096]如一個關(guān)鍵字對應(yīng)導(dǎo)航、信息、事務(wù)、主題四個類別,在一天內(nèi),該關(guān)鍵字的歷史搜索過程中,該關(guān)鍵字的導(dǎo)航類的網(wǎng)頁鏈接包括NI個,信息類的網(wǎng)頁鏈接包括N2個,事務(wù)類的網(wǎng)頁鏈接包括N3個,主題類的網(wǎng)頁鏈接包括N4個,統(tǒng)計該關(guān)鍵字的各個類別對應(yīng)的網(wǎng)頁鏈接的被點擊次數(shù),統(tǒng)計結(jié)果可以為如導(dǎo)航一 10次,信息一20次,事務(wù)一30次,主題一40次的形式。
[0097]該統(tǒng)計過程的時間段由技術(shù)人員在開發(fā)過程中或維護過程中進行設(shè)置,本發(fā)明實施例對此不作具體限定。
[0098]204:根據(jù)各個類別對應(yīng)的網(wǎng)頁鏈接的被點擊次數(shù),獲取所述搜索關(guān)鍵字各個類別的支持度,將所述搜索關(guān)鍵字各個類別的支持度作為所述搜索關(guān)鍵字的歷史偏好信息;
[0099]對于同一個時間段內(nèi)計算的支持度,搜索引擎根據(jù)各個類別對應(yīng)的網(wǎng)頁鏈接的被點擊次數(shù)和邊界遞減效應(yīng)對各個類別的支持度進行計算,使得各個類別的網(wǎng)頁鏈接對應(yīng)的被點擊次數(shù)增加到任意值時,支持度的值始終在一定的范圍之內(nèi),以便于計算、存儲和比較。
[0100]對于不同時間計算的支持度,需要累加到已有的支持度上。由于當(dāng)前計算的支持度代表了最近的一段時間內(nèi)用戶的基本點擊需求,所以具有較高的導(dǎo)向性,根據(jù)邊際遞增效應(yīng)進行計算當(dāng)前時間段的支持度??梢栽黾赢?dāng)前時間段的支持度的權(quán)重,即對當(dāng)前時間段的支持度乘以一個較大的系數(shù),或者降低已有的支持度的權(quán)重,即對已有的支持度進行線性衰減或非線性衰減,在對當(dāng)前時間段的支持度和已有的支持度進行加權(quán)后在求和作為歷史偏好信息的支持度,從而使當(dāng)前時間段的支持度計算具有邊際遞增效應(yīng)。
[0101]在步驟203的例子的基礎(chǔ)上,獲取到一天之內(nèi)的一個關(guān)鍵字的各個類別的點擊次數(shù)的統(tǒng)計結(jié)果為導(dǎo)航一 10次,信息一20次,事務(wù)一30次,主題一40次,采用反正切函數(shù)y=arc tan x計算該關(guān)鍵字的各個類別的支持度,該函數(shù)符合邊際遞減效果,當(dāng)導(dǎo)航類的點擊次數(shù)為10,帶入公式計算可以獲取到對應(yīng)的支持度為arc tanl0=l.47,信息類的支持度arc tan20=l.52,事務(wù)類的支持度arc tan30=l.537,主題類的支持度arc tan40=l.545。將各個類別的支持度進行加權(quán),疊加到已有的支持度中,如已有的導(dǎo)航類的支持度為5.5,將已有的導(dǎo)航類的支持度乘以0.8,同時將當(dāng)前計算獲得的導(dǎo)航類支持度1.47乘以0.5,在將兩者進行相加,即5.5*0.8+1.47*0.5=5.135,該關(guān)鍵字的其他類別的計算入導(dǎo)航類的計算過程相似,這里不再贅述,將計算后的該關(guān)鍵字的各個類別的支持度作為該關(guān)鍵字的歷史偏好信息的支持度。
[0102]需要說明的是,步驟201-202、203_204的計算時間沒有先后的順序,該計算時間是由技術(shù)人員在開發(fā)過程中或維護過程中進行設(shè)置的,步驟的序號并不代表該過程在實際應(yīng)用中的執(zhí)行順序。
[0103]205:接收用戶輸入的指定搜索關(guān)鍵字;
[0104]用戶在搜索頁面輸入指定的關(guān)鍵字后,搜索引擎獲取該指定關(guān)鍵字,如用戶輸入指定關(guān)鍵為“蘋果”,搜索引擎通過獲取“蘋果”,以進行對相關(guān)網(wǎng)頁的獲取。
[0105]206:根據(jù)所述指定搜索關(guān)鍵字,獲取與所述指定搜索關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接;
[0106]搜索引擎根據(jù)指定搜索關(guān)鍵字如“蘋果”,進行分析處理,由于該關(guān)鍵字比較簡單,不需要進行分詞等處理,搜索引擎在已有的網(wǎng)頁鏈接中查找和“蘋果”匹配的至少一個網(wǎng)頁鏈接,并獲取至少一個匹配的網(wǎng)頁鏈接。
[0107]207:獲取所述至少一個網(wǎng)頁鏈接的歷史偏好信息,所述網(wǎng)頁鏈接的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到;
[0108] 根據(jù)匹配到的至少一個網(wǎng)頁鏈接,搜索引擎獲取至少一個網(wǎng)頁鏈接的歷史偏好信息,該偏好信息包括類別以及其對應(yīng)的支持度。如“蘋果”對應(yīng)N個網(wǎng)頁鏈接,N可以為1,2,3,4等,當(dāng)N為3時,網(wǎng)頁鏈接I的歷史偏好信息為:導(dǎo)航一5.55,信息一3.12 ;網(wǎng)頁鏈接2的歷史偏好彳目息為:水果一8.56 ;網(wǎng)頁鏈接3的歷史偏好彳目息為:手機一9.25。
[0109]網(wǎng)頁鏈接的歷史偏好信息通過步驟101-102對歷史搜索過程中的用戶點擊數(shù)據(jù)進行分析,獲取網(wǎng)頁鏈接的各個類別及其支持度,將各個類別及其支持度作為網(wǎng)頁鏈接的歷史偏好信息,在此不再贅述。
[0110]208:獲取所述指定搜索關(guān)鍵字的歷史偏好信息,所述指定搜索關(guān)鍵字的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到;
[0111]獲取搜索的關(guān)鍵字的歷史偏好信息,即該關(guān)鍵字的各個類別及其對應(yīng)的支持度。如關(guān)鍵字“蘋果”的關(guān)鍵字的歷史偏好信息為:導(dǎo)航一5.55,信息一3.12 ;網(wǎng)頁鏈接2的歷史偏好?目息為:水果一8.56 ;網(wǎng)頁鏈接3的歷史偏好彳目息為:手機一9.25。
[0112]關(guān)鍵字的歷史偏好信息通過步驟203-204對歷史搜索過程中的用戶點擊數(shù)據(jù)進行分析,獲取關(guān)鍵字的各個類別及其支持度,將各個類別及其支持度作為關(guān)鍵字的歷史偏好信息,在此不再贅述。
[0113]209:根據(jù)獲取到的歷史偏好信息中類別的支持度,應(yīng)用預(yù)設(shè)算法計算至少一個網(wǎng)頁鏈接的排序分數(shù);
[0114]獲取到的歷史偏好信息包括關(guān)鍵字的歷史偏好信息和/或網(wǎng)頁鏈接的歷史偏好信息。搜索引擎根據(jù)預(yù)設(shè)算法對關(guān)鍵字的歷史偏好信息和/或網(wǎng)頁鏈接的歷史偏好信息中的支持度、相關(guān)度等信息中的任一種或多種信息進行疊加或者加權(quán)求和,以獲取網(wǎng)頁鏈接的排序分數(shù)。
[0115]優(yōu)選地,采用關(guān)鍵字的歷史偏好信息、網(wǎng)頁鏈接的偏好信息和相關(guān)度進行網(wǎng)頁鏈接的排序分數(shù)的計算,以便使用戶獲取到的網(wǎng)頁鏈接最大限度的滿足用戶的需求。如輸入關(guān)鍵字為“蘋果”時,關(guān)鍵字的歷史偏好信息包括:導(dǎo)航一5.55,信息一3.12,水果一8.56,手機(意圖類別)一9.25。當(dāng)已獲取的網(wǎng)頁鏈接數(shù)量為N時,以其中3個網(wǎng)頁鏈接為例進行說明,網(wǎng)頁鏈接I的頁鏈接的歷史偏好信息為:導(dǎo)航一1.55,信息一1.12 ;網(wǎng)頁鏈接2的網(wǎng)頁鏈接的歷史偏好信息為:水果一2.56 ;網(wǎng)頁鏈接3的網(wǎng)頁鏈接的歷史偏好信息為:手機一
2.25。網(wǎng)頁鏈接I的相關(guān)度為0.4,網(wǎng)頁鏈接2的相關(guān)度為0.7,網(wǎng)頁鏈接3的相關(guān)度為0.9。在計算排序分數(shù)時,可以采用加權(quán)求和的方式,網(wǎng)頁鏈接的排序分數(shù)=關(guān)鍵字的歷史偏好信息的支持度*網(wǎng)頁鏈接的歷史偏好信息的支持度+相關(guān)度;則網(wǎng)頁鏈接I的排序分數(shù)為:
5.55*1.55+3.21*1.12+0.4=12.5977,網(wǎng)頁鏈接 2 的排序分數(shù)為:8.56*2.56+0.7=22.6136,網(wǎng)頁鏈接3的排序分數(shù)為:9.25*2.25+0.9=21.7125。
[0116]210:根據(jù)所述至少一個網(wǎng)頁鏈接的排序分數(shù),輸出排序后的網(wǎng)頁鏈接。
[0117]搜索引擎將各個網(wǎng)頁鏈接按照排序分數(shù)進行輸出,用戶在瀏覽器提供的頁面中看到排序后的各個網(wǎng)頁鏈接?;诓襟E208中的例子,當(dāng)N為3時,網(wǎng)頁鏈接的排序為:網(wǎng)頁鏈接2,網(wǎng)頁鏈接3,網(wǎng)頁鏈接I。
[0118]用戶按照網(wǎng)頁鏈接的順序查看各個網(wǎng)頁鏈接獲取需要的網(wǎng)頁鏈接,進而可以通過點擊操作進入相關(guān)的頁面。
[0119]本發(fā)明通過接收用戶輸入的指定搜索關(guān)鍵字;根據(jù)所述指定搜索關(guān)鍵字,獲取與所述指定搜索關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接;獲取所述至少一個網(wǎng)頁鏈接的歷史偏好信息,所述網(wǎng)頁鏈接的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到;根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù);根據(jù)所述至少一個網(wǎng)頁鏈接的排序分數(shù),輸出排序后的網(wǎng)頁鏈接。采用本發(fā)明提供的技術(shù)方案,通過獲取對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到的歷史偏好信息以及對至少一個網(wǎng)頁鏈接的排序分數(shù)的計算,使得搜索引擎輸出的排序后的網(wǎng)頁鏈接能夠綜合歷史搜索過程中用戶的偏好,根據(jù)其排序分數(shù)進行排序,使得搜索更加準確,為用戶的搜索提供了導(dǎo)向作用,提高了搜索的效率。進一步地,通過對關(guān)鍵字的歷史偏好信息的獲取,增強了網(wǎng)頁鏈接的排序的導(dǎo)向作用。進一步地,通過對預(yù)設(shè)算法的靈活應(yīng)用,充分考慮了網(wǎng)頁鏈接各種信息,增加了返回網(wǎng)頁鏈接的全面性。
[0120]圖3是本發(fā)明實施例中提供的一種查詢偏好排序裝置結(jié)構(gòu)示意圖,參見圖3,該方法包括:
[0121]接收模塊301,用于接收用戶輸入的指定搜索關(guān)鍵字;[0122]網(wǎng)頁鏈接獲取模塊302,用于根據(jù)所述指定搜索關(guān)鍵字,獲取與所述指定搜索關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接;
[0123]網(wǎng)頁鏈接信息獲取模塊303,用于獲取所述至少一個網(wǎng)頁鏈接的歷史偏好信息,所述網(wǎng)頁鏈接的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到;
[0124]排序分數(shù)計算模塊304,用于根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù);
[0125]輸出模塊305,用于根據(jù)所述至少一個網(wǎng)頁鏈接的排序分數(shù),輸出排序后的網(wǎng)頁鏈接。
[0126]所述裝置還包括:
[0127]關(guān)鍵字信息獲取模塊,用于獲取所述指定搜索關(guān)鍵字的歷史偏好信息,所述指定搜索關(guān)鍵字的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到。
[0128]所述裝置還包括:
[0129]第一統(tǒng)計模塊,用于按照搜索關(guān)鍵字的類別,統(tǒng)計所述搜索關(guān)鍵字的歷史搜索過程的用戶點擊數(shù)據(jù)中所述搜索關(guān)鍵字各個類別對應(yīng)的網(wǎng)頁鏈接的被點擊次數(shù);
[0130]關(guān)鍵字信息計算模塊,用于根據(jù)各個類別對應(yīng)的網(wǎng)頁鏈接的被點擊次數(shù),獲取所述搜索關(guān)鍵字各個類別的支持度,將所述搜索關(guān)鍵字各個類別的支持度作為所述搜索關(guān)鍵字的歷史偏好息。
[0131]所述裝置還包括:
[0132]第二統(tǒng)計模塊,用于根據(jù)網(wǎng)頁鏈接的各個類別,分別統(tǒng)計所述網(wǎng)頁鏈接作為與所述各個類別匹配的搜索結(jié)果時被點擊的次數(shù);
[0133]網(wǎng)頁鏈接信息計算模塊,用于根據(jù)各個類別對應(yīng)的被點擊次數(shù),獲取所述網(wǎng)頁鏈接各個類別的支持度,將所述網(wǎng)頁鏈接各個類別的支持度作為所述網(wǎng)頁鏈接的歷史偏好信
肩、O
[0134]所述類別至少包括主題類別和意圖類別中任一項。
[0135]所述排序分數(shù)計算模塊304用于根據(jù)獲取到的歷史偏好信息中類別的支持度,應(yīng)用預(yù)設(shè)算法計算至少一個網(wǎng)頁鏈接的排序分數(shù)。
[0136]本發(fā)明通過接收用戶輸入的指定搜索關(guān)鍵字;根據(jù)所述指定搜索關(guān)鍵字,獲取與所述指定搜索關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接;獲取所述至少一個網(wǎng)頁鏈接的歷史偏好信息,所述網(wǎng)頁鏈接的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到;根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù);根據(jù)所述至少一個網(wǎng)頁鏈接的排序分數(shù),輸出排序后的網(wǎng)頁鏈接。采用本發(fā)明提供的裝置,通過獲取對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到的歷史偏好信息以及對至少一個網(wǎng)頁鏈接的排序分數(shù)的計算,使得搜索引擎輸出的排序后的網(wǎng)頁鏈接能夠綜合歷史搜索過程中用戶的偏好,根據(jù)其排序分數(shù)進行排序,使得搜索更加準確,為用戶的搜索提供了導(dǎo)向作用,提高了搜索的效率。進一步地,通過對關(guān)鍵字的歷史偏好信息的獲取,增強了網(wǎng)頁鏈接的排序的導(dǎo)向作用。進一步地,通過對預(yù)設(shè)算法的靈活應(yīng)用,充分考慮了網(wǎng)頁鏈接各種信息,增加了返回網(wǎng)頁鏈接的全面性。
[0137]需要說明的是:上述實施例提供的查詢偏好排序裝置在對查詢偏好排序時,僅以上述各功能模塊的劃分進行舉例說明,實際應(yīng)用中,可以根據(jù)需要而將上述功能分配由不同的功能模塊完成,即將設(shè)備的內(nèi)部結(jié)構(gòu)劃分成不同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實施例提供的查詢偏好排序裝置與查詢偏好排序方法實施例屬于同一構(gòu)思,其具體實現(xiàn)過程詳見方法實施例,這里不再贅述。
[0138]本領(lǐng)域普通技術(shù)人員可以理解實現(xiàn)上述實施例的全部或部分步驟可以通過硬件來完成,也可以通過程序來指令相關(guān)的硬件完成,所述的程序可以存儲于一種計算機可讀存儲介質(zhì)中,上述提到的存儲介質(zhì)可以是只讀存儲器,磁盤或光盤等。
[0139]以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。
【權(quán)利要求】
1.一種查詢偏好排序方法,其特征在于,所述方法包括: 接收用戶輸入的指定搜索關(guān)鍵字; 根據(jù)所述指定搜索關(guān)鍵字,獲取與所述指定搜索關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接; 獲取所述至少一個網(wǎng)頁鏈接的歷史偏好信息,所述網(wǎng)頁鏈接的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到; 根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù); 根據(jù)所述至少一個網(wǎng)頁鏈接的排序分數(shù),輸出排序后的網(wǎng)頁鏈接。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,接收用戶輸入的指定搜索關(guān)鍵字之后,根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù)之前,所述方法還包括: 獲取所述指定搜索關(guān)鍵字的歷史偏好信息,所述指定搜索關(guān)鍵字的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,接收用戶輸入的搜索關(guān)鍵字之前,所述方法還包括: 按照搜索關(guān)鍵字的類別,統(tǒng)計所述搜索關(guān)鍵字的歷史搜索過程的用戶點擊數(shù)據(jù)中所述搜索關(guān)鍵字各個類別對應(yīng)的網(wǎng)頁鏈接的被點擊次數(shù); 根據(jù)各個類別對應(yīng)的網(wǎng)頁鏈接的被點擊次數(shù),獲取所述搜索關(guān)鍵字各個類別的支持度,將所述搜索關(guān)鍵字各個類別的支持度作為所述搜索關(guān)鍵字的歷史偏好信息。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,接收用戶輸入的搜索關(guān)鍵字之前,所述方法還包括: 根據(jù)網(wǎng)頁鏈接的各個類別,分別統(tǒng)計所述網(wǎng)頁鏈接作為與所述各個類別匹配的搜索結(jié)果時被點擊的次數(shù); 根據(jù)各個類別對應(yīng)的被點擊次數(shù),獲取所述網(wǎng)頁鏈接各個類別的支持度,將所述網(wǎng)頁鏈接各個類別的支持度作為所述網(wǎng)頁鏈接的歷史偏好信息。
5.根據(jù)權(quán)利要求3或4所述的方法,其特征在于,所述類別至少包括主題類別和意圖類別中任一項。
6.根據(jù)權(quán)利要求3或4所述的方法,其特征在于,根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù),包括: 根據(jù)獲取到的歷史偏好信息中類別的支持度,應(yīng)用預(yù)設(shè)算法計算至少一個網(wǎng)頁鏈接的排序分數(shù)。
7.—種查詢偏好排序裝置,其特征在于,所述裝置包括: 接收模塊,用于接收用戶輸入的指定搜索關(guān)鍵字; 網(wǎng)頁鏈接獲取模塊,用于根據(jù)所述指定搜索關(guān)鍵字,獲取與所述指定搜索關(guān)鍵字匹配的至少一個網(wǎng)頁鏈接; 網(wǎng)頁鏈接信息獲取模塊,用于獲取所述至少一個網(wǎng)頁鏈接的歷史偏好信息,所述網(wǎng)頁鏈接的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到; 排序分數(shù)計算模塊,用于根據(jù)獲取到的歷史偏好信息,計算至少一個網(wǎng)頁鏈接的排序分數(shù); 輸出模塊,用于根據(jù)所述至少一個網(wǎng)頁鏈接的排序分數(shù),輸出排序后的網(wǎng)頁鏈接。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括:關(guān)鍵字信息獲取模塊,用于獲取所述指定搜索關(guān)鍵字的歷史偏好信息,所述指定搜索關(guān)鍵字的歷史偏好信息通過對歷史搜索過程中的用戶點擊數(shù)據(jù)的分析得到。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述裝置還包括: 第一統(tǒng)計模塊,用于按照搜索關(guān)鍵字的類別,統(tǒng)計所述搜索關(guān)鍵字的歷史搜索過程的用戶點擊數(shù)據(jù)中所述搜索關(guān)鍵字各個類別對應(yīng)的網(wǎng)頁鏈接的被點擊次數(shù); 關(guān)鍵字信息計算模塊,用于根據(jù)各個類別對應(yīng)的網(wǎng)頁鏈接的被點擊次數(shù),獲取所述搜索關(guān)鍵字各個類別的支持度,將所述搜索關(guān)鍵字各個類別的支持度作為所述搜索關(guān)鍵字的歷史偏好息。
10.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括: 第二統(tǒng)計模塊,用于根據(jù)網(wǎng)頁鏈接的各個類別,分別統(tǒng)計所述網(wǎng)頁鏈接作為與所述各個類別匹配的搜索結(jié)果時被點擊的次數(shù); 網(wǎng)頁鏈接信息計算模塊,用于根據(jù)各個類別對應(yīng)的被點擊次數(shù),獲取所述網(wǎng)頁鏈接各個類別的支持度,將所述網(wǎng)頁鏈接各個類別的支持度作為所述網(wǎng)頁鏈接的歷史偏好信息。
11.根據(jù)權(quán)利要求9或10所述的裝置,其特征在于,所述類別至少包括主題類別和意圖類別中任一項。
12.根據(jù)權(quán)利要求9或10所述的裝置,其特征在于,所述排序分數(shù)計算模塊用于根據(jù)獲取到的歷史偏好信 息中類別的支持度,應(yīng)用預(yù)設(shè)算法計算至少一個網(wǎng)頁鏈接的排序分數(shù)。
【文檔編號】G06F17/30GK103970796SQ201310043389
【公開日】2014年8月6日 申請日期:2013年2月4日 優(yōu)先權(quán)日:2013年2月4日
【發(fā)明者】羅景 申請人:深圳市世紀光速信息技術(shù)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1