亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

查詢詞權(quán)重值的確定方法和裝置的制造方法

文檔序號:8299149閱讀:432來源:國知局
查詢詞權(quán)重值的確定方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明實施例涉及數(shù)據(jù)處理技術(shù),尤其涉及一種查詢詞權(quán)重值的確定方法和裝 置。
【背景技術(shù)】
[0002] 隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展以及互聯(lián)網(wǎng)應(yīng)用對人們工作、學(xué)習(xí)與生活的不斷滲 透,人們越來越多的通過網(wǎng)絡(luò)獲取信息。典型的,用戶通過搜索引擎輸入查詢式(Query),搜 索引擎通過采用一定的搜索排序方式向用戶返回與輸入查詢式相匹配的搜索結(jié)果。其中, 搜索引擎在處理用戶輸入的查詢式時,會給查詢式中包括的查詢詞(Term)賦予不同的權(quán) 重來反映不同查詢詞在查詢式當(dāng)中的重要程度(也稱為Term重要性),搜索引擎通過聯(lián)合 使用查詢式當(dāng)中的Term重要性以及查詢式與網(wǎng)絡(luò)中文檔(典型的,網(wǎng)頁)的匹配程度對搜 索結(jié)果進(jìn)行排序,并提供給用戶。
[0003] 現(xiàn)有技術(shù)主要通過IDF(InverseDocumentFrequency,逆文檔頻率)方法來計算 查詢詞的權(quán)重值,即通過文檔集合中所有文檔的數(shù)目除以包含某個查詢詞的文檔的數(shù)目, 再將得到的商取對數(shù)的結(jié)果,作為該查詢詞的權(quán)重值?,F(xiàn)有技術(shù)的主要缺陷在于查詢詞權(quán) 重值由網(wǎng)絡(luò)中包含該查詢詞的文檔數(shù)目所決定,與查詢詞在該查詢式中的重要程度有較大 偏差。

【發(fā)明內(nèi)容】

[0004] 有鑒于此,本發(fā)明實施例提供一種查詢詞權(quán)重值的確定方法和裝置,以優(yōu)化現(xiàn)有 的查詢詞權(quán)重值確定技術(shù),提高所確定的查詢詞重要程度的準(zhǔn)確性。
[0005] 在第一方面,本發(fā)明實施例提供了一種查詢詞權(quán)重值的確定方法,包括:
[0006] 按照設(shè)定規(guī)則對查詢?nèi)罩拘畔⑦M(jìn)行分類處理;
[0007] 根據(jù)查詢詞在至少兩類所述查詢?nèi)罩拘畔⒅谐霈F(xiàn)的差異性,確定所述查詢詞的權(quán) 重值。
[0008] 在第二方面,本發(fā)明實施例提供了一種查詢詞權(quán)重值的確定裝置,包括:
[0009] 查詢?nèi)罩咎幚砟K,用于按照設(shè)定規(guī)則對查詢?nèi)罩拘畔⑦M(jìn)行分類處理;
[0010] 權(quán)重值確定模塊,用于根據(jù)查詢詞在至少兩類所述查詢?nèi)罩拘畔⒅谐霈F(xiàn)的差異 性,確定所述查詢詞的權(quán)重值。
[0011] 本發(fā)明實施例通過按照設(shè)定規(guī)則對查詢?nèi)罩拘畔⑦M(jìn)行分類處理;根據(jù)查詢詞在至 少兩類所述查詢?nèi)罩拘畔⒅谐霈F(xiàn)的差異性,確定所述查詢詞的權(quán)重值的技術(shù)手段,解決了 現(xiàn)有技術(shù)在計算查詢詞權(quán)重值時僅僅根據(jù)網(wǎng)絡(luò)中查詢詞的文檔數(shù)目,而不考慮用戶實際輸 入的查詢式以及實際點擊的搜索結(jié)果的技術(shù)問題,優(yōu)化了現(xiàn)有的查詢詞權(quán)重值確定技術(shù), 使得計算得到的查詢詞權(quán)重值與用戶實際的查詢操作密切相關(guān),提高了查詢詞權(quán)重值的準(zhǔn) 確性以及搜索引擎的搜索效果。
【附圖說明】
[0012] 圖1是本發(fā)明第一實施例的一種查詢詞權(quán)重值的確定方法的流程圖;
[0013] 圖2是本發(fā)明第二實施例的一種查詢詞權(quán)重值的確定方法的流程圖;
[0014] 圖3是本發(fā)明第三實施例的一種查詢詞權(quán)重值的確定方法的流程圖;
[0015]圖4是本發(fā)明第三實施例所應(yīng)用的一種搜索引擎的查詢系統(tǒng)的實現(xiàn)框圖;
[0016] 圖5是本發(fā)明第四實施例的一種查詢詞權(quán)重值的確定裝置的結(jié)構(gòu)圖。
【具體實施方式】
[0017] 為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面結(jié)合附圖對本發(fā)明具體實 施例作進(jìn)一步的詳細(xì)描述??梢岳斫獾氖牵颂幩枋龅木唧w實施例僅僅用于解釋本發(fā)明, 而非對本發(fā)明的限定。另外還需要說明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān) 的部分而非全部內(nèi)容。
[0018] 首先,將本發(fā)明實施例的主要實現(xiàn)思路簡述如下:
[0019] 一般來說,用戶通過搜索引擎輸入的查詢式中包括有多個查詢詞,但是這多個查 詢詞的重要程度是不相同的。例如,當(dāng)用戶輸入的查詢式為"百度的股價是多少"時,顯然 "百度"以及"股價"這兩個查詢詞的重要程度,要高于"的"、"是"以及"多少"這三個查詢 詞。因此,重要程度高的查詢詞需要被賦予較高的權(quán)重值,以實現(xiàn)在返回搜索結(jié)果時,將與 權(quán)重值高的查詢詞相匹配的文檔(或網(wǎng)頁),優(yōu)先于與權(quán)重值低的查詢詞相匹配的文檔(或 網(wǎng)頁)顯不。
[0020] 現(xiàn)有的IDF技術(shù)在計算查詢詞的權(quán)重值時,使用的主要思想是:如果網(wǎng)絡(luò)中同時 包含某個查詢詞的文檔數(shù)越多,那這個詞的區(qū)分能力也就越小,那這個詞的權(quán)重值就應(yīng)該 降低;反之,如果某個詞只在很少的文檔中出現(xiàn),那么這個詞的區(qū)分能力就更高,因此權(quán)重 值也更高。換句話說,現(xiàn)有技術(shù)在計算查詢詞的權(quán)重值時,查詢詞在文檔(或網(wǎng)頁)中出現(xiàn) 的次數(shù)越少,該查詢詞的權(quán)重值也就越高。
[0021] 而在本發(fā)明各實施例中,采用了截然不同的思路來計算查詢詞的權(quán)重值。即:在本 發(fā)明各實施例中,將查詢詞的權(quán)重值與用戶實際輸入的查詢式,以及實際點擊的網(wǎng)頁地址 等用戶操作相關(guān)聯(lián)。舉例而言,針對多個不同用戶輸入不同查詢式進(jìn)行搜索后,點擊同一個 URL(UniformResoureLocator,統(tǒng)一資源定位符)地址的操作,用戶實際輸入的某個查詢 詞的次數(shù)越多,則對上述URL地址來說,該查詢詞的重要程度也就越高,該查詢詞的權(quán)重值 也就應(yīng)該越大。
[0022] 第一實施例
[0023] 圖1為本發(fā)明第一實施例提供的一種查詢詞權(quán)重值的確定方法的流程圖,本實施 例的方法可以由查詢詞權(quán)重值的確定裝置來執(zhí)行,該裝置可通過硬件和/或軟件的方式實 現(xiàn),并一般可以集成于用于提供查詢詞權(quán)重值確定服務(wù)的權(quán)重值確定服務(wù)器中,與用于提 供搜索引擎服務(wù)的搜索服務(wù)器配合使用,其中,所述權(quán)重值確定服務(wù)器和所述搜索服務(wù)器 可以相同也可以不同,對此并不進(jìn)行限制。
[0024] 本實施例的方法具體包括如下操作:
[0025] 110、按照設(shè)定規(guī)則對查詢?nèi)罩拘畔⑦M(jìn)行分類處理。
[0026] 在本實施例中,權(quán)重值確定服務(wù)器按照設(shè)定規(guī)則對查詢?nèi)罩拘畔⑦M(jìn)行分類處理。
[0027] 其中,查詢?nèi)罩拘畔⒕唧w是指與用戶通過搜索引擎查詢信息時的用戶行為操作所 對應(yīng)的行為日志信息。
[0028] -般來說,在可提供搜索引擎服務(wù)的搜索服務(wù)器端,通常會存儲與用戶的查詢及 點擊操作對應(yīng)的查詢?nèi)罩拘畔?。典型的,在該查詢?nèi)罩拘畔⒅型ǔ涗浻校河脩敉ㄟ^哪種 輸入設(shè)備(Device,例如,臺式機(jī)或者移動終端等),以哪種輸入方式(InputMethod,例如, 文本輸入或者語音輸入等),輸入了哪種查詢式(Query),以及點擊了所返回的搜索結(jié)果當(dāng) 中的哪條記錄(URL)等參數(shù)。因此,在邏輯上,假定與一個用戶對應(yīng)的查詢?nèi)罩拘畔⒅泄舶?括M條記錄,則該M條記錄的數(shù)據(jù)形式如下所示:
[0029] Devicel,InputMethodl,Queryl,URL1 ;
[0030] Device2,InputMethod2,Query2,URL2 ;
[0031] ;
[0032] DeviceM,InputMethodM,QueryM,URLM〇
[0033] 當(dāng)然,可以理解的是,上述查詢?nèi)罩拘畔⒅羞€可以記錄其他類型的參數(shù),例如,用 戶標(biāo)識、查詢時間等,本實施例對此并不進(jìn)行限制。
[0034] 在本實施例中,可以通過主動拉取或者被動接收的方式,獲取搜索服務(wù)器中存儲 的所述查詢?nèi)罩拘畔ⅰ?br>[0035] 在本實施例中,按照設(shè)定規(guī)則對查詢?nèi)罩拘畔⑦M(jìn)行分類處理具體可以包括:根據(jù) 查詢?nèi)罩拘畔⒅邪ǖ脑O(shè)定參數(shù),對所述查詢?nèi)罩拘畔⑦M(jìn)行分類處理。
[0036] 舉例而言,可以僅根據(jù)查詢?nèi)罩拘畔⒅邪ǖ腢RL參數(shù),對所述查詢?nèi)罩拘畔⑦M(jìn) 行分類,例如,可以將URL參數(shù)相同的查詢?nèi)罩拘畔⒎譃橐活悺?br>[0037] 優(yōu)選還可以同時根據(jù)查詢?nèi)罩拘畔⒅邪ǖ腢RL參數(shù)、輸入設(shè)備參數(shù)和/或輸入 方式參數(shù)對所述查詢?nèi)罩拘畔⑦M(jìn)行分類處理,例如,在獲取URL相同的查詢?nèi)罩拘畔⒑?,?以對上述查詢?nèi)罩拘畔凑詹煌妮斎朐O(shè)備參數(shù)進(jìn)行分類,以生成分類處理結(jié)果;也可以 對上述查詢?nèi)罩拘畔凑詹煌妮斎敕绞絽?shù)進(jìn)行分類,以生成分類處理結(jié)果;還可以對 上述查詢?nèi)罩拘畔⑼瑫r按照輸入設(shè)備參數(shù)和輸入方式參數(shù)進(jìn)行分類,以生成分類處理
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1