專利名稱:一種基于用戶行為分析的搜索結(jié)果改進(jìn)的方法及其系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別是涉及一種基于用戶行為分析的搜索結(jié)果改進(jìn)的方法及其系統(tǒng)。
背景技術(shù):
搜索引擎(search engine)是一種根據(jù)一定的策略、運(yùn)用特定的計(jì)算機(jī)程序搜集互聯(lián)網(wǎng)上的信息,并在對(duì)信息進(jìn)行組織和處理后,將處理后的信息顯示給用戶,以為用戶提供檢索服務(wù)的系統(tǒng)。目前,隨著互聯(lián)網(wǎng)的迅速發(fā)展,搜索引擎已成為互聯(lián)網(wǎng)的重要應(yīng)用之一。為了在互聯(lián)網(wǎng)上數(shù)以百億計(jì)的網(wǎng)頁中尋找信息,人們往往求助于搜索引擎。通用搜索引擎的工作流程大致為通過互聯(lián)網(wǎng)爬蟲對(duì)互聯(lián)網(wǎng)上的網(wǎng)頁進(jìn)行爬取和然后進(jìn)行索引,搜索引擎用戶通過發(fā)送關(guān)鍵詞到搜索引擎提供的接口,搜索引擎對(duì)于關(guān)鍵詞和龐大的索引庫進(jìn)行匹配,然后,返回搜索結(jié)果。由于索引庫的龐大,通常對(duì)于關(guān)鍵詞和索引的匹配搜索結(jié)果進(jìn)行緩存。通用搜索引擎一般專注于索引庫的規(guī)模(索引網(wǎng)頁的數(shù)量)和搜索結(jié)果排序的算法,比如PageRank和Hits算法等。算法匹配出來的搜索結(jié)果通常為可重現(xiàn)的,比如,對(duì)于一個(gè)特定的關(guān)鍵字多次搜索返回的是相同的結(jié)果。目前主流的通用搜索引擎一般通過對(duì)于搜索關(guān)鍵字與索引庫進(jìn)行關(guān)聯(lián)性匹配返回搜索的結(jié)果,而且通常對(duì)于關(guān)鍵字的搜索結(jié)果進(jìn)行緩存。對(duì)于這種方式,多次搜索一個(gè)特定的關(guān)鍵字返回的是相同的結(jié)果。這種搜索結(jié)果的返回存在內(nèi)在的缺陷搜索的結(jié)果完全依賴于關(guān)鍵字與搜索引擎龐大索引庫的匹配,依賴于匹配的技術(shù),分詞和索引的技術(shù)。而忽略了用戶在搜索過程中行為的搜索結(jié)果所產(chǎn)生的影響。比如,用戶使用搜索引擎,可能多次搜索不同的關(guān)鍵字卻是為了查詢一個(gè)相同的主題,由于現(xiàn)有的搜索引擎對(duì)用戶的多次搜索并不進(jìn)行記錄分析,對(duì)于不同關(guān)鍵詞的搜索只是返回了與關(guān)鍵詞比對(duì)的結(jié)果,搜索結(jié)果之間的關(guān)聯(lián)性不大,所以用戶即使使用很多的關(guān)鍵詞,而在每次的搜索過程中也只能摘選到很少部分需要的搜索結(jié)果,造成耗費(fèi)過多的人力,導(dǎo)致不好的用戶體驗(yàn)。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)之不足,提供一種基于用戶行為分析的搜索結(jié)果改進(jìn)的方法及其系統(tǒng),通過對(duì)用戶的搜索行為進(jìn)行分析處理,判斷用戶相鄰的兩次搜索之間的關(guān)聯(lián)性,進(jìn)而導(dǎo)出主題相關(guān)性高的搜索結(jié)果,達(dá)到節(jié)省人力、提高搜索結(jié)果相關(guān)性進(jìn)而提升用戶的搜索體驗(yàn)的目的。本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是一種基于用戶行為分析的搜索結(jié)果改進(jìn)的方法,包括如下步驟接收用戶提交的初次查詢關(guān)鍵詞,對(duì)該初次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取初次搜索結(jié)果,并將該初次搜索結(jié)果顯示在用戶的使用界面上;
4
記錄用戶對(duì)初次搜索結(jié)果的搜索行為,并將該搜索行為予以保存;接收用戶提交的再次查詢關(guān)鍵詞,對(duì)該再次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取再次搜索結(jié)果;對(duì)初次搜索結(jié)果和再次搜索結(jié)果是否為相同主題進(jìn)行判斷,當(dāng)判斷為是相同主題時(shí)進(jìn)行下一步驟的處理,否則,將獲取的再次搜索結(jié)果作為初次搜索結(jié)果來顯示在用戶的使用界面上;根據(jù)用戶的搜索行為,對(duì)再次搜索結(jié)果進(jìn)行處理并重新排序,以及將處理和重新排序后的搜索結(jié)果作為初次搜索結(jié)果來顯示在用戶的使用界面上。所述記錄用戶對(duì)初次搜索結(jié)果的搜索行為,是包括記錄用戶對(duì)初次搜索結(jié)果所點(diǎn)中的鏈接網(wǎng)址和用戶在進(jìn)入對(duì)應(yīng)鏈接網(wǎng)址的停留時(shí)間。所述對(duì)初次搜索結(jié)果和再次搜索結(jié)果是否為相同主題進(jìn)行判斷,是將用戶對(duì)初次搜索結(jié)果所點(diǎn)中的鏈接網(wǎng)址與再次搜索結(jié)果的鏈接網(wǎng)址的重復(fù)度進(jìn)行分析以及將初次搜索結(jié)果的鏈接網(wǎng)址與再次搜索結(jié)果的鏈接網(wǎng)址的重復(fù)度進(jìn)行分析,當(dāng)重復(fù)度達(dá)到預(yù)設(shè)的閾值時(shí),就判定為主題相同。所述對(duì)再次搜索結(jié)果進(jìn)行處理并重新排序,是根據(jù)預(yù)設(shè)的條件,提取三類的鏈接網(wǎng)址來作為搜索結(jié)果,并根據(jù)預(yù)設(shè)的權(quán)重條件將搜索結(jié)果重新排序;其中,該三類鏈接網(wǎng)址分別為初次搜索結(jié)果所點(diǎn)中的鏈接中瀏覽時(shí)間最久的若干鏈接網(wǎng)址,初次搜索結(jié)果和再次搜索結(jié)果都匹配的若干鏈接網(wǎng)址,初次搜索結(jié)果和再次搜索結(jié)果中排序靠前的若干鏈接網(wǎng)址。所述接收用戶提交的初次查詢關(guān)鍵詞,對(duì)該初次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取初次搜索結(jié)果,并將該初次搜索結(jié)果顯示在用戶的使用界面上的過程,包括如下步驟al.接收用戶提交搜索關(guān)鍵詞;a2.利用查詢模塊分析關(guān)鍵詞,對(duì)關(guān)鍵詞進(jìn)行處理;a3.由查詢模塊查看緩存是否存在相關(guān)檢索的結(jié)果,如存在則返回搜索結(jié)果;否則把關(guān)鍵詞和索引庫進(jìn)行相關(guān)性判斷后返回搜索結(jié)果;a4.記錄返回的初次搜索結(jié)果和搜索時(shí)間。所述記錄用戶對(duì)初次搜索結(jié)果的搜索行為,并將該搜索行為予以保存的過程,包括如下步驟bl.當(dāng)初次搜索結(jié)果顯示在用戶的使用界面上時(shí),用戶搜索行為記錄模塊啟動(dòng),開始記錄用戶的搜索行為;b2.記錄用戶點(diǎn)擊的鏈接網(wǎng)址和進(jìn)入該鏈接網(wǎng)址的時(shí)間;b3.記錄用戶返回到初次搜索結(jié)果頁面的時(shí)間從而計(jì)算出用戶在該鏈接網(wǎng)址內(nèi)的停留時(shí)間;b4.重復(fù)步驟b2_b3,直至用戶改變關(guān)鍵詞進(jìn)行下一次搜索;b5.對(duì)用戶的搜索行為進(jìn)行緩存或入庫保存。所述接收用戶提交的再次查詢關(guān)鍵詞,對(duì)該再次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取再次搜索結(jié)果的過程;以及對(duì)初次搜索結(jié)果和再次搜索結(jié)果是否為相同主題進(jìn)行判斷,當(dāng)判斷為是相同主題時(shí)進(jìn)行下一步驟的處理,否則,將獲取的再次搜索結(jié)果作為初次搜索結(jié)果來顯示在用戶的使用界面上的過程;包括如下步驟Cl.記錄用戶再次搜索的時(shí)間,進(jìn)而計(jì)算出與初次搜索時(shí)間的間隔;c2.對(duì)再次搜索的關(guān)鍵詞進(jìn)行處理,得到再次搜索結(jié)果,但不返回給用戶;c3.進(jìn)行初次用戶搜索行為中點(diǎn)擊的鏈接網(wǎng)址與當(dāng)前返回結(jié)果的鏈接網(wǎng)址的重復(fù)情況計(jì)算;c4.進(jìn)行初次用戶搜索行為中返回搜索結(jié)果的鏈接網(wǎng)址與當(dāng)前返回結(jié)果的鏈接網(wǎng)址的重復(fù)情況計(jì)算;c5.綜合搜索時(shí)間間隔,和步驟c3、c4中的鏈接網(wǎng)址的重復(fù)情況,判斷兩次的搜索是否是相關(guān)主題的搜索;c6.如果是相關(guān)主題的搜索果則進(jìn)入搜索結(jié)果關(guān)聯(lián)性分析模塊進(jìn)行后續(xù)分析處理,否則將再次搜索結(jié)果返回給用戶。所述用戶搜索行為,是指在一個(gè)較短時(shí)間內(nèi),用戶利用搜索引擎進(jìn)行檢索過程中的行為。一種基于用戶行為分析的搜索結(jié)果改進(jìn)的系統(tǒng),包括第一查詢模塊,該第一查詢模塊用來接收用戶提交的初次查詢關(guān)鍵詞,對(duì)該初次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取初次搜索結(jié)果,并將該初次搜索結(jié)果顯示在用戶的使用界面上;用戶行為記錄模塊,該用戶行為記錄模塊用來記錄用戶對(duì)初次搜索結(jié)果的搜索行為,并將該搜索行為予以保存;第二查詢模塊,該第二查詢模塊用來接收用戶提交的再次查詢關(guān)鍵詞,對(duì)該再次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取再次搜索結(jié)果;搜索相關(guān)性判斷模塊,該搜索相關(guān)性判斷模塊用來對(duì)初次搜索結(jié)果和再次搜索結(jié)果是否為相同主題進(jìn)行判斷,當(dāng)判斷為是相同主題時(shí)進(jìn)行下一步驟的處理,否則,將獲取的再次搜索結(jié)果作為初次搜索結(jié)果來顯示在用戶的使用界面上;搜索結(jié)果關(guān)聯(lián)性分析模塊,該搜索結(jié)果關(guān)聯(lián)性分析模塊用來根據(jù)用戶的搜索行為,對(duì)再次搜索結(jié)果進(jìn)行處理并重新排序,以及將處理和重新排序后的搜索結(jié)果作為初次搜索結(jié)果來顯示在用戶的使用界面上。本發(fā)明的一種基于用戶行為分析的搜索結(jié)果改進(jìn)的系統(tǒng),是一個(gè)記錄分析用戶搜索行為,進(jìn)而推薦搜索結(jié)果、提升用戶搜索體驗(yàn)的個(gè)性化搜索系統(tǒng)。用戶發(fā)送關(guān)鍵詞到本系統(tǒng),系統(tǒng)對(duì)關(guān)鍵詞進(jìn)行初步處理、查詢并返回結(jié)果,在用戶對(duì)返回的查詢結(jié)果操作中系統(tǒng)記錄用戶的瀏覽行為,在用戶的第二次查詢關(guān)鍵字時(shí),系統(tǒng)判斷兩次查詢的相關(guān)聯(lián)性,如果相關(guān)聯(lián),系統(tǒng)進(jìn)入搜索結(jié)果的關(guān)聯(lián)性分析模塊,推薦更符合用戶查詢主題的搜索結(jié)果。本發(fā)明的有益效果是,由于采用了接收用戶提交的初次查詢關(guān)鍵詞,對(duì)該初次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取初次搜索結(jié)果,并將該初次搜索結(jié)果顯示在用戶的使用界面上;記錄用戶對(duì)初次搜索結(jié)果的搜索行為,并將該搜索行為予以保存;接收用戶提交的再次查詢關(guān)鍵詞,對(duì)該再次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取再次搜索結(jié)果;對(duì)初次搜索結(jié)果和再次搜索結(jié)果是否為相同主題進(jìn)行判斷,當(dāng)判斷為是相同主題時(shí)進(jìn)行下一步驟的處理,否則,將獲取的再次搜索結(jié)果作為初次搜索結(jié)果來顯示在用戶的使用界面上;根據(jù)用戶的搜索行為,對(duì)再次搜索結(jié)果進(jìn)行處理并重新排序,以及將處理和重新排序后的搜索結(jié)果作為初次搜索結(jié)果來顯示在用戶的使用界面上等步驟,通過對(duì)用戶的搜索行為進(jìn)行分析處理,判斷用戶相鄰的兩次搜索之間的關(guān)聯(lián)性,進(jìn)而導(dǎo)出主題相關(guān)性高的搜索結(jié)果,達(dá)到節(jié)省人力、提高搜索結(jié)果相關(guān)性進(jìn)而提升用戶的搜索體驗(yàn)的目的。本發(fā)明是利用用戶的搜索行為分析,關(guān)聯(lián)分析用戶的搜索主題,改進(jìn)搜索的返回結(jié)果,節(jié)省用戶獲取主題信息的時(shí)間,進(jìn)而改善用戶的搜索體驗(yàn)。本發(fā)明致力于搜索返回結(jié)果的改進(jìn),而非相關(guān)的搜索推薦,這是本專利與其他相似名稱專利的最大區(qū)別。用戶利用本發(fā)明的方法及其系統(tǒng),可以改變通用搜索引擎對(duì)于關(guān)鍵詞僅僅通過算法進(jìn)行相關(guān)性匹配返回固定結(jié)果的局限性。系統(tǒng)考慮了用戶的搜索行為,對(duì)于用戶的搜索主題進(jìn)行分析,可以返回更符合用戶期待的搜索結(jié)果,進(jìn)而提升用戶的搜索體驗(yàn)。本發(fā)明的方法及其系統(tǒng)尤其適用于用戶多次進(jìn)行相同主題的搜索,用戶不明確用特定的關(guān)鍵詞描述所需主題的情況下。通過多次搜索不同的關(guān)鍵詞,系統(tǒng)通過分析搜索關(guān)聯(lián)性,可以幫助用戶不斷明確用戶所需的搜索結(jié)果、提升與主題相關(guān)度高的結(jié)果的排名,提高用戶獲取信息的效率。以下結(jié)合附圖及實(shí)施例對(duì)本發(fā)明作進(jìn)一步詳細(xì)說明;但本發(fā)明的一種基于用戶行為分析的搜索結(jié)果改進(jìn)的方法及其系統(tǒng)不局限于實(shí)施例。
圖I是本發(fā)明方法的步驟流程圖;圖2是本發(fā)明系統(tǒng)的工作流程圖。
具體實(shí)施例方式實(shí)施例,請(qǐng)參見圖I所示,本發(fā)明的一種基于用戶行為分析的搜索結(jié)果改進(jìn)的方法,包括如下步驟步驟SI,接收用戶提交的初次查詢關(guān)鍵詞,對(duì)該初次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取初次搜索結(jié)果,并將該初次搜索結(jié)果顯示在用戶的使用界面上;步驟S2,記錄用戶對(duì)初次搜索結(jié)果的搜索行為,并將該搜索行為予以保存;步驟S3,接收用戶提交的再次查詢關(guān)鍵詞,對(duì)該再次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取再次搜索結(jié)果;步驟S4,對(duì)初次搜索結(jié)果和再次搜索結(jié)果是否為相同主題進(jìn)行判斷,當(dāng)判斷為是相同主題時(shí)進(jìn)行下一步驟的處理,否則,將獲取的再次搜索結(jié)果作為初次搜索結(jié)果來顯示在用戶的使用界面上;步驟S5,根據(jù)用戶的搜索行為,對(duì)再次搜索結(jié)果進(jìn)行處理并重新排序,以及將處理和重新排序后的搜索結(jié)果作為初次搜索結(jié)果來顯示在用戶的使用界面上。所述記錄用戶對(duì)初次搜索結(jié)果的搜索行為,是包括記錄用戶對(duì)初次搜索結(jié)果所點(diǎn)中的鏈接網(wǎng)址和用戶在進(jìn)入對(duì)應(yīng)鏈接網(wǎng)址的停留時(shí)間。所述對(duì)初次搜索結(jié)果和再次搜索結(jié)果是否為相同主題進(jìn)行判斷,是將用戶對(duì)初次搜索結(jié)果所點(diǎn)中的鏈接網(wǎng)址與再次搜索結(jié)果的鏈接網(wǎng)址的重復(fù)度進(jìn)行分析以及將初次搜
7索結(jié)果的鏈接網(wǎng)址與再次搜索結(jié)果的鏈接網(wǎng)址的重復(fù)度進(jìn)行分析,當(dāng)重復(fù)度達(dá)到預(yù)設(shè)的閾值時(shí),就判定為主題相同。所述對(duì)再次搜索結(jié)果進(jìn)行處理并重新排序,是根據(jù)預(yù)設(shè)的條件,提取三類的鏈接網(wǎng)址來作為搜索結(jié)果,并根據(jù)預(yù)設(shè)的權(quán)重條件將搜索結(jié)果重新排序;其中,該三類鏈接網(wǎng)址分別為初次搜索結(jié)果所點(diǎn)中的鏈接中瀏覽時(shí)間最久的若干鏈接網(wǎng)址,初次搜索結(jié)果和再次搜索結(jié)果都匹配的若干鏈接網(wǎng)址,初次搜索結(jié)果和再次搜索結(jié)果中排序靠前的若干鏈接網(wǎng)址。所述步驟SI,包括如下步驟al.接收用戶提交搜索關(guān)鍵詞;a2.利用查詢模塊分析關(guān)鍵詞,對(duì)關(guān)鍵詞進(jìn)行處理;a3.由查詢模塊查看緩存是否存在相關(guān)檢索的結(jié)果,如存在則返回搜索結(jié)果;否則把關(guān)鍵詞和索引庫進(jìn)行相關(guān)性判斷后返回搜索結(jié)果;a4.記錄返回的初次搜索結(jié)果和搜索時(shí)間。所述步驟S2,包括如下步驟bl.當(dāng)初次搜索結(jié)果顯示在用戶的使用界面上時(shí),用戶搜索行為記錄模塊啟動(dòng),開始記錄用戶的搜索行為;b2.記錄用戶點(diǎn)擊的鏈接網(wǎng)址和進(jìn)入該鏈接網(wǎng)址的時(shí)間;b3.記錄用戶返回到初次搜索結(jié)果頁面的時(shí)間從而計(jì)算出用戶在該鏈接網(wǎng)址內(nèi)的停留時(shí)間;b4.重復(fù)步驟b2_b3,直至用戶改變關(guān)鍵詞進(jìn)行下一次搜索;b5.對(duì)用戶的搜索行為進(jìn)行緩存或入庫保存。所述步驟S3和步驟S4 ;包括如下步驟Cl.記錄用戶再次搜索的時(shí)間,進(jìn)而計(jì)算出與初次搜索時(shí)間的間隔;c2.對(duì)再次搜索的關(guān)鍵詞進(jìn)行處理,得到再次搜索結(jié)果,但不返回給用戶;c3.進(jìn)行初次用戶搜索行為中點(diǎn)擊的鏈接網(wǎng)址與當(dāng)前返回結(jié)果的鏈接網(wǎng)址的重復(fù)情況計(jì)算;c4.進(jìn)行初次用戶搜索行為中返回搜索結(jié)果的鏈接網(wǎng)址與當(dāng)前返回結(jié)果的鏈接網(wǎng)址的重復(fù)情況計(jì)算;c5.綜合搜索時(shí)間間隔,和步驟c3、c4中的鏈接網(wǎng)址的重復(fù)情況,判斷兩次的搜索是否是相關(guān)主題的搜索;c6.如果是相關(guān)主題的搜索果則進(jìn)入搜索結(jié)果關(guān)聯(lián)性分析模塊進(jìn)行后續(xù)分析處理,否則將再次搜索結(jié)果返回給用戶。所述用戶搜索行為,是指在一個(gè)較短時(shí)間內(nèi),用戶利用搜索引擎進(jìn)行檢索過程中的行為。本發(fā)明的一種基于用戶行為分析的搜索結(jié)果改進(jìn)的系統(tǒng),包括第一查詢模塊,該第一查詢模塊用來接收用戶提交的初次查詢關(guān)鍵詞,對(duì)該初次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取初次搜索結(jié)果,并將該初次搜索結(jié)果顯示在用戶的使用界面上;用戶行為記錄模塊,該用戶行為記錄模塊用來記錄用戶對(duì)初次搜索結(jié)果的搜索行為,并將該搜索行為予以保存;第二查詢模塊,該第二查詢模塊用來接收用戶提交的再次查詢關(guān)鍵詞,對(duì)該再次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取再次搜索結(jié)果;搜索相關(guān)性判斷模塊,該搜索相關(guān)性判斷模塊用來對(duì)初次搜索結(jié)果和再次搜索結(jié)果是否為相同主題進(jìn)行判斷,當(dāng)判斷為是相同主題時(shí)進(jìn)行下一步驟的處理,否則,將獲取的再次搜索結(jié)果作為初次搜索結(jié)果來顯示在用戶的使用界面上;搜索結(jié)果關(guān)聯(lián)性分析模塊,該搜索結(jié)果關(guān)聯(lián)性分析模塊用來根據(jù)用戶的搜索行為,對(duì)再次搜索結(jié)果進(jìn)行處理并重新排序,以及將處理和重新排序后的搜索結(jié)果作為初次搜索結(jié)果來顯示在用戶的使用界面上。本發(fā)明的一種基于用戶行為分析的搜索結(jié)果改進(jìn)的系統(tǒng),是一個(gè)記錄分析用戶搜索行為,進(jìn)而推薦搜索結(jié)果、提升用戶搜索體驗(yàn)的個(gè)性化搜索系統(tǒng)。用戶發(fā)送關(guān)鍵詞到本系統(tǒng),系統(tǒng)對(duì)關(guān)鍵詞進(jìn)行初步處理、查詢并返回結(jié)果,在用戶對(duì)返回的查詢結(jié)果操作中系統(tǒng)記錄用戶的瀏覽行為,在用戶的第二次查詢關(guān)鍵字時(shí),系統(tǒng)判斷兩次查詢的相關(guān)聯(lián)性,如果相關(guān)聯(lián),系統(tǒng)進(jìn)入搜索結(jié)果的關(guān)聯(lián)性分析模塊,推薦更符合用戶查詢主題的搜索結(jié)果。本發(fā)明的一種基于用戶行為分析的搜索結(jié)果改進(jìn)的系統(tǒng),第一查詢模塊和第二查詢模塊可以由一個(gè)查詢模塊來替代。參見圖2所示,本發(fā)明的系統(tǒng)在工作時(shí),包括了三個(gè)流程初次檢索流程,再次檢索流程,自動(dòng)檢索流程。初始工作需要設(shè)定一個(gè)檢索過期的時(shí)間,比如一天。初次檢索流程中,用戶提交搜索關(guān)鍵詞;查詢模塊進(jìn)行關(guān)鍵詞預(yù)處理比如去除空白字符,進(jìn)行必要的分詞等;查詢模塊查看緩存是否存在相關(guān)檢索的結(jié)果,如存在則返回,否則把關(guān)鍵詞和索引庫進(jìn)行相關(guān)性判斷返回搜索結(jié)果;查詢模塊記錄返回的初次搜索結(jié)果和時(shí)間;查詢模塊并將第一次搜索結(jié)果(相當(dāng)于初次索結(jié)果)提供給用戶。當(dāng)初次的搜索結(jié)果返回給用戶后,用戶行為記錄模塊啟動(dòng),開始記錄用戶的搜索行為;記錄的用戶搜索行為包括記錄關(guān)鍵詞,記錄用戶點(diǎn)擊的鏈接URL,記錄頁面停留時(shí)間;對(duì)用戶的搜索行為進(jìn)行緩存。再次檢索流程中,用戶提交搜索關(guān)鍵詞;查詢模塊進(jìn)行關(guān)鍵詞預(yù)處理并且把關(guān)鍵詞和索引庫進(jìn)行相關(guān)性判斷得到第二次搜索結(jié)果(相當(dāng)于再次搜索結(jié)果);該第二次搜索結(jié)果暫不提供給用戶,查詢模塊記錄返回的再次搜索結(jié)果和時(shí)間;搜索相關(guān)性判斷模塊啟動(dòng),結(jié)合第一次搜索結(jié)果、第二次搜索結(jié)果和用戶搜索行為進(jìn)行二次搜索相關(guān)性判斷,當(dāng)判斷為相關(guān)時(shí)啟動(dòng)搜索結(jié)果關(guān)聯(lián)性分析模塊進(jìn)入自動(dòng)檢索流程,當(dāng)判斷為不相關(guān)時(shí),將第二次搜索結(jié)果提供給用戶,此時(shí)的第二次搜索結(jié)果是作為下一次搜索用的初次搜索結(jié)果來看待。自動(dòng)檢索流程中,搜索結(jié)果關(guān)聯(lián)性分析模塊啟動(dòng)工作,進(jìn)行搜索結(jié)果關(guān)聯(lián)性分析, 得到分析后推薦結(jié)果,并將該推薦結(jié)果提供給用戶,此時(shí)的推薦結(jié)果也是作為下一次搜索用的初次搜索結(jié)果來看待的,這樣,用戶對(duì)推薦結(jié)果的搜索行為又被用戶行為記錄模塊所記錄,當(dāng)用戶第三次輸入關(guān)鍵詞進(jìn)行搜索時(shí),推薦結(jié)果就相當(dāng)于初次搜索結(jié)果,第三次搜索結(jié)果相當(dāng)于再次搜索結(jié)果,由此進(jìn)行處理,可以實(shí)現(xiàn)多次相同主題的搜索。搜索結(jié)果關(guān)聯(lián)性分析模塊會(huì)削減搜索返回結(jié)果,由于搜索引擎返回的結(jié)果一般數(shù)量巨大,但是關(guān)聯(lián)性高的結(jié)果卻是不多,所以截取搜索返回結(jié)果中排序排名較高的記錄可以有效減少后續(xù)步驟中數(shù)據(jù)的處理量。搜索結(jié)果關(guān)聯(lián)性分析模塊會(huì)根據(jù)預(yù)設(shè)的條件,提取三類的鏈接網(wǎng)址來作為搜索結(jié)果,并根據(jù)預(yù)設(shè)的權(quán)重條件將搜索結(jié)果重新排序;其中,該三類鏈接網(wǎng)址分別為初次搜索結(jié)果所點(diǎn)中的鏈接中瀏覽時(shí)間最久的若干鏈接網(wǎng)址,初次搜索結(jié)果和再次搜索結(jié)果都匹配的若干鏈接網(wǎng)址,初次搜索結(jié)果和再次搜索結(jié)果中排序靠前的若干鏈接網(wǎng)址;也就是依據(jù)三個(gè)條件提取一個(gè)主題相關(guān)性較高的一個(gè)集合S ;集合S —般規(guī)模不大,以集合S中的記錄或記錄子集為中心點(diǎn)對(duì)截取后的搜索結(jié)果集合進(jìn)行文本的聚類;對(duì)于聚類后的靠近聚類中心即與集合S中的記錄相關(guān)度較高的記錄提供搜索返回結(jié)果相關(guān)度的權(quán)重,進(jìn)而提高其排名。本發(fā)明是利用用戶的搜索行為分析,關(guān)聯(lián)分析用戶的搜索主題,改進(jìn)搜索的返回結(jié)果,節(jié)省用戶獲取主題信息的時(shí)間,進(jìn)而改善用戶的搜索體驗(yàn)。本發(fā)明致力于搜索返回結(jié)果的改進(jìn),而非相關(guān)的搜索推薦,這是本專利與其他相似名稱專利的最大區(qū)別。用戶利用本發(fā)明的方法及其系統(tǒng),可以改變通用搜索引擎對(duì)于關(guān)鍵詞僅僅通過算法進(jìn)行相關(guān)性匹配返回固定結(jié)果的局限性。系統(tǒng)考慮了用戶的搜索行為,對(duì)于用戶的搜索主題進(jìn)行分析,可以返回更符合用戶期待的搜索結(jié)果,進(jìn)而提升用戶的搜索體驗(yàn)。本發(fā)明的方法及其系統(tǒng)尤其適用于用戶多次進(jìn)行相同主題的搜索,用戶不明確用特定的關(guān)鍵詞描述所需主題的情況下。通過多次搜索不同的關(guān)鍵詞,系統(tǒng)通過分析搜索關(guān)聯(lián)性,可以幫助用戶不斷明確用戶所需的搜索結(jié)果、提升與主題相關(guān)度高的結(jié)果的排名,提高用戶獲取信息的效率。上述實(shí)施例僅用來進(jìn)一步說明本發(fā)明的一種基于用戶行為分析的搜索結(jié)果改進(jìn)的方法及其系統(tǒng),但本發(fā)明并不局限于實(shí)施例,凡是依據(jù)本發(fā)明的技術(shù)實(shí)質(zhì)對(duì)以上實(shí)施例所作的任何簡單修改、等同變化與修飾,均落入本發(fā)明技術(shù)方案的保護(hù)范圍內(nèi)。
權(quán)利要求
1.一種基于用戶行為分析的搜索結(jié)果改進(jìn)的方法,其特征在于包括如下步驟接收用戶提交的初次查詢關(guān)鍵詞,對(duì)該初次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取初次搜索結(jié)果,并將該初次搜索結(jié)果顯示在用戶的使用界面上;記錄用戶對(duì)初次搜索結(jié)果的搜索行為,并將該搜索行為予以保存;接收用戶提交的再次查詢關(guān)鍵詞,對(duì)該再次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取再次搜索結(jié)果;對(duì)初次搜索結(jié)果和再次搜索結(jié)果是否為相同主題進(jìn)行判斷,當(dāng)判斷為是相同主題時(shí)進(jìn)行下一步驟的處理,否則,將獲取的再次搜索結(jié)果作為初次搜索結(jié)果來顯示在用戶的使用界面上;根據(jù)用戶的搜索行為,對(duì)再次搜索結(jié)果進(jìn)行處理并重新排序,以及將處理和重新排序后的搜索結(jié)果作為初次搜索結(jié)果來顯示在用戶的使用界面上。
2.根據(jù)權(quán)利要求I所述的基于用戶行為分析的搜索結(jié)果改進(jìn)的方法,其特征在于所述記錄用戶對(duì)初次搜索結(jié)果的搜索行為,是包括記錄用戶對(duì)初次搜索結(jié)果所點(diǎn)中的鏈接網(wǎng)址和用戶在進(jìn)入對(duì)應(yīng)鏈接網(wǎng)址的停留時(shí)間。
3.根據(jù)權(quán)利要求I所述的基于用戶行為分析的搜索結(jié)果改進(jìn)的方法,其特征在于所述對(duì)初次搜索結(jié)果和再次搜索結(jié)果是否為相同主題進(jìn)行判斷,是將用戶對(duì)初次搜索結(jié)果所點(diǎn)中的鏈接網(wǎng)址與再次搜索結(jié)果的鏈接網(wǎng)址的重復(fù)度進(jìn)行分析以及將初次搜索結(jié)果的鏈接網(wǎng)址與再次搜索結(jié)果的鏈接網(wǎng)址的重復(fù)度進(jìn)行分析,當(dāng)重復(fù)度達(dá)到預(yù)設(shè)的閾值時(shí),就判定為主題相同。
4.根據(jù)權(quán)利要求I所述的基于用戶行為分析的搜索結(jié)果改進(jìn)的方法,其特征在于所述對(duì)再次搜索結(jié)果進(jìn)行處理并重新排序,是根據(jù)預(yù)設(shè)的條件,提取三類的鏈接網(wǎng)址來作為搜索結(jié)果,并根據(jù)預(yù)設(shè)的權(quán)重條件將搜索結(jié)果重新排序;其中,該三類鏈接網(wǎng)址分別為初次搜索結(jié)果所點(diǎn)中的鏈接中瀏覽時(shí)間最久的若干鏈接網(wǎng)址,初次搜索結(jié)果和再次搜索結(jié)果都匹配的若干鏈接網(wǎng)址,初次搜索結(jié)果和再次搜索結(jié)果中排序靠前的若干鏈接網(wǎng)址。
5.根據(jù)權(quán)利要求I所述的基于用戶行為分析的搜索結(jié)果改進(jìn)的方法,其特征在于所述接收用戶提交的初次查詢關(guān)鍵詞,對(duì)該初次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取初次搜索結(jié)果,并將該初次搜索結(jié)果顯示在用戶的使用界面上的過程,包括如下步驟al.接收用戶提交搜索關(guān)鍵詞;a2.利用查詢模塊分析關(guān)鍵詞,對(duì)關(guān)鍵詞進(jìn)行處理;a3.由查詢模塊查看緩存是否存在相關(guān)檢索的結(jié)果,如存在則返回搜索結(jié)果;否則把關(guān)鍵詞和索引庫進(jìn)行相關(guān)性判斷后返回搜索結(jié)果; a4.記錄返回的初次搜索結(jié)果和搜索時(shí)間。
6.根據(jù)權(quán)利要求I所述的基于用戶行為分析的搜索結(jié)果改進(jìn)的方法,其特征在于 所述記錄用戶對(duì)初次搜索結(jié)果的搜索行為,并將該搜索行為予以保存的過程,包括如下步驟bl.當(dāng)初次搜索結(jié)果顯示在用戶的使用界面上時(shí),用戶搜索行為記錄模塊啟動(dòng),開始記錄用戶的搜索行為;b2.記錄用戶點(diǎn)擊的鏈接網(wǎng)址和進(jìn)入該鏈接網(wǎng)址的時(shí)間;b3.記錄用戶返回到初次搜索結(jié)果頁面的時(shí)間從而計(jì)算出用戶在該鏈接網(wǎng)址內(nèi)的停留時(shí)間;b4.重復(fù)步驟b2-b3,直至用戶改變關(guān)鍵詞進(jìn)行下一次搜索; b5.對(duì)用戶的搜索行為進(jìn)行緩存或入庫保存。
7.根據(jù)權(quán)利要求I所述的基于用戶行為分析的搜索結(jié)果改進(jìn)的方法,其特征在于所述接收用戶提交的再次查詢關(guān)鍵詞,對(duì)該再次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取再次搜索結(jié)果的過程;以及對(duì)初次搜索結(jié)果和再次搜索結(jié)果是否為相同主題進(jìn)行判斷,當(dāng)判斷為是相同主題時(shí)進(jìn)行下一步驟的處理,否則,將獲取的再次搜索結(jié)果作為初次搜索結(jié)果來顯示在用戶的使用界面上的過程;包括如下步驟Cl.記錄用戶再次搜索的時(shí)間,進(jìn)而計(jì)算出與初次搜索時(shí)間的間隔; c2.對(duì)再次搜索的關(guān)鍵詞進(jìn)行處理,得到再次搜索結(jié)果,但不返回給用戶; c3.進(jìn)行初次用戶搜索行為中點(diǎn)擊的鏈接網(wǎng)址與當(dāng)前返回結(jié)果的鏈接網(wǎng)址的重復(fù)情況計(jì)算;c4.進(jìn)行初次用戶搜索行為中返回搜索結(jié)果的鏈接網(wǎng)址與當(dāng)前返回結(jié)果的鏈接網(wǎng)址的重復(fù)情況計(jì)算;c5.綜合搜索時(shí)間間隔,和步驟c3、c4中的鏈接網(wǎng)址的重復(fù)情況,判斷兩次的搜索是否是相關(guān)主題的搜索;c6.如果是相關(guān)主題的搜索果則進(jìn)入搜索結(jié)果關(guān)聯(lián)性分析模塊進(jìn)行后續(xù)分析處理,否則將再次搜索結(jié)果返回給用戶。
8.一種基于用戶行為分析的搜索結(jié)果改進(jìn)的系統(tǒng),包括第一查詢模塊,該第一查詢模塊用來接收用戶提交的初次查詢關(guān)鍵詞,對(duì)該初次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取初次搜索結(jié)果,并將該初次搜索結(jié)果顯示在用戶的使用界面上;用戶行為記錄模塊,該用戶行為記錄模塊用來記錄用戶對(duì)初次搜索結(jié)果的搜索行為, 并將該搜索行為予以保存;第二查詢模塊,該第二查詢模塊用來接收用戶提交的再次查詢關(guān)鍵詞,對(duì)該再次查詢關(guān)鍵詞進(jìn)行處理,利用關(guān)鍵詞與索引庫的匹配關(guān)系獲取再次搜索結(jié)果;搜索相關(guān)性判斷模塊,該搜索相關(guān)性判斷模塊用來對(duì)初次搜索結(jié)果和再次搜索結(jié)果是否為相同主題進(jìn)行判斷,當(dāng)判斷為是相同主題時(shí)進(jìn)行下一步驟的處理,否則,將獲取的再次搜索結(jié)果作為初次搜索結(jié)果來顯示在用戶的使用界面上;搜索結(jié)果關(guān)聯(lián)性分析模塊,該搜索結(jié)果關(guān)聯(lián)性分析模塊用來根據(jù)用戶的搜索行為,對(duì)再次搜索結(jié)果進(jìn)行處理并重新排序,以及將處理和重新排序后的搜索結(jié)果作為初次搜索結(jié)果來顯示在用戶的使用界面上。
全文摘要
本發(fā)明公開了一種基于用戶行為分析的搜索結(jié)果改進(jìn)的方法及其系統(tǒng),是在用戶的初次查詢過程中記錄用戶對(duì)初次搜索結(jié)果的搜索行為,而在再次查詢過程中,先不將獲取的再次搜索結(jié)果提供給用戶,而是首先判斷前后兩次查詢是否為相同主題,當(dāng)判斷為不是相同主題時(shí)則將再次查詢過程獲取的再次搜索結(jié)果提供給用戶,當(dāng)判斷為是相同主題時(shí)則根據(jù)用戶的搜索行為,對(duì)再次搜索結(jié)果進(jìn)行處理并重新排序,并將處理和重新排序后的搜索結(jié)果提供給用戶。該方法及其系統(tǒng),通過對(duì)用戶的搜索行為進(jìn)行分析處理,判斷用戶相鄰的兩次搜索之間的關(guān)聯(lián)性,進(jìn)而導(dǎo)出主題相關(guān)性高的搜索結(jié)果,達(dá)到節(jié)省人力、提高搜索結(jié)果相關(guān)性進(jìn)而提升用戶的搜索體驗(yàn)的目的。
文檔編號(hào)G06F17/30GK102591948SQ20111044547
公開日2012年7月18日 申請(qǐng)日期2011年12月27日 優(yōu)先權(quán)日2011年12月27日
發(fā)明者吳鴻偉, 章正道, 胡海斌 申請(qǐng)人:廈門市美亞柏科信息股份有限公司