亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于用戶行為反饋的關鍵詞推薦方法和系統(tǒng)的制作方法

文檔序號:10471127閱讀:717來源:國知局
基于用戶行為反饋的關鍵詞推薦方法和系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種基于用戶行為反饋的關鍵詞推薦方法和系統(tǒng),屬于電子商務技術領域。該方法包括步驟獲取用戶搜索的關鍵詞并對所述關鍵詞進行預處理;記錄針對所述關鍵詞搜索結果的用戶行為;解析所述用戶行為頁面的標簽,為所述關鍵詞添加標簽;為具有相同標簽的關鍵詞分類,在后續(xù)搜索中按照分類推薦備選關鍵詞。本發(fā)明的技術方案通過記錄并解析用戶行為,為關鍵詞添加適當?shù)臉撕瀬頂U展單一關鍵詞的搜索范圍,由于充分利用了用戶行為進行反饋,可以及時適應關鍵詞的衍生含義,準確把握搜索熱點,此外還降低了人工維護更新詞庫的成本。
【專利說明】
基于用戶行為反饋的關鍵詞推薦方法和系統(tǒng)
技術領域
[0001] 本發(fā)明涉及電子商務搜索引擎技術領域,特別涉及一種基于用戶行為反饋的關鍵 詞推薦方法和系統(tǒng)。
【背景技術】
[0002] 現(xiàn)有技術中,網絡搜索的擴展多從語義分析處理方面進行優(yōu)化,目前很多網站在 關于相關搜索詞計算方面主要考慮詞和詞之間的支持度。現(xiàn)有方案雖然可W盡量獲得更多 的相關搜索結果,但單純的語義擴展只考慮了即成的文字聯(lián)系,會導致推薦出來的搜索詞 過于死板,缺乏對新產品和新概念的實時理解,很難適應快速變化的流行趨勢和網絡熱點; 如果依賴人工對擴展詞進行定期維護的話又會增加成本。

【發(fā)明內容】

[0003] 針對現(xiàn)有技術的上述缺陷,本發(fā)明所要解決的技術問題是如何動態(tài)擴展關鍵詞的 搜索范圍。
[0004] 為實現(xiàn)上述目的,一方面,本發(fā)明提供一種基于用戶行為反饋的關鍵詞推薦方法, 該方法包括步驟:
[0005] 獲取用戶搜索的關鍵詞并對所述關鍵詞進行預處理;
[0006] 記錄針對所述關鍵詞搜索結果的用戶行為;
[0007] 解析所述用戶行為頁面的標簽,為所述關鍵詞添加標簽;
[0008] 為具有相同標簽的關鍵詞分類,在后續(xù)搜索中按照分類推薦備選關鍵詞。
[0009] 優(yōu)選地,所述方法中,將頁面搜索信息表中的關鍵詞獲取為所述用戶搜索的關鍵 詞。
[0010] 優(yōu)選地,所述預處理包括詞語規(guī)整、去除特殊字符、字符統(tǒng)一轉換、拼寫糾正、截 取、拼音轉漢字、中英文互換中的至少一種處理。
[0011] 優(yōu)選地,為所述關鍵詞添加標簽還包括步驟:
[0012] 根據(jù)關鍵詞的標簽按照預定的規(guī)則進行合并組成W修正關鍵詞。
[0013] 優(yōu)選地,所述按照分類推薦備選關鍵詞還包括:
[0014] 若同一分類中有多個備選關鍵詞,將其全部推薦給用戶、或將備選關鍵詞按排序 后的順序優(yōu)選推薦。
[0015] 另一方面,本發(fā)明還提供一種基于用戶行為反饋的關鍵詞推薦系統(tǒng),包括:
[0016] 預處理模塊,用于獲取用戶搜索的關鍵詞并對所述關鍵詞進行預處理;
[0017] 行為記錄模塊,用于記錄針對所述關鍵詞搜索結果的用戶行為;
[0018] 解析模塊,用于解析所述用戶行為頁面的標簽,為所述關鍵詞添加標簽;
[0019] 分類推薦模塊,用于為具有相同標簽的關鍵詞分類,在后續(xù)搜索中按照分類推薦 備選關鍵詞。
[0020] 優(yōu)選地,所述預處理模塊中還包括:獲取模塊,用于將頁面搜索信息表中的關鍵詞 獲取為所述用戶搜索的關鍵詞。
[0021] 優(yōu)選地,所述預處理包括詞語規(guī)整、去除特殊字符、字符統(tǒng)一轉換、拼寫糾正、截 取、拼音轉漢字、中英文互換中的至少一種處理。
[0022] 優(yōu)選地,所述解析模塊還包括:關鍵詞修正模塊,用于根據(jù)關鍵詞的標簽按照預定 的規(guī)則進行合并組成W修正關鍵詞。
[0023] 優(yōu)選地,所述分類推薦模塊中還包括:備選詞篩選模塊,用于在同一分類中有多個 備選關鍵詞時,將全部備選關鍵詞推薦給用戶、或將備選關鍵詞按排序后的順序優(yōu)選推薦。
[0024] 本發(fā)明的技術方案通過記錄并解析用戶行為,為關鍵詞添加適當?shù)臉撕瀬頂U展單 一關鍵詞的搜索范圍,由于充分利用了用戶行為進行反饋,可W及時適應關鍵詞的衍生含 義,準確把握搜索熱點,此外還降低了人工維護更新詞庫的成本。
【附圖說明】
[00巧]圖1是本發(fā)明一個實施例中的基于用戶行為反饋的關鍵詞推薦方法的流程示意 圖;
[0026] 圖2是本發(fā)明另一個實施例中的基于用戶行為反饋的關鍵詞推薦系統(tǒng)的結構示 意圖。
【具體實施方式】
[0027] 下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完 整地描述。顯然,所描述的實施例為實施本發(fā)明的較佳實施方式,所述描述是W說明本發(fā)明 的一般原則為目的,并非用W限定本發(fā)明的范圍。本發(fā)明的保護范圍應當W權利要求所界 定者為準,基于本發(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動的前提下 所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0028] 現(xiàn)有的語義擴展僅考慮了詞義之間的聯(lián)系,為進一步體現(xiàn)搜索詞實際代表的含 義,本發(fā)明中利用用戶行為進行反饋,為搜索詞或搜索詞的組合添加對應標簽,從而準確識 別搜索詞所表達的隱藏含義,為后續(xù)搜索推薦滿足用戶需求的結果。其中,圖1是本發(fā)明一 個實施例中的基于用戶行為反饋的關鍵詞推薦方法的流程示意圖,如圖1所示,該方法包 括步驟:
[0029] S1、獲取用戶搜索的關鍵詞并對所述關鍵詞進行預處理;
[0030] S2、記錄針對所述關鍵詞搜索結果的用戶行為;
[0031] S3、解析所述用戶行為頁面的標簽,為所述關鍵詞添加標簽;
[0032] S4、為具有相同標簽的關鍵詞分類,在后續(xù)搜索中按照分類推薦備選關鍵詞。
[0033] 其中,獲取用戶搜索的關鍵詞一般是將頁面搜索信息表中的關鍵詞作為搜索關鍵 詞。
[0034] 對關鍵詞進行的預處理包括但不限于詞語規(guī)整、去除特殊字符、字符統(tǒng)一轉換、拼 寫糾正、截取、拼音轉漢字、中英文互換等;W下僅作為示例說明常用的預處理形式,不應視 作對本發(fā)明的具體限制:
[0035] (1)去掉僅由符號、數(shù)字、字母Η者組成的關鍵詞記錄;
[0036] 似去掉僅由符號組成的關鍵詞記錄;
[0037] (3)去掉僅由空格或回車符組成的關鍵詞記錄;
[0038] (4)去掉關鍵詞首尾的空格,關鍵詞內部空格保留一個;
[0039] (5)關鍵詞中的全角字符均轉換為半角字符;
[0040] (6)對于關鍵詞首末含$%'&*()'~! + = {}':〇??!? § ;,,\\[\\].<〉/?~! @(_)八 ¥% ……&*〇 --+1 {}【】';;""'。,、? ' "Θ 0 J ^-1--L ' □ ' * δ #$--_及回車符等特殊字符的,去掉送些特殊字符;
[0041] (7)關鍵詞中的小寫字母統(tǒng)一用大寫字母代替;
[0042] (8)僅保留關鍵詞長度為2-20個字符的關鍵詞;
[0043] (9)將漢語拼音轉化為漢字;如關鍵詞"shouji"轉化為"手機";"sanxing"轉換 為"H星"。
[0044] 用戶行為主要指用戶對搜索結果頁面的訪問行為,包括鼠標停留查看、點擊鏈接 W及對鏈接頁面中元素的進一步操作等動作。根據(jù)用戶對關鍵詞搜索結果的具體訪問行 為,解析行為對應的頁面元素屬性W提取為該關鍵詞的標簽。
[0045] 優(yōu)選地,本發(fā)明W電商搜索為例,搜索結果包括多個商品,用戶行為包括查看摘要 圖、調整數(shù)量、加入購物車、直接購買、篩選、對比、點擊鏈接、和/或對鏈接頁面中的進一步 操作。在該優(yōu)選實施例中,行為對應的頁面元素屬性主要指商品屬性,根據(jù)用戶行為操作的 對象在頁面中找到商品名、目錄(分類或品類)、品牌、廠商及型號等屬性信息作為標簽。上 述標簽既可W是系統(tǒng)本身為商品頁面添加的分類標簽,也可W是提取頁面信息后自動挖掘 歸類的標簽。
[0046] 具體地,為關鍵詞添加標簽包括打上或更新標簽等不同處理。根據(jù)關鍵詞本身與 解析得到的詞類別、相似商品目錄、相似品牌和相似型號/廠商能否匹配,找出關鍵詞自身 的商品目錄、品牌和型號/廠商屬性值,同時判斷關鍵詞自身的商品目錄、品牌和型號/廠 商屬性值是否為空,若為空則為關鍵詞打上得到的標簽,若不為空則對關鍵詞標簽進行更 新。詞標簽格式一般為調類別_品牌_型號_商品目錄;標簽添加規(guī)則;W詞類別開頭, 對品牌、型號/廠商、商品目錄進行組合,詞類別_品牌_廠商_商品目錄,"連接構成 詞標簽。
[0047] 比如,詞標簽主要包含:
[0048]
[0049]
[0050] 在本發(fā)明的優(yōu)選實施例中,還將關鍵詞的標簽,比如品牌、型號、商品目錄等屬性 按照一定的規(guī)則進行合并組成W修正關鍵詞。修正后的關鍵詞由品牌、型號、商品目錄等屬 性按順序合并構成。當關鍵詞的品牌、型號和商品目錄都存在的情況下,修正后關鍵詞的構 成依次為品牌、商品目錄和型號。其他情況下,修正后的關鍵詞按照品牌、型號、商品目錄的 順序進行重組。如,關鍵詞"手機Η星"應調整為"H星手機";"手機N0TE3"調整為"NOTES 手機"。
[0051] 隨后,將具有相同標簽的關鍵詞進行分類,W便在后續(xù)搜索時,在一定的推薦規(guī)則 下,優(yōu)先推薦同一類的關鍵詞。
[0052] W下是本發(fā)明的一個優(yōu)選實施例中用戶分別W "H星"和"海爾手機"為關鍵詞進 行搜索時的反饋和推薦過程,示例的詳細流程為:
[005引用"立星"進行搜索;
[0054] 用戶點擊了搜索結果中的部分頁面,其中一個頁面包含"……Η星……手機…… 優(yōu)惠……",標簽解析模塊解析后,系統(tǒng)為關鍵詞"Η星"打上標簽"品牌+類型";另一個頁 面中包含"……Η星手機Note2……",標簽解析模塊解析后,系統(tǒng)為關鍵詞"H星"打上標 簽"品牌+類型+型號";將關鍵詞"H星"及相應標簽保存于數(shù)據(jù)庫中;
[00巧]用"海爾手機"進行搜索;
[0056] 用戶點擊了搜索結果中的部分頁面,其中一個頁面包含"……海爾……手機……0 元購機……",標簽解析模塊解析后,系統(tǒng)為關鍵詞"海爾手機"打上標簽"品牌+類型";另 一個頁面中包含"……海爾手機5220……",標簽解析模塊解析后,系統(tǒng)為關鍵詞"海爾手 機"打上標簽"品牌+類型+型號";將關鍵詞"海爾手機"及相應標簽保存于數(shù)據(jù)庫中;
[0057] 系統(tǒng)對"H星"的標簽和"海爾手機"的標簽進行比對,發(fā)現(xiàn)關鍵詞"H星"和"海 爾手機"的標簽完全一致;將兩關鍵詞分為一類;
[0058] 在下一次搜索"海爾手機"時,系統(tǒng)將優(yōu)先推薦"H星"作為備選關鍵詞。
[0059] 優(yōu)選地,若同一類中有多個備選關鍵詞,可全部推薦給用戶或將備選關鍵詞按排 序后的順序優(yōu)選推薦。排序可基于各種預定或自選規(guī)則進行,比如關鍵詞間的潛在相關度, 或按照關鍵詞的搜索次數(shù)、點擊量,或按關鍵詞相關商品的關注度、銷量、好評度等等信息 單獨或綜合排序。
[0060] 本領域相關技術人員應能理解,與本發(fā)明的方法相對應的,本發(fā)明還同時包括一 種基于用戶行為反饋的關鍵詞推薦系統(tǒng),與上述方法步驟一一對應,如圖2所示,該系統(tǒng)包 括:
[0061] 預處理模塊201,用于獲取用戶搜索的關鍵詞并對所述關鍵詞進行預處理;
[0062] 行為記錄模塊202,用于記錄針對所述關鍵詞搜索結果的用戶行為;
[0063] 解析模塊203,用于解析所述用戶行為頁面的標簽,為所述關鍵詞添加標簽;
[0064] 分類推薦模塊204,用于為具有相同標簽的關鍵詞分類,在后續(xù)搜索中按照分類推 薦備選關鍵詞。
[0065] 相應地,上述方法實施例中的各具體步驟在系統(tǒng)中同樣存在對應的處理模塊,各 模塊主要基于執(zhí)行的步驟和/或實現(xiàn)的功能進行劃分,在此不再一一賞述。
[0066] 本發(fā)明的技術方案通過記錄并解析用戶行為,為關鍵詞添加適當?shù)臉撕瀬頂U展單 一關鍵詞的搜索范圍,由于充分利用了用戶行為進行反饋,可W及時適應關鍵詞的衍生含 義,準確把握搜索熱點,此外還降低了人工維護更新詞庫的成本。
[0067] 可W理解的是,W上實施方式僅僅是為了說明本發(fā)明的原理而采用的示例性實施 方式,然而本發(fā)明并不局限于此。對于本領域內的普通技術人員而言,在不脫離本發(fā)明的精 神和實質的情況下,可W做出各種變型和改進,送些變型和改進也視為本發(fā)明的保護范圍。
【主權項】
1. 一種基于用戶行為反饋的關鍵詞推薦方法,其特征在于,所述方法包括步驟: 獲取用戶搜索的關鍵詞并對所述關鍵詞進行預處理; 記錄針對所述關鍵詞搜索結果的用戶行為; 解析所述用戶行為頁面的標簽,為所述關鍵詞添加標簽; 為具有相同標簽的關鍵詞分類,在后續(xù)搜索中按照分類推薦備選關鍵詞。2. 根據(jù)權利要求1所述的方法,其特征在于,將頁面搜索信息表中的關鍵詞獲取為所 述用戶搜索的關鍵詞。3. 根據(jù)權利要求1所述的方法,其特征在于,所述預處理包括詞語規(guī)整、去除特殊字 符、字符統(tǒng)一轉換、拼寫糾正、截取、拼音轉漢字、中英文互換中的至少一種處理。4. 根據(jù)權利要求1所述的方法,其特征在于,為所述關鍵詞添加標簽還包括步驟: 根據(jù)關鍵詞的標簽按照預定的規(guī)則進行合并組成以修正關鍵詞。5. 根據(jù)權利要求1所述的方法,其特征在于,所述按照分類推薦備選關鍵詞還包括: 若同一分類中有多個備選關鍵詞,將其全部推薦給用戶、或將備選關鍵詞按排序后的 順序優(yōu)選推薦。6. -種基于用戶行為反饋的關鍵詞推薦系統(tǒng),其特征在于,所述系統(tǒng)包括: 預處理模塊,用于獲取用戶搜索的關鍵詞并對所述關鍵詞進行預處理; 行為記錄模塊,用于記錄針對所述關鍵詞搜索結果的用戶行為; 解析模塊,用于解析所述用戶行為頁面的標簽,為所述關鍵詞添加標簽; 分類推薦模塊,用于為具有相同標簽的關鍵詞分類,在后續(xù)搜索中按照分類推薦備選 關鍵詞。7. 根據(jù)權利要求6所述的系統(tǒng),其特征在于,所述預處理模塊中還包括:獲取模塊,用 于將頁面搜索信息表中的關鍵詞獲取為所述用戶搜索的關鍵詞。8. 根據(jù)權利要求6所述的系統(tǒng),其特征在于,所述預處理包括詞語規(guī)整、去除特殊字 符、字符統(tǒng)一轉換、拼寫糾正、截取、拼音轉漢字、中英文互換中的至少一種處理。9. 根據(jù)權利要求6所述的系統(tǒng),其特征在于,所述解析模塊還包括:關鍵詞修正模塊, 用于根據(jù)關鍵詞的標簽按照預定的規(guī)則進行合并組成以修正關鍵詞。10. 根據(jù)權利要求6所述的系統(tǒng),其特征在于,所述分類推薦模塊中還包括:備選詞篩 選模塊,用于在同一分類中有多個備選關鍵詞時,將全部備選關鍵詞推薦給用戶、或將備選 關鍵詞按排序后的順序優(yōu)選推薦。
【文檔編號】G06F17/30GK105824833SQ201510005745
【公開日】2016年8月3日
【申請日】2015年1月7日
【發(fā)明人】沈海旺, 張偵, 曾敏銳
【申請人】蘇寧云商集團股份有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1