亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種識別消費意圖的方法及裝置與流程

文檔序號:11780333閱讀:253來源:國知局
一種識別消費意圖的方法及裝置與流程
一種識別消費意圖的方法及裝置【技術領域】本發(fā)明涉及計算機應用技術領域,特別涉及一種識別消費意圖的方法及裝置。

背景技術:
隨著網絡技術的迅速發(fā)展和逐漸普及,出現了通過網絡進行購物、交易、推廣等電子商務新模式,電子商務憑借其低成本、高效率的優(yōu)勢迅速發(fā)展。另外,隨著人們物質文化生活水平的日益提高,消費需求也呈現出多樣化、多層次,并由低層次向高層次逐步發(fā)展,消費領域不斷擴展,消費內容日益豐富的趨勢。對于用戶消費需求的識別很大程度上影響了諸如商品、推廣等信息投放的準確性,其中消費意圖是很重要的一個因素。例如,對于一個意圖購買手機的用戶,向其推薦手機相關的商品購買信息、比價信息、對比評測信息等是滿足用戶需求的,但對于一個已經購買了手機的用戶,再向其推薦手機相關的商品購買信息、比價信息、對比評測信息等則不再適宜,此時用戶需求的是使用心得信息、相關周邊商品信息、售后信息等信息。但目前尚沒有較優(yōu)的針對用戶意圖識別的相關技術。

技術實現要素:
有鑒于此,本發(fā)明提供了一種識別消費意圖的方法及裝置,用以用戶消費意圖識別,有助于針對用戶進行更準確的信息投放。具體技術方案如下:一種識別消費意圖的方法,該方法包括:建立消費意圖識別模型的過程:S11、從各用戶的歷史行為日志中篩選出設定消費領域的相關行為日志;S12、基于對篩選出的相關行為日志進行的行為模式分析,確定對應購買前行為的行為日志和對應購買后行為的行為日志;S13、從步驟S12確定的行為日志中選擇滿足訓練數據篩選條件的行為日志作為訓練樣本;S14、從訓練樣本中提取特征訓練分類模型,得到能夠識別出購買前行為和購買后行為的所述設定消費領域對應的消費意圖識別模型;識別消費意圖的過程:S21、確定待識別用戶的消費領域;S22、利用確定出的消費領域對應的消費意圖識別模型,對近一段時間內所述待識別用戶在所述確定出的消費領域的相關行為日志進行分類,得到待識別用戶的消費意圖是購買前或購買后。根據本發(fā)明一優(yōu)選實施方式,所述步驟S11具體包括:將各用戶的歷史行為日志分別與所述設定消費領域對應的n個關鍵詞列表相匹配,篩選出同時包含所述n個關鍵詞列表中關鍵詞的行為日志,所述n為正整數;或者,將各用戶的歷史行為日志分別與所述設定消費領域對應的表達模板相匹配,篩選出與所述表達模板匹配的行為日志。根據本發(fā)明一優(yōu)選實施方式,所述步驟S12中對篩選出的相關行為日志進行的行為模式分析為:人工對篩選出的相關行為日志進行行為模式分析;或者,根據相關行為日志中包含的預示消費意圖的關鍵詞進行行為模式的分析,所述預示消費意圖的關鍵詞包括預示購買前意圖的關鍵詞或預示購買后意圖的關鍵詞。根據本發(fā)明一優(yōu)選實施方式,所述訓練數據篩選條件包括以下條件中的一種或任意組合:用戶的行為日志包含的日志數量大于或等于預設數量閾值;行為日志所包含的預示消費意圖的關鍵詞占比大于或等于預設比例閾值,所述預示消費意圖的關鍵詞為預示購買前意圖的關鍵詞或預示購買后意圖的關鍵詞;行為日志中出現最多的品牌的出現次數占該行為日志中所有品牌的出現次數的比例超過預設比例閾值。根據本發(fā)明一優(yōu)選實施方式,所述預示消費意圖的關鍵詞采用如下方式挖掘:A1、針對所述設定消費領域確定預示消費意圖的種子詞;A2、利用所述種子詞對所述設定消費領域的樣本日志進行分類,得到購買前樣本日志和購買后樣本日志;A3、分別對購買前樣本日志和購買后樣本日志進行分詞和無用詞的過濾后,統(tǒng)計各詞語的詞頻;A4、基于各詞語分別在購買前樣本日志和購買后樣本日志中的詞頻,確定預示購買前意圖的關鍵詞和預示購買后意圖的關鍵詞。根據本發(fā)明一優(yōu)選實施方式,在所述步驟S14中從訓練樣本中提取的特征至少包括但不限于以下特征中的一種或任意組合:日志數量;出現次數最多的品牌所占的日志數量;出現次數次多的品牌所占的日志數量;出現次數最多的型號所占的日志數量;出現次數次多的型號所占的日志數量;預示消費意圖的關鍵詞占比;預示消費意圖的關鍵詞的出現位置;有query的日志占比;query中包含的預示用戶意圖的關鍵詞占比;日志跨越時長;同一品牌所占日志的最大跨越時長;同一型號所占日志的最大跨越時長。根據本發(fā)明一優(yōu)選實施方式,所述步驟S13具體包括:從步驟S12確定的行為日志中選擇分別滿足N組訓練數據篩選條件的N個行為日志集合;所述步驟S14具體包括:將每一個行為日志集合分別作為一組訓練樣本訓練分類模型,得到N個候選模型,從所述N個候選模型中選擇最優(yōu)的一個作為所述設定消費領域對應的消費意圖識別模型。根據本發(fā)明一優(yōu)選實施方式,所述最優(yōu)的一個為:所述N個候選模型中滿足預設召回率要求且準確率最高的一個。根據本發(fā)明一優(yōu)選實施方式,在所述步驟S22之后,還包括:S23、按照所述待識別用戶的消費意圖對應的展示策略向所述待識別用戶展示信息。根據本發(fā)明一優(yōu)選實施方式,所述步驟S23具體包括:按照所述待識別用戶的消費意圖,向所述待識別用戶展示與所述待識別用戶的消費意圖對應類型的推廣信息;或者,在向所述待識別用戶展示的搜索結果中,將所述待識別用戶的消費意圖對應的信息在搜索結果中的排序提前。一種識別消費意圖的裝置,該裝置包括建模單元和識別單元;所述建模單元包括:第一篩選子單元,用于從各用戶的歷史行為日志中篩選出設定消費領域的相關行為日志;模式分析子單元,用于基于對篩選出的相關行為日志進行的行為模式分析,確定對應購買前行為的行為日志和對應購買后行為的行為日志;第二篩選子單元,用于從所述模式分析子單元確定的行為日志中選擇滿足訓練數據篩選條件的行為日志作為訓練樣本;模型訓練子單元,用于從訓練樣本中提取特征訓練分類模型,得到能夠識別出購買前行為和購買后行為的所述設定消費領域對應的消費意圖識別模型;所述識別單元包括:領域確定子單元,用于確定待識別用戶的消費領域;模型分類子單元,用于利用所述領域確定子單元確定出的消費領域對應的消費意圖識別模型,對近一段時間內所述待識別用戶在所述確定出的消費領域的相關行為日志進行分類,得到待識別用戶的消費意圖是購買前或購買后。根據本發(fā)明一優(yōu)選實施方式,所述第一篩選子單元具體執(zhí)行:將各用戶的歷史行為日志分別與所述設定消費領域對應的n個關鍵詞列表相匹配,篩選出同時包含所述n個關鍵詞列表中關鍵詞的行為日志,所述n為正整數;或者,將各用戶的歷史行為日志分別與所述設定消費領域對應的表達模板相匹配,篩選出與所述表達模板匹配的行為日志。根據本發(fā)明一優(yōu)選實施方式,所述模式分析子單元基于人工對篩選出的相關行為日志進行的行為模式分析,或者,根據相關行為日志中包含的預示消費意圖的關鍵詞進行行為模式的分析,所述預示消費意圖的關鍵詞包括預示購買前意圖的關鍵詞或預示購買后意圖的關鍵詞。根據本發(fā)明一優(yōu)選實施方式,所述訓練數據篩選條件包括以下條件中的一種或任意組合:用戶的行為日志包含的日志數量大于或等于預設數量閾值;行為日志所包含的預示消費意圖的關鍵詞占比大于或等于預設比例閾值,所述預示消費意圖的關鍵詞為預示購買前意圖的關鍵詞或預示購買后意圖的關鍵詞;行為日志中出現最多的品牌的出現次數占該行為日志中所有品牌的出現次數的比例超過預設比例閾值。根據本發(fā)明一優(yōu)選實施方式,所述建模單元還包括意圖關鍵詞挖掘子單元,用于按照以下方式挖掘所述預示消費意圖的關鍵詞:A1、針對所述設定消費領域確定預示消費意圖的種子詞;A2、利用所述種子詞對所述設定消費領域的樣本日志進行分類,得到購買前樣本日志和購買后樣本日志;A3、分別對購買前樣本日志和購買后樣本日志進行分詞和無用詞的過濾后,統(tǒng)計各詞語的詞頻;A4、基于各詞語分別在購買前樣本日志和購買后樣本日志中的詞頻,確定預示購買前意圖的關鍵詞和預示購買后意圖的關鍵詞。根據本發(fā)明一優(yōu)選實施方式,所述模型訓練子單元在訓練分類模型時從訓練樣本中提取的特征以及所述模型分類子單元在利用消費意圖識別模型進行分類時從所述待識別用戶在所述確定出的消費領域的相關行為日志中提取的特征至少包括但不限于以下特征中的一種或任意組合:日志數量;出現次數最多的品牌所占的日志數量;出現次數次多的品牌所占的日志數量;出現次數最多的型號所占的日志數量;出現次數次多的型號所占的日志數量;預示消費意圖的關鍵詞占比;預示消費意圖的關鍵詞的出現位置;有query的日志占比;query中包含的預示用戶意圖的關鍵詞占比;日志跨越時長;同一品牌所占日志的最大跨越時長;同一型號所占日志的最大跨越時長。根據本發(fā)明一優(yōu)選實施方式,所述第二篩選子單元從所述模式分析子單元確定的行為日志中選擇分別滿足N組訓練數據篩選條件的N個行為日志集合;所述模型訓練子單元將每一個行為日志集合分別作為一組訓練樣本訓練分類模型,得到N個候選模型,從所述N個候選模型中選擇最優(yōu)的一個作為所述設定消費領域對應的消費意圖識別模型。根據本發(fā)明一優(yōu)選實施方式,所述最優(yōu)的一個為:所述N個候選模型中滿 足預設召回率要求且準確率最高的一個。根據本發(fā)明一優(yōu)選實施方式,所述識別單元還包括:信息展示子單元,用于按照所述待識別用戶的消費意圖對應的展示策略向所述待識別用戶展示信息。根據本發(fā)明一優(yōu)選實施方式,所述信息展示子單元具體執(zhí)行:按照所述待識別用戶的消費意圖,向所述待識別用戶展示與所述待識別用戶的消費意圖對應類型的推廣信息;或者,在向所述待識別用戶展示的搜索結果中,將所述待識別用戶的消費意圖對應的信息在搜索結果中的排序提前。由以上技術方案可以看出,本發(fā)明能夠利用用戶歷史行為日志進行消費意圖模型的建立,并利用建立的消費意圖模型進行用戶消費意圖的識別,即識別出用戶是購買前意圖還是購買后意圖,從而有助于針對用戶進行更準確的信息投放?!靖綀D說明】圖1為本發(fā)明實施例一提供的建立消費意圖識別模型的方法流程圖;圖2為本發(fā)明實施例一提供的預示消費意圖的關鍵詞的挖掘方法流程圖;圖3為本發(fā)明實施例二提供的識別消費意圖的方法流程圖;圖4為本發(fā)明實施例三提供的識別消費意圖的裝置結構圖?!揪唧w實施方式】為了使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面結合附圖和具體實施例對本發(fā)明進行詳細描述。本發(fā)明通過對用戶歷史行為日志進行分析從而實現消費意圖的識別,主要分為兩部分過程:其一是通過對大量用戶歷史行為日志進行分析建立消費意圖識別模型的過程;其二是利用消費意圖識別模型對用戶進行消費意圖識 別的過程。下面分別通過實施例一和實施例二對上述兩個過程進行描述。實施例一、圖1為本發(fā)明實施例一提供的建立消費意圖識別模型的方法流程圖,本發(fā)明實施例中建立的消費意圖識別模型是分別針對各個不同消費領域的,每個消費領域有其對應的消費意圖識別模型,例如數碼消費品領域的消費意圖識別模型、家電領域的消費意圖識別模型、房產領域的消費意圖識別模型、汽車領域的消費意圖識別模型、化妝品領域的消費意圖識別模型等等。本實施例描述了其中一種消費領域的消費識別模型建立方法,如圖1所示,該方法包括以下步驟:步驟101:從各用戶的歷史行為日志中篩選出設定消費領域的相關行為日志。本步驟實際上是從大量用戶的歷史行為日志中篩選出設定消費領域相關的行為日志,從而作為該消費領域后續(xù)消費識別模型建立所需要的數據源。例如,要建立數碼消費品領域的消費意圖識別模型時,需要從各用戶的歷史行為日志中篩選出數碼消費品領域的相關行為日志。為了保證用戶消費意圖識別模型的實時性效果,通常本步驟的篩選來源是最近設定時間段內各用戶的行為日志,例如最近一周內用戶的行為日志。篩選的方式可以采用但不限于以下方式中的一種或組合:基于關鍵詞匹配的方式,以及基于模板匹配的方式。基于關鍵詞匹配的方式是,預先挖掘出設定消費領域對應的關鍵詞列表,將各行為日志分別與設定消費領域對應的關鍵詞列表相匹配,篩選出包含關鍵詞列表中的關鍵詞的行為日志。這里關鍵詞列表可以是一個或多個,可以篩選出包含任一個關鍵詞列表中的關鍵詞的行為日志,或者篩選出同時包含若干個關鍵詞列表中的關鍵詞的行為日志。以數碼消費品領域為例,預先挖掘出數碼消費品領域對應的商品型號列表,例如“諾基亞5233”、“HTCDesire”、“Nexus7”、“ipad2”等等,在執(zhí)行本步驟進行日志篩選時,加載該商品型號列表,篩選出包含該商品型 號列表中的關鍵詞的行為日志,例如某日志中包含“諾基亞5233”,則將該日志篩選出來。這是一種情況,還有一種情況:預先挖掘出數碼消費品領域對應的品牌列表和商品類型列表,品牌列表中例如包含“聯想”、“蘋果”、“三星”、“諾基亞”等等,商品類型列表中包含“筆記本”、“手機”、“平板電腦”、“相機”等等,篩選出同時包含品牌列表和商品類型列表中的關鍵詞的行為日志,例如某日志中同時包含“三星”和“手機”,則將該日志篩選出來?;谀0迤ヅ涞姆绞绞?,預先挖掘出設定消費領域對應的表達模板,將各行為日志分別與該表達模板進行匹配,篩選出與該表達模板匹配的行為日志。仍以數碼消費品領域為例,預先挖掘出數碼消費品領域對應的表達模板,例如“顯示屏:+【數字】+像素”,如果一個行為日志中包含“顯示屏:800萬像素”,則將該行為日志篩選出來。步驟102:基于篩選出的相關行為日志進行的行為模式分析,確定對應購買前行為的行為日志和對應購買后行為的行為日志。通常,用戶在購買前,通常處于前期分析階段,關心的是價格、參數、性能等問題,用戶在購買后關心的則是售后、使用、周邊相關商品等信息,基于這一特性,能夠確定出行為日志對應購買前還是購買后。行為模式分析可以人為進行分析并對各相關行為日志標注分析結果,當然也可以采用自動分析的方式。如果采用自動分析的方式,可以基于各相關行為日志中分別包含的預示消費意圖的關鍵詞進行行為模式的分析。在此,預示消費意圖的關鍵詞也可以稱作極性關鍵詞,分為預示購買前意圖的關鍵詞和預示購買后意圖的關鍵詞。例如“報價”、“參數”、“價格”等關鍵詞預示購買前意圖,“設置”、“維修點”、“軟件”等關鍵詞預示購買后意圖。這些預示消費意圖的關鍵詞可以預先人工設置,但為了提高效率,有利于擴展新的消費品,優(yōu)選采用自動挖掘的方式。預示消費意圖的關鍵詞的挖掘方法如圖2所示,包括以下步驟:步驟201:針對設定消費領域確定預示消費意圖的種子詞。在本步驟中該種子詞可以預先人為設置,通常是針對某一具體消費領域設置的,但一消費領域通常會包含多個子類,在選取種子詞時,最好選取在各子類中都會適用的預示購買前意圖的種子詞和購買后意圖的種子詞。例如,針對數碼消費品領域,通常包括電腦、相機、手機等各子類,在此可以將電腦、相機和手機等子類中預示購買前意圖的關鍵詞取交集來作為數碼消費品領域中預示購買前意圖的種子詞。步驟202:利用預示消費意圖的種子詞對該設定消費領域的樣本日志進行分類,得到購買前樣本日志和購買后樣本日志。預先選取一些設定消費領域的樣本日志,如果某樣本日志中包含預示購買前消費意圖的種子詞多于包含預示購買后消費意圖的種子詞的狀況滿足預設條件,則認為該樣本日志為購買前樣本日志;如果某樣本日志中包含預示購買后消費意圖的種子詞多余包含預示購買前消費意圖的種子詞的狀況滿足預設條件,則認為該樣本日志為購買后樣本日志。這里的預設條件可以采用:差值大于預設差值閾值,差值占該樣本日志中包含的種子詞總數量的比例超過預設比例閾值,等等。步驟203:分別對購買前樣本日志和購買后樣本日志進行分詞和無用詞的過濾后,統(tǒng)計各詞語的詞頻。過濾的無用詞可以包括但不限于以下中的至少一種:與品牌、型號相關的詞語,虛詞、助詞、語氣詞等對語義表達無意義的詞,有字母、數字或一個漢字等噪音詞。步驟204:基于各詞語分別在購買前樣本日志和購買后樣本日志中的詞頻,確定預示購買前意圖的關鍵詞和預示購買后意圖的關鍵詞。如果某詞語在購買前樣本日志中的詞頻很高,但在購買后樣本日志中的詞頻很低或者為0,則確定該詞語是預示購買前意圖的關鍵詞,同樣,如果某詞語在購買后樣本日志中的詞頻很高,但在購買前樣本日志中的詞頻很低 或者為0,則確定該詞語為預示購買后意圖的關鍵詞。繼續(xù)參見圖1,步驟103:從步驟102確定的行為日志中選擇滿足訓練數據篩選條件的行為日志作為訓練樣本。鑒于人工標注方式選擇訓練樣本的工作量太大且效率低下,所能夠標注的數量有限且爭議較大,因此在本發(fā)明實施例中采用自動選擇訓練樣本的方式。上述的訓練數據篩選條件可以采用但不限于以下條件中的一種或任意組合:條件1:若確定的行為日志中,某用戶的日志數量大于或等于預設數量閾值,例如大于或等于5條,則該用戶的日志作為訓練樣本。條件2:若確定的行為日志中,某日志所包含的預示某一消費意圖的關鍵詞占比大于或等于預設比例閾值,則將該日志作為訓練樣本。條件3:若確定的行為日志中,某日志中出現最多的品牌的出現次數占該日志中所有品牌的出現次數的比例超過預設比例閾值,則將該日志作為訓練樣本。例如某日志中出現了“聯想”、“三星”、“蘋果”等品牌,但“蘋果”是出現最多的品牌,如果“蘋果”的出現次數占該日志中所有品牌的出現次數比例超過0.5,則說明用戶的意圖比較集中,將該日志作為訓練樣本,否則說明用戶意圖比較分散,很可能就是隨便瀏覽,就放棄該日志。步驟104:利用訓練樣本訓練分類模型,得到能夠識別出購買前行為和購買后行為的設定消費領域對應的消費意圖識別模型。本發(fā)明中并不限制分類模型的類型,可以采用現有技術中任意的二分類模型,諸如SVM(支持向量機)模型等,最終訓練出的消費意圖識別模型能夠依據每個類型的概率進行識別。在利用訓練樣本訓練分類模型時采用的針對用戶的特征可以至少包括以下特征中的一種或任意組合:日志數量;出現次數最多的品牌所占的日志數量;出現次數次多的品牌所占的日志數量;出現次數最多的型號所占的日志數量;出現次數次多的型號所占的日志數量;預示消費意圖的關鍵詞占比;預示消費意圖的關鍵詞的出現位置;有query的日志占比;query中包含的預示用戶意圖的關鍵詞占比;日志跨越時長;同一品牌所占日志的最大跨越時長;同一型號所占日志的最大跨越時長。除了上述步驟103和步驟104中所示的采用一組訓練樣本訓練分類模型,從而得到消費意圖識別模型的方法之外,為了提高模型的識別準確率,在此還提供一種優(yōu)選的實施方式:在步驟103中,從步驟102確定的行為日志中選擇分別滿足N組訓練數據篩選條件的N個行為日志集合,也就是說,預先設置N組訓練數據篩選條件,N為大于1的正整數,每一組訓練數據篩選條件能夠得到一個行為日志集合,N組就得到N個行為日志集合。這N組訓練數據篩選條件可以采用對上述3個條件設置不同數量閾值、比例閾值等方式獲得,例如在條件2中分別設置比例閾值為:0、0.1、0.2、0.3、0.4、0.5、0.6等,在條件3中分別設置比例閾值為0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9。將N個行為日志集合分別作為訓練樣本訓練分類模型,得到N個候選模型;然后從這N個候選模型中選擇最優(yōu)的一個作為消費意圖識別模型,在此最優(yōu)的一個可以是候選模型中滿足預設召回率要求且準確率最高的一個。具體地,可以分別利用N個候選模型對測試樣本進行分類,依據對測試樣本的分類結果確定各候選模型的召回率和準確率。另外,由于分類模型中概率閾值的設置會直接影響分配模型的分類結果(所謂概率閾值指的是當分類模型預測對象A屬于分類結果X的概率大于該概率閾值時,認為該對象A屬于分類結果X),因此,在得到N個候選模型 后,通過針對N個候選模型分別進行不同的概率閾值的設置,會得到具有不同概率閾值的候選模型,假設分別對N個候選模型分別設置概率閾值為0.5、0.6、0.7、0.8、0.9這五種概率閾值的設置,那么實際上就是得到了5N個候選模型,再從這5N個候選模型中選擇滿足預設召回率要求且準確率最高的一個作為消費意圖識別模型。實施例二、圖3為本發(fā)明實施例二提供的識別消費意圖的方法流程圖,該方法是基于實施例一所示方式建立的消費意圖識別模型來實現的,如圖3所示,該方法包括以下步驟:步驟301:確定待識別用戶的消費領域。本步驟根據不同的應用場景可以采用不同的方式,可以根據用戶當前所在網頁類型進行確定,例如當前用戶正在查看某網站中的數碼產品欄目,那么就可以直接確定待識別用戶的消費領域為數碼消費品領域;或者,可以根據近一段時間待識別用戶的行為日志識別該行為日志所屬的消費領域,確定行為日志所屬的消費領域可以采用現有技術中的主題確定方式,在此不再贅述。通常所述近一段時間的時長設置與建立消費意圖識別模型所采用的篩選相關行為日志的時長設置一致時,能夠具有較高的準確率;或者,可以根據用戶當前輸入的內容確定,例如當用戶使用搜索引擎輸入三星galaxyS4時,根據用戶輸入的內容就可以判定出消費領域為數碼消費品領域。步驟302:利用步驟301識別出的消費領域對應的消費意圖識別模型對待識別用戶的行為日志進行分類,得到待識別用戶的消費意圖是購買前還是購買后。在本步驟中,需要提取待識別用戶的行為日志的特征,消費意圖識別模型實際上是利用待識別用戶的行為日志的特征來進行分類的,此處提取的特征應與實施例一步驟104中在訓練分類模型時采用的特征一致,具體可用哪些特征在此不再贅述。消費意圖識別模型的分類依據實際上就是從待識別用戶的行為日志提取出的特征,從而得到待識別用戶的消費意圖是購買前還是 購買后。在識別出用戶的消費意圖后,就能夠如步驟303所示,按照用戶的消費意圖對應的展示策略有針對性地向用戶展示信息。具體可以應用于但不限于以下兩種場景:第一種場景:按照待識別用戶的消費意圖,向待識別用戶展示與待識別用戶的消費意圖對應類型的推廣信息。例如如果用戶的消費意圖是購買前,則可以向用戶推薦商品購買信息、比價信息、對比評測信息等,如果用戶的消費意圖是購買后,則可以向用戶推薦使用心得信息、相關周邊商品信息、售后信息等信息。第二種場景:當待識別用戶使用搜索引擎時,可以根據待識別用戶消費意圖進行搜索結果的排序,將待識別用戶的消費意圖對應的信息在搜索結果中的排序提前。例如如果識別出用戶的消費意圖是購買前,則可以將搜索結果中關于商品購買信息、比價信息、對比評測信息的網頁的排序提前,如果識別出用戶的消費意圖是購買后,則可以將搜索結果中關于使用心得信息、相關周邊商品信息、售后信息等網頁的排序提前。以上是對本發(fā)明所提供的方法進行的詳細描述,下面通過實施例三對本發(fā)明提供的識別消費意圖的裝置進行詳細描述。實施例三、圖4為本發(fā)明實施例三提供的識別消費意圖的裝置結構圖,該裝置通常設置在服務器端,如圖4所示,該裝置包括建模單元00和識別單元10。其中,建模單元00包括:第一篩選子單元01、模式分析子單元02、第二篩選子單元03和模型訓練子單元04。首先第一篩選子單元01從各用戶的歷史行為日志中篩選出設定消費領域的相關行為日志。在此進行篩選的方式可以采用但不限于以下方式中的一種或組合:基于關鍵詞匹配的方式,以及基于模板匹配的方式?;陉P鍵詞匹配的方式是,預先挖掘出設定消費領域對應的關鍵詞列表,將各行為日志分別與設定消費領域對應的關鍵詞列表相匹配,篩選出包含關鍵 詞列表中的關鍵詞的行為日志。這里關鍵詞列表可以是一個或多個,可以篩選出包含任一個關鍵詞列表中的關鍵詞的行為日志,或者篩選出同時包含若干個關鍵詞列表中的關鍵詞的行為日志?;谀0迤ヅ涞姆绞绞?,預先挖掘出設定消費領域對應的表達模板,將各行為日志分別與該表達模板進行匹配,篩選出與該表達模板匹配的行為日志。然后,模式分析子單元02基于對第一篩選子單元01篩選出的相關行為日志進行的行為模式分析,確定對應購買前行為的行為日志和對應購買后行為的行為日志。此處模式分析子單元02可以基于人工對篩選出的相關行為日志進行的行為模式分析,也可以由模式分析子單元02進行自動分析,即根據相關行為日志中包含的預示消費意圖的關鍵詞進行行為模式的分析,預示消費意圖的關鍵詞包括預示購買前意圖的關鍵詞或預示購買后意圖的關鍵詞。之后,第二篩選子單元03從模式分析子單元02確定的行為日志中選擇滿足訓練數據篩選條件的行為日志作為訓練樣本。其中的訓練數據篩選條件包括以下條件中的一種或任意組合:條件1:用戶的行為日志包含的日志數量大于或等于預設數量閾值。條件2:行為日志所包含的預示消費意圖的關鍵詞占比大于或等于預設比例閾值,預示消費意圖的關鍵詞為預示購買前意圖的關鍵詞或預示購買后意圖的關鍵詞。條件3:行為日志中出現最多的品牌的出現次數占該行為日志中所有品牌的出現次數的比例超過預設比例閾值。另外,為了實現上述預示消費意圖的關鍵詞挖掘,該建模單元00還包括意圖關鍵詞挖掘子單元05,用于按照以下操作A1-A4所示的方式挖掘預示消費意圖的關鍵詞:操作A1、針對設定消費領域確定預示消費意圖的種子詞。此處種子詞可以預先人工設置,通常是針對某一具體消費領域設置的,但一消費領域通常會包含多個子類,在選取種子詞時,最好選取在各子類中都會適用的預示購買前意 圖的種子詞和購買后意圖的種子詞。例如,針對數碼消費品領域,通常包括電腦、相機、手機等各子類,在此可以將電腦、相機和手機等子類中預示購買前意圖的關鍵詞取交集來作為數碼消費品領域中預示購買前意圖的種子詞。操作A2、利用種子詞對設定消費領域的樣本日志進行分類,得到購買前樣本日志和購買后樣本日志。具體地,預先選取一些設定消費領域的樣本日志,如果某樣本日志中包含預示購買前消費意圖的種子詞多于包含預示購買后消費意圖的種子詞的狀況滿足預設條件,則認為該樣本日志為購買前樣本日志;如果某樣本日志中包含預示購買后消費意圖的種子詞多余包含預示購買前消費意圖的種子詞的狀況滿足預設條件,則認為該樣本日志為購買后樣本日志。這里的預設條件可以采用:差值大于預設差值閾值,差值占該樣本日志中包含的種子詞總數量的比例超過預設比例閾值,等等。操作A3、分別對購買前樣本日志和購買后樣本日志進行分詞和無用詞的過濾后,統(tǒng)計各詞語的詞頻。其中過濾的無用詞可以包括但不限于以下中的至少一種:與品牌、型號相關的詞語,虛詞、助詞、語氣詞等對語義表達無意義的詞,有字母、數字或一個漢字等噪音詞。操作A4、基于各詞語分別在購買前樣本日志和購買后樣本日志中的詞頻,確定預示購買前意圖的關鍵詞和預示購買后意圖的關鍵詞。如果某詞語在購買前樣本日志中的詞頻很高,但在購買后樣本日志中的詞頻很低或者為0,則確定該詞語是預示購買前意圖的關鍵詞,同樣,如果某詞語在購買后樣本日志中的詞頻很高,但在購買前樣本日志中的詞頻很低或者為0,則確定該詞語為預示購買后意圖的關鍵詞。最后,模型訓練子單元04從訓練樣本中提取特征訓練分類模型,得到能夠識別出購買前行為和購買后行為的設定消費領域對應的消費意圖識別模型。其采用的分類模型可以是現有技術中任意的二分類模型,諸如SVM模型,最終訓練出的消費意圖識別模型能夠依據每個類型的概率進行識別。模型訓練子單元04在訓練分類模型時從訓練樣本中提取的特征至少包括但不限于以下特征中的一種或任意組合:日志數量;出現次數最多的品牌所占的日志數量;出現次數次多的品牌所占的日志數量;出現次數最多的型號所占的日志數量;出現次數次多的型號所占的日志數量;預示消費意圖的關鍵詞占比;預示消費意圖的關鍵詞的出現位置;有query的日志占比;query中包含的預示用戶意圖的關鍵詞占比;日志跨越時長;同一品牌所占日志的最大跨越時長;同一型號所占日志的最大跨越時長。除了上述的第二篩選子單元03和模型訓練子單元04采用一組訓練樣本訓練分類模型,從而得到消費意圖識別模型的方法之外,為了提高模型的識別準確率,在此還提供一種優(yōu)選的實施方式:第二篩選子單元03從模式分析子單元02確定的行為日志中選擇分別滿足N組訓練數據篩選條件的N個行為日志集合。上述N組訓練數據篩選條件可以采用對上述3個條件設置不同數量閾值、比例閾值等方式獲得,例如在條件2中分別設置比例閾值為:0、0.1、0.2、0.3、0.4、0.5、0.6等,在條件3中分別設置比例閾值為0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9。模型訓練子單元04將每一個行為日志集合分別作為一組訓練樣本訓練分類模型,得到N個候選模型,從N個候選模型中選擇最優(yōu)的一個作為設定消費領域對應的消費意圖識別模型。具體地,可以分別利用N個候選模型對測試樣本進行分類,依據對測試樣本的分類結果確定各候選模型的召回率和準確率。當消費意圖識別模型建立完畢后,就可以用于識別單元10的用戶消費意圖識別。如圖4所示,識別單元10包括:領域確定子單元11和模型分類子單元12,還可以進一步包括信息展示子單元13。首先領域確定子單元11確定待識別用戶的消費領域。根據不同的應用場景,領域確定子單元11可以采用不同的方式:可以根據用戶當前所在網頁類型進行確定,例如當前用戶正在查看某網站中的數碼產品欄目,那么就可以直接確定待識別用戶的消費領域為數碼消費品領域;或者,可以根據近一段時間待識別用戶的行為日志識別該行為日志所屬的消費領域,確定行為日志所屬的消費領域可以采用現有技術中的主題確定方式,在此不再贅述。通常所述近一段時間的時長設置與建立消費意圖識別模型所采用的篩選相關行為日志的時長設置一致時,能夠具有較高的準確率;或者,可以根據用戶當前輸入的內容確定,例如當用戶使用搜索引擎輸入三星galaxyS4時,根據用戶輸入的內容就可以判定出消費領域為數碼消費品領域。然后模型分類子單元12利用領域確定子單元11確定出的消費領域對應的消費意圖識別模型,對近一段時間內待識別用戶在確定出的消費領域的相關行為日志進行分類,得到待識別用戶的消費意圖是購買前或購買后。模型分類子單元需要提取待識別用戶的行為日志的特征,消費意圖識別模型實際上是利用待識別用戶的行為日志的特征來進行分類的。其提取的特征應與模型訓練子單元04提取的特征一致。更進一步地,上述信息展示子單元13就能夠按照待識別用戶的消費意圖對應的展示策略向待識別用戶展示信息。具體地,可以應用于但不限于以下兩種場景:第一種場景:按照待識別用戶的消費意圖,向待識別用戶展示與待識別用戶的消費意圖對應類型的推廣信息。例如如果用戶的消費意圖是購買前,則可以向用戶推薦商品購買信息、比價信息、對比評測信息等,如果用戶的消費意圖是購買后,則可以向用戶推薦使用心得信息、相關周邊商品信息、售后信息等信息。第二種場景:在向待識別用戶展示的搜索結果中,將待識別用戶的消費意圖對應的信息在搜索結果中的排序提前。例如如果識別出用戶的消費意圖是購買前,則可以將搜索結果中關于商品購買信息、比價信息、對比評測信息的網頁的排序提前,如果識別出用戶的消費意圖是購買后,則可以將搜索結果中關于使用心得信息、相關周邊商品信息、售后信息等網頁的排序提前。本發(fā)明提供的上述方法和裝置可以廣泛地適用于網頁搜索、商品搜索、廣告推廣等領域,向用戶展示更符合用戶消費意圖的內容,提高準確度,不僅能夠更好的滿足用戶需求,減少無效內容對用戶的干擾,同時還能夠提高有效的商業(yè)行為轉化率。在本發(fā)明所提供的幾個實施例中,應該理解到,所揭露的裝置和方法,可以通過其它的方式實現。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式。另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現,也可以采用硬件加軟件功能單元的形式實現。上述以軟件功能單元的形式實現的集成的單元,可以存儲在一個計算機可讀取存儲介質中。上述軟件功能單元存儲在一個存儲介質中,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網絡設備等)或處理器(processor)執(zhí)行本發(fā)明各個實施例所述方法的部分步驟。而前述的存儲介質包括:U盤、移動硬盤、只讀存儲器(Read-OnlyMemory,ROM)、隨機存取存儲器(RandomAccessMemory,RAM)、磁碟或者光盤等各種可以存儲程序代碼的介質。以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內,所做的任何修改、等同替換、改進等,均應包含在本發(fā)明保護的范圍之內。
當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1