專利名稱:一種應用于電子商務網(wǎng)站的信息匹配方法和系統(tǒng)的制作方法
技術領域:
本申請涉及計算機數(shù)據(jù)處理技術領域,特別是指一種應用于電子商務網(wǎng)站的信息 匹配方法和系統(tǒng)。
背景技術:
搜索引擎是一種尋找匹配信息的工具,其已經(jīng)成為非常高效的信息發(fā)布、聚合和 展現(xiàn)平臺,且在電子商務領域得到了廣泛的應用。搜索引擎的工作原理是用戶輸入表明需 求的關鍵字,搜索引擎尋找與該關鍵字相匹配的信息,并將匹配的結果信息返回給該用戶。 搜索引擎本身是根據(jù)關鍵字來識別用戶需求的,而用戶的需求千變?nèi)f化,僅憑幾個關鍵字 很難準確地表達出用戶的真實意圖。例如,用戶輸入“防水套”時,既可能是指“相機防水 套”,又可能是指“手機防水套”,用戶既可能是想購買某種防水套,又可能只是想了解防水 套的相關信息。由于用戶本身的生活方式、習慣、宗教信仰等個性化特征是各不相同的,而搜索引 擎無法識別用戶的這種個性化差異,因此搜索引擎只能給不同的用戶呈現(xiàn)千篇一律的搜索 結果;例如,同樣是搜索“酒店”,預算充裕的用戶可能需要了解的是豪華酒店,預算緊張的 用戶可能需要了解的是經(jīng)濟酒店,向預算緊張的用戶呈現(xiàn)豪華酒店的信息,只能浪費用戶 過濾甄別信息的精力和時間,而且對于發(fā)布豪華酒店信息的商家而言也沒有任何好處。再者,在手機等設備上,關鍵字的輸入并不方便,而過短的關鍵字又不能表達清楚 用戶想要的信息。例如用戶搜索“審美理發(fā)”時,有那么多的連鎖店,應該給用戶呈現(xiàn)哪一 家店的信息?現(xiàn)在的搜索引擎只能要求用戶反復精煉關鍵字進行調(diào)整,這樣不但降低了搜 索效率,而且給用戶的使用帶來了極大的不便??梢?,通過現(xiàn)有的搜索引擎實現(xiàn)的信息匹配,并不能保證所檢索的到結果是用戶
最需要的信息。競價排名也有信息發(fā)布、信息檢索等功能。競價排名的實質(zhì)是按照信息發(fā)布者為 每次點擊付費多少進行排序,將排序后靠前的結果展現(xiàn)在訪問者面前,即,信息發(fā)布者通過 付費對展現(xiàn)的廣告進行控制??梢?,競價排名所保證的是讓付費更多的發(fā)布者的信息排在前面,而該排序最靠 前的信息是否是與用戶需求最匹配的信息,并不是其關注的重點。因而,競價排名更多的關 注了信息發(fā)布者即商家的利益,而忽略了信息接收者即用戶的利益。傳統(tǒng)廣告也有信息發(fā)布等功能?;ヂ?lián)網(wǎng)傳統(tǒng)廣告的發(fā)展已經(jīng)歷經(jīng)了多代,從最開 始的選擇主題欄目投放(例如在新浪的汽車頻道投放汽車廣告),到從頁面提取關鍵字進 行關鍵字投放(例如Google的AdSense)再到對用戶行為進行分析,通過聚類、路徑分析等 方法,定向投放(例如doubleclick、騰迅),互聯(lián)網(wǎng)廣告效果越來越明顯。然而,傳統(tǒng)廣告 的本質(zhì)仍是“廣告”,即,信息是按照廣告主的意志而不是消費者的意志投放的。可見,傳統(tǒng)廣告并不是為用戶提供其所需要的匹配信息,而是尋找潛在客戶,將廣 告的內(nèi)容強行發(fā)送給其所認定的潛在客戶。因而,其實質(zhì)仍然是廣告,無論如何改善,它仍然是在用戶需要獲取其它信息的時候出現(xiàn),這必然會對用戶的正?;顒赢a(chǎn)生干擾。同樣的, 傳統(tǒng)廣告也是更多的關注了信息發(fā)布者即商家的利益,而忽略了信息接收者即用戶的利益。
發(fā)明內(nèi)容
本申請實施例在于提供一種應用于電子商務網(wǎng)站的信息匹配方法和系統(tǒng),通過為 信息接收者提供其最需要的信息,使得信息發(fā)布者和信息接收者之間實現(xiàn)雙贏。本申請實施例提供了一種應用于電子商務網(wǎng)站的信息匹配方法,包括搜索引擎服務器收集網(wǎng)絡用戶的每一類網(wǎng)絡行為的特征數(shù)據(jù),分別針對每一類網(wǎng) 絡行為按照所述特征數(shù)據(jù)對網(wǎng)絡用戶進行聚類,設定據(jù)以進行聚類的各類特征數(shù)據(jù)的權 重;搜索引擎服務器接收某一特定網(wǎng)絡用戶的搜索請求,并根據(jù)該搜索請求搜索獲得 若干條搜索結果;搜索引擎服務器查詢所述特定用戶所屬聚類中所有網(wǎng)絡用戶對所述每一條搜索 結果的歷史點選記錄;搜索引擎服務器根據(jù)所述所有網(wǎng)絡用戶的歷史點選記錄以及據(jù)以進行聚類的各 類特征數(shù)據(jù)的權重計算獲得所述若干條搜索結果的等級值;搜索引擎服務器按照所述等級值由大到小對所述搜索結果進行排序,并將排序后 的搜索結果返回給特定用戶的用戶終端。其中,所述網(wǎng)絡行為包括網(wǎng)絡交易行為或網(wǎng)絡點評行為;所述網(wǎng)絡行為的特征 數(shù)據(jù)包括網(wǎng)絡交易記錄或網(wǎng)絡點評記錄。其中,所述分別針對每一類網(wǎng)絡行為按照所述特征數(shù)據(jù)對網(wǎng)絡用戶進行聚類的方 法包括首先將沒有搜集到網(wǎng)絡行為的特征數(shù)據(jù)的網(wǎng)絡用戶聚為一類;對于剩下的網(wǎng)絡用戶,根據(jù)所述網(wǎng)絡行為的特征數(shù)據(jù)以及已配置的聚類數(shù)目進行 聚類;將聚類結果以數(shù)據(jù)表的形式保存在數(shù)據(jù)庫中。其中,所述根據(jù)所述網(wǎng)絡行為的特征數(shù)據(jù)以及已配置的聚類數(shù)目進行聚類的步驟 包括若所述網(wǎng)絡行為的特征數(shù)據(jù)為網(wǎng)絡交易記錄,則根據(jù)所述網(wǎng)絡交易記錄中的商品 信息是否類似進行聚類,將購買過類似商品的網(wǎng)絡用戶聚為一類;聚類數(shù)達到已配置的數(shù)目時,聚類完成。其中,所述根據(jù)所述網(wǎng)絡行為的特征數(shù)據(jù)以及已配置的聚類數(shù)目進行聚類的步驟 包括若所述網(wǎng)絡行為的特征數(shù)據(jù)為網(wǎng)絡點評記錄,則根據(jù)網(wǎng)絡用戶點評的商家用戶所 屬的類目對網(wǎng)絡用戶進行聚類;或者,統(tǒng)計每兩個商家用戶的網(wǎng)絡點評記錄中相同的網(wǎng)絡 用戶的數(shù)量,根據(jù)所述網(wǎng)絡用戶的數(shù)量與對該商家用戶進行網(wǎng)絡點評的網(wǎng)絡用戶的總數(shù)量 的比值獲得重疊比例,根據(jù)重疊比例計算商家用戶之間的距離;根據(jù)所述距離對商家用戶 進行聚類,再反過來根據(jù)商家用戶的聚類對消費者用戶進行聚類;
聚類數(shù)達到已配置的數(shù)目時,聚類完成。其中,所述搜索引擎服務器收集網(wǎng)絡用戶的每一類網(wǎng)絡行為的特征數(shù)據(jù)的方式包 括通過服務器日志分析系統(tǒng)收集、通過網(wǎng)絡用戶活動日志系統(tǒng)收集、通過地理信息系統(tǒng)收 集或通過第三方數(shù)據(jù)接口收集,或通過以上任意組合的方式收集。其中,所述方法還包括設置地理位置信息的權重;根據(jù)所述地理位置信息的權重和據(jù)以進行聚類的各類特征數(shù)據(jù)的權重,計算各條 檢索結果的等級值,根據(jù)計算出的等級值按照從大到小的順序?qū)z索結果進行排序。其中,所述搜索引擎服務器接收某一特定網(wǎng)絡用戶的搜索請求,具體包括搜索引 擎服務器接收某一特定網(wǎng)絡用戶輸入的搜索關鍵詞,和/或搜索引擎服務器接收某一特定 網(wǎng)絡用戶的鼠標點擊行為觸發(fā)的搜索請求。本申請還提供了一種應用于電子商務網(wǎng)站的信息匹配系統(tǒng),包括信息采集系統(tǒng),收集網(wǎng)絡用戶的每一類網(wǎng)絡行為的特征數(shù)據(jù),分別針對每一類網(wǎng) 絡行為按照所述特征數(shù)據(jù)對網(wǎng)絡用戶進行聚類,設定據(jù)以進行聚類的各類特征數(shù)據(jù)的權 重;檢索系統(tǒng),接收某一特定網(wǎng)絡用戶的搜索請求,并根據(jù)該搜索請求搜索獲得若干 條搜索結果,查詢所述特定用戶所屬聚類中其他網(wǎng)絡用戶對所述每一條搜索結果的歷史點 選記錄,根據(jù)所述其他網(wǎng)絡用戶的歷史點選記錄以及據(jù)以進行聚類的各類特征數(shù)據(jù)的權重 計算獲得所述若干條搜索結果的等級值,按照所述等級值由大到小對所述搜索結果進行排 序;結果頁面生成系統(tǒng),用于將所述排序后的檢索結果顯示給信息接收者。其中,所述檢索系統(tǒng)具體包括搜索引擎,接收某一特定網(wǎng)絡用戶的搜索請求,并根據(jù)該搜索請求搜索獲得若干 條搜索結果;排序系統(tǒng),查詢所述特定用戶所屬聚類中其他網(wǎng)絡用戶對所述每一條搜索結果的 歷史點選記錄,根據(jù)所述其他網(wǎng)絡用戶的歷史點選記錄以及據(jù)以進行聚類的各類特征數(shù)據(jù) 的權重計算獲得所述若干條搜索結果的等級值,按照所述等級值由大到小對所述搜索結果 進行排序。其中,所述排序系統(tǒng)具體包括第一設置模塊,用于設定據(jù)以進行聚類的各類特征數(shù)據(jù)的權重;查詢模塊,用于針對已獲得的每一條檢索結果,查詢每一網(wǎng)絡用戶對每一條檢索 結果的歷史點選記錄;統(tǒng)計模塊,用于統(tǒng)計獲得的每一個檢索結果的歷史點選記錄,并以數(shù)據(jù)表的形式 保存于數(shù)據(jù)庫中;排序模塊,用于當某一特定網(wǎng)絡用戶搜索時,對于返回的檢索結果,查詢與所述網(wǎng) 絡用戶同一聚類的所有用戶的歷史點選記錄,并根據(jù)所述權重,計算各條檢索結果的等級 值,根據(jù)計算出的等級值按照從大到小的順序?qū)z索結果進行排序。其中,所述排序系統(tǒng)具體包括第二設置模塊,用于設置地理位置信息的權重;第一設置模塊,用于設定據(jù)以進行聚類的各類特征數(shù)據(jù)的權重;
查詢模塊,用于針對已獲得的每一條檢索結果,查詢每一網(wǎng)絡用戶對每一條檢索 結果的歷史點選記錄;統(tǒng)計模塊,用于統(tǒng)計獲得的每一個檢索結果的歷史點選記錄,并以數(shù)據(jù)表的形式 保存于數(shù)據(jù)庫中;排序模塊,用于當某一特定網(wǎng)絡用戶搜索時,對于返回的檢索結果,查詢與所述網(wǎng) 絡用戶同一聚類的所有用戶的歷史點選記錄,并根據(jù)所述地理位置信息的權重和據(jù)以進行 聚類的各類特征數(shù)據(jù)的權重,計算各條檢索結果的等級值,根據(jù)計算出的等級值按照從大 到小的順序?qū)z索結果進行排序。應用本申請?zhí)峁┑膽糜陔娮由虅盏男畔⑵ヅ浞椒ê拖到y(tǒng),通過收集信息發(fā)布者 和信息接收者的信息,綜合分析信息發(fā)布者和信息接收者的屬性,根據(jù)信息接收者所表示 出來的需求,為其提供與其相匹配的信息,從而實現(xiàn)信息的匹配,使得在電子商務應用中信 息發(fā)布者和信息接收者之間實現(xiàn)雙贏。
為了更清楚地說明本申請實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn) 有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 申請的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。圖1是本申請所涉及角色之間的關系示意圖;圖2是本申請信息匹配方法的網(wǎng)絡構架示意圖;圖3是根據(jù)本申請是實施例的在信息編輯系統(tǒng)中選擇要發(fā)布信息分類的實例圖;圖4是基于圖3所示分類實例選擇餐飲分類后的實例圖;圖5是根據(jù)本申請是實施例的通過信息代理系統(tǒng)接入信息編輯系統(tǒng)的示意圖;圖6是根據(jù)本申請實施例的應用于電子商務網(wǎng)站的信息匹配方法流程圖;圖7是根據(jù)本申請實施例的應用于電子商務網(wǎng)站的信息匹配系統(tǒng)結構示意圖。
具體實施例方式下面將結合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例?;?本申請中的實施例,本領域普通技術人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本申請保護的范圍。本申請涉及三種角色信息發(fā)布者、信息接受者和本申請的信息匹配系統(tǒng)。信息發(fā) 布者是指提供信息一方,信息接受者是指需要信息一方,注意這二者只是概念上的區(qū)分,在 現(xiàn)實生活中,一個人既可以是信息發(fā)布者也可以是信息接受者,例如,一個學生在找兼職工 作時,他是一個信息發(fā)布者;同時他又需要了解招聘兼職工作的信息,這時他又變成了信息 接受者。本申請的信息匹配系統(tǒng)是為信息發(fā)布者和信息接受者提供信息傳播的一個平臺。 三者的關系如圖1所示。參見圖2,其是本申請信息匹配方法的網(wǎng)絡構架示意圖。其中,信息采集系統(tǒng)201用于收集信息,具體的,信息采集系統(tǒng)中的信息編輯系統(tǒng)2011收集信息發(fā)布者的基本屬性信息以及需要發(fā)布的信息,信息采集系統(tǒng)中的個性化信息系統(tǒng) 收集信息接收者的個性化數(shù)據(jù)2012,對所述個性化數(shù)據(jù)進行聚類處理,獲得所述信息接收 者的個性化屬性。信息存儲系統(tǒng)203保存信息發(fā)布者的基本屬性信息,所述信息發(fā)布者需 要發(fā)布的信息,以及信息接收者的個性化屬性。信息存儲系統(tǒng)203保存信息發(fā)布者的基本 屬性信息,所述信息發(fā)布者需要發(fā)布的信息,以及信息接收者的個性化屬性。再有,本申請 的信息匹配網(wǎng)絡構建還可以包括信息認證系統(tǒng)202,用于對所述信息采集系統(tǒng)所收集的信 息發(fā)布者的基本屬性信息進行認證,認證通過通知信息存儲系統(tǒng)。當信息接收者在網(wǎng)上活動時,需求識別系統(tǒng)204根據(jù)接收到的觸發(fā)信息,獲取所 述信息接收者的用戶標識和網(wǎng)上活動信息;檢索系統(tǒng)205根據(jù)所述網(wǎng)上活動信息生成檢索 結果,所述檢索結果包括與所述檢索命令匹配的來自信息發(fā)布者的發(fā)布信息;結果頁面生 成系統(tǒng)206將所述檢索結果顯示給信息接收者。需要說明的是,上述信息采集系統(tǒng)201、信息認證系統(tǒng)202、信息存儲系統(tǒng)203、需 求識別系統(tǒng)204、檢索系統(tǒng)205、結果頁面生成系統(tǒng)206均為邏輯系統(tǒng),其既可以全部在一臺 服務器上,也可以其中的一個或多個在一臺或多臺服務器上??梢?,本申請通過收集信息發(fā)布者和信息接收者的信息,綜合分析信息發(fā)布者和 信息接收者的屬性,根據(jù)信息接收者所表示出來的需求,為其提供與其相匹配的信息,從而 實現(xiàn)信息的匹配,使得在電子商務應用中信息發(fā)布者和信息接收者之間實現(xiàn)雙贏。結合圖2所示網(wǎng)絡構架,下面首先從信息發(fā)布者和信息接收者兩個角度分別說 明。對于信息發(fā)布者,其包括以下幾個步驟第一步通過信息編輯系統(tǒng),信息發(fā)布者將所需發(fā)布的信息以及其基本屬性信息輸入信息 存儲系統(tǒng)。信息編輯系統(tǒng)是一個運行在應用程序服務器上的系統(tǒng)軟件,它與外界的通訊通 過標準的超文本傳輸協(xié)議(HTTP,Hyper Text TransferProtocol)協(xié)議來完成。信息發(fā)布 者可以通過普通的瀏覽器訪問信息編輯系統(tǒng)的頁面,在頁面上輸入信息。例如,某餐飲行業(yè)的信息發(fā)布者,希望發(fā)布一條餐飲服務的信息。首先它需要在信 息編輯系統(tǒng)中登錄后選擇要發(fā)布的信息分類,選擇餐飲的分類后,信息編輯系統(tǒng)會要求信 息發(fā)布者按照餐飲行業(yè)的情況輸入相關的信息,如圖3和圖4所示??梢岳斫猓绻瞧渌?行業(yè),圖4所示頁面上需要填入的內(nèi)容會有所不同。需要說明的是,圖3和圖4僅是針對餐 飲行業(yè)的一個實施例而已,在其他可能的實施例中頁面的內(nèi)容、布局、圖片、顏色等都可以 發(fā)生變化。信息發(fā)布者也可以用其他方式發(fā)布信息,例如手機短信,或者通過其它終端設備 的方式,如果這些方式不是通過標準的HTTP協(xié)議,那么還需要一個信息代理系統(tǒng)將信息轉 換為HTTP協(xié)議與信息編輯系統(tǒng)通信,如5圖所示,手機或其他終端設備通過信息代理系統(tǒng) 將需要輸入的信息傳輸至信息編輯系統(tǒng)。信息提交后,會保存到信息存儲系統(tǒng)。信息存儲系統(tǒng)是由后臺數(shù)據(jù)庫組成,該后臺 數(shù)據(jù)庫可以是分布式的,也可以是非分布式的。這里,數(shù)據(jù)庫是一個泛指概念,代表各種格 式的數(shù)據(jù)庫,而不局限于某種特定格式的數(shù)據(jù),例如Oracle數(shù)據(jù)庫,開放源碼的小型關系 型數(shù)據(jù)庫管理系統(tǒng)(MySQL),結構化查詢語言服務器(SQL Server)等。
第二步系統(tǒng)管理員通過信息認證系統(tǒng)來審核信息發(fā)布者所提交的信息。信息認證系統(tǒng)也 是一個運行在系統(tǒng)服務器上的系統(tǒng)軟件,它與外界的通訊通過標準的HTTP協(xié)議來完成,即 系統(tǒng)管理員通過瀏覽器即可訪問。根據(jù)實際需要,系統(tǒng)管理員可以委托第三方認證公司、第三方信用公司或者其它 第三方機構,對信息發(fā)布者發(fā)布的信息進行審核和認證,以保證信息發(fā)布者發(fā)布的信息真 實可信。例如,在上例中,某信息發(fā)布者提供了餐飲服務的信息,其中包括商家名稱、菜品 相關信息、營業(yè)執(zhí)照、衛(wèi)生許可證等,系統(tǒng)管理員將這些信息委托第三方公司進行認證,第 三方公司經(jīng)過多渠道交叉認證后,認為該信息真實可信,反饋給系統(tǒng)管理員后,系統(tǒng)管理員 審核通過此信息。如果信息審核不通過,系統(tǒng)管理員可以拒絕該信息,或者編輯該信息使其符合要 求然后審核通過。審核通過后,信息審核系統(tǒng)將這條信息轉入審核通過的數(shù)據(jù)庫中即信息存儲系統(tǒng) 中,供其它系統(tǒng)調(diào)用。需要說明的是,該步的目標是為了保證信息提供者所提供的信息真實可靠,從而 更好的維護電子商務活動中的誠信,在一些實際應用環(huán)境中該步也可以不存在。以上是面向信息發(fā)布者的流程,對于信息接受者,包括以下幾個步驟第一步通過個性化信息采集系統(tǒng)收集用戶特征數(shù)據(jù)。個性化信息采集系統(tǒng)是一個運行在 服務器上的系統(tǒng)軟件,它又包含有若干子系統(tǒng)a)服務器日志分析系統(tǒng)從服務器日志中,通過分析用戶的訪問記錄,來分析用 戶特征的系統(tǒng)。服務器日志是指,服務器上運行的基本服務軟件,所記錄的軟件運行的日 志,例如Apache HTTP服務器的日志。例如,從服務器的Apache日志中,可以獲取用戶的訪問記錄,某用戶過去7天可能 訪問過/pathl/filel/path2/file2____這些訪問記錄被提取作為用戶特征,保存到數(shù)據(jù)存儲系統(tǒng)。b)用戶活動日志系統(tǒng)從用戶活動的日志中分析用戶特征的系統(tǒng)。用戶活動日志 是指,網(wǎng)站為用戶提供服務的應用程序所記錄的、用戶使用這些服務的日志記錄。例如,網(wǎng) 站為用戶提供的論壇程序,可能會把用戶的登錄IP、登錄時間、發(fā)帖標題、發(fā)帖內(nèi)容等信息 記錄到日志中。用戶活動日志系統(tǒng)從這些日志中提取用戶的特征,保存到數(shù)據(jù)存儲系統(tǒng)。例如,論壇程序記錄的用戶活動如表1所示表 權利要求
1.一種應用于電子商務網(wǎng)站的信息匹配方法,其特征在于,包括搜索引擎服務器收集網(wǎng)絡用戶的每一類網(wǎng)絡行為的特征數(shù)據(jù),分別針對每一類網(wǎng)絡行 為按照所述特征數(shù)據(jù)對網(wǎng)絡用戶進行聚類,設定據(jù)以進行聚類的各類特征數(shù)據(jù)的權重;搜索引擎服務器接收某一特定網(wǎng)絡用戶的搜索請求,并根據(jù)該搜索請求搜索獲得若干 條搜索結果;搜索引擎服務器查詢所述特定用戶所屬聚類中所有網(wǎng)絡用戶對所述每一條搜索結果 的歷史點選記錄;搜索引擎服務器根據(jù)所述所有網(wǎng)絡用戶的歷史點選記錄以及據(jù)以進行聚類的各類特 征數(shù)據(jù)的權重計算獲得所述若干條搜索結果的等級值;搜索引擎服務器按照所述等級值由大到小對所述搜索結果進行排序,并將排序后的搜 索結果返回給特定用戶的用戶終端。
2.根據(jù)權利要求1所述的方法,其特征在于,所述網(wǎng)絡行為包括網(wǎng)絡交易行為或網(wǎng)絡 點評行為;所述網(wǎng)絡行為的特征數(shù)據(jù)包括網(wǎng)絡交易記錄或網(wǎng)絡點評記錄。
3.根據(jù)權利要求1所述的方法,其特征在于,所述分別針對每一類網(wǎng)絡行為按照所述 特征數(shù)據(jù)對網(wǎng)絡用戶進行聚類的方法包括首先將沒有搜集到網(wǎng)絡行為的特征數(shù)據(jù)的網(wǎng)絡用戶聚為一類;對于剩下的網(wǎng)絡用戶,根據(jù)所述網(wǎng)絡行為的特征數(shù)據(jù)以及已配置的聚類數(shù)目進行聚類;將聚類結果以數(shù)據(jù)表的形式保存在數(shù)據(jù)庫中。
4.根據(jù)權利要求3所述的方法,其特征在于,所述根據(jù)所述網(wǎng)絡行為的特征數(shù)據(jù)以及 已配置的聚類數(shù)目進行聚類的步驟包括若所述網(wǎng)絡行為的特征數(shù)據(jù)為網(wǎng)絡交易記錄,則根據(jù)所述網(wǎng)絡交易記錄中的商品信息 是否類似進行聚類,將購買過類似商品的網(wǎng)絡用戶聚為一類;聚類數(shù)達到已配置的數(shù)目時,聚類完成。
5.根據(jù)權利要求3所述的方法,其特征在于,所述根據(jù)所述網(wǎng)絡行為的特征數(shù)據(jù)以及 已配置的聚類數(shù)目進行聚類的步驟包括若所述網(wǎng)絡行為的特征數(shù)據(jù)為網(wǎng)絡點評記錄,則根據(jù)網(wǎng)絡用戶點評的商家用戶所屬的 類目對網(wǎng)絡用戶進行聚類;或者,統(tǒng)計每兩個商家用戶的網(wǎng)絡點評記錄中相同的網(wǎng)絡用戶 的數(shù)量,根據(jù)所述網(wǎng)絡用戶的數(shù)量與對該商家用戶進行網(wǎng)絡點評的網(wǎng)絡用戶的總數(shù)量的比 值獲得重疊比例,根據(jù)重疊比例計算商家用戶之間的距離;根據(jù)所述距離對商家用戶進行 聚類,再反過來根據(jù)商家用戶的聚類對消費者用戶進行聚類;聚類數(shù)達到已配置的數(shù)目時,聚類完成。
6.根據(jù)權利要求1所述的方法,其特征在于,所述搜索引擎服務器收集網(wǎng)絡用戶的每 一類網(wǎng)絡行為的特征數(shù)據(jù)的方式包括通過服務器日志分析系統(tǒng)收集、通過網(wǎng)絡用戶活動 日志系統(tǒng)收集、通過地理信息系統(tǒng)收集或通過第三方數(shù)據(jù)接口收集,或通過以上任意組合 的方式收集。
7.根據(jù)權利要求1所述的方法,其特征在于,所述方法還包括設置地理位置信息的權重;根據(jù)所述地理位置信息的權重和據(jù)以進行聚類的各類特征數(shù)據(jù)的權重,計算各條檢索結果的等級值,根據(jù)計算出的等級值按照從大到小的順序?qū)z索結果進行排序。
8.根據(jù)權利要求1所述的方法,其特征在于,所述搜索引擎服務器接收某一特定網(wǎng)絡 用戶的搜索請求,具體包括搜索引擎服務器接收某一特定網(wǎng)絡用戶輸入的搜索關鍵詞,和 /或搜索引擎服務器接收某一特定網(wǎng)絡用戶的鼠標點擊行為觸發(fā)的搜索請求。
9.一種應用于電子商務網(wǎng)站的信息匹配系統(tǒng),其特征在于,包括信息采集系統(tǒng),收集網(wǎng)絡用戶的每一類網(wǎng)絡行為的特征數(shù)據(jù),分別針對每一類網(wǎng)絡行 為按照所述特征數(shù)據(jù)對網(wǎng)絡用戶進行聚類,設定據(jù)以進行聚類的各類特征數(shù)據(jù)的權重;檢索系統(tǒng),接收某一特定網(wǎng)絡用戶的搜索請求,并根據(jù)該搜索請求搜索獲得若干條搜 索結果,查詢所述特定用戶所屬聚類中其他網(wǎng)絡用戶對所述每一條搜索結果的歷史點選記 錄,根據(jù)所述其他網(wǎng)絡用戶的歷史點選記錄以及據(jù)以進行聚類的各類特征數(shù)據(jù)的權重計算 獲得所述若干條搜索結果的等級值,按照所述等級值由大到小對所述搜索結果進行排序;結果頁面生成系統(tǒng),用于將所述排序后的檢索結果顯示給信息接收者。
10.根據(jù)權利要求9所述的系統(tǒng),其特征在于,所述檢索系統(tǒng)具體包括搜索引擎,接收某一特定網(wǎng)絡用戶的搜索請求,并根據(jù)該搜索請求搜索獲得若干條搜 索結果;排序系統(tǒng),查詢所述特定用戶所屬聚類中其他網(wǎng)絡用戶對所述每一條搜索結果的歷史 點選記錄,根據(jù)所述其他網(wǎng)絡用戶的歷史點選記錄以及據(jù)以進行聚類的各類特征數(shù)據(jù)的權 重計算獲得所述若干條搜索結果的等級值,按照所述等級值由大到小對所述搜索結果進行 排序。
11.根據(jù)權利要求10所述的系統(tǒng),其特征在于,所述排序系統(tǒng)具體包括第一設置模塊,用于設定據(jù)以進行聚類的各類特征數(shù)據(jù)的權重;查詢模塊,用于針對已獲得的每一條檢索結果,查詢每一網(wǎng)絡用戶對每一條檢索結果 的歷史點選記錄;統(tǒng)計模塊,用于統(tǒng)計獲得的每一個檢索結果的歷史點選記錄,并以數(shù)據(jù)表的形式保存 于數(shù)據(jù)庫中;排序模塊,用于當某一特定網(wǎng)絡用戶搜索時,對于返回的檢索結果,查詢與所述網(wǎng)絡用 戶同一聚類的所有用戶的歷史點選記錄,并根據(jù)所述權重,計算各條檢索結果的等級值,根 據(jù)計算出的等級值按照從大到小的順序?qū)z索結果進行排序。
12.根據(jù)權利要求11所述的系統(tǒng),其特征在于,所述排序系統(tǒng)具體包括第二設置模塊,用于設置地理位置信息的權重;第一設置模塊,用于設定據(jù)以進行聚類的各類特征數(shù)據(jù)的權重;查詢模塊,用于針對已獲得的每一條檢索結果,查詢每一網(wǎng)絡用戶對每一條檢索結果 的歷史點選記錄;統(tǒng)計模塊,用于統(tǒng)計獲得的每一個檢索結果的歷史點選記錄,并以數(shù)據(jù)表的形式保存 于數(shù)據(jù)庫中;排序模塊,用于當某一特定網(wǎng)絡用戶搜索時,對于返回的檢索結果,查詢與所述網(wǎng)絡用 戶同一聚類的所有用戶的歷史點選記錄,并根據(jù)所述地理位置信息的權重和據(jù)以進行聚類 的各類特征數(shù)據(jù)的權重,計算各條檢索結果的等級值,根據(jù)計算出的等級值按照從大到小 的順序?qū)z索結果進行排序。
全文摘要
本申請公開了一種應用于電子商務網(wǎng)站的信息匹配方法和系統(tǒng),所述方法包括搜索引擎服務器收集網(wǎng)絡用戶的每一類網(wǎng)絡行為的特征數(shù)據(jù),分別針對每一類網(wǎng)絡行為按照所述特征數(shù)據(jù)對網(wǎng)絡用戶進行聚類,設定據(jù)以進行聚類的各類特征數(shù)據(jù)的權重。接收某一特定網(wǎng)絡用戶的搜索請求,并根據(jù)所述搜索請求搜索獲得若干條搜索結果。查詢所述特定用戶所屬聚類中所有網(wǎng)絡用戶對所述每一條搜索結果的歷史點選記錄。根據(jù)所述所有網(wǎng)絡用戶的歷史點選記錄以及據(jù)以進行聚類的各類特征數(shù)據(jù)的權重計算獲得所述若干條搜索結果的等級值。按照所述等級值由大到小對所述搜索結果進行排序,并將排序后的搜索結果返回給特定用戶的用戶終端。
文檔編號G06F17/30GK101996215SQ200910171350
公開日2011年3月30日 申請日期2009年8月27日 優(yōu)先權日2009年8月27日
發(fā)明者劉青焱, 葉一火, 吳鵬松, 張旭 申請人:阿里巴巴集團控股有限公司