專利名稱:一種訊價方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,具體涉及ー種訊價方法及裝置。
背景技術(shù):
隨著電子商務技術(shù)的不斷發(fā)展,網(wǎng)上購物方式逐漸被人們所接受,比價購物網(wǎng)站也隨之應運而生,比價購物網(wǎng)站一般都集成有多個供應商(泛指B2C商城,例如京東、當當、亞馬遜、蘇寧易購等)的商品信息(例如商品圖片、規(guī)格參數(shù)、價格、庫存狀態(tài)等),其為用戶提供訊價服務的過程可描述如下首先,用戶登錄比價購物網(wǎng)站,并在關(guān)鍵詞捜索欄中輸入訊價對象,點擊搜索按鈕之后,比價購物網(wǎng)站服務器就會將其集成的不同供應商網(wǎng)站對該訊價對象的商品概述信息(例如商品圖片、供應商、價格)結(jié)果集合呈現(xiàn)用戶;其次,用戶還可點擊查看某個供應商網(wǎng)站對訊價對象的詳細商品信息,對此目前的比價購物網(wǎng)站提供了以下兩種實現(xiàn)方式ー種是,直接將該供應商網(wǎng)站保存在比價購物網(wǎng)站服務器的詳細商品信息顯示給用戶查看。因為供應商網(wǎng)站可能會不定期的調(diào)整商品信息,因此如果僅將其保存在比價購物網(wǎng)站服務器內(nèi)的商品信息顯示給用戶,則有可能出現(xiàn)商品信息不準確的問題。為此,比價購物網(wǎng)站服務器會定期去各供應商網(wǎng)站抓取新的商品信息,用以更新服務器保存的信息,這種方式雖能在一定程度上緩解商品信息顯示不準確的問題,但卻仍無法避免這ー問題的出現(xiàn)。另ー種是,在用戶請求查看詳細的商品信息時,直接通過比較購物網(wǎng)站服務器跳轉(zhuǎn)到供應商網(wǎng)站,由供應商網(wǎng)站服務器向用戶推送商品信息并顯示給用戶查看。這種方式雖能保證商品信息的準確性,但是因為用戶要在不同供應商網(wǎng)站上下單購物,因此要在不同供應商網(wǎng)站注冊,購物過程繁瑣,影響了用戶購物體驗。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種訊價方法及裝置,以實現(xiàn)向用戶實時顯示訊價對象正確價格的目的。為此,本發(fā)明實施例提供如下技術(shù)方案一種訊價方法,其特征在于,所述方法用于使比價購物網(wǎng)站實時顯示訊價對象的正確價格信息,所述方法包括根據(jù)URL識別用戶要訪問的供應商網(wǎng)站的身份信息;獲取具有所述身份信息的供應商網(wǎng)站的信息抓取規(guī)則,并按照所述信息抓取規(guī)則從所述供應商網(wǎng)站抓取所述URL對應的商品信息;確定具有所述身份信息的供應商網(wǎng)站的解析正則,并利用所述解析正則從所述商品信息中解析出價格信息,回傳至客戶端顯示。優(yōu)化的,所述根據(jù)URL識別用戶要訪問的供應商網(wǎng)站的身份信息,具體包括
從所述URL中提取供應商網(wǎng)站的域名信息;根據(jù)所述域名信息從數(shù)據(jù)庫中查找所述供應商網(wǎng)站的身份信息,所述數(shù)據(jù)庫用于保存所述供應商網(wǎng)站的域名信息與身份信息之間的對應關(guān)系。優(yōu)化的,所述按照所述信息抓取規(guī)則從所述供應商網(wǎng)站抓取所述URL對應的商品信息,具體包括組織信息抓取參數(shù),所述信息抓取參數(shù)包括所述信息抓取規(guī)則、供應商網(wǎng)站的身份信息和URL ;向具有所述身份信息的供應商網(wǎng)站發(fā)送包含所述信息抓取參數(shù)的抓取請求,以從所述供應商網(wǎng)站抓取所述URL對應的商品信息。優(yōu)化的,所述信息抓取參數(shù)還包括區(qū)域信息和/或時效信息; 如果所述信息抓取參數(shù)中包含所述區(qū)域信息,則利用所述解析正則能從所述商品信息中解析出區(qū)域庫存狀態(tài);如果所述信息抓取參數(shù)中包含所述時效信息,則利用所述解析正則能從所述商品信息中解析出所述價格信息的時效信息。優(yōu)化的,確定所述區(qū)域信息的方式為獲取客戶端用戶的IP地址,并查詢所述IP地址的歸屬地,將所述歸屬地作為所述區(qū)域信息;或者,接收客戶端用戶輸入的城市信息,將所述城市信息作為所述區(qū)域信息。優(yōu)化的,所述解析正則存儲在配置文件中,且與所述供應商網(wǎng)站的身份信息相對應,則確定所述解析正則的方式為在需要解析所述商品信息時,根據(jù)所述身份信息從所述配置文件中提取所述解析正則。優(yōu)化的,所述方法還包括在所述價格信息和/或庫存狀態(tài)和/或時效信息變化時,實時更新所述比價購物網(wǎng)站保存的商品信息。一種訊價裝置,所述裝置用于使比價購物網(wǎng)站實時顯示訊價對象的正確價格信息,所述裝置包括識別單元,用于根據(jù)URL識別用戶要訪問的供應商網(wǎng)站的身份信息;規(guī)則獲取単元,用于獲取具有所述身份信息的供應商網(wǎng)站的信息抓取規(guī)則;信息抓取単元,用于按照所述信息抓取規(guī)則從所述供應商網(wǎng)站抓取所述URL對應的商品信息;解析単元,用于確定具有所述身份信息的供應商網(wǎng)站的解析正則,并利用所述解析正則從所述商品信息中解析出價格信息,回傳至客戶端顯示。優(yōu)化的,所述識別單元具體包括域名提取單元,用于從所述URL中提取供應商網(wǎng)站的域名信息;查找單元,用于根據(jù)所述域名信息從數(shù)據(jù)庫中查找所述供應商網(wǎng)站的身份信息,所述數(shù)據(jù)庫用于保存所述供應商網(wǎng)站的域名信息與身份信息之間的對應關(guān)系。優(yōu)化的,所述信息抓取單元具體包括參數(shù)組織單元,用于組織信息抓取參數(shù),所述信息抓取參數(shù)包括所述信息抓取規(guī)貝1J、供應商網(wǎng)站的身份信息和URL ;信息抓取子単元,用于向具有所述身份信息的供應商網(wǎng)站發(fā)送包含所述信息抓取參數(shù)的抓取請求,以從所述供應商網(wǎng)站抓取所述URL對應的商品信息。優(yōu)化的,所述參數(shù)組織單元組織的信息抓取參數(shù)中還包括區(qū)域信息和/或時效信息;如果所述信息抓取參數(shù)中包含所述區(qū)域信息,則所述解析単元利用所述解析正則還能從所述商品信息中解析出區(qū)域庫存狀態(tài);如果所述信息抓取參數(shù)中包含所述時效信息,則所述解析単元利用所述解析正則還能從所述商品信息中解析出所述價格信息的時效信息。優(yōu)化的,所述信息抓取單元還包括 第一區(qū)域信息獲取單元,用于獲取客戶端用戶的IP地址,并查詢所述IP地址的歸屬地,將所述歸屬地作為所述區(qū)域信息;或者,第二區(qū)域信息獲取單元,用于接收客戶端用戶輸入的城市信息,將所述城市信息作為所述區(qū)域信息。優(yōu)化的,所述解析正則存儲在配置文件中,且與所述供應商網(wǎng)站的身份信息相對應,則所述解析單元確定所述解析正則的方式為在需要解析所述商品信息時,根據(jù)所述身份信息從所述配置文件中提取所述解析正則。優(yōu)化的,所述裝置還包括更新単元,用于在所述價格信息和/或庫存狀態(tài)和/或時效信息變化時,實時更新所述比價購物網(wǎng)站保存的商品信息。本發(fā)明實施例訊價方法及裝置,比價購物網(wǎng)站服務器可以根據(jù)用戶點擊的鏈接地址確定用戶要訪問的供應商網(wǎng)站,然后直接去該供應商網(wǎng)站抓取用戶想要查看的商品信息,并從中解析出商品價格信息顯示給用戶查看。這樣,用戶不僅可以通過比價購物網(wǎng)站獲得該商品在該供應商網(wǎng)站的實時價格,還可直接在比價購物網(wǎng)站下單,簡化了購物流程,提升了用戶購物體驗。
為了更清楚地說明本申請實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請中記載的ー些實施例,對于本領(lǐng)域普通技術(shù)人員來講,還可以根據(jù)這些附圖獲得其他的附圖。圖I是以列表方式向用戶顯示商品概述信息的示意圖;圖2是本發(fā)明實施例訊價方法實施例I的流程圖;圖3是本發(fā)明實施例訊價方法實施例2的流程圖;圖4是本發(fā)明實施例訊價裝置實施例I的示意圖;圖5是本發(fā)明實施例訊價裝置實施例2的示意圖。
具體實施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面結(jié)合附圖和實施方式對本發(fā)明實施例作進ー步的詳細說明。首先,對本發(fā)明實施例訊價方法及裝置的應用場景進行簡單介紹。在客戶端用戶登錄比價購物網(wǎng)站后,可以在關(guān)鍵詞搜索欄中輸入訊價對象,例如用戶輸入的訊價對象為“iPhone 4s”,則在用戶點擊捜索按鈕后,比價購物網(wǎng)站就會將其服務器內(nèi)存儲的不同供應商關(guān)于“iPhone 4s”的概述信息結(jié)果結(jié)合回傳至客戶端,以列表方式顯示給用戶查看,參見圖I所示的列表顯示示意圖,此時用戶可查看到的信息包括商品圖片、供應商以及價格等基本信息。如果用戶查看顯示列表比價后,想進ー步查看某個供應商針對“iphone 4s”的詳 細商品介紹信息,則可點擊商品鏈接地址(可鏈接在商品圖片和/或鏈接在商品名稱),跳轉(zhuǎn)到商品信息詳細介紹頁面。與現(xiàn)有技術(shù)不同,本發(fā)明技術(shù)方案在跳轉(zhuǎn)到詳細介紹頁面后,比價購物網(wǎng)站不僅可以向用戶提供訊價對象正確的價格信息,還能向用戶提供本地網(wǎng)站下單的服務。 下面詳細介紹本發(fā)明提供的訊價方法的具體實現(xiàn)過程。參見圖2,示出了本發(fā)明實施例訊價方法實施例I的流程圖,所述方法包括步驟101,根據(jù)URL識別用戶要訪問的供應商網(wǎng)站的身份信息。在用戶點擊商品鏈接地址之后,比價購物網(wǎng)站服務器就可獲取到用戶當前要訪問的商品的URL (Uniform/Universal Resource Locator,網(wǎng)頁地址,URL是因特網(wǎng)上標準的資源的地址),因為URL中包含有要訪問的網(wǎng)站的域名,因此可以通過URL識別用戶當前要訪問的商品源于哪個供應商網(wǎng)站,具體識別過程為首先,從所述URL中提取供應商網(wǎng)站的域名信息。完整的URL可包括協(xié)議名、域名、站點名、文件名、參數(shù),對于ー個符合規(guī)范的合法URL來說,比價購物網(wǎng)站服務器是可從中提取出域名信息的。例如,完整的URL 為 http://www. test, com/aaa/bbb. aspx id = 5&name =kelli,則“http://”即為協(xié)議名,www. test, com即為域名,“aaa”即為站點名,“bbb. aspx”即為頁面名(也就是文件名),“id = 5&name = kelli”即為參數(shù)。其次,根據(jù)所述域名信息從數(shù)據(jù)庫中查找所述供應商網(wǎng)站的身份信息,所述數(shù)據(jù)庫用于保存所述供應商網(wǎng)站的域名信息與身份信息之間的對應關(guān)系。本發(fā)明的訊價方法預先設(shè)置有ー個數(shù)據(jù)庫,用以保存域名信息與供應商網(wǎng)站身份信息間的對應關(guān)系,只要提取獲得域名信息,即可從該預置的數(shù)據(jù)庫中查找出與之對應的供應商網(wǎng)站的身份信息,從而比價購物網(wǎng)站服務器就可確定出用戶當前要訪問的是哪個供應商網(wǎng)站,識別出供應商網(wǎng)站的身份信息,就為實時抓取商品信息做好了技術(shù)準備。當然,如果未在數(shù)據(jù)庫中查找到與域名信息相對應的供應商網(wǎng)站的身份信息,即可終止訊價過程并提示用戶。需要說明的是,在依據(jù)域名信息查找到供應商網(wǎng)站后,還可獲取該供應商網(wǎng)站的商品URL正則表達式,對提取的URL的格式進行合法性和有效性檢測,如果URL格式符合規(guī)范且是有效,則繼續(xù)下述的訊價流程,否則直接終止訊價流程,并提示用戶URL地址出錯。例如供貨商URL Γ供貨商商品URL正則
360buy. comhttp://\\w+. 360buy. com/\\d+. html|http://www. 360buy. com/product/\\d+. html
dangdang.comhttp://product, dangdang. com/\\wroduct. aspx\\ product id = \\d+以360buy. com供貨商的URL正則為例,下面對URL格式進行舉例說明,http://www. 360buy. com/product/1000023352. html 即是符合正則規(guī)范的 URL,或 http://book. 360buy. com/11041484, html 亦符合正則,但對 http://mvd. 360buy. com/ 來說則不符合上述正則,此時就可終止訊價流程,向用戶提示URL地址錯誤。步驟102,獲取具有所述身份信息的供應商網(wǎng)站的信息抓取規(guī)則,并按照所述信息抓取規(guī)則從所述供應商網(wǎng)站抓取所述URL對應的商品信息。在步驟101確定出用戶要訪問的供應商網(wǎng)站后,為了能向用戶提供商品的 正確價格,比價購物網(wǎng)站服務器要實時的去該供應器網(wǎng)站抓取商品信息,以便從中解析出商品價格,為此,比價購物網(wǎng)站服務器至少需要知曉要去哪個供應商網(wǎng)站抓取(已通過網(wǎng)站的身份信息確定,具體地,可為每個供應商網(wǎng)站分配一個代碼,則服務器在此知曉的就是ー個代碼)、在該網(wǎng)站抓取哪件商品的信息(可通過URL體現(xiàn))、該網(wǎng)站的抓取規(guī)則是什么(因為不同供應商網(wǎng)站的訪問方式不盡相同,或為get方式或為post方式,為了準確抓取到網(wǎng)站的商品信息,服務器還需要明確其去網(wǎng)站抓取數(shù)據(jù)的規(guī)則為get方式還是post方式)。比價購物網(wǎng)站服務器明確上述內(nèi)容之后,即可去用戶想要訪問的供應商網(wǎng)站實時抓取商品信息,具體抓取方式此處暫不詳述。步驟103,確定具有所述身份信息的供應商網(wǎng)站的解析正則,并利用所述解析正則從所述商品信息中解析出價格信息,回傳至客戶端顯示。在步驟102抓取到用戶想要訪問的供應商網(wǎng)站針對訊價對象的詳細商品信息后,即可從中解析獲得實時的價格信息。一般情況下,供應商可能會根據(jù)市場需求調(diào)整商品價格,而不太會調(diào)整其它信息(例如商品圖片、規(guī)格參數(shù)等),另外,訊價用戶最為關(guān)心的可能也是商品的價格,因此本發(fā)明可以只從抓取到商品信息中解析出價格信息,發(fā)送至客戶端顯示給用戶查看。具體地,用于解析商品信息的解析正則,可直接寫到訊價過程的源程序代碼中;也可與源程序代碼分離,將解析正則預先存儲在配置文件中,在需要時去配置文件中提取。因為供應商網(wǎng)站可能出現(xiàn)改版情況,這種將解析正則與源代碼分離的處理方式,就能有效解決供應商網(wǎng)站頻繁改版造成的后期維護困難問題。不同供應商的商品信息版面風格是不同的,這就決定了每個供應商的解析正則也是有差異的。例如當當網(wǎng)解析格式
權(quán)利要求
1.一種訊價方法,其特征在于,所述方法用于使比價購物網(wǎng)站實時顯示訊價對象的正確價格信息,所述方法包括 根據(jù)URL識別用戶要訪問的供應商網(wǎng)站的身份信息; 獲取具有所述身份信息的供應商網(wǎng)站的信息抓取規(guī)則,并按照所述信息抓取規(guī)則從所述供應商網(wǎng)站抓取所述URL對應的商品信息; 確定具有所述身份信息的供應商網(wǎng)站的解析正則,并利用所述解析正則從所述商品信息中解析出價格信息,回傳至客戶端顯示。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述根據(jù)URL識別用戶要訪問的供應商網(wǎng)站的身份信息,具體包括 從所述URL中提取供應商網(wǎng)站的域名信息; 根據(jù)所述域名信息從數(shù)據(jù)庫中查找所述供應商網(wǎng)站的身份信息,所述數(shù)據(jù)庫用于保存所述供應商網(wǎng)站的域名信息與身份信息之間的對應關(guān)系。
3.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述按照所述信息抓取規(guī)則從所述供應商網(wǎng)站抓取所述URL對應的商品信息,具體包括 組織信息抓取參數(shù),所述信息抓取參數(shù)包括所述信息抓取規(guī)則、供應商網(wǎng)站的身份信息和URL ; 向具有所述身份信息的供應商網(wǎng)站發(fā)送包含所述信息抓取參數(shù)的抓取請求,以從所述供應商網(wǎng)站抓取所述URL對應的商品信息。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述信息抓取參數(shù)還包括區(qū)域信息和/或時效信息; 如果所述信息抓取參數(shù)中包含所述區(qū)域信息,則利用所述解析正則能從所述商品信息中解析出區(qū)域庫存狀態(tài); 如果所述信息抓取參數(shù)中包含所述時效信息,則利用所述解析正則能從所述商品信息中解析出所述價格信息的時效信息。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,確定所述區(qū)域信息的方式為 獲取客戶端用戶的IP地址,并查詢所述IP地址的歸屬地,將所述歸屬地作為所述區(qū)域信息;或者, 接收客戶端用戶輸入的城市信息,將所述城市信息作為所述區(qū)域信息。
6.根據(jù)權(quán)利要求1-5任一項所述的方法,其特征在于,所述解析正則存儲在配置文件中,且與所述供應商網(wǎng)站的身份信息相對應,則確定所述解析正則的方式為 在需要解析所述商品信息時,根據(jù)所述身份信息從所述配置文件中提取所述解析正貝1J。
7.根據(jù)權(quán)利要求1-5任一項所述的方法,其特征在于,所述方法還包括 在所述價格信息和/或庫存狀態(tài)和/或時效信息變化時,實時更新所述比價購物網(wǎng)站保存的商品信息。
8.一種訊價裝置,其特征在于,所述裝置用于使比價購物網(wǎng)站實時顯示訊價對象的正確價格信息,所述裝置包括 識別單元,用于根據(jù)URL識別用戶要訪問的供應商網(wǎng)站的身份信息; 規(guī)則獲取単元,用于獲取具有所述身份信息的供應商網(wǎng)站的信息抓取規(guī)則;信息抓取単元,用于按照所述信息抓取規(guī)則從所述供應商網(wǎng)站抓取所述URL對應的商品ィ目息; 解析単元,用于確定具有所述身份信息的供應商網(wǎng)站的解析正則,并利用所述解析正則從所述商品信息中解析出價格信息,回傳至客戶端顯示。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述識別単元具體包括 域名提取單元,用于從所述URL中提取供應商網(wǎng)站的域名信息; 查找單元,用于根據(jù)所述域名信息從數(shù)據(jù)庫中查找所述供應商網(wǎng)站的身份信息,所述數(shù)據(jù)庫用于保存所述供應商網(wǎng)站的域名信息與身份信息之間的對應關(guān)系。
10.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述信息抓取単元具體包括 參數(shù)組織單元,用于組織信息抓取參數(shù),所述信息抓取參數(shù)包括所述信息抓取規(guī)則、供應商網(wǎng)站的身份信息和URL ; 信息抓取子単元,用于向具有所述身份信息的供應商網(wǎng)站發(fā)送包含所述信息抓取參數(shù)的抓取請求,以從所述供應商網(wǎng)站抓取所述URL對應的商品信息。
11.根據(jù)權(quán)利要求10所述的裝置,其特征在干, 所述參數(shù)組織單元組織的信息抓取參數(shù)中還包括區(qū)域信息和/或時效信息; 如果所述信息抓取參數(shù)中包含所述區(qū)域信息,則所述解析単元利用所述解析正則還能從所述商品信息中解析出區(qū)域庫存狀態(tài); 如果所述信息抓取參數(shù)中包含所述時效信息,則所述解析単元利用所述解析正則還能從所述商品信息中解析出所述價格信息的時效信息。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述信息抓取單元還包括 第一區(qū)域信息獲取單元,用于獲取客戶端用戶的IP地址,并查詢所述IP地址的歸屬地,將所述歸屬地作為所述區(qū)域信息;或者, 第二區(qū)域信息獲取單元,用于接收客戶端用戶輸入的城市信息,將所述城市信息作為所述區(qū)域信息。
13.根據(jù)權(quán)利要求8-12任一項所述的裝置,其特征在于,所述解析正則存儲在配置文件中,且與所述供應商網(wǎng)站的身份信息相對應,則所述解析單元確定所述解析正則的方式為 在需要解析所述商品信息時,根據(jù)所述身份信息從所述配置文件中提取所述解析正貝1J。
14.根據(jù)權(quán)利要求8-12任一項所述的裝置,其特征在于,所述裝置還包括 更新単元,用于在所述價格信息和/或庫存狀態(tài)和/或時效信息變化吋,實時更新所述比價購物網(wǎng)站保存的商品信息。
全文摘要
本發(fā)明提供一種訊價方法及裝置,所述方法用于使比價購物網(wǎng)站實時顯示訊價對象的正確價格信息,所述方法包括根據(jù)URL識別用戶要訪問的供應商網(wǎng)站的身份信息;獲取具有所述身份信息的供應商網(wǎng)站的信息抓取規(guī)則,并按照所述信息抓取規(guī)則從所述供應商網(wǎng)站抓取所述URL對應的商品信息;確定具有所述身份信息的供應商網(wǎng)站的解析正則,并利用所述解析正則從所述商品信息中解析出價格信息,回傳至客戶端顯示。如此技術(shù)方案,用戶不僅可以通過比價購物網(wǎng)站獲得該商品在該供應商網(wǎng)站的實時價格,還可直接在比價購物網(wǎng)站下單,簡化了購物流程,提升了用戶購物體驗。
文檔編號G06Q30/02GK102867266SQ20121030862
公開日2013年1月9日 申請日期2012年8月27日 優(yōu)先權(quán)日2012年8月27日
發(fā)明者蔣世芳, 劉義, 張海旭, 張宇, 譚肖 申請人:北京聯(lián)時空網(wǎng)絡通信設(shè)備有限公司