亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種商品價格預(yù)測方法及裝置的制造方法

文檔序號:10512984閱讀:195來源:國知局
一種商品價格預(yù)測方法及裝置的制造方法
【專利摘要】本發(fā)明公開了一種商品價格預(yù)測方法及裝置。該商品價格預(yù)測方法包括以下步驟:確定用戶待預(yù)測價格的目標商品;獲得所述用戶針對所述目標商品的成交價格數(shù)據(jù);獲得影響所述目標商品價格的價格參考數(shù)據(jù);對所述成交價格數(shù)據(jù)及所述價格參考數(shù)據(jù)進行預(yù)處理,獲得與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù);將所述輸入數(shù)據(jù)輸入到所述預(yù)測模型中,獲得所述目標商品的預(yù)測價格。應(yīng)用本發(fā)明實施例所提供的技術(shù)方案,在對目標商品的價格進行預(yù)測時,同時考慮了成交價格數(shù)據(jù)和價格參考數(shù)據(jù),可以提高預(yù)測準確性,為用戶的實際操作行為提供有效參考。
【專利說明】
一種商品價格預(yù)測方法及裝置
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及計算機技術(shù)領(lǐng)域,特別是涉及一種商品價格預(yù)測方法及裝置。
【背景技術(shù)】
[0002]商品價格預(yù)測,是指根據(jù)相關(guān)的價格信息,運用科學(xué)方法,對商品價格變化動態(tài)進行分析和判斷,得到商品的預(yù)測價格。對商品價格進行預(yù)測,有助于購買者根據(jù)預(yù)測的商品價格確定是否執(zhí)行購買行為,或者確定購買商品的數(shù)量。隨著計算機技術(shù)的快速發(fā)展,商品價格預(yù)測受到了越來越多的關(guān)注。
[0003]目前,在針對購買者進行某商品的價格預(yù)測時,使用的數(shù)據(jù)是購買者自身購買該商品的成交價格數(shù)據(jù),根據(jù)某一時間段該商品的成交價格的起伏變化預(yù)測該商品下一時間段的價格。
[0004]這種預(yù)測方法存在一定的問題,因為影響商品價格的因素較多,單純依靠購買者自身購買商品的成交價格數(shù)據(jù)進行預(yù)測,比較片面,預(yù)測結(jié)果準確性較低,使得預(yù)測結(jié)果難以成為購買者購買商品的有效參考。

【發(fā)明內(nèi)容】

[0005]為解決上述技術(shù)問題,本發(fā)明提供一種商品價格預(yù)測方法及裝置。
[0006]—種商品價格預(yù)測方法,包括:
[0007]確定用戶待預(yù)測價格的目標商品;
[0008]獲得所述用戶針對所述目標商品的成交價格數(shù)據(jù);
[0009]獲得影響所述目標商品價格的價格參考數(shù)據(jù);
[0010]對所述成交價格數(shù)據(jù)及所述價格參考數(shù)據(jù)進行預(yù)處理,獲得與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù);
[0011]將所述輸入數(shù)據(jù)輸入到所述預(yù)測模型中,獲得所述目標商品的預(yù)測價格。
[0012]在本發(fā)明的一種【具體實施方式】中,所述價格參考數(shù)據(jù)包括各廠家報價數(shù)據(jù)、供求關(guān)系數(shù)據(jù)、價格評價數(shù)據(jù)中的至少一種。
[0013]在本發(fā)明的一種【具體實施方式】中,所述獲得影響所述目標商品價格的價格參考數(shù)據(jù),包括:
[0014]利用網(wǎng)絡(luò)爬蟲技術(shù)獲得影響所述目標商品價格的價格參考數(shù)據(jù)。
[0015]在本發(fā)明的一種【具體實施方式】中,所述利用網(wǎng)絡(luò)爬蟲技術(shù)獲得影響所述目標商品價格的價格參考數(shù)據(jù),包括:
[0016]根據(jù)所述目標商品的類型,確定所述目標商品的搜索關(guān)鍵字和待爬取的網(wǎng)頁;
[0017]根據(jù)所述搜索關(guān)鍵字,從所述待爬取的網(wǎng)頁上爬取影響所述目標商品價格的價格參考數(shù)據(jù)。
[0018]在本發(fā)明的一種【具體實施方式】中,所述對所述成交價格數(shù)據(jù)和所述價格參考數(shù)據(jù)進行預(yù)處理,獲得與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù),包括:
[0019]對所述價格參考數(shù)據(jù)進行數(shù)據(jù)清洗;
[0020]將所述成交價格數(shù)據(jù)及進行數(shù)據(jù)清洗后的價格參考數(shù)據(jù)進行結(jié)構(gòu)化處理;
[0021]提取與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù)。
[0022]一種商品價格預(yù)測裝置,包括:
[0023]目標商品確定模塊,用于確定用戶待預(yù)測價格的目標商品;
[0024]成交價格數(shù)據(jù)獲得模塊,用于獲得所述用戶針對所述目標商品的成交價格數(shù)據(jù);
[0025]價格參考數(shù)據(jù)獲得模塊,用于獲得影響所述目標商品價格的價格參考數(shù)據(jù);
[0026]輸入數(shù)據(jù)獲得模塊,用于對所述成交價格數(shù)據(jù)及所述價格參考數(shù)據(jù)進行預(yù)處理,獲得與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù);
[0027]預(yù)測價格獲得模塊,用于將所述輸入數(shù)據(jù)輸入到所述預(yù)測模型中,獲得所述目標商品的預(yù)測價格。
[0028]在本發(fā)明的一種【具體實施方式】中,所述價格參考數(shù)據(jù)包括各廠家報價數(shù)據(jù)、供求關(guān)系數(shù)據(jù)、價格評價數(shù)據(jù)中的至少一種。
[0029]在本發(fā)明的一種【具體實施方式】中,所述價格參考數(shù)據(jù)獲得模塊,包括:
[0030]爬蟲子模塊,用于利用網(wǎng)絡(luò)爬蟲技術(shù)獲得影響所述目標商品價格的價格參考數(shù)據(jù)。
[0031]在本發(fā)明的一種【具體實施方式】中,所述爬蟲子模塊,具體用于:
[0032]根據(jù)所述目標商品的類型,確定所述目標商品的搜索關(guān)鍵字和待爬取的網(wǎng)頁;
[0033]根據(jù)所述搜索關(guān)鍵字,從所述待爬取的網(wǎng)頁上爬取影響所述目標商品價格的價格參考數(shù)據(jù)。
[0034]在本發(fā)明的一種【具體實施方式】中,所述輸入數(shù)據(jù)獲得模塊,具體用于:
[0035]對所述價格參考數(shù)據(jù)進行數(shù)據(jù)清洗;
[0036]將所述成交價格數(shù)據(jù)及進行數(shù)據(jù)清洗后的價格參考數(shù)據(jù)進行結(jié)構(gòu)化處理;
[0037]提取與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù)。
[0038]本發(fā)明實施例所提供的技術(shù)方案,確定用戶待預(yù)測價格的目標商品后,獲得用戶針對該目標商品的成交價格數(shù)據(jù)及影響目標商品價格的價格參考數(shù)據(jù),對成交價格數(shù)據(jù)和價格參考數(shù)據(jù)進行預(yù)處理后,獲得與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù),進行目標商品價格的預(yù)測。相比于現(xiàn)有技術(shù),本發(fā)明實施例所提供的技術(shù)方案在對目標商品的價格進行預(yù)測時,同時考慮了成交價格數(shù)據(jù)和價格參考數(shù)據(jù),可以提高預(yù)測準確性,為用戶的實際操作行為提供有效參考。
【附圖說明】
[0039]為了更清楚的說明本發(fā)明實施例或現(xiàn)有技術(shù)的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單的介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0040]圖1為本發(fā)明實施例中商品價格預(yù)測方法的一種實施流程圖;
[0041 ]圖2為本發(fā)明實施例中使用預(yù)測模型的一種實施流程圖;
[0042]圖3為本發(fā)明實施例中商品價格預(yù)測裝置的一種結(jié)構(gòu)示意圖。
【具體實施方式】
[0043]本發(fā)明的核心是提供一種商品價格預(yù)測方法及裝置,以提高商品價格預(yù)測的準確性。
[0044]為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面結(jié)合附圖和【具體實施方式】對本發(fā)明作進一步的詳細說明。顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0045]參見圖1所示,為本發(fā)明實施例所提供的一種商品價格預(yù)測方法的實施流程圖,該方法可以包括以下步驟:
[0046]SI 10:確定用戶待預(yù)測價格的目標商品。
[0047]在本發(fā)明實施例中,用戶可以是購買者,還可以是銷售者。當用戶為購買者,需要購買某商品或者確定購買該商品的數(shù)量時,或者當用戶為銷售者,要調(diào)整該商品價格或者確定提供該商品的數(shù)量時,都可以應(yīng)用本發(fā)明實施例所提供的商品價格預(yù)測方法,對該商品的價格進行預(yù)測,將預(yù)測價格作為實際操作行為的有效參考。為描述方便,以下對于本發(fā)明實施例所提供的技術(shù)方案的描述,均以用戶為購買者為例進行說明。
[0048]待預(yù)測價格的目標商品可以根據(jù)用戶指令進行確定。比如,用戶每隔一段時間都要對某商品執(zhí)行一次購買行為,在當前時刻,用戶需要參考該商品的預(yù)測價格確定購買該商品的數(shù)量或者確定是否購買該商品,可以發(fā)出針對目標商品進行價格預(yù)測的指令。在實際應(yīng)用中,可以為用戶提供一個輸入接口,用戶根據(jù)自身需要通過該輸入接口輸入待預(yù)測價格的商品。如通過網(wǎng)頁或者應(yīng)用軟件輸出展示輸入框或選擇框,用戶根據(jù)自身需要從輸入框中輸入待預(yù)測價格的商品或者從選擇框中選擇待預(yù)測價格的商品。
[0049]如果用戶僅指定一個,則可以直接將用戶指定的該商品確定為待預(yù)測價格的目標商品;如果用戶指定多個商品,則可以逐一將用戶指定的商品確定為待預(yù)測價格的目標商品O
[0050]S120:獲得用戶針對目標商品的成交價格數(shù)據(jù)。
[0051 ]對于一個商品而言,在當前時刻之前的一個時間段內(nèi),用戶購買該商品的成交價格是確定存在的,為確定信息。
[0052]用戶針對目標商品的成交價格數(shù)據(jù)可以由用戶提供,即接收用戶輸入的針對該目標商品的成交價格數(shù)據(jù)。或者,在用戶每次購買目標商品之后,即在預(yù)設(shè)的記錄表中記錄當次購買目標商品的成交價格,當確定用戶待預(yù)測價格的目標商品時,即從該記錄表中獲得用戶針對該目標商品的成交價格數(shù)據(jù)。
[0053]S130:獲得影響目標商品價格的價格參考數(shù)據(jù)。
[0054]可以理解的是,商品價格可能會受到多種因素影響,在本發(fā)明的一種【具體實施方式】中,價格參考數(shù)據(jù)可以包括各廠家報價數(shù)據(jù)、供求關(guān)系數(shù)據(jù)、價格評價數(shù)據(jù)中的至少一種。當然,還可以包括其他價格影響因素數(shù)據(jù),如預(yù)設(shè)時間段內(nèi)不同地理區(qū)域中該商品的價格走勢數(shù)據(jù)等。
[0055]其中,各廠家報價數(shù)據(jù)可以為不同地理區(qū)域、不同廠家針對目標商品的報價數(shù)據(jù);供求關(guān)系數(shù)據(jù)可以為針對該目標商品的供求量之間的關(guān)系數(shù)據(jù);價格評價數(shù)據(jù)可以為特定人員對目標商品的價格的評價,可以包括價格日評價數(shù)據(jù)、價格周評價數(shù)據(jù)、價格月評價數(shù)據(jù)等。
[0056]在步驟SllO確定用戶待預(yù)測價格的目標商品后,可以進一步獲得影響該目標商品價格的價格參考數(shù)據(jù)。
[0057]在實際應(yīng)用中,影響目標商品價格的價格參考數(shù)據(jù)可以由運營人員人工獲得,還可以利用搜索技術(shù)自動在互聯(lián)網(wǎng)上搜索而獲得。
[0058]需要說明的是,本發(fā)明實施例對于步驟S120和步驟S130的執(zhí)行順序不做限制,可以順序執(zhí)行,還可以同時執(zhí)行。
[0059]在實際應(yīng)用中,用戶針對目標商品的成交價格數(shù)據(jù)及影響目標商品價格的價格參考數(shù)據(jù)均可以是一個逐漸累積的過程,在還未接收到用戶針對目標商品價格的預(yù)測指令時,就可以根據(jù)用戶的歷史預(yù)測指令對相應(yīng)商品的成交價格數(shù)據(jù)及價格參數(shù)數(shù)據(jù)進行收集和整理,當接收到用戶針對目標商品的價格的預(yù)測指令時,對于已經(jīng)收集和整理的數(shù)據(jù)不需要再次收集,只需要收集新的相關(guān)數(shù)據(jù)即可。這樣可以節(jié)省預(yù)測價格的時間,提高效率。
[0060]S140:對成交價格數(shù)據(jù)及價格參考數(shù)據(jù)進行預(yù)處理,獲得與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù)。
[0061]在本發(fā)明實施例中,預(yù)測模型可以為灰色時間序列預(yù)測模型或者自回歸積分滑動平均模型,自回歸積分滑動平均模型也稱為ARIMA(Autoregressive Integrated MovingAverage)模型。當然,還可以是其他預(yù)測模型,或者多個預(yù)測模型的結(jié)合,本發(fā)明實施例對此不做限制。
[0062]可以理解的是,不同的預(yù)測模型其對于輸入數(shù)據(jù)具有不同的要求。比如,預(yù)測模型為灰色時間序列預(yù)測模型,其輸入數(shù)據(jù)需要為準光滑序列。
[0063]在步驟S120獲得的用戶針對目標商品的成交價格數(shù)據(jù)和步驟S130獲得的影響目標商品價格的價格參考數(shù)據(jù),可能是雜亂無章的,為使這些數(shù)據(jù)適應(yīng)預(yù)設(shè)的預(yù)測模型,需要對這些數(shù)據(jù)進行預(yù)處理,以獲得與預(yù)設(shè)的預(yù)測模型相匹配的輸入數(shù)據(jù)。
[0064]對目標商品的價格參考數(shù)據(jù)的預(yù)處理過程,可以包括對價格參考數(shù)據(jù)的抽取、轉(zhuǎn)換、加載、語義分析等,還可以包括對成交價格數(shù)據(jù)及價格參考數(shù)據(jù)的結(jié)構(gòu)化處理等。
[0065]獲得與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù)后,可以進一步執(zhí)行步驟S150的操作。
[0066]S150:將輸入數(shù)據(jù)輸入到預(yù)測模型中,獲得目標商品的預(yù)測價格。
[0067]在步驟S140對成交價格數(shù)據(jù)及價格參考數(shù)據(jù)進行預(yù)處理,獲得與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù)后,可以進一步將該輸入數(shù)據(jù)輸入到預(yù)測模型中,獲得該目標商品的預(yù)測價格。
[0068]為方便理解,以預(yù)測模型為灰色時間序列預(yù)測模型為例對步驟S150進行詳細說明。
[0069]通過步驟SllO至步驟S140的操作,獲得的與灰色時間序列預(yù)測模型匹配的輸入數(shù)據(jù),構(gòu)成了一個既包含確定信息又包含不確定信息的數(shù)據(jù)系統(tǒng),該數(shù)據(jù)系統(tǒng)具有一定的變化規(guī)律,尋求該變化規(guī)律,并弱化輸入數(shù)據(jù)的波動性,使灰色數(shù)據(jù)呈現(xiàn)出一定的規(guī)律,從而可以根據(jù)該規(guī)律建立相應(yīng)的微分方程,預(yù)測目標商品價格未來的發(fā)展趨勢,解方程后即可獲得該目標商品的預(yù)測價格。該過程可以利用MATLAB工具實現(xiàn)。
[0070]圖2所示為具體實現(xiàn)過程,該過程可以包括以下步驟:
[0071]S210:獲得輸入數(shù)據(jù);
[0072]S220:判斷該輸入數(shù)據(jù)是否為準光滑序列,如果是,則確定通過該輸入數(shù)據(jù)可建立灰色時間序列預(yù)測模型,繼續(xù)執(zhí)行步驟S230,否則,確定通過該輸入數(shù)據(jù)不可建立灰色時間序列預(yù)測模型,不做處理;
[0073]S230:生成累加序列;
[0074]S240:建立微分方程;
[0075]S250:解方程得到預(yù)測值,即得到目標商品的預(yù)測價格。
[0076]獲得目標商品的預(yù)測價格后,可以通過設(shè)定方式將該預(yù)測價格提供給用戶,比如通過Restful API服務(wù)方式將目標商品的預(yù)測價格輸出給網(wǎng)頁或者應(yīng)用軟件,由網(wǎng)頁或者應(yīng)用軟件為用戶輸出展示該目標商品的預(yù)測價格。
[0077]本發(fā)明實施例所提供的技術(shù)方案,確定用戶待預(yù)測價格的目標商品后,獲得用戶針對該目標商品的成交價格數(shù)據(jù)及影響目標商品價格的價格參考數(shù)據(jù),對成交價格數(shù)據(jù)和價格參考數(shù)據(jù)進行預(yù)處理后,獲得與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù),進行目標商品價格的預(yù)測。相比于現(xiàn)有技術(shù),本發(fā)明實施例所提供的技術(shù)方案在對目標商品的價格進行預(yù)測時,同時考慮了成交價格數(shù)據(jù)和價格參考數(shù)據(jù),可以提高預(yù)測準確性,為用戶的實際操作行為提供有效參考。
[0078]在實際應(yīng)用中,在對目標商品的價格進行預(yù)測時,可以重復(fù)執(zhí)行步驟S120至步驟S150的操作,利用多個預(yù)測模型,從而獲得針對該目標商品的多個預(yù)測價格,然后將多個預(yù)測價格進行平均處理,獲得該目標商品最終的預(yù)測價格,這樣,可以進一步提高商品預(yù)測價格的準確性。
[0079]另外,在對目標商品的價格進行預(yù)測時,可以針對不同時間粒度的成交價格數(shù)據(jù)及價格參考數(shù)據(jù)進行目標商品價格的預(yù)測。并按照數(shù)據(jù)的時間粒度向用戶展示相應(yīng)的預(yù)測結(jié)果。比如,按照天、周、月、年、十年等時間粒度的數(shù)據(jù)進行價格的預(yù)測。
[0080]在本發(fā)明的一個實施例中,步驟S130可以包括以下步驟:
[0081 ]利用網(wǎng)絡(luò)爬蟲技術(shù)獲得影響目標商品價格的價格參考數(shù)據(jù)。
[0082]隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)已經(jīng)成為大量信息的載體。網(wǎng)絡(luò)爬蟲,是按照一定的規(guī)則,自動爬取互聯(lián)網(wǎng)上的信息的程序或者腳本。在本發(fā)明實施例中,利用網(wǎng)絡(luò)爬蟲技術(shù)可以獲得影響目標商品價格的價格參考數(shù)據(jù)。如各廠家報價數(shù)據(jù)、供求關(guān)系數(shù)據(jù)、價格評價數(shù)據(jù)等。
[0083]在本發(fā)明的一種【具體實施方式】中,利用網(wǎng)絡(luò)爬蟲技術(shù)獲得目標商品的價格參考數(shù)據(jù),可以包括以下步驟:
[0084]步驟一:根據(jù)目標商品的類型,確定目標商品的搜索關(guān)鍵字和待爬取的網(wǎng)頁;
[0085]步驟二:根據(jù)搜索關(guān)鍵字,從待爬取的網(wǎng)頁上爬取影響目標商品價格的價格參考數(shù)據(jù)。
[0086]為方便描述,將上述兩個步驟結(jié)合起來進行說明。
[0087]可以理解的是,互聯(lián)網(wǎng)中各類網(wǎng)頁包含的信息量是巨大的,如果將互聯(lián)網(wǎng)上的所有網(wǎng)頁作為獲得價格參考數(shù)據(jù)的數(shù)據(jù)源,將會增大搜索難度和數(shù)據(jù)處理難度。而不同類型的商品,可以獲得的價格參考數(shù)據(jù)的數(shù)據(jù)源可能是不同的。比如,建材類商品,其價格參考數(shù)據(jù)的數(shù)據(jù)源可以是建材網(wǎng)站的網(wǎng)頁,化妝品類商品,其價格參考數(shù)據(jù)的數(shù)據(jù)源可以是百貨購物類網(wǎng)站的網(wǎng)頁。
[0088]在實際應(yīng)用中,可以預(yù)先設(shè)置商品類型與搜索關(guān)鍵字、待爬取網(wǎng)頁的對應(yīng)關(guān)系,并將該對應(yīng)關(guān)系存儲到關(guān)系表中,比如,由運營人員預(yù)先設(shè)置。當確定用戶待預(yù)測的目標商品時,可以根據(jù)目標商品的類型,通過查找預(yù)先設(shè)置的關(guān)系表確定針對該目標商品的搜索關(guān)鍵字及待爬取的網(wǎng)頁。
[0089]目標商品的搜索關(guān)鍵字可以是對該目標商品的一些描述信息,比如該目標商品的商品名稱、類型名稱等。根據(jù)搜索關(guān)鍵字,可以從待爬取的網(wǎng)頁上爬取影響該目標商品價格的價格參考數(shù)據(jù)。
[0090]在實際應(yīng)用中,可以通過分布式爬蟲,利用多臺服務(wù)器來爬取確定的待爬取網(wǎng)頁上針對目標商品的價格參考數(shù)據(jù),這樣可以提高效率,避免單一服務(wù)器負載過重出現(xiàn)癱瘓等問題的發(fā)生。具體操作方法可以參考以下說明:
[0091]在全國乃至世界不同地域部署多臺服務(wù)器,在每臺服務(wù)器上使用應(yīng)用容器引擎Docker輕量級虛擬機技術(shù)創(chuàng)建數(shù)百個容器,并在每個容器上裝載爬蟲模塊,從而形成大型分布式爬蟲集群。
[0092]確定用戶待預(yù)測價格的目標商品后,可以將獲得影響目標商品價格的價格參考數(shù)據(jù)作為一個大型爬蟲任務(wù),將該大型爬蟲任務(wù)劃分為大量小型子任務(wù)并構(gòu)建任務(wù)隊列,任務(wù)的劃分可以根據(jù)實際情況進行,比如,根據(jù)搜索關(guān)鍵字的個數(shù)進行任務(wù)的劃分,或者按照網(wǎng)頁的層級或類型進行劃分。
[0093]將大型爬蟲任務(wù)劃分為大量小型子任務(wù)后,再通過多地多容器協(xié)同的任務(wù)調(diào)度機制將各個子任務(wù)按需分配到各個容器上執(zhí)行,從而實現(xiàn)超高并發(fā)的分布式爬蟲機制,獲得影響目標商品價格的價格參考數(shù)據(jù)。
[0094]在本發(fā)明的一種【具體實施方式】中,在上述各實施例的基礎(chǔ)上,步驟S140可以包括以下步驟:
[0095]第一個步驟:對價格參考數(shù)據(jù)進行數(shù)據(jù)清洗;
[0096]第二個步驟:將成交價格數(shù)據(jù)及進行數(shù)據(jù)清洗后的價格參考數(shù)據(jù)進行結(jié)構(gòu)化處理;
[0097]第三個步驟:提取與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù)。
[0098]為方便描述,將上述三個步驟結(jié)合起來進行說明。
[0099]如前所述,步驟S120獲得了用戶針對目標商品的成交價格數(shù)據(jù),步驟S130獲得了影響目標商品價格的價格參考數(shù)據(jù)。價格參考數(shù)據(jù)可作為數(shù)據(jù)處理的異構(gòu)數(shù)據(jù)源,其可能為結(jié)構(gòu)化數(shù)據(jù),還可能為非結(jié)構(gòu)化數(shù)據(jù)。
[0100]利用存儲中間件可以從異構(gòu)數(shù)據(jù)源中進行數(shù)據(jù)抽取、轉(zhuǎn)換、加載等處理,完成數(shù)據(jù)清洗工作。數(shù)據(jù)抽取、轉(zhuǎn)換和加載也稱為ETL,即Extract1n-Transformat1n-Loading的縮寫。ETL負責(zé)將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)文件等抽取到臨時中間層后進行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉庫或者數(shù)據(jù)集中。舉例而言,抽取的過程可以是抽取具有實際意義的詞的過程,還可以包括對價格參考數(shù)據(jù)的去重處理等過程。轉(zhuǎn)換的過程可以是將價格參考數(shù)據(jù)中的文本、表格等數(shù)據(jù)轉(zhuǎn)換成預(yù)設(shè)形式的數(shù)據(jù)。
[0?0? ] 對價格參考數(shù)據(jù)進行數(shù)據(jù)清洗后,可以以數(shù)據(jù)API (Applicat1n ProgrammingInterface,應(yīng)用程序編程接口)的形式將進行數(shù)據(jù)清洗后的價格參考數(shù)據(jù)提供給上層數(shù)據(jù)處理程序。
[0102]上層數(shù)據(jù)處理程序可以對成交價格數(shù)據(jù)及進行數(shù)據(jù)清洗后的價格參考數(shù)據(jù)進行結(jié)構(gòu)化處理。具體的,可以先應(yīng)用自然語言處理技術(shù),自動化地依據(jù)上下文語義分析以及關(guān)鍵詞匹配,在海量雜亂無章的文本中定位提取出所需數(shù)據(jù),再清洗結(jié)構(gòu)雜亂的非結(jié)構(gòu)化數(shù)據(jù)來構(gòu)建價格知識庫,最后進行分類統(tǒng)計分析,得出結(jié)構(gòu)化數(shù)據(jù)。
[0103]得到結(jié)構(gòu)化數(shù)據(jù)之后,進一步的,可以從結(jié)構(gòu)化數(shù)據(jù)中提取出與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù)。
[0104]當然,在對價格參考數(shù)據(jù)進行結(jié)構(gòu)化處理,得到結(jié)構(gòu)化數(shù)據(jù)之后,還可以進一步檢查是否有微量數(shù)據(jù)的缺失,如果有,則對其進行插值處理,再從結(jié)構(gòu)化數(shù)據(jù)中提取出與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù),如果否,則直接從結(jié)構(gòu)化數(shù)據(jù)中提取出與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù)。
[0105]比如,對于預(yù)設(shè)的預(yù)測模型而言,其需要A、B、C、D四類數(shù)據(jù),經(jīng)過對價格參考數(shù)據(jù)及進行數(shù)據(jù)清洗后的價格參考數(shù)據(jù)進行結(jié)構(gòu)化處理之后,缺少B類數(shù)據(jù),在這種情況下,可以根據(jù)實際情況或者預(yù)設(shè)的經(jīng)驗值對B類數(shù)據(jù)進行插值處理,以形成完整的數(shù)據(jù)結(jié)構(gòu),適應(yīng)預(yù)設(shè)的預(yù)測模型的輸入數(shù)據(jù)的要求。
[0106]在本發(fā)明實施例中,成交價格數(shù)據(jù)和價格參考數(shù)據(jù)的獲得、處理、預(yù)測等過程均可自動化完成,為用戶實時展現(xiàn)價格預(yù)測結(jié)果。
[0107]下面對本發(fā)明實施例提供的商品價格預(yù)測裝置進行介紹,下文描述的商品價格預(yù)測裝置與上文描述的商品價格預(yù)測方法可相互對應(yīng)參照。
[0108]圖3為本發(fā)明實施例提供的一種商品價格預(yù)測裝置的結(jié)構(gòu)框圖,該裝置可以包括以下模塊:
[0109]目標商品確定模塊310,用于確定用戶待預(yù)測價格的目標商品;
[0110]成交價格數(shù)據(jù)獲得模塊320,用于獲得所述用戶針對所述目標商品的成交價格數(shù)據(jù);
[0111]價格參考數(shù)據(jù)獲得模塊330,用于獲得影響所述目標商品價格的價格參考數(shù)據(jù);
[0112]輸入數(shù)據(jù)獲得模塊340,用于對所述成交價格數(shù)據(jù)及所述價格參考數(shù)據(jù)進行預(yù)處理,獲得與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù);
[0113]預(yù)測價格獲得模塊350,用于將所述輸入數(shù)據(jù)輸入到所述預(yù)測模型中,獲得所述目標商品的預(yù)測價格。
[0114]本發(fā)明實施例所提供的裝置,確定用戶待預(yù)測價格的目標商品后,獲得用戶針對該目標商品的成交價格數(shù)據(jù)及影響目標商品價格的價格參考數(shù)據(jù),對成交價格數(shù)據(jù)和價格參考數(shù)據(jù)進行預(yù)處理后,獲得與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù),進行目標商品價格的預(yù)測。相比于現(xiàn)有技術(shù),本發(fā)明實施例所提供的裝置在對目標商品的價格進行預(yù)測時,同時考慮了成交價格數(shù)據(jù)和價格參考數(shù)據(jù),可以提高預(yù)測準確性,為用戶的實際操作行為提供有效參考。
[0115]在本發(fā)明的一種【具體實施方式】中,所述價格參考數(shù)據(jù)包括各廠家報價數(shù)據(jù)、供求關(guān)系數(shù)據(jù)、價格評價數(shù)據(jù)中的至少一種。
[0116]在本發(fā)明的一種【具體實施方式】中,所述價格參考數(shù)據(jù)獲得模塊330,包括:
[0117]爬蟲子模塊,用于利用網(wǎng)絡(luò)爬蟲技術(shù)獲得影響所述目標商品價格的價格參考數(shù)據(jù)。
[0118]在本發(fā)明的一種【具體實施方式】中,所述爬蟲子模塊,具體用于:
[0119]根據(jù)所述目標商品的類型,確定所述目標商品的搜索關(guān)鍵字和待爬取的網(wǎng)頁;
[0120]根據(jù)所述搜索關(guān)鍵字,從所述待爬取的網(wǎng)頁上爬取影響所述目標商品價格的價格參考數(shù)據(jù)。
[0121]在本發(fā)明的一種【具體實施方式】中,所述輸入數(shù)據(jù)獲得模塊340,具體用于:
[0122]對所述價格參考數(shù)據(jù)進行數(shù)據(jù)清洗;
[0123]將所述成交價格數(shù)據(jù)及進行數(shù)據(jù)清洗后的價格參考數(shù)據(jù)進行結(jié)構(gòu)化處理;
[0124]提取與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù)。
[0125]在本發(fā)明的一種【具體實施方式】中,所述預(yù)測模型為灰色時間序列預(yù)測模型或者自回歸積分滑動平均模型。
[0126]本說明書中各個實施例采用遞進的方式描述,每個實施例重點說明的都是與其它實施例的不同之處,各個實施例之間相同或相似部分互相參見即可。對于實施例公開的裝置而言,由于其與實施例公開的方法相對應(yīng),所以描述的比較簡單,相關(guān)之處參見方法部分說明即可。
[0127]專業(yè)人員還可以進一步意識到,結(jié)合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、計算機軟件或者二者的結(jié)合來實現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應(yīng)用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應(yīng)認為超出本發(fā)明的范圍。
[0128]結(jié)合本文中所公開的實施例描述的方法或算法的步驟可以直接用硬件、處理器執(zhí)行的軟件模塊,或者二者的結(jié)合來實施。軟件模塊可以置于隨機存儲器(RAM)、內(nèi)存、只讀存儲器(R0M)、電可編程R0M、電可擦除可編程R0M、寄存器、硬盤、可移動磁盤、CD-ROM、或技術(shù)領(lǐng)域內(nèi)所公知的任意其它形式的存儲介質(zhì)中。
[0129]以上對本發(fā)明所提供的一種商品價格預(yù)測方法及裝置進行了詳細介紹。本文中應(yīng)用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想。應(yīng)當指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以對本發(fā)明進行若干改進和修飾,這些改進和修飾也落入本發(fā)明權(quán)利要求的保護范圍內(nèi)。
【主權(quán)項】
1.一種商品價格預(yù)測方法,其特征在于,包括: 確定用戶待預(yù)測價格的目標商品; 獲得所述用戶針對所述目標商品的成交價格數(shù)據(jù); 獲得影響所述目標商品價格的價格參考數(shù)據(jù); 對所述成交價格數(shù)據(jù)及所述價格參考數(shù)據(jù)進行預(yù)處理,獲得與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù); 將所述輸入數(shù)據(jù)輸入到所述預(yù)測模型中,獲得所述目標商品的預(yù)測價格。2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述價格參考數(shù)據(jù)包括各廠家報價數(shù)據(jù)、供求關(guān)系數(shù)據(jù)、價格評價數(shù)據(jù)中的至少一種。3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述獲得影響所述目標商品價格的價格參考數(shù)據(jù),包括: 利用網(wǎng)絡(luò)爬蟲技術(shù)獲得影響所述目標商品價格的價格參考數(shù)據(jù)。4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述利用網(wǎng)絡(luò)爬蟲技術(shù)獲得影響所述目標商品價格的價格參考數(shù)據(jù),包括: 根據(jù)所述目標商品的類型,確定所述目標商品的搜索關(guān)鍵字和待爬取的網(wǎng)頁; 根據(jù)所述搜索關(guān)鍵字,從所述待爬取的網(wǎng)頁上爬取影響所述目標商品價格的價格參考數(shù)據(jù)。5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述對所述成交價格數(shù)據(jù)和所述價格參考數(shù)據(jù)進行預(yù)處理,獲得與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù),包括: 對所述價格參考數(shù)據(jù)進行數(shù)據(jù)清洗; 將所述成交價格數(shù)據(jù)及進行數(shù)據(jù)清洗后的價格參考數(shù)據(jù)進行結(jié)構(gòu)化處理; 提取與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù)。6.一種商品價格預(yù)測裝置,其特征在于,包括: 目標商品確定模塊,用于確定用戶待預(yù)測價格的目標商品; 成交價格數(shù)據(jù)獲得模塊,用于獲得所述用戶針對所述目標商品的成交價格數(shù)據(jù); 價格參考數(shù)據(jù)獲得模塊,用于獲得影響所述目標商品價格的價格參考數(shù)據(jù); 輸入數(shù)據(jù)獲得模塊,用于對所述成交價格數(shù)據(jù)及所述價格參考數(shù)據(jù)進行預(yù)處理,獲得與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù); 預(yù)測價格獲得模塊,用于將所述輸入數(shù)據(jù)輸入到所述預(yù)測模型中,獲得所述目標商品的預(yù)測價格。7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述價格參考數(shù)據(jù)包括各廠家報價數(shù)據(jù)、供求關(guān)系數(shù)據(jù)、價格評價數(shù)據(jù)中的至少一種。8.根據(jù)權(quán)利要求6或7所述的裝置,其特征在于,所述價格參考數(shù)據(jù)獲得模塊,包括: 爬蟲子模塊,用于利用網(wǎng)絡(luò)爬蟲技術(shù)獲得影響所述目標商品價格的價格參考數(shù)據(jù)。9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述爬蟲子模塊,具體用于: 根據(jù)所述目標商品的類型,確定所述目標商品的搜索關(guān)鍵字和待爬取的網(wǎng)頁; 根據(jù)所述搜索關(guān)鍵字,從所述待爬取的網(wǎng)頁上爬取影響所述目標商品價格的價格參考數(shù)據(jù)。10.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述輸入數(shù)據(jù)獲得模塊,具體用于:對所述價格參考數(shù)據(jù)進行數(shù)據(jù)清洗;將所述成交價格數(shù)據(jù)及進行數(shù)據(jù)清洗后的價格參考數(shù)據(jù)進行結(jié)構(gòu)化處理;提取與預(yù)設(shè)的預(yù)測模型匹配的輸入數(shù)據(jù)。
【文檔編號】G06F17/30GK105869019SQ201610200684
【公開日】2016年8月17日
【申請日】2016年3月31日
【發(fā)明人】李鑫楠, 張良杰, 陳恒, 黃譯萱, 蔡曉勝
【申請人】金蝶軟件(中國)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1