智能商場(chǎng)信息系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于商務(wù)智能中的數(shù)據(jù)挖掘技術(shù)領(lǐng)域,涉及關(guān)聯(lián)性分析、Apriori算法以及 BP神經(jīng)網(wǎng)絡(luò)算法,尤其涉及一種結(jié)合兩種算法并實(shí)現(xiàn)其功能的智能商場(chǎng)信息系統(tǒng)。
【背景技術(shù)】
[0002] 目前,商務(wù)智能領(lǐng)域正不斷被發(fā)掘和擴(kuò)展中,該領(lǐng)域中的核心技術(shù)包括數(shù)據(jù)倉庫 技術(shù)、數(shù)據(jù)挖掘技術(shù)、聯(lián)機(jī)分析處理技術(shù)等也不斷地發(fā)展,進(jìn)一步推進(jìn)商務(wù)智能在生活中的 應(yīng)用,促進(jìn)商業(yè)利潤的不斷增加,推動(dòng)經(jīng)濟(jì)發(fā)展。在推進(jìn)商場(chǎng)等進(jìn)行合理化智能化商品管理 時(shí),經(jīng)常需要對(duì)商場(chǎng)銷售記錄,即被銷售商品信息所存在的潛在商業(yè)信息進(jìn)行發(fā)掘和分析, 進(jìn)而得到可靠并且具有決斷性以及實(shí)際意義的信息。在這里智能商場(chǎng)信息系統(tǒng)以及其攜帶 的智能算法能夠有效地達(dá)成這一目的實(shí)現(xiàn)其功能。智能商場(chǎng)信息系統(tǒng)通過對(duì)商場(chǎng)顧客的消 費(fèi)記錄中的商品進(jìn)行關(guān)聯(lián)性分析,以及商品相當(dāng)一段時(shí)間內(nèi)的銷售量的回歸分析,進(jìn)而將 最后結(jié)果通過可視化圖表以及文字形式進(jìn)行呈現(xiàn),為商場(chǎng)智能優(yōu)化貨柜商品位置擺放,以 及智能控制商品進(jìn)貨量以及配送量提供可靠的參考。
[0003] 在BI領(lǐng)域,對(duì)商品信息的處理過程中,考慮到商品信息存在一些特性。一方面是 相較于其他數(shù)據(jù),商場(chǎng)的商品信息的信息量相當(dāng)?shù)凝嫶?,并且商品信息?huì)因地域不同、季節(jié) 變更、經(jīng)濟(jì)情況、以及某些商品的特殊性而存在不確定性。另一方面是從現(xiàn)實(shí)可行性需求分 析,商務(wù)智能中對(duì)于商品信息的分析,基于商場(chǎng)對(duì)商品相關(guān)信息的需求,不同類型的商場(chǎng)對(duì) 于商品信息的需求不同,這需要我們對(duì)商場(chǎng)的需求有十分確切以及實(shí)時(shí)的了解。而正是因 為這樣的特性,目前的智能商場(chǎng)系統(tǒng)就商場(chǎng)的基礎(chǔ)信息需求以及絕大多數(shù)商場(chǎng)共有的需求 對(duì)數(shù)據(jù)進(jìn)行分析,進(jìn)而得到可靠的參考信息。
[0004] 數(shù)據(jù)挖掘,從大量的數(shù)據(jù)中挖掘出隱含的、未知的、對(duì)決策有價(jià)值的知識(shí)和規(guī)則, 在商務(wù)智能中十分重要的技術(shù)領(lǐng)域。針對(duì)商品信息的特性,數(shù)據(jù)挖掘領(lǐng)域中的多種算法 都能夠?qū)π畔⑦M(jìn)行處理。如貝葉斯分類器、決策樹等對(duì)數(shù)據(jù)進(jìn)行分類的方法;如對(duì)商品相 似度進(jìn)行分析進(jìn)而歸類商品的KMeans聚類算法,該算法運(yùn)算速度快,但由于算法中存在 的聚類數(shù)目K的取值可能對(duì)結(jié)果產(chǎn)生影響;如能夠快速處理混合類型數(shù)據(jù)的聚類問題的 K-prototypes算法。另外有以其他基于密度、網(wǎng)格、模型等的聚類分析方法對(duì)商品信息進(jìn) 行聚類分析。每種方法都存在各自的優(yōu)缺點(diǎn),適用范圍也相對(duì)有限,對(duì)于不同的數(shù)據(jù)類型特 征、數(shù)據(jù)質(zhì)量等存在著不同的制約因素。
[0005] 智能商場(chǎng)信息的提取要求時(shí)效性、有效性和針對(duì)性以及良好的可讀性和交互性。 數(shù)據(jù)挖掘領(lǐng)域的關(guān)聯(lián)規(guī)則發(fā)現(xiàn)技術(shù)中的Apirori算法以及目前被廣泛應(yīng)用的監(jiān)督式學(xué)習(xí) 方法BP神經(jīng)網(wǎng)絡(luò)算法能夠?qū)崿F(xiàn)對(duì)商場(chǎng)信息的有效分析和提取。在智能商場(chǎng)信息系統(tǒng)中,這 是十分重要的,只有更加準(zhǔn)確和具有實(shí)際意義的商品信息才能夠進(jìn)一步推動(dòng)商場(chǎng)的智能發(fā) 展。如賣家將會(huì)從自己所持有的顧客消費(fèi)記錄中尋找顧客購買商品的潛在規(guī)律,并且進(jìn)行 相關(guān)規(guī)律的實(shí)際對(duì)應(yīng)措施的實(shí)施;同時(shí)賣家也會(huì)從近階段商品的銷售情況,進(jìn)而推測(cè)商品 未來的未知銷售量。而這兩種情況正能夠?qū)?yīng)我們的兩種算法所進(jìn)行的對(duì)數(shù)據(jù)的分析。前 者應(yīng)用Apriori算法能夠準(zhǔn)確并且有效地對(duì)大量的銷售記錄進(jìn)行商品的關(guān)聯(lián)規(guī)則分析;后 者則應(yīng)用BP神經(jīng)網(wǎng)絡(luò)算法對(duì)銷售量進(jìn)行回歸預(yù)測(cè),基于商品信息的時(shí)效性為未知銷售量 做出可靠預(yù)測(cè)作為參考。
[0006] 關(guān)聯(lián)規(guī)則Apriori算法是目前廣泛應(yīng)用于智慧商場(chǎng)領(lǐng)域的方法之一。該算法能夠 有效的將商品之間的關(guān)聯(lián)規(guī)則進(jìn)行挖掘和呈現(xiàn),但仍舊存在一些不足:①I/O負(fù)載大,產(chǎn)生 過多的候選項(xiàng)目集;②商場(chǎng)中的商品數(shù)據(jù)存在著因季節(jié)、利潤、地域、時(shí)間等因素導(dǎo)致的不 確定性以及雜亂性,該算法對(duì)影響因素的有效措施并不完善。同樣BP神經(jīng)網(wǎng)絡(luò)算法,在被 廣泛應(yīng)用的同時(shí)也存在著一些不足,即存在平坦區(qū)域,因誤差對(duì)權(quán)值的梯度變化小二導(dǎo)致 的區(qū)域,而這樣也導(dǎo)致誤差下降緩慢,影響收斂速度。近年來商務(wù)智能不斷發(fā)展的過程中, Apriori算法也在不斷的被修改和完善,如通過對(duì)數(shù)據(jù)進(jìn)行加權(quán)計(jì)算,從而對(duì)不同類別商品 的項(xiàng)集發(fā)現(xiàn)進(jìn)行區(qū)分等一些措施。國內(nèi)外針對(duì)BP神經(jīng)網(wǎng)絡(luò)算法的不足也不斷地提出改進(jìn), 消除樣本輸入順應(yīng)影響等。但目前仍舊存在著一些可見或不可見的因素影響著數(shù)據(jù)信息的 提取。因此,能夠更加準(zhǔn)確、可靠、并且切合實(shí)際地對(duì)商品信息進(jìn)行提取和分析仍舊是智慧 商場(chǎng)領(lǐng)域的研究熱點(diǎn)并具有客觀前景。
[0007] 常見的嵌入式系統(tǒng)基于傳統(tǒng)集成電路設(shè)計(jì),需要整合大量的外圍電路,由于PCB 板中的1C芯片之間的連線延時(shí),以及本身的體積和重量等因素的限制,整機(jī)系統(tǒng)的性能受 到了很大的制約。近年來具有超大規(guī)模、低功耗、低成本、設(shè)計(jì)靈活等優(yōu)點(diǎn)的FPGA(Field ProgrammableGateArray,現(xiàn)場(chǎng)可編程門陣列)成為行業(yè)主流并被廣泛應(yīng)用在高速度、高密 度的數(shù)字電路設(shè)計(jì)領(lǐng)域。工業(yè)、農(nóng)業(yè)、醫(yī)療、科研等領(lǐng)域集成電路設(shè)計(jì)已經(jīng)進(jìn)入了片上系統(tǒng) (SystemonaChip,SoC)時(shí)代,其將微處理器、模擬IP核、數(shù)字IP核和存儲(chǔ)器(或片外 存儲(chǔ)控制接口)集成在單一芯片上。SoPC(SystemonaProgrammableChip)是一種基 于FPGA的SoC設(shè)計(jì)方案,它將FPGA及微處理器的核心嵌在同一芯片上,構(gòu)成一個(gè)可編程的 SoPC系統(tǒng)框架,具有高度的集成能力,很大程度上減小了產(chǎn)品體積以及外部信號(hào)對(duì)系統(tǒng)的 干擾,大大增加了系統(tǒng)的可靠性、穩(wěn)定性和靈活性。全球著名FPGA制造商Altera推出的內(nèi) 部集成軟核處理器NiosII及各種IP核的CycloneII,是一種目前民用市場(chǎng)常用的SoPC 架構(gòu),配合SoPCBuilder和NiosIIIDE開發(fā)工具,能夠在很短的時(shí)間內(nèi)推出一個(gè)完整的 系統(tǒng),極大的方便了系統(tǒng)的開發(fā)。該架構(gòu)也成為醫(yī)療行業(yè)信號(hào)檢測(cè)、數(shù)據(jù)處理等系統(tǒng)設(shè)計(jì)的 發(fā)展趨勢(shì)。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明的目的是結(jié)合目前應(yīng)用效果較好的Apriori智能算法以及半學(xué)習(xí)式的BP 神經(jīng)網(wǎng)絡(luò)算法對(duì)智慧商場(chǎng)的商品信息進(jìn)行智能挖掘與分析方法。有效實(shí)現(xiàn)商品貨柜位置擺 放的優(yōu)化以及商品銷售量的預(yù)測(cè)的功能,為商場(chǎng)提供更多更可靠的參考信息。
[0009] 本發(fā)明提供了一種結(jié)合并實(shí)現(xiàn)多種智能算法的智慧商場(chǎng)信息系統(tǒng)。
[0010] 本發(fā)明所采用的技術(shù)方案是: 1、智能商業(yè)信息系統(tǒng),其特點(diǎn)是,按以下定義和步驟實(shí)施: 定義: 定義1 :定義D為事物數(shù)據(jù)項(xiàng)集,是消費(fèi)者購物數(shù)據(jù)的總和; 定義2 :定義L1'項(xiàng)集為D所包含的所有的銷售記錄中不重復(fù)的包含一種商品的項(xiàng)集; 定義3 :支持度(Support)指A和B兩個(gè)項(xiàng)集的并集AUB在D中出現(xiàn)的概率P(AU B),即; 定義4:置信度(Confidence)表示事務(wù)數(shù)據(jù)庫D在包含A的事務(wù)的前提下同時(shí)也包含B的概率P(B|A),即
MERGEFORMAT; 定義5:定義L1為一維頻繁項(xiàng)集,指支持度不小于用戶給定的最小支持度閾值 (minsup)的項(xiàng)集,1維頻繁項(xiàng)集記為L1,以此類推,η維頻繁項(xiàng)集記為Ln; 定義6:定義訓(xùn)練彳
\*MERGEFORMAT,表示若干組銷 售量數(shù)據(jù)與對(duì)應(yīng)月份所組成的集合; 定義7:在向前的多層前饋網(wǎng)絡(luò)中 .
. ;\*MERGEFORMAT 定義8 :在后向傳播中,有
\*MERGEFORMAT 定義9 :均方誤差e的結(jié)果由均方函數(shù)求得,其中,均方函數(shù)= 輸出維度 為1 ; 定義10 :梯度下降法更新權(quán)值時(shí),
*MERGEFORMAT 步驟1 :從本地SD卡獲得事務(wù)數(shù)據(jù)項(xiàng)集D; 步驟2 :打開軟件運(yùn)行,導(dǎo)入購物數(shù)據(jù)置軟件中,通過用戶輸入的自定義值,為閾值 sup; 步驟3 :系統(tǒng)軟件運(yùn)用Apirori算法對(duì)事務(wù)數(shù)據(jù)項(xiàng)集D進(jìn)行頻繁項(xiàng)集的發(fā)現(xiàn),并對(duì)頻繁 項(xiàng)集中項(xiàng)目的推薦度進(jìn)行計(jì)算; 步驟4 :根據(jù)步驟3的分析結(jié)果,實(shí)現(xiàn)對(duì)消費(fèi)者輸入的商品進(jìn)行相關(guān)商品智能推薦的功 能; 步驟5 :從本地SD卡獲得商品的前一段時(shí)間每個(gè)月的銷售量記錄,運(yùn)用BP神經(jīng)網(wǎng)絡(luò)算 法,對(duì)該數(shù)據(jù)記錄進(jìn)行分析,預(yù)測(cè)下一月該商品的銷售量。
[0011] 該系統(tǒng)包括一個(gè)FPGA模塊及外接設(shè)備, 所述的FPGA模塊中,設(shè)置有Avalon總線及三態(tài)橋總線,在Avalon總線及三態(tài)橋總線 上連接有Flash控制器、SDRAM控制器、通用10、IXD驅(qū)動(dòng)器、定時(shí)器、LTM控制器、C2H加速、 SD卡控制器、以太網(wǎng)控制器、JTAGUART模塊和NiosII軟核; 所述的外接設(shè)備包括,F(xiàn)lash控制器外接Flash設(shè)備,SDRAM控制器外接SDRAM