1.一種基于交易數(shù)據(jù)的客戶分類(lèi)方法,其特征在于,所述方法包括:
從零售企業(yè)交易數(shù)據(jù)庫(kù)中采集交易數(shù)據(jù);
將采集到的交易數(shù)據(jù)進(jìn)行預(yù)處理,并將經(jīng)過(guò)預(yù)處理后的交易數(shù)據(jù)分別按層進(jìn)行編碼;
根據(jù)編碼后的層次信息為每個(gè)客戶創(chuàng)建客戶購(gòu)買(mǎi)樹(shù);
對(duì)創(chuàng)建的所有客戶購(gòu)買(mǎi)樹(shù)進(jìn)行聚類(lèi),直到聚類(lèi)中心不再改變或者變化小于預(yù)設(shè)的閾值為止,以獲取客戶分類(lèi)的結(jié)果。
2.如權(quán)利要求1所述的基于交易數(shù)據(jù)的客戶分類(lèi)方法,其特征在于,所述交易數(shù)據(jù)包括:會(huì)員卡號(hào)、交易日期、交易時(shí)間、商品名稱、商品類(lèi)別名稱以及銷(xiāo)售額。
3.如權(quán)利要求2所述的基于交易數(shù)據(jù)的客戶分類(lèi)方法,其特征在于,所述預(yù)處理包括對(duì)信息缺失的交易數(shù)據(jù)進(jìn)行忽略處理和對(duì)信息沖突的交易數(shù)據(jù)進(jìn)行唯一性處理,其中,所述將經(jīng)過(guò)預(yù)處理后的交易數(shù)據(jù)分別按層進(jìn)行編碼的步驟具體包括:
對(duì)經(jīng)過(guò)預(yù)處理后的交易數(shù)據(jù)分別對(duì)商品名稱、商品類(lèi)別名稱按層進(jìn)行編碼,且編碼方式為按數(shù)字從1開(kāi)始從小到大依次進(jìn)行編碼,層與層之間相互獨(dú)立。
4.如權(quán)利要求3所述的基于交易數(shù)據(jù)的客戶分類(lèi)方法,其特征在于,所述根據(jù)編碼后的層次信息為每個(gè)客戶創(chuàng)建客戶購(gòu)買(mǎi)樹(shù)的步驟具體包括:
對(duì)交易數(shù)據(jù)按會(huì)員卡號(hào)聚合分組,統(tǒng)計(jì)每個(gè)商品的消費(fèi)頻率、消費(fèi)金額、最近一次消費(fèi)時(shí)間,以形成每個(gè)商品的RFM值;
將每個(gè)客戶購(gòu)買(mǎi)的商品根據(jù)商品類(lèi)別構(gòu)建出購(gòu)買(mǎi)樹(shù),其中,所述購(gòu)買(mǎi)樹(shù)的節(jié)點(diǎn)包括根節(jié)點(diǎn)、葉子節(jié)點(diǎn)和內(nèi)部節(jié)點(diǎn),所述葉子節(jié)點(diǎn)為商品名稱節(jié)點(diǎn),所述內(nèi)部節(jié)點(diǎn)為商品類(lèi)別名稱節(jié)點(diǎn);
依次掃描交易數(shù)據(jù),將獲取的商品名稱、商品類(lèi)別名稱與購(gòu)買(mǎi)樹(shù)做匹配;
將不在購(gòu)買(mǎi)樹(shù)中的該筆交易數(shù)據(jù)加入購(gòu)買(mǎi)樹(shù)中。
5.如權(quán)利要求4所述的基于交易數(shù)據(jù)的客戶分類(lèi)方法,其特征在于,所述對(duì)創(chuàng)建的所有客戶購(gòu)買(mǎi)樹(shù)進(jìn)行聚類(lèi),直到聚類(lèi)中心不再改變或者變化小于預(yù)設(shè)的閾值為止,以獲取客戶分類(lèi)的結(jié)果的步驟具體包括:
a、從購(gòu)買(mǎi)樹(shù)中隨機(jī)選擇k顆購(gòu)買(mǎi)樹(shù)作為初始中心;
b、初始化權(quán)重樹(shù);
c、依次計(jì)算購(gòu)買(mǎi)樹(shù)中節(jié)點(diǎn)的RFM值;
d、依次計(jì)算購(gòu)買(mǎi)樹(shù)和每個(gè)中心距離的加權(quán)和,并將該購(gòu)買(mǎi)樹(shù)劃分到加權(quán)和最小中心所在的簇;
e、更新初始中心,將劃分到同一個(gè)簇的購(gòu)買(mǎi)樹(shù)對(duì)應(yīng)結(jié)點(diǎn)的值相加后取均值作為新中心對(duì)應(yīng)結(jié)點(diǎn)的RFM值;
f、重復(fù)上述過(guò)程c、d和e,直到聚類(lèi)中心不再發(fā)生變化或變化小于預(yù)設(shè)的閾值為止。
6.一種基于交易數(shù)據(jù)的客戶分類(lèi)系統(tǒng),其特征在于,所述系統(tǒng)包括:
數(shù)據(jù)采集模塊,用于從零售企業(yè)交易數(shù)據(jù)庫(kù)中采集交易數(shù)據(jù);
數(shù)據(jù)預(yù)處理模塊,用于將采集到的交易數(shù)據(jù)進(jìn)行預(yù)處理,并將經(jīng)過(guò)預(yù)處理后的交易數(shù)據(jù)分別按層進(jìn)行編碼;
購(gòu)買(mǎi)樹(shù)生成模塊,用于根據(jù)編碼后的層次信息為每個(gè)客戶創(chuàng)建客戶購(gòu)買(mǎi)樹(shù);
客戶分類(lèi)模塊,用于對(duì)創(chuàng)建的所有客戶購(gòu)買(mǎi)樹(shù)進(jìn)行聚類(lèi),直到聚類(lèi)中心不再改變或者變化小于預(yù)設(shè)的閾值為止,以獲取客戶分類(lèi)的結(jié)果。
7.如權(quán)利要求6所述的基于交易數(shù)據(jù)的客戶分類(lèi)系統(tǒng),其特征在于,所述交易數(shù)據(jù)包括:會(huì)員卡號(hào)、交易日期、交易時(shí)間、商品名稱、商品類(lèi)別名稱以及銷(xiāo)售額。
8.如權(quán)利要求7所述的基于交易數(shù)據(jù)的客戶分類(lèi)系統(tǒng),其特征在于,所述預(yù)處理包括對(duì)信息缺失的交易數(shù)據(jù)進(jìn)行忽略處理和對(duì)信息沖突的交易數(shù)據(jù)進(jìn)行唯一性處理,其中,所述數(shù)據(jù)預(yù)處理模塊具體用于:
對(duì)經(jīng)過(guò)預(yù)處理后的交易數(shù)據(jù)分別對(duì)商品名稱、商品類(lèi)別名稱按層進(jìn)行編碼,且編碼方式為按數(shù)字從1開(kāi)始從小到大依次進(jìn)行編碼,層與層之間相互獨(dú)立。
9.如權(quán)利要求8所述的基于交易數(shù)據(jù)的客戶分類(lèi)系統(tǒng),其特征在于,所述購(gòu)買(mǎi)樹(shù)生成模塊具體用于:
對(duì)交易數(shù)據(jù)按會(huì)員卡號(hào)聚合分組,統(tǒng)計(jì)每個(gè)商品的消費(fèi)頻率、消費(fèi)金額、最近一次消費(fèi)時(shí)間,以形成每個(gè)商品的RFM值;
將每個(gè)客戶購(gòu)買(mǎi)的商品根據(jù)商品類(lèi)別構(gòu)建出購(gòu)買(mǎi)樹(shù),其中,所述購(gòu)買(mǎi)樹(shù)的節(jié)點(diǎn)包括根節(jié)點(diǎn)、葉子節(jié)點(diǎn)和內(nèi)部節(jié)點(diǎn),所述葉子節(jié)點(diǎn)為商品名稱節(jié)點(diǎn),所述內(nèi)部節(jié)點(diǎn)為商品類(lèi)別名稱節(jié)點(diǎn);
依次掃描交易數(shù)據(jù),將獲取的商品名稱、商品類(lèi)別名稱與購(gòu)買(mǎi)樹(shù)做匹配;
將不在購(gòu)買(mǎi)樹(shù)中的該筆交易數(shù)據(jù)加入購(gòu)買(mǎi)樹(shù)中。
10.如權(quán)利要求9所述的基于交易數(shù)據(jù)的客戶分類(lèi)系統(tǒng),其特征在于,所述客戶分類(lèi)模塊具體用于:
a、從購(gòu)買(mǎi)樹(shù)中隨機(jī)選擇k顆購(gòu)買(mǎi)樹(shù)作為初始中心;
b、初始化權(quán)重樹(shù);
c、依次計(jì)算購(gòu)買(mǎi)樹(shù)中節(jié)點(diǎn)的RFM值;
d、依次計(jì)算購(gòu)買(mǎi)樹(shù)和每個(gè)中心距離的加權(quán)和,并將該購(gòu)買(mǎi)樹(shù)劃分到加權(quán)和最小中心所在的簇;
e、更新初始中心,將劃分到同一個(gè)簇的購(gòu)買(mǎi)樹(shù)對(duì)應(yīng)結(jié)點(diǎn)的值相加后取均值作為新中心對(duì)應(yīng)結(jié)點(diǎn)的RFM值;
f、重復(fù)上述過(guò)程c、d和e,直到聚類(lèi)中心不再發(fā)生變化或變化小于預(yù)設(shè)的閾值為止。