本發(fā)明實施例涉及數(shù)據(jù)領(lǐng)域,尤其涉及一種確定商圈的方法和裝置。
背景技術(shù):
:當(dāng)前,在大數(shù)據(jù)產(chǎn)業(yè)中,實際交易信息被普遍認(rèn)為是最具商業(yè)價值的數(shù)據(jù)。根據(jù)交易數(shù)據(jù)中所蘊(yùn)含的大量信息,結(jié)合數(shù)據(jù)分析和建模方法,可以對商戶終端所屬的商圈進(jìn)行精準(zhǔn)定位,從而實現(xiàn)精準(zhǔn)營銷、市場推廣、熱點追蹤等商業(yè)手段,實現(xiàn)商業(yè)價值?,F(xiàn)有技術(shù)中,例如在專利cn104462059a中,該專利提供一種通過識別商戶地址信息的方法來實現(xiàn)商戶的定位,但是這種方法存在著以下問題:適用于處理含有商戶地址的數(shù)據(jù);即使對于已經(jīng)含有地址的商戶,其地址文本信息往往也過于模糊;存在大量商戶注冊地址與實際經(jīng)營地址不一致的情況,會導(dǎo)致商戶定位錯誤;在該專利中關(guān)于商戶商圈歸并環(huán)節(jié),簡單使用兩個商戶間交易卡量在總卡量的占比作為歸并依據(jù),并未充分考慮時間因素。另外,在使用交易信息判斷商戶終端所屬的商圈的過程中,現(xiàn)有大數(shù)據(jù)算法如聚類需要衡量樣本點即商戶終端之間的距離,該距離的定義需要滿足三角準(zhǔn)則,但是通過交易信息無法定義該距離。綜上所述,現(xiàn)有技術(shù)在對商戶終端所屬的商圈的定位過程中,存在需要依賴商戶地址文本信息而帶來的一系列問題以及通過交易數(shù)據(jù)無法定義商戶終端之間的距離的缺點,因此,需要提出有效的方法來解決上述問題。技術(shù)實現(xiàn)要素:本發(fā)明實施例提供一種確定商圈的方法和裝置,用以解決現(xiàn)有技術(shù)在對商戶終端所屬的商圈的定位過程中,存在需要依賴商戶地址文本信息而帶來的一系列問題以及通過交易數(shù)據(jù)無法定義商戶終端之間的距離的缺點。本發(fā)明實施例提供一種確定商圈的方法,包括:確定商圈的種子商戶終端;從線下交易數(shù)據(jù)中確定出種子商戶終端的消費交易數(shù)據(jù);將與消費交易數(shù)據(jù)的賬戶相同且交易時間滿足時間閾值的交易數(shù)據(jù),確定為種子商戶終端的鄰近交易數(shù)據(jù);將鄰近交易數(shù)據(jù)涉及的商戶終端確定為商圈的種子商戶終端,從而根據(jù)所有種子商戶終端所在區(qū)域更新商圈范圍??蛇x地,將鄰近交易數(shù)據(jù)涉及的商戶終端確定為商圈的種子商戶終端,包括:將鄰近交易數(shù)據(jù)涉及的商戶終端確定為待選種子商戶終端;針對每個待選種子商戶終端,獲取待選種子商戶終端的鄰近交易數(shù)據(jù);根據(jù)待選種子商戶終端的鄰近交易數(shù)據(jù),統(tǒng)計各項評估指標(biāo);在各項評估指標(biāo)滿足預(yù)設(shè)條件時,確定待選種子商戶終端為商圈的種子商戶終端。可選地,根據(jù)待選種子商戶終端的鄰近交易數(shù)據(jù),統(tǒng)計各項評估指標(biāo),包括:統(tǒng)計待選種子商戶終端的鄰近交易數(shù)據(jù)的個數(shù);統(tǒng)計待選種子商戶終端的鄰近交易數(shù)據(jù)與種子商戶終端的消費交易數(shù)據(jù)中的交易時間的時間差值,并根據(jù)各時間差值確定出最小時間差值和平均時間差值;確定個數(shù)、最小時間差值和平均時間差值是否滿足預(yù)設(shè)條件。可選地,確定商圈的種子商戶終端,包括:查找商戶名中包含地址信息的商戶終端;根據(jù)地址信息確定商戶終端與商圈的距離;將滿足距離閾值的商戶終端確定為種子商戶終端??蛇x地,將鄰近交易數(shù)據(jù)涉及的商戶終端確定為商圈的種子商戶終端之后,還包括:返回從線下交易數(shù)據(jù)中確定出種子商戶終端的消費交易數(shù)據(jù)的步驟,直至滿足收斂條件為止;收斂條件為循環(huán)次數(shù)大于次數(shù)閾值;或每次循環(huán)的新增種子商戶終端的個數(shù)與已有種子商戶終端的個數(shù)比值小于比例閾值。本發(fā)明實施例提供一種確定商圈的裝置,包括:第一確定單元:用于確定商圈的種子商戶終端;第二確定單元:用于從線下交易數(shù)據(jù)中確定出種子商戶終端的消費交易數(shù)據(jù);第三確定單元:用于將與消費交易數(shù)據(jù)的賬戶相同且交易時間滿足時間閾值的交易數(shù)據(jù),確定為種子商戶終端的鄰近交易數(shù)據(jù);第四確定單元:用于將鄰近交易數(shù)據(jù)涉及的商戶終端確定為商圈的種子商戶終端,從而根據(jù)所有種子商戶終端所在區(qū)域更新商圈范圍??蛇x地,第四確定單元具體用于:將鄰近交易數(shù)據(jù)涉及的商戶終端確定為待選種子商戶終端;針對每個待選種子商戶終端,獲取待選種子商戶終端的鄰近交易數(shù)據(jù);根據(jù)待選種子商戶終端的鄰近交易數(shù)據(jù),統(tǒng)計各項評估指標(biāo);在各項評估指標(biāo)滿足預(yù)設(shè)條件時,確定待選種子商戶終端為商圈的種子商戶終端。可選地,第四確定單元具體還用于:統(tǒng)計待選種子商戶終端的鄰近交易數(shù)據(jù)的個數(shù);統(tǒng)計待選種子商戶終端的鄰近交易數(shù)據(jù)與種子商戶終端的消費交易數(shù)據(jù)中的交易時間的時間差值,并根據(jù)各時間差值確定出最小時間差值和平均時間差值;確定個數(shù)、最小時間差值和平均時間差值是否滿足預(yù)設(shè)條件??蛇x地,第一確定單元具體用于:查找商戶名中包含地址信息的商戶終端;根據(jù)地址信息確定商戶終端與商圈的距離;將滿足距離閾值的商戶終端確定為種子商戶終端??蛇x地,第四確定單元還用于:返回從線下交易數(shù)據(jù)中確定出種子商戶終端的消費交易數(shù)據(jù)的步驟,直至滿足收斂條件為止;收斂條件為循環(huán)次數(shù)大于次數(shù)閾值;或每次循環(huán)的新增種子商戶終端的個數(shù)與已有種子商戶終端的個數(shù)比值小于比例閾值。本發(fā)明實施例中提供了一種確定商圈的方法和裝置,確定商圈的種子商戶終端;從線下交易數(shù)據(jù)中確定出種子商戶終端的消費交易數(shù)據(jù);將與消費交易數(shù)據(jù)的賬戶相同且交易時間滿足時間閾值的交易數(shù)據(jù),確定為種子商戶終端的鄰近交易數(shù)據(jù);將鄰近交易數(shù)據(jù)涉及的商戶終端確定為商圈的種子商戶終端,從而根據(jù)所有種子商戶終端所在區(qū)域更新商圈范圍。本發(fā)明實施例中首先確定商圈的種子商戶終端;然后基于線下交易數(shù)據(jù)確定出種子商戶終端的消費交易數(shù)據(jù),將同一個賬戶在時間閾值內(nèi)進(jìn)行的消費交易數(shù)據(jù),確定為商圈種子商戶終端的鄰近交易數(shù)據(jù);最后將鄰近交易數(shù)據(jù)涉及到的商戶終端確定為商圈的種子商戶終端,從而根據(jù)所有種子商戶終端所在區(qū)域更新商圈范圍。可以看出,一方面,本發(fā)明的技術(shù)方案是基于線下交易數(shù)據(jù)的,而并不像現(xiàn)有技術(shù)依賴商戶地址文本信息;另一方面,現(xiàn)有技術(shù)在大數(shù)據(jù)算法如聚類算法中利用交易數(shù)據(jù)無法定義商戶終端之間的距離,而本發(fā)明的技術(shù)方案利用交易數(shù)據(jù)可以確定商戶終端的臨近交易數(shù)據(jù),從而可以避免利用交易數(shù)據(jù)無法定義商戶終端之間的距離的缺點,此外,通過交易數(shù)據(jù)劃定的商圈是動態(tài)的,使用不同時間段的交易數(shù)據(jù)能刻畫出不同商業(yè)場景下的商圈動態(tài)。附圖說明為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡要介紹。圖1為本發(fā)明實施例提供的一種確定商圈的方法流程示意圖;圖2為本發(fā)明實施例提供的一種確定商圈的整體方法流程示意圖;圖3為本發(fā)明實施例提供的一種確定商圈的裝置結(jié)構(gòu)示意圖。具體實施方式為了使本發(fā)明的目的、技術(shù)方案及有益效果更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。應(yīng)理解,本發(fā)明實施例的技術(shù)方案可以應(yīng)用于實現(xiàn)各個城市的商圈的定位。圖1示例性示出了本發(fā)明實施例提供的一種確定商圈的方法流程示意圖,如圖1所示,包括以下步驟:s101:確定商圈的種子商戶終端;s102:從線下交易數(shù)據(jù)中確定出種子商戶終端的消費交易數(shù)據(jù);s103:將與消費交易數(shù)據(jù)的賬戶相同且交易時間滿足時間閾值的交易數(shù)據(jù),確定為種子商戶終端的鄰近交易數(shù)據(jù);s104:將鄰近交易數(shù)據(jù)涉及的商戶終端確定為商圈的種子商戶終端,從而根據(jù)所有種子商戶終端所在區(qū)域更新商圈范圍。s101中,確定商圈的種子商戶終端,包括:查找商戶名中包含地址信息的商戶終端;根據(jù)地址信息確定商戶終端與商圈的距離;將滿足距離閾值的商戶終端確定為種子商戶終端。在具體實施中,可以從交易商戶庫中選取一部分商戶終端作為每個商圈的種子商戶終端,選取商戶終端作為商圈的種子商戶終端可以采用以下渠道:第一種渠道:從交易商戶庫提取少量商戶名中含有商戶地址的終端,比如上海世紀(jì)公園等,使用該地址信息作為輸入,與外部互聯(lián)網(wǎng)匹配其地理坐標(biāo),若地理坐標(biāo)距離某個商圈中心最近,則記該商戶終端為該商圈的種子商戶終端;第二種渠道:是對于交易量特別大且商戶名中含有能夠標(biāo)識商戶所屬地理位置特征詞的終端,通過人工數(shù)據(jù)驗證確定其為某個商圈的種子商戶終端。一般而言,初始階段,每個商圈的種子商戶終端數(shù)量在20個以上50個以下。其中,商戶終端可以是pos(pointofsale,銷售終端)機(jī)、atm(automatictellermachine,自動取款機(jī))機(jī)。首先確定出商圈的一小部分種子商戶終端,為后續(xù)擴(kuò)展商圈的范圍提供了前提保證,如果不選定一小部分商戶終端作為商圈的種子商戶終端,后續(xù)是沒法繼續(xù)計算與該商圈內(nèi)種子商戶終端有交易關(guān)聯(lián)的商戶終端。s102中,從線下交易數(shù)據(jù)中確定出種子商戶終端的消費交易數(shù)據(jù),具體來說,本發(fā)明的技術(shù)方案是基于海量的交易數(shù)據(jù),而海量的交易數(shù)據(jù)中包括線上和線下交易,要把交易數(shù)據(jù)中所有的線上交易數(shù)據(jù)剔除,因為線上交易數(shù)據(jù)不能反映商戶終端的地理位置信息,若保留會對數(shù)據(jù)結(jié)果造成錯誤的影響。其中,剔除線上交易的方法可以是:根據(jù)交易數(shù)據(jù)中的交易要素來剔除,其中,交易要素包括買方和賣方的信息、銀行卡信息、交易時間、交易地點、交易方式,比如交易方式是通過電腦、移動終端等、商戶終端名稱、商戶類型和行業(yè)等,可以根據(jù)識別出的交易要素中的關(guān)鍵信息來確定該條交易數(shù)據(jù)是否為線上交易,比如識別出交易要素中含有移動終端等的關(guān)鍵信息,則可以確定出該條交易為線上交易,那么就可以將這條線上交易剔除。剔除線上的交易數(shù)據(jù)之后,從線下交易數(shù)據(jù)中可以確定商圈中種子商戶終端的消費交易數(shù)據(jù)。從線下交易數(shù)據(jù)中確定種子商戶終端的消費交易數(shù)據(jù),可以看出,實用范圍更廣泛,而不僅僅局限于含有地址文本信息的交易,因此,本發(fā)明的技術(shù)方案對原始交易數(shù)據(jù)的要求更低,通過交易數(shù)據(jù)中的交易要素即可得到是否是線下交易。s103中,將與消費交易數(shù)據(jù)的賬戶相同且交易時間滿足時間閾值的交易數(shù)據(jù),確定為種子商戶終端的鄰近交易數(shù)據(jù),包括:將鄰近交易數(shù)據(jù)涉及的商戶終端確定為待選種子商戶終端;針對每個待選種子商戶終端,獲取待選種子商戶終端的鄰近交易數(shù)據(jù);根據(jù)待選種子商戶終端的鄰近交易數(shù)據(jù),統(tǒng)計各項評估指標(biāo);在各項評估指標(biāo)滿足預(yù)設(shè)條件時,確定待選種子商戶終端為商圈的種子商戶終端。具體來說,同一個賬戶在預(yù)設(shè)時間間隔閾值內(nèi)在不同的兩個商戶終端進(jìn)行的消費交易數(shù)據(jù),確定為種子商戶終端的鄰近交易數(shù)據(jù),其中,具體實施中,預(yù)設(shè)時間間隔一般取3小時,例如,賬戶1在10點在種子商戶終端a進(jìn)行了一筆消費交易,到10點50在種子商戶終端b進(jìn)行了另一筆消費交易,那么,將賬戶1先后在兩個不同種子商戶終端進(jìn)行消費交易的記錄作為種子商戶終端a,b的鄰近交易數(shù)據(jù)。如果種子商戶終端a,b的鄰近交易數(shù)據(jù)還與商戶終端d,e,f有關(guān),比如,賬戶1在10點在種子商戶終端a進(jìn)行了一筆消費交易,到11點在種子商戶終端d進(jìn)行了另一筆消費交易,那么種子商戶終端d為種子商戶終端a鄰近交易數(shù)據(jù)中涉及的商戶終端,把商戶終端d確定為該商圈的待選種子商戶終端,依次類推,商戶終端e,f也類似。針對每個待選種子商戶終端,獲取待選種子商戶終端的鄰近交易數(shù)據(jù),這里獲取待選種子商戶終端的鄰近交易數(shù)據(jù)的方法和上面舉得例子類似,這里就不再贅述??蛇x地,根據(jù)待選種子商戶終端的鄰近交易數(shù)據(jù),統(tǒng)計各項評估指標(biāo),包括:統(tǒng)計待選種子商戶終端的鄰近交易數(shù)據(jù)的個數(shù);統(tǒng)計待選種子商戶終端的鄰近交易數(shù)據(jù)與種子商戶終端的消費交易數(shù)據(jù)中的交易時間的時間差值,并根據(jù)各時間差值確定出最小時間差值和平均時間差值;具體來說,待選種子商戶終端d與商圈內(nèi)的種子商戶終端a,b發(fā)生過交易關(guān)聯(lián),那么,統(tǒng)計待選種子商戶終端d與商圈內(nèi)種子商戶終端a,b之間的各項評估指標(biāo),其中,各項評估指標(biāo)包括鄰近交易數(shù)據(jù)的個數(shù)、最小時間差值和平均時間差值。比如,待選種子商戶終端d與商圈內(nèi)種子商戶終端a之間有賬戶2和賬戶3滿足時間閾值條件下發(fā)生過交易,那么,待選種子商戶終端d與商圈內(nèi)種子商戶終端a之間的鄰近交易數(shù)據(jù)的個數(shù)是2,而待選種子商戶終端d與商圈內(nèi)種子商戶終端b之間有賬戶1、賬戶3、賬戶4滿足時間閾值條件下發(fā)生過交易,那么,待選種子商戶終端d與商圈內(nèi)種子商戶終端b之間的鄰近交易數(shù)據(jù)的個數(shù)是3,因此,待選種子商戶終端d的鄰近交易數(shù)據(jù)的個數(shù)是5,也可以說是待選種子商戶終端與該商圈的鄰近交易數(shù)據(jù)的個數(shù)是5;最小時間差值的統(tǒng)計方法為:待選種子商戶終端d與商圈內(nèi)種子商戶終端a之間的交易時間的差值、待選種子商戶終端d與商圈內(nèi)種子商戶終端b之間的交易時間的差值中交易時間的差值最小的,比如,賬戶2在10點在待選種子商戶終端d在種子商戶終端a發(fā)生過一筆交易,在10點20分在種子商戶終端b發(fā)生過一筆交易,那么這時的交易時間差值為20分鐘,其它的也類似,這里不再贅述,假如通過統(tǒng)計,統(tǒng)計出待選種子商戶終端d與商圈內(nèi)的種子終端a,b中所有的時間差值中最小時間差值為15分鐘;平均時間差值的統(tǒng)計方法:所有時間的差值相加除以鄰近交易數(shù)據(jù)的個數(shù),例如,賬戶2在待選種子終端d與種子終端a交易的時間差值為1小時,賬戶3在待選種子終端d與種子終端a交易的時間差值為1.5小時,賬戶1在待選種子終端d與種子終端b交易的時間差值為2小時、賬戶3在待選種子終端d與種子終端b交易的時間差值為2.5小時、賬戶4在待選種子終端d與種子終端b交易的時間差值為1.5小時,將所有的時間差值加起來為8.5小時,待選種子終端d的鄰近交易數(shù)據(jù)的個數(shù)為5,所以平均時間差值為8.5除以5為1.7小時。通過統(tǒng)計各項評估指標(biāo)的方法作為商圈更新范圍的限制條件,可以看出商圈范圍更新的過程具有很好的穩(wěn)定性和更高的可信度。確定個數(shù)、最小時間差值和平均時間差值是否滿足預(yù)設(shè)條件。具體來說,判斷個數(shù)是否大于第一設(shè)定的閾值,最小時間差值和平均時間差值是否小于第二設(shè)定的閾值,其中,第一設(shè)定的閾值和第二設(shè)定的閾值可以相同也可以不相同,視具體的情況而定,第一設(shè)定的閾值和第二設(shè)定的閾值可以為5%~10%,如果個數(shù)、最小時間差值和平均時間差值都滿足預(yù)設(shè)條件,那么可以將該待選種子終端納入到該商圈中,作為該商圈新增的種子商戶終端。需要說明的是,具體實施中,如果確定出一個待選種子商戶終端的個數(shù)、最小時間差值和平均時間差值滿足預(yù)設(shè)條件之后,確定出這個待選種子商戶終端既屬于商圈1,又屬于商圈2,那么,接著再比較這個待選種子商戶終端與商圈1和商圈2的鄰近交易數(shù)據(jù)的個數(shù),看誰的多,就將其納入該商圈中,比如,這個待選種子商戶終端與商圈1的鄰近交易數(shù)據(jù)的個數(shù)為9,這個待選種子商戶終端與商圈1的鄰近交易數(shù)據(jù)的個數(shù)為5,那么,就將這個待選種子商戶終端納入到商圈1中。不僅僅統(tǒng)計各項評估指標(biāo),各項評估指標(biāo)還要滿足預(yù)設(shè)條件,才可以作為商圈更新范圍的商戶終端,這樣更加提高了商圈更新過程的穩(wěn)定性和可信度。s104中,將鄰近交易數(shù)據(jù)涉及的商戶終端確定為商圈的種子商戶終端,從而根據(jù)所有種子商戶終端所在區(qū)域更新商圈范圍,比如,商圈內(nèi)的種子商戶終端a,b之間的鄰近交易數(shù)據(jù)涉及的待選種子商戶終端d確定為商圈的種子商戶終端,根據(jù)種子商戶終端d所在的區(qū)域來更新商圈的范圍,具體實施中,可以通過畫圓或者橢圓或者不規(guī)則的近似圓的形狀的方式來更新商圈的范圍。可選地,將鄰近交易數(shù)據(jù)涉及的商戶終端確定為商圈的種子商戶終端之后,還包括:返回從線下交易數(shù)據(jù)中確定出種子商戶終端的消費交易數(shù)據(jù)的步驟,直至滿足收斂條件為止;收斂條件為循環(huán)次數(shù)大于次數(shù)閾值;或每次循環(huán)的新增種子商戶終端的個數(shù)與已有種子商戶終端的個數(shù)比值小于比例閾值。具體來說,將待選種子商戶終端d納入到商圈中之后,于是,第一輪商圈更新范圍完成,接著返回從線下交易數(shù)據(jù)中確定出種子商戶終端的消費交易數(shù)據(jù)的步驟,重新計算待選商戶終端e,f是否屬于商圈1,直到滿足收斂條件為止,其中收斂條件為循環(huán)次數(shù)小于次數(shù)閾值;或每次循環(huán)的新增種子商戶終端的個數(shù)與所有種子商戶終端的個數(shù)比值小于比例閾值,比如,次數(shù)閾值設(shè)為11次,那么,當(dāng)前循環(huán)次數(shù)為10,那么,不滿足次數(shù)閾值,或者,商圈內(nèi)的種子商戶終端有兩個,分別為a,b,而待選種子商戶終端d,e,f假如都滿足設(shè)定條件,可以將d,e,f納入到商圈中,那么,新增的種子商戶終端d,e,f的個數(shù)與已有種子商戶終端a,b的個數(shù)的比例為1.5,而比例閾值如果設(shè)為1,那么,不滿足收斂條件,直到滿足任一收斂條件為止。通過多次循環(huán)或者每次循環(huán)的新增種子商戶終端的個數(shù)與已有種子商戶終端的個數(shù)比值小于比例閾值,可以看出基于交易數(shù)據(jù)而更新的商圈的范圍是動態(tài)的,這樣能夠刻畫出不同商業(yè)場景下的商圈動態(tài)。為了更好地理解本發(fā)明的技術(shù)方案,那么,下面介紹一下確定商圈的整體思路,圖2示例性地示出了一種確定商圈的整體方法流程圖,如圖2所示,包括以下步驟:s201:開始;s202:確定商圈的種子商戶終端;s203:從線下交易數(shù)據(jù)中確定出種子商戶終端的消費交易數(shù)據(jù);s204:將與消費交易數(shù)據(jù)的賬戶相同且交易時間滿足時間閾值的交易數(shù)據(jù),確定為種子商戶終端的鄰近交易數(shù)據(jù);s205:將鄰近交易數(shù)據(jù)涉及的商戶終端確定為商圈的待選種子商戶終端;s206:針對每個待選種子商戶終端,獲取待選種子商戶終端的鄰近交易數(shù)據(jù);s207:根據(jù)待選種子商戶終端的鄰近交易數(shù)據(jù),統(tǒng)計各項評估指標(biāo);s208:判斷各項評估指標(biāo)是否滿足預(yù)設(shè)條件,若是,則執(zhí)行s209,若否,則執(zhí)行s210;s209:根據(jù)該待選種子商戶終端所在區(qū)域更新商圈范圍;s210:不更新商圈范圍;s211:判斷是否滿足收斂條件,若是,則執(zhí)行s212,若否,則執(zhí)行s203;s212:結(jié)束。進(jìn)一步地,為了更好地理解本發(fā)明的技術(shù)方案,下面舉一個具體的實施例:以上海為例,為了計算方便和便于理解方案,假設(shè)上海有1個商圈(商圈1),通過s101確定商圈1中包含2個種子商戶終端,分別為(a,b),表1示例性地示出了確定商圈的種子商戶終端,如表1所示:表1:確定商圈的種子商戶終端商圈1種子商戶終端a,b假設(shè)交易商戶庫中總共有10個商戶終端,為商戶終端a,b,c,d,e,f,g,h,i,j。從這10個商戶終端中找到關(guān)于同一個賬戶在時間閾值(一般為3小時)內(nèi)在兩個不同商戶終端進(jìn)行交易的記錄,這個交易記錄作為一個交易對,這個交易對稱為鄰近交易數(shù)據(jù),其中,具體實施中賬戶也可以稱之為客戶。例如,表2中客戶1在滿足時間閾值(1小時)內(nèi)先后在商戶終端a,b發(fā)生過一筆交易,那么,這個交易為一個交易對,具體如下表2所示,表2示例性地示出了確定種子商戶終端的鄰近交易數(shù)據(jù):表2:確定種子商戶終端的鄰近交易數(shù)據(jù)需要說明一點的是,在具體實施中,表1中的任何兩個商戶終端之間所涉及的客戶不僅僅如表中所列的幾個,兩個商戶終端之間會涉及到很多客戶,這里兩個商戶終端之間僅列了幾個是為了便于計算?;诒?,計算關(guān)于商戶終端a,b,c,d,e,f中任意兩個商戶終端之間的鄰近交易數(shù)據(jù)的個數(shù)、交易最小時間差值和交易平均時間差值,那么,通過計算,形成表3,表3示例性地示出了任意兩個商戶終端之間的鄰近交易數(shù)據(jù)的個數(shù)、交易最小時間差值、交易平均時間差值的關(guān)系表,如表3所示:計算待選商戶終端與發(fā)生交易關(guān)聯(lián)的商圈1之間的鄰近交易數(shù)據(jù)的個數(shù)、交易最小時間差值、交易平均時間差值,由上表可知商戶終端c,d,e,f分別與商圈1發(fā)生了交易關(guān)聯(lián)。它們與商圈1之間的鄰近交易數(shù)據(jù)的個數(shù)、交易最小時間差值、交易平均時間差值的計算結(jié)果如下表4所示,表4示例性地示出了待選商戶終端與商圈之間的鄰近交易數(shù)據(jù)的個數(shù)、交易最小時間差值、交易平均時間差值的計算結(jié)果:表4:待選商戶終端與商圈之間的鄰近交易數(shù)據(jù)的個數(shù)、交易最小時間差值、交易平均時間差值的計算結(jié)果根據(jù)表4,可以計算出商圈1的各項評估指標(biāo)如鄰近交易數(shù)據(jù)的個數(shù)、交易最小時間差值和交易平均時間差值的分布以及百分位數(shù)。如:鄰近交易數(shù)據(jù)的個數(shù)的50%分位數(shù)是5,交易最小時間差值25%分位數(shù)是0.4,交易平均時間差值25%分位數(shù)是1.14。設(shè)定以上分位數(shù)為商圈的更新范圍的閾值,只有當(dāng)商戶終端的各項評估指標(biāo)同時滿足預(yù)設(shè)條件,才將根據(jù)該商戶終端所在區(qū)域更新該商圈范圍,此例中,商戶終端c屬于商圈1,商戶終端d,e,f均不屬于商圈1。此處需要說明兩點:首先是在實際運算過程中,分位數(shù)的選取一般在5%分位數(shù)到10%分位數(shù)之間,此處僅僅為了展示需要選取了50%和25%分位數(shù);其次,若存在同一商戶終端同時滿足作為多個商圈的更新范圍的條件,則取最大鄰近交易數(shù)據(jù)的個數(shù)所對應(yīng)的商圈。至此,第一輪商圈更新范圍完成,更新商圈1表格為下表5,表5示例性地示出了第一輪商圈更新范圍后的種子商戶終端的結(jié)果,如表5所示:表5:第一輪商圈更新范圍后的種子商戶終端的結(jié)果商圈1種子商戶終端a,b,c然后繼續(xù)重復(fù)以上步驟,重新計算商戶終端d,e,f等是否屬于商圈1,直至達(dá)到以下兩個收斂條件中的任何一個:1)商圈中新增的種子商戶終端的個數(shù)與已有種子商戶終端的個數(shù)比值小于比例閾值,比例閾值可以設(shè)為如百分之一,視具體情況而定;2)循環(huán)次數(shù)大于次數(shù)閾值,次數(shù)閾值如10次或者更多次,視具體情況而定。在上例中,第一次將商戶終端c加入商圈1,新增的種子商戶終端的個數(shù)與已有種子商戶終端的個數(shù)比值為1/3=33%>1%,不滿足收斂條件1,且循環(huán)次數(shù)=1<10,不滿足收斂條件2,故第一次更新商圈1范圍后需要繼續(xù)進(jìn)行第二次更新,直至任一收斂條件滿足。當(dāng)計算完成后,最終確定商圈1中最終包含商戶終端a,b,c……,即完成了商戶終端a,b,c……i的商圈定位。本發(fā)明實施例中提供了一種確定商圈的方法,確定商圈的種子商戶終端;從線下交易數(shù)據(jù)中確定出種子商戶終端的消費交易數(shù)據(jù);將與消費交易數(shù)據(jù)的賬戶相同且交易時間滿足時間閾值的交易數(shù)據(jù),確定為種子商戶終端的鄰近交易數(shù)據(jù);將鄰近交易數(shù)據(jù)涉及的商戶終端確定為商圈的種子商戶終端,從而根據(jù)所有種子商戶終端所在區(qū)域更新商圈范圍。本發(fā)明實施例中首先確定商圈的種子商戶終端;然后基于線下交易數(shù)據(jù)確定出種子商戶終端的消費交易數(shù)據(jù),將同一個賬戶在時間閾值內(nèi)進(jìn)行的消費交易數(shù)據(jù),確定為商圈種子商戶終端的鄰近交易數(shù)據(jù);最后將鄰近交易數(shù)據(jù)涉及到的商戶終端確定為商圈的種子商戶終端,從而根據(jù)所有種子商戶終端所在區(qū)域更新商圈范圍。可以看出,一方面,本發(fā)明的技術(shù)方案是基于線下交易數(shù)據(jù)的,而并不像現(xiàn)有技術(shù)依賴商戶地址文本信息;另一方面,現(xiàn)有技術(shù)在大數(shù)據(jù)算法如聚類算法中利用交易數(shù)據(jù)無法定義商戶終端之間的距離,而本發(fā)明的技術(shù)方案利用交易數(shù)據(jù)可以確定商戶終端的臨近交易數(shù)據(jù),從而可以避免利用交易數(shù)據(jù)無法定義商戶終端之間的距離的缺點,此外,通過交易數(shù)據(jù)劃定的商圈是動態(tài)的,使用不同時間段的交易數(shù)據(jù)能刻畫出不同商業(yè)場景下的商圈動態(tài)?;谙嗤瑯?gòu)思,本發(fā)明實施例提供的一種確定商圈的裝置,如圖3所示,該裝置包括第一確定單元301、第二確定單元302、第三確定單元303、第四確定單元304。其中:第一確定單元301:用于確定商圈的種子商戶終端;第二確定單元302:用于從線下交易數(shù)據(jù)中確定出種子商戶終端的消費交易數(shù)據(jù);第三確定單元303:用于將與消費交易數(shù)據(jù)的賬戶相同且交易時間滿足時間閾值的交易數(shù)據(jù),確定為種子商戶終端的鄰近交易數(shù)據(jù);第四確定單元304:用于將鄰近交易數(shù)據(jù)涉及的商戶終端確定為商圈的種子商戶終端,從而根據(jù)所有種子商戶終端所在區(qū)域更新商圈范圍。可選地,第四確定單元304具體用于:將鄰近交易數(shù)據(jù)涉及的商戶終端確定為待選種子商戶終端;針對每個待選種子商戶終端,獲取待選種子商戶終端的鄰近交易數(shù)據(jù);根據(jù)待選種子商戶終端的鄰近交易數(shù)據(jù),統(tǒng)計各項評估指標(biāo);在各項評估指標(biāo)滿足預(yù)設(shè)條件時,確定待選種子商戶終端為商圈的種子商戶終端??蛇x地,第四確定單元304具體還用于:統(tǒng)計待選種子商戶終端的鄰近交易數(shù)據(jù)的個數(shù);統(tǒng)計待選種子商戶終端的鄰近交易數(shù)據(jù)與種子商戶終端的消費交易數(shù)據(jù)中的交易時間的時間差值,并根據(jù)各時間差值確定出最小時間差值和平均時間差值;確定個數(shù)、最小時間差值和平均時間差值是否滿足預(yù)設(shè)條件??蛇x地,第一確定單元301具體用于:查找商戶名中包含地址信息的商戶終端;根據(jù)地址信息確定商戶終端與商圈的距離;將滿足距離閾值的商戶終端確定為種子商戶終端。可選地,第四確定單元304還用于:返回從線下交易數(shù)據(jù)中確定出種子商戶終端的消費交易數(shù)據(jù)的步驟,直至滿足收斂條件為止;收斂條件為循環(huán)次數(shù)大于次數(shù)閾值;或每次循環(huán)的新增種子商戶終端的個數(shù)與已有種子商戶終端的個數(shù)比值小于比例閾值。本發(fā)明實施例中提供了一種確定商圈的裝置,從上述內(nèi)容可看出:確定商圈的種子商戶終端;從線下交易數(shù)據(jù)中確定出種子商戶終端的消費交易數(shù)據(jù);將與消費交易數(shù)據(jù)的賬戶相同且交易時間滿足時間閾值的交易數(shù)據(jù),確定為種子商戶終端的鄰近交易數(shù)據(jù);將鄰近交易數(shù)據(jù)涉及的商戶終端確定為商圈的種子商戶終端,從而根據(jù)所有種子商戶終端所在區(qū)域更新商圈范圍。本發(fā)明實施例中首先確定商圈的種子商戶終端;然后基于線下交易數(shù)據(jù)確定出種子商戶終端的消費交易數(shù)據(jù),將同一個賬戶在時間閾值內(nèi)進(jìn)行的消費交易數(shù)據(jù),確定為商圈種子商戶終端的鄰近交易數(shù)據(jù);最后將鄰近交易數(shù)據(jù)涉及到的商戶終端確定為商圈的種子商戶終端,從而根據(jù)所有種子商戶終端所在區(qū)域更新商圈范圍??梢钥闯?,一方面,本發(fā)明的技術(shù)方案是基于線下交易數(shù)據(jù)的,而并不像現(xiàn)有技術(shù)依賴商戶地址文本信息;另一方面,現(xiàn)有技術(shù)在大數(shù)據(jù)算法如聚類算法中利用交易數(shù)據(jù)無法定義商戶終端之間的距離,而本發(fā)明的技術(shù)方案利用交易數(shù)據(jù)可以確定商戶終端的臨近交易數(shù)據(jù),從而可以避免利用交易數(shù)據(jù)無法定義商戶終端之間的距離的缺點,此外,通過交易數(shù)據(jù)劃定的商圈是動態(tài)的,使用不同時間段的交易數(shù)據(jù)能刻畫出不同商業(yè)場景下的商圈動態(tài)。本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實施例可提供為方法、或計算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機(jī)可用程序代碼的計算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器、cd-rom、光學(xué)存儲器等)上實施的計算機(jī)程序產(chǎn)品的形式。本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備(系統(tǒng))、和計算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機(jī)程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計算機(jī)程序指令到通用計算機(jī)、專用計算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個機(jī)器,使得通過計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。這些計算機(jī)程序指令也可存儲在能引導(dǎo)計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機(jī)可讀存儲器中,使得存儲在該計算機(jī)可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。這些計算機(jī)程序指令也可裝載到計算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機(jī)實現(xiàn)的處理,從而在計算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。盡管已描述了本發(fā)明的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造性概念,則可對這些實施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括優(yōu)選實施例以及落入本發(fā)明范圍的所有變更和修改。顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。當(dāng)前第1頁12