一種數(shù)據(jù)處理方法和裝置制造方法
【專利摘要】本發(fā)明提供了一種數(shù)據(jù)處理方法和裝置,該方法包括:獲取待分析數(shù)據(jù)具有的屬性參數(shù);根據(jù)待分析數(shù)據(jù)具有的屬性參數(shù),確定待生成的二進制數(shù)的位數(shù),其中,該二進制數(shù)的位數(shù)與待分析數(shù)據(jù)具有的屬性參數(shù)的個數(shù)相同,且該二進制數(shù)的各位分別表示該待分析數(shù)據(jù)的一個屬性參數(shù);生成具有該位數(shù)的所有所述二進制數(shù),并從生成的多個二進制數(shù)中,選取包含有預(yù)設(shè)數(shù)量位為第一指定數(shù)值的二進制數(shù);對于每個選取出的二進制數(shù),將二進制數(shù)中為第一指定數(shù)值的各位所表示的屬性參數(shù)組成屬性參數(shù)組合;基于得到的屬性參數(shù)組合,對待分析數(shù)據(jù)進行預(yù)設(shè)數(shù)量維度的統(tǒng)計。該方法可以提高對數(shù)據(jù)分析統(tǒng)計的精度。
【專利說明】一種數(shù)據(jù)處理方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)據(jù)處理【技術(shù)領(lǐng)域】,更具體的說是涉及一種數(shù)據(jù)處理方法和裝置。
【背景技術(shù)】
[0002]在數(shù)據(jù)統(tǒng)計中,經(jīng)常需要涉及到排重計算。所謂排重計算就是從待統(tǒng)計數(shù)據(jù)中統(tǒng)計出指定類型的數(shù)據(jù)記錄,以排除不屬于該指定類型的數(shù)據(jù)記錄。例如,以待統(tǒng)計數(shù)據(jù)為某個超市的銷售數(shù)據(jù)為例,則該銷售數(shù)據(jù)包括多條數(shù)據(jù)記錄,每條數(shù)據(jù)記錄中具包含了已銷售商品的商品名稱、生產(chǎn)廠商、銷售時間等屬性信息,如果對本月銷售的商品A進行排重計算后,則僅僅會統(tǒng)計出銷售時間為本月,且商品名稱為商品A的數(shù)據(jù)記錄,而其他數(shù)據(jù)記錄則會被排除。
[0003]在實際應(yīng)用中,待分析數(shù)據(jù)一般具有多個屬性參數(shù),可能需要分別基于多個不同的屬性組合來進行多個維度的排重計算,這樣,則需要人為根據(jù)所需統(tǒng)計的維度數(shù),列舉出可能的屬性組合情況,然后再分別基于可能的屬性參數(shù)組合進行排重計算。
[0004]如仍以上面的例子進行介紹,該銷售數(shù)據(jù)對應(yīng)著商品名稱、生產(chǎn)廠商、銷售時間這個三個屬性參數(shù),這三個屬性參數(shù)可以組合成8種不同的維度組合,即該8種可能的維度組合包含一個三維度組合、三個二維度組合、三個一維度組合和一個零維度組合。其中,該三維度的組合為由商品名稱、生產(chǎn)廠商和銷售時間這三個屬性參數(shù)組合的三維組合;該三個兩維度的組合分別為:商品名稱和生產(chǎn)廠商的二維組合,商品名稱和銷售時間的二維組合,生產(chǎn)廠商和銷售時間的二維組合;該三個一維度的組合則分別是商品名稱、生產(chǎn)廠商和銷售時間中任意一個屬性參數(shù)為一個一維組合;零維度就是不考慮任意的屬性參數(shù)組合。上面提到的對本月銷售的商品A進行排重計算實際上是基于銷售名稱和銷售時間這兩個屬性參數(shù)組合的一種二維度的排重計算。
[0005]當(dāng)數(shù)據(jù)具有的屬性參數(shù)的數(shù)量為η時,基于不同維度的屬性參數(shù)組合的總數(shù)量則為2的η次方。隨著數(shù)據(jù)復(fù)雜性的增加,數(shù)據(jù)具有的屬性參數(shù)的數(shù)量也相應(yīng)增多。當(dāng)數(shù)據(jù)具有的屬性參數(shù)數(shù)量較大時,可能的也相應(yīng)增多,這樣,通過人為的方式列舉可能的維度組合已經(jīng)變得不可能,而且人為列舉也經(jīng)常會出現(xiàn)遺漏某些屬性參數(shù)的組合,使得得到的維度組合不全面,影響到了排重計算,進而降低了數(shù)據(jù)統(tǒng)計分析的精度。
【發(fā)明內(nèi)容】
,
[0006]有鑒于此,本發(fā)明提供一種數(shù)據(jù)處理方法和裝置,以提高利用待分析數(shù)據(jù)的屬性參數(shù)確定維度組合的準(zhǔn)確性,進而提高數(shù)據(jù)統(tǒng)計分析的精度。
[0007]為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種數(shù)據(jù)處理方法,包括:
[0008]獲取待分析數(shù)據(jù)具有的屬性參數(shù);
[0009]根據(jù)所述待分析數(shù)據(jù)具有的屬性參數(shù),確定待生成的二進制數(shù)的位數(shù),其中,所述二進制數(shù)的位數(shù)與所述待分析數(shù)據(jù)具有的屬性參數(shù)的個數(shù)相同,且所述二進制數(shù)的各位分別表示所述待分析數(shù)據(jù)的一個屬性參數(shù);[0010]生成具有所述位數(shù)的所有所述二進制數(shù),并從生成的所述多個二進制數(shù)中,選取包含有預(yù)設(shè)數(shù)量位為第一指定數(shù)值的二進制數(shù),其中,所述第一指定數(shù)值為O或I ;
[0011]對于每個選取出的所述二進制數(shù),將所述二進制數(shù)中為所述第一指定數(shù)值的各位所表示的屬性參數(shù)組成屬性參數(shù)組合;
[0012]基于得到的所述屬性參數(shù)組合,對所述待分析數(shù)據(jù)進行所述預(yù)設(shè)數(shù)量個維度的統(tǒng)計。
[0013]優(yōu)選的,所述生成具有所述位數(shù)的所有所述二進制數(shù),并從生成的所述多個二進制數(shù)中,選取包含有預(yù)設(shè)數(shù)量位為第一指定數(shù)值的二進制數(shù),包括:
[0014]A:生成具有所述位數(shù),且每位均為所述第二指定數(shù)值的初始二進制數(shù),將所述初始二進制數(shù)作為第一二進制數(shù),其中,第二指定數(shù)值為O或I;
[0015]B:根據(jù)預(yù)設(shè)規(guī)則和所述第一二進制數(shù),生成第二二進制數(shù),所述第二二進制數(shù)與所述第一二進制的差值的絕對值為I;
[0016]C:如果所述第二二進制數(shù)中有預(yù)設(shè)數(shù)量位上的數(shù)值為第一指定數(shù)值,則選取出所述第二二進制數(shù);
[0017]C:判斷所述第二二進制數(shù)的各位是否為均為第三指定數(shù)值,如果是,則執(zhí)行生成所述屬性參數(shù)組合的操作;如果否,則將當(dāng)前的所述第二二進制數(shù)作為所述第一二進制數(shù),并返回所述步驟B;
[0018]其中,所述第三指定數(shù)值為O或1,且所述第三指定數(shù)值不同于所述第二指定數(shù)值。
[0019]優(yōu)選的,當(dāng)所述第二指定數(shù)值為O時,所述生成具有所述位數(shù),且每位均為所述第二指定數(shù)值的初始二進制數(shù),包括:
[0020]生成具有所述位數(shù),且每位均為O的初始二進制數(shù)
[0021]所述根據(jù)預(yù)設(shè)規(guī)則和所述第一二進制數(shù),生成第二二進制數(shù),所述第二二進制數(shù)與所述第一二進制的差值的絕對值為1,包括:
[0022]將所述第一二進制數(shù)的最低位加一,得到第二二進制數(shù)。
[0023]優(yōu)選的,當(dāng)所述第二指定數(shù)值為I時,所述生成具有所述位數(shù),且每位均為所述第二指定數(shù)值的初始二進制數(shù),包括:
[0024]生成具有所述位數(shù),且每位均為I的初始二進制;
[0025]所述根據(jù)預(yù)設(shè)規(guī)則和所述第一二進制數(shù),生成第二二進制數(shù),所述第二二進制數(shù)與所述第一二進制的差值的絕對值為1,包括:
[0026]將所述第一二進制數(shù)的最低位減一,得到第二二進制數(shù)。
[0027]優(yōu)選的,所述對于每個選取出的所述二進制數(shù),將所述二進制數(shù)中為所述第一指定數(shù)值的各位所表示的屬性參數(shù)組成屬性參數(shù)組合,包括:
[0028]對于每個選取出的所述二進制數(shù),按照第一指定數(shù)值對應(yīng)布爾數(shù)組中的真值的規(guī)貝U,將所述二進制數(shù)的各位的值依次轉(zhuǎn)換為布爾數(shù)組中的元素值,以使得所述布爾數(shù)組中的每個元素值分別對應(yīng)一個所述屬性參數(shù);
[0029]提取出所述布爾數(shù)組中真值對應(yīng)的屬性參數(shù),將提取出的屬性參數(shù)組成屬性參數(shù)組合。
[0030]另一方面,本發(fā)明還提供了一種數(shù)據(jù)處理裝置,包括:[0031]獲取單元,用于獲取待分析數(shù)據(jù)具有的屬性參數(shù);
[0032]關(guān)系確定單元,用于根據(jù)所述待分析數(shù)據(jù)具有的屬性參數(shù),確定待生成的二進制數(shù)的位數(shù),其中,所述二進制數(shù)的位數(shù)與所述待分析數(shù)據(jù)具有的屬性參數(shù)的個數(shù)相同,且所述二進制數(shù)的各位分別表示所述待分析數(shù)據(jù)的一個屬性參數(shù);
[0033]二進制數(shù)處理單元,用于根據(jù)所述關(guān)系確定單元確定出的位數(shù),生成具有所述位數(shù)的所有所述二進制數(shù),并從生成的所述多個二進制數(shù)中,選取包含有預(yù)設(shè)數(shù)量位為第一指定數(shù)值的二進制數(shù),其中,所述第一指定數(shù)值為O或I ;
[0034]屬性參數(shù)組合單元,用于對于所述二進制數(shù)處理單元選取出的每個所述二進制數(shù),將所述二進制數(shù)中為所述第一指定數(shù)值的各位所表示的屬性參數(shù)組成屬性參數(shù)組合;
[0035]計算單元,用于基于所述屬性參數(shù)組合單元得到的所述屬性參數(shù)組合,對所述待分析數(shù)據(jù)進行所述預(yù)設(shè)數(shù)量個維度的統(tǒng)計。
[0036]優(yōu)選的,所述二進制數(shù)處理單元,包括:
[0037]初始數(shù)生成單元,用于根據(jù)所述關(guān)系確定單元確定出的位數(shù),生成具有所述位數(shù),且每位均為所述第二指定數(shù)值的初始二進制數(shù),將所述初始二進制數(shù)作為第一二進制數(shù),其中,第二指定數(shù)值為O或I ;
[0038]中間數(shù)生成單元,用于根據(jù)預(yù)設(shè)規(guī)則和所述第一二進制數(shù),生成第二二進制數(shù),所述第二二進制數(shù)與所述第一二進制的差值的絕對值為I ;
[0039]二進制數(shù)選取單元,用于如果所述中間制數(shù)生成單元生成的所述第二二進制數(shù)中有預(yù)設(shè)數(shù)量位上的數(shù)值為所述第一指定數(shù)值,則選取出所述第二二進制數(shù);
[0040]判斷單元,用于判斷所述中間數(shù)生成單元生成的所述第二二進制數(shù)的各位是否為均為第三指定數(shù)值,如果是,則觸發(fā)執(zhí)行所述屬性參數(shù)組合單元;如果否,則將當(dāng)前的所述第二二進制數(shù)作為所述第一二進制數(shù),并返回執(zhí)行所述中間二進制數(shù)生成單元;其中,所述第三指定數(shù)值為O或1,且所述第三指定數(shù)值不同于所述第二指定數(shù)值。
[0041]優(yōu)選的,當(dāng)所述第二指定數(shù)值為O時,所述初始數(shù)生成單元,包括:
[0042]第一初始數(shù)生成單元,用于根據(jù)所述關(guān)系確定單元確定出的位數(shù),生成具有所述位數(shù),且每位均為O的初始二進制數(shù)
[0043]所述中間數(shù)生成單元,包括:
[0044]第一中間數(shù)生成單元,用于將所述第一二進制數(shù)的最低位加一,得到第二二進制數(shù)。
[0045]優(yōu)選的,當(dāng)所述第二指定數(shù)值為I時,所述初始數(shù)生成單元,包括:
[0046]第一初始數(shù)生成單元,用于根據(jù)所述關(guān)系確定單元確定出的位數(shù),生成具有所述位數(shù),且每位均為I的初始二進制;
[0047]所述中間數(shù)生成單元,包括:
[0048]第一中間數(shù)生成單元,用于將所述第一二進制數(shù)的最低位減一,得到第二二進制數(shù)。
[0049]優(yōu)選的,所述屬性參數(shù)組合單元,包括:
[0050]布爾數(shù)組轉(zhuǎn)換單元,用于對于每個選取出的所述二進制數(shù),按照第一指定數(shù)值對應(yīng)布爾數(shù)組中的真值的規(guī)則,將所述二進制數(shù)的各位的值依次轉(zhuǎn)換為布爾數(shù)組中的元素值,以使得所述布爾數(shù)組中的每個元素值分別對應(yīng)一個所述屬性參數(shù);[0051]參數(shù)組合子單元,用于提取出所述布爾數(shù)組中真值對應(yīng)的屬性參數(shù),將提取出的屬性參數(shù)組成屬性參數(shù)組合。
[0052]經(jīng)由上述的技術(shù)方案可知,本發(fā)明根據(jù)該待分析數(shù)據(jù)具有的屬性參數(shù)的數(shù)量,生成了與該屬性參數(shù)的數(shù)量相同位數(shù)的二進制數(shù),生成的二進制數(shù)各位分別表示該待分析數(shù)據(jù)的一個屬性參數(shù),由于二進制數(shù)是由O和I組成,這樣可以設(shè)定O或I為第一指定數(shù)值,并認(rèn)為二進制數(shù)中為第一指定數(shù)值的位所對應(yīng)的屬性參數(shù)參與統(tǒng)計計算,這樣,生成的二進制數(shù)實際上包括了該待分析數(shù)據(jù)中屬性參數(shù)進行任意組合的各個組合形式。當(dāng)統(tǒng)計分析的維度數(shù)為預(yù)設(shè)數(shù)量時,從生成的二進制數(shù)中選取出預(yù)設(shè)數(shù)量位為第一指定數(shù)值的二進制數(shù)后,對于選取出的每個二進制數(shù),將該二進制數(shù)中為該第一指定數(shù)值的各位所表示的屬性參數(shù)組成屬性參數(shù)組合,便可以得到滿足該維度數(shù)的所有的屬性參數(shù)組合,避免了遺漏滿足該維度數(shù)的屬性參數(shù)的組合,進而提高了基于該維度數(shù)對待分析數(shù)據(jù)進行統(tǒng)計的精度。
【專利附圖】
【附圖說明】
[0053]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)提供的附圖獲得其他的附圖。
[0054]圖1示出了本發(fā)明一種數(shù)據(jù)處理方法一個實施例的流程示意圖;
[0055]圖2示出了本發(fā)明一種數(shù)據(jù)處理方法另一個實施例的流程示意圖;
[0056]圖3示出了本發(fā)明一種數(shù)據(jù)處理裝置一個實施例的結(jié)構(gòu)示意圖;
[0057]圖4示出了本發(fā)明一種數(shù)據(jù)處理裝置的二進制數(shù)處理單元一種組成結(jié)構(gòu)示意圖。
【具體實施方式】
[0058]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0059]參見圖1,示出了本發(fā)明一種數(shù)據(jù)處理方法一個實施例的流程示意圖,本發(fā)明的方法可以應(yīng)用于任意的計算節(jié)點中,本實施例的方法可以包括:
[0060]S101,獲取待分析數(shù)據(jù)具有的屬性參數(shù)。
[0061]其中,該待分析數(shù)據(jù)可以為需要進行統(tǒng)計分析的多條數(shù)據(jù),如商品銷售記錄、網(wǎng)絡(luò)帶寬使用記錄等。
[0062]該待分析數(shù)據(jù)的屬性參數(shù)是描述該待分析數(shù)據(jù)所代表的對象、類別或特征的參數(shù)。如該待分析數(shù)據(jù)的屬性參數(shù)可以為該待分析數(shù)據(jù)所表明的信息名稱、待分析數(shù)據(jù)中各條數(shù)據(jù)的生成時間等。如待分析數(shù)據(jù)為通訊使用數(shù)據(jù)時,屬性參數(shù)可以包括待分析數(shù)據(jù)中各條呼叫記錄所對應(yīng)的電話號碼、運營商、呼叫類型,通話時長等參數(shù)。
[0063]可以理解的是,在數(shù)據(jù)統(tǒng)計領(lǐng)域,待分析數(shù)據(jù)的屬性參數(shù)也可以稱為待分析數(shù)據(jù)的維度,待分析數(shù)據(jù)的一個屬性參數(shù)即為該待分析數(shù)據(jù)的一個維度。在對待分析數(shù)據(jù)進行統(tǒng)計時,可以根據(jù)需要選取該待分析數(shù)據(jù)的一個或多個維度進行統(tǒng)計分析。例如,可以基于電話號碼和運行商兩個維度對該通訊使用數(shù)據(jù)進行統(tǒng)計分析。
[0064]S102,根據(jù)該待分析數(shù)據(jù)具有的屬性參數(shù),確定待生成的二進制數(shù)的位數(shù)。
[0065]其中,該二進制數(shù)的位數(shù)與該待分析數(shù)據(jù)具有的屬性參數(shù)的個數(shù)相同,待生成的二進制數(shù)的各位分別表示該待分析數(shù)據(jù)的一個屬性參數(shù)。
[0066]需要生成的二進制數(shù)的位數(shù)由該待分析數(shù)據(jù)的屬性參數(shù)的數(shù)量確定,且需要生成的該二進制數(shù)的每位均對應(yīng)該待分析數(shù)據(jù)的一個屬性參數(shù),且不同的屬性參數(shù)對應(yīng)該待生成的二進制數(shù)的不同位。也就是說,建立有該需要生成的二進制的各位與該待分析數(shù)據(jù)的屬性參數(shù)之間的對應(yīng)關(guān)系。
[0067]如,該待分析數(shù)據(jù)具有的屬性參數(shù)為3個時,則可以確定待生成的二進制數(shù)為3位二進制數(shù),而該二進制數(shù)每位表示該3個屬性參數(shù)中的一個屬性參數(shù),且待生成的二進制數(shù)的不同位所表征的屬性參數(shù)不同。假設(shè)該待分析數(shù)據(jù)的屬性參數(shù)分別為電話號碼、運營商、呼叫類型時,則可以是需要生成的二進制數(shù)中從高到低的第一位對應(yīng)該電話號碼,第二位對應(yīng)運營商,第三位對應(yīng)呼叫類型。
[0068]S103,生成具有該位數(shù)的所有二進制數(shù),并從生成的多個二進制數(shù)中,選取包含有預(yù)設(shè)數(shù)量位為第一指定數(shù)值的二進制數(shù)。
[0069]根據(jù)步驟102中確定出需要生成的二進制數(shù)的位數(shù)后,則可以生成具有相應(yīng)位數(shù)的所有可能的二進制數(shù)。如確定出的位數(shù)為3,則需要生成所有的三位二進制數(shù),即生成的二進制數(shù)包括 000、001、010、011、100、101、110 和 111。
[0070]由于在步驟102中預(yù)先規(guī)定了待生成的二進制數(shù)的各位所對應(yīng)的屬性參數(shù),因此,對于生成的任意一個二進制數(shù)而言,每個二進制數(shù)的每位均對應(yīng)該待分析數(shù)據(jù)的一個屬性參數(shù)。
[0071]其中,該預(yù)設(shè)數(shù)量可以根據(jù)需要設(shè)定,一般以對待分析數(shù)據(jù)進行所需要的維度數(shù)量來確定。如,在進行數(shù)據(jù)分析時,需要進行3個維度的分析,則該預(yù)設(shè)數(shù)量可以設(shè)定為3。其中,維度描述了對一個數(shù)據(jù)對象進行分析所需的參數(shù)個數(shù)。如需要進行三維度分析,則需要確定出由該待分析數(shù)據(jù)的三個屬性參數(shù)組成的所有的屬性參數(shù)組合。
[0072]由于二進制數(shù)是由O或I數(shù)碼組成的,該二進制數(shù)中各位只有是O或者是1,因此,該第一指定數(shù)值為O或I。該第一指定數(shù)值可以設(shè)定為O和I中的一個數(shù)值,具體可以根據(jù)需要設(shè)定。
[0073]在本申請實施例中,該第一指定數(shù)值代表參與統(tǒng)計計算,因此,如果二進制數(shù)中某位的數(shù)值為該第一指定數(shù)值,則表示該位所對應(yīng)的屬性參數(shù)參與統(tǒng)計計算。相應(yīng)的,二進制中的某位中的數(shù)值不是該第一指定數(shù)值,則該位對應(yīng)的屬性參數(shù)不參與到對待分析數(shù)據(jù)的統(tǒng)計計算中。
[0074]由于二進制數(shù)如果某位上的數(shù)值為第一指定數(shù)值時,則表示該二進制數(shù)的該位所對應(yīng)的屬性參數(shù)參與統(tǒng)計計算,因此,確定出對該待分析數(shù)據(jù)進行統(tǒng)計分析所需的維度數(shù),即確定出需要多少數(shù)量個屬性參數(shù)進行組合后,為了能夠存在哪些符合該維度數(shù)的屬性參數(shù)的組合,則可以從生成的二進制數(shù)中,選取包含有預(yù)設(shè)數(shù)量位為第一指定數(shù)值的二進制數(shù)。
[0075]選取出的二進制數(shù)中有預(yù)設(shè)數(shù)量位上的數(shù)值為第一指定數(shù)值,而對于任意一個選取出的二進制數(shù)而言,該二進制數(shù)中為第一指定數(shù)值的各位所對應(yīng)的屬性參數(shù)組合到一起得到的屬性參數(shù)組合,便是一種滿足該確定出的維度數(shù)的屬性參數(shù)的組合。
[0076]例如,以待分析數(shù)據(jù)具有3個屬性參數(shù)進行介紹,生成的二進制數(shù)包括000、001、010、011、100、101、110和111,以第一指定數(shù)值為1,需要進行2個維度的分析為例,則需要選取出有兩位上的數(shù)值為I的二進制數(shù),選取出的二進制數(shù)包括011、101和110。
[0077]S104,對于每個選取出的二進制數(shù),將該二進制數(shù)中為該第一指定數(shù)值的各位所表示的屬性參數(shù)組成屬性參數(shù)組合。
[0078]為了根據(jù)選取出的二進制數(shù),確定出該二進制數(shù)對應(yīng)的可以參與計算的屬性參數(shù)的組合,則需要分別確定出該二進制數(shù)為第一指定數(shù)值的各位所表示的屬性參數(shù),然后將確定出的屬性參數(shù)進行組合,得到屬性參數(shù)組合。由于有選取出多個二進制數(shù),每個二進制數(shù)均對應(yīng)一個屬性參數(shù)組合,則可以得到多個屬性參數(shù)組合。
[0079]例如,仍以前面介紹的二進制數(shù)中從高到低的第一位對應(yīng)該電話號碼,第二位對應(yīng)運營商,第三位對應(yīng)呼叫類型,則需要生成3位二進制數(shù)為例,仍假設(shè)對待分析數(shù)據(jù)進行2個維度的分析,且第一指定數(shù)值為I,則從生成二進制數(shù)中,選取出的二進制數(shù)為011、101和110,而二進制數(shù)011中為I的各位分別為第二位和第三位,第二位對應(yīng)的屬性參數(shù)為運行商,第三位對應(yīng)的屬性參數(shù)為呼叫類型,因此該二進制數(shù)011對應(yīng)的屬性參數(shù)組合為運行商和呼叫類型的組合,即基于這兩個維度對該待分析數(shù)據(jù)進行統(tǒng)計分析。相應(yīng)的,二進制數(shù)101對應(yīng)的電話號碼和呼叫類型這兩個屬性參數(shù)的組合,二進制數(shù)110對應(yīng)電話號碼和運行商這兩個屬性參數(shù)的組合。
[0080]S105,基于得到的屬性參數(shù)組合,對待分析數(shù)據(jù)進行預(yù)設(shè)數(shù)量維度的統(tǒng)計。
[0081]得到所有的屬性參數(shù)組合后,可以分別基于每個屬性參數(shù)組合進行相應(yīng)維度數(shù)的統(tǒng)計分析。如預(yù)設(shè)數(shù)量為2個,而某個屬性參數(shù)組合為包含電話號碼和運行商的組合,則可以基于這兩個屬性參數(shù)對待分析數(shù)據(jù)進行二維度的統(tǒng)計。
[0082]其中,基于得到的屬性參數(shù)的組合,對待分析數(shù)據(jù)進行相應(yīng)維度的統(tǒng)計,與現(xiàn)有的方式相似,在此不再贅述。
[0083]可以理解的是,在實際應(yīng)用中,可以需要分別基于多種不同的維度進行數(shù)據(jù)分析,因此,該預(yù)設(shè)數(shù)量可以設(shè)定多個。例如,需要2維度和3維度的分析時,則預(yù)設(shè)數(shù)量可以為2和3。但是對于每一個預(yù)設(shè)數(shù)量,在選取二進制數(shù),以及確定屬性參數(shù)的組合過程都是相同的。
[0084]本實施例中,根據(jù)該待分析數(shù)據(jù)具有的屬性參數(shù)的數(shù)量,生成了與該屬性參數(shù)的數(shù)量相同位數(shù)的二進制數(shù),生成的二進制數(shù)各位分別表示該待分析數(shù)據(jù)的一個屬性參數(shù),由于二進制數(shù)是由O和I組成,這樣可以設(shè)定O或I為第一指定數(shù)值,并認(rèn)為二進制數(shù)中為第一指定數(shù)值的位所對應(yīng)的屬性參數(shù)參與統(tǒng)計計算,這樣,生成的二進制數(shù)實際上包括了該待分析數(shù)據(jù)中屬性參數(shù)進行任意組合的各個組合形式。當(dāng)需要進行的維度數(shù)為預(yù)設(shè)數(shù)量時,從生成的二進制數(shù)中選取出預(yù)設(shè)數(shù)量位為第一指定數(shù)值的二進制數(shù)后,對于選取出的每個二進制數(shù),將該二進制數(shù)中為該第一指定數(shù)值的各位所表示的屬性參數(shù)組成屬性參數(shù)組合,便可以得到滿足該維度數(shù)的所有的屬性參數(shù)組合,也避免了遺漏滿足該維度數(shù)的屬性參數(shù)的組合,進而提高了對待分析數(shù)據(jù)進行統(tǒng)計計算的精度。
[0085]同時,該方法為利用計算機利用二進制的方式確定滿足該維度數(shù)的屬性參數(shù)組合提供了可能,進而可以提高基于該維度數(shù)對待分析數(shù)據(jù)進行統(tǒng)計的便捷性。[0086]參見圖2,示出了本發(fā)明一種數(shù)據(jù)處理方法另一個實施例的流程示意圖,本實施例的方法可以包括:
[0087]S201,獲取待分析數(shù)據(jù)具有的屬性參數(shù)。
[0088]S202,根據(jù)該待分析數(shù)據(jù)具有的屬性參數(shù),確定待生成的二進制數(shù)的位數(shù)。
[0089]其中,該二進制數(shù)的位數(shù)與該待分析數(shù)據(jù)具有的屬性參數(shù)的個數(shù)相同,待生成的二進制的各位分別表示該待分析數(shù)據(jù)的一個屬性參數(shù)。
[0090]S203,生成具有位數(shù),且每位均為第二指定數(shù)值的初始二進制數(shù),將該初始二進制
數(shù)作為第一二進制數(shù)。
[0091]其中,第二指定數(shù)值為O或1,僅為O和I中的一個確定數(shù)值。
[0092]當(dāng)該第二指定數(shù)值不同時,生成的初始二進制數(shù)也不同。如該第二指定數(shù)值為I時,該初始二進制數(shù)的各位均為I;如該第二指定數(shù)值為O時,該初始二進制數(shù)的各位均為
O0
[0093]例如,該待分析數(shù)據(jù)具有3個屬性參數(shù),且該第二指定數(shù)值為O時,則生成的初始二進制數(shù)為000。
[0094]S204,根據(jù)預(yù)設(shè)規(guī)則和第一二進制數(shù),生成第二二進制數(shù)。
[0095]其中,生成的第二二進制數(shù)與該第一二進制的差值的絕對值為I。
[0096]其中,根據(jù)該第二指定數(shù)值為O或1,生成該第二二進制數(shù)的方式也不同,但是均需要保證該第二二進制數(shù)與該第一二進制數(shù)不同,且當(dāng)前時刻生成的該第二二進制數(shù)為之前未曾生成過的二進制數(shù)。
[0097]如,當(dāng)該第二指定數(shù)值為O時,則生成該第二二進制數(shù)的方式為:將該第一二進制數(shù)的最低位加一,得到第二二進制數(shù)。其中,例如,以初始二進制數(shù)為000時,如果當(dāng)前時刻000為第一二進制數(shù),則第二二進制數(shù)為001。
[0098]又如,當(dāng)該第二指定數(shù)值為I時,則生成該第二二進制數(shù)的方式為:將該第二二進制數(shù)的最低位減一,得到第二二進制數(shù)。例如,該第一二進制數(shù)為初始二進制數(shù)111時,則生成的第二二進制數(shù)為110。
[0099]S205,如果該第二二進制數(shù)中有預(yù)設(shè)數(shù)量位上的數(shù)值為該第一指定數(shù)值,則選取出該第二二進制數(shù)。
[0100]每生成一個第二二進制數(shù),均需要判斷該第二二進制數(shù)是否有預(yù)設(shè)數(shù)量位上的數(shù)值為第一指定數(shù)值,如果該第二二進制數(shù)中有預(yù)設(shè)數(shù)量位上的數(shù)值為第一指定數(shù)值,則保存該第二二進制數(shù);如果該第二二進制數(shù)中沒有預(yù)設(shè)數(shù)量的位上的數(shù)值為第一指定數(shù)值,則直接進行步驟206。
[0101]當(dāng)然,如果需要基于多種維度進行統(tǒng)計分析,則可以設(shè)定多個預(yù)設(shè)數(shù)量,因此,如果該第二二進制數(shù)為第一數(shù)值數(shù)量的位達到任意一個預(yù)設(shè)數(shù)量,均選取出當(dāng)前的第二二進制數(shù)。
[0102]其中,該第一指定數(shù)值為O或I。
[0103]S206,判斷該第二二進制數(shù)的各位是否為均為第三指定數(shù)值,如果是,則執(zhí)行步驟208 ;如果否,執(zhí)行步驟207。
[0104]S207,將當(dāng)前的所述第二二進制數(shù)作為所述第一二進制數(shù),并返回所述步驟204。
[0105]其中,該第三指定數(shù)值為O和I中的一個數(shù)值,且該第三指定數(shù)值不同于第二指定數(shù)值。
[0106]當(dāng)該第二二進制數(shù)中的各位均為第三指定數(shù)值時,則說明已經(jīng)生成了全部該位數(shù)的二進制數(shù),如果還存在該位數(shù)的二進制數(shù)未被生成,則將該第二二進制數(shù)作為第一二進制數(shù),返回該步驟204,繼續(xù)生成下一個第二二進制數(shù),直至具有該位數(shù)的二進制數(shù)全部被生成。
[0107]在本實施例中,以一為步進值,逐步生成第二二進制數(shù),如,采用遞增或遞減的方式,增加或降低二進制數(shù)的數(shù)值,從而可以得到所有該位數(shù)的二進制數(shù),避免了二進制數(shù)遺
漏或重復(fù)。
[0108]S208,對于每個選取出的二進制數(shù),將該二進制數(shù)中為該第一指定數(shù)值的各位所表示的屬性參數(shù)組成屬性參數(shù)組合。
[0109]S209,基于得到的屬性參數(shù)組合,對待分析數(shù)據(jù)進行預(yù)設(shè)數(shù)量維度的統(tǒng)計。
[0110]其中,該步驟207和步驟208的操作與前面實施例的相關(guān)介紹相似,在此不再贅述。
[0111]可以理解的是,該步驟205和步驟206的操作不限于圖2所示,該步驟205和步驟206也可以同時進行。
[0112]在本實施例中,該第一指定數(shù)值同樣為O和I中的一個數(shù)值。該第一指定數(shù)值表示二進制數(shù)的任意一個位對應(yīng)的屬性參數(shù)參與統(tǒng)計計算時,相應(yīng)位上的數(shù)值。如,如果第一指定數(shù)值為I時,如果二進制數(shù)為000,則表示該二進制數(shù)的三位對應(yīng)的屬性參數(shù)均不參與統(tǒng)計分析,該二進制數(shù)對應(yīng)的屬性參數(shù)的組合為一個O維度的屬性參數(shù)組合;如果二進制數(shù)為011,則表示該二進制數(shù)的后兩位對應(yīng)的屬性參數(shù)可以參與統(tǒng)計分析,且該二進制數(shù)的后兩位對應(yīng)的屬性參數(shù)組合成一個2維度的屬性參數(shù)組合。
[0113]該第二指定數(shù)值用于限定初始二進制數(shù),以及基于初始二進制數(shù)生成后續(xù)二進制數(shù)的方式。因此,第一指定數(shù)值和第二指定數(shù)值的意義不同,在設(shè)定第一指定數(shù)值和第二指定數(shù)值時,可以設(shè)定該第一指定數(shù)值和第二指定數(shù)值相同,如同為O ;也可以設(shè)定該第一指定數(shù)值和第二指定數(shù)值不同,如該第二指定數(shù)值為0,而該第二指定數(shù)值為I。
[0114]為了便于理解本實施例的方案,下面以待分析數(shù)據(jù)為商品銷售記錄為例,假設(shè)商品銷售記錄包括的屬性參數(shù)有商品名稱、生產(chǎn)商和銷售時間,并以需要進行2個維度的分析為例進行詳細(xì)描述。假設(shè)第一指定數(shù)值為I進行介紹,也就是說二進制數(shù)某個位上的數(shù)值為I則表示該位對應(yīng)的屬性參數(shù)參與到統(tǒng)計分析中。設(shè)定第二指定數(shù)值為0,第三指定數(shù)值為I。則生成該初始二進制數(shù)為000,將該000作為第一二進制數(shù)執(zhí)行步驟204,該將000的最低位加一,得到第二二進制數(shù)001。該001中有I位上的數(shù)值為1,則保存出該001。同時,判斷出該001的各位不是全部為1,則該001作為第一二進制數(shù),返回執(zhí)行該步驟204,將001的最低位加I,得到第二二進制數(shù)010,依次類推,直至生成的第二二進制數(shù)111,111的三位均為I,則執(zhí)行后續(xù)步驟207。
[0115]最終,選取出的二進制數(shù)有011、101和110,其中,011對應(yīng)生產(chǎn)商和銷售時間的兩維度組合,101對應(yīng)商品名稱和銷售時間的兩個維度組合,110對應(yīng)商品名稱和生產(chǎn)商的兩個維度的組合。這樣,基于這三個兩維度組合,可以分別進行相應(yīng)的統(tǒng)計分析。
[0116]在本發(fā)明實施例中僅僅是為了描述方便,以待分析數(shù)據(jù)具有的屬性參數(shù)為3或4個為例進行描述,但是可以理解的是,在實際應(yīng)用中待分析數(shù)據(jù)具有的屬性參數(shù)可以會有很多,當(dāng)待分析數(shù)據(jù)具有的屬性參數(shù)越大時,應(yīng)用本發(fā)明的方法更加體現(xiàn)出其避免遺漏屬性參數(shù)組合,進而提高統(tǒng)計分析的精度等優(yōu)點。
[0117]進一步的,在以上任意一個實施例中,為了便于判斷選取出的二進制數(shù)中哪個位對應(yīng)的屬性參數(shù)參與統(tǒng)計分析,在選取出二進制數(shù)之后,對于每個選取出的二進制數(shù),按照第一指定數(shù)值對應(yīng)布爾數(shù)組中的真值的規(guī)則,將該二進制數(shù)的各位的值依次轉(zhuǎn)換為布爾數(shù)組中的元素值,以使得布爾數(shù)組中的每個元素值分別對應(yīng)一個屬性參數(shù)。
[0118]也就是說,該二進制數(shù)中為第一指定數(shù)值的位所對應(yīng)的布爾數(shù)值中的值為真值,而該二進制數(shù)中不為該第一指定數(shù)值的位對應(yīng)的布爾數(shù)值中的值為假,其中,該二進制數(shù)中各位對應(yīng)的屬性參數(shù),依次對應(yīng)到該布爾數(shù)組的各個元素。例如,第一指定數(shù)值為1,二進制數(shù)為101時,則該二進制數(shù)的最高位轉(zhuǎn)換為布爾數(shù)組中的第一個元素值為ture,該二進制數(shù)的第二位轉(zhuǎn)換為布爾數(shù)組中的第二個元素值為false,該二進制數(shù)的最低位的值轉(zhuǎn)換為布爾數(shù)值中的第三個元素值為ture,因此,將該二進制數(shù)轉(zhuǎn)換出的布爾數(shù)組為{ture,false, ture},其中,該布爾數(shù)組中第一個元素對應(yīng)的屬性參數(shù)為該二進制數(shù)101中的最高位對應(yīng)的屬性參數(shù),該布爾數(shù)組中第二個元素對應(yīng)的屬性參數(shù)為該二進制數(shù)101的第二位對應(yīng)的屬性參數(shù),該布爾數(shù)組中第三個元素對應(yīng)的屬性參數(shù)為該二進制數(shù)出101的最低位對應(yīng)的屬性參數(shù)。
[0119]得到布爾數(shù)組后,提取出布爾數(shù)值中真值ture對應(yīng)的屬性參數(shù),將提取出的屬性參數(shù)組成屬性參數(shù)組合。例如,布爾數(shù)組為{ture,false,ture}時,則分別提取出該布爾數(shù)組中第一個元素和第三個元素對應(yīng)的屬性參數(shù),將提取出的兩個屬性參數(shù)組合成屬性參數(shù)組合。
[0120]對應(yīng)本發(fā)明的數(shù)據(jù)處理方法,本發(fā)明還提供了一種數(shù)據(jù)處理裝置,參見圖3,示出了本發(fā)明一種數(shù)據(jù)處理裝置一個實施例的結(jié)構(gòu)示意圖,本實施例的裝置可以包括:獲取單元301、關(guān)系確定單元302、二進制數(shù)處理單元303、屬性參數(shù)組合單元304和計算單元305。
[0121]其中,獲取單元301,用于獲取待分析數(shù)據(jù)具有的屬性參數(shù);
[0122]關(guān)系確定單元302,用于根據(jù)所述待分析數(shù)據(jù)具有的屬性參數(shù),確定待生成的二進制數(shù)的位數(shù),其中,所述二進制數(shù)的位數(shù)與所述待分析數(shù)據(jù)具有的屬性參數(shù)的個數(shù)相同,且所述二進制數(shù)的各位分別表示所述待分析數(shù)據(jù)的一個屬性參數(shù);
[0123]二進制數(shù)處理單元303,用于根據(jù)所述關(guān)系確定單元確定出的位數(shù),生成具有所述位數(shù)的所有所述二進制數(shù),并從生成的所述多個二進制數(shù)中,選取包含有預(yù)設(shè)數(shù)量位為第一指定數(shù)值的二進制數(shù),其中,所述第一指定數(shù)值為O或I ;
[0124]屬性參數(shù)組合單元304,用于對于所述二進制數(shù)處理單元選取出的每個所述二進制數(shù),將所述二進制數(shù)中為所述第一指定數(shù)值的各位所表示的屬性參數(shù)組成屬性參數(shù)組合;
[0125]計算單元305,用于基于所述屬性參數(shù)組合單元得到的所述屬性參數(shù)組合,對所述待分析數(shù)據(jù)進行所述預(yù)設(shè)數(shù)量維度的統(tǒng)計。
[0126]在本實施例中,關(guān)系確定單元根據(jù)待分析數(shù)據(jù)具有的屬性參數(shù)的數(shù)量,確定出待生成的二進制數(shù)的位數(shù),且待生成的二進制數(shù)各位分別表示該待分析數(shù)據(jù)的一個屬性參數(shù),由于二進制數(shù)是由O和I組成,這樣可以設(shè)定O或I為第一指定數(shù)值,并認(rèn)為二進制數(shù)中為第一指定數(shù)值的位所對應(yīng)的屬性參數(shù)參與統(tǒng)計計算,這樣,該二進制數(shù)處理單元根據(jù)該關(guān)系確定單元確定出的位數(shù),生成相應(yīng)的位數(shù)的所有二進制數(shù)實際上包括了該待分析數(shù)據(jù)中屬性參數(shù)進行任意組合的各個組合形式。
[0127]而該二進制數(shù)處理單元從生成的二進制數(shù)中選取出預(yù)設(shè)數(shù)量位為第一指定數(shù)值的二進制數(shù)后,對于選取出的每個二進制數(shù),將該二進制數(shù)中為該第一指定數(shù)值的各位所表示的屬性參數(shù)組成屬性參數(shù)組合,便可以得到滿足與該預(yù)設(shè)數(shù)量相同維度數(shù)的所有的屬性參數(shù)組合,避免了遺漏滿足該維度數(shù)的屬性參數(shù)的組合,進而提高了基于該維度數(shù)對待分析數(shù)據(jù)進行統(tǒng)計計算的精度。
[0128]其中,二進制數(shù)處理單元根據(jù)所述關(guān)系確定單元確定出的位數(shù)生成具有該位數(shù)的二進制數(shù)的方式可以有多種。參見圖4,示出了本發(fā)明的一種數(shù)據(jù)處理裝置中二進制數(shù)處理單元一種實現(xiàn)方式的結(jié)構(gòu)示意圖,在本實施例中,該二進制數(shù)處理單元303,包括:
[0129]初始數(shù)生成單元3031,用于根據(jù)所述關(guān)系確定單元確定出的位數(shù),生成具有所述位數(shù),且每位均為所述第二指定數(shù)值的初始二進制數(shù),將所述初始二進制數(shù)作為第一二進制數(shù),其中,第二指定數(shù)值為O或I ;
[0130]中間數(shù)生成單元3032,用于根據(jù)預(yù)設(shè)規(guī)則和所述第一二進制數(shù),生成第二二進制數(shù),所述第二二進制數(shù)與所述第一二進制的差值的絕對值為I ;
[0131]二進制數(shù)選取單元3033,用于如果所述中間數(shù)生成單元生成的所述第二二進制數(shù)中有預(yù)設(shè)數(shù)量位上的數(shù)值為所述第一指定數(shù)值,則選取出所述第二二進制數(shù);
[0132]判斷單元3034,用于判斷所述中間數(shù)生成單元生成的所述第二二進制數(shù)的各位是否為均為第三指定數(shù)值,如果是,則觸發(fā)執(zhí)行所述屬性參數(shù)組合單元;如果否,則將當(dāng)前的所述第二二進制數(shù)作為所述第一二進制數(shù),并返回執(zhí)行所述中間數(shù)生成單元;其中,所述第三指定數(shù)值為O或1,且所述第三指定數(shù)值不同于所述第二指定數(shù)值。
[0133]其中,該第一指定數(shù)值可以與第二指定數(shù)值相同,也可以是與該第三指定數(shù)值相同。
[0134]其中,該判斷單元3034可以在該二進制數(shù)選取單元確定出是否選取該第二二進制數(shù)之后,再執(zhí)行判斷該該第二二進制數(shù)的各位是否均為第三指定數(shù)值的操作。該判斷單元也可以是在該二進制數(shù)選取單元對該第二二進制數(shù)進行選取操作的同時,執(zhí)行相應(yīng)的判斷操作。
[0135]當(dāng)該第二指定數(shù)值為O時,該初始數(shù)生成單元,可以包括:
[0136]第一初始數(shù)生成單元,用于根據(jù)所述關(guān)系確定單元確定出的位數(shù),生成具有所述位數(shù),且每位均為O的初始二進制數(shù)
[0137]相應(yīng)的,該中間數(shù)生成單元,可以包括:
[0138]第一中間數(shù)生成單元,用于將所述第一二進制數(shù)的最低位加一,得到第二二進制數(shù)。
[0139]當(dāng)所述第二指定數(shù)值為I時,所述初始數(shù)生成單元,可以包括:
[0140]第一初始數(shù)生成單元,用于根據(jù)所述關(guān)系確定單元確定出的位數(shù),生成具有所述位數(shù),且每位均為I的初始二進制;
[0141]所述中間數(shù)生成單元,包括:
[0142]第一中間數(shù)生成單元,用于將所述第一二進制數(shù)的最低位減一,得到第二二進制數(shù)。[0143]進一步的,在以上任意一個實施例中,該屬性參數(shù)組合單元,可以包括:
[0144]布爾數(shù)組轉(zhuǎn)換單元,用于對于每個選取出的所述二進制數(shù),按照第一指定數(shù)值對應(yīng)布爾數(shù)組中的真值的規(guī)則,將所述二進制數(shù)的各位的值依次轉(zhuǎn)換為布爾數(shù)組中的元素值,以使得所述布爾數(shù)組中的每個元素值分別對應(yīng)一個所述屬性參數(shù);
[0145]參數(shù)組合子單元,用于提取出所述布爾數(shù)組中真值對應(yīng)的屬性參數(shù),將提取出的屬性參數(shù)組成屬性參數(shù)組合。
[0146]本說明書中各個實施例采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似部分互相參見即可。對于實施例公開的裝置而言,由于其與實施例公開的方法相對應(yīng),所以描述的比較簡單,相關(guān)之處參見方法部分說明即可。
[0147]對所公開的實施例的上述說明,使本領(lǐng)域?qū)I(yè)技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對這些實施例的多種修改對本領(lǐng)域的專業(yè)技術(shù)人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實施例中實現(xiàn)。因此,本發(fā)明將不會被限制于本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的范圍。
【權(quán)利要求】
1.一種數(shù)據(jù)處理方法,其特征在于,包括: 獲取待分析數(shù)據(jù)具有的屬性參數(shù); 根據(jù)所述待分析數(shù)據(jù)具有的屬性參數(shù),確定待生成的二進制數(shù)的位數(shù),其中,所述二進制數(shù)的位數(shù)與所述待分析數(shù)據(jù)具有的屬性參數(shù)的個數(shù)相同,且所述二進制數(shù)的各位分別表示所述待分析數(shù)據(jù)的一個屬性參數(shù); 生成具有所述位數(shù)的所有所述二進制數(shù),并從生成的所述多個二進制數(shù)中,選取包含有預(yù)設(shè)數(shù)量位為第一指定數(shù)值的二進制數(shù),其中,所述第一指定數(shù)值為O或I ; 對于每個選取出的所述二進制數(shù),將所述二進制數(shù)中為所述第一指定數(shù)值的各位所表示的屬性參數(shù)組成屬性參數(shù)組合; 基于得到的所述屬性參數(shù)組合,對所述待分析數(shù)據(jù)進行所述預(yù)設(shè)數(shù)量個維度的統(tǒng)計。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述生成具有所述位數(shù)的所有所述二進制數(shù),并從生成的所述多個二進制數(shù)中,選取包含有預(yù)設(shè)數(shù)量位為第一指定數(shù)值的二進制數(shù),包括: A:生成具有所述位數(shù),且每位均為所述第二指定數(shù)值的初始二進制數(shù),將所述初始二進制數(shù)作為第一二進制數(shù),其中,第二指定數(shù)值為O或I ; B:根據(jù)預(yù)設(shè)規(guī)則和所述第一二進制數(shù),生成第二二進制數(shù),所述第二二進制數(shù)與所述第一二進制的差值的絕對值為I ; C:如果所述第二二進制數(shù)中有預(yù)設(shè)數(shù)量位上的數(shù)值為第一指定數(shù)值,則選取出所述第二二進制數(shù); C:判斷所述第二二進制數(shù)的各位是否為均為第三指定數(shù)值,如果是,則執(zhí)行生成所述屬性參數(shù)組合的操作;如果否,則將當(dāng)前的所述第二二進制數(shù)作為所述第一二進制數(shù),并返回所述步驟B; 其中,所述第三指定數(shù)值為O或1,且所述第三指定數(shù)值不同于所述第二指定數(shù)值。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,當(dāng)所述第二指定數(shù)值為O時,所述生成具有所述位數(shù),且每位均為所述第二指定數(shù)值的初始二進制數(shù),包括: 生成具有所述位數(shù),且每位均為O的初始二進制數(shù) 所述根據(jù)預(yù)設(shè)規(guī)則和所述第一二進制數(shù),生成第二二進制數(shù),所述第二二進制數(shù)與所述第一二進制的差值的絕對值為1,包括: 將所述第一二進制數(shù)的最低位加一,得到第二二進制數(shù)。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,當(dāng)所述第二指定數(shù)值為I時,所述生成具有所述位數(shù),且每位均為所述第二指定數(shù)值的初始二進制數(shù),包括: 生成具有所述位數(shù),且每位均為I的初始二進制; 所述根據(jù)預(yù)設(shè)規(guī)則和所述第一二進制數(shù),生成第二二進制數(shù),所述第二二進制數(shù)與所述第一二進制的差值的絕對值為1,包括: 將所述第一二進制數(shù)的最低位減 一,得到第二二進制數(shù)。
5.根據(jù)權(quán)利要求1至4任一項所述的方法,其特征在于,所述對于每個選取出的所述二進制數(shù),將所述二進制數(shù)中為所述第一指定數(shù)值的各位所表示的屬性參數(shù)組成屬性參數(shù)組合,包括: 對于每個選取出的所述二進制數(shù),按照第一指定數(shù)值對應(yīng)布爾數(shù)組中的真值的規(guī)則,將所述二進制數(shù)的各位的值依次轉(zhuǎn)換為布爾數(shù)組中的元素值,以使得所述布爾數(shù)組中的每個元素值分別對應(yīng)一個所述屬性參數(shù); 提取出所述布爾數(shù)組中真值對應(yīng)的屬性參數(shù),將提取出的屬性參數(shù)組成屬性參數(shù)組口 O
6.一種數(shù)據(jù)處理裝置,其特征在于,包括: 獲取單元,用于獲取待分析數(shù)據(jù)具有的屬性參數(shù); 關(guān)系確定單元,用于根據(jù)所述待分析數(shù)據(jù)具有的屬性參數(shù),確定待生成的二進制數(shù)的位數(shù),其中,所述二進制數(shù)的位數(shù)與所述待分析數(shù)據(jù)具有的屬性參數(shù)的個數(shù)相同,且所述二進制數(shù)的各位分別表示所述待分析數(shù)據(jù)的一個屬性參數(shù); 二進制數(shù)處理單元,用于根據(jù)所述關(guān)系確定單元確定出的位數(shù),生成具有所述位數(shù)的所有所述二進制數(shù),并從生成的所述多個二進制數(shù)中,選取包含有預(yù)設(shè)數(shù)量位為第一指定數(shù)值的二進制數(shù),其中,所述第一指定數(shù)值為O或I ; 屬性參數(shù)組合單元,用于對于所述二進制數(shù)處理單元選取出的每個所述二進制數(shù),將所述二進制數(shù)中為所述第一指定數(shù)值的各位所表示的屬性參數(shù)組成屬性參數(shù)組合; 計算單元,用于基于所述屬性參數(shù)組合單元得到的所述屬性參數(shù)組合,對所述待分析數(shù)據(jù)進行所述預(yù)設(shè)數(shù)量個維度的統(tǒng)計。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述二進制數(shù)處理單元,包括: 初始數(shù)生成單元,用于根據(jù) 所述關(guān)系確定單元確定出的位數(shù),生成具有所述位數(shù),且每位均為所述第二指定數(shù)值的初始二進制數(shù),將所述初始二進制數(shù)作為第一二進制數(shù),其中,第二指定數(shù)值為O或I ; 中間數(shù)生成單元,用于根據(jù)預(yù)設(shè)規(guī)則和所述第一二進制數(shù),生成第二二進制數(shù),所述第二二進制數(shù)與所述第一二進制的差值的絕對值為I; 二進制數(shù)選取單元,用于如果所述中間制數(shù)生成單元生成的所述第二二進制數(shù)中有預(yù)設(shè)數(shù)量位上的數(shù)值為所述第一指定數(shù)值,則選取出所述第二二進制數(shù); 判斷單元,用于判斷所述中間數(shù)生成單元生成的所述第二二進制數(shù)的各位是否為均為第三指定數(shù)值,如果是,則觸發(fā)執(zhí)行所述屬性參數(shù)組合單元;如果否,則將當(dāng)前的所述第二二進制數(shù)作為所述第一二進制數(shù),并返回執(zhí)行所述中間二進制數(shù)生成單元;其中,所述第三指定數(shù)值為O或1,且所述第三指定數(shù)值不同于所述第二指定數(shù)值。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,當(dāng)所述第二指定數(shù)值為O時,所述初始數(shù)生成單元,包括: 第一初始數(shù)生成單元,用于根據(jù)所述關(guān)系確定單元確定出的位數(shù),生成具有所述位數(shù),且每位均為O的初始二進制數(shù) 所述中間數(shù)生成單元,包括: 第一中間數(shù)生成單元,用于將所述第一二進制數(shù)的最低位加一,得到第二二進制數(shù)。
9.根據(jù)權(quán)利要求7所述的裝置,其特征在于,當(dāng)所述第二指定數(shù)值為I時,所述初始數(shù)生成單元,包括: 第一初始數(shù)生成單元,用于根據(jù)所述關(guān)系確定單元確定出的位數(shù),生成具有所述位數(shù),且每位均為I的初始二進制; 所述中間數(shù)生成單元,包括:第一中間數(shù)生成單元,用于將所述第一二進制數(shù)的最低位減一,得到第二二進制數(shù)。
10.根據(jù)權(quán)利要求6至9任一項所述的裝置,其特征在于,所述屬性參數(shù)組合單元,包括: 布爾數(shù)組轉(zhuǎn)換單元,用于對于每個選取出的所述二進制數(shù),按照第一指定數(shù)值對應(yīng)布爾數(shù)組中的真值的規(guī)則,將所述二進制數(shù)的各位的值依次轉(zhuǎn)換為布爾數(shù)組中的元素值,以使得所述布爾數(shù)組中的每個元素值分別對應(yīng)一個所述屬性參數(shù); 參數(shù)組合子單元,用于提取出所述布爾數(shù)組中真值對應(yīng)的屬性參數(shù),將提取出的屬性參數(shù)組成屬性參數(shù)組合。
【文檔編號】G06F19/00GK103559413SQ201310573974
【公開日】2014年2月5日 申請日期:2013年11月15日 優(yōu)先權(quán)日:2013年11月15日
【發(fā)明者】曹艷白 申請人:北京搜房科技發(fā)展有限公司