一種移動拍照類app用戶的性別識別方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種移動拍照類APP用戶的性別識別方法及系統(tǒng),涉及數(shù)據(jù)挖掘領(lǐng)域,尤其是針對應用軟件,如拍照軟件,的用戶使用行為特征進行用戶性別識別的方法。本發(fā)明技術(shù)要點:采集測試對象的目標特征值(x1,x2,...,xm);根據(jù)測試對象的目標特征值計算z值,z=w0+w1×x1+w2×x2+...wm×xm;其中,(w0,w1,w2,...wm)為已知的目標特征權(quán)值;計算測試對象的sigmoid函數(shù)值g,g=1/(1+exp(-z));根據(jù)g值求取測試對象的類標號t:其中a為二分類閾值。
【專利說明】-種移動拍照類APP用戶的性別識別方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)據(jù)挖掘領(lǐng)域,尤其是一種分類/預測技術(shù)。
【背景技術(shù)】
[0002] 隨著網(wǎng)絡及智能移動終端的不斷發(fā)展,涌現(xiàn)出很多APP,為了擴大用戶量,很多 APP降低了用戶使用門檻,大多數(shù)不需要注冊,用戶便可使用。如拍照軟件等。
[0003] 拍照軟件在移動APP中占有極其重要的地位,為即時數(shù)字圖像娛樂提供了極大便 利。由于大多拍照軟件不需注冊,造成了用戶資料的基本空白(如:性別等)。對用戶信息 不了解,APP開發(fā)上對產(chǎn)品的改進、營銷活動(針對性地特效推薦、廣告投放等)等將很難 開展。
[0004] 因此,很有必要提供一種基于用戶對該類APP的使用行為特征確定用戶性別等信 息的方法。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明所要解決的技術(shù)問題是:針對上述存在的問題,提供一種二分類方法及系 統(tǒng),尤其是根據(jù)應用軟件,如拍照軟件,的用戶使用行為特征進行用戶性別識別的方法。
[0006] 本發(fā)明提供的二分類方法,包括:
[0007]步驟1:采集測試對象使用拍照類APP行為的的目標特征值(Xl,x2,...,Xm);
[0008] 步驟2 :根據(jù)所述目標特征值計算z值,z = Wc^w 1XxJw2Xx2+. .. WmXxm ;其中, (w。,》1,%,... wm)為已知的目標特征權(quán)值;
[0009]步驟3 :計算測試對象的sigmoid函數(shù)值g,g=l/(l+exp(_z));
[0010] 步驟4 :根據(jù)g值求取測試對象的類標號t:
【權(quán)利要求】
1. 一種移動拍照類APP用戶的性別識別方法,其特征在于,包括: 步驟1 :采集測試對象使用拍照類APP行為的目標特征值(Xl,x2, ...,xm); 步驟2 :根據(jù)所述目標特征值計算z值,z=Wc^w1XXfw2Xx2+. ..wmXxm ;其中, (W。,》1,%,...Wm)為已知的目標特征權(quán)值; 步驟3 :計算測試對象的sigmoid函數(shù)值g,g=l/(l+exp(-z)); Γ^I當g2u 步驟4 :根據(jù)g值求取測試對象的類標號t:b= ^gg^fl其中a為二分類閾值。
2. 根據(jù)權(quán)利要求1所述的一種移動拍照類APP用戶的性別識別方法,其特征在于,所述 目標特征的確定步驟為: 步驟al:確定訓練對象及訓練對象使用拍照類APP行為的初步特征,采集每個訓練對 象的初步特征的特征值;將不同訓練對象的相同的初步特征的特征值集合在一起作為一個 初步特征值向量; 步驟a2 :將初步特征值向量分別作為InfoGain特征選擇函數(shù)、Chi_Square特征選擇函 數(shù)以及CFS特征選擇函數(shù)的輸入得到每個初步特征的InfoGain權(quán)值、Chi_Square權(quán)值以 及CFS權(quán)值; 步驟a3 :將每個初步特征的InfoGain權(quán)值與InfoGain篩選閾值比較,將大于InfoGain篩選閾值的初步特征值保留并作為第一特征集合;將每個初步特征的Chi_ Square權(quán)值與Chi_Square篩選閾值比較,將大于Chi_Square篩選閾值的初步特征值保留 并作為第二特征集合;將每個初步特征的CFS權(quán)值與CFS篩選閾值比較,將大于CFS篩選閾 值的初步特征值保留并作為第三特征集合; 步驟a4 :計算第一特征集合、第二特征集合與第三特征集合的交集,并將交集中的成 員作為目標特征。
3. 根據(jù)權(quán)利要求1所述的一種移動拍照類APP用戶的性別識別方法,其特征在于,目標 特征權(quán)值的(Wtl,W1,W2, ...Wm)的獲取方法包括: η 令目標特征數(shù)量為m;對似然函數(shù)"》') = 1^/4(^.) + (1UnG-g,.)丨求導,將不同訓練 對象的目標特征的特征值依次帶入求導后的似然函數(shù)并令求導后的函數(shù)值為〇得到包含η個方程的方程組,利用牛頓-拉斐森方法進行迭代,得到方程組的解(^,Wl,w2,...wm) ;η為 訓練對象個數(shù);其中(Xli,x2i,...,xmi)為第i個訓練對象的目標特征值山為第i個訓練對 象的類標號,h為已知量,其取值為0或I;gi為第i個訓練對象的sigmoid值,gi= 1/(1+ θχρ(_(?νΗ¥ιΧχπ+¥2Χχ2?+· · .WmXxmi)));n不小于m+1。
4. 根據(jù)權(quán)利要求1所述的一種移動拍照類APP用戶的性別識別方法,其特征在于,目標 特征權(quán)值的(Wtl,W1,W2, ...Wm)的獲取方法包括: 令 目 標特征 數(shù)量為m; 對似 然函數(shù) 2 /(VV)=乞!,>(g,.) + (1 -)ln(l-g,)!-乞!In具+ 2^ + 求導,將不同訓練對象的目標 1=1 7=1 LIoj 特征的特征值依次帶入求導后的似然函數(shù)并令求導后的函數(shù)值為〇得到包含η個方程的方 程組,利用牛頓-拉斐森方法進行迭代,得到方程組的解(%,W1,w2,. . .Wm) ;n為訓練對象個 數(shù); 其中(Xli,x2i,. . .,xmi)為第i個訓練對象的目標特征值山為第i個訓練對象的類標 號,h為已知量,其取值為O或I;gi為第i個訓練對象的sigmoid值,gi=l/(l+exp(-(wQ +W1Xx1^w2Xx2i+. · .WmXxmi))) ;δj為基于η個訓練對象的第j個目標特征值計算得到的第 j個目標特征的方差;η不小于m+1。
5. 根據(jù)權(quán)利要求1所述的一種移動拍照類APP用戶的性別識別方法,其特征在于,a取 值為0.5。
6. -種移動拍照類APP用戶的性別識別系統(tǒng),其特征在于,包括:目標特征值獲取模 塊,用于采集測試對象使用拍照類APP行為的目標特征值(Xl,x2,...,xm); 中間值計算模塊,用于根據(jù)所述目標特征值計算z值,z=Wc^w1Xxdw2Xx2+. . .WmXxm; 其中,(wQ,W1,W2, ...wm)為已知的目標特征權(quán)值; sigmoid函數(shù)值計算模塊,用于計算測試對象的sigmoid函數(shù)值g,g=1/ (l+exp(-z)); = 1 當g 類標號獲取模塊,用于根據(jù)g值求取測試對象的類標號t 其中a為二 分類閾值。
7.根據(jù)權(quán)利要求6所述的一種移動拍照類APP用戶的性別識別系統(tǒng),其特征在于,所述 目標特征的確定步驟為: 步驟al:確定訓練對象及訓練對象使用拍照類APP行為的初步特征,采集每個訓練對 象的初步特征的特征值;將不同訓練對象的相同的初步特征的特征值集合在一起作為一個 初步特征值向量; 步驟a2 :將初步特征值向量分別作為InfoGain特征選擇函數(shù)、Chi_Square特征選擇函 數(shù)以及CFS特征選擇函數(shù)的輸入得到每個初步特征的InfoGain權(quán)值、Chi_Square權(quán)值以 及CFS權(quán)值; 步驟a3 :將每個初步特征的InfoGain權(quán)值與InfoGain篩選閾值比較,將大于InfoGain篩選閾值的初步特征值保留并作為第一特征集合;將每個初步特征的Chi_ Square權(quán)值與Chi_Square篩選閾值比較,將大于Chi_Square篩選閾值的初步特征值保留 并作為第二特征集合;將每個初步特征的CFS權(quán)值與CFS篩選閾值比較,將大于CFS篩選閾 值的初步特征值保留并作為第三特征集合; 步驟a4 :計算第一特征集合、第二特征集合與第三特征集合的交集,并將交集中的成 員作為目標特征。
8. 根據(jù)權(quán)利要求6所述的一種移動拍照類APP用戶的性別識別系統(tǒng),其特征在于,目標 特征權(quán)值的(Wtl,W1,W2, ...Wm)的獲取方法包括: η 令目標特征數(shù)量為m;對似然函數(shù),^ = + -乂丨求導,將不同訓練 對象的目標特征的特征值依次帶入求導后的似然函數(shù)并令求導后的函數(shù)值為〇得到包含η個方程的方程組,利用牛頓-拉斐森方法進行迭代,得到方程組的解(^,Wl,w2,...wm) ;η為 訓練對象個數(shù);其中(Xli,X2i,...,Xmi)為第i個訓練對象的目標特征值山為第i個訓練對 象的類標號,ti為已知量,其取值為O或I;gi為第i個訓練對象的sigmoid值,gi= 1/(1+ θχρ(_(?νΗ¥ιΧχπ+¥2Χχ2?+· · .WmXxmi)));n不小于m+1。
9.根據(jù)權(quán)利要求6所述的一種移動拍照類APP用戶的性別識別系統(tǒng),其特征在于,目標 特征權(quán)值的(Wtl,W1,W2, ...Wm)的獲取方法包括: 令 目 標特征 數(shù)量為m; 對似 然函數(shù) /(w) =Σln(g/) +(1 - () 1η〇 -g/)卜Σ彳In^ + 一^ + 丨求導,將不同訓練對象的目標 /-Ii-i 2 2〇j 特征的特征值依次帶入求導后的似然函數(shù)并令求導后的函數(shù)值為〇得到包含η個方程的方 程組,利用牛頓-拉斐森方法進行迭代,得到方程組的解(^,Wl,《2,...wm) ;η為訓練對象個 數(shù);其中(Xli,x2i,. . .,xmi)為第i個訓練對象的目標特征值山為第i個訓練對象的類標號, h為已知量,其取值為0或1沿為第i個訓練對象的sigmoid值,gi=l/d+expiHwd+Wi Xxu+w2Xx2i+. . .wmXxmi))) ;δ』為基于η個訓練對象的第j個目標特征值計算得到的第j 個目標特征的方差;η不小于m+1。
10. 根據(jù)權(quán)利要求6所述的一種移動拍照類APP用戶的性別識別系統(tǒng),其特征在于,a 取值為0.5。
【文檔編號】G06K9/62GK104318255SQ201410654279
【公開日】2015年1月28日 申請日期:2014年11月17日 優(yōu)先權(quán)日:2014年11月17日
【發(fā)明者】陳若田 申請人:成都品果科技有限公司