本發(fā)明涉及直播平臺(tái)用戶(hù)數(shù)據(jù)分析領(lǐng)域,具體是涉及一種基于主成分分析的用戶(hù)房間興趣度計(jì)算方法及系統(tǒng)。
背景技術(shù):
用戶(hù)在使用直播平臺(tái)時(shí),通常會(huì)進(jìn)入大量不同的房間觀看直播。同一個(gè)用戶(hù)在不同房間時(shí),產(chǎn)生的行為不一樣,觀看的時(shí)間長(zhǎng)短、觀看的頻率、是否有贈(zèng)送信息,都反映該用戶(hù)對(duì)房間的興趣度。為了能夠準(zhǔn)確地判斷用戶(hù)的喜好,向其推薦可能感興趣的房間,增加用戶(hù)體驗(yàn),需要獲得用戶(hù)對(duì)房間的興趣度。但是,如何確定用戶(hù)對(duì)房間的興趣度,目前缺乏有效的計(jì)算方法。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是為了克服上述背景技術(shù)的不足,提供一種基于主成分分析的用戶(hù)房間興趣度計(jì)算方法及系統(tǒng),本發(fā)明有助于準(zhǔn)確判斷用戶(hù)的喜好,有助于向用戶(hù)準(zhǔn)確推薦可能感興趣的房間,增加用戶(hù)體驗(yàn)。
本發(fā)明提供一種基于主成分分析的用戶(hù)房間興趣度計(jì)算方法,包括以下步驟:
S1、根據(jù)用戶(hù)對(duì)房間的行為信息,提取多個(gè)行為指標(biāo),并對(duì)所述行為指標(biāo)進(jìn)行分析,對(duì)相關(guān)系數(shù)絕對(duì)值大于相關(guān)閾值的行為指標(biāo)進(jìn)行相互替代,篩選出n個(gè)具有代表性的行為指標(biāo)作為主要評(píng)估指標(biāo),n為≥3的正整數(shù),構(gòu)建興趣度計(jì)算指標(biāo)體系;
S2、獲取一定時(shí)間段內(nèi)多個(gè)用戶(hù)所產(chǎn)生的房間行為信息,構(gòu)建初始化矩陣X,對(duì)初始化矩陣X進(jìn)行標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)化矩陣Z;計(jì)算標(biāo)準(zhǔn)化矩陣Z的相關(guān)系數(shù)矩陣R,并計(jì)算相關(guān)系數(shù)矩陣R對(duì)應(yīng)的特征值λ;將特征值λ由大到小排列,得到λ1、λ2、……、λn,對(duì)應(yīng)的特征向量為e1、e2、……、en,特征向量e滿足|e|=1,每個(gè)特征值對(duì)應(yīng)一個(gè)主成分,每個(gè)特征向量包含n個(gè)元素;
S3、計(jì)算每個(gè)主成分的方差貢獻(xiàn)率v,va=λa/(λ1+λ2+……+λn),a為正整數(shù),1≤a≤n,va表示第a個(gè)主成分的方差貢獻(xiàn)率,λa表示第a個(gè)主成分對(duì)應(yīng)的特征值;計(jì)算主成分的累計(jì)方差貢獻(xiàn)率,第a個(gè)主成分的累計(jì)方差貢獻(xiàn)率=第1個(gè)主成分的方差貢獻(xiàn)率至第(a-1)個(gè)主成分的方差貢獻(xiàn)率之和;
S4、按照特征值大于1,累計(jì)方差貢獻(xiàn)率大于指定閾值的原則,提取滿足條件的特征值個(gè)數(shù),作為最終選擇的主成分個(gè)數(shù);如果滿足條件的特征值個(gè)數(shù)為b,選擇b個(gè)主成分,λ1,λ2,……,λb為b個(gè)主成分分別對(duì)應(yīng)的特征值,其分別對(duì)應(yīng)的特征向量e1,e2,……,eb為b個(gè)主成分的特征向量,特征向量和標(biāo)準(zhǔn)化后的數(shù)據(jù)相乘,得到主成分的線性表達(dá)式;
S5、以主成分的方差貢獻(xiàn)率為權(quán)重,對(duì)主要評(píng)估指標(biāo)在各個(gè)主成分線性表達(dá)式中的系數(shù)進(jìn)行加權(quán)平均,計(jì)算每個(gè)主要評(píng)估指標(biāo)的綜合權(quán)重;將所有n個(gè)主要評(píng)估指標(biāo)的綜合權(quán)重進(jìn)行歸一化,得到每個(gè)主要評(píng)估指標(biāo)的權(quán)重值w′,w′j=第j個(gè)主要評(píng)估指標(biāo)的綜合權(quán)重/所有主要評(píng)估指標(biāo)的綜合權(quán)重之和,根據(jù)獲得的權(quán)重值,進(jìn)行加權(quán)計(jì)算,得到每個(gè)用戶(hù)對(duì)不同房間的興趣度得分。
在上述技術(shù)方案的基礎(chǔ)上,步驟S2中,所述對(duì)初始化矩陣X進(jìn)行標(biāo)準(zhǔn)化處理的過(guò)程如下:
初始化矩陣X中的元素包括xij、xj,xij表示第i個(gè)用戶(hù)第j個(gè)行為指標(biāo)的數(shù)據(jù)情況,xj表示第j個(gè)行為指標(biāo)的數(shù)據(jù)情況,i、j均為正整數(shù),1≤j≤n;采用最大值函數(shù)max和最小值函數(shù)min對(duì)初始化矩陣X進(jìn)行標(biāo)準(zhǔn)化處理,具體公式為:zij=(xij-min(xj))/(max(xj)-min(xj)),其中,zij表示標(biāo)準(zhǔn)化矩陣Z中的一個(gè)元素。
在上述技術(shù)方案的基礎(chǔ)上,步驟S4中,所述主成分的線性表達(dá)式如下:
Yc=ec1*Z1+ec2*Z2+……+ecn*Zn,
其中,c為正整數(shù),1≤c≤b,Yc表示第c個(gè)主成分,ec1為第1個(gè)指標(biāo)在第c個(gè)主成分線性表達(dá)式中的系數(shù),表示第c個(gè)特征向量中的第1個(gè)元素,ecn為第n個(gè)指標(biāo)在第c個(gè)主成分線性表達(dá)式中的系數(shù),表示第c個(gè)特征向量中的第n個(gè)元素,Z1表示第1個(gè)指標(biāo)經(jīng)過(guò)標(biāo)準(zhǔn)化處理后的值,Zn表示第n個(gè)指標(biāo)經(jīng)過(guò)標(biāo)準(zhǔn)化處理后的值。
在上述技術(shù)方案的基礎(chǔ)上,步驟S5中,所述計(jì)算綜合權(quán)重的公式如下:
wj=v1*e1j/(v1+v2……+vb)+v2*e2j/(v1+v2……+vb)+……+vb*ebj/(v1+v2……+vb),
其中,wj表示第j個(gè)主要評(píng)估指標(biāo)的綜合權(quán)重,v1表示第1個(gè)主成分的方差貢獻(xiàn)率,vb表示第b個(gè)主成分的方差貢獻(xiàn)率。
在上述技術(shù)方案的基礎(chǔ)上,步驟S5中,所述興趣度得分的計(jì)算公式如下:
S=w′1*Z1+w′2*Z2+……+w′n*Zn,其中,S表示興趣度得分,w1表示第1個(gè)指標(biāo)的權(quán)重值,Z1表示第1個(gè)指標(biāo)經(jīng)過(guò)標(biāo)準(zhǔn)化處理后的值,wn表示第n個(gè)指標(biāo)的權(quán)重值,Zn表示第n個(gè)指標(biāo)經(jīng)過(guò)標(biāo)準(zhǔn)化處理后的值。
本發(fā)明還提供一種基于主成分分析的用戶(hù)房間興趣度計(jì)算系統(tǒng),該系統(tǒng)包括:體系構(gòu)建單元、主成分分析單元、權(quán)重分析單元,其中,
所述體系構(gòu)建單元用于:根據(jù)用戶(hù)對(duì)房間的行為信息,提取多個(gè)行為指標(biāo),并對(duì)所述行為指標(biāo)進(jìn)行分析,對(duì)相關(guān)系數(shù)絕對(duì)值大于相關(guān)閾值的行為指標(biāo)進(jìn)行相互替代,篩選出n個(gè)具有代表性的行為指標(biāo)作為主要評(píng)估指標(biāo),n為≥3的正整數(shù),構(gòu)建興趣度計(jì)算指標(biāo)體系;
所述主成分分析單元用于:獲取一定時(shí)間段內(nèi)多個(gè)用戶(hù)所產(chǎn)生的房間行為信息,構(gòu)建初始化矩陣X,對(duì)初始化矩陣X進(jìn)行標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)化矩陣Z;計(jì)算標(biāo)準(zhǔn)化矩陣Z的相關(guān)系數(shù)矩陣R,并計(jì)算相關(guān)系數(shù)矩陣R對(duì)應(yīng)的特征值λ;將特征值λ由大到小排列,得到λ1、λ2、……、λn,對(duì)應(yīng)的特征向量為e1、e2、……、en,特征向量e滿足|e|=1,每個(gè)特征值對(duì)應(yīng)一個(gè)主成分,每個(gè)特征向量包含n個(gè)元素;
計(jì)算每個(gè)主成分的方差貢獻(xiàn)率v,va=λa/(λ1+λ2+……+λn),a為正整數(shù),1≤a≤n,va表示第a個(gè)主成分的方差貢獻(xiàn)率,λa表示第a個(gè)主成分對(duì)應(yīng)的特征值;計(jì)算主成分的累計(jì)方差貢獻(xiàn)率,第a個(gè)主成分的累計(jì)方差貢獻(xiàn)率=第1個(gè)主成分的方差貢獻(xiàn)率至第(a-1)個(gè)主成分的方差貢獻(xiàn)率之和;
按照特征值大于1,累計(jì)方差貢獻(xiàn)率大于指定閾值的原則,提取滿足條件的特征值個(gè)數(shù),作為最終選擇的主成分個(gè)數(shù);如果滿足條件的特征值個(gè)數(shù)為b,選擇b個(gè)主成分,λ1,λ2,……,λb為b個(gè)主成分分別對(duì)應(yīng)的特征值,其分別對(duì)應(yīng)的特征向量e1,e2,……,eb為b個(gè)主成分的特征向量,特征向量和標(biāo)準(zhǔn)化后的數(shù)據(jù)相乘,得到主成分的線性表達(dá)式;
所述權(quán)重分析單元用于:以主成分的方差貢獻(xiàn)率為權(quán)重,對(duì)主要評(píng)估指標(biāo)在各個(gè)主成分線性表達(dá)式中的系數(shù)進(jìn)行加權(quán)平均,計(jì)算每個(gè)主要評(píng)估指標(biāo)的綜合權(quán)重;將所有n個(gè)主要評(píng)估指標(biāo)的綜合權(quán)重進(jìn)行歸一化,得到每個(gè)主要評(píng)估指標(biāo)的權(quán)重值w′,w′j=第j個(gè)主要評(píng)估指標(biāo)的綜合權(quán)重/所有主要評(píng)估指標(biāo)的綜合權(quán)重之和,根據(jù)獲得的權(quán)重值,進(jìn)行加權(quán)計(jì)算,得到每個(gè)用戶(hù)對(duì)不同房間的興趣度得分。
在上述技術(shù)方案的基礎(chǔ)上,所述對(duì)初始化矩陣X進(jìn)行標(biāo)準(zhǔn)化處理的過(guò)程如下:
初始化矩陣X中的元素包括xij、xj,xij表示第i個(gè)用戶(hù)第j個(gè)行為指標(biāo)的數(shù)據(jù)情況,xj表示第j個(gè)行為指標(biāo)的數(shù)據(jù)情況,i、j均為正整數(shù),1≤j≤n;采用最大值函數(shù)max和最小值函數(shù)min對(duì)初始化矩陣X進(jìn)行標(biāo)準(zhǔn)化處理,具體公式為:zij=(xij-min(xj))/(max(xj)-min(xj)),其中,zij表示標(biāo)準(zhǔn)化矩陣Z中的一個(gè)元素。
在上述技術(shù)方案的基礎(chǔ)上,所述主成分的線性表達(dá)式如下:
Yc=ec1*Z1+ec2*Z2+……+ecn*Zn,
其中,c為正整數(shù),1≤c≤b,Yc表示第c個(gè)主成分,ec1為第1個(gè)指標(biāo)在第c個(gè)主成分線性表達(dá)式中的系數(shù),表示第c個(gè)特征向量中的第1個(gè)元素,ecn為第n個(gè)指標(biāo)在第c個(gè)主成分線性表達(dá)式中的系數(shù),表示第c個(gè)特征向量中的第n個(gè)元素,Z1表示第1個(gè)指標(biāo)經(jīng)過(guò)標(biāo)準(zhǔn)化處理后的值,Zn表示第n個(gè)指標(biāo)經(jīng)過(guò)標(biāo)準(zhǔn)化處理后的值。
在上述技術(shù)方案的基礎(chǔ)上,所述計(jì)算綜合權(quán)重的公式如下:
wj=v1*e1j/(v1+v2……+vb)+v2*e2j/(v1+v2……+vb)+……+vb*ebj/(v1+v2……+vb),
其中,wj表示第j個(gè)主要評(píng)估指標(biāo)的綜合權(quán)重,v1表示第1個(gè)主成分的方差貢獻(xiàn)率,vb表示第b個(gè)主成分的方差貢獻(xiàn)率。
在上述技術(shù)方案的基礎(chǔ)上,所述興趣度得分的計(jì)算公式如下:
S=w′1*Z1+w′2*Z2+……+w′n*Zn,其中,S表示興趣度得分,w1表示第1個(gè)指標(biāo)的權(quán)重值,Z1表示第1個(gè)指標(biāo)經(jīng)過(guò)標(biāo)準(zhǔn)化處理后的值,wn表示第n個(gè)指標(biāo)的權(quán)重值,Zn表示第n個(gè)指標(biāo)經(jīng)過(guò)標(biāo)準(zhǔn)化處理后的值。
與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點(diǎn)如下:
本發(fā)明通過(guò)分析用戶(hù)對(duì)房間產(chǎn)生不同的行為,構(gòu)建指標(biāo)評(píng)價(jià)體系,并確定評(píng)估指標(biāo)的權(quán)重,定量衡量用戶(hù)對(duì)房間的興趣度,有助于準(zhǔn)確判斷用戶(hù)的喜好;使用該興趣度得分,能夠得到用戶(hù)對(duì)觀看過(guò)的房間進(jìn)行興趣排名,有助于向用戶(hù)準(zhǔn)確推薦可能感興趣的房間,增加用戶(hù)體驗(yàn)。
附圖說(shuō)明
圖1是本發(fā)明實(shí)施例中用戶(hù)房間興趣度計(jì)算方法的流程圖。
具體實(shí)施方式
下面結(jié)合附圖及具體實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述。
參見(jiàn)圖1所示,本發(fā)明實(shí)施例提供一種基于主成分分析的用戶(hù)房間興趣度計(jì)算方法,包括以下步驟:
S1、根據(jù)用戶(hù)對(duì)房間的行為信息,提取多個(gè)行為指標(biāo),并對(duì)行為指標(biāo)進(jìn)行分析,對(duì)相關(guān)系數(shù)絕對(duì)值大于相關(guān)閾值的行為指標(biāo)進(jìn)行相互替代,篩選出n個(gè)具有代表性的行為指標(biāo)作為主要評(píng)估指標(biāo),構(gòu)建興趣度計(jì)算指標(biāo)體系;實(shí)際應(yīng)用中,相關(guān)閾值一般大于0.7,優(yōu)選為0.8,n一般為≥3的正整數(shù);
步驟S1的具體過(guò)程如下:
根據(jù)用戶(hù)對(duì)房間的行為信息,構(gòu)建一級(jí)指標(biāo),一級(jí)指標(biāo)包括贈(zèng)送行為、觀看行為、關(guān)注行為,彈幕行為;對(duì)一級(jí)指標(biāo)進(jìn)行細(xì)分,細(xì)化用戶(hù)對(duì)房間的行為信息指標(biāo),得到最初評(píng)估指標(biāo),例如,“觀看行為”這個(gè)一級(jí)指標(biāo)下,包括有效觀看時(shí)長(zhǎng)、有效觀看天數(shù)這兩個(gè)最初評(píng)估指標(biāo);對(duì)最初評(píng)估指標(biāo)進(jìn)行相關(guān)分析,對(duì)相關(guān)系數(shù)絕對(duì)值大于0.8的高相關(guān)指標(biāo)進(jìn)行相互替代,篩選出n個(gè)具有代表性的行為指標(biāo)作為主要評(píng)估指標(biāo),確定興趣度計(jì)算指標(biāo)體系;
本實(shí)施例中,通過(guò)上述的分析,得出n=6,表示主要評(píng)估指標(biāo)有6個(gè),6個(gè)主要評(píng)估指標(biāo)分別為:有效觀看時(shí)長(zhǎng)、有效觀看天數(shù)、發(fā)送彈幕數(shù)、免費(fèi)禮物數(shù)、付費(fèi)禮物數(shù)、是否關(guān)注。
S2、獲取近一周時(shí)間內(nèi)多個(gè)用戶(hù)所產(chǎn)生的房間行為信息,構(gòu)建初始化矩陣X,對(duì)初始化矩陣X進(jìn)行標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)化矩陣Z,對(duì)初始化矩陣X進(jìn)行標(biāo)準(zhǔn)化處理的過(guò)程如下:
初始化矩陣X中的元素包括xij、xj,xij表示第i個(gè)用戶(hù)第j個(gè)行為指標(biāo)的數(shù)據(jù)情況,xj表示第j個(gè)行為指標(biāo)的數(shù)據(jù)情況,i、j均為正整數(shù),1≤j≤n;采用最大值函數(shù)max和最小值函數(shù)min對(duì)初始化矩陣X進(jìn)行標(biāo)準(zhǔn)化處理,具體公式為:zij=(xij-min(xj))/(max(xj)-min(xj)),其中,zij表示標(biāo)準(zhǔn)化矩陣Z中的一個(gè)元素;
計(jì)算標(biāo)準(zhǔn)化矩陣Z的相關(guān)系數(shù)矩陣R,并計(jì)算相關(guān)系數(shù)矩陣R對(duì)應(yīng)的特征值λ;將特征值λ由大到小排列,得到λ1、λ2、……、λ6,對(duì)應(yīng)的特征向量為e1、e2、……、e6,特征向量e滿足|e|=1,每個(gè)特征值對(duì)應(yīng)一個(gè)主成分,每個(gè)特征向量包含6個(gè)元素,例如,向量e1包括e12、e12、e13、……、e16;
S3、計(jì)算每個(gè)主成分的方差貢獻(xiàn)率v,va=λa/(λ1+λ2+……+λ6),a為正整數(shù),1≤a≤n,va表示第a個(gè)主成分的方差貢獻(xiàn)率,λa表示第a個(gè)主成分對(duì)應(yīng)的特征值;計(jì)算主成分的累計(jì)方差貢獻(xiàn)率,第a個(gè)主成分的累計(jì)方差貢獻(xiàn)率=第1個(gè)主成分的方差貢獻(xiàn)率至第(a-1)個(gè)主成分的方差貢獻(xiàn)率之和;例如,第二主成分的累計(jì)方差貢獻(xiàn)率為:第一主成分的方差貢獻(xiàn)率+第二主成分的方差貢獻(xiàn)率;
S4、按照特征值大于1,累計(jì)方差貢獻(xiàn)率大于指定閾值的原則,提取滿足條件的特征值個(gè)數(shù),作為最終選擇的主成分個(gè)數(shù);實(shí)際應(yīng)用中,指定閾值=3,本發(fā)明按照上述規(guī)則,最終提取3個(gè)主成分,λ1,λ2,λ3為3個(gè)主成分分別對(duì)應(yīng)的特征值,其分別對(duì)應(yīng)的特征向量e1,e2,e3為3個(gè)主成分的特征向量,特征向量和標(biāo)準(zhǔn)化后的數(shù)據(jù)相乘,得到主成分的線性表達(dá)式,如:
Y1=e11*Z1+e12*Z2+……+e16*Z6;
Y2=e21*Z1+e22*Z2+……+e26*Z6;
Y3=e31*Z1+e32*Z2+……+e36*Z6;
其中,Y1表示第1個(gè)主成分,e11為第1個(gè)指標(biāo)在第1個(gè)主成分線性表達(dá)式中的系數(shù),表示特征向量e1中的第1個(gè)元素,e16為第6個(gè)指標(biāo)在第1個(gè)主成分線性表達(dá)式中的系數(shù),表示特征向量e1中的第6個(gè)元素,Z1表示第1個(gè)指標(biāo)經(jīng)過(guò)標(biāo)準(zhǔn)化處理后的值,以此類(lèi)推。
S5、主成分的方差貢獻(xiàn)率越大,表示該主成分的重要性越強(qiáng),將方差貢獻(xiàn)率定義為不同主成分的權(quán)重;以主成分的方差貢獻(xiàn)率為權(quán)重,對(duì)主要評(píng)估指標(biāo)在各個(gè)主成分線性表達(dá)式中的系數(shù)進(jìn)行加權(quán)平均,計(jì)算每個(gè)主要評(píng)估指標(biāo)的綜合權(quán)重;計(jì)算公式如下:
w1=v1*e11/(v1+v2+v3)+v2*e21/(v1+v2+v3)+v3*e31/(v1+v2+v3);
w2=v2*e12/(v1+v2+v3)+v2*e22/(v1+v2+v3)+v3*e32/(v1+v2+v3);
……;
w6=v1*e16/(v1+v2+v3)+v2*e26/(v1+v2+v3)+v3*e36/(v1+v2+v3);
w1表示第1個(gè)主要評(píng)估指標(biāo)的綜合權(quán)重,以此類(lèi)推,可得到各個(gè)主要評(píng)估指標(biāo)對(duì)應(yīng)的綜合權(quán)重;
將所有6個(gè)主要評(píng)估指標(biāo)的綜合權(quán)重進(jìn)行歸一化,得到每個(gè)主要評(píng)估指標(biāo)的權(quán)重值w′,w′j=第j個(gè)主要評(píng)估指標(biāo)的綜合權(quán)重/所有主要評(píng)估指標(biāo)的綜合權(quán)重之和,根據(jù)獲得的權(quán)重值,進(jìn)行加權(quán)計(jì)算,得到每個(gè)用戶(hù)對(duì)不同房間的興趣度得分,興趣度得分的計(jì)算公式如下:
S=w′1*Z1+w′2*Z2+……+w′6*Z6,其中,S表示興趣度得分。
本發(fā)明實(shí)施例還提供一種基于主成分分析的用戶(hù)房間興趣度計(jì)算系統(tǒng),該系統(tǒng)包括:體系構(gòu)建單元、主成分分析單元、權(quán)重分析單元,其中,
體系構(gòu)建單元用于:根據(jù)用戶(hù)對(duì)房間的行為信息,提取多個(gè)行為指標(biāo),并對(duì)行為指標(biāo)進(jìn)行分析,對(duì)相關(guān)系數(shù)絕對(duì)值大于相關(guān)閾值的行為指標(biāo)進(jìn)行相互替代,篩選出n個(gè)具有代表性的行為指標(biāo)作為主要評(píng)估指標(biāo),構(gòu)建興趣度計(jì)算指標(biāo)體系;實(shí)際應(yīng)用中,相關(guān)閾值一般大于0.7,優(yōu)選為0.8,n一般為≥3的正整數(shù);
具體過(guò)程如下:
根據(jù)用戶(hù)對(duì)房間的行為信息,構(gòu)建一級(jí)指標(biāo),一級(jí)指標(biāo)包括贈(zèng)送行為、觀看行為、關(guān)注行為,彈幕行為;對(duì)一級(jí)指標(biāo)進(jìn)行細(xì)分,細(xì)化用戶(hù)對(duì)房間的行為信息指標(biāo),得到最初評(píng)估指標(biāo),例如,“觀看行為”這個(gè)一級(jí)指標(biāo)下,包括有效觀看時(shí)長(zhǎng)、有效觀看天數(shù)這兩個(gè)最初評(píng)估指標(biāo);對(duì)最初評(píng)估指標(biāo)進(jìn)行相關(guān)分析,對(duì)相關(guān)系數(shù)絕對(duì)值大于0.8的高相關(guān)指標(biāo)進(jìn)行相互替代,篩選出n個(gè)具有代表性的行為指標(biāo)作為主要評(píng)估指標(biāo),確定興趣度計(jì)算指標(biāo)體系;本實(shí)施例中,通過(guò)上述的分析,得出n=6,表示主要評(píng)估指標(biāo)有6個(gè),6個(gè)主要評(píng)估指標(biāo)分別為:有效觀看時(shí)長(zhǎng)、有效觀看天數(shù)、發(fā)送彈幕數(shù)、免費(fèi)禮物數(shù)、付費(fèi)禮物數(shù)、是否關(guān)注。
主成分分析單元用于:獲取近一周時(shí)間內(nèi)多個(gè)用戶(hù)所產(chǎn)生的房間行為信息,構(gòu)建初始化矩陣X,對(duì)初始化矩陣X進(jìn)行標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)化矩陣Z,對(duì)初始化矩陣X進(jìn)行標(biāo)準(zhǔn)化處理的過(guò)程如下:
初始化矩陣X中的元素包括xij、xj,xij表示第i個(gè)用戶(hù)第j個(gè)行為指標(biāo)的數(shù)據(jù)情況,xj表示第j個(gè)行為指標(biāo)的數(shù)據(jù)情況,i、j均為正整數(shù),1≤j≤n;采用最大值函數(shù)max和最小值函數(shù)min對(duì)初始化矩陣X進(jìn)行標(biāo)準(zhǔn)化處理,具體公式為:zij=(xij-min(xj))/(max(xj)-min(xj)),其中,zij表示標(biāo)準(zhǔn)化矩陣Z中的一個(gè)元素;
計(jì)算標(biāo)準(zhǔn)化矩陣Z的相關(guān)系數(shù)矩陣R,并計(jì)算相關(guān)系數(shù)矩陣R對(duì)應(yīng)的特征值λ;將特征值λ由大到小排列,得到λ1、λ2、……、λ6,對(duì)應(yīng)的特征向量為e1、e2、……、e6,特征向量e滿足|e|=1,每個(gè)特征值對(duì)應(yīng)一個(gè)主成分,每個(gè)特征向量包含6個(gè)元素,例如,向量e1包括e12、e12、e13、……、e16;
計(jì)算每個(gè)主成分的方差貢獻(xiàn)率v,va=λa/(λ1+λ2+……+λ6),a為正整數(shù),1≤a≤n,va表示第a個(gè)主成分的方差貢獻(xiàn)率,λa表示第a個(gè)主成分對(duì)應(yīng)的特征值;計(jì)算主成分的累計(jì)方差貢獻(xiàn)率,第a個(gè)主成分的累計(jì)方差貢獻(xiàn)率=第1個(gè)主成分的方差貢獻(xiàn)率至第(a-1)個(gè)主成分的方差貢獻(xiàn)率之和;例如,第二主成分的累計(jì)方差貢獻(xiàn)率為:第一主成分的方差貢獻(xiàn)率+第二主成分的方差貢獻(xiàn)率;
按照特征值大于1,累計(jì)方差貢獻(xiàn)率大于指定閾值的原則,提取滿足條件的特征值個(gè)數(shù),作為最終選擇的主成分個(gè)數(shù);實(shí)際應(yīng)用中,指定閾值=3,本發(fā)明按照上述規(guī)則,最終提取3個(gè)主成分,λ1,λ2,λ3為3個(gè)主成分分別對(duì)應(yīng)的特征值,其分別對(duì)應(yīng)的特征向量e1,e2,e3為3個(gè)主成分的特征向量,特征向量和標(biāo)準(zhǔn)化后的數(shù)據(jù)相乘,得到主成分的線性表達(dá)式,如:
Y1=e11*Z1+e12*Z2+……+e16*Z6;
Y2=e21*Z1+e22*Z2+……+e26*Z6;
Y3=e31*Z1+e32*Z2+……+e36*Z6;
其中,Y1表示第1個(gè)主成分,e11為第1個(gè)指標(biāo)在第1個(gè)主成分線性表達(dá)式中的系數(shù),表示特征向量e1中的第1個(gè)元素,e16為第6個(gè)指標(biāo)在第1個(gè)主成分線性表達(dá)式中的系數(shù),表示特征向量e1中的第6個(gè)元素,Z1表示第1個(gè)指標(biāo)經(jīng)過(guò)標(biāo)準(zhǔn)化處理后的值,以此類(lèi)推。
權(quán)重分析單元用于:以主成分的方差貢獻(xiàn)率為權(quán)重,對(duì)主要評(píng)估指標(biāo)在各個(gè)主成分線性表達(dá)式中的系數(shù)進(jìn)行加權(quán)平均,計(jì)算每個(gè)主要評(píng)估指標(biāo)的綜合權(quán)重;計(jì)算公式如下:
w1=v1*e11/(v1+v2+v3)+v2*e21/(v1+v2+v3)+v3*e31/(v1+v2+v3);
w2=v2*e12/(v1+v2+v3)+v2*e22/(v1+v2+v3)+v3*e32/(v1+v2+v3);
……;
w6=v1*e16/(v1+v2+v3)+v2*e26/(v1+v2+v3)+v3*e36/(v1+v2+v3);
w1表示第1個(gè)主要評(píng)估指標(biāo)的綜合權(quán)重,以此類(lèi)推,可得到各個(gè)主要評(píng)估指標(biāo)對(duì)應(yīng)的綜合權(quán)重;
將所有6個(gè)主要評(píng)估指標(biāo)的綜合權(quán)重進(jìn)行歸一化,得到每個(gè)主要評(píng)估指標(biāo)的權(quán)重值w′,w′j=第j個(gè)主要評(píng)估指標(biāo)的綜合權(quán)重/所有主要評(píng)估指標(biāo)的綜合權(quán)重之和,根據(jù)獲得的權(quán)重值,進(jìn)行加權(quán)計(jì)算,得到每個(gè)用戶(hù)對(duì)不同房間的興趣度得分,興趣度得分的計(jì)算公式如下:
S=w′1*Z1+w′2*Z2+……+w′6*Z6,其中,S表示興趣度得分。
本領(lǐng)域的技術(shù)人員可以對(duì)本發(fā)明實(shí)施例進(jìn)行各種修改和變型,倘若這些修改和變型在本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則這些修改和變型也在本發(fā)明的保護(hù)范圍之內(nèi)。
說(shuō)明書(shū)中未詳細(xì)描述的內(nèi)容為本領(lǐng)域技術(shù)人員公知的現(xiàn)有技術(shù)。