本發(fā)明實(shí)施例涉及視頻技術(shù)領(lǐng)域,尤其涉及一種基于電視的家庭成員的分析方法及裝置。
背景技術(shù):
在視頻領(lǐng)域,對(duì)用戶的分析一般分很多端側(cè),比如移動(dòng)端(手機(jī))、客戶端(電腦)和智能電視。對(duì)于手機(jī)用戶和電腦用戶來(lái)說(shuō),他們基本是單一用戶。但是對(duì)于智能電視的用戶來(lái)說(shuō),往往面對(duì)的是家庭用戶,由于家庭用戶中不同用戶的觀影需求不同,那么為了給家庭用戶提供更好的電視服務(wù)體驗(yàn),就需要對(duì)這些家庭用戶進(jìn)行家庭成員的結(jié)構(gòu)分析。
現(xiàn)有技術(shù)中,在對(duì)電視用戶的家庭成員進(jìn)行分析時(shí),采用的方案主要是通過(guò)獲取用戶的注冊(cè)信息以及對(duì)用戶進(jìn)行問(wèn)卷調(diào)查的方式來(lái)確定用戶的屬性(例如性別、年齡等)、觀影偏好等信息,以此完成家庭用戶成員的結(jié)構(gòu)分析。
但是,對(duì)于通過(guò)獲取注冊(cè)信息來(lái)對(duì)電視用戶的家庭成員進(jìn)行分析的方案來(lái)說(shuō),本領(lǐng)域的技術(shù)人員發(fā)現(xiàn)由于注冊(cè)信息中有很多用戶屬性(例如:年齡、性別)以及家庭成員等信息并不是必須填寫(xiě)的,這樣容易造成注冊(cè)信息的不完全,從而無(wú)法有效的依據(jù)注冊(cè)進(jìn)行來(lái)對(duì)家庭成員進(jìn)行分析。
而對(duì)于通過(guò)問(wèn)卷調(diào)查的方式來(lái)對(duì)電視用戶的家庭成員進(jìn)行分析的方案來(lái)說(shuō),本領(lǐng)域的技術(shù)人員發(fā)現(xiàn)由于用戶對(duì)問(wèn)卷調(diào)查普遍填寫(xiě)不積極,內(nèi)容真實(shí)性不可靠,從而也會(huì)造成家庭成員分析的不準(zhǔn)確。
發(fā)明人在實(shí)現(xiàn)本發(fā)明的過(guò)程中發(fā)現(xiàn),現(xiàn)有技術(shù)中的電視用戶的家庭成員的分析方案普遍存在著對(duì)家庭成員的信息分析準(zhǔn)確性低的問(wèn)題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例提供一種基于電視的家庭成員的分析方法及裝置,用以解決現(xiàn)有技術(shù)中的電視用戶的家庭成員的分析方案所存在的對(duì)家庭成員的信息分析準(zhǔn)確性低的問(wèn)題。
本發(fā)明實(shí)施例提供一種基于電視的家庭成員的分析方法,包括:
獲取電視用戶家庭在預(yù)定時(shí)間段內(nèi)所觀看的電視影片的第一影片記錄;
依據(jù)所述第一影片記錄中每部影片的觀眾性別傾向數(shù)據(jù),對(duì)所述第一影片記錄內(nèi)的影片按照性別進(jìn)行聚類操作,確定所述電視用戶家庭的用戶性別以及每個(gè)用戶性別所對(duì)應(yīng)的第二影片記錄;
依據(jù)所述第二影片記錄中每部影片的觀眾年齡段傾向數(shù)據(jù),對(duì)所述第二影片記錄內(nèi)的影片按照年齡段進(jìn)行聚類操作,確定所述電視用戶家庭的每個(gè)用戶性別的用戶群的年齡分布。
本發(fā)明實(shí)施例提供一種基于電視的家庭成員的分析裝置,包括:
獲取模塊,用于獲取電視用戶家庭在預(yù)定時(shí)間段內(nèi)所觀看的電視影片的第一影片記錄;
第一聚類模塊,用于依據(jù)所述第一影片記錄中每部影片的觀眾性別傾向數(shù)據(jù),對(duì)所述第一影片記錄內(nèi)的影片按照性別進(jìn)行聚類操作,確定所述電視用戶家庭的用戶性別以及每個(gè)用戶性別所對(duì)應(yīng)的第二影片記錄;
第二聚類模塊,用于依據(jù)所述第二影片記錄中每部影片的觀眾年齡段傾向數(shù)據(jù),對(duì)所述第二影片記錄內(nèi)的影片按照年齡段進(jìn)行聚類操作,確定所述電視用戶家庭的每個(gè)用戶性別的用戶群的年齡分布。
本發(fā)明實(shí)施例提供的基于電視的家庭成員的分析及裝置,通過(guò)對(duì)某段時(shí)間內(nèi)電視用戶家庭的觀影記錄以及觀影記錄中每部影片的性別傾向數(shù)據(jù)和年齡段傾向數(shù)據(jù)來(lái)對(duì)該電視用戶家庭的家庭成員構(gòu)成情況進(jìn)行分析。其中,用于分析的數(shù)據(jù)源為真實(shí)準(zhǔn)確的信息,而非傳統(tǒng)技術(shù)中依據(jù)問(wèn)卷調(diào)查和用戶信息注冊(cè)的真實(shí)度無(wú)法保證的數(shù)據(jù)源。從而能夠借助于真實(shí)準(zhǔn)確的數(shù)據(jù)源來(lái)對(duì)電視用戶家庭的家庭成員分析更加接近于真實(shí)情況,準(zhǔn)確度更高。并且,首先對(duì)電視用戶家庭的性別進(jìn)行分析,得到對(duì)應(yīng)于不同性別的兩類觀影記錄;然后,再對(duì)每個(gè)觀影聚類的觀眾年齡進(jìn)行分析,從而確定該電視用戶家庭的用戶數(shù)量以及年齡分布,分析結(jié)果更加細(xì)化和準(zhǔn)確。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例的一種基于電視的家庭成員的分析方法的流程圖;
圖2為本發(fā)明實(shí)施例的另一種基于電視的家庭成員的分析方法的流程圖;
圖3為本發(fā)明實(shí)施例的一種基于電視的家庭成員的分析裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
第一實(shí)施例
參照?qǐng)D1,根據(jù)本發(fā)明的一個(gè)實(shí)施例,提供了一種基于電視的家庭成員的分析方法。
對(duì)于一個(gè)電視用戶家庭可以由一個(gè)或多個(gè)用戶而構(gòu)成,那么為了分析該電視用戶家庭的家庭成員的構(gòu)成情況,因此,需要借助于本發(fā)明實(shí)施例的基于電視的家庭成員的分析方法,從而分析該電視用戶家庭為幾口之家,各個(gè)家庭成員的性別以及年齡段情況,從而為該家庭成員推薦與各個(gè)成員的個(gè)人情況相匹配的電視資源。圖1所示的該方法具體包括如下步驟:
步驟101,獲取電視用戶家庭在預(yù)定時(shí)間段內(nèi)所觀看的電視影片的第一影片記錄;
其中,可以獲取該電視用家庭在某一臺(tái)電視機(jī)上某個(gè)時(shí)間段內(nèi)的觀影記錄,該記錄中包含所觀看的影片名稱,該影片可以是電視劇、電影等。
步驟102,依據(jù)所述第一影片記錄中每部影片的觀眾性別傾向數(shù)據(jù),對(duì)所述第一影片記錄內(nèi)的影片按照性別進(jìn)行聚類操作,確定所述電視用戶家庭的用戶性別以及每個(gè)用戶性別所對(duì)應(yīng)的第二影片記錄;
其中,對(duì)于每部影片來(lái)說(shuō),本發(fā)明實(shí)施例都為其設(shè)計(jì)有相應(yīng)的觀眾性別傾向數(shù)據(jù),例如電視機(jī)《親愛(ài)的翻譯官》的觀眾性別傾向數(shù)據(jù)為觀眾傾向?yàn)榕缘臋?quán)重為0.75,觀眾傾向?yàn)槟行缘臋?quán)重為0.25,即該觀眾性別傾向數(shù)據(jù)為觀看該影片的觀眾的兩種性別的權(quán)重;該權(quán)重依據(jù)電視機(jī)的不同而不同,但是兩種性別的權(quán)重之和必然等于一。
那么,一段時(shí)間內(nèi)的影片記錄中可能包括多部影片,而每部影片都有相應(yīng)的男、女觀眾的權(quán)重屬性值,就可以依據(jù)多部影片的男、女觀眾的權(quán)重屬性值來(lái)對(duì)這些影片按照觀眾性別進(jìn)行聚類,從而確定該電視用戶家庭的用戶性別以及傾向于男性觀眾觀看的影片記錄和/或傾向于女性觀眾觀看的影片記錄。
這里需要注意的是,該電視用戶家庭的所有用戶可能為同一種性別,這時(shí),該第二影片記錄實(shí)質(zhì)與第一影片記錄相同;而如果該電視用戶家庭包括兩種性別,則傾向男性觀看的影片記錄和傾向女性觀看的影片記錄之和為上述第一影片記錄。
步驟103,依據(jù)所述第二影片記錄中每部影片的觀眾年齡段傾向數(shù)據(jù),對(duì)所述第二影片記錄內(nèi)的影片按照年齡段進(jìn)行聚類操作,確定所述電視用戶家庭的每個(gè)用戶性別的用戶群的年齡分布。
其中,對(duì)于每部影片來(lái)說(shuō),本發(fā)明實(shí)施例不僅為其設(shè)計(jì)有相應(yīng)的觀眾性別傾向數(shù)據(jù),還設(shè)計(jì)有相應(yīng)的觀眾年齡段傾向數(shù)據(jù),例如電視機(jī)《親愛(ài)的翻譯官》的觀眾年齡段傾向數(shù)據(jù)為觀眾年齡在20~29歲的權(quán)重為0.61,觀眾年齡在30~39歲的權(quán)重為0.15,觀眾年齡在0~19歲的權(quán)重為0.14,觀眾年齡在40歲以上的權(quán)重為0.11,即該觀眾年齡段傾向數(shù)據(jù)為觀看該影片的觀眾的年齡段的權(quán)重;該權(quán)重依據(jù)電視機(jī)的不同而不同,但是這四種年齡段的權(quán)重之和必然等于一。并且,這里的權(quán)重值越高說(shuō)明屬于該年齡段的用戶觀看該電視劇的占所有年齡段的觀眾的比值最高。
另外,需要注意的是,雖然這里針對(duì)《親愛(ài)的翻譯官》配置了四個(gè)年齡段的權(quán)重,但是,隨著各個(gè)影片觀眾的年齡段的不同,每個(gè)影片的年齡段布局并不要求一一相同,例如針對(duì)《西游記》可以配置五個(gè)年齡段,0~9歲,10~19歲,20~39歲,40~59歲,以及60歲以上,并且根據(jù)觀劇情況來(lái)配置每個(gè)年齡段的權(quán)重。
借助于本發(fā)明實(shí)施例的上述技術(shù)方案,本發(fā)明實(shí)施例通過(guò)對(duì)某段時(shí)間內(nèi)電視用戶家庭的觀影記錄以及觀影記錄中每部影片的性別傾向數(shù)據(jù)和年齡段傾向數(shù)據(jù)來(lái)對(duì)該電視用戶家庭的家庭成員構(gòu)成情況進(jìn)行分析。其中,用于分析的數(shù)據(jù)源為真實(shí)準(zhǔn)確的信息,而非傳統(tǒng)技術(shù)中依據(jù)問(wèn)卷調(diào)查和用戶信息注冊(cè)的真實(shí)度無(wú)法保證的數(shù)據(jù)源。從而能夠借助于真實(shí)準(zhǔn)確的數(shù)據(jù)源來(lái)對(duì)電視用戶家庭的家庭成員分析更加接近于真實(shí)情況,準(zhǔn)確度更高。并且,首先對(duì)電視用戶家庭的性別進(jìn)行分析,得到對(duì)應(yīng)于不同性別的兩類觀影記錄;然后,再對(duì)每個(gè)觀影聚類的觀眾年齡進(jìn)行分析,從而確定該電視用戶家庭的用戶數(shù)量以及年齡分布,分析結(jié)果更加細(xì)化和準(zhǔn)確。
第二實(shí)施例
參照?qǐng)D2,根據(jù)本發(fā)明的一個(gè)實(shí)施例,還提供了一種基于電視的家庭成員的分析方法,該方法包括:
步驟201,獲取電視用戶家庭在預(yù)定時(shí)間段內(nèi)所觀看的電視影片的第一影片記錄;
步驟202,依據(jù)所述第一影片記錄中每部影片的觀眾性別傾向數(shù)據(jù),對(duì)所述第一影片記錄內(nèi)的影片按照性別進(jìn)行聚類操作,得到兩個(gè)性別聚類結(jié)果簇;
可選地,在一個(gè)實(shí)施例中,在執(zhí)行步驟202時(shí),可以通過(guò)以下方式來(lái)實(shí)現(xiàn):依據(jù)所述第一影片記錄中每部影片的觀眾性別傾向數(shù)據(jù),對(duì)所述第一影片記錄建立性別維度的空間向量模型;依據(jù)所述性別維度的空間向量模型,對(duì)所述第一影片記錄內(nèi)的影片按照性別進(jìn)行聚類操作,來(lái)得到兩個(gè)性別聚類結(jié)果簇。
具體而言,例如某段時(shí)間內(nèi)某一個(gè)家庭在一臺(tái)電視上的影片記錄包括:影片1、2、3、4、5、6,每部影片都有男性權(quán)重、女性權(quán)重,那么可以以男性權(quán)重和女性權(quán)重為X、Y軸建立平面直角坐標(biāo)系,每部影片都是該坐標(biāo)系中的一個(gè)點(diǎn),該點(diǎn)的橫縱坐標(biāo)值即該影片對(duì)應(yīng)的男性權(quán)重和女性權(quán)重值;
那么,該坐標(biāo)系中包括6個(gè)點(diǎn),可以對(duì)這6個(gè)點(diǎn)進(jìn)行聚類,將距離接近的點(diǎn)歸為一類,剩余的點(diǎn)歸為一類。這樣可以通過(guò)聚類操作,初步粗略的得到兩類結(jié)果,一類性別聚類結(jié)果簇A對(duì)應(yīng)于女性觀看,一類性別聚類結(jié)果簇B對(duì)應(yīng)于男性觀看。
步驟203,對(duì)所述兩個(gè)性別聚類結(jié)果簇分別進(jìn)行性別分類操作,確定每個(gè)性別聚類結(jié)果簇的性別傾向;
其中,由于步驟202得到的性別聚類結(jié)果簇只是粗略的分類,即從性別權(quán)重的角度分析得到的家庭成員的性別預(yù)測(cè)結(jié)果,但是,實(shí)際情況上,也存在某些女性也喜歡看更傾向于被男性觀看的影片的情況,因此,該性別聚類結(jié)果簇并不一定屬于真實(shí)情況。
這里,需要借助于步驟203來(lái)對(duì)兩個(gè)性別聚類結(jié)果簇A、B分別作進(jìn)一步的性別分類操作,具體而言,在上述平面直角坐標(biāo)系中,例如A類聚類結(jié)果簇包括2個(gè)點(diǎn),B類聚類結(jié)果簇包括4個(gè)點(diǎn)。以包含兩個(gè)點(diǎn)的A類聚類結(jié)果簇為例,計(jì)算兩個(gè)點(diǎn)的橫坐標(biāo)的坐標(biāo)值之和,即男性權(quán)重之和,得到Sum1,計(jì)算兩個(gè)點(diǎn)的縱坐標(biāo)的坐標(biāo)值之和,即女性權(quán)重之和,得到Sum2;比較Sum1和Sum2,如果Sum1大于Sum2,說(shuō)明該A類聚類結(jié)果簇更傾向于男性,如果相反,則說(shuō)明更傾向于女性。這里,假設(shè)包含兩個(gè)點(diǎn)的聚類結(jié)果簇的Sum1大于Sum2,傾向于男性。
同理,計(jì)算包含4個(gè)點(diǎn)的另一B類聚類結(jié)果簇的橫坐標(biāo)的坐標(biāo)值之和,記為Sum3,縱坐標(biāo)的坐標(biāo)值之和,記為Sum4,如果Sum3大于Sum4,則說(shuō)明該B類聚類結(jié)果簇也是傾向于男性,與上述包含兩個(gè)點(diǎn)的A類聚類結(jié)果簇的性別傾向相同,那么這時(shí)需要將兩類聚類結(jié)果簇A和B進(jìn)行合并,同時(shí)可以確定該電視用戶家庭只包含男性;相反,如果Sum3小于Sum4,則說(shuō)明該B類聚類結(jié)果簇傾向于女性,不同于上述包含兩個(gè)點(diǎn)的A類聚類結(jié)果簇的性別傾向結(jié)果。因此,這時(shí)可以確定該電視用戶家庭由男女共同構(gòu)成。
步驟204,根據(jù)每個(gè)性別聚類結(jié)果簇的性別傾向,確定所述電視用戶家庭的用戶性別以及每個(gè)用戶性別所對(duì)應(yīng)的第二影片記錄;
其中,如上所述,如果上述兩個(gè)性別聚類結(jié)果簇A、B的性別傾向不同,則可以確定該電視用戶家庭的性別包括男性和女性,同時(shí)性別傾向于男性的性別聚類結(jié)果簇所包含的多個(gè)影片即為男性的影片記錄,而性別傾向于女性的性別聚類結(jié)果簇所包含的多個(gè)影片即為女性的影片記錄。
這樣,在依據(jù)性別進(jìn)行粗略的聚類操作后,可以通過(guò)性別分類操作進(jìn)一步對(duì)兩個(gè)性別聚類結(jié)果簇進(jìn)行性別區(qū)分,從而判斷是否需要合并,這樣可以保證對(duì)電視用戶家庭的家庭成員的用戶性別的判斷準(zhǔn)確度。
步驟205,依據(jù)所述第二影片記錄中每部影片的觀眾年齡段傾向數(shù)據(jù),對(duì)所述第二影片記錄內(nèi)的影片按照年齡段進(jìn)行聚類操作,得到多個(gè)年齡段的年齡聚類結(jié)果簇;
具體而言,對(duì)于上述A、B類性別聚類結(jié)果簇,這里假設(shè)它們對(duì)應(yīng)的性別傾向不同,未合并,那么需要對(duì)該男、女聚類結(jié)果簇所對(duì)應(yīng)的兩組第二影片記錄分別進(jìn)行上述聚類操作。
可選地,在一個(gè)實(shí)施例中,在執(zhí)行步驟S205時(shí),可以通過(guò)以下方式來(lái)實(shí)現(xiàn):依據(jù)所述第二影片記錄中每部影片的觀眾年齡段傾向數(shù)據(jù),對(duì)所述第二影片記錄建立年齡段維度的空間向量模型;依據(jù)所述年齡段維度的空間向量模型,對(duì)所述第二影片記錄內(nèi)的影片按照年齡段進(jìn)行聚類操作,得到多個(gè)年齡段的年齡聚類結(jié)果簇。
以對(duì)應(yīng)于男性的第二影片記錄為例,在上述實(shí)施例中提到的平面直角坐標(biāo)系中,例如A類性別聚類結(jié)果對(duì)應(yīng)的影片包括1、2、3。這里,每部影片不僅包含性別傾向數(shù)據(jù),還包括年齡段傾向數(shù)據(jù),例如影片1、2、3都對(duì)應(yīng)有四個(gè)相同年齡段的權(quán)重?cái)?shù)據(jù),那么在依據(jù)各個(gè)影片的年齡段的權(quán)重?cái)?shù)據(jù)建立空間向量模型時(shí),建立的就是四維的模型,四個(gè)維度分別為四個(gè)年齡段,每部影片對(duì)應(yīng)于模型中的一個(gè)面(而如果模型是三維的,則對(duì)應(yīng)一條線),而每部影片的年齡段的權(quán)重?cái)?shù)據(jù)則可以構(gòu)成相應(yīng)影片的面。
實(shí)際上,該年齡段維度的空間向量模型與性別維度的空間向量模型的建立方式類似,只是維度增加了而已。同樣的,在建模完成后,就對(duì)這里的第二影片記錄內(nèi)的3部影片按照年齡段進(jìn)行聚類操作,即將距離接近的面構(gòu)成一類,從而得到四類對(duì)應(yīng)這里四個(gè)不同年齡段的年齡聚類結(jié)果簇。其中,需要說(shuō)明的是,由于本例中只涉及了三部影片,因此,其中一個(gè)年齡段的年齡聚類結(jié)果簇的結(jié)果為零。
步驟206,對(duì)所述多個(gè)年齡段的年齡聚類結(jié)果簇分別進(jìn)行年齡段分類操作,確定每個(gè)年齡段的年齡聚類結(jié)果簇的年齡段傾向;
同樣的,與性別聚類結(jié)果簇類型,上述年齡聚類操作也是粗略的聚類,并不一定符合真實(shí)情況,因此,還需要進(jìn)行年齡段的分類操作。
這里的分類操作與性別分類操作類似,對(duì)于一個(gè)年齡聚類結(jié)果簇來(lái)說(shuō),其可能包括多個(gè)面,這里需要將多個(gè)面的四個(gè)坐標(biāo)值分別作求和處理,這樣得到四個(gè)年齡段的各自求和結(jié)果,將最大的求和結(jié)果所對(duì)應(yīng)的年齡段作為該年齡聚類結(jié)果簇的年齡段傾向,具體與性別分類操作類似,在此不再詳述。
步驟207,將年齡段傾向相同的年齡段聚類結(jié)果簇進(jìn)行合并。
其中,可能存在年齡段傾向相同的情況,因此,可以將年齡段傾向相同的年齡段聚類結(jié)果簇進(jìn)行合并。
步驟208,根據(jù)每個(gè)年齡段聚類結(jié)果簇的年齡段傾向,確定所述電視用戶家庭的每個(gè)用戶性別的用戶群的年齡段分布。
其中,對(duì)于女性的影片記錄,可以根據(jù)該影片記錄的每個(gè)年齡段聚類結(jié)果簇的年齡段傾向(例如影片1、2、3均傾向于20~29歲);對(duì)于男性的影片記錄(例如影片4、5、6)的一個(gè)年齡段聚類結(jié)果(對(duì)應(yīng)于影片4)的年齡段傾向?yàn)?0~29歲,另一個(gè)年齡段聚類結(jié)果(對(duì)應(yīng)于影片5、6)的年齡段傾向?yàn)?~19歲。那么就可以確定該電視家庭用戶為三口之家,由20~29歲的父母和0~19歲的兒子構(gòu)成。
借助于本發(fā)明上述實(shí)施例的技術(shù)方案,能夠在按照性別對(duì)影片分類后,對(duì)每類性別的影片進(jìn)行進(jìn)一步的用戶年齡段的分類,使得對(duì)電視用戶家庭的家庭成員的分析更加細(xì)化和準(zhǔn)確。
第三實(shí)施例
參照?qǐng)D3,根據(jù)本發(fā)明的一個(gè)實(shí)施例,還提供了一種基于電視的家庭成員的分析裝置,該裝置包括:
獲取模塊31,用于獲取電視用戶家庭在預(yù)定時(shí)間段內(nèi)所觀看的電視影片的第一影片記錄;
第一聚類模塊32,用于依據(jù)所述第一影片記錄中每部影片的觀眾性別傾向數(shù)據(jù),對(duì)所述第一影片記錄內(nèi)的影片按照性別進(jìn)行聚類操作,確定所述電視用戶家庭的用戶性別以及每個(gè)用戶性別所對(duì)應(yīng)的第二影片記錄;
第二聚類模塊33,用于依據(jù)所述第二影片記錄中每部影片的觀眾年齡段傾向數(shù)據(jù),對(duì)所述第二影片記錄內(nèi)的影片按照年齡段進(jìn)行聚類操作,確定所述電視用戶家庭的每個(gè)用戶性別的用戶群的年齡分布。
第四實(shí)施例
根據(jù)本發(fā)明的一個(gè)實(shí)施例,還提供了一種基于電視的家庭成員的分析裝置,該裝置包括:
獲取模塊,用于獲取電視用戶家庭在預(yù)定時(shí)間段內(nèi)所觀看的電視影片的第一影片記錄;
第一聚類模塊,用于依據(jù)所述第一影片記錄中每部影片的觀眾性別傾向數(shù)據(jù),對(duì)所述第一影片記錄內(nèi)的影片按照性別進(jìn)行聚類操作,確定所述電視用戶家庭的用戶性別以及每個(gè)用戶性別所對(duì)應(yīng)的第二影片記錄;
其中,所述第一聚類模塊包括:
第一聚類子模塊,用于依據(jù)所述第一影片記錄中每部影片的觀眾性別傾向數(shù)據(jù),對(duì)所述第一影片記錄內(nèi)的影片按照性別進(jìn)行聚類操作,得到兩個(gè)性別聚類結(jié)果簇;
性別分類子模塊,用于對(duì)所述兩個(gè)性別聚類結(jié)果簇分別進(jìn)行性別分類操作,確定每個(gè)性別聚類結(jié)果簇的性別傾向;
第一確定子模塊,用于根據(jù)每個(gè)性別聚類結(jié)果簇的性別傾向,確定所述電視用戶家庭的用戶性別以及每個(gè)用戶性別所對(duì)應(yīng)的第二影片記錄。
其中,所述第一聚類子模塊包括:
第一建模單元,用于依據(jù)所述第一影片記錄中每部影片的觀眾性別傾向數(shù)據(jù),對(duì)所述第一影片記錄建立性別維度的空間向量模型;
第一聚類單元,用于依據(jù)所述性別維度的空間向量模型,對(duì)所述第一影片記錄內(nèi)的影片按照性別進(jìn)行聚類操作,得到兩個(gè)性別聚類結(jié)果簇。
第二聚類模塊,用于依據(jù)所述第二影片記錄中每部影片的觀眾年齡段傾向數(shù)據(jù),對(duì)所述第二影片記錄內(nèi)的影片按照年齡段進(jìn)行聚類操作,確定所述電視用戶家庭的每個(gè)用戶性別的用戶群的年齡分布。
其中,所述第二聚類模塊包括:
第二聚類子模塊,用于依據(jù)所述第二影片記錄中每部影片的觀眾年齡段傾向數(shù)據(jù),對(duì)所述第二影片記錄內(nèi)的影片按照年齡段進(jìn)行聚類操作,得到多個(gè)年齡段的年齡聚類結(jié)果簇;
年齡分類子模塊,用于對(duì)所述多個(gè)年齡段的年齡聚類結(jié)果簇分別進(jìn)行年齡段分類操作,確定每個(gè)年齡段的年齡聚類結(jié)果簇的年齡段傾向;
第二確定子模塊,用于根據(jù)每個(gè)年齡段聚類結(jié)果簇的年齡段傾向,確定所述電視用戶家庭的每個(gè)用戶性別的用戶群的年齡段分布。
其中,所述第二聚類子模塊包括:
第二建模單元,用于依據(jù)所述第二影片記錄中每部影片的觀眾年齡段傾向數(shù)據(jù),對(duì)所述第二影片記錄建立年齡段維度的空間向量模型;
第二聚類單元,用于依據(jù)所述年齡段維度的空間向量模型,對(duì)所述第二影片記錄內(nèi)的影片按照年齡段進(jìn)行聚類操作,得到多個(gè)年齡段的年齡聚類結(jié)果簇。
合并模塊,用于將年齡段傾向相同的年齡段聚類結(jié)果簇進(jìn)行合并。
借助于本發(fā)明實(shí)施例的上述技術(shù)方案,本發(fā)明實(shí)施例通過(guò)對(duì)某段時(shí)間內(nèi)電視用戶家庭的觀影記錄以及觀影記錄中每部影片的性別傾向數(shù)據(jù)和年齡段傾向數(shù)據(jù)來(lái)對(duì)該電視用戶家庭的家庭成員構(gòu)成情況進(jìn)行分析。其中,用于分析的數(shù)據(jù)源為真實(shí)準(zhǔn)確的信息,而非傳統(tǒng)技術(shù)中依據(jù)問(wèn)卷調(diào)查和用戶信息注冊(cè)的真實(shí)度無(wú)法保證的數(shù)據(jù)源。從而能夠借助于真實(shí)準(zhǔn)確的數(shù)據(jù)源來(lái)對(duì)電視用戶家庭的家庭成員分析更加接近于真實(shí)情況,準(zhǔn)確度更高。并且,首先對(duì)電視用戶家庭的性別進(jìn)行分析,得到對(duì)應(yīng)于不同性別的兩類觀影記錄;然后,再對(duì)每個(gè)觀影聚類的觀眾年齡進(jìn)行分析,從而確定該電視用戶家庭的用戶數(shù)量以及年齡分布,分析結(jié)果更加細(xì)化和準(zhǔn)確。
本發(fā)明實(shí)施例中可以通過(guò)硬件處理器(hardware processor)來(lái)實(shí)現(xiàn)相關(guān)功能模塊。
以上所描述的裝置實(shí)施例僅僅是示意性的,其中所述作為分離部件說(shuō)明的單元可以是或者也可以不是物理上分開(kāi)的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來(lái)實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性的勞動(dòng)的情況下,即可以理解并實(shí)施。
通過(guò)以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到各實(shí)施方式可借助軟件加必需的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn),當(dāng)然也可以通過(guò)硬件?;谶@樣的理解,上述技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品可以存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,如ROM/RAM、磁碟、光盤(pán)等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。
最后應(yīng)說(shuō)明的是:以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。