技術特征:1.一種挖掘電視觀看模式的數(shù)據(jù)處理系統(tǒng),其特征在于,包括數(shù)據(jù)收集模塊,用于收集電視節(jié)目的觀看歷史數(shù)據(jù);數(shù)據(jù)過濾模塊,用于從數(shù)據(jù)收集模塊收集的電視節(jié)目的觀看歷史數(shù)據(jù)中過濾識別出用戶的觀看歷史數(shù)據(jù),將噪聲數(shù)據(jù)濾除;數(shù)據(jù)挖掘與特征分類模塊,用于通過對存儲有用戶觀看歷史和電視節(jié)目信息的內(nèi)容數(shù)據(jù)庫進行數(shù)據(jù)挖掘與數(shù)據(jù)特征分類,找出用戶的觀看信息,并將特征分類后的用戶觀看信息形成一個聚類集;分析模塊,用于分析用戶觀看歷史內(nèi)容特征和從數(shù)據(jù)挖掘與特征分類模塊獲取到的聚類集,從中選擇分類,獲取代表原始用戶行為內(nèi)容歷史的觀看歷史數(shù)據(jù)集;模式挖掘模塊,用于從分析模塊獲取的觀看歷史數(shù)據(jù)集中發(fā)掘出用戶觀看模式集;所述模式集中模式數(shù)量與分類數(shù)量相關,將所述觀看歷史數(shù)據(jù)集用時間帶劃分的方法進行分類,將一個完整的時間劃分成若干個時間帶,時間帶的劃分由家庭來確定,不同的家庭時間帶劃分不同;其中,所述模式挖掘模塊包括:用戶觀看模式分析模塊,用于將所述觀看歷史數(shù)據(jù)集進行數(shù)學模型化,生成用戶的觀看歷史數(shù)據(jù)集,并對觀看歷史數(shù)據(jù)集進行重新架構;對比模塊,用于對比觀看歷史數(shù)據(jù)集和用戶觀看模式分析模塊重新架構的觀看歷史數(shù)據(jù)集,找出最優(yōu)的用戶觀看模式組合。2.一種挖掘電視觀看模式的數(shù)據(jù)處理方法,其特征在于,包括以下步驟:A、數(shù)據(jù)收集模塊預先收集電視節(jié)目的觀看歷史數(shù)據(jù),并通過數(shù)據(jù)過濾模塊從中過濾識別出用戶的觀看歷史數(shù)據(jù),濾掉噪聲數(shù)據(jù);B、數(shù)據(jù)挖掘與特征分類模塊通過對存儲有用戶觀看歷史和電視節(jié)目信息的內(nèi)容數(shù)據(jù)庫進行數(shù)據(jù)挖掘與數(shù)據(jù)特征分類,找出用戶的觀看信息,并將特征分類后的用戶觀看信息形成一個聚類集;C、分析模塊通過分析用戶觀看歷史內(nèi)容特征和從上一步獲取到的聚類集,從中選擇分類,獲取代表原始用戶行為內(nèi)容歷史的觀看歷史數(shù)據(jù)集;D、模式挖掘模塊從分析模塊獲取的觀看歷史數(shù)據(jù)集中發(fā)掘出用戶觀看模式集;所述模式集中模式數(shù)量與分類數(shù)量相關,將所述觀看歷史數(shù)據(jù)集用時間帶劃分的方法進行分類,將一個完整的時間劃分成若干個時間帶,時間帶的劃分由家庭來確定,不同的家庭時間帶劃分不同;模式挖掘模塊對所述觀看歷史數(shù)據(jù)集進行重新架構,通過對比觀看歷史數(shù)據(jù)集和重新架構的觀看歷史數(shù)據(jù)集,確定最優(yōu)的用戶觀看模式集,并輸出。3.根據(jù)權利要求2所述的挖掘電視觀看模式的數(shù)據(jù)處理方法,其特征在于,所述步驟D具體包括:D1、將所述觀看歷史數(shù)據(jù)集進行如下定義:指定N為用戶特定的時間段的長度,{Vi}(i=0,1,…,N-1)是第i個時間點觀看歷史數(shù)據(jù)集;將用戶觀看模式定義為P(c,s,n,m,p),其中,c表示內(nèi)容類別,s表示用戶觀看模式開始時間點,且s∈{0,1,…,N-1};n是用戶觀看行為發(fā)生周期的長度,且n∈{1,2,…,N/2};m表示周期重復次數(shù),且m∈{1,…,N/n};p表示模式字符串長度,且p∈{1,…,n};定義{Pr(c,s,n,m,p)}(r=0,1,…,R-1)為用戶觀看模式的結果集,并通過所述結果集對觀看歷史數(shù)據(jù)集進行重新架構,結果定義為其中,R表示從歷史數(shù)據(jù)中找出來的具有代表性的模式數(shù)量;D2、對比觀看歷史數(shù)據(jù)集{Vi}和重新架構的觀看歷史數(shù)據(jù)集找出差異最小的并通過確定最優(yōu)的用戶觀看模式。4.根據(jù)權利要求3所述的挖掘電視觀看模式的數(shù)據(jù)處理方法,其特征在于,對比觀看歷史數(shù)據(jù)集{Vi}和重新架構的觀看歷史數(shù)據(jù)集的步驟具體還包括:定義觀看歷史數(shù)據(jù)集{Vi}和重新架構的觀看歷史數(shù)據(jù)集的差異為失真度,并定義表達式量化衡量失真度,其中,5.根據(jù)權利要求4所述的挖掘電視觀看模式的數(shù)據(jù)處理方法,其特征在于,當失真度最小時,觀看歷史數(shù)據(jù)集{Vi}和重新架構的觀看歷史數(shù)據(jù)集的差異最小,其中失真度最小為滿足R≤RThreshold,RThreshold是模式數(shù)量限制條件。6.根據(jù)權利要求4所述的挖掘電視觀看模式的數(shù)據(jù)處理方法,其特征在于,所述步驟D還采用拉格朗日乘子法實現(xiàn),定義拉格朗日函數(shù)其中,λ為拉格朗日乘子,確定一個λ*,使u*=arg[minuJλ(u)],且滿足R(u*)=RThreshold,u*表示滿足R≤RThreshold的最優(yōu)解。7.根據(jù)權利要求6所述的挖掘電視觀看模式的數(shù)據(jù)處理方法,其特征在于,所述步驟D還包括:定義決策點向量U,而uk代表第k項決策點向量集(uk={(c,s,n,m,p)k,o}(o代表模式總數(shù)),以及定義代價函數(shù)Gk(uk-q,…,uk),表示第k項的最小代價,而GN(uN-q,…,uN)表示最后一項所需最小代價;根據(jù)給定q+1個決策向量集uk-q-1,…,uk-1計算出到uk-1項的代價函數(shù)Gk-1(uk-q-1,…,uk-1)的值,而到uk項的代價函數(shù)值不依賴u1,u2,…,uk-q-1的向量集,確定最優(yōu)的用戶觀看模式數(shù)量。8.根據(jù)權利要求2所述的挖掘電視觀看模式的數(shù)據(jù)處理方法,其特征在于,采用K-means算法對所述內(nèi)容數(shù)據(jù)庫進行數(shù)據(jù)特征分類。9.根據(jù)權利要求2所述的挖掘電視觀看模式的數(shù)據(jù)處理方法,其特征在于,通過主成分分析的方法分析用戶觀看歷史內(nèi)容特征。