基于標(biāo)簽熱度的智能電影排名和評價系統(tǒng)的制作方法
【專利說明】基于標(biāo)簽熱度的智能電影排名和評價系統(tǒng)
[0001]
技術(shù)領(lǐng)域
[0002]本發(fā)明涉及數(shù)據(jù)處理領(lǐng)域,具體地,涉及一種基于標(biāo)簽熱度的智能電影排名和評價系統(tǒng)。
【背景技術(shù)】
[0003]互聯(lián)網(wǎng)為廣大用戶提供了海量的影視資源,越來越多的電影網(wǎng)站和應(yīng)用應(yīng)運(yùn)而生。以百度電影榜單首頁為例,提供了和電影相關(guān)的信息如發(fā)行公司、編劇、導(dǎo)演和演員等,搜索演員得到的結(jié)果往往只是其作品的羅列,缺少適合用戶需求的電影排序和評價,對于許多希望得到一個導(dǎo)演或者演員的作品具體排序的用戶來說,需求難以滿足。對于觀眾來說,由于網(wǎng)絡(luò)廣告和營銷,觀眾很難挑選一部真正喜歡看的影視節(jié)目。
[0004]在線觀看電影為廣大觀眾提供了方便,許多大型電影網(wǎng)站提供了十分豐富的電影資源。然而,由于網(wǎng)絡(luò)中信息的爆炸性增長,資源數(shù)量龐大,用戶不得不花費(fèi)大量時間搜索自己感興趣的電影,如何幫助用戶快速找到其想要的資源成為大型電影網(wǎng)站的重要需求。電影標(biāo)簽體現(xiàn)了用戶從自己的角度概括網(wǎng)絡(luò)資源內(nèi)容的著重點(diǎn)或者興趣點(diǎn),往往能夠較真實地反映大眾的觀感。對標(biāo)簽這樣一種新的數(shù)據(jù)源進(jìn)行分析和挖掘,能夠?qū)崿F(xiàn)有效的搜索頁面排名,從而提高用戶的搜索滿意度。
【發(fā)明內(nèi)容】
[0005]本發(fā)明的目的在于,針對上述問題,提出一種基于標(biāo)簽熱度的智能電影排名和評價系統(tǒng),以實現(xiàn)用戶可方便快捷的得到影視節(jié)目的排名和評價信息的優(yōu)點(diǎn)。
[0006]為實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是:
一種基于標(biāo)簽熱度的智能電影排名和評價系統(tǒng),包括,客戶端、服務(wù)器和數(shù)據(jù)庫;
所述服務(wù)器:從影視節(jié)目中提取標(biāo)簽,將提取的標(biāo)簽信息保存至數(shù)據(jù)庫,并對數(shù)據(jù)庫內(nèi)保存的標(biāo)簽進(jìn)行去噪處理,然后對經(jīng)過去噪處理后的標(biāo)簽進(jìn)行排序,根據(jù)排序結(jié)果推送影視節(jié)目信息至客戶端;
所述客戶端:接收服務(wù)器推送的影視節(jié)目信息;
所述數(shù)據(jù)庫:保存標(biāo)簽信息。
[0007]優(yōu)選的,所述客戶端:包括智能手機(jī)、平板電腦或PC。
[0008]同時本發(fā)明技術(shù)方案還公開一種基于標(biāo)簽熱度的智能電影排名和評價方法,包括以下步驟:
從影視節(jié)目中提取影視標(biāo)簽的步驟,下文影視標(biāo)簽簡稱為標(biāo)簽;
建立標(biāo)簽數(shù)據(jù)庫,并將上述提取的標(biāo)簽保存至標(biāo)簽數(shù)據(jù)庫的步驟;
對標(biāo)簽數(shù)據(jù)庫內(nèi)保存的標(biāo)簽進(jìn)行去噪處理的步驟;
對上述經(jīng)過去噪處理后的標(biāo)簽進(jìn)行排序的步驟; 根據(jù)上述排序結(jié)果推送影視節(jié)目信息的步驟。
[0009]優(yōu)選的,上述從影視節(jié)目中提取影視標(biāo)簽的步驟中,具體利用爬取技術(shù)和分詞技術(shù)提取影視標(biāo)簽。
[0010]優(yōu)選的,上述對經(jīng)過去噪處理后的標(biāo)簽進(jìn)行排序的步驟具體為:
首先確定時間單位,計算每個標(biāo)簽在時間單位內(nèi)被標(biāo)注的次數(shù).然后計算每個時間單位內(nèi)該標(biāo)簽的熱度P1,根據(jù)標(biāo)簽的熱度P1求出該標(biāo)簽最終對應(yīng)的熱度因子P,再依據(jù)熱度因子P值,確定標(biāo)簽排序值。
[0011]優(yōu)選的,對標(biāo)簽進(jìn)行排序的步驟中,影響標(biāo)簽排序的參數(shù)包括,電視收視率、網(wǎng)絡(luò)播放量、微博話題關(guān)注人數(shù)或閱讀量。
[0012]優(yōu)選的,推送影視節(jié)目信息的步驟中,推送的影視節(jié)目信息包括,影視節(jié)目播出信息、演職員信息以及與影視相關(guān)的文字、圖片或視頻信息。
[0013]本發(fā)明的技術(shù)方案具有以下有益效果:
本發(fā)明的技術(shù)方案,基于標(biāo)簽熱度的進(jìn)行智能電影排名和評價??梢曰谀壳暗臉?biāo)簽熱度幫助觀眾挑選時下熱門、觀眾真正喜歡觀看的影視節(jié)目,提升用戶使用感受。達(dá)到用戶可方便快捷的得到影視節(jié)目的排名和評價信息的目的。
[0014]下面通過附圖和實施例,對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
【附圖說明】
[0015]圖1為本發(fā)明實施例所述的基于標(biāo)簽熱度的智能電影排名和評價方法的流程圖;
圖2為本發(fā)明實施例所述的基于標(biāo)簽熱度的智能電影排名和評價的原理框圖;
圖3為本發(fā)明實施例所述的數(shù)據(jù)處理框圖。
【具體實施方式】
[0016]以下結(jié)合附圖對本發(fā)明的優(yōu)選實施例進(jìn)行說明,應(yīng)當(dāng)理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。
[0017]如圖1所示,一種基于標(biāo)簽熱度的智能電影排名和評價方法,包括以下步驟:
從影視節(jié)目中提取影視標(biāo)簽的步驟,下文影視標(biāo)簽簡稱為標(biāo)簽;
建立標(biāo)簽數(shù)據(jù)庫,并將上述提取的標(biāo)簽保存至標(biāo)簽數(shù)據(jù)庫的步驟;
對標(biāo)簽數(shù)據(jù)庫內(nèi)保存的標(biāo)簽進(jìn)行去噪處理的步驟;
對上述經(jīng)過去噪處理后的標(biāo)簽進(jìn)行排序的步驟;
根據(jù)上述排序結(jié)果推送影視節(jié)目信息的步驟。
[0018]優(yōu)選的,從影視節(jié)目中提取影視標(biāo)簽的步驟中,具體利用爬取技術(shù)和分詞技術(shù)提取影視標(biāo)簽。
[0019]優(yōu)選的,對經(jīng)過去噪處理后的標(biāo)簽進(jìn)行排序的步驟具體為:
首先確定時間單位,計算每個標(biāo)簽在時間單位內(nèi)被標(biāo)注的次數(shù).然后計算每個時間單位內(nèi)該標(biāo)簽的熱度P1,根據(jù)標(biāo)簽的熱度P1求出該標(biāo)簽最終對應(yīng)的熱度因子P,再依據(jù)熱度因子P值,確定標(biāo)簽排序值。
[0020]優(yōu)選的,對標(biāo)簽進(jìn)行排序的步驟中,影響標(biāo)簽排序的參數(shù)包括,電視收視率、網(wǎng)絡(luò)播放量、微博話題關(guān)注人數(shù)或閱讀量。[0021 ]優(yōu)選的,推送影視節(jié)目信息的步驟中,推送的影視節(jié)目信息包括,影視節(jié)目播出信息、演職員信息以及與影視相關(guān)的文字、圖片或視頻信息。
[0022]如圖2所示,一種基于標(biāo)簽熱度的智能電影排名和評價系統(tǒng),包括,客戶端、服務(wù)器和數(shù)據(jù)庫;
服務(wù)器:從影視節(jié)目中提取標(biāo)簽,將提取的標(biāo)簽信息保存至數(shù)據(jù)庫,并對數(shù)據(jù)庫內(nèi)保存的標(biāo)簽進(jìn)行去噪處理,然后對經(jīng)過去噪處理后的標(biāo)簽進(jìn)行排序,根據(jù)排序結(jié)果推送影視節(jié)目信息至客戶端;
客戶端:接收服務(wù)器推送的影視節(jié)目信息;
數(shù)據(jù)庫:保存標(biāo)簽信息。
[0023]其中,客戶端:包括智能手機(jī)、平板電腦或PC。即基于Android、1S、WP和Sybian等系統(tǒng)開發(fā)的智能手機(jī)、平板電腦、PC端等終端使用;
本發(fā)明的技術(shù)方案具體為:
1.從影視節(jié)目中提取影視標(biāo)簽,標(biāo)簽提取技術(shù)涉及到爬取技術(shù)和分詞技術(shù);
2.建立標(biāo)簽數(shù)據(jù)庫;
3.對標(biāo)簽數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行去噪、預(yù)處理;
4.利用TagRank標(biāo)簽排序算法,包括電視收視率(從央視旗下的CSM公司網(wǎng)站提取),網(wǎng)絡(luò)播放量(從視頻播放器提取),微博話題關(guān)注人數(shù),閱讀量等參考指標(biāo);如圖3所示。
[0024]TagRank算法下,對每個tag對應(yīng)的標(biāo)簽使用TagRank算法.首先以“月”為時間單位,計算每個標(biāo)簽共有多少個“月”時間片及每個時間片下被標(biāo)注的次數(shù).然后計算每個時間片內(nèi)該標(biāo)簽的熱度Pi,根據(jù)Pi求出該標(biāo)簽最終對應(yīng)的熱度因子P,再依據(jù)P值,按TagRank公式確定Tr值。
[0025](特定tag的TagRank值用Tr表示,S卩表示在簡單方法下該標(biāo)簽依據(jù)tag的排名值) 算法描述如下所示:
TagRank ()
Begin
抽取頁面中的tag信息;
標(biāo)簽的預(yù)處理; for標(biāo)簽中所有tag begin
{計算標(biāo)簽中tag被標(biāo)注的次數(shù)并賦初始值;
計算tag在單位時間片內(nèi)的熱度Pi ;
計算tag在單位時間片內(nèi)的熱度因子P ;
計算tag的最終熱度因子P ;
}
end
計算TagRank值 End
5.網(wǎng)頁端影視節(jié)目系統(tǒng)呈現(xiàn)排序算法的結(jié)果,向用戶推薦熱點(diǎn)影視節(jié)目,包括影視節(jié)目相關(guān)播出和演職員信息,相關(guān)的文字,圖片,視頻等。
[0026]其中,計算tag在單位時間片內(nèi)的熱度Pi以及計算tag在單位時間片內(nèi)的熱度因子P均為現(xiàn)有技術(shù)。
[0027]最后應(yīng)說明的是:以上所述僅為本發(fā)明的優(yōu)選實施例而已,并不用于限制本發(fā)明,盡管參照前述實施例對本發(fā)明進(jìn)行了詳細(xì)的說明,對于本領(lǐng)域的技術(shù)人員來說,其依然可以對前述各實施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項】
1.一種基于標(biāo)簽熱度的智能電影排名和評價系統(tǒng),其特征在于,包括,客戶端、服務(wù)器和數(shù)據(jù)庫; 所述服務(wù)器:從影視節(jié)目中提取標(biāo)簽,將提取的標(biāo)簽信息保存至數(shù)據(jù)庫,并對數(shù)據(jù)庫內(nèi)保存的標(biāo)簽進(jìn)行去噪處理,然后對經(jīng)過去噪處理后的標(biāo)簽進(jìn)行排序,根據(jù)排序結(jié)果推送影視節(jié)目信息至客戶端; 所述客戶端:接收服務(wù)器推送的影視節(jié)目信息; 所述數(shù)據(jù)庫:保存標(biāo)簽信息。2.根據(jù)權(quán)利要求1所述的基于標(biāo)簽熱度的智能電影排名和評價系統(tǒng),其特征在于,所述客戶端:包括智能手機(jī)、平板電腦或PC。3.—種基于標(biāo)簽熱度的智能電影排名和評價方法,其特征在于,包括以下步驟: 從影視節(jié)目中提取影視標(biāo)簽的步驟,下文影視標(biāo)簽簡稱為標(biāo)簽; 建立標(biāo)簽數(shù)據(jù)庫,并將上述提取的標(biāo)簽保存至標(biāo)簽數(shù)據(jù)庫的步驟; 對標(biāo)簽數(shù)據(jù)庫內(nèi)保存的標(biāo)簽進(jìn)行去噪處理的步驟; 對上述經(jīng)過去噪處理后的標(biāo)簽進(jìn)行排序的步驟; 根據(jù)上述排序結(jié)果推送影視節(jié)目信息的步驟。4.根據(jù)權(quán)利要求3所述的基于標(biāo)簽熱度的智能電影排名和評價方法,其特征在于,上述從影視節(jié)目中提取影視標(biāo)簽的步驟中,具體利用爬取技術(shù)和分詞技術(shù)提取影視標(biāo)簽。5.根據(jù)權(quán)利要求3或4所述的基于標(biāo)簽熱度的智能電影排名和評價方法,其特征在于,上述對經(jīng)過去噪處理后的標(biāo)簽進(jìn)行排序的步驟具體為: 首先確定時間單位,計算每個標(biāo)簽在時間單位內(nèi)被標(biāo)注的次數(shù).然后計算每個時間單位內(nèi)該標(biāo)簽的熱度P1,根據(jù)標(biāo)簽的熱度P1求出該標(biāo)簽最終對應(yīng)的熱度因子P,再依據(jù)熱度因子P值,確定標(biāo)簽排序值。6.根據(jù)權(quán)利要求5所述的基于標(biāo)簽熱度的智能電影排名和評價方法,其特征在于,對標(biāo)簽進(jìn)行排序的步驟中,影響標(biāo)簽排序的參數(shù)包括,電視收視率、網(wǎng)絡(luò)播放量、微博話題關(guān)注人數(shù)或閱讀量。7.根據(jù)權(quán)利要求3或4所述的基于標(biāo)簽熱度的智能電影排名和評價方法,其特征在于,推送影視節(jié)目信息的步驟中,推送的影視節(jié)目信息包括,影視節(jié)目播出信息、演職員信息以及與影視相關(guān)的文字、圖片或視頻信息。
【專利摘要】本發(fā)明公開了一種基于標(biāo)簽熱度的智能電影排名和評價系統(tǒng),包括,客戶端、服務(wù)器和數(shù)據(jù)庫;服務(wù)器:從影視節(jié)目中提取標(biāo)簽,將提取的標(biāo)簽信息保存至數(shù)據(jù)庫,并對數(shù)據(jù)庫內(nèi)保存的標(biāo)簽進(jìn)行去噪處理,然后對經(jīng)過去噪處理后的標(biāo)簽進(jìn)行排序,根據(jù)排序結(jié)果推送影視節(jié)目信息至客戶端;客戶端:接收服務(wù)器推送的影視節(jié)目信息;數(shù)據(jù)庫:保存標(biāo)簽信息?;跇?biāo)簽熱度的進(jìn)行智能電影排名和評價??梢曰谀壳暗臉?biāo)簽熱度幫助觀眾挑選時下熱門、觀眾真正喜歡觀看的影視節(jié)目,提升用戶使用感受。達(dá)到用戶可方便快捷的得到影視節(jié)目的排名和評價信息的目的。
【IPC分類】G06F17/30
【公開號】CN105550277
【申請?zhí)枴緾N201510909945
【發(fā)明人】劉杉, 柴劍平, 范馨怡, 王芳
【申請人】中國傳媒大學(xué)
【公開日】2016年5月4日
【申請日】2015年12月10日