文章熱度的預(yù)測方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及文本分析技術(shù)領(lǐng)域,尤其涉及一種文章熱度的預(yù)測方法和裝置。
【背景技術(shù)】
[0002] 互聯(lián)網(wǎng)時代,每個人都可以在互聯(lián)網(wǎng)上各抒己見。隨之而來的問題是一些不法分 子利用網(wǎng)絡(luò)輿論導(dǎo)向來達(dá)到其個人目的。所以,需要對網(wǎng)絡(luò)輿論進(jìn)行一些監(jiān)測及預(yù)測,防止 網(wǎng)絡(luò)輿論被不法分子利用。文章熱度是衡量一篇網(wǎng)絡(luò)文章、博客等各種網(wǎng)絡(luò)文字在一段時 間內(nèi)的閱讀、評論以及轉(zhuǎn)發(fā)等情況,描述了網(wǎng)絡(luò)文字的影響力,是輿情分析的重要一環(huán)。
[0003] -般來說,常規(guī)的文章熱度預(yù)測是通過搜集一段時間內(nèi)的歷史文章數(shù)據(jù),根據(jù)歷 史數(shù)據(jù)進(jìn)行大數(shù)據(jù)分析,使用回歸算法對文章的熱度進(jìn)行模型擬合,將得到的模型用于新 文章的熱度預(yù)測分析。
[0004]但是,由于文章內(nèi)容的多樣性,簡單使用回歸模型進(jìn)行預(yù)測,獲得的文章熱度的準(zhǔn) 確度較低,不利于網(wǎng)絡(luò)輿論的預(yù)測。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
[0006] 為此,本發(fā)明的第一個目的在于提出一種文章熱度的預(yù)測方法。該方法在對用戶 發(fā)表的文章進(jìn)行聚類判斷之后,再根據(jù)上述文章所屬的類別對上述文章的熱度進(jìn)行預(yù)測, 提高了文章熱度預(yù)測的準(zhǔn)確度。
[0007] 本發(fā)明的第二個目的在于提出一種文章熱度的預(yù)測裝置。
[0008] 為了實(shí)現(xiàn)上述目的,本發(fā)明第一方面實(shí)施例的文章熱度的預(yù)測方法,包括:根據(jù)用 戶在當(dāng)前時刻之前的預(yù)定時間長度內(nèi)發(fā)表的歷史文章的關(guān)鍵詞,為所述用戶最新發(fā)表的文 章生成第一矢量,所述第一矢量的維度等于所述關(guān)鍵詞的個數(shù),所述第一矢量中各維度的 值分別對應(yīng)每個關(guān)鍵詞在所述用戶最新發(fā)表的文章中的出現(xiàn)情況;通過聚類模型對所述第 一矢量進(jìn)行聚類判斷,獲得所述用戶最新發(fā)表的文章所屬的類別;通過所述用戶最新發(fā)表 的文章所屬類別的回歸模型對所述用戶最新發(fā)表的文章的熱度值進(jìn)行預(yù)測。
[0009] 本發(fā)明實(shí)施例的文章熱度的預(yù)測方法,根據(jù)用戶在當(dāng)前時刻之前的預(yù)定時間長度 內(nèi)發(fā)表的歷史文章的關(guān)鍵詞,為上述用戶最新發(fā)表的文章生成第一矢量,然后通過聚類模 型對上述第一矢量進(jìn)行聚類判斷,獲得上述用戶最新發(fā)表的文章所屬的類別,最后通過上 述用戶最新發(fā)表的文章所屬類別的回歸模型對上述用戶最新發(fā)表的文章的熱度值進(jìn)行預(yù) 測,從而可以實(shí)現(xiàn)在對用戶發(fā)表的文章進(jìn)行聚類判斷之后,再根據(jù)上述文章所屬的類別對 上述文章的熱度值進(jìn)行預(yù)測,提高了文章熱度預(yù)測的準(zhǔn)確度。
[0010] 為了實(shí)現(xiàn)上述目的,本發(fā)明第二方面實(shí)施例的文章熱度的預(yù)測裝置,包括:生成模 塊,用于根據(jù)用戶在當(dāng)前時刻之前的預(yù)定時間長度內(nèi)發(fā)表的歷史文章的關(guān)鍵詞,為所述用 戶最新發(fā)表的文章生成第一矢量,所述第一矢量的維度等于所述關(guān)鍵詞的個數(shù),所述第一 矢量中各維度的值分別對應(yīng)每個關(guān)鍵詞在所述用戶最新發(fā)表的文章中的出現(xiàn)情況;聚類模 塊,用于通過聚類模型對所述生成模塊生成的第一矢量進(jìn)行聚類判斷,獲得所述用戶最新 發(fā)表的文章所屬的類別;預(yù)測模塊,用于通過所述用戶最新發(fā)表的文章所屬類別的回歸模 型對所述用戶最新發(fā)表的文章的熱度值進(jìn)行預(yù)測。
[0011] 本發(fā)明實(shí)施例的文章熱度的預(yù)測裝置,生成模塊根據(jù)用戶在當(dāng)前時刻之前的預(yù)定 時間長度內(nèi)發(fā)表的歷史文章的關(guān)鍵詞,為上述用戶最新發(fā)表的文章生成第一矢量,然后聚 類模塊通過聚類模型對上述第一矢量進(jìn)行聚類判斷,獲得上述用戶最新發(fā)表的文章所屬的 類別,最后預(yù)測模塊通過上述用戶最新發(fā)表的文章所屬類別的回歸模型對上述用戶最新發(fā) 表的文章的熱度值進(jìn)行預(yù)測,從而可以實(shí)現(xiàn)在對用戶發(fā)表的文章進(jìn)行聚類判斷之后,再根 據(jù)上述文章所屬的類別對上述文章的熱度值進(jìn)行預(yù)測,提高了文章熱度預(yù)測的準(zhǔn)確度。
[0012] 本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變 得明顯,或通過本發(fā)明的實(shí)踐了解到。
【附圖說明】
[0013] 本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對實(shí)施例的描述中將變得 明顯和容易理解,其中:
[0014] 圖1為本發(fā)明文章熱度的預(yù)測方法一個實(shí)施例的流程圖;
[0015] 圖2為本發(fā)明文章熱度的預(yù)測方法另一個實(shí)施例的流程圖;
[0016] 圖3為本發(fā)明文章熱度的預(yù)測方法再一個實(shí)施例的流程圖;
[0017] 圖4為本發(fā)明文章熱度的預(yù)測方法再一個實(shí)施例的流程圖;
[0018] 圖5為本發(fā)明文章熱度的預(yù)測方法再一個實(shí)施例的流程圖;
[0019] 圖6為本發(fā)明文章熱度的預(yù)測方法再一個實(shí)施例的流程圖;
[0020] 圖7為本發(fā)明文章熱度的預(yù)測方法再一個實(shí)施例的流程圖;
[0021] 圖8為本發(fā)明文章熱度的預(yù)測裝置一個實(shí)施例的結(jié)構(gòu)示意圖;
[0022] 圖9為本發(fā)明文章熱度的預(yù)測裝置另一個實(shí)施例的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0023] 下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終 相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對本發(fā)明的限制。相反,本 發(fā)明的實(shí)施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同 物。
[0024] 圖1為本發(fā)明文章熱度的預(yù)測方法一個實(shí)施例的流程圖,如圖1所示,上述文章熱 度的預(yù)測方法可以包括:
[0025] 步驟101,根據(jù)用戶在當(dāng)前時刻之前的預(yù)定時間長度內(nèi)發(fā)表的歷史文章的關(guān)鍵詞, 為上述用戶最新發(fā)表的文章生成第一矢量。
[0026] 其中,上述第一矢量的維度等于上述關(guān)鍵詞的個數(shù),上述第一矢量中各維度的值 分別對應(yīng)每個關(guān)鍵詞在上述用戶最新發(fā)表的文章中的出現(xiàn)情況。
[0027] 舉例來說,假設(shè)上述關(guān)鍵詞的個數(shù)為10,則第一矢量為10維矢量,上述第一矢量中 第一個維度的值表示第一個關(guān)鍵詞是否在上述用戶最新發(fā)表的文章中出現(xiàn),如果出現(xiàn),則 上述第一矢量中第一個維度的值可以為"1",如果未出現(xiàn),則上述第一矢量中第一個維度的 值可以為"〇",以此類推。當(dāng)然,本實(shí)施例并不限定用"Γ表示關(guān)鍵詞在上述用戶最新發(fā)表的 文章中出現(xiàn),用"〇"表示關(guān)鍵詞在上述用戶最新發(fā)表的文章中未出現(xiàn)。
[0028] 其中,上述預(yù)定時間長度可以在具體實(shí)現(xiàn)時根據(jù)系統(tǒng)性能和/或?qū)崿F(xiàn)需求等自行 設(shè)定,本實(shí)施例對上述預(yù)定時間長度的大小不作限定,舉例來說,上述預(yù)定時間長度可以為 6個月。
[0029] 步驟102,通過聚類模型對上述第一矢量進(jìn)行聚類判斷,獲得上述用戶最新發(fā)表的 文章所屬的類別。
[0030] 步驟103,通過上述用戶最新發(fā)表的文章所屬類別的回歸模型對上述用戶最新發(fā) 表的文章的熱度值進(jìn)行預(yù)測。
[0031] 圖2為本發(fā)明文章熱度的預(yù)測方法另一個實(shí)施例的流程圖,如圖2所示,步驟102之 前,還可以包括:
[0032] 步驟201,對上述第一矢量進(jìn)行降維處理。
[0033]具體地,可以使用主成分分析等特征提煉方法,對第一矢量進(jìn)行降維處理。
[0034] 圖3為