亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于特征子空間的新聞分類方法及系統(tǒng)的制作方法

文檔序號:9304650閱讀:428來源:國知局
一種基于特征子空間的新聞分類方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及自然語言處理及模式識別技術(shù)領(lǐng)域,特別是涉及一種基于特征子空間 的新聞分類方法和系統(tǒng)。
【背景技術(shù)】
[0002] 當今,用戶可以通過網(wǎng)絡對新聞中的人物、事件和現(xiàn)象等表達自己的觀點和態(tài)度。 在用戶的活動中,用戶對事物的態(tài)度往往與用戶的情緒傾向是緊密聯(lián)系的,也就是說可以 從用戶的情緒傾向觀察到用戶對事物的觀點傾向。其中,情緒傾向是指用戶內(nèi)在的心理反 應與感受的傾向性,即積極情緒傾向或消極情緒傾向。
[0003] 現(xiàn)有技術(shù)中,對于新聞的分類,通常是利用主題分類技術(shù)對新聞進行分類、管理和 檢索的,例如基于新聞的主題(如體育、經(jīng)濟、娛樂、政治等)對新聞進行分類、管理和檢索。 然而,在實際生活中,針對不同主題的新聞,用戶產(chǎn)生的情緒傾向也會不同,而現(xiàn)有技術(shù)中 并不存在基于情緒傾向性對新聞進行分類的技術(shù)方案,因此,不能滿足用戶按自己的情緒 傾向來查找新聞的需求,從而降低了用戶瀏覽新聞時的體驗度。
[0004] 綜上所述可以看出,如何實現(xiàn)對新聞進行情緒傾向性分類,從而改善用戶瀏覽新 聞時的用戶體驗是目前亟待解決的問題。其中,對新聞進行情緒傾向性分類是指:按用戶看 至IJ新聞時的情緒傾向?qū)⑿侣剺擞洖槟撤N情緒傾向類別的新聞。

【發(fā)明內(nèi)容】

[0005] 有鑒于此,本發(fā)明提供了一種基于特征子空間的新聞分類方法和系統(tǒng),以實現(xiàn)對 新聞進行情緒傾向性分類,從而提高用戶瀏覽新聞時的體驗度的目的。
[0006] 為解決上述技術(shù)問題,本發(fā)明提供一種基于特征子空間的新聞分類方法,包括:
[0007] 將已標注樣本的整個特征空間劃分為若干個不相交的特征子空間,并對若干個不 相交的特征子空間中各個特征子空間進行訓練,得到與所述各個特征子空間對應的子分類 器;其中,所述已標注樣本為已知情緒傾向類別的樣本;
[0008] 利用訓練得到的子分類器對未標注樣本進行分類,得到所述未標注樣本的情緒傾 向類別,并將已知情緒傾向類別的所述未標注樣本更新至標注樣本集中;
[0009] 利用所述標注樣本集構(gòu)建情緒傾向分類器,并利用構(gòu)建的情緒傾向分類器對待分 類新聞的情緒傾向類別進行分類,得到所述待分類新聞的情緒傾向類別;
[0010] 其中,所述情緒傾向類別包括積極情緒類別和消極情緒類別。
[0011] 優(yōu)選的,所述將已知情緒傾向類別的所述未標注樣本更新至標注樣本集中,包 括:
[0012] 將情緒傾向類別對應的置信度最高的所述未標注樣本更新至所述標注樣本集中, 迭代上述更新過程直至所有所述未標注樣本更新至所述標注樣本集中。
[0013] 優(yōu)選的,將相同數(shù)量的積極情緒類別的所述未標注樣本和消極情緒類別的所述未 標注樣本更新至所述標注樣本集中。
[0014]優(yōu)選的,利用機器學習分類算法對所述若干個不相交的特征子空間中各個特征子 空間進行訓練,得到與所述各個特征子空間對應的子分類器。
[0015]優(yōu)選的,所述機器學習分類算法為樸素貝葉斯分類算法。
[0016]優(yōu)選的,所述利用構(gòu)建的情緒傾向分類器對待分類新聞的情緒傾向類別進行分 類,得到所述待分類新聞的情緒傾向類別,包括:
[0017]利用構(gòu)建的情緒傾向分類器對待分類新聞的情緒傾向類別進行分類,得到分類結(jié) 果;其中,所述分類結(jié)果包括與任一情緒傾向類別對應的后驗概率,所述與任一情緒傾向類 別對應的后驗概率表示所述待分類新聞含有該情緒傾向類別的后驗概率;
[0018]判斷所述積極情緒類別對應的后驗概率是否大于所述消極情緒類別對應的后驗 概率,如果是,則判定所述待分類新聞的情緒傾向類別為積極情緒類別,否則,判定所述待 分類新聞的情緒傾向類別為消極情緒類別。
[0019]本發(fā)明還提供了一種基于特征子空間的新聞分類系統(tǒng),包括:
[0020] 子分類器確定單元,用于將已標注樣本的整個特征空間劃分為若干個不相交的特 征子空間,并對所述若干個不相交的特征子空間中各個特征子空間進行訓練,得到與所述 各個特征子空間對應的子分類器;其中,所述已標注樣本為已知情緒傾向類別的樣本;
[0021] 標注樣本集更新單元,用于利用訓練得到的子分類器對未標注樣本進行分類,得 到所述未標注樣本的情緒傾向類別,并將已知情緒傾向類別的所述未標注樣本更新至標注 樣本集中;
[0022] 分類單元,用于利用所述標注樣本集構(gòu)建情緒傾向分類器,并利用構(gòu)建的情緒傾 向分類器對待分類新聞的情緒傾向類別進行分類,得到所述待分類新聞的情緒傾向類別;
[0023]其中,所述情緒傾向類別包括積極情緒類別和消極情緒類別。
[0024]以上本發(fā)明提供的一種基于特征子空間的新聞分類方法及系統(tǒng)中,新聞的情緒傾 向類別包括積極和消極兩種,最開始就已知情緒傾向類別的樣本稱為已標注樣本,反之,最 開始未知情緒傾向類別的樣本稱為未標注樣本,基于此,首先,將已標注樣本的整個特征空 間劃分為若干個不相交的特征子空間,并對這些特征子空間中各個特征子空間進行訓練, 得到對應的子分類器;然后,利用訓練得到的子分類器對未標注樣本進行分類,并將已知情 緒傾向類別的未標注樣本更新至標注樣本集中;最后,利用最終更新好的標注樣本集構(gòu)建 情緒傾向分類器,并利用構(gòu)建的情緒傾向分類器對待分類新聞的情緒傾向類別進行分類, 得到待分類新聞的情緒傾向類別。當獲知待分類新聞的情緒傾向類別后,可以將待分類新 聞劃分到其含有的情緒傾向類別對應的新聞中,從而提高了用戶瀏覽新聞時的體驗度。
【附圖說明】
[0025]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù) 提供的附圖獲得其他的附圖。
[0026] 圖1為本發(fā)明一種基于特征子空間的新聞分類方法實施例1的流程圖;
[0027]圖2為本發(fā)明一種基于特征子空間的新聞分類方法實施例2的流程圖;
[0028]圖3為本發(fā)明一種基于特征子空間的新聞分類系統(tǒng)實施例1的結(jié)構(gòu)框圖示意圖。
【具體實施方式】
[0029] 下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;?本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。
[0030] 本發(fā)明的核心是提供一種基于特征子空間的新聞分類方法和系統(tǒng),以實現(xiàn)對新聞 進行情緒傾向性分類,從而提高用戶瀏覽新聞時的體驗度的目的。
[0031] 在發(fā)明中,新聞的情緒傾向類別可以是每個用戶看到同一篇新聞時產(chǎn)生的情緒傾 向,當然,也可以統(tǒng)計看到同一篇新聞時產(chǎn)生某一相同情緒傾向的用戶數(shù)量占看到該新聞 的所有用戶數(shù)量的比例,當該比例較大時,認為該新聞含有相應的情緒傾向類別,否則,認 為含其它相應的情緒傾向類別。所有用戶數(shù)量可以設定為一定數(shù)量,例如可以是1〇〇〇人, 而無需設定為某個市或者某個省的全部人口數(shù)量,否則會提高計算時間,降低效率。
[0032] 本發(fā)明中,新聞的情緒傾向類別可
當前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1