亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

基于社交網絡的對象分類方法及裝置的制造方法_4

文檔序號:9304560閱讀:來源:國知局
,達到了可以大大降低計算的復雜 度,提高向量空間模型的處理效率以及性能的效果。
[0125]需要說明的是:上述實施例中提供的基于社交網絡的對象分類裝置在進行對象分 類時,僅以上述各功能模塊的劃分進行舉例說明,實際應用中,可以根據需要而將上述功能 分配由不同的功能模塊完成,即將服務器或其他需要進行分類的設備的內部結構劃分成不 同的功能模塊,以完成以上描述的全部或者部分功能。另外,上述實施例提供的基于社交網 絡的對象分類裝置與基于社交網絡的對象分類方法實施例屬于同一構思,其具體實現過程 詳見方法實施例,這里不再贅述。
[0126] 上述本發(fā)明實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。
[0127] 本領域普通技術人員可以理解實現上述實施例的全部或部分步驟可以通過硬件 來完成,也可以通過程序來指令相關的硬件完成,所述的程序可以存儲于一種計算機可讀 存儲介質中,上述提到的存儲介質可以是只讀存儲器,磁盤或光盤等。
[0128] 以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和 原則之內,所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內。
【主權項】
1. 一種基于社交網絡的對象分類方法,其特征在于,所述方法包括: 獲取對象的特征信息; 將所述特征信息表示成語義向量,所述語義向量用于反映各個分詞在所述特征信息中 同時出現時的相關性特征; 將所述對象的特征信息的語義向量輸入預定分類器,得到所述對象被分類后的初始類 別。2. 根據權利要求1所述的方法,其特征在于,所述對象包括用戶和/或群組,在所述將 所述特征信息表示成語義向量之后,還包括: 對于每個對象,利用所述對象的特征信息的語義向量,確定與所述對象對應的預定個 數相似對象; 將所述對象分別與各個所述相似對象組成對象對; 利用所述對象對以及群組與群組中的用戶之間的對應關系構造二分圖; 利用主題模型算法對所述二分圖中的對象進行聚類; 其中,所述二分圖包含至少一組由第一元素和第二元素組成的對應關系,當所述對應 關系的第一元素為一個群組時,則所述第二元素為所述群組中的一個用戶或為與所述群組 在同一組對象對的群組,或,當所述對應關系的第一元素為用戶時,則所述第二元素為與所 述用戶在同一組對象對的用戶。3. 根據權利要求2所述的方法,其特征在于,在所述利用主題模型算法對所述二分圖 中的對象進行聚類之后,還包括: 計算聚類后屬于同一個所述初始類別的對象的數目; 將數目最多的所述初始類別確定為擴散類別; 將所述聚類后其他各個對象的類別均確定為所述擴散類別。4. 根據權利要求2所述的方法,其特征在于,所述利用所述對象的特征信息的語義向 量,確定與所述對象對應的預定個數相似對象,包括: 利用對象的特征信息的語義向量,計算所述對象與其他同類型對象之間的相似度; 按照所述相似度由高到低排序所述同類型對象; 依次從排序后的所述同類型對象中選取預定個數對象,將選取出的所述預定個數對象 確定為所述對象的相似對象。5. 根據權利要求4所述的方法,其特征在于,所述利用對象的特征信息的語義向量,計 算所述對象與其他同類型對象之間的相似度,包括: 計算所述對象的語義向量與其他同類型對象的語義向量之間的余弦夾角值; 將所述余弦夾角值確定為所述相似度。6. 根據權利要求1所述的方法,其特征在于,在所述將所述對象的特征信息的語義向 量輸入預定分類器,得到所述對象被分類后的初始類別之后,還包括: 獲取所述對象在被所述預定分類器分類時所確定的置信度值; 當所述置信度值大于預定置信度閾值時,將所述置信度值所對應的對象歸類為所述分 類器所確定的類別。7. 根據權利要求1至6中任一所述的方法,其特征在于,所述將所述特征信息表示成語 義向量,包括: 利用預存的語料庫,統(tǒng)計出分詞在預定個數指定分詞后出現的概率,所述分詞以及所 述預定個數指定分詞構成所述特征信息; 利用反向傳播算法求解預定數學模型,得到所述特征信息中各個分詞的語義向量; 將同一個特征信息中各個分詞的語義向量相加后歸一化,得到所述特征信息的語義向 量。8. 根據權利要求7所述的方法,其特征在于,所述預定數學模型為: y = softmax(U ? tanh(Hx+d)+ffx+b), 其中,所述y為所述分詞在各個特征信息中出現的概率所組成的矩陣,所述x是所述各 個特征信息中的所述預定個數指定分詞的語義向量首尾相接得到的向量,所述d和b為偏 置項,tanh和softmax均為激活函數,所述U是預定數學模型的隱含層到輸出層的參數,所 述W是從所述預定數學模型的輸入層直接到輸出層的線性變換。9. 一種基于社交網絡的對象分類裝置,其特征在于,所述裝置包括: 第一獲取模塊,用于獲取對象的特征信息; 表示模塊,用于將所述特征信息表示成語義向量,所述語義向量用于反映各個分詞在 所述特征信息中同時出現時的相關性特征; 分類模塊,用于將所述對象的特征信息的語義向量輸入預定分類器,得到所述對象被 分類后的初始類別。10. 根據權利要求9所述的裝置,其特征在于,所述裝置還包括: 第一確定模塊,用于對于每個對象,利用所述對象的特征信息的語義向量,確定與所述 對象對應的預定個數相似對象; 組成模塊,用于將所述對象分別與各個所述相似對象組成對象對; 構造模塊,用于利用所述組成模塊組成的對象對以及群組與群組中的用戶之間的對應 關系構造二分圖; 聚類模塊,用于利用主題模型算法對所述二分圖中的對象進行聚類; 其中,所述二分圖包含至少一組由第一元素和第二元素組成的對應關系,當所述對應 關系的第一元素為一個群組時,則所述第二元素為所述群組中的一個用戶或為與所述群組 在同一組對象對的群組,或,當所述對應關系的第一元素為用戶時,則所述第二元素為與所 述用戶在同一組對象對的用戶。11. 根據權利要求10所述的裝置,其特征在于,所述裝置還包括: 計算模塊,用于計算聚類后屬于同一個所述初始類別的對象的數目; 第二確定模塊,用于將所述計算模塊計算出的數目最多的所述初始類別確定為擴散類 別; 第三確定模塊,用于將所述聚類后其他各個對象的類別均確定為所述擴散類別。12. 根據權利要求10所述的裝置,其特征在于,所述第一確定模塊,包括: 計算單元,用于利用對象的特征信息的語義向量,計算所述對象與其他同類型對象之 間的相似度; 排序單元,用于按照計算單元計算得到的所述相似度由高到低排序所述同類型對象; 確定單元,用于依次從排序后的所述同類型對象中選取預定個數對象,將選取出的所 述預定個數對象確定為所述對象的相似對象。13. 根據權利要求12所述的裝置,其特征在于,所述計算單元,包括: 計算子單元,用于計算所述對象的語義向量與其他同類型對象的語義向量之間的余弦 夾角值; 確定子單元,用于將所述計算子單元計算得到的所述余弦夾角值確定為所述相似度。14. 根據權利要求9所述的裝置,其特征在于,所述裝置還包括: 第二獲取模塊,用于獲取所述對象在被所述預定分類器分類時所確定的置信度值; 歸類模塊,用于當所述置信度值大于預定置信度閾值時,將所述置信度值所對應的對 象歸類為所述分類器所確定的類別。15. 根據權利要求9至14中任一所述的裝置,其特征在于,所述表示模塊,包括: 統(tǒng)計單元,用于利用預存的語料庫,統(tǒng)計出分詞在預定個數指定分詞后出現的概率,所 述分詞以及所述預定個數指定分詞構成所述特征信息; 求解單元,用于利用反向傳播算法求解預定數學模型,得到所述特征信息中各個分詞 的語義向量; 相加單元,用于將同一個特征信息中各個分詞的語義向量相加后歸一化,得到所述特 征信息的語義向量。16. 根據權利要求15所述的裝置,其特征在于,所述預定數學模型為: y = softmax(U ? tanh(Hx+d)+ffx+b), 其中,所述y為所述分詞在各個特征信息中出現的概率所組成的矩陣,所述x是所述各 個特征信息中的所述預定個數指定分詞的語義向量首尾相接得到的向量,所述d和b為偏 置項,tanh和softmax均為激活函數,所述U是預定數學模型的隱含層到輸出層的參數,所 述W是從所述預定數學模型的輸入層直接到輸出層的線性變換。
【專利摘要】本發(fā)明公開了一種基于社交網絡的對象分類方法及裝置,屬于計算機技術領域。所述方法包括:獲取對象的特征信息;將特征信息表示成語義向量,語義向量用于反映各個分詞在特征信息中同時出現時的相關性特征;將對象的特征信息的語義向量輸入預定分類器,得到對象被分類后的初始類別。本發(fā)明通過將對象的特征信息表示成語義向量,將該語義向量輸入預定分類器,得到對象被分類后的初始類別;解決了現有技術中由于用戶信息和群組信息有數億的規(guī)模,空間向量的維度非常大,導致計算的時間復雜度與空間復雜度都非常大,嚴重損害到向量空間模型的處理效率以及性能的問題;達到了可以大大降低計算的復雜度,提高向量空間模型的處理效率以及性能的效果。
【IPC分類】G06F17/30
【公開號】CN105022754
【申請?zhí)枴緾N201410177246
【發(fā)明人】余建興, 易玲玲, 賀鵬, 陳川
【申請人】騰訊科技(深圳)有限公司
【公開日】2015年11月4日
【申請日】2014年4月29日
【公告號】WO2015165372A1
當前第4頁1 2 3 4 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1