亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

多新聞之間相關性計算方法和裝置的制造方法_2

文檔序號:9865491閱讀:來源:國知局
聞的一級關聯(lián)關系。在 本實施例中,對特征屬性不進行限制,例如其分詞的詞頻、發(fā)布的時間等特征屬性均可用于 生成向量。利用余弦相似度作為第一關聯(lián)關系,則得到的第一關聯(lián)關系能夠反映第一新聞 與第二新聞的相似程度。例如對于新聞A、新聞B,則新聞A與新聞B的一級關聯(lián)關系為:
[0032]
[0033] 其中,i為向量的維度,similarity即為預先相似度。
[0034] 步驟120,具體包括:根據(jù)第Ξ新聞的特征屬性設置第Ξ向量,計算第二向量和第 Ξ向量的余弦相似度作為第二新聞與第Ξ新聞的一級關聯(lián)關系。同樣地,利用余弦相似度 也可W計算出第二新聞與第Ξ新聞的一級關聯(lián)關系。
[0035] 如圖2所示,本發(fā)明的一個實施例中還提供了一種多新聞之間相關性計算方法,相 比于前述的實施例,本實施例的多新聞之間相關性計算方法,步驟130,具體包括:
[0036] 步驟210,根據(jù)第一新聞與第二新聞的一級關聯(lián)關系、第二新聞與第Ξ新聞的一級 關聯(lián)關系,計算第一新聞與第Ξ新聞的信息賭。在本實施例中,采用信息賭來確定第一新聞 與第Ξ新聞的二級關聯(lián)關系,則得到的第二關聯(lián)關系能夠體現(xiàn)第一新聞與第Ξ新聞的語義 相似度,而不受到字面是否相似的影響。例如,新聞Α、新聞Β之間為一級關聯(lián)關系,新聞Β、新 聞C之間為一級關聯(lián)關系,則新聞Α、新聞C的信息賭為:
[0037]
[003引運里的p(A,Bi,C)為從新聞A通過新聞Bi到達新聞C的路徑概率,i表示新聞Β包括 多個新聞。
[0039] 如圖3所示,計算通過新聞4通過新聞81到達新聞(:1的概率為:?^,81,(:1)=|胖1|* VIII,運里II為向量余弦值的平方標準化后的權重。
[0040] Wl = cos(A,Bl)^'2,|Wl| + |W2| + |W3|+… = l;Vll = cos(Bl,Cl)^'2,|Vll| + |V12| + V13|…=1。基于W上公式,可W計算得到信息賭。
[0041] 步驟220,根據(jù)第一新聞與第Ξ新聞的信息賭,確定第一新聞與第Ξ新聞的二級關 聯(lián)關系。
[0042] 本發(fā)明的一個實施例中還提供了一種多新聞之間相關性計算方法,相比于前述的 實施例,本實施例的多新聞之間相關性計算方法,第二新聞為多個;在步驟120之前,還包 括:
[0043] 根據(jù)預設規(guī)則,為每個第二新聞查找相應的第Ξ新聞。
[0044] 步驟130,具體包括:
[0045] 根據(jù)每個第Ξ新聞對應的第二新聞在全部第二新聞中的占比,計算每個第Ξ新聞 的權重值;根據(jù)每個第Ξ新聞的權重值、每個第Ξ新聞對應的信息賭,計算每個第Ξ新聞與 第一新聞的二級關聯(lián)關系。在本實施例中,假設第二新聞共有N條,某第Ξ新聞關聯(lián)到其中 的η j個第二新聞,則該第Ξ新聞的權重值IDF= logN/n j,該權值能夠反映出第Ξ新聞的重 要性程度。
[0046] 本發(fā)明的一個實施例中還提供了一種多新聞之間相關性計算方法,相比于前述的 實施例,本實施例的多新聞之間相關性計算方法,第Ξ新聞為多個;方法還包括:
[0047] 根據(jù)多個第Ξ新聞與第一新聞的二級關聯(lián)關系,對多個第Ξ新聞進行排序。在本 實施例的技術方案中,計算出的第二關聯(lián)關系實際上能夠反映新聞之間的語義相似度高 低,所W依照第二關聯(lián)關系排序,能夠把更相似的第Ξ新聞提供給用戶。
[004引如圖4所示,本發(fā)明的一個實施例中提供了一種多新聞之間相關性計算裝置,包 括:
[0049] 第一關聯(lián)關系確定模塊410,用于確定第一新聞與第二新聞的一級關聯(lián)關系。在本 實施例中,第一新聞與第二新聞之間的一級關聯(lián)關系反映了第一新聞與第二新聞的字面內 容之間的相似程度。
[0050] 第二關聯(lián)關系確定模塊420,確定第二新聞與第Ξ新聞的一級關聯(lián)關系。第二新聞 與第Ξ新聞之間的一級關聯(lián)關系反映了第一新聞與第二新聞的字面內容之間的相似程度。
[0051] 第Ξ關聯(lián)關系確定模塊430,根據(jù)第一新聞與第二新聞的一級關聯(lián)關系、第二新聞 與第Ξ新聞的一級關聯(lián)關系,建立第一新聞與第Ξ新聞之間的二級關聯(lián)關系。根據(jù)本實施 的技術方案,計算得到的第一新聞與第Ξ新聞之間的二級關聯(lián)關系不再受到字面內容的限 審IJ,因為第二新聞與第一新聞字面相似的部分、和第二新聞與第Ξ新聞字面相似的部分可 W不同,其實際上反映的是第一新聞與第Ξ新聞的語義相似程度,所W根據(jù)本發(fā)明的建立 二級關聯(lián)關系,可W查找到字面不同但語義相似的新聞。
[0052] 本發(fā)明的一個實施例中還提供了一種多新聞之間相關性計算裝置,相比于前述的 實施例,本實施例的多新聞之間相關性計算裝置,第一關聯(lián)關系確定模塊410根據(jù)第一新聞 的特征屬性設置第一向量,根據(jù)第二新聞的特征屬性設置第二向量,計算第一向量和第二 向量的余弦相似度作為第一新聞與第二新聞的一級關聯(lián)關系。在本實施例中,對特征屬性 不進行限制,例如其分詞的詞頻、發(fā)布的時間等特征屬性均可用于生成向量。利用余弦相似 度作為第一關聯(lián)關系,則得到的第一關聯(lián)關系能夠反映第一新聞與第二新聞的相似程度。 例如對于新聞Α、新聞Β,則新聞A與新聞Β的一級關聯(lián)關系為:
[0化3]
[0054] 其中,i為向量的維度,similarity即為預先相似度。
[0055] 第二關聯(lián)關系確定模塊420根據(jù)第Ξ新聞的特征屬性設置第Ξ向量,計算第二向 量和第=向量的余弦相似度作為第二新聞與第Ξ新聞的一級關聯(lián)關系。同樣地,利用余弦 相似度也可W計算出第二新聞與第Ξ新聞的一級關聯(lián)關系。
[0056] 本發(fā)明的一個實施例中還提供了一種多新聞之間相關性計算裝置,相比于前述的 實施例,本實施例的多新聞之間相關性計算裝置,第Ξ關聯(lián)關系確定模塊430根據(jù)第一新聞 與第二新聞的一級關聯(lián)關系、第二新聞與第Ξ新聞的一級關聯(lián)關系,計算第一新聞與第Ξ 新聞的信息賭;W及根據(jù)第一新聞與第Ξ新聞的信息賭,確定第一新聞與第Ξ新聞的二級 關聯(lián)關系。
[0057] 在本實施例中,采用信息賭來確定第一新聞與第Ξ新聞的二級關聯(lián)關系,則得到 的第二關聯(lián)關系能夠體現(xiàn)第一新聞與第Ξ新聞的語義相似度,而不受到字面是否相似的影 響。例如,新聞A、新聞B之間為一級關聯(lián)關系,新聞B、新聞C之間為一級關聯(lián)關系,則新聞A、 新聞C的信息賭為:
[0化引
[0059] 運里的p(A,Bi,C)為從新聞A通過新聞Bi到達新聞C的路徑概率,i表示新聞B包括 多個新聞。
[0060] 如圖3所示,計算通過新聞4通過新聞81到達新聞(:1的概率為^^,81,(:1)=|胖1|* VIII,運里II為向量余弦值的平方標準化后的權重。
[0061 ] Wl = cos(A,Bl)^'2,|Wl| + |W2| + |W3|+… = l;Vll = cos(Bl,Cl)^'2,|Vll| + |V12| + V13|…=1?;赪上公式,可W計算得到信息賭。
[0062] 如圖5所示,本發(fā)明的一個實施例中還提供了一種多新聞之間相關性計算裝置,相 比于前述的實施例,本實施例的多新聞之間相關性計算裝置,第二新聞為多個;裝置還包 括:
[0063] 查找模塊510,用于根據(jù)預設規(guī)則,為每個第二新聞查找相應的第Ξ新聞。
[0064] 第Ξ關聯(lián)關系確定430模塊根據(jù)每個第Ξ新聞對應的第二新聞在全部第二新聞中 的占比,計算每個第Ξ新聞的權重值;W及根據(jù)每個第Ξ新聞的權重值、每個第Ξ新聞對應 的信息賭,計算每個第Ξ新聞與第一新聞的二級關聯(lián)關系。在本實施例中,假設第二新聞共 有N條,某第Ξ新聞關聯(lián)到其中的nj個第二新聞,則該第Ξ新聞的權重值IDF=logN/nj,該 權值能夠反映出第Ξ新聞的重要性程度。
[0065] 如圖5所示,本發(fā)明的一個實施例中還提供了一種多新聞之間相關性計算裝置,相 比于前述的實施例,本實施例的多新聞之間相關性計算裝置,第Ξ新聞為多個;裝置還包 括:
[0066] 排序模塊520,用于根據(jù)多個第Ξ新聞與第一新聞的二級關聯(lián)關系,對多個第Ξ新 聞進行排序。在本實施例的技術方案中,計算出的第二關聯(lián)關系實際上能夠反映新聞之間 的語義相似度高低,所W依照第二關聯(lián)關系排序,能夠把更相似的第Ξ新聞提供給用戶。
[0067] 在此提供的算法和顯示不與任何特定計算機、虛擬系統(tǒng)或者其它設備固有相關。 各種通用系統(tǒng)也可W與基于在此的示教一起使用。根據(jù)上面的描述,構
當前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1