亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

確定新聞之間相關(guān)性的方法和裝置的制造方法_2

文檔序號(hào):9765933閱讀:來(lái)源:國(guó)知局
。例如,如果第一新聞為體育新聞,則選取的標(biāo)桿新聞為體育新聞。
[0031]本發(fā)明的一個(gè)實(shí)施例中還提供一種確定新聞之間相關(guān)性的方法,相比于前述的實(shí)施例,本實(shí)施例的確定新聞之間相關(guān)性的方法,在步驟110之前,還包括:
[0032]獲取第一新聞中的關(guān)鍵詞,并從標(biāo)桿新聞集合中選擇具有關(guān)鍵詞的標(biāo)桿新聞。在本實(shí)施例中,如果第一新聞、第二新聞與標(biāo)桿新聞之間的距離過(guò)大,只能說(shuō)明第一新聞、第二新聞與標(biāo)桿新聞均有很大不同,但難以說(shuō)明第一新聞、第二新聞之間的相關(guān)性如何;而具有相同關(guān)鍵詞的新聞之間具有較高的相關(guān)性,則本實(shí)施例使得第一新聞與標(biāo)桿新聞之間的距離較小,說(shuō)明第一新聞與標(biāo)桿新聞相關(guān)性較高,則第二新聞與標(biāo)桿新聞距離大則相當(dāng)于與第一新聞距離大,即第一新聞與第二新聞相關(guān)性較弱,第二新聞與標(biāo)桿新聞距離小則相當(dāng)于與第一新聞距離小,即第一新聞與第二新聞相關(guān)性較強(qiáng)。例如,如果第一新聞標(biāo)題為《明星A獲獎(jiǎng)》,則選取的標(biāo)桿新聞可以是《明星A全紀(jì)錄》,關(guān)鍵詞是明星A。
[0033]本發(fā)明的一個(gè)實(shí)施例中還提供一種確定新聞之間相關(guān)性的方法,相比于前述的實(shí)施例,本實(shí)施例的確定新聞之間相關(guān)性的方法,步驟110,具體包括:
[0034]獲取第一新聞的特征屬性,并根據(jù)述第一新聞的特征屬性生成第一新聞對(duì)應(yīng)的向量,將第一新聞對(duì)應(yīng)的向量與標(biāo)桿新聞對(duì)應(yīng)的向量進(jìn)行比較。
[0035]步驟120,具體包括:獲取第二新聞的特征屬性,并根據(jù)述第二新聞的特征屬性生成第二新聞對(duì)應(yīng)的向量,并將第二新聞對(duì)應(yīng)的向量與標(biāo)桿新聞對(duì)應(yīng)的向量進(jìn)行比較。
[0036]在本實(shí)施例中,對(duì)特征屬性不進(jìn)行限制;利用新聞的一個(gè)或多個(gè)特征屬性,容易將新聞量化稱謂數(shù)字,能夠更容易、更精確地計(jì)算新聞之間的距離。
[0037]本發(fā)明的一個(gè)實(shí)施例中還提供一種確定新聞之間相關(guān)性的方法,相比于前述的實(shí)施例,本實(shí)施例的確定新聞之間相關(guān)性的方法,步驟110,具體包括:
[0038]對(duì)第一新聞進(jìn)行分詞得到多個(gè)詞,計(jì)算第一新聞的多個(gè)詞的詞頻,作為第一新聞的特征屬性;
[0039]步驟120,具體包括:對(duì)第二新聞進(jìn)行分詞得到多個(gè)詞,計(jì)算第二新聞的多個(gè)詞的詞頻,作為第二新聞的特征屬性。
[0040]在本實(shí)施例中,可以為第一新聞分配一個(gè)隨機(jī)數(shù),根據(jù)隨機(jī)數(shù)和計(jì)算得到的詞頻,為第一新聞構(gòu)造出一個(gè)文章向量;同樣地,第二新聞、標(biāo)桿新聞也可以構(gòu)造相應(yīng)的文章向量;在本實(shí)施例中,對(duì)第一新聞、第二新聞、標(biāo)桿新聞的文章向量取最小哈希值再進(jìn)行計(jì)算,能夠得到第一新聞與標(biāo)桿新聞之間的具體距離值、第二新聞與標(biāo)桿新聞之間的距離值。例如,新聞A、新聞B與標(biāo)桿新聞之間的距離分別為4、3,差值較小為I表示新聞A、新聞B相關(guān)性較高,而新聞C與標(biāo)桿新聞的差值為I,其與新聞A、新聞B的距離差值較大,則相關(guān)性較低。
[0041]本發(fā)明的一個(gè)實(shí)施例中還提供一種確定新聞之間相關(guān)性的方法,相比于前述的實(shí)施例,本實(shí)施例的確定新聞之間相關(guān)性的方法,步驟130,具體包括:
[0042]在距離差位于預(yù)設(shè)區(qū)間時(shí),將第二新聞設(shè)置為第一新聞的相關(guān)新聞,以用于在需推送第一新聞的相關(guān)新聞時(shí)推送第二新聞。例如,結(jié)合前述的實(shí)施例內(nèi)容,假設(shè)預(yù)設(shè)區(qū)間為0-1,則新聞A為新聞B的相關(guān)新聞,用戶查看新聞A時(shí)可以為用戶推送新聞B。
[0043]如圖2所示,本發(fā)明的一個(gè)實(shí)施例中提供了一種確定新聞之間相關(guān)性的裝置,包括:
[0044]第一距離計(jì)算模塊210,用于將第一新聞與標(biāo)桿新聞進(jìn)行比較,得到第一新聞與標(biāo)桿新聞的距離。在本實(shí)施例中,對(duì)標(biāo)桿新聞不進(jìn)行限制,任何一篇新聞都可以選定作為標(biāo)桿新聞。
[0045]第二距離計(jì)算模塊220,用于將第二新聞與標(biāo)桿新聞進(jìn)行比較,得到第二新聞與標(biāo)桿新聞的距離。
[0046]相關(guān)性計(jì)算模塊230,用于計(jì)算第一新聞和標(biāo)桿新聞的距離與第一新聞與標(biāo)桿新聞的距離之間的距離差,根據(jù)距離差確定第一新聞與第二新聞之間的相關(guān)性。在本實(shí)施例中,距離反映了新聞之間的差別,本實(shí)施例對(duì)計(jì)算距離的方式不進(jìn)行限制;根據(jù)本實(shí)施例的技術(shù)方案,容易理解,當(dāng)?shù)谝恍侣勁c標(biāo)桿新聞之間的距離,和第二新聞與標(biāo)桿新聞之間的距離相似時(shí),說(shuō)明第一新聞與第二新聞之間的距離較近,也就是兩個(gè)新聞之間的相關(guān)性較強(qiáng);當(dāng)?shù)谝恍侣勁c標(biāo)桿新聞之間距離較近,第二新聞與標(biāo)桿新聞之間的距離較遠(yuǎn)時(shí),說(shuō)明第一新聞與第二新聞之間的距離較遠(yuǎn),兩個(gè)新聞之間的相關(guān)性較弱。
[0047]如圖3所示,本發(fā)明的一個(gè)實(shí)施例中還提供一種確定新聞之間相關(guān)性的裝置,相比于前述的實(shí)施例,本實(shí)施例的確定新聞之間相關(guān)性的裝置,還包括:
[0048]第一標(biāo)桿新聞獲取模塊310,用于識(shí)別第一新聞的類型,并從標(biāo)桿新聞集合中選擇具有相對(duì)應(yīng)類型的標(biāo)桿新聞。在本實(shí)施例中,如果第一新聞、第二新聞與標(biāo)桿新聞之間的距離過(guò)大,只能說(shuō)明第一新聞、第二新聞與標(biāo)桿新聞均有很大不同,但難以說(shuō)明第一新聞、第二新聞之間的相關(guān)性如何;而同類型的新聞之間具有較高的相關(guān)性,則本實(shí)施例使得第一新聞與標(biāo)桿新聞之間的距離較小,說(shuō)明第一新聞與標(biāo)桿新聞相關(guān)性較高,則第二新聞與標(biāo)桿新聞距離大則相當(dāng)于與第一新聞距離大,即第一新聞與第二新聞相關(guān)性較弱,第二新聞與標(biāo)桿新聞距離小則相當(dāng)于與第一新聞距離小,即第一新聞與第二新聞相關(guān)性較強(qiáng)。例如,如果第一新聞為體育新聞,則選取的標(biāo)桿新聞為體育新聞。
[0049]如圖3所示,本發(fā)明的一個(gè)實(shí)施例中還提供一種確定新聞之間相關(guān)性的裝置,相比于前述的實(shí)施例,本實(shí)施例的確定新聞之間相關(guān)性的裝置,還包括:
[0050]第二標(biāo)桿新聞獲取模塊320,用于獲取第一新聞中的關(guān)鍵詞,并從標(biāo)桿新聞集合中選擇具有關(guān)鍵詞的標(biāo)桿新聞。在本實(shí)施例中,如果第一新聞、第二新聞與標(biāo)桿新聞之間的距離過(guò)大,只能說(shuō)明第一新聞、第二新聞與標(biāo)桿新聞均有很大不同,但難以說(shuō)明第一新聞、第二新聞之間的相關(guān)性如何;而具有相同關(guān)鍵詞的新聞之間具有較高的相關(guān)性,則本實(shí)施例使得第一新聞與標(biāo)桿新聞之間的距離較小,說(shuō)明第一新聞與標(biāo)桿新聞相關(guān)性較高,則第二新聞與標(biāo)桿新聞距離大則相當(dāng)于與第一新聞距離大,即第一新聞與第二新聞相關(guān)性較弱,第二新聞與標(biāo)桿新聞距離小則相當(dāng)于與第一新聞距離小,即第一新聞與第二新聞相關(guān)性較強(qiáng)。例如,如果第一新聞標(biāo)題為《明星A獲獎(jiǎng)》,則選取的標(biāo)桿新聞可以是《明星A全紀(jì)錄》,關(guān)鍵詞是明星A。
[0051]如圖3所示,本發(fā)明的一個(gè)實(shí)施例中還提供一種確定新聞之間相關(guān)性的裝置,相比于前述的實(shí)施例,本實(shí)施例的確定新聞之間相關(guān)性的裝置,還包括:
[0052]第一向量生成模塊330,用于獲取第一新聞的特征屬性,并根據(jù)述第一新聞的特征屬性生成第一新聞對(duì)應(yīng)的向量;第一標(biāo)桿新聞獲取模塊310將第一新聞對(duì)應(yīng)的向量與標(biāo)桿新聞對(duì)應(yīng)的向量進(jìn)行比較。
[0053]第二向量生成模塊340,用于獲取第二新聞的特征屬性,并根據(jù)述第二新聞的特征屬性生成第二新聞對(duì)應(yīng)的向量;第一標(biāo)桿新聞獲取模塊320將第二新聞對(duì)應(yīng)的向量與標(biāo)桿新聞對(duì)應(yīng)的向量進(jìn)行比較。
[0054]在本實(shí)施例中,對(duì)特征屬性不進(jìn)行限制;利用新聞的一個(gè)或多個(gè)特征屬性,容易將新聞量化稱謂數(shù)字,能夠更容易、更精確地計(jì)算新聞之間的距離。
[0055]本發(fā)明的一個(gè)實(shí)施例中還提供一種確定新聞之間相關(guān)性的裝置,相比于前述的實(shí)施例,本實(shí)施例的確定新聞之間相關(guān)性的裝置,第一向量生成模塊330對(duì)第一新聞進(jìn)行分詞得到多個(gè)詞,計(jì)算第一新聞的多個(gè)詞的詞頻,作為第一新聞的特征屬性.
[0056]第二向量生成模塊340對(duì)第二新聞進(jìn)行分詞得到多個(gè)詞,計(jì)算第二新聞的多個(gè)詞的詞頻,作為第二新聞的特征屬性。
[0057]在本實(shí)施例中,可以為第一新聞分配一個(gè)隨機(jī)數(shù),根據(jù)隨機(jī)數(shù)和計(jì)算得到的詞頻,為第一新聞構(gòu)造出一個(gè)文章向量;同樣地,第二新聞、標(biāo)桿新聞也可以構(gòu)造相應(yīng)的文章向量;在本實(shí)施例中,對(duì)第一新聞、第二新聞、標(biāo)桿新聞的文章向量取最小哈希值再進(jìn)行計(jì)算,能夠得到第一新聞與標(biāo)桿新聞之間的具體距離值、第二新聞與標(biāo)桿新聞之間的距離值。例如,新聞A、新聞B與標(biāo)桿新聞之間的距離分別為4、3,差值較小為I表示新聞A、新聞B相關(guān)性較高,而新聞C與標(biāo)桿新聞的差值為I,其與新聞A、新聞B的距離差值較大,則相關(guān)性較低。
[0058]本發(fā)明的一個(gè)實(shí)施例中還提供一種確定新聞之間相關(guān)性的裝置,相比于前述的實(shí)施例,本實(shí)施例的確定新聞之間相關(guān)性的裝置,相關(guān)性計(jì)算模塊310在距離差位于預(yù)設(shè)區(qū)間時(shí),將第二新聞設(shè)置為第一新聞的相關(guān)新聞,以用于在需推
當(dāng)前第2頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1