衡量新聞重要性的方法和裝置制造方法
【專利摘要】本發(fā)明提供了一種衡量新聞重要性的方法和裝置,該方法包括:確定待衡量新聞的至少一個發(fā)布屬性,以及每個發(fā)布屬性在新聞重要性中的權(quán)值;獲取每個發(fā)布屬性的屬性值,并根據(jù)確定的所述權(quán)值以及獲取的所述屬性值對所述至少一個發(fā)布屬性進行加權(quán)處理,計算得出的值作為所述待衡量新聞的重要性值;將所述重要性值與預(yù)設(shè)的衡量規(guī)則進行比較,衡量出所述待衡量新聞的重要性。本發(fā)明實施例基于待衡量新聞的至少一個發(fā)布屬性來綜合衡量待衡量新聞的重要性,使得衡量結(jié)果更加客觀、準確、全面。
【專利說明】衡量新聞重要性的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及互聯(lián)網(wǎng)【技術(shù)領(lǐng)域】,特別是一種衡量新聞重要性的方法和裝置。
【背景技術(shù)】
[0002]隨著計算機和計算機網(wǎng)絡(luò)的日益普及,互聯(lián)網(wǎng)已經(jīng)深入到人們工作、學(xué)習(xí)和生活的各個領(lǐng)域,成為人們發(fā)布和獲取信息的重要途徑,而搜索引擎則成為人們從互聯(lián)網(wǎng)上獲取信息的重要工具。
[0003]在搜索引擎中,在其它相關(guān)性因素相近時,通常將重要性、權(quán)威性高的網(wǎng)頁盡量排在搜索結(jié)果的前面,方便用戶盡快找到有價值的網(wǎng)頁信息。對于新聞搜索引擎而言,新聞的重要性是其對搜索結(jié)果進行排序的重要依據(jù)。傳統(tǒng)的網(wǎng)頁等級(PageRank)方法對于新聞搜索引擎并不適用,原因是PageRank所依賴的鏈接指向關(guān)系是一個需要時間積累的數(shù)據(jù),新聞由于其時效性特點,在第一時間發(fā)布時并未積累多少PageRank,以至于跟歷史新聞比較權(quán)重時,依賴PageRank會起負面作用。
[0004]因此,如何有效、準確地衡量新聞重要性成為目前亟待解決的技術(shù)問題。
【發(fā)明內(nèi)容】
[0005]鑒于上述問題,提出了本發(fā)明以便提供一種克服上述問題或者至少部分地解決上述問題的衡量新聞重要性的方法和相應(yīng)的裝置。
[0006]依據(jù)本發(fā)明的一個方面,提供了一種衡量新聞重要性的方法,包括:確定待衡量新聞的至少一個發(fā)布屬性,以及每個發(fā)布屬性在新聞重要性中的權(quán)值;獲取每個發(fā)布屬性的屬性值,并根據(jù)確定的所述權(quán)值以及獲取的所述屬性值對所述至少一個發(fā)布屬性進行加權(quán)處理,計算得出的值作為所述待衡量新聞的重要性值;將所述重要性值與預(yù)設(shè)的衡量規(guī)則進行比較,衡量出所述待衡量新聞的重要性。
[0007]可選地,所述發(fā)布屬性包括下列任意之一:
[0008]發(fā)布時間;
[0009]發(fā)布所述待衡量新聞的新聞源;
[0010]所述待衡量新聞被發(fā)布在新聞源上的位置;
[0011]發(fā)布內(nèi)容中的文字或圖片信息;
[0012]發(fā)布內(nèi)容的篇幅。
[0013]可選地,若所述至少一個發(fā)布屬性包括發(fā)布所述待衡量新聞的新聞源和/或所述待衡量新聞被發(fā)布在新聞源上的位置,所述獲取每個發(fā)布屬性的屬性值之前,還包括:基于發(fā)布所述待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布所述待衡量新聞的新聞源的屬性值和/或所述待衡量新聞被發(fā)布在所述新聞源上的位置的屬性值。
[0014]可選地,基于發(fā)布所述待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出所述待衡量新聞被發(fā)布在所述新聞源上的位置的屬性值,包括:統(tǒng)計指定時間段內(nèi)被發(fā)布在所述新聞源上的所述位置的多條新聞;確定所述多條新聞的參數(shù);根據(jù)確定的所述多條新聞的參數(shù),計算出所述新聞源上的所述位置的屬性值作為所述待衡量新聞被發(fā)布在所述新聞源上的所述位置的屬性值。
[0015]可選地,統(tǒng)計指定時間段內(nèi)被發(fā)布在所述新聞源上的所述位置的多條新聞之前,還包括:以預(yù)設(shè)的時間間隔從多個新聞源上抓取發(fā)布時間距當前不超過指定時長的新聞,記錄抓取的所述新聞首次被發(fā)布的時間、新聞源以及被發(fā)布在該新聞源上的位置。
[0016]可選地,所述多條新聞的參數(shù)包括下列至少之一:
[0017]所述多條新聞中每條新聞的網(wǎng)頁等級PageRank ;
[0018]所述多條新聞中每條新聞被點擊的次數(shù);
[0019]所述多條新聞中每條新聞被展示的次數(shù)。
[0020]可選地,根據(jù)確定的所述多條新聞的參數(shù),計算出所述新聞源上的所述位置的屬性值,包括:根據(jù)確定的所述多條新聞中每條新聞的PageRank、被點擊的次數(shù)、被展示的次數(shù),分別計算得到所述多條新聞的PageRank、被點擊的次數(shù)、被展示的次數(shù)的平均值;將計算得到的所述平均值進行加權(quán)求和作為所述新聞源上的所述位置的屬性值。
[0021]可選地,若發(fā)布所述待衡量新聞的新聞源的個數(shù)為多個,基于發(fā)布所述待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布所述待衡量新聞的新聞源的屬性值和/或所述待衡量新聞被發(fā)布在所述新聞源上的位置的屬性值,包括:基于發(fā)布所述待衡量新聞的多個新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布所述待衡量新聞的各個新聞源的屬性值和/或所述待衡量新聞被發(fā)布在各個所述新聞源上的位置的屬性值。
[0022]依據(jù)本發(fā)明的另一個方面,還提供了一種衡量新聞重要性的裝置,包括:
[0023]確定模塊,適于確定待衡量新聞的至少一個發(fā)布屬性,以及每個發(fā)布屬性在新聞重要性中的權(quán)值;
[0024]計算模塊,適于獲取每個發(fā)布屬性的屬性值,并根據(jù)確定的所述權(quán)值以及獲取的所述屬性值對所述至少一個發(fā)布屬性進行加權(quán)處理,計算得出的值作為所述待衡量新聞的重要性值;
[0025]衡量模塊,適于將所述重要性值與預(yù)設(shè)的衡量規(guī)則進行比較,衡量出所述待衡量新聞的重要性。
[0026]可選地,所述發(fā)布屬性包括下列任意之一:
[0027]發(fā)布時間;
[0028]發(fā)布所述待衡量新聞的新聞源;
[0029]所述待衡量新聞被發(fā)布在新聞源上的位置;
[0030]發(fā)布內(nèi)容中的文字或圖片信息;
[0031]發(fā)布內(nèi)容的篇幅。
[0032]可選地,若所述至少一個發(fā)布屬性包括發(fā)布所述待衡量新聞的新聞源和/或所述待衡量新聞被發(fā)布在新聞源上的位置,在所述計算模塊獲取每個發(fā)布屬性的屬性值之前,所述計算模塊還適于:基于發(fā)布所述待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布所述待衡量新聞的新聞源的屬性值和/或所述待衡量新聞被發(fā)布在所述新聞源上的位置的屬性值。
[0033]可選地,所述計算模塊還適于:統(tǒng)計指定時間段內(nèi)被發(fā)布在所述新聞源上的所述位置的多條新聞;確定所述多條新聞的參數(shù);根據(jù)確定的所述多條新聞的參數(shù),計算出所述新聞源上的所述位置的屬性值作為所述待衡量新聞被發(fā)布在所述新聞源上的所述位置的屬性值。
[0034]可選地,在所述計算模塊統(tǒng)計指定時間段內(nèi)被發(fā)布在所述新聞源上的所述位置的多條新聞之前,還包括:抓取模塊,適于以預(yù)設(shè)的時間間隔從多個新聞源上抓取發(fā)布時間距當前不超過指定時長的新聞,記錄抓取的所述新聞首次被發(fā)布的時間、新聞源以及被發(fā)布在該新聞源上的位置。
[0035]可選地,所述多條新聞的參數(shù)包括下列至少之一:
[0036]所述多條新聞中每條新聞的網(wǎng)頁等級PageRank ;
[0037]所述多條新聞中每條新聞被點擊的次數(shù);
[0038]所述多條新聞中每條新聞被展示的次數(shù)。
[0039]可選地,所述計算模塊還適于:根據(jù)確定的所述多條新聞中每條新聞的PageRank、被點擊的次數(shù)、被展示的次數(shù),分別計算得到所述多條新聞的PageRank、被點擊的次數(shù)、被展示的次數(shù)的平均值;將計算得到的所述平均值進行加權(quán)求和作為所述新聞源上的所述位置的屬性值。
[0040]可選地,若發(fā)布所述待衡量新聞的新聞源的個數(shù)為多個,所述計算模塊還適于:基于發(fā)布所述待衡量新聞的多個新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布所述待衡量新聞的各個新聞源的屬性值和/或所述待衡量新聞被發(fā)布在各個所述新聞源上的位置的屬性值。
[0041]依據(jù)本發(fā)明提供的技術(shù)方案,確定待衡量新聞的至少一個發(fā)布屬性,以及每個發(fā)布屬性在新聞重要性中的權(quán)值,并獲取每個發(fā)布屬性的屬性值。進而根據(jù)確定的權(quán)值以及獲取的屬性值對至少一個發(fā)布屬性進行加權(quán)處理,計算得出的值作為待衡量新聞的重要性值。隨后將重要性值與預(yù)設(shè)的衡量規(guī)則進行比較,衡量出待衡量新聞的重要性??梢姡景l(fā)明基于待衡量新聞的至少一個發(fā)布屬性來綜合衡量待衡量新聞的重要性,使得衡量結(jié)果更加客觀、準確、全面。由此解決了相關(guān)技術(shù)中若采用網(wǎng)頁等級(PageRank)方法確定新聞重要性而產(chǎn)生負面作用的問題。并且,新聞搜索引擎能夠根據(jù)本發(fā)明提供的客觀、準確、全面的待衡量新聞的重要性的衡量結(jié)果將重要性高的新聞盡量排在搜索結(jié)果的前面,方便用戶盡快找到價值較高的新聞。
[0042]上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的【具體實施方式】。
[0043]根據(jù)下文結(jié)合附圖對本發(fā)明具體實施例的詳細描述,本領(lǐng)域技術(shù)人員將會更加明了本發(fā)明的上述以及其他目的、優(yōu)點和特征。
【專利附圖】
【附圖說明】
[0044]通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
[0045]圖1示出了根據(jù)本發(fā)明一個實施例的衡量新聞重要性的方法的一種流程圖;
[0046]圖2示出了根據(jù)本發(fā)明一個實施例的衡量新聞重要性的方法的另一種流程圖;
[0047]圖3示出了根據(jù)本發(fā)明一個實施例的衡量新聞重要性的裝置的一種結(jié)構(gòu)示意圖;以及
[0048]圖4示出了根據(jù)本發(fā)明一個實施例的衡量新聞重要性的裝置的另一種結(jié)構(gòu)示意圖。
【具體實施方式】
[0049]下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應(yīng)當理解,可以以各種形式實現(xiàn)本公開而不應(yīng)被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達給本領(lǐng)域的技術(shù)人員。
[0050]為解決上述技術(shù)問題,本發(fā)明實施例提供了一種衡量新聞重要性的方法,圖1示出了根據(jù)本發(fā)明一個實施例的衡量新聞重要性的方法的一種流程圖。如圖1所示,該方法至少包括以下步驟S102至步驟S106。
[0051]步驟S102、確定待衡量新聞的至少一個發(fā)布屬性,以及每個發(fā)布屬性在新聞重要性中的權(quán)值。
[0052]步驟S104、獲取每個發(fā)布屬性的屬性值,并根據(jù)確定的權(quán)值以及獲取的屬性值對至少一個發(fā)布屬性進行加權(quán)處理,計算得出的值作為待衡量新聞的重要性值。
[0053]步驟S106、將重要性值與預(yù)設(shè)的衡量規(guī)則進行比較,衡量出待衡量新聞的重要性。
[0054]依據(jù)本發(fā)明提供的技術(shù)方案,確定待衡量新聞的至少一個發(fā)布屬性,以及每個發(fā)布屬性在新聞重要性中的權(quán)值,并獲取每個發(fā)布屬性的屬性值。進而根據(jù)確定的權(quán)值以及獲取的屬性值對至少一個發(fā)布屬性進行加權(quán)處理,計算得出的值作為待衡量新聞的重要性值。隨后將重要性值與預(yù)設(shè)的衡量規(guī)則進行比較,衡量出待衡量新聞的重要性??梢姡景l(fā)明基于待衡量新聞的至少一個發(fā)布屬性來綜合衡量待衡量新聞的重要性,使得衡量結(jié)果更加客觀、準確、全面。由此解決了相關(guān)技術(shù)中若采用網(wǎng)頁等級(PageRank)方法確定新聞重要性而產(chǎn)生負面作用的問題。并且,新聞搜索引擎能夠根據(jù)本發(fā)明提供的客觀、準確、全面的待衡量新聞的重要性的衡量結(jié)果將重要性高的新聞盡量排在搜索結(jié)果的前面,方便用戶盡快找到價值較高的新聞。
[0055]上文步驟S102中提及的新聞可以是新聞鏈接、新聞頁面內(nèi)容等。進一步地,待衡量新聞的發(fā)布屬性是指與發(fā)布待衡量新聞相關(guān)的信息,如發(fā)布時間、發(fā)布待衡量新聞的新聞源、待衡量新聞被發(fā)布在新聞源上的位置、發(fā)布內(nèi)容中的文字或圖片信息、發(fā)布內(nèi)容的篇幅等等,本發(fā)明不限于此。這里提及的新聞源是指一個聚合了大量新聞的網(wǎng)頁或頁面,例如某新聞源a,其網(wǎng)址可以為http://news.a.com.cn。此外,每個發(fā)布屬性在新聞重要性中的權(quán)值是指每個發(fā)布屬性在新聞重要性中的相對重要程度,因而可以采用多種方法確定每個發(fā)布屬性在新聞重要性中的權(quán)值,如主觀經(jīng)驗法、專家調(diào)查法等。例如,確定待衡量新聞的至少一個發(fā)布屬性為發(fā)布時間、發(fā)布待衡量新聞的新聞源以及發(fā)布內(nèi)容的篇幅,根據(jù)主觀經(jīng)驗,其中的發(fā)布時間在新聞重要性中較重要,可以賦予較大的權(quán)值(如權(quán)值為0.5),并賦予發(fā)布待衡量新聞的新聞源以及發(fā)布內(nèi)容的篇幅的權(quán)值分別為0.3和0.2。又例如,確定待衡量新聞的至少一個發(fā)布屬性為發(fā)布時間、發(fā)布待衡量新聞的新聞源、待衡量新聞被發(fā)布在新聞源上的位置以及發(fā)布內(nèi)容的篇幅,可以賦予它們的權(quán)值分別為0.5,0.3,0.1和0.1。以上僅列舉了常見的確定權(quán)值的方法,其它用于確定權(quán)值的方法均適用于本發(fā)明。
[0056]上文步驟S104中發(fā)布屬性的屬性值是發(fā)布屬性的一種數(shù)值表示,例如發(fā)布時間6:00整,可以通過屬性值I來表示該發(fā)布時間6:00整,發(fā)布時間12:00整,可以通過屬性值2來表示該發(fā)布時間12:00整,當然還可以通過其它屬性值來表示。又例如,發(fā)布內(nèi)容的篇幅為100字以內(nèi),可以通過屬性值100來表示該100字以內(nèi)的篇幅,發(fā)布內(nèi)容的篇幅為100字至500字,可以通過屬性值500來表示該100字至500字的篇幅,發(fā)布內(nèi)容的篇幅為500字至1000字,可以通過屬性值1000來表示該500字至1000字的篇幅,此外還可以通過其它屬性值來表示均適用于本發(fā)明。
[0057]若待衡量新聞的至少一個發(fā)布屬性為發(fā)布待衡量新聞的新聞源或者待衡量新聞被發(fā)布在新聞源上的某個位置,本發(fā)明實施例還提供了一種優(yōu)選的計算上述兩種發(fā)布屬性(發(fā)布待衡量新聞的新聞源以及待衡量新聞被發(fā)布在新聞源上的某個位置)的屬性值的方案,在該方案中,可以基于發(fā)布待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布待衡量新聞的新聞源的屬性值以及待衡量新聞被發(fā)布在新聞源上的某個位置的屬性值。下面將分別對上述兩種發(fā)布屬性的屬性值的計算方式進行詳細介紹。
[0058]首先,基于發(fā)布待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布待衡量新聞的新聞源的屬性值,可以是基于發(fā)布待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布待衡量新聞的新聞源的PageRank作為發(fā)布待衡量新聞的新聞源的屬性值。PageRank是一種根據(jù)網(wǎng)頁之間相互的超鏈接計算的技術(shù),通過網(wǎng)絡(luò)浩瀚的超鏈接關(guān)系來確定一個網(wǎng)頁的等級??梢园褟腁網(wǎng)頁到B網(wǎng)頁的鏈接解釋為A網(wǎng)頁給B網(wǎng)頁投票,根據(jù)投票來源(甚至來源的來源,即鏈接到A網(wǎng)頁的網(wǎng)頁)和投票目標的等級來決定新的等級。簡單的說,一個高等級的網(wǎng)頁可以使其他低等級網(wǎng)頁的等級提升。
[0059]其次,基于發(fā)布待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出待衡量新聞被發(fā)布在新聞源上的某個位置的屬性值。即統(tǒng)計指定時間段內(nèi)被發(fā)布在新聞源上的該位置的多條新聞,并確定多條新聞的參數(shù),進而根據(jù)確定的多條新聞的參數(shù),計算出新聞源上的該位置的屬性值作為待衡量新聞被發(fā)布在新聞源上的該位置的屬性值。這里,多條新聞的參數(shù)是指多條新聞中每條新聞被鏈接或操作的參數(shù)值,例如多條新聞中每條新聞的PageRank、多條新聞中每條新聞被點擊的次數(shù)、多條新聞中每條新聞被展示的次數(shù),等等。
[0060]進一步地,當多條新聞的參數(shù)包括多條新聞中每條新聞的PageRank、多條新聞中每條新聞被點擊的次數(shù)以及多條新聞中每條新聞被展示的次數(shù)時,本發(fā)明提供了一種優(yōu)選的計算新聞源上的該位置的屬性值的方案,在該方案中根據(jù)確定的多條新聞中每條新聞的PageRank、被點擊的次數(shù)、被展示的次數(shù),分別計算得到多條新聞的PageRank、被點擊的次數(shù)、被展示的次數(shù)的平均值,進而將計算得到的平均值進行加權(quán)求和作為新聞源上的該位置的屬性值。例如,統(tǒng)計指定時間段內(nèi)(如24小時)被發(fā)布在新聞源上的該位置的多條新聞為新聞1、新聞2以及新聞3,確定新聞1、新聞2以及新聞3的PageRank分別為P1、P2和P3,則其PageRank的平均值為PO = (P1+P2+P3)/3。確定新聞1、新聞2以及新聞3被點擊的次數(shù)分別為Cl、C2和C3,則其被點擊的次數(shù)的平均值為CO = (Cl+C2+C3)/3。確定新聞1、新聞2以及新聞3被展示的次數(shù)分別為Dl、D2和D3,其被展示的次數(shù)的平均值為DO=(Dl+D2+D3)/3。對PO、CO以及DO進行加權(quán)求和作為新聞源上的該位置的屬性值,這里列舉的新聞1、新聞2以及新聞3僅僅是示意性的,不用于限制本發(fā)明。需要說明的是,上述列舉了多條新聞的參數(shù)包括多條新聞中每條新聞的PageRank、多條新聞中每條新聞被點擊的次數(shù)以及多條新聞中每條新聞被展示的次數(shù)時,計算出新聞源上的該位置的屬性值的方案。當多條新聞的參數(shù)包括多條新聞中每條新聞的PageRank和多條新聞中每條新聞被點擊的次數(shù)時,或者當多條新聞的參數(shù)包括多條新聞中每條新聞被點擊的次數(shù)和多條新聞中每條新聞被展示的次數(shù)時也可以采用上述方案計算出新聞源上的該位置的屬性值。例如,當多條新聞的參數(shù)包括多條新聞中每條新聞的PageRank和多條新聞中每條新聞被點擊的次數(shù)時,可以根據(jù)確定的多條新聞中每條新聞的PageRank、被點擊的次數(shù),分別計算得到多條新聞的PageRank、被點擊的次數(shù)的平均值,進而將計算得到的平均值進行加權(quán)求和作為新聞源上的該位置的屬性值。
[0061]此外,為了統(tǒng)計指定時間段內(nèi)被發(fā)布在新聞源上的該位置的多條新聞,本發(fā)明還可以以預(yù)設(shè)的時間間隔從多個新聞源上抓取發(fā)布時間距當前不超過指定時長的新聞,記錄抓取的新聞首次被發(fā)布的時間、新聞源以及被發(fā)布在該新聞源上的位置。
[0062]以上介紹了發(fā)布待衡量新聞的新聞源的個數(shù)為一個的情況,若發(fā)布待衡量新聞的新聞源的個數(shù)為多個時(對于一些特別重要的新聞,可能會同時被多個新聞源轉(zhuǎn)載),則基于發(fā)布待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布待衡量新聞的新聞源的屬性值和/或待衡量新聞被發(fā)布在新聞源上的位置的屬性值,可以是基于發(fā)布待衡量新聞的多個新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布待衡量新聞的各個新聞源的屬性值和/或待衡量新聞被發(fā)布在各個新聞源上的位置的屬性值,且計算發(fā)布待衡量新聞的各個新聞源的屬性值和/或待衡量新聞被發(fā)布在各個新聞源上的位置的屬性值可以采用上述發(fā)布待衡量新聞的新聞源的個數(shù)為一個的情況的方案來實現(xiàn)。
[0063]另外,上文步驟S106中提及的預(yù)設(shè)的衡量規(guī)則可以是數(shù)值區(qū)間與新聞的重要性的對應(yīng)關(guān)系,例如落入數(shù)值區(qū)間I對應(yīng)的新聞的重要性為“非常高”、落入數(shù)值區(qū)間2對應(yīng)的新聞的重要性為“高”、落入數(shù)值區(qū)間3對應(yīng)的新聞的重要性為“中”、落入數(shù)值區(qū)間4對應(yīng)的新聞的重要性為“低”等,此處僅是列舉的,還可以是其他數(shù)值區(qū)間與新聞的重要性的對應(yīng)關(guān)系。
[0064]以上介紹了圖1所示的實施例中各環(huán)節(jié)的多種實現(xiàn)方式,下面通過具體的優(yōu)選實施例對本發(fā)明實施例提供的衡量新聞重要性的方法做進一步說明。
[0065]圖2示出了根據(jù)本發(fā)明一個實施例的衡量新聞重要性的方法的另一種流程圖。如圖2所示,該方法包括以下步驟S202至步驟S214。
[0066]步驟S202、確定待衡量新聞的至少一個發(fā)布屬性,以及每個發(fā)布屬性在新聞重要性中的權(quán)值,其中,至少一個發(fā)布屬性包括發(fā)布待衡量新聞的新聞源以及待衡量新聞被發(fā)布在新聞源上的某個位置。
[0067]這里,至少一個發(fā)布屬性還可以包括發(fā)布時間、發(fā)布內(nèi)容中的文字或圖片信息、發(fā)布內(nèi)容的篇幅等。
[0068]步驟S204、基于發(fā)布待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布待衡量新聞的新聞源的PageRank作為發(fā)布待衡量新聞的新聞源的屬性值。
[0069]步驟S206、統(tǒng)計指定時間段內(nèi)被發(fā)布在新聞源上的該位置的多條新聞,并確定多條新聞中每條新聞的PageRank、被點擊的次數(shù)、被展示的次數(shù)。
[0070]為了統(tǒng)計指定時間段內(nèi)被發(fā)布在新聞源上的該位置的多條新聞,在步驟S206之前可以以預(yù)設(shè)的時間間隔從多個新聞源上抓取發(fā)布時間距當前不超過指定時長的新聞,記錄抓取的新聞首次被發(fā)布的時間、新聞源以及被發(fā)布在該新聞源上的位置。
[0071]步驟S208、根據(jù)確定的多條新聞中每條新聞的PageRank、被點擊的次數(shù)、被展示的次數(shù),分別計算得到多條新聞的PageRank、被點擊的次數(shù)、被展示的次數(shù)的平均值。
[0072]步驟S210、將計算得到的平均值進行加權(quán)求和作為新聞源上的該位置的屬性值。
[0073]步驟S212、獲取每個發(fā)布屬性的屬性值,并根據(jù)確定的權(quán)值以及獲取的屬性值對至少一個發(fā)布屬性進行加權(quán)處理,計算得出的值作為待衡量新聞的重要性值。
[0074]步驟S214、將重要性值與預(yù)設(shè)的衡量規(guī)則進行比較,衡量出待衡量新聞的重要性。
[0075]需要說明的是,上述步驟S204與步驟S206至步驟S210無先后執(zhí)行順序之分,也可以先執(zhí)行步驟S206至步驟S210,然后執(zhí)行步驟S204。
[0076]本發(fā)明實施例中,基于待衡量新聞的發(fā)布待衡量新聞的新聞源以及待衡量新聞被發(fā)布在新聞源上的某個位置等至少一個發(fā)布屬性來綜合衡量待衡量新聞的重要性,使得衡量結(jié)果更加客觀、準確、全面。并且,新聞搜索引擎能夠根據(jù)本發(fā)明提供的客觀、準確、全面的待衡量新聞的重要性的衡量結(jié)果將重要性高的新聞盡量排在搜索結(jié)果的前面,方便用戶盡快找到價值較高的新聞。
[0077]需要說明的是,實際應(yīng)用中,上述所有可選實施方式可以采用結(jié)合的方式任意組合,形成本發(fā)明的可選實施例,在此不再一一贅述。
[0078]基于同一發(fā)明構(gòu)思,本發(fā)明實施例還提供了一種衡量新聞重要性的裝置,以實現(xiàn)上述衡量新聞重要性的方法。
[0079]圖3示出了根據(jù)本發(fā)明一個實施例的衡量新聞重要性的裝置的一種結(jié)構(gòu)示意圖。參見圖3,該裝置至少包括:確定模塊310、計算模塊320以及衡量模塊330。
[0080]現(xiàn)介紹本發(fā)明實施例的衡量新聞重要性的裝置的各組成或器件的功能以及各部分間的連接關(guān)系:
[0081]確定模塊310,適于確定待衡量新聞的至少一個發(fā)布屬性,以及每個發(fā)布屬性在新聞重要性中的權(quán)值;
[0082]計算模塊320,與確定模塊310相耦合,適于獲取每個發(fā)布屬性的屬性值,并根據(jù)確定的權(quán)值以及獲取的屬性值對至少一個發(fā)布屬性進行加權(quán)處理,計算得出的值作為待衡量新聞的重要性值;
[0083]衡量模塊330,與計算模塊320相耦合,適于將重要性值與預(yù)設(shè)的衡量規(guī)則進行比較,衡量出待衡量新聞的重要性。
[0084]在一個實施例中,發(fā)布屬性包括下列任意之一:
[0085]發(fā)布時間;
[0086]發(fā)布待衡量新聞的新聞源;
[0087]待衡量新聞被發(fā)布在新聞源上的位置;
[0088]發(fā)布內(nèi)容中的文字或圖片信息;
[0089]發(fā)布內(nèi)容的篇幅。
[0090]在一個實施例中,若至少一個發(fā)布屬性包括發(fā)布待衡量新聞的新聞源和/或待衡量新聞被發(fā)布在新聞源上的位置,在計算模塊320獲取每個發(fā)布屬性的屬性值之前,計算模塊320還適于:基于發(fā)布待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布待衡量新聞的新聞源的屬性值和/或待衡量新聞被發(fā)布在新聞源上的位置的屬性值。
[0091]在一個實施例中,計算模塊320還適于:統(tǒng)計指定時間段內(nèi)被發(fā)布在新聞源上的位置的多條新聞;確定多條新聞的參數(shù);根據(jù)確定的多條新聞的參數(shù),計算出新聞源上的位置的屬性值作為待衡量新聞被發(fā)布在新聞源上的位置的屬性值。
[0092]在一個實施例中,圖4示出了根據(jù)本發(fā)明一個實施例的衡量新聞重要性的裝置的另一種結(jié)構(gòu)示意圖。如圖4所示,在計算模塊320統(tǒng)計指定時間段內(nèi)被發(fā)布在新聞源上的位置的多條新聞之前,還包括:抓取模塊410,與計算模塊320相耦合,適于以預(yù)設(shè)的時間間隔從多個新聞源上抓取發(fā)布時間距當前不超過指定時長的新聞,記錄抓取的新聞首次被發(fā)布的時間、新聞源以及被發(fā)布在該新聞源上的位置。
[0093]在一個實施例中,多條新聞的參數(shù)包括下列至少之一:
[0094]多條新聞中每條新聞的網(wǎng)頁等級PageRank ;
[0095]多條新聞中每條新聞被點擊的次數(shù);
[0096]多條新聞中每條新聞被展示的次數(shù)。
[0097]在一個實施例中,計算模塊320還適于:根據(jù)確定的多條新聞中每條新聞的PageRank、被點擊的次數(shù)、被展示的次數(shù),分別計算得到多條新聞的PageRank、被點擊的次數(shù)、被展示的次數(shù)的平均值;將計算得到的平均值進行加權(quán)求和作為新聞源上的位置的屬性值。
[0098]在一個實施例中,若發(fā)布待衡量新聞的新聞源的個數(shù)為多個,計算模塊320還適于:基于發(fā)布待衡量新聞的多個新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布待衡量新聞的各個新聞源的屬性值和/或待衡量新聞被發(fā)布在各個新聞源上的位置的屬性值。
[0099]根據(jù)上述任意一個優(yōu)選實施例或多個優(yōu)選實施例的組合,本發(fā)明實施例能夠達到如下有益效果:
[0100]依據(jù)本發(fā)明提供的技術(shù)方案,確定待衡量新聞的至少一個發(fā)布屬性,以及每個發(fā)布屬性在新聞重要性中的權(quán)值,并獲取每個發(fā)布屬性的屬性值。進而根據(jù)確定的權(quán)值以及獲取的屬性值對至少一個發(fā)布屬性進行加權(quán)處理,計算得出的值作為待衡量新聞的重要性值。隨后將重要性值與預(yù)設(shè)的衡量規(guī)則進行比較,衡量出待衡量新聞的重要性。可見,本發(fā)明基于待衡量新聞的至少一個發(fā)布屬性來綜合衡量待衡量新聞的重要性,使得衡量結(jié)果更加客觀、準確、全面。由此解決了相關(guān)技術(shù)中若采用網(wǎng)頁等級(PageRank)方法確定新聞重要性而產(chǎn)生負面作用的問題。并且,新聞搜索引擎能夠根據(jù)本發(fā)明提供的客觀、準確、全面的待衡量新聞的重要性的衡量結(jié)果將重要性高的新聞盡量排在搜索結(jié)果的前面,方便用戶盡快找到價值較高的新聞。
[0101]本發(fā)明還公開了:
[0102]Al、一種衡量新聞重要性的方法,包括:
[0103]確定待衡量新聞的至少一個發(fā)布屬性,以及每個發(fā)布屬性在新聞重要性中的權(quán)值;
[0104]獲取每個發(fā)布屬性的屬性值,并根據(jù)確定的所述權(quán)值以及獲取的所述屬性值對所述至少一個發(fā)布屬性進行加權(quán)處理,計算得出的值作為所述待衡量新聞的重要性值;
[0105]將所述重要性值與預(yù)設(shè)的衡量規(guī)則進行比較,衡量出所述待衡量新聞的重要性。
[0106]A2、根據(jù)Al所述的方法,其中,所述發(fā)布屬性包括下列任意之一:
[0107]發(fā)布時間;
[0108]發(fā)布所述待衡量新聞的新聞源;
[0109]所述待衡量新聞被發(fā)布在新聞源上的位置;
[0110]發(fā)布內(nèi)容中的文字或圖片信息;
[0111]發(fā)布內(nèi)容的篇幅。
[0112]A3、根據(jù)Al或A2所述的方法,其中,
[0113]若所述至少一個發(fā)布屬性包括發(fā)布所述待衡量新聞的新聞源和/或所述待衡量新聞被發(fā)布在新聞源上的位置,
[0114]所述獲取每個發(fā)布屬性的屬性值之前,還包括:
[0115]基于發(fā)布所述待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布所述待衡量新聞的新聞源的屬性值和/或所述待衡量新聞被發(fā)布在所述新聞源上的位置的屬性值。
[0116]A4、根據(jù)A1-A3任一項所述的方法,其中,基于發(fā)布所述待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出所述待衡量新聞被發(fā)布在所述新聞源上的位置的屬性值,包括:
[0117]統(tǒng)計指定時間段內(nèi)被發(fā)布在所述新聞源上的所述位置的多條新聞;
[0118]確定所述多條新聞的參數(shù);
[0119]根據(jù)確定的所述多條新聞的參數(shù),計算出所述新聞源上的所述位置的屬性值作為所述待衡量新聞被發(fā)布在所述新聞源上的所述位置的屬性值。
[0120]A5、根據(jù)A1-A4任一項所述的方法,其中,統(tǒng)計指定時間段內(nèi)被發(fā)布在所述新聞源上的所述位置的多條新聞之前,還包括:
[0121]以預(yù)設(shè)的時間間隔從多個新聞源上抓取發(fā)布時間距當前不超過指定時長的新聞,記錄抓取的所述新聞首次被發(fā)布的時間、新聞源以及被發(fā)布在該新聞源上的位置。
[0122]A6、根據(jù)A1-A5任一項所述的方法,其中,所述多條新聞的參數(shù)包括下列至少之
[0123]所述多條新聞中每條新聞的網(wǎng)頁等級PageRank ;
[0124]所述多條新聞中每條新聞被點擊的次數(shù);
[0125]所述多條新聞中每條新聞被展示的次數(shù)。
[0126]A7、根據(jù)A1-A6任一項所述的方法,其中,根據(jù)確定的所述多條新聞的參數(shù),計算出所述新聞源上的所述位置的屬性值,包括:
[0127]根據(jù)確定的所述多條新聞中每條新聞的PageRank、被點擊的次數(shù)、被展示的次數(shù),分別計算得到所述多條新聞的PageRank、被點擊的次數(shù)、被展示的次數(shù)的平均值;
[0128]將計算得到的所述平均值進行加權(quán)求和作為所述新聞源上的所述位置的屬性值。
[0129]A8、根據(jù)A1-A7任一項所述的方法,其中,
[0130]若發(fā)布所述待衡量新聞的新聞源的個數(shù)為多個,
[0131]基于發(fā)布所述待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布所述待衡量新聞的新聞源的屬性值和/或所述待衡量新聞被發(fā)布在所述新聞源上的位置的屬性值,包括:
[0132]基于發(fā)布所述待衡量新聞的多個新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布所述待衡量新聞的各個新聞源的屬性值和/或所述待衡量新聞被發(fā)布在各個所述新聞源上的位置的屬性值。
[0133]B9、一種衡量新聞重要性的裝置,包括:
[0134]確定模塊,適于確定待衡量新聞的至少一個發(fā)布屬性,以及每個發(fā)布屬性在新聞重要性中的權(quán)值;
[0135]計算模塊,適于獲取每個發(fā)布屬性的屬性值,并根據(jù)確定的所述權(quán)值以及獲取的所述屬性值對所述至少一個發(fā)布屬性進行加權(quán)處理,計算得出的值作為所述待衡量新聞的重要性值;
[0136]衡量模塊,適于將所述重要性值與預(yù)設(shè)的衡量規(guī)則進行比較,衡量出所述待衡量新聞的重要性。
[0137]B10、根據(jù)B9所述的裝置,其中,所述發(fā)布屬性包括下列任意之一:
[0138]發(fā)布時間;
[0139]發(fā)布所述待衡量新聞的新聞源;
[0140]所述待衡量新聞被發(fā)布在新聞源上的位置;
[0141]發(fā)布內(nèi)容中的文字或圖片信息;
[0142]發(fā)布內(nèi)容的篇幅。
[0143]B11、根據(jù)B9或BlO所述的裝置,其中,
[0144]若所述至少一個發(fā)布屬性包括發(fā)布所述待衡量新聞的新聞源和/或所述待衡量新聞被發(fā)布在新聞源上的位置,
[0145]在所述計算模塊獲取每個發(fā)布屬性的屬性值之前,所述計算模塊還適于:
[0146]基于發(fā)布所述待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布所述待衡量新聞的新聞源的屬性值和/或所述待衡量新聞被發(fā)布在所述新聞源上的位置的屬性值。
[0147]B12、根據(jù)B9-B11任一項所述的裝置,其中,所述計算模塊還適于:
[0148]統(tǒng)計指定時間段內(nèi)被發(fā)布在所述新聞源上的所述位置的多條新聞;
[0149]確定所述多條新聞的參數(shù);
[0150]根據(jù)確定的所述多條新聞的參數(shù),計算出所述新聞源上的所述位置的屬性值作為所述待衡量新聞被發(fā)布在所述新聞源上的所述位置的屬性值。
[0151]B13、根據(jù)B9-B12任一項所述的裝置,其中,在所述計算模塊統(tǒng)計指定時間段內(nèi)被發(fā)布在所述新聞源上的所述位置的多條新聞之前,還包括:
[0152]抓取模塊,適于以預(yù)設(shè)的時間間隔從多個新聞源上抓取發(fā)布時間距當前不超過指定時長的新聞,記錄抓取的所述新聞首次被發(fā)布的時間、新聞源以及被發(fā)布在該新聞源上的位置。
[0153]B14、根據(jù)B9-B13任一項所述的裝置,其中,所述多條新聞的參數(shù)包括下列至少之
[0154]所述多條新聞中每條新聞的網(wǎng)頁等級PageRank ;
[0155]所述多條新聞中每條新聞被點擊的次數(shù);
[0156]所述多條新聞中每條新聞被展示的次數(shù)。
[0157]B15、根據(jù)B9-B14任一項所述的裝置,其中,所述計算模塊還適于:
[0158]根據(jù)確定的所述多條新聞中每條新聞的PageRank、被點擊的次數(shù)、被展示的次數(shù),分別計算得到所述多條新聞的PageRank、被點擊的次數(shù)、被展示的次數(shù)的平均值;
[0159]將計算得到的所述平均值進行加權(quán)求和作為所述新聞源上的所述位置的屬性值。
[0160]B16、根據(jù)B9-B15任一項所述的裝置,其中,若發(fā)布所述待衡量新聞的新聞源的個數(shù)為多個,所述計算模塊還適于:
[0161]基于發(fā)布所述待衡量新聞的多個新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布所述待衡量新聞的各個新聞源的屬性值和/或所述待衡量新聞被發(fā)布在各個所述新聞源上的位置的屬性值。
[0162]在此處所提供的說明書中,說明了大量具體細節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細節(jié)的情況下實踐。在一些實例中,并未詳細示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。
[0163]類似地,應(yīng)當理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應(yīng)將該公開的方法解釋成反映如下意圖:即所要求保護的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循【具體實施方式】的權(quán)利要求書由此明確地并入該【具體實施方式】,其中每個權(quán)利要求本身都作為本發(fā)明的單獨實施例。
[0164]本領(lǐng)域那些技術(shù)人員可以理解,可以對實施例中的設(shè)備中的模塊進行自適應(yīng)性地改變并且把它們設(shè)置在與該實施例不同的一個或多個設(shè)備中??梢园褜嵤├械哪K或單元或組件組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者單元中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的的替代特征來代替。
[0165]此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實施例。例如,在權(quán)利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。
[0166]本發(fā)明的各個部件實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當理解,可以在實踐中使用微處理器或者數(shù)字信號處理器(DSP)來實現(xiàn)根據(jù)本發(fā)明實施例的衡量新聞重要性的裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。
[0167]應(yīng)該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計出替換實施例。在權(quán)利要求中,不應(yīng)將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來實現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
[0168]至此,本領(lǐng)域技術(shù)人員應(yīng)認識到,雖然本文已詳盡示出和描述了本發(fā)明的多個示例性實施例,但是,在不脫離本發(fā)明精神和范圍的情況下,仍可根據(jù)本發(fā)明公開的內(nèi)容直接確定或推導(dǎo)出符合本發(fā)明原理的許多其他變型或修改。因此,本發(fā)明的范圍應(yīng)被理解和認定為覆蓋了所有這些其他變型或修改。
【權(quán)利要求】
1.一種衡量新聞重要性的方法,包括: 確定待衡量新聞的至少一個發(fā)布屬性,以及每個發(fā)布屬性在新聞重要性中的權(quán)值;獲取每個發(fā)布屬性的屬性值,并根據(jù)確定的所述權(quán)值以及獲取的所述屬性值對所述至少一個發(fā)布屬性進行加權(quán)處理,計算得出的值作為所述待衡量新聞的重要性值; 將所述重要性值與預(yù)設(shè)的衡量規(guī)則進行比較,衡量出所述待衡量新聞的重要性。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述發(fā)布屬性包括下列任意之一: 發(fā)布時間; 發(fā)布所述待衡量新聞的新聞源; 所述待衡量新聞被發(fā)布在新聞源上的位置; 發(fā)布內(nèi)容中的文字或圖片信息; 發(fā)布內(nèi)容的篇幅。
3.根據(jù)權(quán)利要求1或2所述的方法,其中, 若所述至少一個發(fā)布屬性包括發(fā)布所述待衡量新聞的新聞源和/或所述待衡量新聞被發(fā)布在新聞源上的位置, 所述獲取每個發(fā)布屬性的屬性值之前,還包括: 基于發(fā)布所述待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布所述待衡量新聞的新聞源的屬性值和/或所述待衡量新聞被發(fā)布在所述新聞源上的位置的屬性值。
4.根據(jù)權(quán)利要求1-3任一項所述的方法,其中,基于發(fā)布所述待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出所述待衡量新聞被發(fā)布在所述新聞源上的位置的屬性值,包括: 統(tǒng)計指定時間段內(nèi)被發(fā)布在所述新聞源上的所述位置的多條新聞; 確定所述多條新聞的參數(shù); 根據(jù)確定的所述多條新聞的參數(shù),計算出所述新聞源上的所述位置的屬性值作為所述待衡量新聞被發(fā)布在所述新聞源上的所述位置的屬性值。
5.根據(jù)權(quán)利要求1-4任一項所述的方法,其中,統(tǒng)計指定時間段內(nèi)被發(fā)布在所述新聞源上的所述位置的多條新聞之前,還包括: 以預(yù)設(shè)的時間間隔從多個新聞源上抓取發(fā)布時間距當前不超過指定時長的新聞,記錄抓取的所述新聞首次被發(fā)布的時間、新聞源以及被發(fā)布在該新聞源上的位置。
6.根據(jù)權(quán)利要求1-5任一項所述的方法,其中,所述多條新聞的參數(shù)包括下列至少之 所述多條新聞中每條新聞的網(wǎng)頁等級PageRank ; 所述多條新聞中每條新聞被點擊的次數(shù); 所述多條新聞中每條新聞被展示的次數(shù)。
7.根據(jù)權(quán)利要求1-6任一項所述的方法,其中,根據(jù)確定的所述多條新聞的參數(shù),計算出所述新聞源上的所述位置的屬性值,包括: 根據(jù)確定的所述多條新聞中每條新聞的PageRank、被點擊的次數(shù)、被展示的次數(shù),分別計算得到所述多條新聞的PageRank、被點擊的次數(shù)、被展示的次數(shù)的平均值; 將計算得到的所述平均值進行加權(quán)求和作為所述新聞源上的所述位置的屬性值。
8.根據(jù)權(quán)利要求1-7任一項所述的方法,其中, 若發(fā)布所述待衡量新聞的新聞源的個數(shù)為多個, 基于發(fā)布所述待衡量新聞的新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布所述待衡量新聞的新聞源的屬性值和/或所述待衡量新聞被發(fā)布在所述新聞源上的位置的屬性值,包括: 基于發(fā)布所述待衡量新聞的多個新聞源的網(wǎng)頁鏈接關(guān)系,計算出發(fā)布所述待衡量新聞的各個新聞源的屬性值和/或所述待衡量新聞被發(fā)布在各個所述新聞源上的位置的屬性值。
9.一種衡量新聞重要性的裝置,包括: 確定模塊,適于確定待衡量新聞的至少一個發(fā)布屬性,以及每個發(fā)布屬性在新聞重要性中的權(quán)值; 計算模塊,適于獲取每個發(fā)布屬性的屬性值,并根據(jù)確定的所述權(quán)值以及獲取的所述屬性值對所述至少一個發(fā)布屬性進行加權(quán)處理,計算得出的值作為所述待衡量新聞的重要性值; 衡量模塊,適于將所述重要性值與預(yù)設(shè)的衡量規(guī)則進行比較,衡量出所述待衡量新聞的重要性。
10.根據(jù)權(quán)利要求9所述的裝置,其中,所述發(fā)布屬性包括下列任意之一: 發(fā)布時間; 發(fā)布所述待衡量新聞的新聞源; 所述待衡量新聞被發(fā)布在新聞源上的位置; 發(fā)布內(nèi)容中的文字或圖片信息; 發(fā)布內(nèi)容的篇幅。
【文檔編號】G06F17/30GK104331419SQ201410539702
【公開日】2015年2月4日 申請日期:2014年10月13日 優(yōu)先權(quán)日:2014年10月13日
【發(fā)明者】魏少俊 申請人:北京奇虎科技有限公司, 奇智軟件(北京)有限公司