亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

Web信息處理方法及裝置的制作方法

文檔序號:6336710閱讀:244來源:國知局
專利名稱:Web信息處理方法及裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及TOB信息處理領(lǐng)域,尤其涉及WEB信息處理方法及裝置。
背景技術(shù)
隨著WEB技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)所能夠傳播的信息越來越豐富、且更新速度較快, 使網(wǎng)絡(luò)媒體漸漸成為人們獲取信息的重要平臺之一。新聞是人們生活中不可或缺的重要信息,人們通??梢酝ㄟ^直接瀏覽新聞網(wǎng)站獲取新聞信息??墒?,人們在瀏覽新聞網(wǎng)站時,常常是沒有待處理的,而各個新聞網(wǎng)站又都有著相當(dāng)大的新聞信息量,面對龐雜的網(wǎng)絡(luò)新聞,讀者常常會感到不知從何入手。為了讀者閱讀的方便,各個新聞網(wǎng)站往往都將新聞信息按照一定的規(guī)律進行排行,比如按新聞信息的發(fā)布時間排行,或者按新聞信息的點擊率排行,或者按照新聞信息的關(guān)注度排行。引導(dǎo)讀者快速的找到有價值的新聞信息。但是,各個新聞網(wǎng)站的新聞信息的排行,往往都是其網(wǎng)站內(nèi)部的新聞信息排行情況,和該網(wǎng)站的知名度、使用率等許多因素相關(guān),不能從客觀上反映該新聞的真實排行情況。人們也可以通過搜索引擎直接搜索待處理新聞信息,而搜索引擎搜索查詢互聯(lián)網(wǎng)上發(fā)布的各種新聞信息,并將搜索到的新聞信息向用戶展示,但是,并不能將互聯(lián)網(wǎng)上的新聞信息按照一定的規(guī)律排行并向用戶展示。

發(fā)明內(nèi)容
本發(fā)明的實施例提供一種TOB信息處理方法及裝置,能夠?qū)⒁粋€或者多個統(tǒng)一資源定位符對應(yīng)的信息資源的預(yù)定WEB信息按照預(yù)設(shè)的規(guī)律排行。為達到上述目的,本發(fā)明的實施例采用如下技術(shù)方案一種WEB信息處理方法,包括獲取待處理信息,所述待處理信息包含來自一個或多個統(tǒng)一資源定位符對應(yīng)的信息資源的目標(biāo)信息;將所述待處理信息按照預(yù)設(shè)的第一規(guī)則進行排序。一種WEB信息處理裝置,包括第一獲取單元,用于獲取待處理信息,所述待處理信息包含來自一個或多個統(tǒng)一資源定位符對應(yīng)的信息資源的目標(biāo)信息;排序單元,用于將所述待處理信息按照預(yù)設(shè)的第一規(guī)則進行排序。本發(fā)明實施例提供的TOB信息處理方法及裝置,將獲取到的來自一個或多個統(tǒng)一資源定位符對應(yīng)的信息資源的WEB信息按照預(yù)設(shè)的規(guī)則進行排序。使用戶能夠同時得到來自一個或多個web service (網(wǎng)絡(luò))的WEB信息,并且所述來自一個或多個web service的 WEB信息的順序是按照預(yù)設(shè)的排序規(guī)則排好的。


為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明實施例中TOB信息處理方法的流程圖;圖2為本發(fā)明實施例中另一種WEB信息處理方法的流程圖;圖3為圖2中步驟201的流程圖;圖4為圖2中步驟202的流程圖;圖5為圖2中步驟204的流程圖;圖6為本發(fā)明實施例中TOB信息處理裝置的結(jié)構(gòu)圖;圖7為本發(fā)明實施例中另一種WEB信息處理裝置的結(jié)構(gòu)圖。
具體實施例方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。本發(fā)明實施例提供了一種WEB信息處理方法,如圖1所示,包括以下步驟101、獲取待處理的TOB信息,所述待處理的TOB信息包含來自一個或多個統(tǒng)一資源定位符對應(yīng)的信息資源的目標(biāo)信息。本實施例中待處理的TOB信息可以是TOB信息獲取裝置直接采集的,也可以是TOB 信息獲取裝置接收第三方發(fā)來的數(shù)據(jù)。待處理的WEB信息可以是來自一個或者多個網(wǎng)站的新聞信息、論壇信息等。102、將所述待處理的TOB信息按照預(yù)設(shè)的第一規(guī)則進行排序。在獲取到待處理的TOB信息后,根據(jù)預(yù)設(shè)的第一規(guī)則對待處理的WEB信息進行排序,第一規(guī)則可以根據(jù)需要而設(shè)定,比如按照待處理的WEB信息的訪問量排序,或者按照待處理的WEB信息的發(fā)布先后順序排序,或者按照待處理的WEB信息的訪問量的變化率排序寸。本實施例提供的TOB信息處理方法,將獲取到的來自一個或多個統(tǒng)一資源定位符對應(yīng)的信息資源的WEB信息按照預(yù)設(shè)的規(guī)則進行排序。使用戶能夠同時得到來自一個或多個web service的TOB信息,并且所述來自一個或多個webservice的TOB信息的順序是按照預(yù)設(shè)的排序規(guī)則排好的。本發(fā)明實施例提供了另一種TOB信息處理方法,如圖2所示,包括以下步驟201、獲取待處理的TOB信息,采用元搜索的方式從預(yù)設(shè)的一個或多個統(tǒng)一資源定位符對應(yīng)的資源中獲取目標(biāo)信息,將獲取到的目標(biāo)信息作為待處理的WEB信息,待處理的 WEB信息包含來自一個或多個統(tǒng)一資源定位符對應(yīng)的信息資源的目標(biāo)信息。本實施方式中,可以采用元搜索系統(tǒng)從預(yù)設(shè)的一個或多個統(tǒng)一資源定位符對應(yīng)的資源中獲取目標(biāo)信息。目標(biāo)信息可以是新聞信息、論壇信息等各種希望獲取的信息。一個或多個統(tǒng)一資源定位符對應(yīng)的資源可以是網(wǎng)站中的各種信息資源。下面以從預(yù)先設(shè)定的一個或者多個網(wǎng)站獲取新聞信息的處理方法為例,說明本發(fā)明實施例提供的WEB信息處理方法首先配置元搜索訪問的webService數(shù)據(jù)來源接口及網(wǎng)站列表,然后啟動網(wǎng)絡(luò)新聞監(jiān)控線程定時掃描數(shù)據(jù)來源,等待接收網(wǎng)絡(luò)新聞信息。如圖3所示,在本實施例中,步驟 201可以包括以下步驟301、查詢目標(biāo)信息監(jiān)控線程是否獲取到目標(biāo)信息。網(wǎng)絡(luò)新聞信息監(jiān)控線程定時掃描新聞信息數(shù)據(jù)來源接口,例如,每隔T分鐘掃描一次數(shù)據(jù)源,T可以根據(jù)需要設(shè)置。查詢是否獲取到新聞信息,當(dāng)網(wǎng)絡(luò)新聞信息監(jiān)控線程獲取到新聞信息時,執(zhí)行步驟302 ;否則,執(zhí)行步驟301。302、讀取獲取到的目標(biāo)信息。在本實施例中,讀取數(shù)據(jù)來源接口提供的新聞信息。303、根據(jù)第三規(guī)則判斷獲取到的目標(biāo)信息是否為排行范圍內(nèi)的目標(biāo)信息。第三規(guī)則可以是預(yù)設(shè)好的淘汰規(guī)則,比如可以預(yù)先設(shè)定將獲取到的圖片資料、音頻資料、視頻資料等格式的文件淘汰。本實施例中,判斷獲取到的新聞信息是否符合第三規(guī)則,即過濾規(guī)則,過濾規(guī)則可以是用戶預(yù)先設(shè)置的一組頻道信息。只要獲取到的新聞信息是這組頻道中的信息,則不需要參與排行,拋棄這條信息。如果獲取到的新聞信息不是這組頻道中的信息,則進入步驟 304。這樣可以使排行更具有針對性,也更準確。304、當(dāng)所述獲取到的目標(biāo)信息為排行范圍內(nèi)的目標(biāo)信息時,更新所述目標(biāo)信息的屬性值,并存儲所述獲取到的目標(biāo)信息。本實施例中,新聞信息的屬性可以包括標(biāo)題、url (統(tǒng)一資源定位符)、今日訪問量、昨日同期訪問量、摘要、排行順序、相似文檔標(biāo)識、日期、作者、來源,訪問量變化率等屬性。根據(jù)屬性url的值從數(shù)據(jù)庫中讀取該新聞信息的歷史數(shù)據(jù),并根據(jù)歷史數(shù)據(jù)中該條新聞信息的屬性值,更新該新聞信息的昨日訪問量等屬性值。根據(jù)網(wǎng)絡(luò)新聞信息監(jiān)控線程獲取到的該新聞信息的數(shù)據(jù),更新該新聞信息的摘要屬性值、相似文檔屬性值等。305、將獲取到的新聞信息按照預(yù)設(shè)規(guī)則進行排序。本步驟中的預(yù)設(shè)規(guī)則可以是新聞信息的訪問量、新聞信息的發(fā)布時間等順序。202、按照預(yù)設(shè)的第二規(guī)則從所述待處理信息中獲取有效目標(biāo)信息。第二規(guī)則可以根據(jù)需要設(shè)定,比如,可以預(yù)先設(shè)定將從url地址為http://0001、 http://00012和http://0003獲取到的目標(biāo)信息過濾掉。本實施例中,依據(jù)預(yù)先設(shè)置的淘汰規(guī)則對接收的網(wǎng)絡(luò)新聞信息進行過濾,將屬于預(yù)先設(shè)置的淘汰規(guī)則內(nèi)的無效數(shù)據(jù)拋棄,保留有效的新聞信息。如圖4所示,在本實施例中,步驟202可以包括以下步驟401、從待處理信息中讀取所述目標(biāo)信息,并將所述目標(biāo)信息對應(yīng)的統(tǒng)一資源定位符轉(zhuǎn)換成預(yù)定格式。本實施例中,設(shè)定新聞信息的url屬性值的標(biāo)準格式,比如可以將url的標(biāo)準格式設(shè)定為http://的形式,讀取新聞信息并將新聞信息的url屬性值轉(zhuǎn)換成預(yù)定格式。402、判斷轉(zhuǎn)換后的統(tǒng)一資源定位符是否與所述第二規(guī)則相匹配。當(dāng)轉(zhuǎn)換后的統(tǒng)一資源定位符與所述第二規(guī)則相匹配時,將該目標(biāo)信息丟棄,流程結(jié)束。當(dāng)轉(zhuǎn)換后的統(tǒng)一資源定位符與所述第二規(guī)則不相匹配時,執(zhí)行403。本實施例中,判斷轉(zhuǎn)換后的新聞信息的url屬性值是否與預(yù)設(shè)的第二規(guī)則中的一個或者多個url格式相匹配。如果轉(zhuǎn)換后的新聞信息的url屬性值與預(yù)設(shè)的第二規(guī)則中的一個或者多個url格式相匹配,則執(zhí)行步驟403,丟棄該新聞信息;否則執(zhí)行401。403、如果該目標(biāo)信息為有效新聞信息,獲取并存儲該新聞信息。本步驟過濾掉無效的新聞信息,使獲得的新聞信息排行結(jié)果更有針對性、更準確。203、更新由步驟201和202獲取的有效目標(biāo)信息的屬性值,并存儲目標(biāo)信息。作為本步驟的一種實施方式,本步驟可以包括查找目標(biāo)信息需要更新的屬性值,并更新目標(biāo)信息需要更新的屬性值。本實施例中,查找獲取的新聞信息需要更行的屬性。如果新聞信息是數(shù)據(jù)庫中已經(jīng)存在的新聞信息,則更新該新聞信息的昨日訪問量、摘要、相似文檔標(biāo)識等屬性值,如果新聞信息是數(shù)據(jù)庫中所沒有的新聞信息,則更新該新聞信息的相似文檔標(biāo)識屬性值。將已經(jīng)更新過的新聞信息上傳至數(shù)據(jù)庫中。204、為了使待處理的TOB信息的排序更有針對性、更準確,將待處理的WEB信息中內(nèi)容相同的目標(biāo)信息重復(fù)部分刪除,然后再將待處理的WEB信息按照預(yù)設(shè)的第一規(guī)則進行排序。如圖5所示,在本實施例中,步驟204可以包含以下步驟501、從待處理信息中查找并獲取內(nèi)容相同的目標(biāo)信息。本實施例中,從待處理的新聞信息中查找并獲取內(nèi)容相同的新聞信息。502、將獲取到的內(nèi)容相同的目標(biāo)信息合并成為一條目標(biāo)信息。本實施例中,將獲取到的內(nèi)容相同的新聞信息合并成為一條新聞信息。也可以將內(nèi)容相同的新聞信息中的一條保留,其它刪除。503、將待處理信息按照預(yù)設(shè)的第一規(guī)則進行排序。本實施例中,在刪除了獲取到的新聞信息中的重復(fù)內(nèi)容后,將待處理的新聞信息按照預(yù)定的第一規(guī)則排序。本步驟中的第一規(guī)則可以根據(jù)需要設(shè)定,比如可以是按照新聞信息的訪問量的多少進行排序,也可以按照新聞信息的最早發(fā)布時間進行排序,還可以按照新聞信息的訪問量的變化率進行排序。205、將排好順序的新聞信息上傳至數(shù)據(jù)庫中。206、按照不同的排序方式顯示排好順序的新聞信息。為了滿足不同用戶的需要,將排序好的新聞信息按照一定的排序方式顯示,比如可以按照當(dāng)日上升最快、當(dāng)日單條排行等方式排行并顯示。本發(fā)明實施例提供的TOB信息處理方法及裝置,對從一個或者多個網(wǎng)站獲取到的新聞信息進行排行,將獲取到的來自一個或多個統(tǒng)一資源定位符對應(yīng)的新聞信息按照預(yù)設(shè)的規(guī)則進行排序。使用戶能夠同時得到來自一個或多個webservice的新聞信息,并且所述來自一個或多個web service的新聞信息的順序是按照預(yù)設(shè)的排序規(guī)則排好的。本實施例所述的TOB信息處理方法,根據(jù)需要采集網(wǎng)絡(luò)新聞信息,并對其內(nèi)容進行分析,并將分析后的各數(shù)據(jù)項上傳至數(shù)據(jù)庫中。采用本發(fā)明WEB信息處理方法,把在各個網(wǎng)站獨立顯示的新聞信息集中采集到一起,并對其進行分析和處理,按照最新、最熱的排序規(guī)則進行排序,解決用戶在指定范圍網(wǎng)站中新聞進行綜合排行的問題,有助于及時發(fā)現(xiàn)當(dāng)前的新聞熱點。本發(fā)明實施例提供了一種TOB信息處理裝置,如圖6所示,包括第一獲取單元 61、排序單元62。其中,所述第一獲取單元61獲取待處理信息,待處理信息包含來自一個或多個統(tǒng)一資源定位符對應(yīng)的信息資源的目標(biāo)信息;所述排序單元62將待處理信息按照預(yù)設(shè)的第一規(guī)則進行排序。作為本實施例的一種實施方式,本實施例中待處理的WEB信息可以是TOB信息獲取裝置直接采集的,也可以是WEB信息獲取裝置接收第三方發(fā)來的數(shù)據(jù)。待處理的WEB信息可以是來自一個或者多個網(wǎng)站的新聞信息、論壇信息等。在獲取到待處理的TOB信息后,根據(jù)預(yù)設(shè)的第一規(guī)則對待處理的WEB信息進行排序,第一規(guī)則可以根據(jù)需要而設(shè)定,比如按照待處理的WEB信息的訪問量排序,或者按照待處理的WEB信息的發(fā)布先后順序排序,或者按照待處理的WEB信息的訪問量的變化率排序寸。本實施例提供的TOB信息處理裝置,將獲取到的來自一個或多個統(tǒng)一資源定位符對應(yīng)的信息資源的WEB信息按照預(yù)設(shè)的規(guī)則進行排序。使用戶能夠同時得到來自一個或多個web service的TOB信息,并且所述來自一個或多個webservice的TOB信息的順序是按照預(yù)設(shè)的排序規(guī)則排好的。本發(fā)明實施例提供另一種TOB信息處理裝置,如圖7所示,包括第一獲取單元 71、第二獲取單元72、更新單元73、排序單元74。其中,所述第一獲取單元71包括第一查詢模塊711、讀取模塊712、判斷模塊 713、第一更新模塊714。所述第二獲取單元72包括轉(zhuǎn)換單元721、判斷單元722、刪除單元723。所述更新單元73包括第二查詢模塊731、第二更新模塊732。所述排序單元74包括獲取模塊741、合并模塊742、排序模塊743。所述第一獲取單元71采用元搜索的方式從預(yù)設(shè)的一個或多個統(tǒng)一資源定位符對應(yīng)的資源中獲取目標(biāo)信息。具體為所述第一查詢模塊711查詢目標(biāo)信息監(jiān)控線程是否獲取到所述目標(biāo)信息;當(dāng)所述目標(biāo)信息監(jiān)控線程獲取到所述目標(biāo)信息時,所述讀取模塊712 讀取獲取到的目標(biāo)信息;所述判斷模塊713根據(jù)第三規(guī)則判斷所述獲取到的目標(biāo)信息是否為排行范圍內(nèi)的目標(biāo)信息;當(dāng)所述獲取到的目標(biāo)信息為排行范圍內(nèi)的目標(biāo)信息時,所述第一更新模塊更新所述目標(biāo)信息的屬性值,并存儲所述獲取到的目標(biāo)信息。以將從一個或者多個網(wǎng)站獲取的新聞信息進行排行為例,本實施方式中,第一獲取單元71可以采用元搜索系統(tǒng)從預(yù)設(shè)的一個或多個統(tǒng)一資源定位符對應(yīng)的資源中獲取目標(biāo)信息。目標(biāo)信息可以是新聞信息、論壇信息等各種希望獲取的信息。一個或多個統(tǒng)一資源定位符對應(yīng)的資源可以是網(wǎng)站中的各種信息資源。第三規(guī)則可以是預(yù)設(shè)好的淘汰規(guī)則,比如可以預(yù)先設(shè)定將獲取到的圖片資料、音頻資料、視頻資料等格式的文件淘汰。
本實施例中,判斷獲取到的新聞信息是否符合第三規(guī)則,即過濾規(guī)則,過濾規(guī)則可以是用戶預(yù)先設(shè)置的一組頻道信息。只要獲取到的新聞信息是這組頻道中的信息,則不需要參與排行,拋棄這條信息。所述第二獲取單元72按照預(yù)設(shè)的第二規(guī)則從所述待處理信息中獲取有效目標(biāo)信息。包括所述轉(zhuǎn)換單元721從所述待處理信息中讀取所述目標(biāo)信息,并將所述目標(biāo)信息對應(yīng)的統(tǒng)一資源定位符轉(zhuǎn)換成預(yù)定格式;所述判斷單元722判斷所述轉(zhuǎn)換后的統(tǒng)一資源定位符是否與所述第二規(guī)則相匹配;所述刪除單元723當(dāng)所述轉(zhuǎn)換后的統(tǒng)一資源定位符與所述第二規(guī)則相匹配時,將所述目標(biāo)信息刪除。第二規(guī)則可以根據(jù)需要設(shè)定,比如,可以預(yù)先設(shè)定將從url地址為httD://00011、 http //00012和httD ://00013獲取到的目標(biāo)信息過濾掉。本實施例中,判斷轉(zhuǎn)換后的新聞信息的url屬性值是否與預(yù)設(shè)的第二規(guī)則中的一個或者多個url格式相匹配。如果轉(zhuǎn)換后的新聞信息的url屬性值與預(yù)設(shè)的第二規(guī)則中的一個或者多個url格式相匹配,丟棄該新聞信息。所述更新單元73更新所述目標(biāo)信息的屬性值。包括所述第二查詢模塊731查找所述目標(biāo)信息需要更新的屬性值;所述第二更新模塊732更新所述目標(biāo)信息需要更新的屬性值。以將從一個或者多個網(wǎng)站獲取的新聞信息進行排行為例,本實施例中,新聞信息的屬性可以包括標(biāo)題、url (統(tǒng)一資源定位符)、今日訪問量、昨日同期訪問量、摘要、排行順序、相似文檔標(biāo)識、日期、作者、來源,訪問量變化率等屬性。根據(jù)屬性url的值從數(shù)據(jù)庫中讀取該新聞信息的歷史數(shù)據(jù),并根據(jù)歷史數(shù)據(jù)中該條新聞信息的屬性值,更新該新聞信息的昨日訪問量等屬性值。根據(jù)網(wǎng)絡(luò)新聞信息監(jiān)控線程獲取到的該新聞信息的數(shù)據(jù),更新該新聞信息的摘要屬性值、相似文檔屬性值等。所述排序單元74將待處理信息按照預(yù)設(shè)的第一規(guī)則進行排序。包括所述獲取模塊741從所述待處理信息中查找并獲取內(nèi)容相同的目標(biāo)信息;所述合并模塊742將獲取到的內(nèi)容相同的目標(biāo)信息合并成為一條目標(biāo)信息;所述排序模塊743將所述待處理信息按照預(yù)設(shè)的第一規(guī)則進行排序。以將從一個或者多個網(wǎng)站獲取的新聞信息進行排行為例,第一規(guī)則可以根據(jù)需要設(shè)定,比如可以是按照新聞信息的訪問量的多少進行排序,也可以按照新聞信息的最早發(fā)布時間進行排序,還可以按照新聞信息的訪問量的變化率進行排序。本實施例提供的TOB信息處理裝置,將獲取到的來自一個或多個統(tǒng)一資源定位符對應(yīng)的信息資源的WEB信息按照預(yù)設(shè)的規(guī)則進行排序。使用戶能夠同時得到來自一個或多個web service的TOB信息,并且所述來自一個或多個webservice的TOB信息的順序是按照預(yù)設(shè)的排序規(guī)則排好的。通過以上的實施方式的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件的方式來實現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在可讀取的存儲介質(zhì)中,如計算機的軟盤,硬盤或光盤等,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述的方法。 以上所述,僅為本發(fā)明的具體實施方式
,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應(yīng)所述以權(quán)利要求的保護范圍為準。
權(quán)利要求
1.一種TOB信息處理方法,其特征在于,包括獲取待處理信息,所述待處理信息包含來自一個或多個統(tǒng)一資源定位符對應(yīng)的信息資源的目標(biāo)信息;將所述待處理信息按照預(yù)設(shè)的第一規(guī)則進行排序。
2.根據(jù)權(quán)利要求1所述的WEB信息處理方法,其特征在于,所述獲取待處理信息為采用元搜索的方式從預(yù)設(shè)的一個或多個統(tǒng)一資源定位符對應(yīng)的資源中獲取目標(biāo)信息。
3.根據(jù)權(quán)利要求2所述的TOB信息處理方法,其特征在于,在所述將所述待處理信息按照預(yù)設(shè)的第一規(guī)則進行排序之前,所述方法還包括更新所述目標(biāo)信息的屬性值。
4.根據(jù)權(quán)利要求3所述的TOB信息處理方法,其特征在于,在所述更新所述目標(biāo)信息的屬性值之前,所述方法還包括按照預(yù)設(shè)的第二規(guī)則從所述待處理信息中獲取有效目標(biāo)信息。
5.根據(jù)權(quán)利要求2至4任一項所述的TOB信息處理方法,其特征在于,所述采用元搜索的方式從預(yù)設(shè)的一個或多個統(tǒng)一資源定位符對應(yīng)的資源中獲取目標(biāo)信息包括查詢目標(biāo)信息監(jiān)控線程是否獲取到所述目標(biāo)信息; 當(dāng)所述目標(biāo)信息監(jiān)控線程獲取到所述目標(biāo)信息時,讀取獲取到的目標(biāo)信息; 根據(jù)第三規(guī)則判斷所述獲取到的目標(biāo)信息是否為排行范圍內(nèi)的目標(biāo)信息; 當(dāng)所述獲取到的目標(biāo)信息為排行范圍內(nèi)的目標(biāo)信息時,更新所述目標(biāo)信息的屬性值, 并存儲所述獲取到的目標(biāo)信息。
6.根據(jù)權(quán)利要求3或4所述的TOB信息處理方法,其特征在于,所述更新所述目標(biāo)信息的屬性值包括查找所述目標(biāo)信息需要更新的屬性值; 更新所述目標(biāo)信息需要更新的屬性值。
7.根據(jù)權(quán)利要求4所述的TOB信息處理方法,其特征在于,所述按照預(yù)設(shè)的第二規(guī)則從所述待處理信息中獲取有效目標(biāo)信息包括從所述待處理信息中讀取所述目標(biāo)信息,并將所述目標(biāo)信息對應(yīng)的統(tǒng)一資源定位符轉(zhuǎn)換成預(yù)定格式;判斷所述轉(zhuǎn)換后的統(tǒng)一資源定位符是否與所述第二規(guī)則相匹配;當(dāng)所述轉(zhuǎn)換后的統(tǒng)一資源定位符與所述第二規(guī)則相匹配時,將所述目標(biāo)信息丟棄。
8.根據(jù)權(quán)利要求1至4任一項所述的TOB信息處理方法,其特征在于,所述將所述待處理信息按照預(yù)設(shè)的第一規(guī)則進行排序包括從所述待處理信息中查找并獲取內(nèi)容相同的目標(biāo)信息; 將獲取到的內(nèi)容相同的目標(biāo)信息合并成為一條目標(biāo)信息; 將所述待處理信息按照預(yù)設(shè)的第一規(guī)則進行排序。
9.一種TOB信息處理裝置,其特征在于,包括第一獲取單元,用于獲取待處理信息,所述待處理信息包含來自一個或多個統(tǒng)一資源定位符對應(yīng)的信息資源的目標(biāo)信息;排序單元,用于將所述待處理信息按照預(yù)設(shè)的第一規(guī)則進行排序。
10.根據(jù)權(quán)利要求9所述的TOB信息處理裝置,其特征在于,所述第一獲取單元獲取待處理信息為所述第一獲取單元采用元搜索的方式從預(yù)設(shè)的一個或多個統(tǒng)一資源定位符對應(yīng)的資源中獲取目標(biāo)信息。
11.根據(jù)權(quán)利要求10所述的TOB信息處理裝置,其特征在于,所述TOB信息處理裝置還包括更新單元,用于更新所述目標(biāo)信息的屬性值。
12.根據(jù)權(quán)利要求11所述的WEB信息處理裝置,其特征在于,所述TOB信息處理裝置還包括第二獲取單元,用于按照預(yù)設(shè)的第二規(guī)則從所述待處理信息中獲取有效目標(biāo)信息。
13.根據(jù)權(quán)利要求10至12任一項所述的TOB信息處理裝置,其特征在于,所述第一獲取單元包括第一查詢模塊,用于查詢目標(biāo)信息監(jiān)控線程是否獲取到所述目標(biāo)信息; 讀取模塊,用于當(dāng)所述目標(biāo)信息監(jiān)控線程獲取到所述目標(biāo)信息時,讀取獲取到的目標(biāo) fn息;判斷模塊,用于根據(jù)第三規(guī)則判斷所述獲取到的目標(biāo)信息是否為排行范圍內(nèi)的目標(biāo)信息;第一更新模塊,用于當(dāng)所述獲取到的目標(biāo)信息為排行范圍內(nèi)的目標(biāo)信息時,更新所述目標(biāo)信息的屬性值,并存儲所述獲取到的目標(biāo)信息。
14.根據(jù)權(quán)利要求11或12所述的TOB信息處理裝置,其特征在于,所述更新單元包括 第二查詢模塊,用于查找所述目標(biāo)信息需要更新的屬性值;第二更新模塊,用于更新所述目標(biāo)信息需要更新的屬性值。
15.根據(jù)權(quán)利要求12所述的TOB信息處理裝置,其特征在于,所述第二獲取單元包括 轉(zhuǎn)換單元,用于從所述待處理信息中讀取所述目標(biāo)信息,并將所述目標(biāo)信息對應(yīng)的統(tǒng)一資源定位符轉(zhuǎn)換成預(yù)定格式;判斷單元,用于判斷所述轉(zhuǎn)換后的統(tǒng)一資源定位符是否與所述第二規(guī)則相匹配; 刪除單元,用于當(dāng)所述轉(zhuǎn)換后的統(tǒng)一資源定位符與所述第二規(guī)則相匹配時,將所述目標(biāo)信息刪除。
16.根據(jù)權(quán)利要求9至12任一項所述的TOB信息處理裝置,其特征在于,所述排序單元包括獲取模塊,用于從所述待處理信息中查找并獲取內(nèi)容相同的目標(biāo)信息; 合并模塊,用于將獲取到的內(nèi)容相同的目標(biāo)信息合并成為一條目標(biāo)信息; 排序模塊,用于將所述待處理信息按照預(yù)設(shè)的第一規(guī)則進行排序。
全文摘要
本發(fā)明實施例公開了一種WEB信息處理方法及裝置,涉及WEB信息處理領(lǐng)域,能夠?qū)⒁粋€或者多個統(tǒng)一資源定位符對應(yīng)的預(yù)定WEB信息按照預(yù)設(shè)的規(guī)律排行。包括獲取待處理信息,所述待處理信息包含來自一個或多個統(tǒng)一資源定位符對應(yīng)的信息資源的目標(biāo)信息;將所述待處理信息按照預(yù)設(shè)的第一規(guī)則進行排序。摘要應(yīng)用于WEB信息的排序,尤其應(yīng)用于網(wǎng)站新聞信息、論壇信息的排序。
文檔編號G06F17/30GK102479194SQ20101055796
公開日2012年5月30日 申請日期2010年11月22日 優(yōu)先權(quán)日2010年11月22日
發(fā)明者吳新麗, 孫紅娥, 張丹, 楊建武, 梁汝峰, 王松 申請人:北京北大方正電子有限公司, 北京大學(xué), 北大方正集團有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1