亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種信息聚合方法及系統(tǒng)的制作方法

文檔序號:9261393閱讀:703來源:國知局
一種信息聚合方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及信息聚合領(lǐng)域,尤其涉及一種信息聚合方法及系統(tǒng)。
【背景技術(shù)】
[0002]現(xiàn)有技術(shù)中,聚合網(wǎng)站會(huì)抓取多個(gè)不同網(wǎng)站的內(nèi)容,聚合后提供給用戶使用。例如,視頻網(wǎng)站都會(huì)有各種類型視頻的排行榜,以便讓用戶了解最熱的視頻內(nèi)容,而視頻網(wǎng)站一般都是通過每個(gè)視頻被觀看的次數(shù)(點(diǎn)擊數(shù))排序,從而得出最熱視頻的排行榜,聚合網(wǎng)站則會(huì)將這些視頻網(wǎng)站的排行榜數(shù)據(jù)聚合在一起形成新的排行榜,提供給用戶使用。
[0003]但,以視頻網(wǎng)站為例,現(xiàn)有的聚合網(wǎng)站存在以下問題:因?yàn)樽ト〉氖遣煌曨l網(wǎng)站的排行榜數(shù)據(jù),而不同視頻網(wǎng)站的用戶數(shù)量大都不在一個(gè)基數(shù),所以每個(gè)網(wǎng)站的視頻被觀看次數(shù)也大都不在一個(gè)基數(shù),所以聚合網(wǎng)站若將各視頻網(wǎng)站的排行榜直接抓取過來使用,則無法反映出各視頻真實(shí)的熱度。
[0004]因此,現(xiàn)有技術(shù)還有待于改進(jìn)和發(fā)展。

【發(fā)明內(nèi)容】

[0005]鑒于上述現(xiàn)有技術(shù)的不足,本發(fā)明的目的在于提供一種信息聚合方法及系統(tǒng),旨在解決現(xiàn)有的信息聚合方法無法真實(shí)反映信息的熱度的問題。
[0006]本發(fā)明的技術(shù)方案如下:
一種信息聚合方法,其中,包括步驟:
A、抓取多個(gè)網(wǎng)站的信息庫數(shù)據(jù),并為每一網(wǎng)站配置一個(gè)權(quán)重值;
B、對各網(wǎng)站的信息庫數(shù)據(jù)進(jìn)行去重處理,將各網(wǎng)站信息庫數(shù)據(jù)中相同內(nèi)容的信息過濾,只保留其中一條權(quán)重值最聞的網(wǎng)站的?目息;
C、按信息庫中的信息排序?qū)⒏骶W(wǎng)站去重處理之后的信息庫數(shù)據(jù)進(jìn)行重新排列;
D、將各網(wǎng)站按照權(quán)重大小進(jìn)行排序,然后按照網(wǎng)站排序依次從各網(wǎng)站的信息庫數(shù)據(jù)中抽取排列在前的信息,形成包含預(yù)定信息數(shù)量的聚合信息庫。
[0007]所述的信息聚合方法,其中,所述步驟D具體包括:
D1、預(yù)先設(shè)置聚合信息庫中的信息數(shù)量T ;
D2、計(jì)算需從每個(gè)網(wǎng)站的信息庫中抽取的平均信息數(shù)量X,Χ=Τ/Ν, N為網(wǎng)站的個(gè)數(shù);
D3、判斷是否有信息庫數(shù)據(jù)中包含的信息數(shù)量小于X,當(dāng)是時(shí),轉(zhuǎn)入步驟D4,當(dāng)否時(shí),轉(zhuǎn)入步驟D5 ;
D4、按照網(wǎng)站排序逐條從各網(wǎng)站的信息庫數(shù)據(jù)中抽取排列在前的信息,并將輪空的信息庫剔除,然后繼續(xù)按照網(wǎng)站排序逐條從各網(wǎng)站抽取排列在前的信息,直至抽取到T條信息;
D5、按照網(wǎng)站排序逐條從各網(wǎng)站的信息庫數(shù)據(jù)中抽取排列在前的信息,直至抽取到T條信息;
D6、按照抽取的順序?qū)條信息進(jìn)行排序,形成聚合信息庫。
[0008]所述的信息聚合方法,其中,所述網(wǎng)站為多媒體網(wǎng)站,所述信息為多媒體信息。
[0009]所述的信息聚合方法,其中,所述步驟A中,根據(jù)各網(wǎng)站的用戶數(shù)量為每一網(wǎng)站配置一權(quán)重值。
[0010]所述的信息聚合方法,其中,所述步驟B具體包括:
將各個(gè)網(wǎng)站信息庫數(shù)據(jù)中各條信息的名稱進(jìn)行比較,將相同名稱的信息過濾掉,只保留其中一條權(quán)重值最聞的網(wǎng)站的彳目息。
[0011]所述的信息聚合方法,其中,所述步驟C中,在被去重的網(wǎng)站信息庫數(shù)據(jù)中,被過濾掉的信息依次由后面的信息補(bǔ)上,形成重新排列之后的信息庫。
[0012]—種信息聚合系統(tǒng),其中,包括:
抓取模塊,用于抓取多個(gè)網(wǎng)站的信息庫數(shù)據(jù),并為每一網(wǎng)站配置一個(gè)權(quán)重值;
去重模塊,用于對各網(wǎng)站的信息庫數(shù)據(jù)進(jìn)行去重處理,將各網(wǎng)站信息庫數(shù)據(jù)中相同內(nèi)容的信息過濾,只保留其中一條權(quán)重值最高的網(wǎng)站的信息;
重排模塊,用于按信息庫中的信息排序?qū)⒏骶W(wǎng)站去重處理之后的網(wǎng)站信息庫數(shù)據(jù)進(jìn)行重新排列;
聚合模塊,用于將各網(wǎng)站按照權(quán)重大小進(jìn)行排序,然后按照網(wǎng)站排序依次從各網(wǎng)站的信息庫數(shù)據(jù)中抽取排列在前的信息,形成包含預(yù)定信息數(shù)量的聚合信息庫。
[0013]所述的信息聚合系統(tǒng),其中,所述聚合模塊具體包括:
數(shù)量設(shè)置單元,用于預(yù)先設(shè)置聚合信息庫中的信息數(shù)量T ;
平均信息數(shù)量計(jì)算單元,用于計(jì)算需從每個(gè)網(wǎng)站的信息庫中抽取的平均信息數(shù)量X,X=T/N,N為網(wǎng)站的個(gè)數(shù);
判斷單元,用于判斷是否有網(wǎng)站信息庫數(shù)據(jù)中包含的信息數(shù)量小于X,當(dāng)是時(shí),按照網(wǎng)站排序逐條從各網(wǎng)站的信息庫數(shù)據(jù)中抽取排列在前的信息,并將輪空的信息庫剔除,然后繼續(xù)按照網(wǎng)站排序逐條從各網(wǎng)站抽取排列在前的信息,直至抽取到T條信息,當(dāng)否時(shí),按照網(wǎng)站排序逐條從各網(wǎng)站的信息庫數(shù)據(jù)中抽取排列在前的信息,直至抽取到T條信息;
排序單元,用于按照抽取的順序?qū)條信息進(jìn)行排序,形成聚合信息庫。
[0014]所述的信息聚合系統(tǒng),其中,所述網(wǎng)站為多媒體網(wǎng)站,所述信息為多媒體信息。
[0015]所述的信息聚合系統(tǒng),其中,所述去重模塊用于將各個(gè)網(wǎng)站信息庫數(shù)據(jù)中各條信息的名稱進(jìn)行比較,將相同名稱的信息過濾掉,只保留其中一條權(quán)重值最高的網(wǎng)站的信息。
[0016]有益效果:本發(fā)明通過對各網(wǎng)站的信息庫數(shù)據(jù)進(jìn)行去重處理,使得重復(fù)信息被剔除,并且為每一網(wǎng)站設(shè)置一權(quán)重值,按照權(quán)重大小從各網(wǎng)站抽取排列在前的信息,從而形成聚合信息庫,通過本發(fā)明的方法,信息聚合可更真實(shí)反映各條信息的熱度,并且結(jié)合了各網(wǎng)站的權(quán)重,將各網(wǎng)站信息庫的數(shù)據(jù)融合在一起,得出的數(shù)據(jù)更加真實(shí)、準(zhǔn)確。
【附圖說明】
[0017]圖1為本發(fā)明一種信息聚合方法較佳實(shí)施例的流程圖。
[0018]圖2為圖1所示方法較佳實(shí)施例中步驟S104的具體流程圖。
[0019]圖3為本發(fā)明一種信息聚合系統(tǒng)較佳實(shí)施例的結(jié)構(gòu)框圖。
[0020]圖4為圖3所示系統(tǒng)較佳實(shí)施例中聚合模塊的具體結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0021]本發(fā)明提供一種信息聚合方法及系統(tǒng),為使本發(fā)明的目的、技術(shù)方案及效果更加清楚、明確,以下對本發(fā)明進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0022]請參閱圖1,圖1為本發(fā)明一種信息聚合方法較佳實(shí)施例的流程圖,如圖所示,其包括步驟:
5101、抓取多個(gè)網(wǎng)站的信息庫數(shù)據(jù),并為每一網(wǎng)站配置一個(gè)權(quán)重值;
5102、對各網(wǎng)站的信息庫數(shù)據(jù)進(jìn)行去重處理,將各網(wǎng)站信息庫數(shù)據(jù)中相同內(nèi)容的信息過濾,只保留其中一條權(quán)重值最聞的網(wǎng)站的?目息;
5103、按信息庫中的信息排序?qū)⒏骶W(wǎng)站去重處理之后的網(wǎng)站信息庫數(shù)據(jù)進(jìn)行重新排列;
5104、將各網(wǎng)站按照權(quán)重大小進(jìn)行排序,然后按照網(wǎng)站排序依次從各網(wǎng)站的信息庫數(shù)據(jù)中抽取排列在前的信息,形成包含預(yù)定信息數(shù)量的聚合信息庫。
[0023]在本實(shí)施例中,首先抓取多個(gè)網(wǎng)站的信息庫數(shù)據(jù),本實(shí)施例中,所述的信息庫數(shù)據(jù)可以是各網(wǎng)站的排行榜數(shù)據(jù),例如視頻網(wǎng)站的視頻排行榜,也可以是其他信息庫數(shù)據(jù),例如視頻網(wǎng)站的各種類型的影片庫,例如喜劇片、戰(zhàn)爭片、科幻片、動(dòng)作片等等類型的影片庫,在這些信息庫中都具有原有的排序。本發(fā)明的目的就是將各種網(wǎng)站的信息庫數(shù)據(jù)融合在一起,形成能夠真實(shí)反映熱度排行的聚合信息庫。本實(shí)施例主要以排行榜數(shù)據(jù)來舉例說明,顯然,對于其他類型的信息庫都可以采用本發(fā)明的方法來進(jìn)行聚合
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1