一種聚合頁面中數(shù)據(jù)模塊的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及頁面處理領(lǐng)域,特別涉及一種聚合頁面中數(shù)據(jù)模塊的方法及裝置。
【背景技術(shù)】
[0002]數(shù)據(jù)信息是媒體網(wǎng)站提供給用戶的核心價(jià)值,而隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,媒體網(wǎng)站能展現(xiàn)給用戶越來越多類型的數(shù)據(jù)信息,同時(shí),數(shù)據(jù)信息也越來越豐富。
[0003]隨著數(shù)據(jù)信息的增加,將數(shù)據(jù)信息所表達(dá)的主要信息內(nèi)容有效地傳達(dá)給用戶也越來越困難?,F(xiàn)有技術(shù)中,主要通過人工組織頁面的方式展現(xiàn)內(nèi)容,先由編輯人員對(duì)頁面排版,聚合不同的數(shù)據(jù)模塊,然后最終展現(xiàn)給用戶,其中,所述的數(shù)據(jù)模塊為頁面中用于承載數(shù)據(jù)信息的載體單元。
[0004]但是,人工排版的方式帶有編輯人員的主觀認(rèn)識(shí),且不同的展現(xiàn)形式會(huì)帶給用戶不同的體驗(yàn),這樣導(dǎo)致可能無法將數(shù)據(jù)信息所表達(dá)的主要信息內(nèi)容有效傳達(dá)給用戶。
【發(fā)明內(nèi)容】
[0005]基于上述問題,本發(fā)明實(shí)施例公開了一種聚合頁面中數(shù)據(jù)模塊的方法及裝置,以提高頁面中的主要信息內(nèi)容的有效表達(dá)。技術(shù)方案如下:
[0006]第一方面,本發(fā)明實(shí)施例提供了一種聚合頁面中數(shù)據(jù)模塊的方法,包括:
[0007]確定待聚合頁面的第一類參考信息,其中,所述第一類參考信息至少能夠表述待聚合頁面所對(duì)應(yīng)主題內(nèi)容,所述待聚合頁面包含多個(gè)用于承載數(shù)據(jù)模塊的矩陣塊;
[0008]依據(jù)所述第一類參考信息和數(shù)據(jù)模塊的第二類參數(shù)信息,從預(yù)先構(gòu)建的數(shù)據(jù)模塊庫中提取多個(gè)數(shù)據(jù)模塊,并將所提取出的多個(gè)數(shù)據(jù)模塊作為所述待聚合頁面的待聚合數(shù)據(jù)模塊,其中,所述數(shù)據(jù)模塊庫中的每一數(shù)據(jù)模塊均對(duì)應(yīng)各自的第二類參考信息,所述第二類參考信息至少能夠表述所述數(shù)據(jù)模塊的信息內(nèi)容;
[0009]依據(jù)所述第一類參考信息和所述待聚合數(shù)據(jù)模塊的第二類參考信息,從所述待聚合數(shù)據(jù)模塊中篩選出部分?jǐn)?shù)據(jù)模塊,并將所篩選出的部分?jǐn)?shù)據(jù)模塊作為優(yōu)先匹配數(shù)據(jù)模塊;
[0010]將所述優(yōu)先匹配數(shù)據(jù)模塊放置于所述待聚合頁面中的預(yù)定最佳展示矩陣塊中,其中,所述預(yù)定最佳展示矩陣塊為所述待聚合頁面的矩陣塊中的至少一個(gè)矩陣塊;
[0011]依據(jù)所述優(yōu)先匹配數(shù)據(jù)模塊與其余的待聚合數(shù)據(jù)模塊的水平關(guān)聯(lián)系數(shù)或垂直關(guān)聯(lián)系數(shù)、所述優(yōu)先級(jí)匹配數(shù)據(jù)模塊的第二類參考信息和所述第一類參考信息,將所述其余的待聚合數(shù)據(jù)模塊放置于所述待聚合頁面中的所述預(yù)定最佳展示單元以外的矩陣塊中。
[0012]可選的,所述第一類參考信息包括:關(guān)鍵詞集合,其中,所述關(guān)鍵詞集合中每一關(guān)鍵詞均為預(yù)先設(shè)定的能夠表述待聚合頁面所對(duì)應(yīng)主題內(nèi)容的詞語且對(duì)應(yīng)一優(yōu)先級(jí);
[0013]所述第二類參考信息包括:標(biāo)簽集合,其中,所述標(biāo)簽集合中的每一標(biāo)簽均為預(yù)先設(shè)定的能夠表述數(shù)據(jù)模塊的信息內(nèi)容的詞語。
[0014]可選的,所述依據(jù)所述第一類參考信息和數(shù)據(jù)模塊的第二類參數(shù)信息,從預(yù)先構(gòu)建的數(shù)據(jù)模塊庫中提取多個(gè)數(shù)據(jù)模塊,包括:
[0015]從預(yù)先構(gòu)建的數(shù)據(jù)模塊庫中,提取標(biāo)簽集合與所述關(guān)鍵詞集合存在交集的多個(gè)數(shù)據(jù)模塊;
[0016]所述依據(jù)所述第一類參考信息和所述待聚合數(shù)據(jù)模塊的第二類參考信息,從所述待聚合數(shù)據(jù)模塊中篩選出部分?jǐn)?shù)據(jù)模塊,包括:
[0017]從所述待聚合數(shù)據(jù)模塊中,篩選出標(biāo)簽集合與關(guān)鍵詞集合的交集中存在優(yōu)先級(jí)滿足第一預(yù)定條件的關(guān)鍵詞的待聚合數(shù)據(jù)模塊;
[0018]所述依據(jù)所述優(yōu)先匹配數(shù)據(jù)模塊與其余的待聚合數(shù)據(jù)模塊的水平關(guān)聯(lián)系數(shù)或垂直關(guān)聯(lián)系數(shù)、所述優(yōu)先級(jí)匹配數(shù)據(jù)模塊第二類參考信息和所述第一類參考信息,將所述其余的待聚合數(shù)據(jù)模塊放置于所述待聚合頁面中的所述預(yù)定最佳展示單元以外的矩陣塊中,包括:
[0019]確定每一優(yōu)先匹配數(shù)據(jù)模塊的標(biāo)簽集合和關(guān)鍵詞集合的交集中的關(guān)鍵詞的最高優(yōu)先級(jí);
[0020]根據(jù)所確定出的最高優(yōu)先級(jí)的高低順序,依次將優(yōu)先匹配數(shù)據(jù)模塊作為基準(zhǔn)模塊;
[0021]進(jìn)一步的,在確定出每一基準(zhǔn)模塊后,基于當(dāng)前的基準(zhǔn)模塊與剩余的待聚合數(shù)據(jù)模塊的水平關(guān)聯(lián)系數(shù)或垂直關(guān)聯(lián)系數(shù),將剩余的待聚合數(shù)據(jù)模塊中的部分或全部的待聚合數(shù)據(jù)模塊放置到所述預(yù)定最佳展示單元以外的關(guān)聯(lián)的矩陣塊中。
[0022]可選的,所述第一類參考信息包括:關(guān)鍵詞集合,其中,所述關(guān)鍵詞集合中每一關(guān)鍵詞均為預(yù)先設(shè)定的能夠表述待聚合頁面所對(duì)應(yīng)主題內(nèi)容的詞語;
[0023]所述第二類參考信息包括:標(biāo)簽集合,其中,所述標(biāo)簽集合中的每一標(biāo)簽均為預(yù)先設(shè)定的能夠表述數(shù)據(jù)模塊的信息內(nèi)容的詞語且對(duì)應(yīng)一優(yōu)先級(jí)。
[0024]可選的,所述依據(jù)所述第一類參考信息和數(shù)據(jù)模塊的第二類參數(shù)信息,從預(yù)先構(gòu)建的數(shù)據(jù)模塊庫中提取多個(gè)數(shù)據(jù)模塊,包括:
[0025]從預(yù)先構(gòu)建的數(shù)據(jù)模塊庫中,提取標(biāo)簽集合與所述關(guān)鍵詞集合存在交集的多個(gè)數(shù)據(jù)模塊;
[0026]所述依據(jù)所述第一類參考信息和所述待聚合數(shù)據(jù)模塊的第二類參考信息,從所述待聚合數(shù)據(jù)模塊中篩選出部分?jǐn)?shù)據(jù)模塊,包括:
[0027]從所述待聚合數(shù)據(jù)模塊中,篩選出標(biāo)簽集合與關(guān)鍵詞集合的交集中存在優(yōu)先級(jí)滿足第二預(yù)定條件的標(biāo)簽的待聚合數(shù)據(jù)模塊;
[0028]所述依據(jù)所述優(yōu)先匹配數(shù)據(jù)模塊與其余的待聚合數(shù)據(jù)模塊的水平關(guān)聯(lián)系數(shù)或垂直關(guān)聯(lián)系數(shù)、所述優(yōu)先級(jí)匹配數(shù)據(jù)模塊第二類參考信息和所述第一類參考信息,將所述其余的待聚合數(shù)據(jù)模塊放置于所述待聚合頁面中的所述預(yù)定最佳展示單元以外的矩陣塊中,包括:
[0029]確定每一優(yōu)先匹配數(shù)據(jù)模塊的標(biāo)簽集合和關(guān)鍵詞集合的交集中的標(biāo)簽的最高優(yōu)先級(jí);
[0030]根據(jù)所確定出的最高優(yōu)先級(jí)的高低順序,依次將優(yōu)先匹配數(shù)據(jù)模塊作為基準(zhǔn)模塊;
[0031]進(jìn)一步的,在確定出每一基準(zhǔn)模塊后,基于當(dāng)前的基準(zhǔn)模塊與剩余的待聚合數(shù)據(jù)模塊的水平關(guān)聯(lián)系數(shù)或垂直關(guān)聯(lián)系數(shù),將剩余的待聚合數(shù)據(jù)模塊中的部分或全部的待聚合數(shù)據(jù)模塊放置到所述預(yù)定最佳展示單元以外的關(guān)聯(lián)的矩陣塊中。
[0032]可選的,所述第一類參考信息包括:關(guān)鍵詞集合,其中,所述關(guān)鍵詞集合中每一關(guān)鍵詞均為預(yù)先設(shè)定的能夠表述待聚合頁面所對(duì)應(yīng)主題內(nèi)容的詞語且對(duì)應(yīng)一權(quán)重值;
[0033]所述第二類參考信息包括:標(biāo)簽集合,其中,所述標(biāo)簽集合中的每一標(biāo)簽均為預(yù)先設(shè)定的能夠表述數(shù)據(jù)模塊的信息內(nèi)容的詞語且對(duì)應(yīng)一權(quán)重值。
[0034]可選的,所述依據(jù)所述第一類參考信息和數(shù)據(jù)模塊的第二類參數(shù)信息,從預(yù)先構(gòu)建的數(shù)據(jù)模塊庫中提取多個(gè)數(shù)據(jù)模塊,包括:
[0035]從預(yù)先構(gòu)建的數(shù)據(jù)模塊庫中,提取標(biāo)簽集合與所述關(guān)鍵詞集合存在交集的、且所存在交集中的關(guān)鍵詞的權(quán)重值與標(biāo)簽的權(quán)重值符合第三預(yù)定條件的多個(gè)數(shù)據(jù)模塊;
[0036]所述依據(jù)所述第一類參考信息和所述待聚合數(shù)據(jù)模塊的第二類參考信息,從所述待聚合數(shù)據(jù)模塊中篩選出部分?jǐn)?shù)據(jù)模塊,包括:
[0037]依次根據(jù)每一待聚合數(shù)據(jù)模塊的標(biāo)簽集合與所述關(guān)鍵詞集合的交集中的關(guān)鍵詞的權(quán)重值和/或標(biāo)簽的權(quán)重值,計(jì)算相應(yīng)待聚合數(shù)據(jù)模塊的綜合權(quán)重值;
[0038]從所述待聚合數(shù)據(jù)模塊中,篩選出綜合權(quán)重值滿足第四預(yù)定條件的待聚合數(shù)據(jù)模塊;
[0039]所述依據(jù)所述優(yōu)先匹配數(shù)據(jù)模塊與其余的待聚合數(shù)據(jù)模塊的水平關(guān)聯(lián)系數(shù)或垂直關(guān)聯(lián)系數(shù)、所述優(yōu)先級(jí)匹配數(shù)據(jù)模塊的第二類參考信息和所述第一類參考信息,將所述其余的待聚合數(shù)據(jù)模塊放置于所述待聚合頁面中的所述預(yù)定最佳展示單元以外的矩陣塊中,包括:
[0040]從所述待聚合頁面的關(guān)鍵詞集合中選擇權(quán)重值最高的關(guān)鍵詞;
[0041]按照所述優(yōu)先匹配數(shù)據(jù)塊的綜合權(quán)重值的高低順序,依次將標(biāo)簽集合中標(biāo)簽與所選擇關(guān)鍵詞相同的優(yōu)先匹配數(shù)據(jù)塊作為基準(zhǔn)模塊;
[0042]進(jìn)一步的,在確定出每一基準(zhǔn)模塊后,基于當(dāng)前的基準(zhǔn)模塊與剩余的待聚合數(shù)據(jù)模塊的水平關(guān)聯(lián)系數(shù)或垂直關(guān)聯(lián)系數(shù),將剩余的待聚合數(shù)據(jù)模塊中的部分或全部的待聚合數(shù)據(jù)模塊放置到所述預(yù)定最佳展示單元以外的關(guān)聯(lián)的矩陣塊中。
[0043]第二方面,本發(fā)明實(shí)施例還提供了一種聚合頁面中數(shù)據(jù)模塊的裝置,包括:
[0044]第一類參考信息確定單元,用于確定待聚合頁面的第一類參考信息,其中,所述第一類參考信息至少能夠表述待聚合頁面所對(duì)應(yīng)主題內(nèi)容,所述待聚合頁面包含多個(gè)用于承載數(shù)據(jù)模塊的矩陣塊;
[0045]待聚合數(shù)據(jù)模塊確定單元,用于依據(jù)所述第一類參考信息和數(shù)據(jù)模塊的第二類參數(shù)信息,從預(yù)先構(gòu)建的數(shù)據(jù)模塊庫中提取多個(gè)數(shù)據(jù)模塊,并將所提取出的多個(gè)數(shù)據(jù)模塊作為所述待聚合頁面的待聚合數(shù)據(jù)模塊,其中,所述數(shù)據(jù)模塊庫中的每一數(shù)據(jù)模塊均對(duì)應(yīng)各自的第二類參考信息,所述第二類參考信息至少能夠表述所述數(shù)據(jù)模塊的信息內(nèi)容;
[0046]優(yōu)先匹配數(shù)據(jù)模塊確定單元,用于依據(jù)所述第一類參考信息和所述待聚合數(shù)據(jù)模塊的第二類參考信息,從所述待聚合數(shù)據(jù)模塊中篩選出部分?jǐn)?shù)據(jù)模塊,并將所篩選出的部分?jǐn)?shù)據(jù)模塊作為優(yōu)先匹配數(shù)據(jù)模塊;
[0047]優(yōu)先匹配數(shù)據(jù)模塊放置單元,用于將所述優(yōu)先匹配數(shù)據(jù)模塊放置于所述待聚合頁面中的預(yù)定最佳展示矩陣塊中,其中,所述預(yù)定最佳展示矩陣塊為所述待聚合頁面的矩陣塊中的至少一個(gè)矩陣塊;
[0048]待聚合數(shù)據(jù)模塊放置單元,用于依據(jù)所述優(yōu)先匹配數(shù)據(jù)模塊與其余的待聚合數(shù)據(jù)模塊的水平關(guān)聯(lián)系數(shù)或垂直關(guān)聯(lián)系數(shù)、所述優(yōu)先級(jí)匹配數(shù)據(jù)模塊的第二類參考信息和所述第一類參考信息,將所述其余的待聚合數(shù)據(jù)模塊放置于所述待聚合頁面中的所述預(yù)定最佳展示單元以外的矩陣塊中。
[0049]與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例所提供方案,在頁面中數(shù)據(jù)模塊的聚合過程中,并不采用依賴主觀意識(shí)的人工排版,而是根據(jù)待聚合頁面的主題內(nèi)容和數(shù)據(jù)模塊所表達(dá)信息內(nèi)容,為頁面進(jìn)行數(shù)據(jù)模塊的聚合處理,并且,在數(shù)據(jù)模塊聚合過程中考慮了各個(gè)數(shù)據(jù)模塊之間的關(guān)聯(lián)關(guān)系。因此,通過利用本方案能夠提供頁面中的主要信息內(nèi)容的有效表達(dá)。
【附圖說明】
[0050]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面