專利名稱:一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)與信息技術(shù)領(lǐng)域,特別是涉及一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整方法及系統(tǒng)。
背景技術(shù):
隨著科學(xué)技術(shù)的不斷發(fā)展,計(jì)算機(jī)與信息技術(shù)特別是網(wǎng)站信息結(jié)構(gòu)的技術(shù)發(fā)展迅速。網(wǎng)站個(gè)性化信息服務(wù)正在由基于用戶當(dāng)前瀏覽頁(yè)面的信息推薦服務(wù)方式向基于信息結(jié)構(gòu)自適應(yīng)調(diào)整的敏捷服務(wù)方式發(fā)展。太原理工大學(xué)計(jì)算機(jī)與軟件學(xué)院的余雪麗教授在其全國(guó)教育科學(xué)“十五”規(guī)劃國(guó)家重點(diǎn)課題《信息化進(jìn)程中的教育技術(shù)發(fā)展研究》子課題研究報(bào)告(基于XML和學(xué)習(xí)對(duì)象技術(shù)的e-Learning系統(tǒng)平臺(tái)研究)中,研究了個(gè)性化智能e-learning系統(tǒng)平臺(tái)及其構(gòu)建理論、方法和技術(shù),并且提出了從需求到軟件體系結(jié)構(gòu)的映射的模型近來(lái),人們?cè)絹?lái)越認(rèn)識(shí)到在整個(gè)軟件開發(fā)生命周期內(nèi)需求的變化是不可避免的。正是這種認(rèn)識(shí)導(dǎo)致了開始對(duì)軟件體系結(jié)構(gòu)(SoftwareArchitecture)、軟件開發(fā)框架(Software Development Frameworks)及自適應(yīng)軟件(Self-adapting Software)等領(lǐng)域的研究。一般的自適應(yīng)軟件(或動(dòng)態(tài)體系結(jié)構(gòu)網(wǎng)站)采用了一種映射機(jī)制,也就是解決需求分析到體系結(jié)構(gòu)的映射問(wèn)題。一個(gè)系統(tǒng)除了從需求方面描述外,還要從它的靜態(tài)結(jié)構(gòu)、動(dòng)態(tài)行為以及實(shí)現(xiàn)上來(lái)描述。需求模型、結(jié)構(gòu)模型、行為模型和實(shí)現(xiàn)模型就構(gòu)成了系統(tǒng)的不同視圖,從不同的視圖觀察系統(tǒng)可得到不同的結(jié)論。因此,動(dòng)態(tài)軟件體系結(jié)構(gòu)也可由一組彼此內(nèi)在聯(lián)系的視圖來(lái)表示,每一個(gè)視圖反映軟件體系結(jié)構(gòu)的某個(gè)方面。四個(gè)模型并不是孤立的,而是相互依賴、相互約束的。在描述系統(tǒng)軟件體系結(jié)構(gòu)中尤其如此。只有分析清楚各個(gè)模型間映射關(guān)系,才能使得開發(fā)人員準(zhǔn)確、一致地理解體系結(jié)構(gòu),從而有利于系統(tǒng)的開發(fā)。但是由于該映射機(jī)制過(guò)于復(fù)雜,而且比較適合大型軟件體系結(jié)構(gòu)的描述,是一項(xiàng)龐大的系統(tǒng)工程,需要遵循大型、軟件密集型復(fù)雜系統(tǒng)的開發(fā)原則進(jìn)行。對(duì)于一般的動(dòng)態(tài)結(jié)構(gòu)的網(wǎng)站顯得不太適合。為了克服上述現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整方法及系統(tǒng),嘗試提出一種更輕型的更實(shí)用的自適應(yīng)軟件的構(gòu)建方法與運(yùn)行機(jī)制,從而提高自適應(yīng)軟件的構(gòu)建與管理效率,是目前計(jì)算機(jī)與信息技術(shù)領(lǐng)域亟待解決的問(wèn)題之一。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例提出了一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整方法及系統(tǒng),通過(guò)從網(wǎng)站形式結(jié)構(gòu)庫(kù)中取出其下級(jí)欄目數(shù)據(jù),生成欄目頁(yè)的導(dǎo)航條區(qū),接著依據(jù)用戶興趣度確定欄目頁(yè)下屬各欄目在鏈接區(qū)中顯示區(qū)域的大小和位置,然后依據(jù)用戶興趣度順序篩選的信息,在各子欄目相應(yīng)的區(qū)域內(nèi)組織指向原始文檔的鏈接,本方案可較好的提高自適應(yīng)軟件的構(gòu)建與管理效率。
為解決上述技術(shù)問(wèn)題,本發(fā)明實(shí)施例的目的是通過(guò)以下技術(shù)方案實(shí)現(xiàn)的一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整方法,包括步驟一、從網(wǎng)站形式結(jié)構(gòu)庫(kù)中取出其下級(jí)欄目數(shù)據(jù),生成欄目頁(yè)的導(dǎo)航條區(qū);
步驟二、依據(jù)用戶興趣度確定欄目頁(yè)下屬各欄目在鏈接區(qū)中顯示區(qū)域的大小和位置;步驟三、依據(jù)用戶興趣度順序篩選的信息,在各子欄目相應(yīng)的區(qū)域內(nèi)組織指向原始文檔的鏈接。優(yōu)選的,上述步驟一中,所述網(wǎng)站頁(yè)面分為欄目頁(yè)(或子欄目頁(yè))、主題頁(yè)和文檔頁(yè)三種類型。優(yōu)選的,上述欄目頁(yè)由鏈接著下級(jí)欄目頁(yè)和主題頁(yè)的導(dǎo)航條區(qū)和直接鏈接文檔頁(yè)的鏈接區(qū)組成。優(yōu)選的,上述興趣度是用戶對(duì)信息感興趣的程度,用戶興趣就是垂直網(wǎng)站特征空間或主題空間的一個(gè)向量,該向量在主題空間各維(軸)上的分量,即為用戶對(duì)該主題的興趣度。優(yōu)選的,用戶對(duì)上述欄目或子欄目的興趣度為該欄目或子欄目下屬各主題興趣度之和。優(yōu)選的,上述步驟二中,將統(tǒng)計(jì)用戶瀏覽歷史的每一個(gè)特征詞的詞頻,并結(jié)合該特征詞出現(xiàn)的位置和瀏覽的時(shí)間長(zhǎng)短、時(shí)間先后的新近度,對(duì)每一個(gè)特征詞賦予一個(gè)興趣權(quán)Wi,表示用戶行為中對(duì)該特征詞的興趣程度,得到該用戶興趣描述模型P(w1; w2, W3, , wn)優(yōu)選的,上述步驟三中,當(dāng)用戶申請(qǐng)主題頁(yè)時(shí),鏈接區(qū)生成器用于使用數(shù)據(jù)過(guò)濾器,依據(jù)用戶興趣度順序優(yōu)先篩選的信息,在頁(yè)面上組織指向原始文檔的鏈接,可以連續(xù)使用前后鏈接著的多個(gè)頁(yè)面連續(xù)組織鏈接。優(yōu)選的,上述數(shù)據(jù)過(guò)濾器則用于將網(wǎng)站上各主題范圍內(nèi)的文檔,按用戶興趣度排序,供鏈接區(qū)生成器從高到低選用。一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整系統(tǒng),包括生成單元、判斷單元以及執(zhí)行單元,通過(guò)從網(wǎng)站形式結(jié)構(gòu)庫(kù)中取出其下級(jí)欄目數(shù)據(jù),生成欄目頁(yè)的導(dǎo)航條區(qū),接著依據(jù)用戶興趣度確定欄目頁(yè)下屬各欄目在鏈接區(qū)中顯示區(qū)域的大小和位置,然后依據(jù)用戶興趣度順序篩選的信息,在各子欄目相應(yīng)的區(qū)域內(nèi)組織指向原始文檔的鏈接。優(yōu)選的,上述生成單元用于從網(wǎng)站形式結(jié)構(gòu)庫(kù)中取出其下級(jí)欄目數(shù)據(jù),生成欄目頁(yè)的導(dǎo)航條區(qū)。優(yōu)選的,上述判斷單元用于依據(jù)用戶興趣度確定欄目頁(yè)下屬各欄目在鏈接區(qū)中顯示區(qū)域的大小和位置。優(yōu)選的,上述執(zhí)行單元用于依據(jù)用戶興趣度順序篩選的信息,在各子欄目相應(yīng)的區(qū)域內(nèi)組織指向原始文檔的鏈接。綜上所述,本發(fā)明提供了一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整方法及系統(tǒng),通過(guò)從網(wǎng)站形式結(jié)構(gòu)庫(kù)中取出其下級(jí)欄目數(shù)據(jù),生成欄目頁(yè)的導(dǎo)航條區(qū),接著依據(jù)用戶興趣度確定欄目頁(yè)下屬各欄目在鏈接區(qū)中顯示區(qū)域的大小和位置,然后依據(jù)用戶興趣度順序篩選的信息,在各子欄目相應(yīng)的區(qū)域內(nèi)組織指向原始文檔的鏈接,本方案可較好的提高自適應(yīng)軟件的構(gòu)建與管理效率。
圖I為一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整方法示意圖;圖2為動(dòng)態(tài)生成的虛擬網(wǎng)站結(jié)構(gòu)示意圖;圖3為本發(fā)明實(shí)施例網(wǎng)站內(nèi)容的分類體系示意圖;圖4為本發(fā)明實(shí)施例網(wǎng)站調(diào)整概念模型示意圖;圖5為本發(fā)明實(shí)施例網(wǎng)站結(jié)構(gòu)合理度評(píng)價(jià)示意圖;圖6為本發(fā)明實(shí)施例之基于用戶偏好的自適應(yīng)信息結(jié)構(gòu)調(diào)整模型示意圖;圖7為一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整系統(tǒng)示意圖。
具體實(shí)施例方式本發(fā)明實(shí)施例提供的一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整方法及系統(tǒng),通過(guò)從網(wǎng)站形式結(jié)構(gòu)庫(kù)中取出其下級(jí)欄目數(shù)據(jù),生成欄目頁(yè)的導(dǎo)航條區(qū),接著依據(jù)用戶興趣度確定欄目頁(yè)下屬各欄目在鏈接區(qū)中顯示區(qū)域的大小和位置,然后依據(jù)用戶興趣度順序篩選的信息,在各子欄目相應(yīng)的區(qū)域內(nèi)組織指向原始文檔的鏈接,本方案可較好的提高自適應(yīng)軟件的構(gòu)建
與管理效率。為使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,下面參照附圖并舉實(shí)施例,對(duì)本發(fā)明進(jìn)一步詳細(xì)說(shuō)明。在本方案中的一些支撐概念和定義,規(guī)定如下其一,網(wǎng)站的信息結(jié)構(gòu),是網(wǎng)站依托網(wǎng)頁(yè)鏈接結(jié)構(gòu)而進(jìn)行信息展示的信息元間的位置關(guān)系。據(jù)此定義,信息結(jié)構(gòu)可分解為兩層,一層是信息展示所依托的網(wǎng)頁(yè)鏈接結(jié)構(gòu),稱之為形式結(jié)構(gòu)。另一層是網(wǎng)頁(yè)鏈接結(jié)構(gòu)中不同結(jié)點(diǎn)位置上的不同信息元組成的信息關(guān)系,稱之為內(nèi)容結(jié)構(gòu)。其二,垂直網(wǎng)站的形式結(jié)構(gòu)Sf是該網(wǎng)站內(nèi)容的分類體系結(jié)構(gòu)Sd在網(wǎng)站上的一個(gè)映射 G (Sel)。定義 Sf = G(Scl)。其三,垂直網(wǎng)站的內(nèi)容結(jié)構(gòu)Srt是當(dāng)前用戶(群)的興趣偏好P(t)在網(wǎng)站的一個(gè)映射。定義Set = F(Pa)),其中F為基于用戶偏好的網(wǎng)站結(jié)構(gòu)調(diào)整機(jī)制。p(t)即為t時(shí)刻上的興趣快照。其四,設(shè)用戶興趣為P(t),垂直網(wǎng)站的內(nèi)容的分類體系結(jié)構(gòu)為Scl,則垂直網(wǎng)站t時(shí)刻的信息結(jié)構(gòu)為St = H(F(P(t)),G(SJ),其中垂直網(wǎng)站的信息結(jié)構(gòu)是由分類體系決定的(靜態(tài)的)形式結(jié)構(gòu)和適應(yīng)用戶興趣變化而動(dòng)態(tài)調(diào)整的(動(dòng)態(tài)的)內(nèi)容結(jié)構(gòu)所構(gòu)成的。我們把這種結(jié)構(gòu)構(gòu)成機(jī)制H,叫做垂直網(wǎng)站的自適應(yīng)信息結(jié)構(gòu)模式。其五,網(wǎng)站上網(wǎng)頁(yè)間的距離是指如下1,兩直接相連的網(wǎng)頁(yè)間的距離為2。間接相連的網(wǎng)頁(yè)間的距離為相連路徑上的網(wǎng)頁(yè)數(shù)之和。2,網(wǎng)頁(yè)到自身的距離為I。3,網(wǎng)頁(yè)到主頁(yè)的最短距離為該網(wǎng)頁(yè)的中心距離。
其六,網(wǎng)站信息的顯現(xiàn)度是該信息“易被瀏覽到的程度”。網(wǎng)站信息的顯現(xiàn)度由信息所在頁(yè)的中心距離和信息在頁(yè)內(nèi)所處的位置、顯示方式確定。信息的顯現(xiàn)度與該網(wǎng)頁(yè)中心距離成反比例關(guān)系。本發(fā)明實(shí)施例提供一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整方法,網(wǎng)站信息結(jié)構(gòu)的調(diào)整對(duì)象是信息內(nèi)容結(jié)構(gòu),網(wǎng)站信息結(jié)構(gòu)調(diào)整的目標(biāo)是根據(jù)用戶的興趣,在虛擬網(wǎng)站不同層次的頁(yè)面中合理安排鏈接信息,以最大限度地適應(yīng)用戶的興趣偏好。如圖I所示,具體步驟包括步驟一、從網(wǎng)站形式結(jié)構(gòu)庫(kù)中取出其下級(jí)欄目數(shù)據(jù),生成欄目頁(yè)的導(dǎo)航條區(qū);具體而言,在本發(fā)明實(shí)施例中,網(wǎng)站頁(yè)面分為欄目頁(yè)(或子欄目頁(yè))、主題頁(yè)和文檔頁(yè)三種類型。其中,欄目頁(yè)由鏈接著下級(jí)欄目頁(yè)和主題頁(yè)的“導(dǎo)航條區(qū)”和直接鏈接文檔頁(yè)的“鏈接區(qū)”組成。有時(shí)候在頁(yè)面較大(較長(zhǎng))時(shí),鏈接區(qū)中插入導(dǎo)航點(diǎn),作為方便導(dǎo)航的一種補(bǔ)充。而,主題頁(yè)由于沒有下級(jí)欄目頁(yè),只有直接鏈接文檔的“鏈接區(qū)”。此外,文檔頁(yè)主要顯示原始信息。如圖2所示為動(dòng)態(tài)生成的虛擬網(wǎng)站結(jié)構(gòu)。步驟二、依據(jù)用戶興趣度確定欄目頁(yè)下屬各欄目在鏈接區(qū)中顯示區(qū)域的大小和位置;具體而言,在本發(fā)明實(shí)施例中,興趣度是用戶對(duì)信息感興趣的程度。用戶興趣就是垂直網(wǎng)站特征空間或主題空間的一個(gè)向量。該向量在主題空間各維(軸)上的分量,即為用戶對(duì)該主題的興趣度。用戶對(duì)某欄目或子欄目的興趣度為該欄目或子欄目下屬各主題興趣度之和。本實(shí)施例中,將統(tǒng)計(jì)用戶瀏覽歷史的每一個(gè)特征詞的詞頻,并結(jié)合該特征詞出現(xiàn)的位置和瀏覽的時(shí)間長(zhǎng)短、時(shí)間先后的新近度,對(duì)每一個(gè)特征詞賦予一個(gè)興趣權(quán)Wi,表示用戶行為中對(duì)該特征詞的興趣程度,得到該用戶興趣描述模型P(w1; w2, W3, , wn)對(duì)于網(wǎng)站內(nèi)容(信息元、欄目等)也使用相同空間上的向量表示,便于將用戶的興趣和網(wǎng)站的內(nèi)容進(jìn)行比較運(yùn)算。垂直網(wǎng)站上,除了定義特征空間,還可以定義主題空間。其中,垂直網(wǎng)站內(nèi)容的粒度是指,垂直網(wǎng)站根據(jù)信息聚集的程度大小分為欄目和多級(jí)子欄目。欄目級(jí)次越低的子欄目,欄目主題范圍越窄,粒度越小。網(wǎng)站內(nèi)容的分類體系如圖3所示。垂直網(wǎng)站的主題是指,定義不再設(shè)置下級(jí)類目的子類(葉子類)為垂直網(wǎng)站的主題。主題可包含多篇文檔,文檔是網(wǎng)站內(nèi)容粒度最小的單位。垂直網(wǎng)站內(nèi)容的分類體系結(jié)構(gòu),決定了網(wǎng)站的欄目頁(yè)間的鏈接結(jié)構(gòu)。進(jìn)一步的,在本方案中,每個(gè)用戶的興趣偏好數(shù)據(jù)保存在用戶興趣模型庫(kù)。該庫(kù)的數(shù)據(jù)字段包括用戶標(biāo)識(shí)、興趣向量、IP地址等。步驟三、依據(jù)用戶興趣度順序篩選的信息,在各子欄目相應(yīng)的區(qū)域內(nèi)組織指向原始文檔的鏈接。具體而言,在本發(fā)明實(shí)施例中,當(dāng)用戶申請(qǐng)主題頁(yè)時(shí),鏈接區(qū)生成器用于使用數(shù)據(jù)過(guò)濾器,依據(jù)用戶興趣度順序優(yōu)先篩選的信息,在頁(yè)面上組織指向原始文檔的鏈接,可以連續(xù)使用前后鏈接著的多個(gè)頁(yè)面連續(xù)組織鏈接。而,數(shù)據(jù)過(guò)濾器則用于將網(wǎng)站上各主題范圍內(nèi)的文檔,按用戶興趣度排序,供鏈接區(qū)生成器從高到低選用。進(jìn)一步的,在本方案中,欄目頁(yè)鏈接區(qū)的布局算法包含如下約定1,鏈接區(qū)版面根據(jù)下屬子欄目數(shù)多少分為1-3列,各列寬度均等。2,鏈接區(qū)按下屬各子欄目集中組織超連接,分別構(gòu)成不可分割的矩形鏈接塊。3,欄目頁(yè)鏈接區(qū)的鏈接塊數(shù)即為該欄目下屬的子欄目數(shù)。4,各子欄目的面積大小由該子欄目的用戶興趣度和本鏈接區(qū)的總面積確定。5,由于寬度相同,面積由矩形的高度來(lái)表示,單位是“行”。6,布局時(shí),靠近屏幕頂端的位置具有較高的顯現(xiàn)度。分兩欄的鏈接區(qū),在布局高度相同時(shí),左邊具有較高顯現(xiàn)度;分三欄的鏈接區(qū),顯現(xiàn)度按中、左、右的順序排列。欄目頁(yè)鏈接區(qū)的布局算法通過(guò)各子欄目在鏈接區(qū)的布局按其面積由大到小的順序依次進(jìn)行,并且每個(gè)子欄目布置在當(dāng)前具有較高顯現(xiàn)度的位置。如圖4所示網(wǎng)站調(diào)整概念模型,網(wǎng)站所要展示的全部信息,以文件系統(tǒng)或數(shù)據(jù)庫(kù)系統(tǒng)的存儲(chǔ)形式保存在服務(wù)器。其中元數(shù)據(jù)存儲(chǔ)的結(jié)構(gòu)包括原始文檔的標(biāo)題、作者、URL、文檔類型、所屬主題(分類體系中的主題),產(chǎn)生、修改時(shí)間等等如圖4所示網(wǎng)站調(diào)整概念模型,網(wǎng)站形式結(jié)構(gòu)是網(wǎng)站結(jié)構(gòu)的基本框架,不作為自動(dòng)調(diào)整對(duì)象。保存在形式結(jié)構(gòu)庫(kù)中,數(shù)據(jù)字段主要有欄目(主題)名稱,上級(jí)欄目、頁(yè)面生成程序名等等。[XML描述]通過(guò)本發(fā)明實(shí)施例,可以獲知網(wǎng)站信息結(jié)構(gòu)調(diào)整結(jié)果為,在網(wǎng)站各主題上的信息顯現(xiàn)度分布是否與用戶的興趣度分布趨于一致,也就是信息結(jié)構(gòu)調(diào)整后的各主題的顯現(xiàn)度構(gòu)成的曲線和用戶興趣度曲線相重合(或平行)。如圖5所示為本發(fā)明實(shí)施例網(wǎng)站結(jié)構(gòu)合理度評(píng)價(jià)示意圖。此外,本發(fā)明實(shí)施例之基于用戶偏好的自適應(yīng)信息結(jié)構(gòu)調(diào)整模型如圖6所示。應(yīng)用服務(wù)器實(shí)現(xiàn)網(wǎng)站信息結(jié)構(gòu)的調(diào)整功能包括Web用戶信息挖掘,從Web服務(wù)器日志文檔中挖掘用戶模式,保存到數(shù)據(jù)庫(kù)服務(wù)器。以及,Web結(jié)構(gòu)控制器,讀取用戶興趣模型數(shù)據(jù)、構(gòu)建與之相適應(yīng)的網(wǎng)站信息結(jié)構(gòu)控制信息、并根據(jù)此控制信息刷新網(wǎng)站,實(shí)現(xiàn)結(jié)構(gòu)調(diào)整。另外,本發(fā)明實(shí)施例還提供了一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整系統(tǒng)。如圖7所示,為本發(fā)明實(shí)施例提供的一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整系統(tǒng)示意圖。一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整系統(tǒng),包括生成單元11、判斷單元22以及執(zhí)行單元33。生成單元11,用于從網(wǎng)站形式結(jié)構(gòu)庫(kù)中取出其下級(jí)欄目數(shù)據(jù),生成欄目頁(yè)的導(dǎo)航條區(qū);具體而言,在本發(fā)明實(shí)施例中,網(wǎng)站頁(yè)面分為欄目頁(yè)(或子欄目頁(yè))、主題頁(yè)和文檔頁(yè)三種類型。其中,欄目頁(yè)由鏈接著下級(jí)欄目頁(yè)和主題頁(yè)的“導(dǎo)航條區(qū)”和直接鏈接文檔頁(yè)的“鏈接區(qū)”組成。有時(shí)候在頁(yè)面較大(較長(zhǎng))時(shí),鏈接區(qū)中插入導(dǎo)航點(diǎn),作為方便導(dǎo)航的一種補(bǔ)充。而,主題頁(yè)由于沒有下級(jí)欄目頁(yè),只有直接鏈接文檔的“鏈接區(qū)”。此外,文檔頁(yè)主要顯示原始信息。如圖2所示為動(dòng)態(tài)生成的虛擬網(wǎng)站結(jié)構(gòu)。判斷單元22,用于依據(jù)用戶興趣度確定欄目頁(yè)下屬各欄目在鏈接區(qū)中顯示區(qū)域的大小和位置;
具體而言,在本發(fā)明實(shí)施例中,興趣度是用戶對(duì)信息感興趣的程度。用戶興趣就是垂直網(wǎng)站特征空間或主題空間的一個(gè)向量。該向量在主題空間各維(軸)上的分量,即為用戶對(duì)該主題的興趣度。用戶對(duì)某欄目或子欄目的興趣度為該欄目或子欄目下屬各主題興趣度之和。本實(shí)施例中,將統(tǒng)計(jì)用戶瀏覽歷史的每一個(gè)特征詞的詞頻,并結(jié)合該特征詞出現(xiàn)的位置和瀏覽的時(shí)間長(zhǎng)短、時(shí)間先后的新近度,對(duì)每一個(gè)特征詞賦予一個(gè)興趣權(quán)Wi,表示用戶行為中對(duì)該特征詞的興趣程度,得到該用戶興趣描述模型P(w1; w2, W3, , wn)對(duì)于網(wǎng)站內(nèi)容(信息元、欄目等)也使用相同空間上的向量表示,便于將用戶的興趣和網(wǎng)站的內(nèi)容進(jìn)行比較運(yùn)算。垂直網(wǎng)站上,除了定義特征空間,還可以定義主題空間。其中,垂直網(wǎng)站內(nèi)容的粒度是指,垂直網(wǎng)站根據(jù)信息聚集的程度大小分為欄目和多級(jí)子欄目。欄目級(jí)次越低的子欄目,欄目主題范圍越窄,粒度越小。網(wǎng)站內(nèi)容的分類體系如圖3所示。垂直網(wǎng)站的主題是指,定義不再設(shè)置下級(jí)類目的子類(葉子類)為垂直網(wǎng)站的主題。主題可包含多篇文檔,文檔是網(wǎng)站內(nèi)容粒度最小的單位。垂直網(wǎng)站內(nèi)容的分類體系結(jié)構(gòu),決定了網(wǎng)站的欄目頁(yè)間的鏈接結(jié)構(gòu)。進(jìn)一步的,在本方案中,每個(gè)用戶的興趣偏好數(shù)據(jù)保存在用戶興趣模型庫(kù)。該庫(kù)的數(shù)據(jù)字段包括用戶標(biāo)識(shí)、興趣向量、IP地址等。執(zhí)行單元33,用于依據(jù)用戶興趣度順序篩選的信息,在各子欄目相應(yīng)的區(qū)域內(nèi)組織指向原始文檔的鏈接。具體而言,在本發(fā)明實(shí)施例中,當(dāng)用戶申請(qǐng)主題頁(yè)時(shí),鏈接區(qū)生成器用于使用數(shù)據(jù)過(guò)濾器,依據(jù)用戶興趣度順序優(yōu)先篩選的信息,在頁(yè)面上組織指向原始文檔的鏈接,可以連續(xù)使用前后鏈接著的多個(gè)頁(yè)面連續(xù)組織鏈接。而,數(shù)據(jù)過(guò)濾器則用于將網(wǎng)站上各主題范圍內(nèi)的文檔,按用戶興趣度排序,供鏈接區(qū)生成器從高到低選用。進(jìn)一步的,在本方案中,欄目頁(yè)鏈接區(qū)的布局算法包含如下約定1,鏈接區(qū)版面根據(jù)下屬子欄目數(shù)多少分為1-3列,各列寬度均等。2,鏈接區(qū)按下屬各子欄目集中組織超連接,分別構(gòu)成不可分割的矩形鏈接塊。3,欄目頁(yè)鏈接區(qū)的鏈接塊數(shù)即為該欄目下屬的子欄目數(shù)。4,各子欄目的面積大小由該子欄目的用戶興趣度和本鏈接區(qū)的總面積確定。5,由于寬度相同,面積由矩形的高度來(lái)表示,單位是“行”。6,布局時(shí),靠近屏幕頂端的位置具有較高的顯現(xiàn)度。分兩欄的鏈接區(qū),在布局高度相同時(shí),左邊具有較高顯現(xiàn)度;分三欄的鏈接區(qū),顯現(xiàn)度按中、左、右的順序排列。欄目頁(yè)鏈接區(qū)的布局算法通過(guò)各子欄目在鏈接區(qū)的布局按其面積由大到小的順序依次進(jìn)行,并且每個(gè)子欄目布置在當(dāng)前具有較高顯現(xiàn)度的位置。如圖4所示網(wǎng)站調(diào)整概念模型,網(wǎng)站所要展示的全部信息,以文件系統(tǒng)或數(shù)據(jù)庫(kù)系統(tǒng)的存儲(chǔ)形式保存在服務(wù)器。其中元數(shù)據(jù)存儲(chǔ)的結(jié)構(gòu)包括原始文檔的標(biāo)題、作者、URL、文檔類型、所屬主題(分類體系中的主題),產(chǎn)生、修改時(shí)間等等如圖4所示網(wǎng)站調(diào)整概念模型,網(wǎng)站形式結(jié)構(gòu)是網(wǎng)站結(jié)構(gòu)的基本框架,不作為自動(dòng)調(diào)整對(duì)象。保存在形式結(jié)構(gòu)庫(kù)中,數(shù)據(jù)字段主要有欄目(主題)名稱,上級(jí)欄目、頁(yè)面生成程序名等等。[XML描述]通過(guò)本發(fā)明實(shí)施例,可以獲知網(wǎng)站信息結(jié)構(gòu)調(diào)整結(jié)果為,在網(wǎng)站各主題上的信息顯現(xiàn)度分布是否與用戶的興趣度分布趨于一致,也就是信息結(jié)構(gòu)調(diào)整后的各主題的顯現(xiàn)度構(gòu)成的曲線和用戶興趣度曲線相重合(或平行)。如圖5所示。本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法攜帶的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),包括方法實(shí)施例的步驟之一或其組合。另外,在本發(fā)明各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理模塊中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)模塊中。上述集成的模塊既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能模塊的形式實(shí)現(xiàn)。所述集成的模塊如果以軟件功能模塊的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),也可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中。綜上所述,本文提供了一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整方法及系統(tǒng),通過(guò)從網(wǎng)站形式結(jié)構(gòu)庫(kù)中取出其下級(jí)欄目數(shù)據(jù),生成欄目頁(yè)的導(dǎo)航條區(qū),接著依據(jù)用戶興趣度確定欄目頁(yè)下屬各欄目在鏈接區(qū)中顯示區(qū)域的大小和位置,然后依據(jù)用戶興趣度順序篩選的信息,在各子欄目相應(yīng)的區(qū)域內(nèi)組織指向原始文檔的鏈接,本方案可較好的提高自適應(yīng)軟件的構(gòu)
建與管理效率。以上對(duì)本發(fā)明所提供的一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整方法及系統(tǒng)進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方案;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式
及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
權(quán)利要求
1.一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整方法,其特征在于,所述方法包括步驟一、從網(wǎng)站形式結(jié)構(gòu)庫(kù)中取出其下級(jí)欄目數(shù)據(jù),生成欄目頁(yè)的導(dǎo)航條區(qū);步驟二、依據(jù)用戶興趣度確定欄目頁(yè)下屬各欄目在鏈接區(qū)中顯示區(qū)域的大小和位置;步驟三、依據(jù)用戶興趣度順序篩選的信息,在各子欄目相應(yīng)的區(qū)域內(nèi)組織指向原始文檔的鏈接。
2.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述步驟一中,所述網(wǎng)站頁(yè)面分為欄目頁(yè)(或子欄目頁(yè))、主題頁(yè)和文檔頁(yè)三種類型。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述欄目頁(yè)由鏈接著下級(jí)欄目頁(yè)和主題頁(yè)的導(dǎo)航條區(qū)和直接鏈接文檔頁(yè)的鏈接區(qū)組成。
4.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述興趣度是用戶對(duì)信息感興趣的程度,用戶興趣就是垂直網(wǎng)站特征空間或主題空間的一個(gè)向量,該向量在主題空間各維(軸)上的分量,即為用戶對(duì)該主題的興趣度。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,用戶對(duì)所述欄目或子欄目的興趣度為該欄目或子欄目下屬各主題興趣度之和。
6.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述步驟二中,將統(tǒng)計(jì)用戶瀏覽歷史的每一個(gè)特征詞的詞頻,并結(jié)合該特征詞出現(xiàn)的位置和瀏覽的時(shí)間長(zhǎng)短、時(shí)間先后的新近度,對(duì)每一個(gè)特征詞賦予一個(gè)興趣權(quán)Wi,表示用戶行為中對(duì)該特征詞的興趣程度,得到該用戶興趣描述模型P (W1, w2, W3, , wn)。
7.根據(jù)權(quán)利要求I所述的方法,其特征在于,所述步驟三中,當(dāng)用戶申請(qǐng)主題頁(yè)時(shí),鏈接區(qū)生成器用于使用數(shù)據(jù)過(guò)濾器,依據(jù)用戶興趣度順序優(yōu)先篩選的信息,在頁(yè)面上組織指向原始文檔的鏈接,可以連續(xù)使用前后鏈接著的多個(gè)頁(yè)面連續(xù)組織鏈接。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述數(shù)據(jù)過(guò)濾器則用于將網(wǎng)站上各主題范圍內(nèi)的文檔,按用戶興趣度排序,供鏈接區(qū)生成器從高到低選用。
9.一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整系統(tǒng),其特征在于,所述系統(tǒng)包括生成單元、判斷單元以及執(zhí)行單元,通過(guò)從網(wǎng)站形式結(jié)構(gòu)庫(kù)中取出其下級(jí)欄目數(shù)據(jù),生成欄目頁(yè)的導(dǎo)航條區(qū),接著依據(jù)用戶興趣度確定欄目頁(yè)下屬各欄目在鏈接區(qū)中顯示區(qū)域的大小和位置,然后依據(jù)用戶興趣度順序篩選的信息,在各子欄目相應(yīng)的區(qū)域內(nèi)組織指向原始文檔的鏈接。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述生成單元用于從網(wǎng)站形式結(jié)構(gòu)庫(kù)中取出其下級(jí)欄目數(shù)據(jù),生成欄目頁(yè)的導(dǎo)航條區(qū)。
11.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述判斷單元用于依據(jù)用戶興趣度確定欄目頁(yè)下屬各欄目在鏈接區(qū)中顯示區(qū)域的大小和位置。
12.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述執(zhí)行單元用于依據(jù)用戶興趣度順序篩選的信息,在各子欄目相應(yīng)的區(qū)域內(nèi)組織指向原始文檔的鏈接。
全文摘要
本發(fā)明提供了一種網(wǎng)站信息結(jié)構(gòu)的動(dòng)態(tài)調(diào)整方法及系統(tǒng),通過(guò)從網(wǎng)站形式結(jié)構(gòu)庫(kù)中取出其下級(jí)欄目數(shù)據(jù),生成欄目頁(yè)的導(dǎo)航條區(qū),接著依據(jù)用戶興趣度確定欄目頁(yè)下屬各欄目在鏈接區(qū)中顯示區(qū)域的大小和位置,然后依據(jù)用戶興趣度順序篩選的信息,在各子欄目相應(yīng)的區(qū)域內(nèi)組織指向原始文檔的鏈接,本方案可較好的提高自適應(yīng)軟件的構(gòu)建與管理效率。
文檔編號(hào)G06F9/44GK102937986SQ20121041389
公開日2013年2月20日 申請(qǐng)日期2012年10月25日 優(yōu)先權(quán)日2012年10月25日
發(fā)明者楊志和 申請(qǐng)人:上海電機(jī)學(xué)院