亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

標簽建構(gòu)方法及系統(tǒng)的制作方法

文檔序號:6563092閱讀:134來源:國知局

專利名稱::標簽建構(gòu)方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
:本發(fā)明是有關(guān)于計算機技術(shù),且特別有關(guān)于標簽地圖自動建構(gòu)方法。
背景技術(shù)
:隨著Web2.0觀念的興起,應(yīng)用大眾分類方法論(folksnonomy)的網(wǎng)站也漸漸普遍,例如Del.icio.us網(wǎng)站。相較于傳統(tǒng)由專家或作者執(zhí)行的分類管理(taxonomy),Folksnonomy是由使用者將網(wǎng)站、檔案、數(shù)字影像等網(wǎng)絡(luò)資源以標簽(tag)作分類。標簽為用來代表資源的關(guān)鍵詞或描述性用語。圖1顯示標簽地圖(TagCloud)的一實例。圖1中,字體越大的標簽代表其聯(lián)結(jié)的資源越多??梢杂删W(wǎng)頁服務(wù)器的一網(wǎng)頁接收一標簽、該標簽對應(yīng)的資源地址、描述及批注后,將該標簽加入標簽地圖。當該標簽被使用者點選時,該網(wǎng)頁服務(wù)器重新引導(dǎo)(redirect)該使用者至該資源地址。然而,同一標簽可能指向完全不相關(guān)的對象。舉例來說,MIT可能表示"MadeinTaiwan"及"MassachusettsInstituteofTechology"。i亥問題會卩條^f氐搜尋的準確率(precision)。另外,也可能不同標簽指向完全相同的對象。例如標簽"cat"與"cats"可能指向相同的網(wǎng)頁,"NewYork"、"New—York"可能都是指紐約市。另外標簽之間可能互為關(guān)聯(lián)詞,例如標簽"peri"、"javascript"及"programming",或"java"、"jdk"及"j2ee"。標簽用i吾的這類問題會降低搜尋的搜全率(recall)。
發(fā)明內(nèi)容為解決上述現(xiàn)有技術(shù)中所存在的問題,本發(fā)明的主要目的在于提供一種標簽建構(gòu)方法及系統(tǒng)?;谏鲜瞿康?,本發(fā)明實施例提供一種標簽建構(gòu)方法,該方法包含下列步驟接收代表網(wǎng)絡(luò)資源的多個標簽;決定多個標簽中每一個所對應(yīng)的資源范圍;根據(jù)每一標簽對應(yīng)的資源范圍以建立上述多個標簽成為一階層化關(guān)系網(wǎng)絡(luò)中的節(jié)點;利用上述階層化關(guān)系網(wǎng)絡(luò)輔助資源搜尋。本發(fā)明還一種計算機可讀取儲存媒體,用以儲存一計算機程序,該計算機程序可加載至一計算機裝置中以執(zhí)行上述實施例所提供的標簽建構(gòu)方法。另外,本發(fā)明實施例提供一種標簽建構(gòu)系統(tǒng),包含標簽?zāi)K、建構(gòu)模塊及搜尋模塊。標簽?zāi)K接收代表網(wǎng)絡(luò)資源的多個標簽。建構(gòu)模塊決定多個標簽中每一個所對應(yīng)的資源范圍,并才艮據(jù)每一標簽對應(yīng)的資源范圍以建立上述多個標簽成為一階層化關(guān)系網(wǎng)絡(luò)中的節(jié)點。搜尋^t塊利用上述階層化關(guān)系網(wǎng)絡(luò)輔助資源搜尋。另外,本發(fā)明實施例提供一種標簽建構(gòu)方法,包含下列步驟接收代表網(wǎng)絡(luò)資源的多個標簽,包含第一標簽及第二標簽;決定每一個所對應(yīng)的資源集合;依下列步驟以分類上述第一及第二標簽若上述第一及第二標簽分別對應(yīng)資源集合OA及OB,且資源集合Oa大于資源集合0B,且第一及第二標簽對應(yīng)共同資源,且上述共同資源在Os中所占比率大于一預(yù)定比率,則判別笫二標簽被歸屬于第一標簽。通過本發(fā)明利用階層化關(guān)系網(wǎng)絡(luò)作為輔助資源搜尋的圖像導(dǎo)覽,可以幫助使用者逐步放寬或縮小搜尋范圍,調(diào)整搜全率(recall)與準確率(precision),改善標簽的基本層級差異。圖1顯示一標簽地圖2顯示標簽建構(gòu)系統(tǒng)的結(jié)構(gòu)示意圖3a圖3j顯示階層化關(guān)系網(wǎng)絡(luò)示意圖4顯示標簽建構(gòu)方法實施例的流程圖5顯示標簽的階層化關(guān)系網(wǎng)絡(luò)建構(gòu)方法的實施例的流程圖6顯示連結(jié)凈皮加權(quán)后的階層化關(guān)系網(wǎng)絡(luò)示意圖;以及圖7顯示多個計算機裝置所構(gòu)成的網(wǎng)絡(luò)系統(tǒng)實施例的示意圖。主要組件符號說明1~處理器;2~存儲器;10區(qū)域;100標簽建構(gòu)系統(tǒng);UO區(qū)域;111~標簽?zāi)K;112提示模塊;120區(qū)域;121~標簽庫;122建構(gòu)模塊;123關(guān)系網(wǎng)絡(luò)暫存區(qū);130~區(qū)域;131搜尋模塊;132搜尋結(jié)果暫存區(qū);133排列模塊;140~區(qū)域;141標簽接口;142搜尋接口;150輸出模塊;700服務(wù)器;C多個客戶端計算機;H階層化關(guān)系網(wǎng)絡(luò)。具體實施例方式以下說明是本發(fā)明的較佳實施例。其目的是要舉例說明本發(fā)明一般性的原則,不應(yīng)視為本發(fā)明的限制,本發(fā)明的范圍當以權(quán)利要求所界定的為準。以下揭示標簽建構(gòu)方法。標簽建構(gòu)方法包含取得標簽、標簽分類、輔助數(shù)據(jù)搜尋、執(zhí)行搜尋及排列搜尋結(jié)果等步驟。圖2顯示標簽建構(gòu)系統(tǒng)的結(jié)構(gòu)示意圖。請參照圖2及圖4,區(qū)域IIO、120及130中的模塊分別作為建立標簽、處理標簽及資源搜尋之用。區(qū)域140中包含圖形化使用者接口(Graphicaluserinterface,簡稱GUI),即圖2中的標簽接口141及搜尋接口142。標簽?zāi)Klll通過標簽接口141接收標簽及對應(yīng)資源(例如網(wǎng)頁、圖片、文件等網(wǎng)絡(luò)資源)并輸入至標簽庫(Tagrepository)121(步驟S400)。建構(gòu)模塊122決定多個標簽中每一個所對應(yīng)的資源范圍(步驟S402),根據(jù)每一標簽對應(yīng)的資源范圍以建立標簽庫121中標簽之間的關(guān)系,并將標簽庫121中的標簽建立為其關(guān)系網(wǎng)絡(luò)中的節(jié)點,稱為階層化關(guān)系網(wǎng)絡(luò)H(步驟S404)。區(qū)域130中的模塊再使用階層化關(guān)系網(wǎng)絡(luò)H以輔助資源搜尋(步驟S406)。舉例來說,搜尋模塊131通過搜尋接口142接收搜尋字符串或關(guān)鍵詞,進行搜尋以取得搜尋結(jié)果,以儲存至搜尋結(jié)果暫存區(qū)132。排列模塊133參照階層化關(guān)系網(wǎng)絡(luò)H以計算搜尋結(jié)果中的資源的信息密度指針,并依據(jù)信息密度指針以排列搜尋結(jié)果中的資源,再存回搜尋結(jié)果暫存區(qū)132。輸出模塊150顯示排列后的搜尋結(jié)杲。搜尋模塊131也可以在搜尋接口142顯示階層化關(guān)系網(wǎng)絡(luò)H或其中的部分節(jié)點以輔助使用者進行搜尋。以下表格1顯示標簽庫'121中標簽與資源之間的關(guān)系,其中標簽與資源之間的數(shù)字顯示標簽才莫塊111所接收的該標簽用來代表或指示該資源的次數(shù)<table>tableseeoriginaldocumentpage9</column></row><table>表格l表格1可以用標簽與資源的一矩陣R代表,如下:<formula>formulaseeoriginaldocumentpage10</formula>Rij為第i個標簽用來描述第j資源的次數(shù),其中i及j為整數(shù),且0《i<12,0《j<6。建構(gòu)模塊122可以每一標簽所對應(yīng)的資源類別數(shù)目作為每一標簽對應(yīng)的資源范圍。因此,建構(gòu)模塊122可以決定多個標簽中每一個所對應(yīng)的資源范圍。例如標簽Sun對應(yīng)"初階Java"、"J2MEintro"、"程序設(shè)計"、"C弁一點點,,以及"Java&J2ME,,等五個資源,而JDK只對應(yīng)其中的三個資源。因此標簽Sun的資源范圍大于JDK的資源范圍。建構(gòu)才莫塊122根據(jù)每一標簽對應(yīng)的資源范圍以建立上述多個標簽成為上述多個標簽的階層化關(guān)系網(wǎng)絡(luò)H中的節(jié)點。首先,建構(gòu)模塊122根據(jù)每一標簽的資源范圍對上述多個標簽排序。資源類別數(shù)目的統(tǒng)計請參照以下表格2:<table>tableseeoriginaldocumentpage10</column></row><table><table>tableseeoriginaldocumentpage11</column></row><table>表格2每一標簽對應(yīng)的資源類別數(shù)目為該標簽在表格l的同一列中的非零項的數(shù)目。每一標簽對應(yīng)的使用次數(shù)為該標簽用來描述資源的次數(shù)的總合。建構(gòu)模塊122根據(jù)每一標簽的資源類別數(shù)目對上述多個標簽排序,如果有多個標簽的資源類別數(shù)目相等,就再依其使用次數(shù)作排序。若二標簽的資源類別數(shù)目及《吏用次數(shù)都相同,則以輸入系統(tǒng)100對時間先后順序排序。以下表格3顯示排序后的結(jié)果<table>tableseeoriginaldocumentpage11</column></row><table><table>tableseeoriginaldocumentpage12</column></row><table>表格3已排列的標簽順序為programming,Java、API、Sun、J2EE、C#、Javascript、JDK、J2SE、JSP、J2ME及Php,將依序加入階層化關(guān)系網(wǎng)絡(luò)H。建構(gòu)模塊122利用表格3以產(chǎn)生用二元數(shù)據(jù)來表示標簽與資源間的關(guān)系的表格4:<table>tableseeoriginaldocumentpage12</column></row><table>表格4其中l(wèi)代表有關(guān)系,0代表沒有關(guān)系。表格4可以用一矩陣M代表標簽與資源的關(guān)系,如下<formula>formulaseeoriginaldocumentpage13</formula>(2)向量Mi用來表示第i個標簽的標簽向量。舉例來說,第0個標簽programming的標簽向量為[l1011l]。建構(gòu)模塊122產(chǎn)生階層化關(guān)系網(wǎng)絡(luò)H時可以利用以下的數(shù)組數(shù)據(jù)結(jié)構(gòu)Tag[]:儲存所有已排序過,且尚未加入階層化關(guān)系網(wǎng)絡(luò)H的標簽。hierarchy[]:儲存所有已加入的階層化關(guān)系網(wǎng)絡(luò)H的標簽的備份。Terminal[]:儲存所有已加入階層化關(guān)系網(wǎng)絡(luò)H而尚未有子節(jié)點的標簽。Tag—Relation[][]:標簽的關(guān)系矩陣,為一01矩陣,若Tag—Relation[x][y]-l表示第x個標簽為第y個標簽的子節(jié)點,x及y都為整數(shù)。建立階層圖參照圖5,建構(gòu)模塊122執(zhí)行以下步驟。建構(gòu)模塊122依照上述方式將標簽庫121中的標簽排序后(步驟S500),初始化階層化關(guān)系網(wǎng)絡(luò)H(步驟S502)。如圖3a所示,建構(gòu)模塊122加入根節(jié)點S及終端T節(jié)點至階層化關(guān)系網(wǎng)絡(luò)H。所有找不到父節(jié)點的標簽,以根節(jié)點S為父節(jié)點。T節(jié)點連接Terminal[]中的所有末端節(jié)點,即任何沒有子節(jié)點的節(jié)點。根節(jié)點的標簽向量可以設(shè)為[l1111l]。此時Terminal[]及hierarchy[]都僅包含根節(jié)點S。建構(gòu)模塊122從排序后的上述多個標簽中取出一標簽(例如標簽"programming")以加入上述階層化關(guān)系網(wǎng)絡(luò)H作為一節(jié)點(步驟S504)。舉例來說,如圖3b所示,當建構(gòu)模塊122取標簽"programming"作為目前節(jié)點時直接以根節(jié)點S作為其父節(jié)點。建構(gòu)模塊122判別Tag[]是否還有標簽(步驟S506)。如無,建構(gòu)模塊122輸出階層化關(guān)系網(wǎng)絡(luò)H至關(guān)系網(wǎng)絡(luò)暫存區(qū)123(步驟S508)。如有,建構(gòu)模塊122從排序后的上述多個標簽Tag[]中依序取出一標簽Tag[x],稱為目前節(jié)點(步驟S510),x為整數(shù)。建構(gòu)模塊122復(fù)制階層化關(guān)系網(wǎng)絡(luò)H中的全部標簽至hierarchy[](步驟S512)。建構(gòu)模塊122由終端節(jié)點T開始,依寬度優(yōu)先搜尋(breathfirstsearch,筒稱BFS)算法的順序取得階層化關(guān)系網(wǎng)絡(luò)H中的一節(jié)點hierarchy[y]作為待檢查節(jié)點(步驟S514),該節(jié)點必須存在于hierarchy[]中。從hierarchy[]中刪去hierarchy[y](步驟S515)。建構(gòu)模塊122比較目前節(jié)點Tag[x]與上述取得的待檢查節(jié)點hierarchy[y]的關(guān)系是否符合下列條件(步驟S516)。上述目前節(jié)點Tag[x]及上述取得的待檢查節(jié)點hierarchy[y]分別代表一第一及第二標簽。第一及第二標簽對應(yīng)的資源集合分別為OA及OB。若符合下列式子,則目前節(jié)點Tag[x]及上述取得的待檢查節(jié)點之間可以建立一父子關(guān)系A(chǔ)l(3)其中,入為預(yù)定數(shù)字,以下假設(shè)為0.8。IOAJ為OA的數(shù)目。|oAnoB^Oa及Ob的交集的資源數(shù)目。在此步驟S516中,建構(gòu)模塊122對上述目前節(jié)點Tag[x]及上述待檢查節(jié)點hierarchy[y]執(zhí)行父子關(guān)系檢查。在父子關(guān)系檢查中,當上述第一及第二標簽所共同對應(yīng)的資源數(shù)量符合上述式子(3)時,建構(gòu)模塊122使上述二標簽中資源范圍較大與較小的標簽之間建立一父子關(guān)系(步驟S518),并分別成為該關(guān)系中的父節(jié)點與子節(jié)點。在Tag一Relation[][]中的對應(yīng)位置輸入"1"。如否,建構(gòu)模塊122直接執(zhí)行步驟S522。步驟S522中,建構(gòu)模塊122判別hierarchy[]中是否還有標簽(步驟S522)。如是,重復(fù)步驟S514。如否,重復(fù)步驟S506。所有找不到父節(jié)點的標簽,以根節(jié)點S為父節(jié)點。舉例來說,當建構(gòu)模塊122取標簽"Java"作為目前節(jié)點時,對標簽"Java"=0.8^與標簽"programming"作父子關(guān)系檢查。此時|0八|=5而因此,如圖3c所示,建構(gòu)模塊122使上述二標簽中資源范圍較大與較小的標簽之間被建立一父子關(guān)系(以圖3c中的連結(jié)Ll表示),并分別成為該關(guān)系中的父節(jié)點與子節(jié)點。同理,如圖3d所示,當建構(gòu)模塊122取標簽"api,'作為目前節(jié)點時,|0J,所以標簽"Java"成為標簽"api"的父節(jié)點。須要了解的是,當一已檢查節(jié)點(例如標簽"Java")已成為上述目前標簽(例如標簽"api")的父節(jié)點,則該已檢查節(jié)點的祖先節(jié)點(例如標簽"programming")不需再與上述目前節(jié)點進行該父子關(guān)系檢查。因此,建構(gòu)模塊122從hiemrchy[]中刪除待檢查節(jié)點hierarchy[y]及上述待檢查節(jié)點的祖先節(jié)點(步驟S520)。相反地,當一已檢查節(jié)點經(jīng)檢查后不是上述目前標簽的父節(jié)點,則該已檢查節(jié)點的祖先節(jié)點仍需與上述目前節(jié)點進行該父子關(guān)系檢查。舉例來說,如圖3e所示,當建構(gòu)模塊122取標簽"sun"作為目前節(jié)點,標簽"api,,作為待檢查節(jié)點時,1^14,所以標簽"api"不是標簽"sun"的父節(jié)點。因此,標簽"java"需要與標簽"sun"進行該父子關(guān)系檢查。此時建構(gòu)模塊122取標簽"sun"作為目前節(jié)點,標簽"java"=1>義作為待檢查節(jié)點時,|0J,所以標簽"Java"成為標簽"s皿"的父節(jié)點。標簽"Java"祖先節(jié)點(例如標簽"programming")不需再與上述目前節(jié)點進行該父子關(guān)系檢查。同理,建構(gòu)模塊122分別在圖3f、圖3g、圖3h及圖3i中把標簽"j2ee"、"C弁"、"javascript"及"jdk"加入階層化關(guān)系網(wǎng)絡(luò)H,最后完成圖3j。經(jīng)由上述說明可知,建構(gòu)階層化關(guān)系網(wǎng)絡(luò)H即是在進行標簽分類。若存在標簽A及B分別對應(yīng)資源集合OA及Ob。當下列條件被滿足時(1)標簽A的資源范圍大于標簽B的資源范圍(即IOaWObI);(2)標簽A及B對應(yīng)共同資源WpoAnoB*a),①指空集合);(3)上述共同資源在Os中所占比率(或比值)大于一預(yù)定比率(例如比值入),即1^1一;則標簽B被判別歸屬于標簽A。輔助資源搜尋關(guān)鍵詞提示搜尋接口142接收一搜尋用關(guān)鍵詞。當上述關(guān)鍵詞符合上述階層化關(guān)系網(wǎng)絡(luò)H中的一特定標簽(例如java),提示模塊112則取得上述特定標簽的所有相鄰節(jié)點。搜尋模塊131顯示上述相鄰節(jié)點所對應(yīng)的標簽內(nèi)容,作為候選的搜尋關(guān)鍵詞。當上述候選標簽的標簽內(nèi)^^皮選取時,搜尋模塊131以上述標簽內(nèi)容為關(guān)鍵詞進行搜尋。另外,可以利用一參數(shù)D來設(shè)定上述特定標簽的相鄰節(jié)點的范圍。舉例來說,上述參數(shù)D用來設(shè)定上述特定標簽與其相鄰節(jié)點的距離,以下以每個連結(jié)為1單位距離來計算。當參數(shù)D-1時,搜尋模塊131輸出與上述特定標簽相距一層連結(jié)的標簽(包含父節(jié)點及子節(jié)點)至輸出模塊150來加以顯示。例如與java相距一層連結(jié)的標簽為Sun,Programming,api及jsp。當參凄tD=2時,搜尋模塊131輸出與上述特定標簽相距二層連結(jié)以內(nèi)的標簽(包含父節(jié)點及子節(jié)點、祖父節(jié)點及孫子節(jié)點)。例如與java相距二層連結(jié)的標簽為Javascript,j2ee,jdk,C存及php。參數(shù)D可以供使用者設(shè)定調(diào)整。搜尋模塊131也可以直接顯示階層化關(guān)系網(wǎng)絡(luò)H,或?qū)⑵渲泄?jié)點按字母順序排序后以標簽地圖形式顯示。搜尋模塊131可以依照標簽被使用的次數(shù)以決定其在標簽地圖中的大小。輔助資源搜尋搜尋結(jié)果排列搜尋模塊131通過搜尋接口142接收搜尋字符串或關(guān)鍵詞,進行搜尋以取得搜尋結(jié)果,以儲存至搜尋結(jié)果暫存區(qū)132。排列模塊133參照階層化關(guān)系網(wǎng)絡(luò)H以計算搜尋結(jié)果中多個資源的信息密度指針。建構(gòu)模塊122可以依照下式賦與標簽關(guān)系(即階層化關(guān)系網(wǎng)絡(luò)H中連結(jié))權(quán)重。以二標簽的標簽向量A和B為例,我們計算A和B的余弦相似度(cosinesimilarity):(4)以為上述二標簽之間的關(guān)系的權(quán)重。舉例來i兌,programming的標簽向量為[110111〗,Java的標簽向量為[10111l],API的標簽向量為[111110],Sun的標簽向量為[IOI101],J2EE的標簽向量為,C#的標簽向量為,JDK的標簽向量為[100101],JSP的標簽向量為[l00100]。上述標簽之間的關(guān)系權(quán)重如圖6所示。計算資源對象分數(shù)的公式如下/:k附++,))S:對象符合作為關(guān)鍵詞的標簽所得到的信息密度指針分數(shù)。Wi:父/子節(jié)點和關(guān)鍵詞之間的關(guān)系權(quán)重。Wj:祖父/孫子節(jié)點和關(guān)鍵詞之間的兩層關(guān)系權(quán)重乘積。k,n,m:該對象符合k個標簽、n個父/子節(jié)點以及m個祖父/孫子節(jié)點。因此,根據(jù)上述算式(5),當S^,且一資源符合關(guān)鍵詞java時,其分數(shù)為(1)+(0,75+0.43+0.51.0.72)+(0.38+0.87)。排列模塊133可以依照算式(5)以計算搜尋結(jié)果中多個資源的信息密度指針,并依據(jù)信息密度指針以排列搜尋結(jié)果中的資源,再存回搜尋結(jié)果暫存區(qū)132。輸出模塊150顯示排列后的搜尋結(jié)果。上述標簽建構(gòu)方法可用于儲存在計算機可讀取儲存媒體的一計算機程序?qū)嵶?。參照圖7,系統(tǒng)IOO可以由計算機程序組成,執(zhí)行于服務(wù)器700。存儲器2儲存系統(tǒng)100,當系統(tǒng)100載入至服務(wù)器700時,處理器l執(zhí)行如上所述的方法。可以從電纜、無線通信信道,或光盤、硬盤、卸除式磁盤驅(qū)動器等,或從其它儲存媒體中栽入系統(tǒng)100至存儲器2。服務(wù)器700可以通過網(wǎng)絡(luò)耦接于多個客戶端計算機C。多個客戶端計算機C通過瀏覽器以輸入標簽至系統(tǒng)100,并顯示系統(tǒng)IOO提示的候選標簽、階層化關(guān)系網(wǎng)絡(luò)H及搜尋結(jié)果??傊?,上述系統(tǒng)可以建立標簽的階層化關(guān)系圖,以提供給使用者作搜尋資源的接口,并能經(jīng)由選擇不同階層的標簽以調(diào)整搜尋范圍的大小。雖然本發(fā)明已以較/f圭實施例揭露如上,然其并非用以限定本發(fā)明,任何所屬
技術(shù)領(lǐng)域
中具有通常知識者,在不脫離本發(fā)明的精神和范圍內(nèi),當可作各種的更動與潤飾,因此本發(fā)明的保護范圍當視權(quán)利要求所界定的為準。權(quán)利要求1.一種標簽建構(gòu)方法,其特征在于,該方法包含接收代表網(wǎng)絡(luò)資源的多個標簽;決定多個標簽中每一個所對應(yīng)的資源范圍;根據(jù)每一標簽對應(yīng)的資源范圍以建立上述多個標簽成為一階層化關(guān)系網(wǎng)絡(luò)中的節(jié)點;利用上述階層化關(guān)系網(wǎng)絡(luò)輔助資源搜尋。2.如權(quán)利要求1所述的標簽建構(gòu)方法,其特征在于,建立上述多個標簽的階層化關(guān)系網(wǎng)絡(luò)的步驟中還包含取得一第一標簽及一第二標簽;對上述第一及第二標簽的執(zhí)行父子關(guān)系檢查;其中該父子關(guān)系檢查還包含當上述笫一及第二標簽所共同對應(yīng)的資源數(shù)量符合一條件時,使上述二標簽中資源范圍較大與較小的標簽之間建立一父子關(guān)系,并分別成為該關(guān)系中的父節(jié)點與子節(jié)點。3.如權(quán)利要求2所述的標簽建構(gòu)方法,其特征在于,上述資源范圍即網(wǎng)絡(luò)資源的數(shù)目。4,如權(quán)利要求3所述的標簽建構(gòu)方法,其特征在于,上述第一及第二標簽對應(yīng)的資源集合分別為Oa及Ob,上述條件為下列式子IAI—其中,入為預(yù)定數(shù)字,iOAi為OA的數(shù)目,|oAnoB^Oa及Ob的交集的資源數(shù)目。5.如權(quán)利要求2所述的標簽建構(gòu)方法,其特征在于,該方法還包含a.才艮據(jù)每一標簽的資源范圍對上述多個標簽排序;b.初始化上述階層化關(guān)系網(wǎng)絡(luò);c.依序從排序后的上述多個標簽中取出另一標簽,稱為目前標簽;d.從上述階層化關(guān)系網(wǎng)絡(luò)的末端節(jié)點開始,依寬度優(yōu)先搜尋算法的順序取得上述階層化關(guān)系網(wǎng)絡(luò)中每一節(jié)點,與上述目前標簽進行上述父子關(guān)系檢查,其中當一已檢查節(jié)點已成為上述目前標簽的父節(jié)點,則該已檢查節(jié)點的祖先節(jié)點不進行該檢查;以及e重復(fù)上述步驟c及d直到所有標簽都加入該階層化關(guān)系網(wǎng)絡(luò)。6.如權(quán)利要求1所述的標簽建構(gòu)方法,其特征在于,上述資源搜尋還包含接收一搜尋用關(guān)鍵詞;當上述關(guān)鍵詞符合上述階層化關(guān)系網(wǎng)絡(luò)中的一特定標簽,則取得上述特定標簽的所有相鄰節(jié)點;以及顯示上述相鄰節(jié)點所對應(yīng)的標簽內(nèi)容。7.如權(quán)利要求6所述的標簽建構(gòu)方法,其特征在于,該方法還包含當上述標簽內(nèi)容被選取時,以上述標簽內(nèi)容為關(guān)鍵詞進行搜尋。8.如權(quán)利要求6所述的標簽建構(gòu)方法,其特征在于,該方法還包含利用一參數(shù)來指定上述特定標簽與其相鄰節(jié)點的距離。9.如權(quán)利要求1所述的標簽建構(gòu)方法,其特征在于,上述資源搜尋還包含當以一標簽作為一關(guān)鍵詞搜尋得到多個資源時,利用上述階層化關(guān)系網(wǎng)絡(luò)計算上述多個資源的信息密度指針;依據(jù)每一資源的信息密度指針對上述多個資源進行排序;以及顯示排序后的上述多個資源。10.—種計算機可讀取儲存媒體,用以儲存一計算機程序,其特征在于,上述計算機程序可加載至一計算機裝置中以執(zhí)行如權(quán)利要求1至9中任一項所述的標簽建構(gòu)方法。11.一種標簽建構(gòu)系統(tǒng),其特征在于,該標簽建構(gòu)系統(tǒng)包含一標簽?zāi)K,接收代表網(wǎng)絡(luò)資源的多個標簽;一建構(gòu)模塊,決定多個標簽中每一個所對應(yīng)的資源范圍,并根據(jù)每一標簽對應(yīng)的資源范圍以建立上述多個標簽成為一階層化關(guān)系網(wǎng)絡(luò)中的節(jié)點;一搜尋模塊,利用上述階層化關(guān)系網(wǎng)絡(luò)輔助資源搜尋。12.如權(quán)利要求11所述的標簽建構(gòu)系統(tǒng),其特征在于,上述建構(gòu)模塊取得一第一標簽及一第二標簽,對上述第一及第二標簽執(zhí)行父子關(guān)系檢查,其中,在該父子關(guān)系檢查中,當上述第一及第二標簽所共同對應(yīng)的資源數(shù)量符合一條件時,上述建構(gòu)模塊使上述二標簽中資源范圍較大與較小的標簽之間建立一父子關(guān)系,并分別成為該關(guān)系中的父節(jié)點與子節(jié)點。13.如權(quán)利要求12所述的標簽建構(gòu)系統(tǒng),其特征在于,上述資源范圍即網(wǎng)絡(luò)資源的數(shù)目。14.如權(quán)利要求13所述的標簽建構(gòu)系統(tǒng),其特征在于,上述第一及第二標簽對應(yīng)的資源集合分別為Oa及Ob,上述條件為下列式子^門^>義其中,入為預(yù)定數(shù)字,IOAl為oa的數(shù)目,IOA門OBl為Oa及Ob的交集的資源數(shù)目。15.如權(quán)利要求12所述的標簽建構(gòu)系統(tǒng),其特征在于,上述建構(gòu)模塊執(zhí)行下列步驟a.根據(jù)每一標簽的資源范圍對上述多個標簽排序;b.初始化上述階層化關(guān)系網(wǎng)絡(luò);c.依序從排序后的上述多個標簽中取出另一標簽,稱為目前標簽;d.從上述階層化關(guān)系網(wǎng)絡(luò)的末端節(jié)點開始,依寬度優(yōu)先搜尋算法的順序取得上述階層化關(guān)系網(wǎng)絡(luò)中每一節(jié)點,與上述目前標簽進行上述父子關(guān)系檢查,其中當一已檢查節(jié)點已成為上述目前標簽的父節(jié)點,則該已檢查節(jié)點的祖先節(jié)點不進行該檢查;以及e.重復(fù)上述步驟c及d直到所有標簽都加入該階層化關(guān)系網(wǎng)絡(luò)。16.如權(quán)利要求11所述的標簽建構(gòu)系統(tǒng),其特征在于,上述搜尋模塊接收一搜尋用關(guān)鍵詞,當上述關(guān)鍵詞符合上述階層化關(guān)系網(wǎng)絡(luò)中的一特定標簽,則取得上述特定標簽的所有相鄰節(jié)點,以及顯示上述相鄰節(jié)點所對應(yīng)的標簽內(nèi)容。17.如權(quán)利要求16所述的標簽建構(gòu)系統(tǒng),其特征在于,當上述標簽內(nèi)容被選取時,上述搜尋模塊以上述標簽內(nèi)容為關(guān)鍵詞進行搜尋。18.如權(quán)利要求16所述的標簽建構(gòu)系統(tǒng),其特征在于,上述搜尋模塊利用一參數(shù)來指定上述特定標簽與其相鄰節(jié)點的距離。19.如權(quán)利要求11所述的標簽建構(gòu)系統(tǒng),其特征在于,當上述搜尋模塊以一標簽作為一關(guān)鍵詞搜尋得到多個資源時,利用上述階層化關(guān)系網(wǎng)絡(luò)計算上述多個資源的信息密度指針,依據(jù)每一資源的信息密度指針對上述多個資源進行排序,以及顯示排序后的上述多個資源。20.—種標簽建構(gòu)方法,其特征在于,該方法包含接收代表網(wǎng)絡(luò)資源的多個標簽,包含第一標簽及第二標簽;決定每一個所對應(yīng)的資源集合;依下列步驟以分類上述第一及第二標簽若上述第一及第二標簽分別對應(yīng)資源集合0A及0B,且資源集合0A大于資源集合Ob,且第一及第二標簽對應(yīng)共同資源,且上述共同資源在Ob中所占比率大于一預(yù)定比率,則判別第二標簽被歸屬于第一標簽。全文摘要本發(fā)明提供一種標簽建構(gòu)方法及系統(tǒng),所述方法包含下列步驟接收代表網(wǎng)絡(luò)資源的多個標簽;決定多個標簽中每一個所對應(yīng)的資源范圍;根據(jù)每一標簽對應(yīng)的資源范圍以建立上述多個標簽成為一階層化關(guān)系網(wǎng)絡(luò)中的節(jié)點。利用上述階層化關(guān)系網(wǎng)絡(luò)作為輔助資源搜尋的圖像導(dǎo)覽,可以幫助使用者逐步放寬或縮小搜尋范圍,調(diào)整搜全率(recall)與準確率(precision),改善標簽的基本層級差異。文檔編號G06F17/30GK101192220SQ20061014948公開日2008年6月4日申請日期2006年11月21日優(yōu)先權(quán)日2006年11月21日發(fā)明者謝文泰,賴威慎申請人:財團法人資訊工業(yè)策進會
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1