專利名稱:用于緩存術(shù)語數(shù)據(jù)的方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)據(jù)管理技術(shù),特別地,本發(fā)明涉及用于在術(shù)語服務(wù)中用于緩存語義 數(shù)據(jù)的方法和系統(tǒng)。
背景技術(shù):
術(shù)語服務(wù)是指應(yīng)用戶的需求從特定專業(yè)領(lǐng)域的術(shù)語知識集合中返回特定內(nèi)容的 服務(wù)?;谡Z義的應(yīng)用,例如語義查詢,需要術(shù)語服務(wù)器提供語義支持,即由術(shù)語服務(wù)器向 客戶端提供概念的定義以及概念之間的關(guān)系的定義。標準術(shù)語提供對于領(lǐng)域知識的普遍理 解,并且有助于進行有效的信息處理和在不同各方之間進行知識共享,因此術(shù)語服務(wù)器通 常保持有大量數(shù)據(jù)??蛻舳税凑諔?yīng)用中對術(shù)語的請求從術(shù)語服務(wù)器獲取術(shù)語數(shù)據(jù),以用于 支持語義應(yīng)用的執(zhí)行。為了獲得語義應(yīng)用的更高性能和可擴展性,需要使用本地客戶端存 儲裝置對術(shù)語數(shù)據(jù)進行緩存,這樣可以使得從術(shù)語服務(wù)器接收的術(shù)語數(shù)據(jù)能夠繼續(xù)用于后 續(xù)的使用??蛻舳舜鎯ρb置中用于緩存術(shù)語數(shù)據(jù)的緩存空間是有限的,用戶不可能將術(shù)語服 務(wù)器中所有的術(shù)語數(shù)據(jù)緩存到客戶端存儲裝置。為了能夠更迅速地響應(yīng)于請求對術(shù)語數(shù)據(jù) 進行訪問,并且盡量減少與術(shù)語服務(wù)器進行網(wǎng)絡(luò)交互所消耗的資源,需要確定適當?shù)木彺?策略,主要包括響應(yīng)于某個術(shù)語請求從術(shù)語服務(wù)器獲取什么數(shù)據(jù)進行緩存,以及以何種形 式進行緩存。傳統(tǒng)的緩存技術(shù),例如頁面緩存和元組緩存不能滿足對術(shù)語服務(wù)進行訪問的要 求。頁面緩存和元組緩存使用靜態(tài)定義的、具有固定長度的物理單元,而所請求的數(shù)據(jù)項直 接利用物理頁面或者元組標識符來指定。在面向術(shù)語服務(wù)的緩存中,需要對所定義的、具有 基于術(shù)語的語義關(guān)系的數(shù)據(jù)項進行動態(tài)管理。這是因為術(shù)語數(shù)據(jù)的組成包括概念,是針對 一個事物的抽象的、普遍的想法和觀念,詞項(term)是概念的表現(xiàn)形式,一個概念可以用 不同的詞項表示;針對概念的屬性,是該概念本身所具有的特性,特征,參數(shù)等,例如概念的 屬性包括用于命名該概念的詞項以及該概念的其它屬性;以及關(guān)系,表示概念之間的關(guān)聯(lián)。 通常用戶請求術(shù)語數(shù)據(jù)中一個概念的信息,之后通常會接著請求與該概念依據(jù)關(guān)系相關(guān)聯(lián) 的另一概念的信息。因此,按照傳統(tǒng)緩存技術(shù)緩存術(shù)語數(shù)據(jù)難以反映術(shù)語數(shù)據(jù)的語義關(guān)系, 從而不能有效地響應(yīng)語義應(yīng)用的請求,表現(xiàn)為在系統(tǒng)中對緩存數(shù)據(jù)命中率的下降,客戶端 緩存數(shù)據(jù)本身冗余度過高等方面。進一步地,術(shù)語概念之間的關(guān)系包括非傳遞性關(guān)系和傳遞性關(guān)系,其中傳遞性關(guān) 系可以定義為對于任意的概念A(yù)、B和C以及一個特定的關(guān)系r,已知r (A,B)和r (A,C), 如果r(A,C)也成立,則關(guān)系r是傳遞性關(guān)系,例如“是一種”和“是一部分”是關(guān)聯(lián)概念的 傳遞性關(guān)系;而非傳遞性關(guān)系可以定義為對于任意的概念A(yù)、B、和C和一個特定的關(guān)系r, 已知r(A,B)和r(B,0,如果1~(八,C)不成立,則關(guān)系r是非傳遞性關(guān)系,例如“相互作用” 是關(guān)聯(lián)概念的非傳遞性關(guān)系??梢岳斫?,對于傳遞性關(guān)系來說具體表現(xiàn)形式為;f既念A(yù)條>概念B,概念Β^ ^概念C,則存在概念Α·^—概念C。在現(xiàn)有的緩存
機制中無法體現(xiàn)不直接關(guān)聯(lián)的概念之間存在的傳遞性關(guān)系,即概念A(yù)和概念c之間的關(guān)系。 因此,無法有效響應(yīng)涉及傳遞性關(guān)系的請求,例如,客戶端需要獲取與給定概念通過一傳遞 性關(guān)系相關(guān)聯(lián)的所有概念的信息。因此,出于術(shù)語服務(wù)的要求,需要在客戶端用于對來自術(shù)語服務(wù)器的術(shù)語數(shù)據(jù)進 行緩存的新方案。
發(fā)明內(nèi)容
為了克服現(xiàn)有技術(shù)中的缺陷,本發(fā)明提出一種用于緩存術(shù)語數(shù)據(jù)的方法和系統(tǒng)。根據(jù)本發(fā)明的第一方面,提供一種用于緩存術(shù)語數(shù)據(jù)的方法,包括。該方法包括以 下步驟接收術(shù)語請求;確定該術(shù)語請求與至少一個未被緩存的術(shù)語概念有關(guān);獲取該術(shù) 語概念的完全概念集作為緩存單元,其中該完全概念集包括該術(shù)語概念、與該術(shù)語概念通 過非傳遞性關(guān)系直接關(guān)聯(lián)或間接關(guān)聯(lián)的其他所有術(shù)語概念、各術(shù)語概念的屬性、以及各術(shù) 語概念之間的非傳遞性關(guān)系;針對該完全概念集,獲取傳遞性關(guān)系信息,該傳遞性關(guān)系信息 至少包括與該完全概念集中的每個術(shù)語概念通過傳遞性關(guān)系關(guān)聯(lián)的術(shù)語概念的標識;以及 對該緩存單元和該緩存單元的該傳遞性關(guān)系信息進行緩存。根據(jù)本發(fā)明的第二方面,提供一種用于緩存術(shù)語數(shù)據(jù)的裝置。該裝置包括用于 接收術(shù)語請求的裝置;用于確定該術(shù)語請求與至少一個未被緩存的術(shù)語概念有關(guān)的裝置; 用于獲取該術(shù)語概念的完全概念集作為緩存單元的裝置,其中該完全概念集包括該術(shù)語概 念、與該術(shù)語概念通過非傳遞性關(guān)系直接關(guān)聯(lián)或間接關(guān)聯(lián)的其他所有術(shù)語概念、各術(shù)語概 念的屬性、以及各術(shù)語概念之間的非傳遞性關(guān)系;用于針對該完全概念集獲取傳遞性關(guān)系 信息的裝置,該傳遞性關(guān)系信息至少包括與該完全概念集中的每個術(shù)語概念通過傳遞性關(guān) 系關(guān)聯(lián)的術(shù)語概念的標識;以及用于對該緩存單元和該緩存單元的該傳遞性關(guān)系信息進行 緩存。根據(jù)本發(fā)明的技術(shù)方案,能夠使得緩存術(shù)語數(shù)據(jù)在很大程度上反映術(shù)語數(shù)據(jù)的語 義關(guān)系,從而能夠有效地響應(yīng)語義應(yīng)用的術(shù)語請求,顯著提高術(shù)語服務(wù)系統(tǒng)中對緩存數(shù)據(jù) 命中率。而且,根據(jù)本發(fā)明的技術(shù)方案能夠減少為了獲取術(shù)語數(shù)據(jù)的語義關(guān)系而與術(shù)語服 務(wù)器進行的網(wǎng)絡(luò)交互,并降低客戶端緩存的術(shù)語數(shù)據(jù)的冗余度。
通過以下結(jié)合附圖的說明,并且隨著對本發(fā)明的更全面了解,本發(fā)明的其他目的 和效果將變得更加清楚和易于理解,其中圖1示意性示出根據(jù)本發(fā)明一個實施例的對術(shù)語數(shù)據(jù)進行緩存的系統(tǒng);圖2示意性示出根據(jù)本發(fā)明一個實施例對術(shù)語數(shù)據(jù)進行緩存的方法的流程圖;圖3示出一個術(shù)語數(shù)據(jù)的結(jié)構(gòu)的示例;圖4示意性示出根據(jù)本發(fā)明一個實施例對術(shù)語數(shù)據(jù)進行緩存的數(shù)據(jù)形式;圖5示意性示出根據(jù)本發(fā)明一個實施例對術(shù)語數(shù)據(jù)進行緩存的附加數(shù)據(jù)形式;圖6示意性示出根據(jù)本發(fā)明一個實施例處理語義應(yīng)用客戶端的術(shù)語請求的流程 在所有的上述附圖中,相同的標號表示具有相同、相似或相應(yīng)的特征或功能。
具體實施例方式圖1示意性示出根據(jù)本發(fā)明一個實施例的對術(shù)語數(shù)據(jù)進行緩存的系統(tǒng)。如圖1所示,根據(jù)本發(fā)明一個實施例的對術(shù)語數(shù)據(jù)進行緩存的系統(tǒng)包括客戶端側(cè) 的語義應(yīng)用客戶端10、用于緩存術(shù)語數(shù)據(jù)的客戶端存儲裝置11、用于對術(shù)語數(shù)據(jù)的緩存進 行管理的緩存管理裝置12,以及服務(wù)器側(cè)的術(shù)語服務(wù)器20、術(shù)語服務(wù)器存儲裝置21。語義應(yīng)用客戶端10發(fā)出術(shù)語請求。響應(yīng)于該術(shù)語請求,緩存管理裝置12在客戶 端存儲裝置11中緩存的術(shù)語數(shù)據(jù)中查詢該術(shù)語請求針對的術(shù)語數(shù)據(jù)。如果相應(yīng)的術(shù)語數(shù) 據(jù)項已經(jīng)被緩存在客戶端存儲裝置11中,則緩存管理裝置12直接將查詢結(jié)果返回給語義 應(yīng)用客戶端10。如果該術(shù)語請求針對的術(shù)語數(shù)據(jù)未緩存在于客戶端存儲裝置11中,則緩存 管理裝置12向術(shù)語服務(wù)器20請求獲取相關(guān)的術(shù)語數(shù)據(jù),并將所獲得的數(shù)據(jù)以一定數(shù)據(jù)形 式緩存到客戶端存儲裝置11中,并將獲得的查詢結(jié)果返回給語義應(yīng)用客戶端10。如在前文中所述,術(shù)語數(shù)據(jù)的組成包括概念;針對概念的屬性,包括用于命名該 概念的詞項以及該概念的其它屬性;以及關(guān)系,表示概念之間的關(guān)聯(lián)。而且術(shù)語數(shù)據(jù)概念之 間的關(guān)系可以是非傳遞性關(guān)系,也可以是傳遞性關(guān)系。因此,緩存管理裝置12需要使得所 獲取的、用于緩存的術(shù)語數(shù)據(jù)本身以及對術(shù)語數(shù)據(jù)進行緩存的數(shù)據(jù)形式能夠反映術(shù)語數(shù)據(jù) 的語義關(guān)系,從而支持更迅速地響應(yīng)于請求對術(shù)語數(shù)據(jù)進行訪問,并且盡量減少與術(shù)語服 務(wù)器進行網(wǎng)絡(luò)交互所消耗的資源。本發(fā)明的發(fā)明人已經(jīng)意識到如下事實在術(shù)語服務(wù)中總是針對彼此相關(guān)聯(lián)的術(shù)語 概念進行連續(xù)請求;一個術(shù)語概念僅具有少量通過非傳遞性關(guān)系與之直接相關(guān)聯(lián)的概念, 而且間接非傳遞性關(guān)系的深度是有限的,通常小于5?;谶@樣的事實,本發(fā)明提出一種用于對術(shù)語數(shù)據(jù)進行緩存的方法。例如,該方法 可以由圖1所示的緩存管理裝置12執(zhí)行,從而滿足訪問術(shù)語數(shù)據(jù)的要求。圖2示意性示出根據(jù)本發(fā)明一個實施例對術(shù)語數(shù)據(jù)進行緩存的方法的流程圖。如圖2所示,在步驟S200中,該方法流程開始。在步驟S201中,接收術(shù)語請求。例如,緩存管理裝置12接收到來自語義應(yīng)用客戶 端10的術(shù)語請求。該術(shù)語請求例如可以包括關(guān)于某個術(shù)語概念的請求、關(guān)于某個詞項的 請求、關(guān)于某個關(guān)系涉及的術(shù)語概念的請求、關(guān)于兩個詞項的請求等等。術(shù)語請求的種類和 具體內(nèi)容取決于語義應(yīng)用客戶端10所支持的語義應(yīng)用的需求。然而,無論何種請求最終都 能分解為對術(shù)語數(shù)據(jù)最小成分的查詢,即術(shù)語概念和術(shù)語概念之間的關(guān)系。因此,對于本發(fā) 明來說,適用于本文提到或者本文未提到的任何類型的術(shù)語請求。在步驟S202中,確定該術(shù)語請求與至少一個未被緩存的術(shù)語概念有關(guān)。緩存管理 裝置12在客戶端存儲裝置11中緩存的術(shù)語數(shù)據(jù)中查詢該術(shù)語請求針對的術(shù)語數(shù)據(jù)。如果 命中,則返回查詢結(jié)果;如果未命中,則確定所接收的術(shù)語請求與至少一個未被緩存的術(shù)語 概念有關(guān)。該確定步驟通??梢詢H通過緩存管理裝置12與客戶端存儲裝置11之間的交互 就可以實現(xiàn)。在某些特定情況下,該確定步驟也可以包括緩存管理裝置12與術(shù)語服務(wù)器20 之間的交互。例如,當術(shù)語請求的輸入為關(guān)系,從而要求獲取所關(guān)聯(lián)術(shù)語概念時,則緩存管 理裝置12需要與術(shù)語服務(wù)器20進行交互以獲取相關(guān)聯(lián)術(shù)語概念的信息,如果存在至少一個術(shù)語概念未在客戶端存儲裝置11中進行緩存,則確定所接收的術(shù)語請求與該至少一個 未被緩存的術(shù)語概念有關(guān)。在步驟S203中,獲取該術(shù)語概念的完全概念集作為緩存單元。未被緩存的術(shù)語概 念的完全概念集包括該術(shù)語概念本身、與該術(shù)語概念通過非傳遞性關(guān)系直接關(guān)聯(lián)或間接關(guān) 聯(lián)的其他所有術(shù)語概念、各術(shù)語概念的屬性、以及各術(shù)語概念之間的非傳遞性關(guān)系。在一種 具體實現(xiàn)中,緩存管理裝置12按照完全概念集的內(nèi)容要求向術(shù)語服務(wù)器20發(fā)出術(shù)語請求。 響應(yīng)于該緩存管理裝置12所發(fā)送的術(shù)語請求術(shù)語服務(wù)器20將相應(yīng)的術(shù)語數(shù)據(jù)提供到緩存 管理裝置12。緩存管理裝置12將接收到的關(guān)于該完全概念集的術(shù)語數(shù)據(jù)作為一個緩存單 元。該緩存單元可以具有一定的數(shù)據(jù)形式,例如樹形結(jié)構(gòu),以表示所包含術(shù)語數(shù)據(jù)。在步驟S204中,針對該完全概念集,獲取傳遞性關(guān)系信息。該傳遞性關(guān)系信息至 少包括與該完全概念集中的每個術(shù)語概念通過傳遞性關(guān)系關(guān)聯(lián)的術(shù)語概念的標識。實際 上,傳遞性關(guān)系可以包括多種具體傳遞性關(guān)系,例如,“是”,“屬于”,“傳播到”等等,如果在 術(shù)語數(shù)據(jù)中同時存在多種傳遞性關(guān)系,則需要為每個數(shù)據(jù)概念、針對每個具體傳遞性關(guān)系 獲取通過該傳遞性關(guān)系關(guān)聯(lián)的數(shù)據(jù)概念。在一種實施例中,緩存管理裝置12向術(shù)語服務(wù)器 20發(fā)出術(shù)語請求,為完全概念集中的每個術(shù)語概念獲取與其通過傳遞性關(guān)系直接關(guān)聯(lián)的術(shù) 語概念。傳遞性關(guān)系信息可以具有一定的數(shù)據(jù)形式,例如表格,以指示完全概念集中每個術(shù) 語概念與所獲得的與其通過傳遞性關(guān)系直接關(guān)聯(lián)的術(shù)語概念之間的對應(yīng)關(guān)系。這里需要指 出的是,在傳遞性關(guān)系信息中并不需要獲取通過傳遞性關(guān)系關(guān)聯(lián)的術(shù)語概念的各種屬性, 只需要記錄該術(shù)語概念的標識。因此,完全概念集的傳遞性關(guān)系信息將不會占用很大的緩 存空間。在步驟S205中,對該緩存單元和該緩存單元的該傳遞性關(guān)系信息進行緩存。緩存 管理裝置12將所獲取的完全概念集作為緩存單元緩存到客戶端存儲裝置11。因此,緩存單 元作為緩存更新的基本單元其大小是動態(tài)可變的。緩存管理裝置12為每個緩存單元同時 緩存該完全概念集的傳遞性關(guān)系信息,當緩存單元更新時,傳遞性關(guān)系信息也隨之更新。在步驟206中,該方法流程結(jié)束。本領(lǐng)域技術(shù)人員可以理解,由于通過作為緩存單元的完全概念集在客戶端存儲裝 置11中緩存了關(guān)于術(shù)語概念和其之間的非傳遞性關(guān)系的術(shù)語數(shù)據(jù),并且通過在客戶端存 儲裝置11中針對每個緩存單元維持該完全概念集的傳遞性關(guān)系信息,這些緩存的術(shù)語數(shù) 據(jù)能夠在很大程度上反映術(shù)語數(shù)據(jù)的語義關(guān)系,由此大大減少了為獲取術(shù)語數(shù)據(jù)的語義關(guān) 系而與術(shù)語服務(wù)器進行的網(wǎng)絡(luò)交互。而且,緩存單元和非傳遞性關(guān)系信息占用的緩存空間 是有限,能夠在有限的緩存空間中提供更多、更有效的信息。以下將參照附圖3-5具體說明根據(jù)本發(fā)明一個實施例對術(shù)語數(shù)據(jù)進行緩存的具 體數(shù)據(jù)形式。圖3示出一個術(shù)語數(shù)據(jù)的結(jié)構(gòu)的示例。該術(shù)語數(shù)據(jù)的結(jié)構(gòu)可以是維護在術(shù)語服務(wù) 器存儲裝置21中的術(shù)語片段。如圖3所示,該術(shù)語數(shù)據(jù)的結(jié)構(gòu)包括根節(jié)點以及多個作為其 后代節(jié)點的術(shù)語概念。術(shù)語概念之間通過傳遞性關(guān)系或非傳遞性關(guān)系相關(guān)聯(lián),其中在圖3 中傳遞性關(guān)系以虛線箭頭示出,而非傳遞性關(guān)系以實線箭頭示出。例如術(shù)語概念C7通過非 傳遞性關(guān)系直接與術(shù)語概念C9和ClO關(guān)聯(lián),并且進而間接與術(shù)語概念C8和C12關(guān)聯(lián)。此 外,術(shù)語概念C7還通過傳遞性關(guān)系與其它術(shù)語概念(未示出)相關(guān)聯(lián)。
7
圖4示意性示出根據(jù)本發(fā)明一個實施例對術(shù)語數(shù)據(jù)進行緩存的數(shù)據(jù)形式。如圖4所示,緩存的數(shù)據(jù)形式包括作為緩存單元的完全概念集和針對每個緩存單 元的傳遞性關(guān)系信息。在該示例中,作為緩存單元的完全概念集以樹形結(jié)構(gòu)表示,而傳遞性 關(guān)系信息以表的形式表示。本領(lǐng)域技術(shù)人員可以理解,還可以使用任何可能的數(shù)據(jù)形式來 表示完全概念集和傳遞性關(guān)系信息。所采用的具體數(shù)據(jù)形式不對本發(fā)明構(gòu)成限制。圖4所示出的緩存術(shù)語數(shù)據(jù)是對如圖3所示的維護在術(shù)語服務(wù)器存儲裝置21中 的術(shù)語片段一種可能的數(shù)據(jù)緩存。對術(shù)語數(shù)據(jù)的緩存是響應(yīng)于術(shù)語請求而進行的,因此對 于術(shù)語服務(wù)器端相同的術(shù)語結(jié)構(gòu),在客戶端側(cè)可能產(chǎn)生不同的緩存內(nèi)容。圖4僅示出一種 可能的緩存內(nèi)容。緩存單元1和針對緩存單元1的傳遞性關(guān)系信息表是應(yīng)術(shù)語請求而獲取并進行緩 存的。該術(shù)語請求與術(shù)語概念Cl有關(guān),而術(shù)語概念Cl在進行該術(shù)語請求之時并未緩存在 客戶端存儲裝置11中。從圖3所示的維護在術(shù)語服務(wù)器存儲裝置21中的術(shù)語片段可以看 到,與術(shù)語概念Cl通過非傳遞性關(guān)系直接關(guān)聯(lián)的術(shù)語概念包括C3、C4、C2,進一步通過非傳 遞性關(guān)系間接關(guān)聯(lián)的術(shù)語概念還包括C5、C6 (與C2直接關(guān)聯(lián))。這樣術(shù)語概念C1-C6構(gòu)成 術(shù)語概念Cl的完全概念集。緩存管理裝置12從術(shù)語服務(wù)器20獲取術(shù)語概念C1-C6、C1-C6 各自的全部屬性,以及C1-C6之間的非傳遞性關(guān)系,作為緩存單元1進行緩存。其中術(shù)語概 念Cl是該緩存單元1的根節(jié)點,其具有為0的入度。另一方面,從圖3所示的維護在術(shù)語服務(wù)器存儲裝置21中的術(shù)語片段還可以看 到,術(shù)語概念C1-C6中的某些術(shù)語概念還存在傳遞性關(guān)系。術(shù)語概念Cl通過傳遞性關(guān)系關(guān) 聯(lián)到術(shù)語概念C8和Cy ;術(shù)語概念C6通過傳遞性關(guān)系關(guān)聯(lián)到C10。緩存管理裝置12針對作 為緩存單元1的該完全概念集從術(shù)語服務(wù)器20獲取上述傳遞性關(guān)系信息,作為針對緩存單 元1的傳遞性信息表進行緩存。在圖4所示的示例中,傳遞性關(guān)系信息僅包括通過傳遞性 關(guān)系直接關(guān)聯(lián)的術(shù)語概念的標識,即緊接的孩子術(shù)語概念的標識(ID)。在其它實施例中也 可以進一步顯示下一級或下η級(η有限)間接關(guān)聯(lián)的術(shù)語概念的標識。此時,需要使得該 傳遞性信息表維持在有限的、合理的數(shù)據(jù)大小,從而在提高訪問緩存術(shù)語數(shù)據(jù)速度的同時 兼顧對緩存空間的占用問題。類似地,緩存單元2和針對緩存單元2的傳遞性關(guān)系信息表是應(yīng)術(shù)語請求而獲取 并進行緩存的。該術(shù)語請求與術(shù)語概念C7有關(guān),而術(shù)語概念C7在進行該術(shù)語請求之時并 未緩存在客戶端存儲裝置11中。緩存單元2包括術(shù)語概念C7的完全概念集C7-C10、C12, 術(shù)語概念C7-C10、C12各自的全部屬性,以及C7-C10、C12之間的非傳遞性關(guān)系。針對作為 緩存單元2的該完全概念集的傳遞關(guān)系信息表指示了 C7-C10、C12中存在的非傳遞性關(guān)系。應(yīng)注意到傳遞性關(guān)系信息中所指示的、通過傳遞性關(guān)系關(guān)聯(lián)的術(shù)語概念(顯示在 表格右欄)可以是尚未被緩存到客戶端存儲裝置11的術(shù)語概念。例如,在圖4所示的傳遞 性關(guān)系信息表中,緩存單元1中包括的術(shù)語概念Cl通過傳遞性關(guān)系關(guān)聯(lián)到C8和Cy,其中 Cy不屬于當前已經(jīng)緩存的任何一個緩存單元,其還未被加載到緩存。當任何術(shù)語請求涉及 到術(shù)語概念Cy時,緩存管理裝置12可以為Cy請求其完全概念集作為新的緩存單元加載到 緩存。需要指出的是,雖然出于簡便的目的,在圖4中僅概括的表示為“傳遞性關(guān)系”,但 實際上,傳遞性關(guān)系可以包括多種具體傳遞性關(guān)系,例如,“是”,“屬于”,“傳播到”等等。如果在術(shù)語數(shù)據(jù)中同時存在多種傳遞性關(guān)系,則需要為在傳遞性關(guān)系信息中為每個數(shù)據(jù)概念、 針對涉及該概念的每個具體傳遞性關(guān)系指示通過該傳遞性關(guān)系關(guān)聯(lián)的數(shù)據(jù)概念。圖5示意性示出根據(jù)本發(fā)明一個實施例對術(shù)語數(shù)據(jù)進行緩存的附加數(shù)據(jù)形式。通 過使用這些附加數(shù)據(jù)形式使得在如圖4所示的基本數(shù)據(jù)形式基礎(chǔ)上,能夠更快速和便捷地 訪問所緩存的術(shù)語數(shù)據(jù)。在一個示例中,該附加數(shù)據(jù)形式可以包括術(shù)語概念索引信息。該術(shù)語概念索引信 息可以以表的形式為所有緩存單元生成,用于表示當前已經(jīng)緩存的術(shù)語概念和其所屬的緩 存單元之間的對映關(guān)系。響應(yīng)于術(shù)語請求,緩存管理裝置12通過查找該表就可以確定所要 查詢的術(shù)語概念屬于哪個緩存單元,從而提高命中率。在又一示例中,該附加數(shù)據(jù)形式還可以包括詞項概念映射信息。該詞項概念映射 信息可以實現(xiàn)為表的形式,用于表示詞項與術(shù)語概念之間的映射關(guān)系。如前所述,詞項是術(shù) 語概念的一個屬性,用于對術(shù)語概念進行命名。同一詞項可能作為多個術(shù)語概念的屬性。術(shù) 語請求可能直接關(guān)于詞項。當術(shù)語請求關(guān)于特定詞項時,雖然詞項本身作為術(shù)語概念的屬 性之一已經(jīng)通過緩存單元加載到緩存,但逐一查詢屬性概念的屬性可能是費時的。因此,為 了提高處理針對詞項的術(shù)語請求的效率,在一種優(yōu)選方案中可以緩存詞項概念映射信息。在又一示例中,該附加數(shù)據(jù)形式還可以包括逆?zhèn)鬟f性關(guān)系信息。該逆?zhèn)鬟f性關(guān)系 信息可以實現(xiàn)為表的形式,用于表示與傳遞性關(guān)系信息所表示的反向的傳遞性關(guān)系。例如, 如果傳遞性關(guān)系信息包括與術(shù)語概念通過傳遞性關(guān)系關(guān)聯(lián)的緊接的孩子術(shù)語概念的標識 (ID),則在相應(yīng)逆?zhèn)鬟f性關(guān)系信息中可以包括該術(shù)語概念通過傳遞性關(guān)系關(guān)聯(lián)的緊接的父 親術(shù)語概念的標識(ID)。由此可以在緩存中支持關(guān)于傳遞性關(guān)系的雙方向地對術(shù)語概念進 行訪問。當在術(shù)語數(shù)據(jù)中包括多種具體傳遞性關(guān)系時,逆?zhèn)鬟f性關(guān)系信息應(yīng)該對應(yīng)于傳遞 性關(guān)系信息,為每個數(shù)據(jù)概念、針對每個具體傳遞性關(guān)系指示通過該傳遞性關(guān)系關(guān)聯(lián)的數(shù) 據(jù)概念。本領(lǐng)域的技術(shù)人員可以理解,可應(yīng)用于本發(fā)明的用于緩存術(shù)語數(shù)據(jù)的附加數(shù)據(jù)形 式不限于上文中僅描述的這些數(shù)據(jù)形式。還可以根據(jù)實際的需要構(gòu)造各種用于提高緩存訪 問性能的附加數(shù)據(jù)形式,例如以其它指標對術(shù)語概念編制索引等。顯然,由于描述緩存術(shù)語 數(shù)據(jù)的信息的增加,使得訪問緩存的效率得以提高,然而這種提高是以附加數(shù)據(jù)消耗緩存 空間為代價的。這樣的問題普遍存在于各種緩存技術(shù)中,在這里不再進行討論。圖6示意性示出根據(jù)本發(fā)明一個實施例處理語義應(yīng)用客戶端的術(shù)語請求的流程 圖。在該示例中,表述了對關(guān)于一個術(shù)語概念的術(shù)語請求的處理流程。如圖6所示,該流程開始。在步驟S601中,接收到來關(guān)于一個術(shù)語概念的術(shù)語請求。在步驟S602中,確定該術(shù)語概念是否已經(jīng)加載在緩存中。如果在步驟S602中確定結(jié)果為“否”,則處理繼續(xù)執(zhí)行步驟S603 ;如果在步驟S602 中確定結(jié)果為“是”,則處理繼續(xù)執(zhí)行步驟S606。在步驟S603中,由于該術(shù)語概念未加載在緩存中,則從術(shù)語服務(wù)器獲取所需的術(shù) 語數(shù)據(jù)。根據(jù)本發(fā)明的一個實施例,例如按照如參照圖2的步驟S203和S204步驟所表述 的那樣獲取參照圖4所表述的該術(shù)語概念的完全概念集和該完全概念集的傳遞性關(guān)系信 息。根據(jù)本發(fā)明進一步實施例,可以進一步獲取參照圖5所描述的附加數(shù)據(jù)形式所需的信
9息,如逆?zhèn)鬟f性關(guān)系信息等。由于獲取了所有所需數(shù)據(jù),在步驟S612中,返回查詢結(jié)果。此時,在步驟S613中, 該處理結(jié)束。在步驟S604中,使用獲取的數(shù)據(jù)生成新緩存單元。在步驟S605中,利用新的緩存單元對客戶端存儲裝置中的緩存進行更新,并對傳 遞性關(guān)系信息進行相應(yīng)的更新。此外,如果在緩存有附加數(shù)據(jù)形式的信息,例如術(shù)語概念索 引信息、詞項概念映射信息、逆?zhèn)鬟f性關(guān)系信息等,需要對這些信息同時進行更新。緩存更新的策略可以按照緩存單元使用的頻度、緩存單元使用的時間(是否最近 使用過該緩存單元)等來確定。例如,當按照緩存單元的使用頻度來更新緩存單元時,可以 為每個緩存單元保存對其進行訪問的次數(shù),在更新時以新緩存單元替換具有最小訪問次數(shù) 的緩存單元。當按照緩存單元使用的時間來更新緩存單元時,可以為每個緩存單元保存最 近對其訪問的時間,在更新時以新緩存單元替換其最近訪問時間最久遠的緩存單元。當然, 還可以使用任何適合的策略執(zhí)行對緩存單元的更新。在對緩存單元的更新中存在這樣一種情況所獲得的作為新緩存單元的新完全概 念集a的一個子節(jié)點(入度大于零),是作為當前加載的緩存單元的完全概念集b的根節(jié)點 (入度為零)。則在這種情況下可以將完全概念集a合并到完全概念集b,作為新的緩存單 元。對完全概念集進行合并有效地消除了緩存的術(shù)語數(shù)據(jù)中存在的不必要冗余,由此提高 了緩存空間的利用率。在步驟S606中,由于所請求的術(shù)語概念已經(jīng)加載在緩存中,則例如在一種查詢條 件下從相關(guān)緩存單元中獲取通過非傳遞性關(guān)系直接關(guān)聯(lián)的術(shù)語概念信息。在步驟S607中,從傳遞性關(guān)系信息中獲取與該術(shù)語概念通過傳遞性關(guān)系信息相 關(guān)的術(shù)語概念I(lǐng)D。在步驟S608中,確定是否所有通過傳遞性關(guān)系信息相關(guān)的術(shù)語概念均已加載在 緩存中。如果在步驟S608中確定結(jié)果為“是”,則處理繼續(xù)執(zhí)行步驟S610 ;如果在步驟S608 中確定結(jié)果為“否”,則處理繼續(xù)執(zhí)行步驟S609。在步驟S609中,由于所需術(shù)語概念沒有完全加載到緩存中,需要從術(shù)語服務(wù)器獲 取未加載的術(shù)語信息。由此,按照本發(fā)明一個實施例,例如按照如參照圖2的步驟S203和 S204步驟所描述的那樣獲取參照圖4所描述的針對這些術(shù)語概念的完全概念集和該完全 概念集的傳遞性關(guān)系信息。根據(jù)本發(fā)明進一步實施例,可以進一步獲取參照圖5所描述的 附加數(shù)據(jù)形式所需的信息,如逆?zhèn)鬟f性關(guān)系信息等。接著,一方面處理繼續(xù)執(zhí)行步驟S604, 對所獲取的術(shù)語數(shù)據(jù)生成新的緩存單元,進而在步驟S605中對緩存單元進行更新。在步驟S610中,獲取所有所需的術(shù)語數(shù)據(jù)。如果在步驟S608中確定結(jié)果為“是”, 則可以從緩存中獲得所有所需的術(shù)語數(shù)據(jù);如果在步驟S608中確定結(jié)果為“否”,則一方面 從緩存中獲得所需的術(shù)語數(shù)據(jù),另一方面通過S609獲得了其余的所需術(shù)語數(shù)據(jù)。在步驟S611中,返回查詢結(jié)果。此時,在步驟S613中,該處理結(jié)束。提供本發(fā)明的說明書的目的是為了說明和描述,而不是用來窮舉或?qū)⒈景l(fā)明限制 為所公開的形式。對本領(lǐng)域的普通技術(shù)人員而言,許多修改和變更都是顯而易見的。本領(lǐng) 域技術(shù)人員還應(yīng)該理解,可以通過軟件、硬件、固件或者它們的結(jié)合的方式,來實現(xiàn)本發(fā)明實施例中的方法和裝置。 因此,選擇并描述實施方式是為了更好地解釋本發(fā)明的原理及其實際應(yīng)用,并使 本領(lǐng)域普通技術(shù)人員明白,在不脫離本發(fā)明實質(zhì)的前提下,所有修改和變更均落入由權(quán)利 要求書所限定的本發(fā)明的保護范圍之內(nèi)。
權(quán)利要求
一種用于緩存術(shù)語數(shù)據(jù)的方法,包括接收術(shù)語請求;確定該術(shù)語請求與至少一個未被緩存的術(shù)語概念有關(guān);獲取該術(shù)語概念的完全概念集作為緩存單元,其中該完全概念集包括該術(shù)語概念、與該術(shù)語概念通過非傳遞性關(guān)系直接關(guān)聯(lián)或間接關(guān)聯(lián)的其他所有術(shù)語概念、各術(shù)語概念的屬性、以及各術(shù)語概念之間的非傳遞性關(guān)系;針對該完全概念集,獲取傳遞性關(guān)系信息,該傳遞性關(guān)系信息至少包括與該完全概念集中的每個術(shù)語概念通過傳遞性關(guān)系關(guān)聯(lián)的術(shù)語概念的標識;對該緩存單元和該緩存單元的該傳遞性關(guān)系信息進行緩存。
2.根據(jù)權(quán)利要求1所述的方法,其中,該傳遞性關(guān)系信息至少包括與該完全概念集中 的每個術(shù)語概念通過傳遞性關(guān)系直接關(guān)聯(lián)的術(shù)語概念的標識。
3.根據(jù)權(quán)利要求1所述的方法,還包括生成術(shù)語概念索引信息,用于表示當前已經(jīng)緩 存的所述完全概念集中的每個術(shù)語概念和其所屬的緩存單元之間的對應(yīng)關(guān)系。
4.根據(jù)權(quán)利要求1所述的方法,其中所述術(shù)語概念的屬性包括詞項,所述方法還包括獲取詞項概念映射信息,用于表示詞項與術(shù)語概念之間的映射關(guān)系。
5.根據(jù)權(quán)利要求1所述的方法,還包括獲取逆?zhèn)鬟f性關(guān)系信息,用于表示與傳遞性關(guān) 系信息所表示的傳遞性關(guān)系反向的傳遞性關(guān)系,其中若傳遞性關(guān)系信息包括與術(shù)語概念通 過傳遞性關(guān)系關(guān)聯(lián)的緊接的孩子術(shù)語概念的標識,則在逆?zhèn)鬟f性關(guān)系信息中包括術(shù)語概念 通過傳遞性關(guān)系關(guān)聯(lián)的緊接的父親術(shù)語概念的標識,反之亦然。
6.根據(jù)權(quán)利要求1所述的方法,還包括利用獲得的緩存單元對當前緩存的數(shù)據(jù)進行更 新,并對傳遞性關(guān)系信息進行相應(yīng)的更新。
7.根據(jù)權(quán)利要求6所述的方法,還包括將作為緩存單元而獲得的完全概念集與作為當 前緩存的緩存單元的完全概念集進行合并,作為新的緩存單元。
8.一種用于緩存術(shù)語數(shù)據(jù)的裝置,包括 用于接收術(shù)語請求的裝置;用于確定該術(shù)語請求與至少一個未被緩存的術(shù)語概念有關(guān)的裝置; 用于獲取該術(shù)語概念的完全概念集作為緩存單元的裝置,其中該完全概念集包括該術(shù) 語概念、與該術(shù)語概念通過非傳遞性關(guān)系直接關(guān)聯(lián)或間接關(guān)聯(lián)的其他所有術(shù)語概念、各術(shù) 語概念的屬性、以及各術(shù)語概念之間的非傳遞性關(guān)系;用于針對該完全概念集獲取傳遞性關(guān)系信息的裝置,該傳遞性關(guān)系信息至少包括與該 完全概念集中的每個術(shù)語概念通過傳遞性關(guān)系關(guān)聯(lián)的術(shù)語概念的標識; 用于對該緩存單元和該緩存單元的該傳遞性關(guān)系信息進行緩存的裝置。
9.根據(jù)權(quán)利要求8所述的裝置,其中,該傳遞性關(guān)系信息至少包括與該完全概念集中 的每個術(shù)語概念通過傳遞性關(guān)系直接關(guān)聯(lián)的術(shù)語概念的標識。
10.根據(jù)權(quán)利要求8所述的裝置,還包括用于生成術(shù)語概念索引信息的裝置,該術(shù)語概 念索引信息用于表示當前已經(jīng)緩存的所述完全概念集中的每個術(shù)語概念和其所屬的緩存 單元之間的對應(yīng)關(guān)系。
11.根據(jù)權(quán)利要求8所述的裝置,還包括用于獲取詞項概念映射信息的裝置,該詞項概 念映射信息用于表示詞項與術(shù)語概念之間的映射關(guān)系,其中所述術(shù)語概念屬性包括詞項。
12.根據(jù)權(quán)利要求8所述的裝置,還包括用于獲取逆?zhèn)鬟f性關(guān)系信息的裝置,該逆?zhèn)?遞性信息用于表示與傳遞性關(guān)系信息所表示的傳遞性關(guān)系反向的傳遞性關(guān)系,其中若傳遞 性關(guān)系信息包括與術(shù)語概念通過傳遞性關(guān)系關(guān)聯(lián)的緊接的孩子術(shù)語概念的標識,則在逆?zhèn)?遞性關(guān)系信息中包括術(shù)語概念通過傳遞性關(guān)系關(guān)聯(lián)的緊接的父親術(shù)語概念的標識,反之亦 然。
13.根據(jù)權(quán)利要求8所述的裝置,還包括用于利用獲得的緩存單元對當前緩存的數(shù)據(jù) 進行更新,并對傳遞性關(guān)系信息進行相應(yīng)的更新的裝置。
14.根據(jù)權(quán)利要求13所述的裝置,還包括用于將作為緩存單元而獲得的完全概念集與 作為當前緩存的緩存單元的完全概念集進行合并以作為新的緩存單元的裝置。
全文摘要
本發(fā)明提供一種用于緩存術(shù)語數(shù)據(jù)的方法。該方法包括接收術(shù)語請求;確定該術(shù)語請求與至少一個未被緩存的術(shù)語概念有關(guān);獲取該術(shù)語概念的完全概念集作為緩存單元,其中該完全概念集包括該術(shù)語概念、與該術(shù)語概念通過非傳遞性關(guān)系直接關(guān)聯(lián)或間接關(guān)聯(lián)的其他所有術(shù)語概念、各術(shù)語概念的屬性、以及各術(shù)語概念之間的非傳遞性關(guān)系;針對該完全概念集,獲取傳遞性關(guān)系信息,該傳遞性關(guān)系信息至少包括與該完全概念集中的每個術(shù)語概念通過傳遞性關(guān)系關(guān)聯(lián)的術(shù)語概念的標識;以及對該緩存單元和該緩存單元的該傳遞性關(guān)系信息進行緩存。本發(fā)明還提供相應(yīng)的用于緩存術(shù)語數(shù)據(jù)的裝置。
文檔編號G06F17/30GK101937442SQ20091015096
公開日2011年1月5日 申請日期2009年6月29日 優(yōu)先權(quán)日2009年6月29日
發(fā)明者侯雪橋, 劉升平, 劉海峰, 李波, 李靜, 胡崗 申請人:國際商業(yè)機器公司