亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

整合來(lái)自多個(gè)源的時(shí)間感知的數(shù)據(jù)的系統(tǒng)和方法_3

文檔序號(hào):8395919閱讀:來(lái)源:國(guó)知局
策略確定要調(diào)節(jié)每個(gè)時(shí)間上沖突的記錄對(duì)中的哪個(gè)記錄;根據(jù) 所定義的策略調(diào)節(jié)每個(gè)所確定的記錄的時(shí)間間隔;以及輸出具有已調(diào)節(jié)的時(shí)間間隔的經(jīng)修 改的數(shù)據(jù)記錄集合,其中(i)經(jīng)修改的數(shù)據(jù)記錄集合不包含時(shí)間沖突,并且(ii)經(jīng)修改的 數(shù)據(jù)記錄集合中的已調(diào)節(jié)的時(shí)間間隔不取決于由計(jì)算機(jī)實(shí)現(xiàn)的方法處理數(shù)據(jù)記錄的次序。
[0036] 本發(fā)明提供了一種基于計(jì)算機(jī)的方法,包括如下步驟:接收輸入模式S;接收兩個(gè) 實(shí)例1\和T2,每個(gè)實(shí)例都符合輸入模式S;計(jì)算1\和T2的合并實(shí)例作為也符合S的 實(shí)例,使得能夠在中找到T1或T2中的每個(gè)路徑,可以在T:或T2中找到中的每 個(gè)路徑,并且與^中任何路徑中的元素相關(guān)聯(lián)的時(shí)域語(yǔ)境都是根據(jù)給定的調(diào)節(jié)策略調(diào) 節(jié)1\和/或T2中在相同路徑下的對(duì)應(yīng)元素的時(shí)域語(yǔ)境的結(jié)果,所述給定的調(diào)節(jié)策略被設(shè)計(jì) 成解決具有時(shí)間沖突的數(shù)據(jù)記錄之間的時(shí)間沖突,其中所述合并實(shí)例「#7^通過(guò)將實(shí)例!^ 和/或1~ 2中的相同元素融合在一起并根據(jù)所述給定的調(diào)節(jié)策略提供對(duì)所述相同元素的對(duì) 應(yīng)時(shí)域語(yǔ)境的解釋來(lái)提供實(shí)例1\和T2的整合視圖;以及輸出所述合并實(shí)例iidh。
【附圖說(shuō)明】
[0037] 將參考下述附圖根據(jù)一個(gè)或多個(gè)不同的示例描述本公開(kāi)。提供附圖的目的只是為 了舉例說(shuō)明,其僅描繪了本公開(kāi)的示例。提供這些附圖是為了促進(jìn)讀者對(duì)本公開(kāi)的理解,不 應(yīng)認(rèn)為其對(duì)本公開(kāi)的寬度、范圍或適用性構(gòu)成限制。應(yīng)當(dāng)指出,為了圖示的清楚和簡(jiǎn)易起 見(jiàn),這些附圖未必是按比例繪制的。
[0038] 圖1示出了真實(shí)示例的簡(jiǎn)化形式,其中信息是根據(jù)從若干源提取的數(shù)據(jù)整合的。
[0039] 圖2A示出了年譜方案的示例。
[0040] 圖2B示出了基于不同調(diào)節(jié)策略的整合簡(jiǎn)檔。
[0041] 圖3示出了圖2A中所示的SEC存檔的兩個(gè)實(shí)例和應(yīng)用于兩個(gè)實(shí)例的結(jié)果和時(shí)間 感知的合并。
[0042] 圖4示出了圖3的中間結(jié)果序列。
[0043] 圖5A-C示出了各種數(shù)據(jù)集的合并版本的大小。
[0044] 圖6A-B示出了合并SWISS-PROT和GeneOntology數(shù)據(jù)花費(fèi)的以秒計(jì)的時(shí)間(y 軸)相對(duì)于每個(gè)版本以MB計(jì)的文件大?。▁軸)。
[0045] 圖6C示出了并行化時(shí)間感知的合并的示例。
[0046] 圖7A示出了并行合并數(shù)據(jù)花費(fèi)的時(shí)間的示例曲線。
[0047] 圖7B示出了合并過(guò)程的加速。
[0048] 圖8A-C示出了根據(jù)本發(fā)明教導(dǎo)的各種算法。
[0049] 圖9示出了犧牲品策略的示例。
[0050] 圖10示出了右調(diào)節(jié)策略的示例。
【具體實(shí)施方式】
[0051] 盡管在優(yōu)選實(shí)施例中對(duì)本發(fā)明進(jìn)行了圖示和描述,但是可以通過(guò)很多種不同的配 置實(shí)現(xiàn)本發(fā)明。在附圖中描繪了本發(fā)明的優(yōu)選實(shí)施例,并將在文中對(duì)其予以詳細(xì)描述,要理 解的是,要將本公開(kāi)看作是對(duì)本發(fā)明的原理以及針對(duì)其構(gòu)造的相關(guān)功能規(guī)范的例示,而并 非意在使本發(fā)明局限于圖示的實(shí)施例。本領(lǐng)域技術(shù)人員將設(shè)想出很多其他落在本發(fā)明的范 圍內(nèi)的可能的變化。
[0052] 注意,在本說(shuō)明書(shū)中,涉及"一個(gè)實(shí)施例"或"實(shí)施例"之處是指所涉及的特征包含 在本發(fā)明的至少一個(gè)實(shí)施例中。此外,在本說(shuō)明書(shū)中對(duì)"一個(gè)實(shí)施例"的單獨(dú)引述未必是指 相同實(shí)施例;但是這樣的實(shí)施例也并非相互排斥,除非給出了這樣的陳述或者這一點(diǎn)對(duì)于 本領(lǐng)域技術(shù)人員而言是顯而易見(jiàn)的。因而,本發(fā)明可以包括文中描述的實(shí)施例的各種組合 和/或整合。
[0053] 時(shí)間感知的數(shù)據(jù)模型
[0054] 年譜數(shù)據(jù)模型:通過(guò)以下語(yǔ)法描述年譜數(shù)據(jù)模型下定義的模式。
[0055] t: : =Str|Int|now| (t,t) |SetOft|SetOf*t
[0056] Rcdtli:t1; . . . ,ln:tJiPairtli:t1; 12:t2]
[0057] 記錄類型,即Rcd[l1:Ti,...,、:Tn]具有字段(或?qū)傩訳p...,、和對(duì)應(yīng)的類 型T. ..,Tn。Pair類型,即Pairh:T12:T2]是僅有兩個(gè)字段1和12與相應(yīng)的類型 tJPt2的特殊記錄類型。
[0058] 為了使語(yǔ)法保持簡(jiǎn)單,僅使用兩個(gè)原子類型:Str和Int。符號(hào)now是表示當(dāng)前時(shí) 間的特殊關(guān)鍵字。(t,t)用于指定表示開(kāi)始時(shí)間和結(jié)束時(shí)間的時(shí)間間隔。按照慣例,時(shí) 間間隔(1,10)表示在1開(kāi)始而在10之前結(jié)束的時(shí)間間隔。由于可能有多個(gè)類型的時(shí)間, 例如運(yùn)行示例中的"asof"和"reported"時(shí)間,每個(gè)這種類型都被稱為時(shí)間維度(參見(jiàn) J.Chomicki等人的書(shū)Temporaldatabases,FoundationsofArtificialIntelligence, Elsevier,2005中的第14章)。注意,為了逼真地圖示,使用日期而非整數(shù)作為運(yùn)行示例中 的時(shí)間。
[0059] 具體而言,年譜數(shù)據(jù)模型下的模式S具有如下形式:S:: =Pair[C:Tpl:t2],其 中h代表時(shí)域語(yǔ)境的類型,而T2為SetOf(或SetOf*)Pair,Rcd,或Pair類型。排除了 t2為原子類型的情況,因?yàn)檫@樣的Pairs僅能夠在SetOf(或SetOf*)類型的語(yǔ)境中定義。 例如,Pair[C:Tpl^SetOfPairtC:t1;1' :Str]]。實(shí)際上,除非將原子類型定義為關(guān)鍵字 字段的類型,否則假定它們始終被定義為Pair類型的第二分量,并在SetOf?或SetOf*類型 的語(yǔ)境中。
[0060] 時(shí)域語(yǔ)境:直觀地講,元素的時(shí)域語(yǔ)境是用于當(dāng)存在這種元素時(shí),在不同時(shí)間維 度下捕獲時(shí)間的一組n維時(shí)間間隔。為了避免與當(dāng)前設(shè)置中的術(shù)語(yǔ)"元素"混淆,使用術(shù) 語(yǔ)時(shí)域語(yǔ)境而不是文獻(xiàn)中使用的術(shù)語(yǔ)時(shí)域元素(參見(jiàn)S-YChien等人的文章"Efficient managementofmultiversiondocumentsbyobjectreferencing'',VLDB,pp. 291-300, 2001)〇
[0061] 在年譜中,利用類型SetOf(或SetOf^Rcdl^:dr),…,an: (ln,rn)]定義時(shí)域 語(yǔ)境,其中aidSiSn)表示時(shí)間維度的名稱。區(qū)間(Uig表示與%相關(guān)聯(lián)的時(shí)間間 隔。時(shí)域語(yǔ)境必須始終被定義為Pair類型的第一個(gè)字段。相反,Pair類型必須使時(shí)域語(yǔ) 境為其第一字段。換言之,Pair類型用于將時(shí)域語(yǔ)境與被定義為Pair的第二字段的元素 相關(guān)聯(lián)。為了方便起見(jiàn),假定每個(gè)Red、SetOf、SetOf*或原子類型都通過(guò)Pair類型與時(shí)域 語(yǔ)境相關(guān)聯(lián)。
[0062] 關(guān)鍵字:必須為SetOf(或SetOf*)類型的元素指定關(guān)鍵字。這種要求的結(jié)果是可 以沿著從實(shí)例根到該元素的路徑,由元素名稱或關(guān)鍵字值唯一地標(biāo)識(shí)年譜模式實(shí)例的每個(gè) 元素。直觀地講,路徑是從根開(kāi)始的元素名稱序列。
[0063] 示例:圖2A示出了標(biāo)記為"ActRep"的時(shí)域語(yǔ)境的定義。它是一組記錄,每個(gè)記錄 都具有與時(shí)間維度"as0f"和"reported"對(duì)應(yīng)的兩個(gè)字段。每個(gè)時(shí)間維度的值都是一對(duì)整 數(shù),從而表示時(shí)間間隔。
[0064]同一圖的中間示出了在本模型下如何定義二元關(guān)系股票(ticker*,shares),在源 中其作為"SEC存檔(SECfilings)"出現(xiàn),在目標(biāo)中作為"持有股票(stocksHeld)"出現(xiàn) (參見(jiàn)圖1)。該模式將該關(guān)系表示為字段"stocksHeld"下的一組(時(shí)域語(yǔ)境,記錄)對(duì) (Pair),其中時(shí)域語(yǔ)境捕獲該記錄成立的時(shí)間段。每個(gè)記錄具有兩個(gè)字段。字段"ticker" 標(biāo)記有"*",是關(guān)鍵字屬性。這意味著在任何時(shí)間點(diǎn),可以由股票代碼(ticker)符號(hào)標(biāo)識(shí) 該組中的每個(gè)記錄。另一個(gè)字段是"shares(股份)",其類型是(時(shí)域語(yǔ)境,值)對(duì)的(嵌 套)組。像以前一樣,使用時(shí)域語(yǔ)境捕獲該"值"(即,股份數(shù)目)成立的時(shí)間段。由于該值 是關(guān)鍵字屬性,這意味著在任何時(shí)間點(diǎn),都可以由該值唯一地標(biāo)識(shí)該組中的每對(duì)。然而,這 不會(huì)排除在同一時(shí)間點(diǎn)出現(xiàn)多個(gè)不同值的可能性。記號(hào)SetOf*是強(qiáng)制在任何時(shí)間點(diǎn)至多 只能有一個(gè)值的唯一性約束。盡管未示出,但可以將該模式擴(kuò)展以包括用于"教育"和"職 位"的定義。注意到"職位"應(yīng)當(dāng)被定義為允許Freddy在任何時(shí)間點(diǎn)就任多個(gè)職位(參見(jiàn) 圖1右側(cè)),并且該規(guī)范類似于持有股票,其中Freddy能夠在任何時(shí)間點(diǎn)持有多只股票。
[0065] 在圖2A的底部附近示出了代表圖1左側(cè)SEC存檔下的前兩個(gè)報(bào)告的示例。 可以看出,在每只股票下,該值(即,持有股份數(shù)目)與時(shí)域語(yǔ)境相關(guān)聯(lián)。例如,在由 (asof:7/01-now,reported:7/01-now)給出的時(shí)間段中持有OLP的396043份股份,而在 由(asof:8/25-now,r印orted:8/26-now)給出的時(shí)間段中持有0LP的13415份股份。沒(méi) 有與屬性股票代碼相關(guān)聯(lián)的時(shí)域語(yǔ)境,因?yàn)樗顷P(guān)鍵字,其時(shí)域語(yǔ)境與其"父母"(即,與封 閉記錄相關(guān)聯(lián)的時(shí)域語(yǔ)境)相同。暫時(shí)忽略與持有股票(stocksHeld)和股票記錄(stock records)相關(guān)聯(lián)的時(shí)域語(yǔ)境,因?yàn)樗鼈兣c論述其余部分無(wú)關(guān)。
[0066] 作為另一示例,在圖2A的底部示出了"持有股票"下的0LP股份的第一條,其中在 與值396043相關(guān)聯(lián)的時(shí)域語(yǔ)境中有兩條記錄。
[0067] 在圖2A的實(shí)例中,路徑/person/stocksHeld是有效路徑。由于"股票代碼"是關(guān) 系股票的關(guān)鍵字,所以/person/stocksHeld/stock[ticker="0LP"]是唯一地標(biāo)識(shí)其股票 代碼符號(hào)為"0LP"的記錄的路徑。
[0068] 在本示例中,源模式和目標(biāo)模式是相同的。實(shí)際上,如稍后所述,時(shí)間感知的合并 運(yùn)算符是一種二進(jìn)制運(yùn)算符,其獲取相同模式的兩個(gè)實(shí)例并產(chǎn)生也是同一模式的實(shí)例。通 常,可能需要預(yù)處理步驟以在應(yīng)用時(shí)間感知的合并之前提取數(shù)據(jù)或?qū)?shù)據(jù)變換成期望的目 標(biāo)格式。
[0069] 在沒(méi)有時(shí)域語(yǔ)境時(shí)在這種模型下許可的模式類似于在數(shù)據(jù)整合和數(shù)據(jù)交換中 廣泛使用的嵌套關(guān)系模式(參見(jiàn)L.Popa等人的文章"TranslatingWebData",VLDB, pp. 598-609,2002)。于是它能夠在其完整一般原則下對(duì)分級(jí)數(shù)據(jù)建模,關(guān)系模型為其特 例。這種模型還捕獲非第一正常形式的時(shí)域模型(參見(jiàn)J.Chomicki等人的書(shū)Temporal databases,FoundationsofArtificialIntelligence,Elsevier,2005 中第 14 章),作 為特例也稱為時(shí)域分組模型(參見(jiàn)J.Clifford等人的文章"Thehistoricalrelational datamodel(hrdm)revisited'',Temporaldatabases,pp. 6-27,1993 和"Oncompleteness ofhistoricalrelationalqueryla
當(dāng)前第3頁(yè)1 2 3 4 5 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1