2、1804和1806經(jīng)由內(nèi)部總線 1808和底板通信接口 1810連接到裝置底板1812,盤1712通過該裝置底板連接到裝置1702 中的其他盤和處理器1716。無論是內(nèi)容或者統(tǒng)計(jì)或者集群集成信息的各種類型的所有對(duì)象 可以在單個(gè)文件系統(tǒng)內(nèi)存儲(chǔ)于盤上。在另一實(shí)施例中,統(tǒng)計(jì)和/或元數(shù)據(jù)可以存儲(chǔ)于與內(nèi) 容不同的存儲(chǔ)設(shè)備或者節(jié)點(diǎn)上或者駐留于系統(tǒng)存儲(chǔ)器內(nèi)。
[0106] 盡管上文以一些細(xì)節(jié)描述各種實(shí)施例,但是其他方式也是可能的。簡(jiǎn)化方式可以 用于無需上文描述的完全解決方案的更小節(jié)點(diǎn)群體。替代地,可以代之以使用其他方法作 為用于系統(tǒng)的部分的擴(kuò)充或者替換(包括多變?cè)?multivariate)分析和卷積內(nèi)核)。
[0107]在另一實(shí)施例中,選擇存儲(chǔ)位置的節(jié)點(diǎn)可以基于訪問和/或存儲(chǔ)統(tǒng)計(jì)向外部?jī)?chǔ)存 器(諸如網(wǎng)絡(luò)附著存儲(chǔ)文件管理器或者存儲(chǔ)區(qū)域網(wǎng)絡(luò))發(fā)起存儲(chǔ)和/或訪問請(qǐng)求。替代地, 節(jié)點(diǎn)可以基于確定的概率將外部對(duì)象請(qǐng)求引向適當(dāng)設(shè)備。在各種實(shí)施例中,這些公開的統(tǒng) 計(jì)方法和選擇策略與現(xiàn)有存儲(chǔ)基礎(chǔ)設(shè)施組合以提供分布式內(nèi)容存儲(chǔ)和取回。
[0108] 對(duì)于小節(jié)點(diǎn)群體,未存儲(chǔ)異常索引可能更簡(jiǎn)單和更高效。當(dāng)取回對(duì)象時(shí),查詢上 文描述的存儲(chǔ)頻率矩陣,并且使用貝葉斯規(guī)則來確定每個(gè)可能存儲(chǔ)位置的概率。系統(tǒng)然后 向可能存儲(chǔ)位置請(qǐng)求對(duì)象。在一個(gè)實(shí)施例中,以可能存儲(chǔ)位置的相應(yīng)概率為序進(jìn)行對(duì)可能 存儲(chǔ)位置的請(qǐng)求嘗試。搜索可以在發(fā)現(xiàn)對(duì)象或者已經(jīng)查詢充分節(jié)點(diǎn)以確定對(duì)象不存在時(shí)終 止。例如如果對(duì)象需要三個(gè)復(fù)制品并且已經(jīng)檢驗(yàn)了除了兩個(gè)潛在位置之外的所有潛在位 置,則系統(tǒng)可以返回對(duì)象不存在。
[0109] 多變?cè)治隹梢栽谔卣骰蛘呶恢玫念A(yù)測(cè)值重疊時(shí)允許維度壓縮。兩種有用的多 變?cè)治黾夹g(shù)是主分量分析或者對(duì)應(yīng)性分析。通過標(biāo)識(shí)可以在未失去顯著預(yù)測(cè)值時(shí)坍縮 (collapse)的特征或者位置來提煉先前描述的系統(tǒng)也可以有幫助??梢酝ㄟ^多變?cè)治黾?術(shù)直接傳遞聚合訪問和存儲(chǔ)矩陣。如果輸出用于來提煉,則可以將最相似特征和位置標(biāo)識(shí) 為在所得空間中具有最接近的主坐標(biāo)。如果輸出純粹用于對(duì)象放置和搜索,則每個(gè)潛在存 儲(chǔ)節(jié)點(diǎn)必須由它自己的在與對(duì)象特征的主坐標(biāo)相同的空間中的點(diǎn)代表。對(duì)象然后與通過組 合(諸如通過如下加權(quán)平均機(jī)制,該機(jī)制將用于每個(gè)特征的P值用作權(quán)重)它的特征的點(diǎn)來 發(fā)現(xiàn)的點(diǎn)對(duì)應(yīng)。存儲(chǔ)節(jié)點(diǎn)優(yōu)先列表是按照與對(duì)象的點(diǎn)的距離的升序分類的存儲(chǔ)節(jié)點(diǎn)列表。 約束統(tǒng)計(jì)輸入中的漂移并且因此約束特征的所得主坐標(biāo)中的漂移以減少對(duì)象重新定位率。 存儲(chǔ)節(jié)點(diǎn)也可以在主坐標(biāo)空間中慢速移動(dòng)以改進(jìn)優(yōu)先列表選擇。節(jié)點(diǎn)以如下方式在每次重 新計(jì)算統(tǒng)計(jì)期間略微移動(dòng),該方式傾向于將節(jié)點(diǎn)相互移開而又移動(dòng)它們更接近最近的特征 和具有最大質(zhì)量的特征。以這一方式,節(jié)點(diǎn)位置將隨機(jī)接近主坐標(biāo)空間上k均值集群算法 的結(jié)果,其中k是可用存儲(chǔ)節(jié)點(diǎn)的數(shù)量。
[0110] 在多數(shù)情況下,完全代表與個(gè)位置關(guān)聯(lián)的優(yōu)先需要n-1個(gè)維度的空間。然而,在 位置優(yōu)先不獨(dú)立的程度上可以實(shí)現(xiàn)維度壓縮(允許信息存儲(chǔ)于更少維度中)。可以擾動(dòng)或者 卷積這樣的壓縮多維空間以從優(yōu)先或者訪問率度量空間轉(zhuǎn)換成成本度量空間。盡管這樣的 方法可以諸如在拆分位置或者添加附加位置時(shí)關(guān)于網(wǎng)絡(luò)拓?fù)涞母淖儽磉_(dá)更多,但是復(fù)雜度 明顯增加未證實(shí)在實(shí)踐中使用它們是合理的。
[0111] 雖然為了理解清楚而已經(jīng)以一些細(xì)節(jié)描述前述實(shí)施例,但是本發(fā)明并不限于提供 的細(xì)節(jié)。有諸多實(shí)現(xiàn)本發(fā)明的替代方式。公開的實(shí)施例為示例而非限制。
【主權(quán)項(xiàng)】
1. 一種存儲(chǔ)數(shù)據(jù)的系統(tǒng),包括: 處理器,其被配置為: 從分布式內(nèi)容存儲(chǔ)系統(tǒng)內(nèi)的多個(gè)存儲(chǔ)位置的每個(gè)存儲(chǔ)位置收集對(duì)應(yīng)的多個(gè)訪問計(jì)數(shù) 數(shù)據(jù),所述多個(gè)訪問計(jì)數(shù)數(shù)據(jù)對(duì)應(yīng)于多個(gè)特征中的相應(yīng)的特征,其中對(duì)應(yīng)于多個(gè)特征中的 相應(yīng)的特征的多個(gè)訪問計(jì)數(shù)數(shù)據(jù)中的一個(gè)表示在具有該特征的存儲(chǔ)位置處存儲(chǔ)的對(duì)象的 數(shù)量和在具有該特征的存儲(chǔ)位置處訪問的對(duì)象的數(shù)量中的至少一個(gè); 至少部分地根據(jù)從每個(gè)存儲(chǔ)位置收集的對(duì)應(yīng)于多個(gè)特征中的相應(yīng)特征的對(duì)應(yīng)的多個(gè) 訪問計(jì)數(shù)數(shù)據(jù)來確定概率數(shù)據(jù),其中,所述概率數(shù)據(jù)包含這樣的數(shù)據(jù),其指示相對(duì)于每個(gè)特 征的每個(gè)存儲(chǔ)位置而言,將從該存儲(chǔ)位置訪問具有該特征的對(duì)象的概率; 確定與內(nèi)容對(duì)象相關(guān)聯(lián)的特征集合,該內(nèi)容對(duì)象關(guān)聯(lián)于操作,其中,該特征集合包含與 該內(nèi)容對(duì)象相關(guān)聯(lián)的性質(zhì)集合; 至少利用概率數(shù)據(jù),至少為多個(gè)存儲(chǔ)位置的子集的每個(gè)存儲(chǔ)位置確定具有關(guān)聯(lián)于該內(nèi) 容對(duì)象的該特征集合中的特征的對(duì)象與該存儲(chǔ)位置相關(guān)聯(lián)的相應(yīng)的期望可能性;以及 從多個(gè)存儲(chǔ)位置中選擇存儲(chǔ)位置以完成相對(duì)于該內(nèi)容對(duì)象而言的操作,該選擇至少部 分地基于具有該特征的對(duì)象關(guān)聯(lián)于被選擇的存儲(chǔ)位置的期望可能性;以及 存儲(chǔ)器,其與處理器耦合并被配置為向處理器提供指令。2. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述操作包括在所選擇的存儲(chǔ)位置內(nèi)存儲(chǔ)內(nèi)容 對(duì)象。3. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述操作包括嘗試訪問在所選擇的存儲(chǔ)位置處的 內(nèi)容對(duì)象。4. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述操作包括從所選的存儲(chǔ)位置嘗試取回內(nèi)容對(duì) 象而未首先基于索引或者其他數(shù)據(jù)確定內(nèi)容對(duì)象事實(shí)上存儲(chǔ)于所選擇的存儲(chǔ)位置內(nèi)。5. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中具有特征的對(duì)象關(guān)聯(lián)于所選擇的存儲(chǔ)位置的期望 可能性至少包括所選擇的存儲(chǔ)位置與未選擇的另一位置相比與所述特征關(guān)聯(lián)的相對(duì)程度。6. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中所選擇的存儲(chǔ)位置包括地理位置。7. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中所選擇的存儲(chǔ)位置包括節(jié)點(diǎn)。8. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中所選擇的存儲(chǔ)位置包括盤。9. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述特征集合包括關(guān)于內(nèi)容對(duì)象為真的一個(gè)或者 多個(gè)聲明。10. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述概率數(shù)據(jù)包含訪問概率矩陣。11. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述概率數(shù)據(jù)包括概率矩陣,所述概率矩陣針對(duì) 所述分布式內(nèi)容存儲(chǔ)系統(tǒng)內(nèi)的多個(gè)存儲(chǔ)設(shè)備中的每個(gè)并且相對(duì)于每個(gè)特征的每個(gè)存儲(chǔ)設(shè) 備而言,指示從包含該存儲(chǔ)設(shè)備的存儲(chǔ)位置處訪問具有該特征的對(duì)象的頻率。12. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中所述特征集合包括一個(gè)或者多個(gè)特征,并且還包 括使用所述概率數(shù)據(jù)針對(duì)所述集合中的每個(gè)特征確定多個(gè)候選存儲(chǔ)位置中的每個(gè)位置與 該特征在統(tǒng)計(jì)上關(guān)聯(lián)的程度,其中多個(gè)存儲(chǔ)位置包含多個(gè)候選存儲(chǔ)位置。13. 根據(jù)權(quán)利要求12所述的系統(tǒng),所述處理器還被配置為關(guān)于每個(gè)候選存儲(chǔ)位置確定 與選擇在該候選存儲(chǔ)位置內(nèi)包含的節(jié)點(diǎn)以執(zhí)行所述操相關(guān)聯(lián)的預(yù)計(jì)成本。14. 根據(jù)權(quán)利要求13所述的系統(tǒng),其中至少部分地基于確定為與選擇相應(yīng)候選存儲(chǔ)位 置以執(zhí)行所述操作關(guān)聯(lián)的相應(yīng)預(yù)計(jì)成本來選擇所選擇的存儲(chǔ)位置。15. 根據(jù)權(quán)利要求1所述的系統(tǒng),所述處理器還被配置為應(yīng)用管理策略以根據(jù)具有特 征的對(duì)象與所選擇的存儲(chǔ)位置相關(guān)聯(lián)的預(yù)期可能性以及與選擇所選擇的存儲(chǔ)位置關(guān)聯(lián)的 確定的成本來確定所選擇的存儲(chǔ)位置是合格的和需要選擇的之一或兩者。16. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中概率數(shù)據(jù)指示將從所選擇的存儲(chǔ)位置訪問具有 特征的對(duì)象和選擇所選擇的存儲(chǔ)位置來執(zhí)行的操作將存儲(chǔ)內(nèi)容對(duì)象的預(yù)期頻率。17. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中概率數(shù)據(jù)指示在所選擇的存儲(chǔ)位置處存儲(chǔ)具有 特征的對(duì)象和選擇所選擇的存儲(chǔ)位置來執(zhí)行的操作將訪問內(nèi)容對(duì)象的預(yù)期頻率。18. 根據(jù)權(quán)利要求1所述的系統(tǒng),其中確定與內(nèi)容對(duì)象相關(guān)聯(lián)的特征集合包括: 評(píng)估與內(nèi)容對(duì)象相關(guān)聯(lián)的標(biāo)識(shí)符以確定一個(gè)或多個(gè)特性;以及 從與關(guān)聯(lián)于內(nèi)容對(duì)象的標(biāo)識(shí)符相關(guān)聯(lián)的一個(gè)或多個(gè)特性獲得特征集合。19. 一種存儲(chǔ)數(shù)據(jù)的方法,包括: 從分布式內(nèi)容存儲(chǔ)系統(tǒng)內(nèi)的多個(gè)存儲(chǔ)位置的每個(gè)存儲(chǔ)位置收集對(duì)應(yīng)的多個(gè)訪問計(jì)數(shù) 數(shù)據(jù),所述多個(gè)訪問計(jì)數(shù)數(shù)據(jù)對(duì)應(yīng)于多個(gè)特征中的相應(yīng)的特征,其中對(duì)應(yīng)于多個(gè)特征中的 相應(yīng)的特征的多個(gè)訪問計(jì)數(shù)數(shù)據(jù)中的一個(gè)表示在具有該特征的存儲(chǔ)位置處存儲(chǔ)的對(duì)象的 數(shù)量和在具有該特征的存儲(chǔ)位置處訪問的對(duì)象的數(shù)量中的至少一個(gè); 至少部分地根據(jù)從每個(gè)存儲(chǔ)位置收集的對(duì)應(yīng)于多個(gè)特征中的相應(yīng)特征的對(duì)應(yīng)的多個(gè) 訪問計(jì)數(shù)數(shù)據(jù)來確定概率數(shù)據(jù),其中,所述概率數(shù)據(jù)包含這樣的數(shù)據(jù),其指示相對(duì)于每個(gè)特 征的每個(gè)存儲(chǔ)位置而言,將從該存儲(chǔ)位置訪問具有該特征的對(duì)象的概率; 確定與內(nèi)容對(duì)象相關(guān)聯(lián)的特征集合,該內(nèi)容對(duì)象關(guān)聯(lián)于操作,其中,該特征集合包含與 該內(nèi)容對(duì)象相關(guān)聯(lián)的性質(zhì)集合; 至少利用概率數(shù)據(jù),至少為多個(gè)存儲(chǔ)位置的子集的每個(gè)存儲(chǔ)位置確定具有關(guān)聯(lián)于該內(nèi) 容對(duì)象的該特征集合中的特征的對(duì)象與該存儲(chǔ)位置相關(guān)聯(lián)的相應(yīng)的期望可能性;以及 從多個(gè)存儲(chǔ)位置中選擇存儲(chǔ)位置以完成相對(duì)于該內(nèi)容對(duì)象而言的操作,該選擇至少部 分地基于具有該特征的對(duì)象關(guān)聯(lián)于被選擇的存儲(chǔ)位置的期望可能性。20. 根據(jù)權(quán)利要求19所述的方法,其中所述操作包括從所選的存儲(chǔ)位置嘗試取回內(nèi) 容對(duì)象而未首先基于索引或者其他數(shù)據(jù)確定內(nèi)容對(duì)象事實(shí)上存儲(chǔ)于所選擇的存儲(chǔ)位置內(nèi)。21. 根據(jù)權(quán)利要求19所述的方法,其中所述特征集合包括一個(gè)或者多個(gè)特征,并且還 包括使用所述概率數(shù)據(jù)針對(duì)所述集合中的每個(gè)特征確定多個(gè)候選存儲(chǔ)位置中的每個(gè)位置 與該特征在統(tǒng)計(jì)上關(guān)聯(lián)的程度,其中多個(gè)存儲(chǔ)位置包含多個(gè)候選存儲(chǔ)位置。22. 根據(jù)權(quán)利要求21所述的方法,還包含關(guān)于每個(gè)候選存儲(chǔ)位置確定與選擇在該候選 存儲(chǔ)位置內(nèi)包含的節(jié)點(diǎn)以執(zhí)行所述操相關(guān)聯(lián)的預(yù)計(jì)成本。23. 根據(jù)權(quán)利要求22所述的方法,其中至少部分地基于確定為與選擇相應(yīng)候選存儲(chǔ)位 置以執(zhí)行所述操作關(guān)聯(lián)的相應(yīng)預(yù)計(jì)成本來選擇所選擇的存儲(chǔ)位置。24. 根據(jù)權(quán)利要求19所述的方法,還包含應(yīng)用管理策略以根據(jù)具有特征的對(duì)象與所選 擇的存儲(chǔ)位置相關(guān)聯(lián)的預(yù)期可能性以及與選擇所選擇的存儲(chǔ)位置關(guān)聯(lián)的確定的成本來確 定所選擇的存儲(chǔ)位置是合格的和需要選擇的之一或兩者。
【專利摘要】公開了分布式內(nèi)容存儲(chǔ)和取回。確定與內(nèi)容對(duì)象關(guān)聯(lián)的特征集合。至少部分地基于概率數(shù)據(jù)從包括分布式內(nèi)容存儲(chǔ)系統(tǒng)的多個(gè)存儲(chǔ)位置選擇用于關(guān)于內(nèi)容對(duì)象執(zhí)行操作的存儲(chǔ)位置,該概率數(shù)據(jù)指示選擇的存儲(chǔ)位置與包括特征集合的確定為與內(nèi)容對(duì)象關(guān)聯(lián)的特征在統(tǒng)計(jì)上關(guān)聯(lián)的程度。
【IPC分類】G06F17/30, H04L29/08
【公開號(hào)】CN104899286
【申請(qǐng)?zhí)枴緾N201510303452
【發(fā)明人】R.F.羅斯, M.P.萊爾
【申請(qǐng)人】高通股份有限公司
【公開日】2015年9月9日
【申請(qǐng)日】2010年9月21日
【公告號(hào)】CN102640125A, CN102640125B, EP2480974A1, EP2480974A4, US8554993, US20110072206, US20140059290, WO2011034625A1