E0-L0CAT10N IN A WIRELESSCOMMUNICAT1N NETWORK”的共同未決的國際專利申請?zhí)朩02010/081658中描述了地理定位的一個示例實現。在本發(fā)明的所示例子的背景下,地理定位可被執(zhí)行來在特定的呼叫記錄所相關的呼叫事件的時間確定該呼叫記錄所相關的移動通信單元的位置。附加地/可選地,在移動通信單元的全球定位系統(tǒng)(GPS)數據是可用的情形下,這樣的GPS數據可用于確定該移動通信單元的位置。相應于移動通信單元的所確定的位置的空間信息可接著被添加至IJ相應的呼叫數據記錄。這樣的空間信息可以是以二維坐標(例如X和Y、瑋度和經度、東西距和南北距等)的形式,各個呼叫記錄“被標記”有相應的坐標值??蛇x地,如果被支持的話,則用于位置信息和與該位置信息相關的數據的存儲的特殊數據存儲格式可用于空間信息。例如,在Oracle?數據庫中,這樣的數據結構被稱為“空間擴展”。
[0086]將要理解的是,在一些可選的例子中,這樣的地理定位和空間信息到數據記錄的添加可同樣在由數據記錄時間分組部件114執(zhí)行的數據記錄的時間分組之前被執(zhí)行。
[0087]數據管理系統(tǒng)100的數據塊組裝部件118,然后布置成將包括空間數據的時間分組呼叫數據記錄組裝到數據塊內。
[0088]圖2示出的是將呼叫數據記錄200存儲在例如磁性存儲磁盤或其它類似的大容量存儲設備上的常規(guī)方法。每個呼叫數據記錄被全部存儲并占用在磁盤上的存儲器的其自身可訪問的“塊”。以這種方式,每個呼叫數據記錄可單獨地并獨立于所有其它呼叫數據記錄被讀取。該方法在大部分數據庫應用中非常有效,其中要求是提取非常特定的數條信息且其中只有幾個記錄需要在給定的時間點被訪問。相關記錄可被讀取,而不需要讀取或處理任何不需要的記錄。
[0089]在圖2的情況下,記錄Ca 210被選擇并從存儲設備讀取。一般,每個記錄包含特定呼叫的完全呼叫數據,其在量上可相當于長移動呼叫的許多千字節(jié)的數據。在偶然的基礎上提取關于單個呼叫的數據通過該方法可以是實際可行的。然而處理和提取與來自無線通信系統(tǒng)的操作員的特定查詢相關的大量記錄是完全不現實的,其中,例如,操作員需要盡可能精確地知道在系統(tǒng)中發(fā)生了什么,以識別并解決“故障”。這樣的查詢可涉及產生在城市中的所有點處在白天期間的特定時期的或在整天中平均的實際用戶數據速率的地圖的需要。離線“批處理”方法由常規(guī)系統(tǒng)采用,由此,查詢由用戶發(fā)起并被留下。在所有相關數據記錄被提取并預先處理(例如在I小時時期或更長時間期間)之后,用戶可接著返回。然而,這并不允許所存儲的呼叫數據的連續(xù)地、幾乎實時地進行完全捕獲和分析。
[0090]圖3示出的是存儲呼叫數據記錄的所提議的方法的例子。在圖3所示的例子中,呼叫數據記錄的大“組塊”被存儲為單個可訪問的塊310。該數據“組塊”可以是比如IM字節(jié),并可包含比如上面提到的照慣例用于存儲單個呼叫數據記錄的128個常規(guī)數據塊。當呼叫數據記錄需要對特定的查詢做出響應時,從存儲器取回整個“多記錄”塊。所取回的數據塊包含想要的記錄和除此之外的許多其它記錄(其中一些也可能是被要求滿足特定的用戶查詢的,而其余部分將是對所要求的來說是多余的)。
[0091]讀取這樣大量的數據以便得到相對小數量的呼叫數據記錄可能看起來是浪費的且可能很慢。然而,當考慮磁盤訪問時間時,情況明顯不是這樣。一般,快速數據存儲磁盤將花費大概5-lOms來找到其需要讀取的數據塊。其然后以大概200M字節(jié)/s的速率傳送數據。換句話說,磁盤的訪問時間等于大概2M字節(jié)/s的數據讀取時間。假定來自網絡操作員的特定用戶查詢將一般需要訪問來自非常大量的呼叫記錄(和也許給定小區(qū)、城市或時間段的所有呼叫記錄)的數據,則使用在磁盤上的大存儲“組塊”并與提取過程(從磁盤)繼續(xù)并行地處理在更快的存儲介質(例如RAM)中的呼叫記錄本身有效得多。
[0092]圖3所示的方法導致利用大數據塊而被寫到磁盤的數據存儲結構。這些“塊”由大量呼叫記錄組成,并從磁盤被訪問和讀取作為單個“每塊”操作。這意味著與被訪問的呼叫記錄的數量比較,磁盤的搜索/訪問時間并不被相對頻繁地部署,從而加速需要訪問大量數據記錄的“讀取”操作。
[0093]因此,在本發(fā)明的一些例子中,圖1所示的數據管理系統(tǒng)100的數據塊組裝部件118可布置成,從在蜂窩通信網絡內的至少一個無線電網絡元件接收至少一個呼叫的呼叫數據,將所接收的呼叫數據布置到呼叫數據記錄內,將呼叫數據記錄組裝到至少一個數據塊內,以及將至少一個數據塊寫到至少一個數據存儲設備,其中該方法包括,當接收到呼叫數據查詢時,在每數據塊基礎上從至少一個數據存儲設備取回呼叫數據記錄。
[0094]在一些可選的例子中,呼叫記錄可包括呼叫數據的地理定位信息,且數據管理系統(tǒng)100的數據塊組裝部件118可布置成,至少部分地基于呼叫數據記錄的單維坐標值,將呼叫數據記錄在空間上分組,并將在空間上分組的呼叫數據記錄組裝到數據塊中。
[0095]在一些可選的例子中,數據管理系統(tǒng)100的數據塊組裝部件118可布置成,至少部分地基于相應于呼叫數據記錄的單維坐標值的單維坐標索引,將至少一個數據存儲設備內的數據塊編索引。
[0096]在一些可選的例子中,數據管理系統(tǒng)100的數據塊組裝部件118可布置成,將呼叫數據記錄在時間上分組,并將在時間上分組的呼叫數據記錄布置到數據塊內。
[0097]返回參考示出存儲呼叫數據記錄200的常規(guī)方法的圖2,每個呼叫數據記錄全部存儲在占用磁盤上的相同數量的空間的塊內,而不考慮關于該呼叫所記錄的實際的數據量(短持續(xù)時間呼叫將產生比長呼叫少得多的數據和/或涉及服務小區(qū)站點或呼叫類型的很多變化的呼叫:語音、數據、MMS等)。
[0098]在圖2的情況下,記錄Ca被選擇并從存儲設備讀取。其包含特定呼叫的完全呼叫數據,其在量上可相當于長移動呼叫的許多千字節(jié)的數據。即使存在與特定呼叫相關的相對少的數據,比如8k字節(jié)的最小風險分配塊尺寸也用于數據記錄,留下該塊的許多部分為空的/冗余的,如所示。
[0099]在大部分數據庫中,空間相關數據需要被寫入和重新寫入很多次。例如,存儲在數據庫內的空間相關數據的一般常規(guī)情形可包括關于給定零售商店的庫存狀況或在加油站的每日收入。商店/加油站不移動(且因此與其相關的、識別商店/加油站的位置的空間相關數據不改變),只有與商店或加油站相關的數據(例如庫存水平)改變。一般,記錄大小改變,例如商店相關記錄可在圣誕節(jié)允許更大的庫存水平或庫存的范圍的供應,或供應可被包括用于未來的庫存擴展。同樣在蕭條的時間,庫存水平或范圍可縮小。
[0100]使用常規(guī)數據庫存儲方法,將確定最大記錄長度,且數據記錄將被存儲在所確定的最大記錄長度的固定尺寸塊中,以便使數據記錄能夠被重新寫入(例如更新)而不影響相鄰的數據記錄。存儲各個數據記錄的固定尺寸數據塊的使用,使例如在庫存大小中的這樣的變化能夠被使用并允許在那些記錄內的數據每當必要時被更新(例如重新寫入)而不影響其它(例如相鄰的)數據記錄。在這種情況下,在相鄰記錄的實際數據之間一般有大“差距”。
[0101]然而,以這種方式存儲呼叫數據從所使用的存儲空間方面來說極其低效。給定需要被存儲用于無線通信網絡的大量數據,由于需要被提供和維持的額外存儲空間,存儲空間的這樣低效的使用可證明是極其昂貴的。此外,在數據記錄之間的任何這樣的大差距使記錄的訪問緩慢下來。
[0102]圖4示出的是存儲呼叫數據記錄的所提議的方法的另一例子。在圖4所示的例子中,除了一起存儲在數據的大塊中的呼叫數據記錄的“組塊”(如在圖3中所示和上面所述的)以外,各個呼叫數據記錄實質上緊鄰彼此被存儲,使得在其間實質上沒有(或最少)浪費的或空的字節(jié)(如對大部分數據庫記錄情況一般是這樣)。換句話說,也許50字節(jié)的短呼叫記錄看起來實質上相鄰于比如100字節(jié)的較長記錄,其又看起來實質上相鄰于比如75字節(jié)的另一呼叫記錄,等等。在圖3中示出這個可變的記錄尺寸。
[0103]如上所述,更常規(guī)的情形將是確定最大記錄長度(比如100字節(jié))并將所有塊分配為100字節(jié)長(從而在上面的例子中分別浪費50字節(jié)和25字節(jié))。以這種方式,數據記錄能夠被重新寫入(例如更新)而不影響相鄰的數據記錄。
[0104]然而,發(fā)明人認識到,一旦無線通信系統(tǒng)的完整的呼叫數據記錄被捕獲并存儲,它們就并不需要被更新。也就是說,這樣的呼叫數據記錄是“寫一次,讀取很多次”。因此,呼叫數據記錄不需要被單獨地重新寫入且僅僅在一段時間(例如幾天、幾星期等)之后“到期”,此時,數據記錄可被“整體地”重寫,例如一次數據的整個塊。相應地,數據呼叫記錄可以以可變記錄長度被寫在連續(xù)“組塊”中,從而優(yōu)化存儲的使用并實質上減少或甚至消除從磁盤讀取“空的”數據的需要。這導致數據存儲空間的明顯更有效的使用以及還有相關數據的讀取速度的提高,因為相關數據是曾經從磁盤讀取的所有數據(即不需要讀取大量空的數據)。
[0105]因此,在本發(fā)明的一些例子中,圖1所示的數據管理系統(tǒng)100的數據塊組裝部件118可以附加地/可選地布置成,從在蜂窩通信網絡內的至少一個無線電網絡元件接收至少一個呼叫的呼叫數據,將所接收的呼叫數據布置到非固定尺寸的呼叫數據記錄內,并將呼叫數據記錄寫到至少一個數據存儲設備內,使得呼叫數據記錄相鄰于彼此被存儲。
[0106]圖1所示的數據管理系統(tǒng)100的倉分配和存儲部件160,將每個組裝數據塊分配到在一個或多個數據存儲設備(例如磁盤)120內的存儲“倉”,這樣的倉在圖1中的125處被指示。例如,每個倉125可以分區(qū)的方式來實現。如在本領域中公知的,分區(qū)是對邏輯數據庫或其構成元件分成不同的獨立部分的劃分,或如在本文提到的“倉”。一般,每個分區(qū)(倉)包括一組“迷你表格”,其具有它們自己的索引和都存儲在一起的數據。附加地/可選地,各個倉125可通過物理地分離的數據存儲設備或由單獨的目錄實現,雖然需要小心確保每個目錄占用磁盤上的存儲空間的連續(xù)區(qū)域且不變成不完整的。
[0107]在所示例子中,數據管理系統(tǒng)100的倉管理部件162可布置成,例如經