本發(fā)明涉及醫(yī)療信息化的技術(shù)領(lǐng)域,尤其涉及一種醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)系統(tǒng)及方法。
背景技術(shù):
目前,隨著我國(guó)經(jīng)濟(jì)持續(xù)穩(wěn)定的發(fā)展和現(xiàn)代科技的日新月異,人們?cè)絹?lái)越多的關(guān)注自身健康,在滿足日常工作和生活的需求之外,人們也迫切希望通過(guò)網(wǎng)絡(luò)或者手機(jī)上網(wǎng)就能隨時(shí)查看流行病的季節(jié)信息、了解每種疾病下的用藥情況以及針對(duì)自身疾病獲得一些個(gè)性化的推薦服務(wù)等。對(duì)于公共衛(wèi)生機(jī)構(gòu),它們希望各個(gè)社區(qū)居民的醫(yī)療數(shù)據(jù)能夠自動(dòng)匯總,并自動(dòng)對(duì)這些數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)的結(jié)果用來(lái)進(jìn)行流行病的趨勢(shì)分析和爆發(fā)預(yù)警,從而為制定防治干預(yù)計(jì)劃提供有力的參考依據(jù)。
隨著國(guó)家新醫(yī)改政策的頒布和實(shí)施,與健康直接相關(guān)的醫(yī)療行業(yè)開始迅猛發(fā)展,醫(yī)療數(shù)據(jù)越來(lái)越趨于高度集中化。在海量醫(yī)療數(shù)據(jù)的訪問(wèn)上,存在大規(guī)模數(shù)據(jù)統(tǒng)計(jì)分析的服務(wù),而且需要盡可能快的查詢響應(yīng)時(shí)間。由于醫(yī)療數(shù)據(jù)規(guī)模很大,醫(yī)療數(shù)據(jù)之間具有強(qiáng)關(guān)聯(lián)性,不同類型的用戶對(duì)同一數(shù)據(jù)具有不同的觀察視角,從而對(duì)醫(yī)療數(shù)據(jù)的存儲(chǔ)模型有很高的要求以應(yīng)付靈活多變的數(shù)據(jù)請(qǐng)求,大規(guī)模數(shù)據(jù)上還存在大量已知的或者未知的數(shù)據(jù)分析需求,查詢的總類多,需要支持各種定制性查詢。由此可見,用戶對(duì)查詢醫(yī)療數(shù)據(jù)的要求高,對(duì)海量醫(yī)療數(shù)據(jù)的存儲(chǔ)與管理要求就越高,因此現(xiàn)有醫(yī)療數(shù)據(jù)存儲(chǔ)系統(tǒng)簡(jiǎn)單地采用傳統(tǒng)數(shù)據(jù)庫(kù)、商業(yè)并行數(shù)據(jù)庫(kù)或者SQL數(shù)據(jù)庫(kù)對(duì)海量醫(yī)療數(shù)據(jù)進(jìn)行存儲(chǔ)已不能滿足實(shí)際情況和需求。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的主要目的在于提供一種醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)系統(tǒng)及方法,旨在解決現(xiàn)有醫(yī)療數(shù)據(jù)存儲(chǔ)系統(tǒng)對(duì)海量醫(yī)療數(shù)據(jù)進(jìn)行分散存儲(chǔ)而影響醫(yī)療數(shù)據(jù)分析處理效率的問(wèn)題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)系統(tǒng),運(yùn)行于云服務(wù)器中,所述云服務(wù)器通過(guò)通信網(wǎng)絡(luò)與多個(gè)醫(yī)療數(shù)據(jù)源建立通信連接,并通過(guò)數(shù)據(jù)庫(kù)連接與大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)連接,該系統(tǒng)包括:
數(shù)據(jù)采集模塊,用于從多個(gè)醫(yī)療數(shù)據(jù)源收集每一個(gè)患者的原始醫(yī)療數(shù)據(jù);
數(shù)據(jù)清洗模塊,用于對(duì)每一個(gè)患者的原始醫(yī)療數(shù)據(jù)進(jìn)行清洗轉(zhuǎn)換處理得到每一個(gè)患者的規(guī)范醫(yī)療數(shù)據(jù);
數(shù)據(jù)抽取模塊,用于從每一個(gè)患者的規(guī)范醫(yī)療數(shù)據(jù)中抽取每一個(gè)患者的身份信息、生命體征數(shù)據(jù)和歷史就診信息,以及根據(jù)每一個(gè)患者的身份信息為每一個(gè)患者產(chǎn)生一個(gè)身份標(biāo)識(shí)號(hào);
數(shù)據(jù)關(guān)聯(lián)模塊,用于將每一個(gè)患者的身份標(biāo)識(shí)號(hào)與患者各自對(duì)應(yīng)的生命體征數(shù)據(jù)進(jìn)行關(guān)聯(lián)并建立一個(gè)患者體征信息表,并將每一個(gè)患者的身份標(biāo)識(shí)號(hào)與患者各自對(duì)應(yīng)的歷史就診信息進(jìn)行關(guān)聯(lián)并建立一個(gè)患者就診信息表;
數(shù)據(jù)存儲(chǔ)模塊,用于將所述患者體征信息表存儲(chǔ)在大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)中的第一分區(qū)數(shù)據(jù)庫(kù)中,并將所述患者就診信息表存儲(chǔ)在大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)中的第二分區(qū)數(shù)據(jù)庫(kù)中。
優(yōu)選的,所述數(shù)據(jù)采集模塊從多個(gè)醫(yī)療數(shù)據(jù)源收集每一個(gè)患者的原始醫(yī)療數(shù)據(jù)的方式為:設(shè)定一個(gè)定時(shí)器腳本的執(zhí)行時(shí)間和執(zhí)行周期,以及按照定時(shí)器腳本的執(zhí)行時(shí)間和執(zhí)行周期從不同的醫(yī)療數(shù)據(jù)源采集每一個(gè)患者的原始醫(yī)療數(shù)據(jù)。
優(yōu)選的,所述數(shù)據(jù)清洗模塊對(duì)每一個(gè)患者的原始醫(yī)療數(shù)據(jù)進(jìn)行清洗轉(zhuǎn)換處理的方式為:利用ETL數(shù)據(jù)過(guò)濾轉(zhuǎn)換組件移除原始醫(yī)療數(shù)據(jù)中無(wú)意義的詞,將原始醫(yī)療數(shù)據(jù)中一個(gè)詞的不同形式轉(zhuǎn)換為相同形式,以及刪除原始醫(yī)療數(shù)據(jù)中重復(fù)的數(shù)據(jù)。
優(yōu)選的,所述患者體征信息表的表頭字段存儲(chǔ)每一個(gè)患者的身份標(biāo)識(shí)號(hào),所述患者體征信息表的內(nèi)容字段存儲(chǔ)每一個(gè)患者對(duì)應(yīng)的生命體征數(shù)據(jù),所述患者就診信息表的表頭字段存儲(chǔ)每一個(gè)患者的身份標(biāo)識(shí)號(hào),所述患者體征信息表的內(nèi)容字段存儲(chǔ)每一個(gè)患者對(duì)應(yīng)的歷史就診信息。
優(yōu)選的,所述生命體征數(shù)據(jù)包括患者的身高數(shù)據(jù)、體重?cái)?shù)據(jù)、血壓數(shù)據(jù)、脈搏數(shù)據(jù)、心率數(shù)據(jù)、血氧數(shù)據(jù)以及血糖數(shù)據(jù),所述歷史就診信息包括患者的歷史就診時(shí)間、歷史就診醫(yī)院、歷史就診科室以及歷史電子病歷。
本發(fā)明還提供了一種醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)方法,應(yīng)用于云服務(wù)器中,所述云服務(wù)器通過(guò)通信網(wǎng)絡(luò)與多個(gè)醫(yī)療數(shù)據(jù)源建立通信連接,并通過(guò)數(shù)據(jù)庫(kù)連接與大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)連接,所述醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)方法包括步驟:
從多個(gè)醫(yī)療數(shù)據(jù)源收集每一個(gè)患者的原始醫(yī)療數(shù)據(jù);
對(duì)每一個(gè)患者的原始醫(yī)療數(shù)據(jù)進(jìn)行清洗轉(zhuǎn)換處理得到每一個(gè)患者的規(guī)范醫(yī)療數(shù)據(jù);
從每一個(gè)患者的規(guī)范醫(yī)療數(shù)據(jù)中抽取每一個(gè)患者的身份信息、生命體征數(shù)據(jù)和歷史就診信息;
根據(jù)每一個(gè)患者的身份信息為每一個(gè)患者產(chǎn)生一個(gè)身份標(biāo)識(shí)號(hào);
將每一個(gè)患者的身份標(biāo)識(shí)號(hào)與患者各自對(duì)應(yīng)的生命體征數(shù)據(jù)進(jìn)行關(guān)聯(lián)并建立一個(gè)患者體征信息表,并將每一個(gè)患者的身份標(biāo)識(shí)號(hào)患者各自對(duì)應(yīng)的歷史就診信息進(jìn)行關(guān)聯(lián)并建立一個(gè)患者就診信息表;
將所述患者體征信息表存儲(chǔ)在大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)中的第一分區(qū)數(shù)據(jù)庫(kù)中,并將所述患者就診信息表存儲(chǔ)在大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)中的第二分區(qū)數(shù)據(jù)庫(kù)中。
優(yōu)選的,所述從多個(gè)醫(yī)療數(shù)據(jù)源收集每一個(gè)患者的原始醫(yī)療數(shù)據(jù)的步驟包括如下步驟:
設(shè)定一個(gè)定時(shí)器腳本的執(zhí)行時(shí)間和執(zhí)行周期;
按照定時(shí)器腳本的執(zhí)行時(shí)間和執(zhí)行周期從不同的醫(yī)療數(shù)據(jù)源采集每一個(gè)患者的原始醫(yī)療數(shù)據(jù)。
優(yōu)選的,所述對(duì)每一個(gè)患者的原始醫(yī)療數(shù)據(jù)進(jìn)行清洗轉(zhuǎn)換處理的步驟包括如下步驟:利用ETL數(shù)據(jù)過(guò)濾轉(zhuǎn)換組件移除原始醫(yī)療數(shù)據(jù)中無(wú)意義的詞;將原始醫(yī)療數(shù)據(jù)中的一個(gè)詞的不同形式轉(zhuǎn)換為相同形式;刪除原始醫(yī)療數(shù)據(jù)中重復(fù)的數(shù)據(jù)。
優(yōu)選的,所述患者體征信息表的表頭字段存儲(chǔ)每一個(gè)患者的身份標(biāo)識(shí)號(hào),所述患者體征信息表的內(nèi)容字段存儲(chǔ)每一個(gè)患者對(duì)應(yīng)的生命體征數(shù)據(jù),所述患者就診信息表的表頭字段存儲(chǔ)每一個(gè)患者的身份標(biāo)識(shí)號(hào),所述患者體征信息表的內(nèi)容字段存儲(chǔ)每一個(gè)患者對(duì)應(yīng)的歷史就診信息。
優(yōu)選的,所述生命體征數(shù)據(jù)包括患者的身高數(shù)據(jù)、體重?cái)?shù)據(jù)、血壓數(shù)據(jù)、脈搏數(shù)據(jù)、心率數(shù)據(jù)、血氧數(shù)據(jù)以及血糖數(shù)據(jù),所述歷史就診信息包括患者的歷史就診時(shí)間、歷史就診醫(yī)院、歷史就診科室以及歷史電子病歷。
相較于現(xiàn)有技術(shù),本發(fā)明所述醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)系統(tǒng)及方法采用上述技術(shù)方案,帶來(lái)的技術(shù)效果為:通過(guò)采集不同的醫(yī)療數(shù)據(jù)源中的醫(yī)療數(shù)據(jù),并將對(duì)醫(yī)療數(shù)據(jù)進(jìn)行清洗轉(zhuǎn)換處理得到規(guī)范醫(yī)療數(shù)據(jù),從而使得醫(yī)療數(shù)據(jù)采集更加全面、更加準(zhǔn)確。此外,將每個(gè)患者的身份標(biāo)識(shí)號(hào)作為體征信息表與就診信息表之間的關(guān)聯(lián)關(guān)系,并將患者的體征信息表與就診信息表分開存儲(chǔ)在大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)的不同分區(qū)數(shù)據(jù)庫(kù)中,減輕了系統(tǒng)負(fù)載,提高了數(shù)據(jù)處理效率,避免了訪問(wèn)醫(yī)療數(shù)據(jù)時(shí)產(chǎn)生沖突,加快了對(duì)醫(yī)療數(shù)據(jù)的讀取與處理速度,從而能夠提高醫(yī)療服務(wù)水平與患者的滿意度。
附圖說(shuō)明
圖1是本發(fā)明醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)系統(tǒng)優(yōu)選實(shí)施例的架構(gòu)圖;
圖2是本發(fā)明醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)方法優(yōu)選實(shí)施例的流程圖。
本發(fā)明目的的實(shí)現(xiàn)、功能特點(diǎn)及優(yōu)點(diǎn)將結(jié)合實(shí)施例,參照附圖做進(jìn)一步說(shuō)明。
具體實(shí)施方式
為更進(jìn)一步闡述本發(fā)明為達(dá)成上述目的所采取的技術(shù)手段及功效,以下結(jié)合附圖及優(yōu)選實(shí)施例,對(duì)本發(fā)明的具體實(shí)施方式、結(jié)構(gòu)、特征及其功效進(jìn)行詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
參考圖1所示,圖1是本發(fā)明醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)系統(tǒng)優(yōu)選實(shí)施例的應(yīng)用環(huán)境架構(gòu)示意圖。在本實(shí)施例中,所述醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)系統(tǒng)10應(yīng)用并運(yùn)行于云服務(wù)器1中,所述云服務(wù)器1通過(guò)通信網(wǎng)絡(luò)3與多個(gè)醫(yī)療數(shù)據(jù)源2(圖1中以兩個(gè)為例進(jìn)行說(shuō)明)建立通信連接,以及通過(guò)數(shù)據(jù)庫(kù)連接5與大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)4連接。所述通信網(wǎng)絡(luò)3可以是有線通信網(wǎng)絡(luò)或無(wú)線通信網(wǎng)絡(luò)。在本實(shí)施例中,所述通信網(wǎng)絡(luò)3優(yōu)選為無(wú)線通信網(wǎng)絡(luò),包括但不限于,GSM網(wǎng)絡(luò)、GPRS網(wǎng)絡(luò)、CDMA網(wǎng)絡(luò)、TD-SCDMA網(wǎng)絡(luò)、WiMAX網(wǎng)絡(luò)、TD-LTE網(wǎng)絡(luò)、FDD-LTE網(wǎng)絡(luò)等無(wú)線傳輸網(wǎng)絡(luò)。所述數(shù)據(jù)庫(kù)連接5可以為一種開放數(shù)據(jù)庫(kù)連接(Open Database Connectivity,ODBC)以及Java數(shù)據(jù)庫(kù)連接(Java Data Base Connectivity,JDBC)。
所述云服務(wù)器1是一種云平臺(tái)或云平臺(tái)中的一臺(tái)服務(wù)器,通過(guò)云服務(wù)器1的數(shù)據(jù)傳輸能力、數(shù)據(jù)存儲(chǔ)能力及數(shù)據(jù)處理能力,可以快速地從不同的醫(yī)療數(shù)據(jù)源2采集到不同的原始醫(yī)療數(shù)據(jù)。所述醫(yī)療數(shù)據(jù)源2存儲(chǔ)有患者的原始醫(yī)療數(shù)據(jù),可以為產(chǎn)生臨床數(shù)據(jù)的醫(yī)院信息系統(tǒng),例如HIS系統(tǒng)、EMR、LIS、PACS系統(tǒng),也可以為體檢中心、私人診所和急救中心等任何適合的臨床業(yè)務(wù)系統(tǒng)。所述大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)4包括第一分區(qū)數(shù)據(jù)庫(kù)41以及第二分區(qū)數(shù)據(jù)庫(kù)42,第一分區(qū)數(shù)據(jù)庫(kù)41用于存儲(chǔ)有患者體征信息表,第二分區(qū)數(shù)據(jù)庫(kù)42用于存儲(chǔ)有患者就診信息表。所述患者體征信息表用于存儲(chǔ)從不同醫(yī)療數(shù)據(jù)源2采集的患者的生命體征數(shù)據(jù),所述患者就診信息表用于存儲(chǔ)從不同醫(yī)療數(shù)據(jù)源2采集的患者的歷史就診數(shù)據(jù)。
在本實(shí)施例中,所述云服務(wù)器1包括,但不僅限于,醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)系統(tǒng)10、通信單元11、存儲(chǔ)單元12以及處理單元13。所述通信單元11為一種有線通訊接口或者為無(wú)線通訊接口,例如,支持GSM、GPRS、WCDMA、CDMA、TD-SCDMA、WiMAX、TD-LTE、FDD-LTE等通訊技術(shù)的通訊接口。所述存儲(chǔ)單元12可以為一種只讀存儲(chǔ)單元ROM,電可擦寫存儲(chǔ)單元EEPROM、快閃存儲(chǔ)單元FLASH或固體硬盤等。所述的處理單元13可以為一種中央處理器(Central Processing Unit,CPU)、微控制器(MCU)、數(shù)據(jù)處理芯片、或者具有數(shù)據(jù)處理功能的信息處理單元。
所述醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)系統(tǒng)10,包括但不僅限于,數(shù)據(jù)采集模塊101、數(shù)據(jù)清洗模塊102、數(shù)據(jù)抽取模塊103、數(shù)據(jù)關(guān)聯(lián)模塊104以及數(shù)據(jù)存儲(chǔ)模塊105。本發(fā)明所稱的模塊是指一種能夠被所述云平臺(tái)服務(wù)器1的處理單元13執(zhí)行并且能夠完成固定功能的一系列計(jì)算機(jī)程序指令段,其存儲(chǔ)在所述云平臺(tái)服務(wù)器1的存儲(chǔ)單元12中。
所述數(shù)據(jù)采集模塊101用于從多個(gè)不同的醫(yī)療數(shù)據(jù)源2收集每一個(gè)患者的原始醫(yī)療數(shù)據(jù)。一般地,患者的原始醫(yī)療數(shù)據(jù)的生成和采集通常來(lái)自于醫(yī)院信息系統(tǒng)所產(chǎn)生的臨床數(shù)據(jù),例如HIS系統(tǒng)、EMR、LIS、PACS系統(tǒng),但是隨著物聯(lián)網(wǎng)的發(fā)展,患者的原始醫(yī)療數(shù)據(jù)還可以來(lái)自于體檢中心、私人診所和急救中心等任何適合的臨床業(yè)務(wù)系統(tǒng)。具體地,所述數(shù)據(jù)采集模塊101具體用于設(shè)定一個(gè)定時(shí)器腳本的執(zhí)行時(shí)間和執(zhí)行周期,以及按照定時(shí)器腳本的執(zhí)行時(shí)間和執(zhí)行周期從不同的醫(yī)療數(shù)據(jù)源采集原始醫(yī)療數(shù)據(jù)。
所述數(shù)據(jù)清洗模塊102用于對(duì)每一個(gè)患者的原始醫(yī)療數(shù)據(jù)進(jìn)行清洗轉(zhuǎn)換處理得到每一個(gè)患者的規(guī)范醫(yī)療數(shù)據(jù)。在本實(shí)施例中,由于從不同的醫(yī)療數(shù)據(jù)源2收集上來(lái)的原始醫(yī)療數(shù)據(jù)可能有壞數(shù)據(jù)、不合理的數(shù)據(jù)或者是重復(fù)的數(shù)據(jù)等,因此數(shù)據(jù)清洗模塊102需要利用ETL(抽取(extract)、轉(zhuǎn)換(transform)、加載(load))數(shù)據(jù)過(guò)濾轉(zhuǎn)換組件對(duì)所收集的原始醫(yī)療數(shù)據(jù)進(jìn)行清洗轉(zhuǎn)換處理得到規(guī)范醫(yī)療數(shù)據(jù),從而并保證了醫(yī)療數(shù)據(jù)的準(zhǔn)確性,并為醫(yī)療數(shù)據(jù)的存儲(chǔ)節(jié)省了存儲(chǔ)空間。具體地,所述數(shù)據(jù)清洗模塊102對(duì)每一個(gè)患者的原始醫(yī)療數(shù)據(jù)進(jìn)行清洗轉(zhuǎn)換處理的方式為:利用ETL數(shù)據(jù)過(guò)濾轉(zhuǎn)換組件移除原始醫(yī)療數(shù)據(jù)中無(wú)意義的詞,將原始醫(yī)療數(shù)據(jù)中一個(gè)詞的不同形式轉(zhuǎn)換為相同形式,以及刪除原始醫(yī)療數(shù)據(jù)中重復(fù)的數(shù)據(jù)等處理。
所述數(shù)據(jù)抽取模塊103用于從每一個(gè)患者的規(guī)范醫(yī)療數(shù)據(jù)中抽取每一個(gè)患者的身份信息、生命體征數(shù)據(jù)和歷史就診信息,以及根據(jù)每一個(gè)患者的身份信息為每一個(gè)患者產(chǎn)生一個(gè)身份標(biāo)識(shí)號(hào)(ID)。在本實(shí)施例中,所述生命體征數(shù)據(jù)包括患者的身高數(shù)據(jù)、體重?cái)?shù)據(jù)、血壓數(shù)據(jù)、脈搏數(shù)據(jù)、心率數(shù)據(jù)、血氧數(shù)據(jù)、血糖數(shù)據(jù)等數(shù)據(jù)信息。所述歷史就診信息包括患者的歷史就診時(shí)間、歷史就診醫(yī)院、歷史就診科室以及歷史電子病歷等數(shù)據(jù)信息。
所述數(shù)據(jù)關(guān)聯(lián)模塊104用于將每一個(gè)患者的身份標(biāo)識(shí)號(hào)與患者各自對(duì)應(yīng)的生命體征數(shù)據(jù)進(jìn)行關(guān)聯(lián)并建立一個(gè)患者體征信息表,并將每一個(gè)患者的身份標(biāo)識(shí)號(hào)與患者各自對(duì)應(yīng)的歷史就診信息進(jìn)行關(guān)聯(lián)并建立一個(gè)患者就診信息表。在本實(shí)施例中,所述患者體征信息表的表頭字段存儲(chǔ)每一個(gè)患者的身份標(biāo)識(shí)號(hào),所述患者體征信息表的內(nèi)容字段存儲(chǔ)每一個(gè)患者對(duì)應(yīng)的生命體征數(shù)據(jù),所述患者就診信息表的表頭字段存儲(chǔ)每一個(gè)患者的身份標(biāo)識(shí)號(hào),所述患者體征信息表的內(nèi)容字段存儲(chǔ)每一個(gè)患者對(duì)應(yīng)的歷史就診信息。
所述數(shù)據(jù)存儲(chǔ)模塊105用于將患者體征信息表存儲(chǔ)在大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)4中的第一分區(qū)數(shù)據(jù)庫(kù)41中,并將患者就診信息表存儲(chǔ)在大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)4中的第二分區(qū)數(shù)據(jù)庫(kù)42中。由于每個(gè)患者的身份標(biāo)識(shí)號(hào)是唯一,因此將每個(gè)患者的身份標(biāo)識(shí)號(hào)作為患者體征信息表與患者就診信息表之間的關(guān)聯(lián)關(guān)系,并將患者體征信息表與患者就診信息表分開存儲(chǔ)在大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)4的不同分區(qū)數(shù)據(jù)庫(kù)中,避免了訪問(wèn)醫(yī)療數(shù)據(jù)時(shí)產(chǎn)生沖突,加快了對(duì)海量醫(yī)療數(shù)據(jù)的讀取與處理速度,從而能夠提高醫(yī)療服務(wù)水平與患者的滿意度。
為實(shí)現(xiàn)本發(fā)明目的,本發(fā)明還提供了一種醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)方法。如圖2所示,圖2是本發(fā)明醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)方法優(yōu)選實(shí)施例的流程圖。在本實(shí)施例中,所述的醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)方法包括如下步驟:
步驟S21,從不同的醫(yī)療數(shù)據(jù)源收集每一個(gè)患者的原始醫(yī)療數(shù)據(jù);具體地,數(shù)據(jù)采集模塊101從多個(gè)不同的醫(yī)療數(shù)據(jù)源2收集每一個(gè)患者的原始醫(yī)療數(shù)據(jù)。一般地,患者的原始醫(yī)療數(shù)據(jù)的生成和采集通常來(lái)自于醫(yī)院信息系統(tǒng)所產(chǎn)生的臨床數(shù)據(jù),例如HIS系統(tǒng)、EMR、LIS、PACS系統(tǒng),但是隨著物聯(lián)網(wǎng)的發(fā)展,患者的原始醫(yī)療數(shù)據(jù)還可以來(lái)自于體檢中心、私人診所和急救中心等任何適合的臨床業(yè)務(wù)系統(tǒng)。在本實(shí)施例中,數(shù)據(jù)采集模塊101對(duì)每一個(gè)患者的原始醫(yī)療數(shù)據(jù)進(jìn)行清洗轉(zhuǎn)換處理的步驟包括步驟:設(shè)定一個(gè)定時(shí)器腳本的執(zhí)行時(shí)間和執(zhí)行周期,按照定時(shí)器腳本的執(zhí)行時(shí)間和執(zhí)行周期從不同的醫(yī)療數(shù)據(jù)源采集原始醫(yī)療數(shù)據(jù)。
步驟S22,對(duì)每一個(gè)患者的原始醫(yī)療數(shù)據(jù)進(jìn)行清洗轉(zhuǎn)換處理得到每一個(gè)患者的規(guī)范醫(yī)療數(shù)據(jù);具體地,數(shù)據(jù)清洗模塊102對(duì)每一個(gè)患者的原始醫(yī)療數(shù)據(jù)進(jìn)行清洗轉(zhuǎn)換處理得到每一個(gè)患者的規(guī)范醫(yī)療數(shù)據(jù)。在本實(shí)施例中,由于從不同的醫(yī)療數(shù)據(jù)源2收集上來(lái)的原始醫(yī)療數(shù)據(jù)可能有壞數(shù)據(jù)、不合理的數(shù)據(jù)或者是重復(fù)的數(shù)據(jù)等,因此數(shù)據(jù)清洗模塊102需要利用ETL(抽取(extract)、轉(zhuǎn)換(transform)、加載(load)數(shù)據(jù)過(guò)濾轉(zhuǎn)換組件對(duì)所收集的原始醫(yī)療數(shù)據(jù)進(jìn)行清洗轉(zhuǎn)換處理得到規(guī)范醫(yī)療數(shù)據(jù),從而并保證了醫(yī)療數(shù)據(jù)的準(zhǔn)確性,并為醫(yī)療數(shù)據(jù)的存儲(chǔ)節(jié)省了存儲(chǔ)空間。具體地,數(shù)據(jù)清洗模塊102對(duì)每一個(gè)患者的原始醫(yī)療數(shù)據(jù)進(jìn)行清洗轉(zhuǎn)換處理的步驟包括步驟:利用利用ETL數(shù)據(jù)過(guò)濾轉(zhuǎn)換組件移除原始醫(yī)療數(shù)據(jù)中無(wú)意義的詞,將原始醫(yī)療數(shù)據(jù)中一個(gè)詞的不同形式轉(zhuǎn)換為相同形式,以及刪除原始醫(yī)療數(shù)據(jù)中重復(fù)的數(shù)據(jù)等處理。
步驟S23,從每一個(gè)患者的規(guī)范醫(yī)療數(shù)據(jù)中抽取每一個(gè)患者的身份信息和生命體征數(shù)據(jù);具體地,數(shù)據(jù)抽取模塊103從每一個(gè)患者的規(guī)范醫(yī)療數(shù)據(jù)中抽取每一個(gè)患者的身份信息、生命體征數(shù)據(jù)和歷史就診信息。在本實(shí)施例中,所述患者的生命體征數(shù)據(jù)包括患者的身高數(shù)據(jù)、體重?cái)?shù)據(jù)、血壓數(shù)據(jù)、脈搏數(shù)據(jù)、心率數(shù)據(jù)、血氧數(shù)據(jù)以及血糖數(shù)據(jù)等數(shù)據(jù)信息。所述患者的歷史就診信息包括患者的歷史就診時(shí)間、歷史就診醫(yī)院、歷史就診科室以及歷史電子病歷等數(shù)據(jù)信息。
步驟S24,根據(jù)每一個(gè)患者的身份信息為每一個(gè)患者產(chǎn)生一個(gè)身份標(biāo)識(shí)號(hào);具體地,數(shù)據(jù)抽取模塊103根據(jù)每一個(gè)患者的身份信息為每一個(gè)患者產(chǎn)生一個(gè)身份標(biāo)識(shí)號(hào),作為每一個(gè)患者唯一的身份標(biāo)識(shí)。
步驟S25,將每一個(gè)患者的身份標(biāo)識(shí)號(hào)與該患者的生命體征數(shù)據(jù)進(jìn)行關(guān)聯(lián)并建立一個(gè)患者體征信息表,并將每一個(gè)患者的身份標(biāo)識(shí)號(hào)與該患者的歷史就診信息進(jìn)行關(guān)聯(lián)并建立一個(gè)患者就診信息表;具體地,數(shù)據(jù)關(guān)聯(lián)模塊104將每一個(gè)患者的身份標(biāo)識(shí)號(hào)與患者各自對(duì)應(yīng)的生命體征數(shù)據(jù)進(jìn)行關(guān)聯(lián)并建立一個(gè)患者體征信息表,并將每一個(gè)患者的身份標(biāo)識(shí)號(hào)與患者各自對(duì)應(yīng)的歷史就診信息進(jìn)行關(guān)聯(lián)并建立一個(gè)患者就診信息表。在本實(shí)施例中,所述患者體征信息表的表頭字段存儲(chǔ)每一個(gè)患者的身份標(biāo)識(shí)號(hào),所述患者體征信息表的內(nèi)容字段存儲(chǔ)每一個(gè)患者對(duì)應(yīng)的生命體征數(shù)據(jù),所述患者就診信息表的表頭字段存儲(chǔ)每一個(gè)患者的身份標(biāo)識(shí)號(hào),所述患者體征信息表的內(nèi)容字段存儲(chǔ)每一個(gè)患者對(duì)應(yīng)的歷史就診信息。
步驟S26,將患者體征信息表存儲(chǔ)在大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)中的第一分區(qū)數(shù)據(jù)庫(kù)中,并將患者就診信息表存儲(chǔ)在大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)中的第二分區(qū)數(shù)據(jù)庫(kù)中;具體地,數(shù)據(jù)存儲(chǔ)模塊105將患者體征信息表存儲(chǔ)在大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)4中的第一分區(qū)數(shù)據(jù)庫(kù)41中,并將患者就診信息表存儲(chǔ)在大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)4中的第二分區(qū)數(shù)據(jù)庫(kù)42中。在本實(shí)施例中,由于每個(gè)患者的身份標(biāo)識(shí)號(hào)是唯一,每個(gè)患者的身份標(biāo)識(shí)號(hào)作為患者體征信息表與患者就診信息表之間的關(guān)聯(lián)關(guān)系,并將患者體征信息表與患者就診信息表分開存儲(chǔ)在大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)4的不同分區(qū)數(shù)據(jù)庫(kù)中,因此增強(qiáng)了數(shù)據(jù)結(jié)構(gòu)化存儲(chǔ)以及避免了訪問(wèn)醫(yī)療數(shù)據(jù)時(shí)產(chǎn)生沖突,加快了云服務(wù)器1對(duì)醫(yī)療數(shù)據(jù)的讀取與處理速度,從而能夠提高醫(yī)療服務(wù)水平與患者的滿意度。
本發(fā)明所述醫(yī)療大數(shù)據(jù)關(guān)聯(lián)存儲(chǔ)系統(tǒng)及方法通過(guò)采集不同的醫(yī)療數(shù)據(jù)源2中的醫(yī)療數(shù)據(jù),并將對(duì)醫(yī)療數(shù)據(jù)進(jìn)行清洗轉(zhuǎn)換處理得到規(guī)范醫(yī)療數(shù)據(jù),從而使得醫(yī)療數(shù)據(jù)采集更加全面、更加準(zhǔn)確。此外,將每個(gè)患者的身份標(biāo)識(shí)號(hào)作為體征信息表與就診信息表之間的關(guān)聯(lián)關(guān)系,并將患者的體征信息表與就診信息表分開存儲(chǔ)在大數(shù)據(jù)存儲(chǔ)倉(cāng)庫(kù)的不同分區(qū)數(shù)據(jù)庫(kù)中,減輕了系統(tǒng)負(fù)載,提高了數(shù)據(jù)處理效率,避免了訪問(wèn)醫(yī)療數(shù)據(jù)時(shí)產(chǎn)生沖突,加快了對(duì)醫(yī)療數(shù)據(jù)的讀取與處理速度,從而能夠提高醫(yī)療服務(wù)水平與患者的滿意度。
以上僅為本發(fā)明的優(yōu)選實(shí)施例,并非因此限制本發(fā)明的專利范圍,凡是利用本發(fā)明說(shuō)明書及附圖內(nèi)容所作的等效結(jié)構(gòu)或等效功能變換,或直接或間接運(yùn)用在其他相關(guān)的技術(shù)領(lǐng)域,均同理包括在本發(fā)明的專利保護(hù)范圍內(nèi)。