1.一種針對(duì)心臟起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:包括以下步驟:
1)從起搏器程控器設(shè)備中導(dǎo)出PDF格式的報(bào)告文件;
2)讀取報(bào)告文件的內(nèi)容并設(shè)置文本標(biāo)記;
3)根據(jù)文本標(biāo)記將報(bào)告文件的內(nèi)容分切成獨(dú)立的內(nèi)容塊;
4)將內(nèi)容塊制作成表格;
5)將表格內(nèi)容轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的針對(duì)心臟起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述步驟2)的具體實(shí)現(xiàn)方式為:
2.1)打開PDF格式的報(bào)告文件;
2.2)使用計(jì)算機(jī)編程語言編程讀取PDF格式的報(bào)告文件;
2.3)將讀取到的PDF格式的報(bào)告文件進(jìn)行文本標(biāo)記。
3.根據(jù)權(quán)利要求2所述的針對(duì)心臟起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述步驟4)的具體實(shí)現(xiàn)方式為:
4.1)根據(jù)內(nèi)容塊的內(nèi)容的所在位置使用計(jì)算機(jī)編程語言編程實(shí)現(xiàn)坐標(biāo)定位;
4.2)根據(jù)坐標(biāo)對(duì)內(nèi)容塊進(jìn)行柵格化處理;
4.3)形成表格。
4.根據(jù)權(quán)利要求3所述的針對(duì)心臟起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述步驟5)的具體實(shí)現(xiàn)方式為:
5.1)根據(jù)表格每一行的單元格使用計(jì)算機(jī)編程語言編程按照第1列內(nèi)容=屬性名1;第2列內(nèi)容=屬性值1;第3列內(nèi)容=屬性名2;第4列內(nèi)容=屬性值2的格式進(jìn)行提??;
5.2)將提取后的數(shù)據(jù)重新通過編程組合成屬性名1=屬性值1;屬性名2=屬性值2的格式;
5.3)編程篩選數(shù)據(jù);
5.4)剔除無用的信息。
5.根據(jù)權(quán)利要求4所述的針對(duì)心臟起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述計(jì)算機(jī)編程語言為JAVA或C語言。
6.根據(jù)權(quán)利要求5所述的針對(duì)心臟起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:還包括有步驟6)將結(jié)構(gòu)化數(shù)據(jù)寫入數(shù)據(jù)庫保存。
7.根據(jù)權(quán)利要求6所述的針對(duì)心臟起搏器的結(jié)構(gòu)化數(shù)據(jù)提取方法,其特征在于:所述數(shù)據(jù)庫為SQLserver數(shù)據(jù)庫或MySQL數(shù)據(jù)庫。