本發(fā)明涉及計算機技術(shù)領(lǐng)域,尤其涉及一種基于格式表達式的信息提取方法和裝置。
背景技術(shù):
現(xiàn)有的在不同格式的信息中提取相同內(nèi)容的方法主要是通過對設(shè)備的軟件進行修改實現(xiàn)的。由于每當(dāng)信息的格式發(fā)生變化時,都需要重新對設(shè)備的軟件進行修改,因此實現(xiàn)格式兼容的過程復(fù)雜,信息提取的過程效率低下。
以提取醫(yī)院病人腕帶信息中的病人ID號為例。不同醫(yī)院、不同his系統(tǒng)制作的腕帶信息的格式不相同,例如,A醫(yī)院的某病人腕帶信息中的病人ID號表示為“ID:12123”,B醫(yī)院的某病人腕帶信息中的病人ID號表示為“AD:789AA”,而C醫(yī)院的某病人腕帶信息中的病人ID號表示為“AID:12122234321END”。當(dāng)需要對不同醫(yī)院的病人的腕帶信息中的病人ID號進行提取時,需要對醫(yī)院設(shè)備的軟件進行修改,以使醫(yī)院設(shè)備能夠提取不同格式的病人腕帶信息中的病人ID號。由此可見,實現(xiàn)醫(yī)院設(shè)備格式兼容的過程復(fù)雜,信息提取的過程效率低下。
技術(shù)實現(xiàn)要素:
本發(fā)明提出一種基于格式表達式的信息提取方法和裝置,能夠使實現(xiàn)格式兼容的過程簡單,且能夠提高信息提取的過程的效率。
本發(fā)明提供的一種基于格式表達式的信息提取方法,具體包括:
接收信息處理指令,并從所述信息處理指令中獲得待處理信息;
根據(jù)預(yù)設(shè)的格式表達式,對所述待處理信息進行信息提取,獲得位于所述待處理信息中的目標(biāo)信息;其中,所述格式表達式中包括起始表達式和終止表達式,分別用于確定對所述待處理信息進行信息提取時的起始位置和終止位置。
進一步地,在所述接收信息處理指令,并從所述信息處理指令中獲得待處理信息之后,所述根據(jù)預(yù)設(shè)的格式表達式,對所述待處理信息進行信息提取,獲得位于所述待處理信息中的目標(biāo)信息之前,還包括:
從所述信息處理指令中獲得目標(biāo)信息種類;
根據(jù)所述目標(biāo)信息種類,從預(yù)先建立的表達式組合數(shù)據(jù)庫中獲得與所述目標(biāo)信息種類相對應(yīng)的所有表達式組合;其中,每一所述表達式組合中包括起始表達式、終止表達式和中間信息格式;
將所述表達式組合與所述待處理信息依次進行匹配,若根據(jù)所述表達式組合中的所述起始表達式和所述終止表達式能夠分別確定對所述待處理信息進行信息提取時的初始位置和終止位置,且位于所述初始位置與所述終止位置之間的信息的格式為所述表達式組合中的所述中間信息格式,則根據(jù)所述表達式組合生成相應(yīng)的格式表達式。
進一步地,在所述根據(jù)預(yù)設(shè)的格式表達式,對所述待處理信息進行信息提取,獲得位于所述待處理信息中的目標(biāo)信息之前,還包括:
掃描格式表達式條形碼,獲得相應(yīng)的表達式條形碼數(shù)據(jù);
對所述表達式條形碼數(shù)據(jù)進行解析,生成相應(yīng)的格式表達式;其中,所述格式表達式條形碼為一維條形碼或者二維碼。
進一步地,所述起始表達式中包括待提取信息的起始標(biāo)識;所述終止表達式中包括待提取信息的終止標(biāo)識或者待提取信息的信息長度;
則所述根據(jù)預(yù)設(shè)的格式表達式,對所述待處理信息進行信息提取,獲得位于所述待處理信息中的目標(biāo)信息,具體包括:
當(dāng)所述終止表達式中包括所述終止標(biāo)識時,根據(jù)所述起始標(biāo)識確定對所述待處理信息進行信息提取時的在所述待處理信息中的起始位置,并根據(jù)所述終止標(biāo)識確定對所述待處理信息進行信息提取時的在所述待處理信息中的終止位置,并提取所述待處理信息中的所述起始位置與所述終止位置之間的信息,從而獲得所述目標(biāo)信息;
當(dāng)所述終止表達式中包括所述信息長度時,根據(jù)所述起始標(biāo)識確定對所述待處理信息進行信息提取時的在所述待處理信息中的起始位置,并根據(jù)所述信息長度提取從所述起始位置起的長度為所述信息長度的信息,從而獲得所述目標(biāo)信息。
進一步地,所述信息處理指令根據(jù)對掃描信息條形碼所獲得的信息條形碼數(shù)據(jù)進行解析所獲得的待處理信息生成;所述信息條形碼為一維條形碼或者二維碼。
相應(yīng)地,本發(fā)明還提供了一種基于格式表達式的信息提取裝置,具體包括:
待處理信息獲得模塊,用于接收信息處理指令,并從所述信息處理指令中獲得待處理信息;以及,
目標(biāo)信息提取模塊,用于根據(jù)預(yù)設(shè)的格式表達式,對所述待處理信息進行信息提取,獲得位于所述待處理信息中的目標(biāo)信息;其中,所述格式表達式中包括起始表達式和終止表達式,分別用于確定對所述待處理信息進行信息提取時的起始位置和終止位置。
進一步地,所述基于格式表達式的信息提取裝置,還包括:
目標(biāo)信息種類獲得模塊,用于從所述信息處理指令中獲得目標(biāo)信息種類;
表達式組合獲得模塊,用于根據(jù)所述目標(biāo)信息種類,從預(yù)先建立的表達式組合數(shù)據(jù)庫中獲得與所述目標(biāo)信息種類相對應(yīng)的所有表達式組合;其中,每一所述表達式組合中包括起始表達式、終止表達式和中間信息格式;以及,
第一格式表達式生成模塊,用于將所述表達式組合與所述待處理信息依次進行匹配,若根據(jù)所述表達式組合中的所述起始表達式和所述終止表達式能夠分別確定對所述待處理信息進行信息提取時的初始位置和終止位置,且位于所述初始位置與所述終止位置之間的信息的格式為所述表達式組合中的所述中間信息格式,則根據(jù)所述表達式組合生成相應(yīng)的格式表達式。
進一步地,所述基于格式表達式的信息提取裝置,還包括:
表達式條形碼數(shù)據(jù)獲得模塊,用于掃描格式表達式條形碼,獲得相應(yīng)的表達式條形碼數(shù)據(jù);以及,
第二格式表達式生成模塊,用于對所述表達式條形碼數(shù)據(jù)進行解析,生成相應(yīng)的格式表達式;其中,所述格式表達式條形碼為一維條形碼或者二維碼。
進一步地,所述起始表達式中包括待提取信息的起始標(biāo)識;所述終止表達式中包括待提取信息的終止標(biāo)識或者待提取信息的信息長度;
則所述目標(biāo)信息獲得模塊,具體包括:
第一目標(biāo)信息提取單元,用于當(dāng)所述終止表達式中包括所述終止標(biāo)識時,根據(jù)所述起始標(biāo)識確定對所述待處理信息進行信息提取時的在所述待處理信息中的起始位置,并根據(jù)所述終止標(biāo)識確定對所述待處理信息進行信息提取時的在所述待處理信息中的終止位置,并提取所述待處理信息中的所述起始位置與所述終止位置之間的信息,從而獲得所述目標(biāo)信息;或者,
第二目標(biāo)信息提取單元,用于當(dāng)所述終止表達式中包括所述信息長度時,根據(jù)所述起始標(biāo)識確定對所述待處理信息進行信息提取時的在所述待處理信息中的起始位置,并根據(jù)所述信息長度提取從所述起始位置起的長度為所述信息長度的信息,從而獲得所述目標(biāo)信息。
進一步地,所述信息處理指令根據(jù)對掃描信息條形碼所獲得的信息條形碼數(shù)據(jù)進行解析所獲得的待處理信息生成;所述信息條形碼為一維條形碼或者二維碼。
實施本發(fā)明,具有如下有益效果:
本發(fā)明提供的基于格式表達式的信息提取方法及裝置,通過預(yù)先在設(shè)備中設(shè)置與待處理信息的格式相對應(yīng)的格式表達式,使得該設(shè)備能夠?qū)Σ煌袷降拇幚硇畔⑦M行信息提取,實現(xiàn)格式兼容的過程簡單;且在信息提取過程中只需根據(jù)設(shè)備中的格式表達式對待處理信息進行信息提取,因此能夠提高信息提取的過程的效率。
附圖說明
圖1是本發(fā)明提供的基于格式表達式的信息提取方法的一個實施例的流程示意圖;
圖2是本發(fā)明提供的基于格式表達式的信息提取裝置的一個實施例的結(jié)構(gòu)示意圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
參見圖1,是本發(fā)明提供的基于格式表達式的信息提取方法的一個實施例的流程示意圖,包括步驟S11至S12,具體如下:
S11:接收信息處理指令,并從所述信息處理指令中獲得待處理信息;
S12:根據(jù)預(yù)設(shè)的格式表達式,對所述待處理信息進行信息提取,獲得位于所述待處理信息中的目標(biāo)信息;其中,所述格式表達式中包括起始表達式和終止表達式,分別用于確定對所述待處理信息進行信息提取時的起始位置和終止位置。
需要說明的是,在設(shè)備對待處理信息中的目標(biāo)信息進行提取之前,針對不同格式的待處理信息,需要預(yù)先在設(shè)備中設(shè)置與待處理信息的格式相對應(yīng)的格式表達式。格式表達式存儲于設(shè)備中的FLASH中或者SD卡等存儲介質(zhì)中。設(shè)備在接收到用戶發(fā)送的或者其他設(shè)備發(fā)送的或者由設(shè)備其他動作產(chǎn)生的信息處理指令之后,從該信息處理指令中獲得待處理信息,并根據(jù)設(shè)備中的格式表達式對該待處理信息進行信息提取,從而獲得位于該待處理信息中的目標(biāo)信息。
在一個優(yōu)選地實施方式中,在設(shè)備對待處理信息中的目標(biāo)信息進行提取之前,在設(shè)備中設(shè)置與該待處理信息的格式相對應(yīng)的格式表達式,該格式表達式中包括表示目標(biāo)信息的起始的起始表達式以及表示目標(biāo)信息的終止的終止表達式。設(shè)備在接收到信息處理指令之后,從該信息處理指令中獲得待處理信息,并根據(jù)設(shè)備中的格式表達式中的起始表達式和終止表達式分別確定對待處理信息中的目標(biāo)信息進行提取時的起始位置和終止位置,從而提取該起始位置和該終止位置之間的信息,獲得目標(biāo)信息。
以醫(yī)院設(shè)備對病人的腕帶信息中的病人ID號進行提取為例,假設(shè)某病人的腕帶信息為“xxxxAID:122342353ENDxxxx”(其中,該病人的ID號為122342353,xxxx表示該病人的腕帶信息中除病人ID號以外的信息),則在采用該醫(yī)院中的某一設(shè)備對該病人的腕帶信息中的病人ID號進行提取之前,需要將格式表達式“ADFM:SUB;SSTRING:’AID’;ESTRING:’END’;”存儲至該設(shè)備的閃存(flash memory)中,從而完成對設(shè)備的設(shè)置。其中,該格式表達式中包括起始表達式“SSTRING:’AID’;”和終止表達式“ESTRING:’END’;”,表示目標(biāo)信息為以字符串“AID”為始且以字符串“END”為終的信息。設(shè)備在接收到信息處理指令并從中獲得病人的腕帶信息之后,先根據(jù)該格式表達式中的起始表達式在腕帶信息中查找到字符串“AID”,再根據(jù)該格式表達式中的終止表達式在腕帶信息中查找到字符串“END”,最后獲取腕帶信息中的位于字符串“AID”和字符串“END”之間的信息,從而獲得目標(biāo)信息“122342353”,即為該病人的ID號。
需要進一步說明的是,一臺設(shè)備中還可以同時存儲多個格式表達式,每個格式表達式具有唯一的ID號。設(shè)備在接收到信息處理指令之后,從中獲得待處理信息的格式的ID號,并根據(jù)該ID號在設(shè)備中查找到相對應(yīng)的格式表達式,從而根據(jù)該格式表達式對待處理信息進行信息提取。
本實施例通過預(yù)先在設(shè)備中設(shè)置與待處理信息的格式相對應(yīng)的格式表達式,使得該設(shè)備能夠?qū)Σ煌袷降拇幚硇畔⑦M行信息提取,實現(xiàn)格式兼容的過程簡單;且在信息提取過程中只需根據(jù)設(shè)備中的格式表達式對待處理信息進行信息提取,因此能夠提高信息提取的過程的效率。
進一步地,在所述接收信息處理指令,并從所述信息處理指令中獲得待處理信息之后,所述根據(jù)預(yù)設(shè)的格式表達式,對所述待處理信息進行信息提取,獲得位于所述待處理信息中的目標(biāo)信息之前,還包括:
從所述信息處理指令中獲得目標(biāo)信息種類;
根據(jù)所述目標(biāo)信息種類,從預(yù)先建立的表達式組合數(shù)據(jù)庫中獲得與所述目標(biāo)信息種類相對應(yīng)的所有表達式組合;其中,每一所述表達式組合中包括起始表達式、終止表達式和中間信息格式;
將所述表達式組合與所述待處理信息依次進行匹配,若根據(jù)所述表達式組合中的所述起始表達式和所述終止表達式能夠分別確定對所述待處理信息進行信息提取時的初始位置和終止位置,且位于所述初始位置與所述終止位置之間的信息的格式為所述表達式組合中的所述中間信息格式,則根據(jù)所述表達式組合生成相應(yīng)的格式表達式。
需要說明的是,每當(dāng)設(shè)備對一種新格式的待處理信息進行信息提取時,均需要在進行信息提取之前對設(shè)備中的格式表達式進行重新設(shè)置。在本實施例中,設(shè)備中的格式表達式通過自適應(yīng)生成的方式進行設(shè)置。設(shè)備中預(yù)先建立有表達式組合數(shù)據(jù)庫,其中存儲有屬于不同目標(biāo)信息種類的多個表達式組合,每一個表達式組合中包括一個起始表達式、一個終止表達式和一個中間信息格式。在接收到用戶發(fā)送的或者其他設(shè)備發(fā)送的或者由設(shè)備其他動作產(chǎn)生的信息處理指令并從中獲得待處理信息之后,設(shè)備從該信息處理指令中獲得所要提取的目標(biāo)信息的目標(biāo)信息種類,并根據(jù)該目標(biāo)信息種類在表達式組合數(shù)據(jù)庫中獲取屬于該目標(biāo)信息種類的所有表達式組合。隨后,將每個所獲取的表達式組合依次與待處理信息進行匹配,若根據(jù)某一表達式組合中的起始表達式和終止表達式能夠在待處理信息中分別確定進行信息提取時的起始位置和終止位置,且該起始位置與該終止位置之間的信息的格式為該表達式組合中的中間信息格式,則認為該表達式組合與該待處理信息的格式相對應(yīng),并根據(jù)該表達式組合生成相應(yīng)的格式表達式,并將生成的格式表達式存儲于設(shè)備中,從而使得該設(shè)備能夠根據(jù)該生成的格式表達式自動地對后續(xù)的具有相同格式的待處理信息進行目標(biāo)信息的提取。
以醫(yī)院設(shè)備對病人的腕帶信息中的病人ID號進行提取為例,假設(shè)某醫(yī)院設(shè)備中預(yù)先建立的表達式組合數(shù)據(jù)庫中包含“病人ID號”和“主治醫(yī)生”兩個目標(biāo)信息類別,其中,“病人ID號”類別中包含“SSTRING:’ID’;EINDEX:6;MID:INT;”(表達式組合1)、“SSTRING:’ID’;ESTING:’END’;MID:SINDEX=6;”(表達式組合2)和“SSTIRNG:’AID’;ESTING:’END’;MID:SINDEX=9;”(表達式組合3)三個表達式組合。假設(shè)某病人的腕帶信息為“xxxxAID:122342353ENDxxxx”(其中,該病人的ID號為122342353,xxxx表示該病人的腕帶信息中除病人ID號以外的信息)。若設(shè)備第一次對格式為“xxxxAIDxxxxENDxxxx”的信息進行提取,則在從接收到的信息處理指令中獲得該病人的腕帶信息之后,從該信息處理指令中獲得待提取的目標(biāo)信息的目標(biāo)信息種類,即“病人ID號”,隨后根據(jù)該“病人ID號”目標(biāo)信息種類在表達式組合數(shù)據(jù)庫中獲得上述的表達式組合1、表達式組合2和表達式組合3,并將表達式組合1、表達式組合2和表達式組合3依次與病人的腕帶信息進行匹配。
當(dāng)將表達式組合1與病人的腕帶信息進行匹配時,先根據(jù)該表達式組合1中的起始表達式“SSTRING:’ID’;”在腕帶信息中查找“ID”字符,在查找到“ID”字符后,根據(jù)該表達式組合1中的終止表達式“EINDEX:6;”提取“ID”字符后的6個字符的信息,即“122342”,隨后,根據(jù)該表達式組合1中的中間信息格式“MID:INT;”判斷所提取的“122342”信息是否為INT型數(shù)據(jù),因為不是,因此將表達式組合2與病人的腕帶信息進行匹配。
當(dāng)將表達式組合2與病人的腕帶信息進行匹配時,先根據(jù)該表達式組合2中的起始表達式“SSTRING:’ID’;”在腕帶信息中查找“ID”字符,在查找到“ID”字符后,根據(jù)該表達式組合2中的終止表達式“ESTING:’END’;”在腕帶信息中查找“END”字符,在查找到“END”字符后,提取該“ID”字符和該“END”字符之間的信息,即“122342353”,并根據(jù)該表達式組合2中的中間信息格式“SINDEX=6;”判斷該“122342353”信息是否為長度為6個字符的字符串類型數(shù)據(jù),因為不是,因此將表達式組合3與病人的腕帶信息進行匹配。
當(dāng)將表達式組合3與病人的腕帶信息進行匹配時,先根據(jù)該表達式組合3中的起始表達式“SSTRING:’AID’;”在腕帶信息中查找“AID”字符,在查找到“AID”字符后,根據(jù)該表達式組合3中的終止表達式“ESTING:’END’;”在腕帶信息中查找“END”字符,在查找到“END”字符后,提取該“AID”字符和該“END”字符之間的信息,即“122342353”,并根據(jù)該表達式組合3中的中間信息格式“SINDEX=9;”判斷該“122342353”信息是否為長度為9個字符的字符串類型數(shù)據(jù),因為是,因此根據(jù)該表達式組合3生成相應(yīng)的格式表達式“ADFM:SUB;SSTRING:’AID’;ESTRING:’END’;”,并將該格式表達式存儲于設(shè)備的存儲介質(zhì)中,以完成對設(shè)備的設(shè)置,使得該設(shè)備能夠根據(jù)所存儲的該格式表達式對后續(xù)的格式為“xxxxAIDxxxxENDxxxx”的信息進行提取。
在本實施例中,設(shè)備中的格式表達式通過自適應(yīng)生成的方式進行設(shè)置,能夠使得實現(xiàn)格式兼容的過程進一步簡單化。
在另一個優(yōu)選地實施方式中,在所述根據(jù)預(yù)設(shè)的格式表達式,對所述待處理信息進行信息提取,獲得位于所述待處理信息中的目標(biāo)信息之前,還包括:
掃描格式表達式條形碼,獲得相應(yīng)的表達式條形碼數(shù)據(jù);
對所述表達式條形碼數(shù)據(jù)進行解析,生成相應(yīng)的格式表達式;其中,所述格式表達式條形碼為一維條形碼或者二維碼。
需要說明的是,每當(dāng)設(shè)備對一種新格式的待處理信息進行信息提取時,均需要在進行信息提取之前對設(shè)備中的格式表達式進行重新設(shè)置。在本實施例中,設(shè)備中的格式表達式通過對掃描格式表達式條形碼所獲得的表達式條形碼數(shù)據(jù)進行解析獲得。其中,格式表達式條形碼預(yù)先通過對格式表達式進行編碼生成。設(shè)備在對待處理信息中的目標(biāo)信息進行提取之前,通過掃描格式表達式條形碼獲得相應(yīng)的表達式條形碼數(shù)據(jù),并對該表達式條形碼數(shù)據(jù)進行解析,生成相應(yīng)的格式表達式,并將生成的格式表達式存儲于設(shè)備中,從而使得該設(shè)備能夠根據(jù)該生成的格式表達式自動地對后續(xù)的具有相同格式的待處理信息進行目標(biāo)信息的提取。需要進一步說明的是,該格式表達式條形碼可以為一維條形碼或者二維碼。
在本實施例中,設(shè)備中的格式表達式通過對掃描格式表達式條形碼所獲得的表達式條形碼數(shù)據(jù)進行解析獲得,能夠使得實現(xiàn)格式兼容的過程進一步簡單化。
進一步地,所述起始表達式中包括待提取信息的起始標(biāo)識;所述終止表達式中包括待提取信息的終止標(biāo)識或者待提取信息的信息長度;
則所述根據(jù)預(yù)設(shè)的格式表達式,對所述待處理信息進行信息提取,獲得位于所述待處理信息中的目標(biāo)信息,具體包括:
當(dāng)所述終止表達式中包括所述終止標(biāo)識時,根據(jù)所述起始標(biāo)識確定對所述待處理信息進行信息提取時的在所述待處理信息中的起始位置,并根據(jù)所述終止標(biāo)識確定對所述待處理信息進行信息提取時的在所述待處理信息中的終止位置,并提取所述待處理信息中的所述起始位置與所述終止位置之間的信息,從而獲得所述目標(biāo)信息;
當(dāng)所述終止表達式中包括所述信息長度時,根據(jù)所述起始標(biāo)識確定對所述待處理信息進行信息提取時的在所述待處理信息中的起始位置,并根據(jù)所述信息長度提取從所述起始位置起的長度為所述信息長度的信息,從而獲得所述目標(biāo)信息。
需要說明的是,格式表達式中的起始表達式中包括待提取信息的起始標(biāo)識。格式表達式中的終止表達式中包括待提取信息的終止標(biāo)識或者待提取信息的信息長度。
當(dāng)格式表達式中的終止表達式中所包括的內(nèi)容為待提取信息的終止標(biāo)識時,在接收到信息處理指令之后,設(shè)備從該信息處理指令中獲得待處理信息,并根據(jù)設(shè)備中的格式表達式中的起始表達式確定對該待處理信息進行信息提取時的在該待處理信息中的起始位置,并根據(jù)設(shè)備中的格式表達式中的終止表達式確定對該待處理信息進行信息提取時的在該待處理信息中的終止位置,隨后,提取該起始位置與該終止位置之間的信息,即為目標(biāo)信息。
當(dāng)格式表達式中的終止表達式中所包括的內(nèi)容為待提取信息的信息長度時,在接收到信息處理指令之后,設(shè)備從該信息處理指令中獲得待處理信息,并根據(jù)設(shè)備中的格式表達式中的起始表達式確定對該待處理信息進行信息提取時的在該待處理信息中的起始位置,并根據(jù)設(shè)備中的格式表達式中的信息長度獲取自所確定的起始位置起的長度為該信息長度的信息,即為目標(biāo)信息。
例如,假設(shè)某醫(yī)院中的某病人的腕帶信息為“xxxxAID:122342353ENDxxxx”(其中,該病人的ID號為122342353,xxxx表示該病人的腕帶信息中除病人ID號以外的信息),該醫(yī)院中的提取病人ID號的設(shè)備中的格式表達式可以為“ADFM:SUB;SSTRING:’AID’;ESTRING:’END’;”或者“ADFM:SUB;SSTRING:’AID’;EINDEX:9;”。當(dāng)采用醫(yī)院設(shè)備對該病人的腕帶信息中的病人ID號進行提取時,若設(shè)備中的格式表達式為“ADFM:SUB;SSTRING:’AID’;ESTRING:’END’;”,則先根據(jù)該格式表達式中的起始表達式“SSTRING:’AID’;”在腕帶信息中查找到字符串“AID”,再根據(jù)該格式表達式中的終止表達式“ESTRING:’END’;”在腕帶信息中查找到字符串“END”,最后提取腕帶信息中的位于字符串“AID”和字符串“END”之間的信息,從而獲得目標(biāo)信息“122342353”,即為該病人的ID號。
當(dāng)采用醫(yī)院設(shè)備對該病人的腕帶信息中的病人ID號進行提取時,若設(shè)備中的格式表達式為“ADFM:SUB;SSTRING:’AID’;EINDEX:9;”,則先根據(jù)該格式表達式中的起始表達式“SSTRING:’AID’;”在腕帶信息中查找到字符串“AID”,再根據(jù)該格式表達式中的終止表達式“EINDEX:9;”在腕帶信息中提取自字符串“AID”起的9個字符的信息,從而獲得目標(biāo)信息“122342353”,即為該病人的ID號。
進一步地,所述信息處理指令根據(jù)對掃描信息條形碼所獲得的信息條形碼數(shù)據(jù)進行解析所獲得的待處理信息生成;所述信息條形碼為一維條形碼或者二維碼。
需要說明的是,設(shè)備在根據(jù)信息處理指令對待處理信息進行信息提取之前,通過對信息條形碼進行掃描獲得相應(yīng)的信息條形碼數(shù)據(jù),并對該信息條形碼數(shù)據(jù)進行解析,從而獲得待處理信息,隨后,根據(jù)該待處理信息生成相應(yīng)的信息處理指令。需要進一步說明的是,該信息條形碼可以為一維條形碼或者二維碼。
本發(fā)明實施例提供的基于格式表達式的信息提取方法,通過預(yù)先在設(shè)備中設(shè)置與待處理信息的格式相對應(yīng)的格式表達式,使得該設(shè)備能夠?qū)Σ煌袷降拇幚硇畔⑦M行信息提取,實現(xiàn)格式兼容的過程簡單;且在信息提取過程中只需根據(jù)設(shè)備中的格式表達式對待處理信息進行信息提取,因此能夠提高信息提取的過程的效率。另外,在一些具體的實施例當(dāng)中,設(shè)備中的格式表達式可以通過自適應(yīng)生成的方式進行設(shè)置,也可以通過對掃描格式表達式條形碼所獲得的表達式條形碼數(shù)據(jù)進行解析獲得,因此能夠使得實現(xiàn)格式兼容的過程進一步簡單化。
相應(yīng)地,本發(fā)明還提供一種基于格式表達式的信息提取裝置,能夠?qū)崿F(xiàn)上述實施例中的基于格式表達式的信息提取方法的所有流程。
參見圖2,是本發(fā)明提供的基于格式表達式的信息提取裝置的一個實施例的結(jié)構(gòu)示意圖,具體如下:
待處理信息獲得模塊21,用于接收信息處理指令,并從所述信息處理指令中獲得待處理信息;以及,
目標(biāo)信息提取模塊22,用于根據(jù)預(yù)設(shè)的格式表達式,對所述待處理信息進行信息提取,獲得位于所述待處理信息中的目標(biāo)信息;其中,所述格式表達式中包括起始表達式和終止表達式,分別用于確定對所述待處理信息進行信息提取時的起始位置和終止位置。
進一步地,所述基于格式表達式的信息提取裝置,還包括:
目標(biāo)信息種類獲得模塊,用于從所述信息處理指令中獲得目標(biāo)信息種類;
表達式組合獲得模塊,用于根據(jù)所述目標(biāo)信息種類,從預(yù)先建立的表達式組合數(shù)據(jù)庫中獲得與所述目標(biāo)信息種類相對應(yīng)的所有表達式組合;其中,每一所述表達式組合中包括起始表達式、終止表達式和中間信息格式;以及,
第一格式表達式生成模塊,用于將所述表達式組合與所述待處理信息依次進行匹配,若根據(jù)所述表達式組合中的所述起始表達式和所述終止表達式能夠分別確定對所述待處理信息進行信息提取時的初始位置和終止位置,且位于所述初始位置與所述終止位置之間的信息的格式為所述表達式組合中的所述中間信息格式,則根據(jù)所述表達式組合生成相應(yīng)的格式表達式。
在另一個優(yōu)選地實施方式中,所述基于格式表達式的信息提取裝置,還包括:
表達式條形碼數(shù)據(jù)獲得模塊,用于掃描格式表達式條形碼,獲得相應(yīng)的表達式條形碼數(shù)據(jù);以及,
第二格式表達式生成模塊,用于對所述表達式條形碼數(shù)據(jù)進行解析,生成相應(yīng)的格式表達式;其中,所述格式表達式條形碼為一維條形碼或者二維碼。
進一步地,所述起始表達式中包括待提取信息的起始標(biāo)識;所述終止表達式中包括待提取信息的終止標(biāo)識或者待提取信息的信息長度;
則所述目標(biāo)信息獲得模塊22,具體包括:
第一目標(biāo)信息提取單元,用于當(dāng)所述終止表達式中包括所述終止標(biāo)識時,根據(jù)所述起始標(biāo)識確定對所述待處理信息進行信息提取時的在所述待處理信息中的起始位置,并根據(jù)所述終止標(biāo)識確定對所述待處理信息進行信息提取時的在所述待處理信息中的終止位置,并提取所述待處理信息中的所述起始位置與所述終止位置之間的信息,從而獲得所述目標(biāo)信息;或者,
第二目標(biāo)信息提取單元,用于當(dāng)所述終止表達式中包括所述信息長度時,根據(jù)所述起始標(biāo)識確定對所述待處理信息進行信息提取時的在所述待處理信息中的起始位置,并根據(jù)所述信息長度提取從所述起始位置起的長度為所述信息長度的信息,從而獲得所述目標(biāo)信息。
進一步地,所述信息處理指令根據(jù)對掃描信息條形碼所獲得的信息條形碼數(shù)據(jù)進行解析所獲得的待處理信息生成;所述信息條形碼為一維條形碼或者二維碼。
本發(fā)明實施例提供的基于格式表達式的信息提取裝置,通過預(yù)先在設(shè)備中設(shè)置與待處理信息的格式相對應(yīng)的格式表達式,使得該設(shè)備能夠?qū)Σ煌袷降拇幚硇畔⑦M行信息提取,因此實現(xiàn)格式兼容的過程簡單;且在信息提取過程中只需根據(jù)設(shè)備中的格式表達式對待處理信息進行信息提取,因此能夠提高信息提取的過程的效率。另外,在一些具體的實施例當(dāng)中,設(shè)備中的格式表達式可以通過自適應(yīng)生成的方式進行設(shè)置,也可以通過對掃描格式表達式條形碼所獲得的表達式條形碼數(shù)據(jù)進行解析獲得,因此能夠使得實現(xiàn)格式兼容的過程進一步簡單化。
以上所述是本發(fā)明的優(yōu)選實施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以作出若干改進和潤飾,這些改進和潤飾也視為本發(fā)明的保護范圍。