一種電子病歷后結(jié)構(gòu)化知識發(fā)現(xiàn)方法和裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及醫(yī)學(xué)教育科研管理領(lǐng)域,尤其涉及一種電子病歷后結(jié)構(gòu)化知識發(fā)現(xiàn)方法和裝置。
【背景技術(shù)】
[0002]隨著計(jì)算機(jī)應(yīng)用普及,醫(yī)學(xué)知識的管理包括對已知知識的機(jī)器總結(jié)和對未知知識的機(jī)器抽取,其已成為醫(yī)學(xué)發(fā)展進(jìn)步的關(guān)鍵技術(shù)手段。
[0003]電子病歷是由醫(yī)療機(jī)構(gòu)以電子化方式創(chuàng)建、保存和使用的,重點(diǎn)針對門診、住院患者臨床診療和指導(dǎo)干預(yù)信息的數(shù)據(jù)集成系統(tǒng)。是居民個(gè)人在醫(yī)療機(jī)構(gòu)歷次就診過程中產(chǎn)生和被記錄的完整、詳細(xì)的臨床信息資源。
[0004]隨著物聯(lián)網(wǎng)技術(shù)的發(fā)展,大量家用穿戴式健康監(jiān)測設(shè)備(比如3D-CELL宇航員檢測儀能同時(shí)檢測出人體12000多項(xiàng)指標(biāo))在指導(dǎo)輔助居民個(gè)人進(jìn)行健康自我管理過程中會(huì)產(chǎn)生大量健康數(shù)據(jù)簡稱物聯(lián)網(wǎng)健康大數(shù)據(jù)。
[0005]物聯(lián)網(wǎng)電子病歷包括:由非醫(yī)療機(jī)構(gòu)產(chǎn)生的物聯(lián)網(wǎng)健康大數(shù)據(jù)屬于自由格式的“治未病電子病歷”,和由醫(yī)療機(jī)構(gòu)產(chǎn)生的臨床電子診療記錄屬于規(guī)范格式的“治已病電子病歷”。為了使電子病歷的數(shù)據(jù)結(jié)構(gòu)化,醫(yī)生被迫一邊盡量詳細(xì)客觀觀察病情一邊要在模棱兩可術(shù)語集中盡量精簡選擇取舍。但問題是結(jié)構(gòu)化錄入電子病歷不是醫(yī)生的本職工作,電子病歷的結(jié)構(gòu)化錄入是對臨床醫(yī)生診療行為的信息化綁架。因此,臨床醫(yī)生希望不受干擾的書寫電子病歷,再利用軟件技術(shù)對文本自動(dòng)進(jìn)行后結(jié)構(gòu)化處理。申請?zhí)枮?01210544345.4的中國發(fā)明專利申請“基于本體技術(shù)的結(jié)構(gòu)化電子病歷生成方法”提供了一種基于“關(guān)鍵詞詞庫”和“病歷特征索引庫”的后結(jié)構(gòu)化電子病歷生成方法。但該技術(shù)應(yīng)用局限于診療病歷而無法針對自由格式文檔的后結(jié)構(gòu)化,并且,如何從后結(jié)構(gòu)化數(shù)據(jù)中抽取有價(jià)值信息輔助醫(yī)學(xué)管理以及如何從中發(fā)現(xiàn)新知識開展教學(xué)科研仍然缺少基于病歷數(shù)據(jù)后結(jié)構(gòu)化的知識發(fā)現(xiàn)技術(shù)手段。
[0006]目前,自然語言處理是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向。它研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語言進(jìn)行有效通信的各種理論和方法。自然語言處理是一門融語言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)于一體的科學(xué)。自然語言處理技術(shù)難點(diǎn)包括:單詞的邊界界定,詞義的消歧,句法的模糊性,有瑕疵的或不規(guī)范的輸入,語言的行為計(jì)劃。自然語言處理的基礎(chǔ)是各類自然語言處理數(shù)據(jù)集,通過分詞器、分類器和統(tǒng)計(jì)學(xué)習(xí)產(chǎn)生語料庫訓(xùn)練集。常用的分類算法為:決策樹,貝葉斯,Rocch1,kNN,神經(jīng)網(wǎng)絡(luò),支持向量機(jī)等。
[0007]但各種自然語言處理技術(shù)努力呈現(xiàn)的是對語言本身的機(jī)器理解能力,只關(guān)注機(jī)器對語法和語義的抽取識別學(xué)習(xí),而對語言依存的事實(shí)環(huán)境(語境)毫無覺察能力,現(xiàn)行自然語言處理技術(shù)關(guān)注和強(qiáng)調(diào)“語言的表述規(guī)律抽取”而忽略“語言中所要表達(dá)的事實(shí)元素抽取”,這是為語言而語言的機(jī)器學(xué)習(xí)方法,不是為事實(shí)而語言的知識發(fā)現(xiàn)方法。
【發(fā)明內(nèi)容】
[0008]鑒于此,本發(fā)明的一個(gè)目的是提供一種電子病歷后結(jié)構(gòu)化知識發(fā)現(xiàn)方法和裝置,以克服因現(xiàn)有技術(shù)中的至少一個(gè)缺陷。
[0009]為了實(shí)現(xiàn)本發(fā)明的目的,根據(jù)本發(fā)明的一方面,本發(fā)明提供了一種電子病歷后結(jié)構(gòu)化知識發(fā)現(xiàn)方法,該方法包括以下步驟:
[0010]構(gòu)建包括文本語料庫、第一邏輯讀寫器以及事實(shí)元素庫的事實(shí)后結(jié)構(gòu)化編輯器的步驟,其中,所述文本語料庫容納電子病歷文本語料的集合,所述第一邏輯讀寫器用于根據(jù)其知識庫關(guān)鍵詞列表從所述文本語料庫找出相匹配的關(guān)鍵詞,并根據(jù)其規(guī)則庫邏輯將邏輯值為真的匹配關(guān)鍵詞識別為事實(shí)元素寫入所述事實(shí)元素庫;
[0011]獲取事件元素的步驟,該步驟中第二邏輯讀寫器根據(jù)其知識庫關(guān)鍵詞列表從所述事實(shí)元素庫找出相匹配的關(guān)鍵詞,并根據(jù)其規(guī)則庫邏輯將邏輯值為真的匹配關(guān)鍵詞識別為事件元素寫入事件元素庫;
[0012]編碼步驟,用超數(shù)編碼事實(shí)元素庫中的事實(shí)元素,并按照所述事件元素庫中的事件元素與事實(shí)元素庫中事實(shí)元素的關(guān)聯(lián)邏輯用敏數(shù)編碼事件元素庫中的事件元素;以及
[0013]構(gòu)建包括事件元素庫、第三邏輯讀寫器以及事實(shí)結(jié)構(gòu)庫的事件后結(jié)構(gòu)化編輯器的步驟,其中所述第三邏輯讀寫器用于根據(jù)其知識庫關(guān)鍵詞列表從所述事件元素庫找出相匹配的關(guān)鍵詞,并根據(jù)其規(guī)則庫邏輯確定相匹配的關(guān)鍵詞之間的邏輯關(guān)系,基于所述邏輯關(guān)系確定事實(shí)結(jié)構(gòu),寫入事實(shí)結(jié)構(gòu)庫。
[0014]進(jìn)一步地,在構(gòu)建事實(shí)后結(jié)構(gòu)化編輯器之前還可包括:建立電子病歷文本語料庫,該文本語料庫包括原始文本語料的集合。
[0015]進(jìn)一步地,所述第一邏輯讀寫器、所述第二邏輯讀寫器、所述第三邏輯讀寫器中的每一個(gè)包括:讀字板、寫字板、第一知識庫、第一規(guī)則庫和邏輯讀寫筆。
[0016]進(jìn)一步地,所述電子病歷文本語料可采用統(tǒng)一格式進(jìn)行存儲于所述文本語料庫。
[0017]進(jìn)一步地,所述方法還可包括:生成知識報(bào)告模板的步驟,該步驟從事實(shí)結(jié)構(gòu)庫選擇邏輯值為真的事實(shí)結(jié)構(gòu)作為報(bào)告對象知識點(diǎn)主索引,通過第二邏輯讀寫器和第三邏輯讀寫器從事件底層事實(shí)元素推導(dǎo)到上級事件元素,并由事件元素推導(dǎo)到所述事實(shí)結(jié)構(gòu)。
[0018]進(jìn)一步地,所述第三邏輯讀寫器根據(jù)其規(guī)則庫邏輯確定相匹配的關(guān)鍵詞之間的邏輯關(guān)系,在邏輯值為真的情況下將事件地址賦值為I,寫入事實(shí)結(jié)構(gòu)庫。
[0019]根據(jù)本發(fā)明的另一方面,還提供一種電子病歷后結(jié)構(gòu)化知識發(fā)現(xiàn)裝置,該裝置包括:
[0020]構(gòu)建包括文本語料庫、第一邏輯讀寫器以及事實(shí)元素庫的事實(shí)后結(jié)構(gòu)化編輯器的單元,其中,所述文本語料庫容納電子病歷文本語料的集合,所述第一邏輯讀寫器用于根據(jù)其知識庫關(guān)鍵詞列表從所述文本語料庫找出相匹配的關(guān)鍵詞,并根據(jù)其規(guī)則庫邏輯將邏輯值為真的匹配關(guān)鍵詞識別為事實(shí)元素寫入所述事實(shí)元素庫;
[0021]獲取事件元素的單元,該單元利用第二邏輯讀寫器根據(jù)第二邏輯讀寫器的知識庫關(guān)鍵詞列表從所述事實(shí)元素庫找出相匹配的關(guān)鍵詞,并根據(jù)第二邏輯讀寫器的規(guī)則庫邏輯將邏輯值為真的匹配關(guān)鍵詞識別為事件元素寫入事件元素庫;
[0022]編碼單元,該單元用超數(shù)編碼事實(shí)元素庫中的事實(shí)元素,并按照所述事件元素庫中的事件元素與事實(shí)元素庫中事實(shí)元素的關(guān)聯(lián)邏輯用敏數(shù)編碼事件元素庫中的事件元素;以及
[0023]構(gòu)建包括事件元素庫、第三邏輯讀寫器以及事實(shí)結(jié)構(gòu)庫的事件后結(jié)構(gòu)化編輯器的單元,其中所述第三邏輯讀寫器用于根據(jù)其知識庫關(guān)鍵詞列表從所述事件元素庫找出相匹配的關(guān)鍵詞,并根據(jù)其規(guī)則庫邏輯確定相匹配的關(guān)鍵詞之間的邏輯關(guān)系,基于所述邏輯關(guān)系確定事實(shí)結(jié)構(gòu),寫入事實(shí)結(jié)構(gòu)庫。
[0024]本發(fā)明基于超敏定律,將簡單機(jī)械的從語言到語言的機(jī)器學(xué)習(xí)能力轉(zhuǎn)變?yōu)閺氖聦?shí)到語言的知識發(fā)現(xiàn)能力,借助這種能力實(shí)現(xiàn)知識發(fā)現(xiàn)過程的自動(dòng)化管理,可大幅度提高醫(yī)學(xué)教育科研管理水平。
[0025]本發(fā)明的附加優(yōu)點(diǎn)、目的,以及特征將在下面的描述中將部分地加以闡述,且將對于本領(lǐng)域普通技術(shù)人員在研究下文后部分地變得明顯,或者可以根據(jù)本發(fā)明的實(shí)踐而獲知。本發(fā)明的目的和其它優(yōu)點(diǎn)可以通過在書面說明及其權(quán)利要求書以及附圖中具體指出的結(jié)構(gòu)實(shí)現(xiàn)到并獲得。
[0026]本領(lǐng)域技術(shù)人員將會(huì)理解的是,能夠用本發(fā)明實(shí)現(xiàn)的目的和優(yōu)點(diǎn)不限于以上具體所述,并且根據(jù)以下詳細(xì)說明將更清楚地理解本發(fā)明能夠?qū)崿F(xiàn)的上述和其他目的。
【附圖說明】
[0027]圖1示出本發(fā)明實(shí)施例中電子病歷后結(jié)構(gòu)化知識發(fā)現(xiàn)裝置的框圖示意圖;
[0028]圖2示出三個(gè)邏輯讀寫器(事實(shí)元素邏輯讀寫器、事件元素邏輯讀寫器和事實(shí)結(jié)構(gòu)邏輯讀寫器)的共同構(gòu)造示意圖;
[0029]圖3示出本發(fā)明實(shí)施例的知識報(bào)告模板設(shè)計(jì)的示意圖;以及
[0030]圖4示出了本發(fā)明實(shí)施例中電子病歷后結(jié)構(gòu)化知識發(fā)現(xiàn)方法的流程示意圖。
【具體實(shí)施方式】
[0031]下面,對本發(fā)明的優(yōu)選實(shí)施方式進(jìn)行詳細(xì)說明。這些優(yōu)選實(shí)施方式的示例在附圖中進(jìn)行了例示。附圖中所示和根據(jù)附圖描述的本發(fā)明的實(shí)施方式僅僅是示例性的,并且本發(fā)明的技術(shù)精神及其主要操作不限于這些實(shí)施方式。
[0032]在此,