本發(fā)明涉及一種基于電子病歷數(shù)據(jù)庫的檢索裝置和檢索方法,尤其涉及根據(jù)相關(guān)度推薦關(guān)鍵字的檢索裝置和檢索方法。
背景技術(shù):
基于電子病歷數(shù)據(jù)庫的病歷檢索系統(tǒng)在醫(yī)療界漸漸被廣泛應(yīng)用,使相關(guān)使用人員特別是醫(yī)務(wù)工作者能夠快速獲得相近患者的病歷資料,以提高對疾病診斷的準(zhǔn)確性,同時便于臨床科研工作者更加精確地對所需病歷的查詢及提取,滿足其科研需求。對于電子病歷數(shù)據(jù)庫中的電子病歷中的關(guān)鍵詞可通過現(xiàn)有技術(shù)中的中文分詞法進行整理提取,電子病歷數(shù)據(jù)庫中所包括的電子病歷為經(jīng)過中文分詞處理后的電子病歷。
病歷檢索系統(tǒng)的重要核心功能之一是病歷的檢索,目前市面上類似系統(tǒng)根據(jù)使用者確定的關(guān)鍵字進行檢索,并顯示檢索結(jié)果。然而有時候檢索結(jié)果未必是使用者所需的,導(dǎo)致檢索效果并不理想。
現(xiàn)有技術(shù)中并未涉及對電子病歷的關(guān)鍵字進行推薦的檢索系統(tǒng)。
技術(shù)實現(xiàn)要素:
本發(fā)明提供一種檢索裝置與方法,在用戶所確定的關(guān)鍵字不符合要求的情況下,根據(jù)相關(guān)度進行關(guān)鍵字推薦,以達(dá)到更精確的檢索結(jié)果的目的。
本發(fā)明的一方面提供一種基于電子病歷數(shù)據(jù)庫的檢索裝置,所述電子病歷數(shù)據(jù)庫包括經(jīng)中文分詞的多個電子病歷,該檢索裝置包括:輸入部,用于輸入用戶確定的第一關(guān)鍵字;第一檢索部,其基于所述第一關(guān)鍵字檢索所述電子病歷數(shù)據(jù)庫,得到第一檢索結(jié)果;判斷部,其判斷所述第一檢索結(jié)果的個數(shù)是否為0,如果為0,則返回提示信息,如果不為0則根據(jù)用戶的輸入,判斷所述第一檢索結(jié)果是否合格;計算部,當(dāng)所述判斷部判斷所述第一檢索結(jié)果不合格時,建立所述多個電子病歷的關(guān)鍵字二維矩陣,并基于該關(guān)鍵字二維矩陣計算所述多個電子病歷中的除所述第一關(guān)鍵字之外的關(guān)鍵字與所述第一關(guān)鍵字的相關(guān)度,所述關(guān)鍵字二維矩陣是以所述多個電子病歷中的關(guān)鍵字為列名,以所述多個電子病歷 的病歷編號為行名的二值化矩陣,其中當(dāng)電子病歷中有列名所例舉的關(guān)鍵字時,將其在該關(guān)鍵字二維矩陣中的所在行列的值標(biāo)為1,否則標(biāo)為0;推薦部,其根據(jù)所述計算部計算得到的所述多個電子病歷中的除所述第一關(guān)鍵字之外的關(guān)鍵字與所述第一關(guān)鍵字的相關(guān)度,推薦相關(guān)度最大的關(guān)鍵字作為第二關(guān)鍵字;第二檢索部,其基于所述第二關(guān)鍵字檢索所述電子病歷數(shù)據(jù)庫,得到第二檢索結(jié)果;顯示部,其對所述提示信息、所述第一檢索結(jié)果和所述第二檢索結(jié)果進行顯示。
根據(jù)上述檢索裝置,用戶能夠在以自己所確定的關(guān)鍵字無法檢索到理想結(jié)果的情況下,根據(jù)裝置推薦的關(guān)鍵字進一步檢索。
進一步的,所述判斷部能夠判斷所述第一關(guān)鍵字的個數(shù)是否為單個;當(dāng)所述判斷部判斷所述第一關(guān)鍵字為單個時,計算部基于以下算式計算所述多個電子病歷中的除所述第一關(guān)鍵字之外的關(guān)鍵字與所述第一關(guān)鍵字的相關(guān)度Rkf,
公式1
其中,p表示電子病歷編號所在行的序號,p=1,2,3....,j;j表示電子病歷系統(tǒng)中的電子病歷的總個數(shù),j為正整數(shù);k表示第一搜索關(guān)鍵字所在的列的序號;f表示除第一關(guān)鍵字以外的關(guān)鍵字所在列的序號,f=1,...k-1,k+1,...i;i為正整數(shù),即為電子病例系統(tǒng)中所有關(guān)鍵字(無重復(fù))的總個數(shù);Z為所述關(guān)鍵字二維矩陣中的對應(yīng)行列所對應(yīng)的值。
根據(jù)上述檢索裝置,能夠提供在用戶確定的第一關(guān)鍵字為單個的情況下的一種相關(guān)度計算的方式。
進一步的,判斷部能夠判斷所述第一關(guān)鍵字的個數(shù)是否為單個;當(dāng)所述判斷部判斷第一關(guān)鍵字為兩個以上詞語時,所述計算部基于以下算式計算所述多個電子病歷中的除所述第一關(guān)鍵字之外的關(guān)鍵字與所述第一關(guān)鍵字的相關(guān)度Ln,
公式2
其中,p表示電子病歷編號所在行的序號,p=1,2,3....,j;j表示電子病歷系統(tǒng)中的電子病歷的總個數(shù),j為正整數(shù);a,b,c...t為第一關(guān)鍵字各自所在的列的序號,n為除第一關(guān)鍵字以外的關(guān)鍵字所在列的序號。
根據(jù)上述檢索裝置,能夠提供在用戶確定的第一關(guān)鍵字為兩個以上的情況下的一種相關(guān)度計算的方式。
進一步的,當(dāng)計算部計算得到的所述多個電子病歷中的除所述第一關(guān)鍵字之外的關(guān)鍵字與所述第一關(guān)鍵字的相關(guān)度中有同值且都是最大的值時,還可基于以下算式分別計算相關(guān)度為同值的各關(guān)鍵字所在列的權(quán)值We,
公式3
其中,p表示電子病歷編號所在行的序號,p=1,2,3....,j;j表示電子病歷系統(tǒng)中的電子病歷的總個數(shù),j為正整數(shù);e表示相關(guān)度產(chǎn)生同值的關(guān)鍵字所在列的序號,
所述推薦部推薦權(quán)值We最大的關(guān)鍵字為第二關(guān)鍵字,如果相關(guān)度為同值的各關(guān)鍵字所在列的權(quán)值We也為同值,則選擇任意一個相關(guān)度為最大的值的關(guān)鍵字作為第二關(guān)鍵字。
根據(jù)上述檢索裝置,能夠提供在除所述第一關(guān)鍵字之外的關(guān)鍵字與所述第一關(guān)鍵字的相關(guān)度中有同值且都是最大的值時,選擇第二關(guān)鍵字的一種方式。
本發(fā)明的另一方面提供一種基于電子病歷數(shù)據(jù)庫的檢索方式,所述電子病歷數(shù)據(jù)庫包括經(jīng)中文分詞的多個電子病歷,該檢索方法包括:輸入步驟,用于輸入用戶確定的第一關(guān)鍵字;第一檢索步驟,其基于所述第一關(guān)鍵字檢索所述電子病歷數(shù)據(jù)庫,得到第一檢索結(jié)果;判斷步驟,其判斷所述第一檢索結(jié)果的個數(shù)是否為0,如果為0,則返回提示信息,如果不為0則根據(jù)用戶的輸入,判斷所述第一檢索結(jié)果是否合格;計算步驟,當(dāng)所述判斷步驟判斷所述第一檢索結(jié)果不合格時,建立所述多個電子病歷的關(guān)鍵字二維矩陣,并基于該關(guān)鍵字二維矩陣計算所述多個電子病歷中的除所述第一關(guān)鍵字之外的關(guān)鍵字與所述第一關(guān)鍵字的相關(guān)度,所述關(guān)鍵字二維矩陣是以所述多個電子病歷中的關(guān)鍵字為列名,以所述多個電子病歷的病歷編號為行名的二值化矩陣,其中當(dāng)電子病歷中有列名所例舉的關(guān)鍵字時,將其在該關(guān)鍵字二維矩陣中的所在行列的值標(biāo)為1,否則標(biāo)為0;推薦步驟,其根據(jù)所述計算步驟計算得到的所述多個電子病歷中的除所述第一關(guān)鍵字之外的關(guān)鍵字與所述第一關(guān)鍵字的相關(guān)度,推薦相關(guān)度最大的關(guān)鍵字作為第二關(guān)鍵字;第二檢索步驟,其基于所述第二關(guān)鍵字檢索所述電子病歷數(shù)據(jù)庫,得到第二檢索結(jié)果;顯示步驟,其對所述提示信息、所述第一檢索結(jié)果和所述第二檢索結(jié)果進行顯示。
附圖說明
圖1是示出本發(fā)明一實施方式的檢索裝置的功能框圖。
圖2是關(guān)鍵字二維矩陣的一個示例。
圖3示出本發(fā)明一實施例的檢索方法的流程圖。
具體實施方式
以下,參照附圖,對本發(fā)明的優(yōu)選的實施方式進行詳細(xì)的說明。在此,在附圖的說明中,對相同或者相當(dāng)?shù)囊貥?biāo)記相同的符號,省略重復(fù)的說明。
圖1是示出本發(fā)明一實施方式的檢索裝置的功能框圖。如圖1所示,檢索裝置100包括,輸入部10,第一檢索部20,判斷部30,計算部40,推薦部50,第二檢索部60以及顯示部70。
檢索裝置100是基于電子病歷數(shù)據(jù)庫(圖未示)進行合適的電子病歷檢索的檢索裝置,電子病歷數(shù)據(jù)庫中包括有經(jīng)中文分詞而將各個電子病歷中的關(guān)鍵字提取出來的多個電子病歷,檢索裝置可通過通信網(wǎng)絡(luò)等與電子病歷數(shù)據(jù)庫連接。該電子病歷數(shù)據(jù)庫的覆蓋范圍可以是全市醫(yī)院的病人的電子病歷,甚至是全國、全球范圍的聯(lián)網(wǎng)數(shù)據(jù)庫。
輸入部10用于輸入用戶確定的第一關(guān)鍵字。用戶通常是醫(yī)生、研究人員等,其會根據(jù)需要確定第一關(guān)鍵字,例如在診斷具有“咳嗽”癥狀的病人時,其就可能以“咳嗽”作為第一關(guān)鍵字來進行檢索相似病人的病歷以為之后的診斷做參考。
第一檢索部20基于通過輸入部10輸入的第一關(guān)鍵字來檢索電子病歷數(shù)據(jù)庫,得到第一檢索結(jié)果。第一檢索結(jié)果是指根據(jù)第一關(guān)鍵字檢索得到的電子病歷。
判斷部30先判斷該第一檢索結(jié)果的個數(shù)是否為0(即沒有檢測到匹配該第一關(guān)鍵字的病歷),如果為0,則返回提示信息,該提示信息可顯示于后述的顯示部70,用以提醒用戶重新確定新的第一關(guān)鍵字;如果第一檢索結(jié)果的個數(shù)不為0,則判斷部30根據(jù)用戶的直接輸入或者來自輸入部10發(fā)送的用戶的輸入,來判斷由第一檢索部20根據(jù)第一關(guān)鍵字檢索得到第一檢索結(jié)果是否合格。用戶對于第一檢索結(jié)果是否符合預(yù)期的反饋結(jié)果,可以通過輸入部10輸入后由輸入部10反饋給判斷部30,也可直接輸入給判斷部30。
計算部40能夠計算除第一關(guān)鍵字之外的關(guān)鍵字與第一關(guān)鍵字的相關(guān)度。當(dāng)判斷部30判斷第一檢索結(jié)果不合格時,計算部40建立電子病歷數(shù)據(jù)庫中的多個電子病歷的關(guān)鍵字二維矩陣,并基于該關(guān)鍵字二維矩陣計算多個電子病歷中的除所述第一關(guān)鍵字之外的關(guān)鍵字與所述第一關(guān)鍵字的相關(guān)度。如圖2所示,上述關(guān)鍵字二維矩陣是以電子病歷數(shù)據(jù)庫中的多個電子病歷中互不重復(fù)的關(guān)鍵字為列名(例如“心悸”,“呼吸困難”,“咳嗽”,“胸悶”,“水腫”等),并以所述多個電子病歷的病歷編號為行名(例如,ID1,ID2,ID3,ID4等)的二值化矩陣。當(dāng)電子病歷數(shù)據(jù)庫中的某個電子病歷中有該關(guān)鍵字二維矩陣的列名所例舉的關(guān)鍵字時,將該電子病歷在關(guān)鍵字二維矩陣中的所在行列的值標(biāo)為1,否則標(biāo)為0。
推薦部50根據(jù)計算部40計算得到的多個電子病歷中的除所述第一關(guān)鍵字之外的各個關(guān)鍵字與所述第一關(guān)鍵字的相關(guān)度,推薦其中相關(guān)度最大的關(guān)鍵字作為第二關(guān)鍵字。
第二檢索部60基于推薦部50所推薦的第二關(guān)鍵字檢索電子病歷數(shù)據(jù)庫,得到第二檢索結(jié)果。
顯示部70可以對提示信息,或者第一檢索結(jié)果或者第二檢索結(jié)果進行顯示。
關(guān)于計算部40對于除所述第一關(guān)鍵字之外的關(guān)鍵字與所述第一關(guān)鍵字的相關(guān)度的計算,即,矩陣中各列之間的相關(guān)度的計算,本領(lǐng)域技術(shù)人員可依據(jù)需要確定合適的相關(guān)度計算方式。下面,給出一些不同情況下的相關(guān)度的計算實例。
以下,通過具體計算例來說明如何進行基于第一關(guān)鍵字的檢索以及當(dāng)?shù)谝魂P(guān)鍵字的檢索結(jié)果不合格時基于第二關(guān)鍵字的檢索。
實施例1
首先,在實施例1中,輸入部10被輸入用戶所確定的第一關(guān)鍵字“咳嗽”。第一檢索部20基于該第一關(guān)鍵字“咳嗽”對電子病歷數(shù)據(jù)庫進行檢索,得到第一檢索結(jié)果,也就是說檢索出與該第一關(guān)鍵字“咳嗽”相關(guān)的所有病歷,并顯示于顯示部70,本例中能夠檢索到電子病例數(shù)據(jù)庫中病例編號為ID1,ID3,ID4的三個病歷。判斷部30由此判斷第一檢索結(jié)果的個數(shù)不為0。此時,使用檢索裝置的用戶可能會對該第一檢索結(jié)果并不滿意,例如,認(rèn)為其檢索得到的電子病歷量太過龐大,或者認(rèn)為檢索得到的電子病歷的參考價值不高等,而做出第一檢索結(jié)果不合格的反饋,這樣的對于第一檢索結(jié)果的反饋可通過輸入部10發(fā)送給判斷部30,也可直接發(fā)送給判斷部30。判斷部30基于用戶輸入的對于第一檢索結(jié)果的反饋,判斷第一檢索結(jié)果是否合格。如果判斷第一檢索結(jié)果合格,則在顯示部70顯示第一檢索結(jié)果;如果判斷第一檢索結(jié)果不合格則由計算部40進行后續(xù)的相關(guān)度的計算。
在實施例1中,判斷部30還能夠?qū)Φ谝魂P(guān)鍵字是否為單個進行判斷。以本實施例1為例,判斷部30判斷第一關(guān)鍵字“咳嗽”為單個,則計算部40首先以電子病歷數(shù)據(jù)庫中的多個電子病歷中互不重復(fù)的關(guān)鍵字為列名,并以所述多個電子病歷的病歷編號為行名構(gòu)筑二維矩陣如下所示(該二維矩陣的實例是為了簡化說明,實際構(gòu)筑的二維矩陣比之可以龐大很多),具體的電子病歷中有該關(guān)鍵字二維矩陣的列名所例舉的關(guān)鍵字時,將該電子病歷在關(guān)鍵字二維矩陣中的所在行列的值標(biāo)為1,否則標(biāo)為0,如下所示:
本例中,通過輸入部輸入的用戶所確定的第一關(guān)鍵字為單個關(guān)鍵字“咳嗽”,此時,計算部40需要計算的是其他關(guān)鍵字“胃痛”、“發(fā)燒”、“鼻噻”與第一關(guān)鍵字“咳嗽”的 相關(guān)度分別是多少。
在構(gòu)筑電子病歷二維矩陣后,計算部40基于以下算式計算所述多個電子病歷中的除所述第一關(guān)鍵字之外的關(guān)鍵字與所述第一關(guān)鍵字的相關(guān)度Rkf。
公式1
其中,p表示電子病歷編號所在行的序號,p=1,2,3....,j;j表示電子病歷系統(tǒng)中的電子病歷的總個數(shù),j為正整數(shù);k表示第一搜索關(guān)鍵字所在的列的序號;f表示除第一關(guān)鍵字以外的關(guān)鍵字所在列的序號,f=1,...k-1,k+1,...i;i為正整數(shù),即為電子病歷系統(tǒng)中所有關(guān)鍵字(無重復(fù))的總個數(shù);Z為所述關(guān)鍵字二維矩陣中的對應(yīng)行列所對應(yīng)的值。
根據(jù)以上,例如,R13代表的是列的序號為3的關(guān)鍵字與列的序號為1的第一關(guān)鍵字的相關(guān)度。
根據(jù)公式1,
由此,推薦部50可根據(jù)上述計算部所計算的除第一關(guān)鍵字以外的關(guān)鍵字與第一關(guān)鍵字的相關(guān)度,來推薦其中相關(guān)度最高的。以實施例1為例,其中,列的序號為4的關(guān)鍵字“鼻噻”與第一關(guān)鍵字“咳嗽”的相關(guān)度R14為最高,列的序號為3的關(guān)鍵字“發(fā)燒”與第一關(guān)鍵字“咳嗽”的相關(guān)度R13為最低。因此,推薦部50推薦“鼻噻”作為第二關(guān)鍵字。
第二檢索部60根據(jù)該第二關(guān)鍵字“鼻噻”對電子病歷數(shù)據(jù)庫進行檢索,得到進一步的檢索結(jié)果,即第二檢索結(jié)果,并將第二檢索結(jié)果顯示于顯示部70。
另,也有第一關(guān)鍵字為兩個以上(包括兩個)的情況,例如實施例2所例舉的實例。
實施例2
在實施例2中,輸入部10被輸入用戶所確定的第一關(guān)鍵字“咳嗽”和“發(fā)燒”。第一檢索部20基于第一關(guān)鍵字“咳嗽”和“發(fā)燒”對電子病歷數(shù)據(jù)庫進行檢索,得到第一檢索結(jié)果,也就是說檢索出與第一關(guān)鍵字“咳嗽”以及“發(fā)燒”相關(guān)的所有病歷,并顯示于顯示部70。本例中能夠檢索到電子病例數(shù)據(jù)庫中病例編號為ID1的病歷。判斷部30由此判斷第一檢索結(jié)果的個數(shù)不為0。此時,使用檢索裝置的用戶可能會對該第一檢索結(jié)果 并不滿意,而做出第一檢索結(jié)果不合格的反饋,這樣的對于第一檢索結(jié)果的反饋可通過輸入部10發(fā)送給判斷部30,也可直接發(fā)送給判斷部30。判斷部30基于用戶輸入的對于第一檢索結(jié)果的反饋,判斷第一檢索結(jié)果是否合格。如果判斷第一檢索結(jié)果合格,則在顯示部70顯示第一檢索結(jié)果;如果判斷第一檢索結(jié)果不合格則由計算部40進行后續(xù)的相關(guān)度的計算。
在實施例2中,判斷部30同樣能夠?qū)Φ谝魂P(guān)鍵字是否為單個進行判斷。以實施例2為例,判斷部30判斷第一關(guān)鍵字“咳嗽”和“發(fā)燒”為兩個以上的詞語。此時,計算部40首先以電子病歷數(shù)據(jù)庫中的多個電子病歷中互不重復(fù)的關(guān)鍵字為列名,并以所述多個電子病歷的病歷編號為行名構(gòu)筑二維矩陣如下所示,具體的電子病歷中有該關(guān)鍵字二維矩陣的列名所例舉的關(guān)鍵字時,將該電子病歷在關(guān)鍵字二維矩陣中的所在行列的值標(biāo)為1,否則標(biāo)為0,如下所示:
本例中,通過輸入部輸入的用戶所確定的第一關(guān)鍵字為關(guān)鍵字“咳嗽”和“發(fā)燒”,此時,計算部40需要計算的是其他關(guān)鍵字“胃痛”、“鼻噻”與第一關(guān)鍵字“咳嗽”和“發(fā)燒”的相關(guān)度分別是多少。
在構(gòu)筑電子病歷二維矩陣后,計算部40基于以下所示的公式2計算所述多個電子病歷中的除所述第一關(guān)鍵字之外的關(guān)鍵字與第一關(guān)鍵字的相關(guān)度Ln。
公式2
其中,p表示電子病歷編號所在行的序號,p=1,2,3....,j;j表示電子病歷系統(tǒng)中的電子病歷的總個數(shù),j為正整數(shù);a,b,c...t為第一關(guān)鍵字各自所在的列的序號,n為除第一關(guān)鍵字以外的關(guān)鍵字所在列的序號。
根據(jù)以上,例如,L2代表的是列的序號為2的關(guān)鍵字“胃痛”與第一關(guān)鍵字的相關(guān)度,L4表示列的序號為4的關(guān)鍵字“鼻噻”與第一關(guān)鍵字的相關(guān)度。
根據(jù)公式2,L2=0+0+0+1=1
L4=2+1+1+0=4
由此,推薦部50可根據(jù)上述計算部所計算的除第一關(guān)鍵字以外的關(guān)鍵字與第一關(guān) 鍵字的相關(guān)度,來推薦其中相關(guān)度最高的。以實施例2為例,其中,列的序號為4的關(guān)鍵字“鼻噻”與第一關(guān)鍵字“咳嗽”和“發(fā)燒”的相關(guān)度L4為最高,列的序號為2的關(guān)鍵字“胃痛”與第一關(guān)鍵字“咳嗽”和“發(fā)燒”的相關(guān)度L2為最低,因此,推薦部50推薦“鼻噻”作為第二關(guān)鍵字。
第二檢索部60根據(jù)該第二關(guān)鍵字“鼻噻”對電子病歷數(shù)據(jù)庫進行檢索,得到進一步的檢索結(jié)果,即第二檢索結(jié)果,并將第二檢索結(jié)果顯示于顯示部70。
雖然上述實施例1和實施例2給出了以兩種不同的相關(guān)度計算方式分別計算第一關(guān)鍵字為單個以及第一關(guān)鍵字為兩個以上的情況的實例,但本領(lǐng)域技術(shù)人員也可根據(jù)具體情況通過一種通用的計算方式來計算第一關(guān)鍵字為單個或兩個以上情況下的相關(guān)度。
實施例3
另外,當(dāng)所述計算部計算得到的所述多個電子病歷中的除所述第一關(guān)鍵字之外的關(guān)鍵字與所述第一關(guān)鍵字的相關(guān)度中有同值且都是最大值時,則可以基于以下算式分別計算相關(guān)度為同值的各關(guān)鍵字所在列的權(quán)值We,
公式3
其中,p表示電子病歷編號所在行的序號,p=1,2,3....,j;j表示電子病歷系統(tǒng)中的電子病歷的總個數(shù),j為正整數(shù);e表示相關(guān)度產(chǎn)生同值的關(guān)鍵字所在列的序號,
推薦部50推薦權(quán)值We最大的關(guān)鍵字為第二關(guān)鍵字。
如果根據(jù)上述的公式3,計算得到相關(guān)度為同值的各關(guān)鍵字所在列的權(quán)值We也為同值,則選擇任意一個相關(guān)度為最大的值的關(guān)鍵字作為第二關(guān)鍵字。
假設(shè),在實施例3中,輸入部10被輸入用戶所確定的第一關(guān)鍵字“咳嗽”和“咳痰”。第一檢索部20基于第一關(guān)鍵字“咳嗽”和“咳痰”對電子病歷數(shù)據(jù)庫進行檢索。判斷部30判斷第一檢索結(jié)果的個數(shù)不為0。且判斷部30基于用戶輸入的對于第一檢索結(jié)果的反饋,判斷第一檢索結(jié)果是否合格。假設(shè)在本例中判斷第一檢索結(jié)果為不合格。
接著,判斷部30判斷第一關(guān)鍵字“咳嗽”和“咳痰”為兩個以上的詞語,計算部40確定以公式2計算除第一關(guān)鍵字以外的關(guān)鍵字與第一關(guān)鍵字的相關(guān)度。計算部40首先以電子病歷數(shù)據(jù)庫中的多個電子病歷中互不重復(fù)的關(guān)鍵字為列名,并以所述多個電子病歷的病歷編號為行名構(gòu)筑二維矩陣如下所示,具體的電子病歷中有該關(guān)鍵字二維矩陣的列名所例舉的關(guān)鍵字時,將該電子病歷在關(guān)鍵字二維矩陣中的所在行列的值標(biāo)為1,否則標(biāo)為0,如下所示:
根據(jù)公式2得到,列的序號為2的關(guān)鍵字“胸悶”與第一關(guān)鍵字的相關(guān)度L2,列序號為3的關(guān)鍵字“氣喘”與第一關(guān)鍵字的相關(guān)度L3,以及列的序號為5的關(guān)鍵字“下肢浮腫”L5的具體數(shù)值。
L2=3
L3=3
L5=2
可知,相關(guān)度大小關(guān)系為,L2=L3>L5。即出現(xiàn)了除所述第一關(guān)鍵字之外的關(guān)鍵字與所述第一關(guān)鍵字的相關(guān)度中有同值的情況。
此時,可依據(jù)如下的公式3來計算這些同值相關(guān)度的權(quán)重值,以選擇其中權(quán)重大的作為第二關(guān)鍵字。
公式3
其中,p表示電子病歷編號所在行的序號,p=1,2,3....,j;j表示電子病歷系統(tǒng)中的電子病歷的總個數(shù),j為正整數(shù);e表示相關(guān)度產(chǎn)生同值的關(guān)鍵字所在列的序號。
根據(jù)公式3,出現(xiàn)同值的L2和L3的對應(yīng)權(quán)重不同,
W2=1+1+0+0+0=2
W3=1+1+0+0+1=3。
因此,實施例3中,最終選擇權(quán)重的值為最大的列序號為3的關(guān)鍵字“氣喘”作為第二關(guān)鍵字進行檢索,并將第二檢索結(jié)果顯示于顯示部。
圖3示出本發(fā)明一實施例的檢索方法的流程圖。如圖3所示,在步驟S11中,輸入用戶確定的第一關(guān)鍵字,例如“咳嗽”。在步驟S12中,根據(jù)該第一關(guān)鍵字檢索電子病歷數(shù)據(jù)庫,得到第一檢索結(jié)果。接著,在步驟S13中,判斷第一檢索結(jié)果的個數(shù)是否為0,如果判斷結(jié)果為是,則發(fā)出提示信息并在步驟S18中顯示提示信息,以便提示用戶重新確定第一關(guān)鍵字;如果步驟S13中的判斷結(jié)果為否,則進入到步驟S14。步驟S14中,根據(jù)用 戶的輸入,判斷第一檢索結(jié)果是否合格,如果判斷結(jié)果為是,則直接進入到步驟S18顯示第一檢索結(jié)果;如果步驟S14的判斷結(jié)果為否,則進入到步驟S15。步驟S15中,建立多個電子病歷的關(guān)鍵字二維矩陣,計算除第一關(guān)鍵字之外的關(guān)鍵字與第一關(guān)鍵字的相關(guān)度,關(guān)于該相關(guān)度的計算,本領(lǐng)域技術(shù)人員可根據(jù)需要確定具體的相關(guān)度計算方式,也可如上文實施例1和實施例2那樣進行相關(guān)度的計算。步驟S16中,根據(jù)步驟S15計算得到的除第一關(guān)鍵字之外的關(guān)鍵字與與第一關(guān)鍵字相關(guān)度,推薦其中相關(guān)度最大的關(guān)鍵字作為第二關(guān)鍵字。步驟S17中,基于步驟S16所推薦的第二關(guān)鍵字檢索電子病歷數(shù)據(jù)庫,得到第二檢索結(jié)果,接著,進入到步驟S18中,顯示該第二檢索結(jié)果。
另外,可以在步驟S14判斷第一檢索結(jié)果為不合格時(否),進一步判斷第一關(guān)鍵字為單個還是兩個以上,并據(jù)此來選擇不同的相關(guān)度計算方法,例如通過上述的公式1的計算方法或通過公式2的計算方法。
另外,在步驟S15中,如果計算得到的除第一關(guān)鍵字之外的關(guān)鍵字與第一關(guān)鍵字的相關(guān)度出現(xiàn)同值且都是最大的值,則可進一步根據(jù)上述的公式3來計算出現(xiàn)同值相關(guān)度的關(guān)鍵字的各自的權(quán)重,以推薦權(quán)重的值為最大的關(guān)鍵字作為第二關(guān)鍵字。另外,如果相關(guān)度為同值的各關(guān)鍵字所在列的權(quán)值We也為同值,則可以選擇任意一個相關(guān)度為最大的值的關(guān)鍵字作為第二關(guān)鍵字。
以上對本發(fā)明的實施方式進行了說明,但這些實施方式僅作為舉例說明,并不具有限定發(fā)明范圍的意圖。這些實施方式能夠通過其他各種形態(tài)實施,在不超出發(fā)明主旨的范圍內(nèi)進行各種各樣的省略、置換、變更、組合。這些實施方式和其變形包含在發(fā)明范圍和主旨中的同時,也包含在權(quán)利要求書中記載的發(fā)明以及與其均等的范圍內(nèi)。