亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

醫(yī)學影像報告診斷修改類型判斷方法及系統(tǒng)與流程

文檔序號:40389707發(fā)布日期:2024-12-20 12:12閱讀:5來源:國知局
醫(yī)學影像報告診斷修改類型判斷方法及系統(tǒng)與流程

本發(fā)明涉及醫(yī)療信息領(lǐng)域,更具體地,涉及一種醫(yī)學影像報告診斷修改類型判斷方法及系統(tǒng)。


背景技術(shù):

1、在影像報告書寫過程中,同一份報告會經(jīng)過初級醫(yī)生初步撰寫,由高級醫(yī)生審核修改。為了評價初級醫(yī)生的報告書寫質(zhì)量和針對性的對初級醫(yī)生的知識進行查漏補缺,需要先針對醫(yī)學影像報告中的診斷印象的修改進行分類。現(xiàn)有技術(shù)中,文本分類主要技術(shù)如下:

2、基于規(guī)則的文本分類方法,根據(jù)一些人工制定的規(guī)則對文本進行分類,由于場景不同,規(guī)則也不同。

3、基于統(tǒng)計的文本分類方法,如利用機器學習、深度學習,通過大量有標注數(shù)據(jù)的監(jiān)督學習進行文本分類。

4、基于大語言模型提示詞的文本分類方法。主要指的是在不進行微調(diào)或者訓練的情況下,直接通過提示詞輸入到大語言模型得出分類結(jié)果。

5、基于規(guī)則的文本分類方法不具備普適性,是針對應(yīng)用場景設(shè)計;另外隨著規(guī)則的增加,系統(tǒng)規(guī)則的可維護性會變差,會產(chǎn)生一些沖突。

6、基于統(tǒng)計的文本分類方法,準確性的上限相對基于規(guī)則來說比較高,比較受學術(shù)界的青睞,但是在工業(yè)界,由于通常需要依賴大量有標注的高質(zhì)量數(shù)據(jù),需要針對不同的任務(wù)做大量數(shù)據(jù)標注,導(dǎo)致應(yīng)用成本偏高。另外在醫(yī)學領(lǐng)域,數(shù)據(jù)長尾分布現(xiàn)象非常常見,導(dǎo)致不同類型數(shù)據(jù)的比例嚴重不均衡,從而導(dǎo)致模型的訓練的難度加大。

7、基于大語言模型提示詞的文本分類方法,可以利用訓練好的語言模型進行分類,基本不需要人工標注,成本比較低,雖然在通識問題上回答的結(jié)果比較接近于人,但是在專業(yè)問題,并且存在一定的個性化的問題上,經(jīng)過測試,準確性(70%左右)和基于規(guī)則的方法(95%左右)有明顯差距;除此之外,大語言模型對硬件要求高,速度慢。


技術(shù)實現(xiàn)思路

1、有鑒于此,本發(fā)明的主要目的在于提供一種醫(yī)學影像報告診斷修改類型判斷方法及系統(tǒng),該方法可自動化分析影像報告的修改類型,能作為影像報告書寫質(zhì)量評價的一個分支方法,大大降低報告質(zhì)量評價的難度,可為初級報告醫(yī)生提供有針對性的查漏補缺的建議提供參考,解決了現(xiàn)有技術(shù)中存在的規(guī)則可維護性差、計算資源消耗高、需要標注大量有分類標簽的數(shù)據(jù)、準確性低、維護成本高的問題。

2、為達到上述目的,本發(fā)明的技術(shù)方案是這樣實現(xiàn)的:

3、一方面,本發(fā)明提供了一種醫(yī)學影像報告診斷修改類型判斷方法,包括:對修改前的醫(yī)學影像報告和修改后的醫(yī)學影像報告做預(yù)處理,預(yù)處理后的數(shù)據(jù)以句子對的形式呈現(xiàn)修改前和修改后的報告數(shù)據(jù);識別所述句子對中的命名實體和命名實體類型;將每個句子對中的命名實體進行配對,輸出配對后的命名實體和命名實體類型;其中,未能匹配的命名實體,按照原有順序插入到序列中;以逗號或句號分隔符為一個單元,基于配對后的命名實體是否相同以及命名實體對應(yīng)的命名實體類型,按照預(yù)設(shè)的邏輯規(guī)則判斷每個單元的修改類型;其中,所述修改類型為漏診、誤診、定位錯誤、特征未識別、特征識別錯誤、診斷邏輯錯誤、文字語法和格式錯誤、診斷信心不一致、語言習慣不一致、程度判斷錯誤、臨床溝通問題。

4、優(yōu)選地,所述識別所述句子對中的命名實體和命名實體類型,其步驟包括:構(gòu)建命名實體字典,所述命名實體字典包括命名實體、命名實體類型和命名實體對應(yīng)的同義詞;其中,所述命名實體字典的類別為疾病種類、影像特征、定位、診斷信心、程度、臨床溝通;基于所述命名實體字典,通過最長字符匹配的方式從所述句子對中識別命名實體和命名實體類型。

5、優(yōu)選地,所述對修改前的醫(yī)學影像報告和修改后的醫(yī)學影像報告做預(yù)處理,其步驟包括:識別句子邊界:以句號或冒號作為句子邊界,將醫(yī)學影像報告文本拆成每個表達完整含義的短句;調(diào)整語序:將修改前后的每個短句進行對比,若移動該短句到對應(yīng)位置時,診斷前后的最長公共子序列長度比未移動該短句增加的數(shù)量占被移動短句的比例達到預(yù)設(shè)值后,則判斷需要移動該短句到對應(yīng)位置;句子配對:基于最長公共子序列,用包裝后的算法得到修改前后短句的對應(yīng)位置以及對應(yīng)關(guān)系,根據(jù)對應(yīng)位置以及對應(yīng)關(guān)系,生成四個移動的指針,分別對應(yīng)修改前短句的起點位置、終點位置,修改后短句的起點位置、終點位置,結(jié)合短句邊界位置,不斷更新四個指針,記錄匹配成對的短句,形成所述句子對。

6、優(yōu)選地,所述將每個句子對中的命名實體進行配對,其步驟包括:定義修改前的短句對應(yīng)的命名實體數(shù)組為x,其數(shù)量為m,x[i].type表示x中的i個命名實體的實體類型,x[i].mention表示x中的i個命名實體的實體提及內(nèi)容;修改后的句子對應(yīng)的命名實體數(shù)組為y,其數(shù)量是n,y[i].type表示y中的i個命名實體的實體類型,y[i].mention表示y中的i個命名實體的實體提及內(nèi)容;定義一個(m+1)*(n+1)的二位數(shù)組dp記錄狀態(tài),dp[i][j]表示在命名實體類型相同才能配對的情況下,前i個修改前的命名實體和前j個修改后的句子命名實體匹配的最長公共子序列數(shù)量;lcs{x[i].mention,y[j].mention}表示第i個實體和第j個實體的最長公共子序列數(shù)量;定義的狀態(tài)轉(zhuǎn)移方程為:dp[0][j]=0;(0<=j(luò)<=n+1)

7、dp[i][0]=0;(0<=i<=m+1)

8、dp[i][j]=dp[i-1][j-1]+lcs{x[i].mention,y[j].mention};(x[i].type==y(tǒng)[i].type?anddp[i][j]>=max{dp[i-1][j],dp[i][j-1]})

9、dp[i][j]=max{dp[i][j-1],dp[i-1][j]};(x[i].type≠y[i].type?or?dp[i][j]<

10、max{dp[i-1][j],dp[i][j-1]})

11、根據(jù)狀態(tài)數(shù)組,回溯能夠匹配的命名實體,任意選擇一個組合即可。

12、優(yōu)選地,該方法還包括:每個所述單元的修改類型包括多個時,將優(yōu)先級別最高的修改類型作為該單元的修改類型;其中,所述優(yōu)先級別排序為:誤診>漏診>特征識別錯誤>特征未識別>定位錯誤>診斷邏輯錯誤>臨床溝通問題>程度判斷錯誤>文字語法和格式錯誤>診斷信心不一致>語言習慣不一致。

13、另一方面,本發(fā)明還提供了一種醫(yī)學影像報告診斷修改類型判斷系統(tǒng),該系統(tǒng)包括:數(shù)據(jù)預(yù)處理模塊、數(shù)據(jù)識別模塊、命名實體配對模塊和修改類型判斷模塊,其中,所述數(shù)據(jù)預(yù)處理模塊,與所述數(shù)據(jù)識別模塊相連,用于對修改前的醫(yī)學影像報告和修改后的醫(yī)學影像報告做預(yù)處理,預(yù)處理后的數(shù)據(jù)以句子對的形式呈現(xiàn)修改前和修改后的報告數(shù)據(jù);所述數(shù)據(jù)識別模塊,分別與所述數(shù)據(jù)預(yù)處理模塊、所述命名實體配對模塊相連,用于識別所述句子對中的命名實體和命名實體類型;所述命名實體配對模塊,分別與所述數(shù)據(jù)識別模塊、所述修改類型判斷模塊相連,用于將每個句子對中的命名實體進行配對,輸出配對后的命名實體和命名實體類型;其中,未能匹配的命名實體,按照原有順序插入到序列中;所述修改類型判斷模塊,與所述命名實體配對模塊相連,用于以逗號或句號分隔符為一個單元,基于配對后的命名實體是否相同以及命名實體對應(yīng)的命名實體類型,按照預(yù)設(shè)的邏輯規(guī)則判斷每個單元的修改類型;其中,所述修改類型為漏診、誤診、定位錯誤、特征未識別、特征識別錯誤、診斷邏輯錯誤、文字語法和格式錯誤、診斷信心不一致、語言習慣不一致、程度判斷錯誤、臨床溝通問題。

14、優(yōu)選地,所述數(shù)據(jù)識別模塊包括:字典構(gòu)建單元和提取單元,其中,所述字典構(gòu)建單元,與所述提取單元相連,用于構(gòu)建命名實體字典,所述命名實體字典包括命名實體、命名實體類型和命名實體對應(yīng)的同義詞;其中,所述命名實體字典的類別為疾病種類、影像特征、定位、診斷信心、程度、臨床溝通;所述提取單元,與所述字典構(gòu)建單元相連,用于基于所述命名實體字典,通過最長字符匹配的方式從所述句子對中識別命名實體和命名實體類型。

15、優(yōu)選地,所述數(shù)據(jù)預(yù)處理模塊包括:句子邊界識別單元、語序調(diào)整單元和句子配對單元,其中,所述句子邊界識別單元,與所述語序調(diào)整單元相連,用于以句號或冒號作為句子邊界,將醫(yī)學影像報告文本拆成每個表達完整含義的短句;所述語序調(diào)整單元,分別與所述句子邊界識別單元和句子配對單元相連,用于將修改前后的每個短句進行對比,若移動該短句到對應(yīng)位置時,診斷前后的最長公共子序列長度比未移動該短句增加的數(shù)量占被移動短句的比例達到預(yù)設(shè)值后,則判斷需要移動該短句到對應(yīng)位置;所述句子配對單元,與所述語序調(diào)整單元相連,用于基于最長公共子序列,用包裝后的算法得到修改前后短句的對應(yīng)位置以及對應(yīng)關(guān)系,根據(jù)對應(yīng)位置以及對應(yīng)關(guān)系,生成四個移動的指針,分別對應(yīng)修改前短句的起點位置、終點位置,修改后短句的起點位置、終點位置,結(jié)合短句邊界位置,不斷更新四個指針,記錄匹配成對的短句,形成所述句子對。

16、優(yōu)選地,所述將每個句子對中的命名實體進行配對包括:定義修改前的短句對應(yīng)的命名實體數(shù)組為x,其數(shù)量為m,x[i].type表示x中的i個命名實體的實體類型,x[i].mention表示x中的i個命名實體的實體提及內(nèi)容;修改后的句子對應(yīng)的命名實體數(shù)組為y,其數(shù)量是n,y[i].type表示y中的i個命名實體的實體類型,y[i].mention表示y中的i個命名實體的實體提及內(nèi)容;定義一個(m+1)*(n+1)的二位數(shù)組dp記錄狀態(tài),dp[i][j]表示在命名實體類型相同才能配對的情況下,前i個修改前的命名實體和前j個修改后的句子命名實體匹配的最長公共子序列數(shù)量;lcs{x[i].mention,y[j].mention}表示第i個實體和第j個實體的最長公共子序列數(shù)量;定義的狀態(tài)轉(zhuǎn)移方程為:dp[0][j]=0;(0<=j(luò)<=n+1)

17、dp[i][0]=0;(0<=i<=m+1)

18、dp[i][j]=dp[i-1][j-1]+lcs{x[i].mention,y[j].mention};(x[i].type==y(tǒng)[i].type?anddp[i][j]>=max{dp[i-1][j],dp[i][j-1]})

19、dp[i][j]=max{dp[i][j-1],dp[i-1][j]};(x[i].type≠y[i].type?or?dp[i][j]<

20、max{dp[i-1][j],dp[i][j-1]})

21、根據(jù)狀態(tài)數(shù)組,回溯能夠匹配的命名實體,任意選擇一個組合即可。

22、優(yōu)選地,每個所述單元的修改類型包括多個時,該系統(tǒng)還包括修改類型確定模塊,與所述修改類型判斷模塊相連,用于將優(yōu)先級別最高的修改類型作為該單元的修改類型;其中,所述優(yōu)先級別排序為:誤診>漏診>特征識別錯誤>特征未識別>定位錯誤>診斷邏輯錯誤>臨床溝通問題>程度判斷錯誤>文字語法和格式錯誤>診斷信心不一致>語言習慣不一致。

23、本發(fā)明的技術(shù)效果:

24、1、本發(fā)明的方法對修改前的醫(yī)學影像報告和修改后的醫(yī)學影像報告做預(yù)處理,預(yù)處理后的數(shù)據(jù)以句子對的形式呈現(xiàn)修改前和修改后的報告數(shù)據(jù),將每個句子對中的命名實體進行配對,基于配對后的命名實體是否相同以及命名實體對應(yīng)的命名實體類型,按照預(yù)設(shè)的邏輯規(guī)則判斷每個單元的修改類型;本發(fā)明利用多種算法,能對影像報告診斷修改的類型進行精確的統(tǒng)計,相比于基于統(tǒng)計的文本分類方法,規(guī)則明確,可解釋性更強,人工成本較低,不需要標注大量有分類標簽的數(shù)據(jù),只需要維護相應(yīng)的分類詞典(包含同義詞)即可;受數(shù)據(jù)長尾問題困擾比較小,更新維護成本低;在已經(jīng)分析過的腰椎報告修改類型分類數(shù)據(jù)上,綜合準確性在95%以上,使得質(zhì)量評價和教學應(yīng)用變得可行;

25、2、本發(fā)明的方法對修改前后的影像報告進行預(yù)處理,對句子邊界進行識別,將報告文本拆成短的句子,語序調(diào)整、句子配對的處理,通過化繁為簡的思路,進行更細粒度的文本分析,降低任務(wù)的復(fù)雜性;其中,句子配對的處理,對準確性沒有依賴,只是通過字符級別的最長公共子序列即可完成,提高整體的魯棒性;

26、3、本發(fā)明的方法相比于大語言模型提示詞的文本分類方法,在特定領(lǐng)域的個性化程度高,準確率高,計算資源消耗非常少,速度更快;本方法可以作為報告書寫質(zhì)量評價的一個分支,大大降低了報告質(zhì)量評價的難度,可以為初級報告醫(yī)生提供有針對性的查漏補缺的建議,針對經(jīng)常出錯的地方有針對性的推送學習資料,對初級醫(yī)生的診斷水平的評價更加精確。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1