本發(fā)明涉及醫(yī)療數(shù)據(jù)錄入,具體為基于圖像識別算法的醫(yī)學(xué)檢驗數(shù)據(jù)錄入方法。
背景技術(shù):
1、醫(yī)學(xué)檢驗,也稱為醫(yī)學(xué)檢驗或臨床檢驗,是醫(yī)學(xué)領(lǐng)域中不可或缺的一部分,它主要通過對人體血液、體液、排泄物及組織細(xì)胞等標(biāo)本進(jìn)行生物學(xué)、微生物學(xué)、免疫學(xué)、化學(xué)、血液學(xué)、生化、遺傳學(xué)及細(xì)胞學(xué)等方面的檢驗,為疾病的預(yù)防、診斷、治療及預(yù)后評估提供重要依據(jù)。通過準(zhǔn)確的檢驗結(jié)果,醫(yī)生能夠更準(zhǔn)確地了解患者的病情,制定更合理的治療方案,從而提高治療效果和患者的生活質(zhì)量。同時,醫(yī)學(xué)檢驗也為疾病的預(yù)防和控制提供了重要依據(jù)。
2、在申請公布號為cn115171837a的中國發(fā)明專利中,公開了一種檢查報告的影像數(shù)據(jù)錄入方法和裝置,其中方法包括:在檢查報告錄入過程中,接收用戶的影像數(shù)據(jù)區(qū)域選擇指令;所述影像數(shù)據(jù)區(qū)域選擇指令用于對影像切面圖中待讀取的目標(biāo)影像數(shù)據(jù)所在區(qū)域進(jìn)行設(shè)置;對所述影像數(shù)據(jù)區(qū)域選擇指令指示的所述區(qū)域進(jìn)行剪裁;對所述剪裁得到的圖像進(jìn)行文本識別處理,得到所述目標(biāo)影像數(shù)據(jù);在檢查報告編輯界面中,將所述目標(biāo)影像數(shù)據(jù),填充至當(dāng)前檢查報告模板中的相應(yīng)數(shù)據(jù)單元。采用本技術(shù),可以有效提高醫(yī)學(xué)檢查報告生成時影像數(shù)據(jù)錄入的便捷性、效率和準(zhǔn)確性。
3、為了提高信息傳遞效率,改善患者醫(yī)療體驗、加快患者的信息錄入,在手動輸入之外,還通常會借助圖像識別技術(shù),使用圖像識別的錄入方法是指利用圖像識別技術(shù),將圖片中的信息自動識別并錄入到計算機(jī)系統(tǒng)中,這種方法可以大大減少人工錄入的工作量,提高數(shù)據(jù)錄入的效率和準(zhǔn)確性。但是在疫情集中爆發(fā)期或者甲流傳播期,醫(yī)院的患者眾多,醫(yī)生在診斷前后會有大量的醫(yī)療檢驗檢驗數(shù)據(jù)需要向系統(tǒng)中錄入,例如各種檢驗數(shù)據(jù)、圖像表格等,而一旦數(shù)據(jù)錄入的工作量過大,就難免會導(dǎo)致將信息錄錯,降低工作效率,產(chǎn)生不必要的醫(yī)患風(fēng)險。
4、為此,本發(fā)明提供了基于圖像識別算法的醫(yī)學(xué)檢驗數(shù)據(jù)錄入方法。
技術(shù)實現(xiàn)思路
1、(一)解決的技術(shù)問題
2、針對現(xiàn)有技術(shù)的不足,本發(fā)明提供了基于圖像識別算法的醫(yī)學(xué)檢驗數(shù)據(jù)錄入方法,通過將若干個新區(qū)域圖像拼接為修正圖像,以修正圖像庫中的修正圖像作為輸入,使用訓(xùn)練好的圖像標(biāo)注模型生成對應(yīng)的檢驗描述,并使用訓(xùn)練后的lda主題提取模型提取檢驗描述的主題詞;由錄入優(yōu)先數(shù)據(jù)集合生成優(yōu)先級系數(shù),依據(jù)優(yōu)先級系數(shù)依次錄入數(shù)據(jù)描述、影像描述及圖表描述;依據(jù)錯誤信息建立錄入錯誤數(shù)據(jù)集合,由錄入錯誤數(shù)據(jù)集合生成錯誤系數(shù),當(dāng)錯誤系數(shù)大于閾值時,向外部發(fā)出提示信息。在使用圖像識別的基礎(chǔ)上有序地進(jìn)行信息錄入,提高信息錄入的效率和可靠性,從而解決了背景技術(shù)提出的技術(shù)問題。
3、(二)技術(shù)方案
4、為實現(xiàn)以上目的,本發(fā)明通過以下技術(shù)方案予以實現(xiàn):基于圖像識別算法的醫(yī)學(xué)檢驗數(shù)據(jù)錄入方法,包括,核驗管理人員身份信息后,重復(fù)采集記載有醫(yī)學(xué)檢驗數(shù)據(jù)的圖像信息,依據(jù)采集圖像的類別分別構(gòu)建采集圖像數(shù)據(jù)集合;
5、從采集圖像數(shù)據(jù)集中獲取區(qū)域圖像并進(jìn)行分割,對覆蓋區(qū)域相同的不同子區(qū)塊進(jìn)行質(zhì)量分析,將其中高質(zhì)量子區(qū)塊標(biāo)記為待選子區(qū)塊,將若干個待選子區(qū)塊拼接形成新區(qū)域圖像,匯總后建立新區(qū)域圖像集合;
6、將若干個新區(qū)域圖像拼接為修正圖像,以修正圖像庫中的修正圖像作為輸入,使用訓(xùn)練好的圖像標(biāo)注模型生成對應(yīng)的檢驗描述,并使用訓(xùn)練后的lda主題提取模型提取檢驗描述的主題詞;其中,檢驗描述包括數(shù)據(jù)描述、影像描述及圖表描述;
7、分別對數(shù)據(jù)描述、影像描述及圖表描述的信息量分析并建立錄入優(yōu)先數(shù)據(jù)集合;由錄入優(yōu)先數(shù)據(jù)集合生成優(yōu)先級系數(shù)yxj,依據(jù)優(yōu)先級系數(shù)yxj依次錄入數(shù)據(jù)描述、影像描述及圖表描述;
8、對錄入信息的語法和結(jié)構(gòu)進(jìn)行分析,若存在錯誤標(biāo)注,依據(jù)錯誤信息建立錄入錯誤數(shù)據(jù)集合,由錄入錯誤數(shù)據(jù)集合生成錯誤系數(shù)cxs,當(dāng)錯誤系數(shù)cxs大于閾值時,向外部發(fā)出提示信息。
9、進(jìn)一步的,由圖像采集裝置,例如說相機(jī)或者掃描儀,對患者的醫(yī)學(xué)檢驗信息進(jìn)行采集,包括:記載有醫(yī)學(xué)檢驗數(shù)據(jù)的醫(yī)學(xué)檢驗單、可視化圖表及檢驗影像信息;
10、依次對醫(yī)學(xué)檢驗信息進(jìn)行初步圖像采集,輸出整體圖像;確定最小采樣單位并依據(jù)醫(yī)學(xué)檢驗信息與最小采樣單位的倍數(shù)關(guān)系確定圖像采集次數(shù);在圖像采集時,使相鄰的采樣圖像存在部分重合,獲取的圖像均記錄為區(qū)域圖像。
11、進(jìn)一步的,對醫(yī)學(xué)檢驗信息進(jìn)行一次或者多次圖像采集,獲取到區(qū)域圖像信息并分別進(jìn)行歸類,并依據(jù)采集的批次進(jìn)行標(biāo)記和排序;對同一批次采集,位置相鄰且存在重合的區(qū)域進(jìn)行標(biāo)記,對不同批次且指代同一區(qū)域的區(qū)域圖像進(jìn)行編號,依據(jù)采集區(qū)域圖像的類別,分別構(gòu)建采集圖像數(shù)據(jù)集合。
12、進(jìn)一步的,從采集圖像數(shù)據(jù)集中獲取采集到的區(qū)域圖像,將不同批次的區(qū)域圖像等面積地分割為若干個子區(qū)塊,對若干個子區(qū)塊進(jìn)行標(biāo)記和編號,對各個子區(qū)塊進(jìn)行圖像質(zhì)量分析,分別采集子區(qū)塊的亮度、對比度及分辨率,匯總形成圖像質(zhì)量數(shù)據(jù)集合;
13、獲取圖像質(zhì)量數(shù)據(jù)集合中的數(shù)據(jù),對各個子區(qū)塊的亮度ld、對比度db及分辨率fb進(jìn)行無量綱處理后,參考如下公式關(guān)聯(lián)形成質(zhì)量評價值qts:
14、
15、參數(shù)意義為:亮度因子ρ1,0.40≤ρ1≤0.78,對比度因子ρ2,0.26≤ρ2≤0.86,分辨率因子ρ3,0.36≤ρ3≤0.86,c1為常數(shù)修正系數(shù)。
16、進(jìn)一步的,對覆蓋區(qū)域相同的不同子區(qū)塊的質(zhì)量評價值qts進(jìn)行排序,并確定出其中質(zhì)量評價值qts最大的子區(qū)塊并標(biāo)記為待選子區(qū)塊;對若干個待選子區(qū)塊拼接形成新區(qū)域圖像,將同一類別的新區(qū)域圖像匯總后建立新區(qū)域圖像集合;在確定待選子區(qū)塊后,完成拼接并形成新區(qū)域圖像,對原圖像進(jìn)行修正,提高圖像質(zhì)量。
17、進(jìn)一步的,在相鄰兩個新區(qū)域圖像存在重合時,將兩個新區(qū)域圖像中質(zhì)量評價值qts較低的重合區(qū)域剪除,依據(jù)醫(yī)學(xué)檢驗信息整體圖像作參考,在去除重疊部分后,將若干個新區(qū)域圖像拼接為修正圖像,匯總并分別構(gòu)建修正圖像庫。
18、進(jìn)一步的,以修正圖像庫中的修正圖像作為輸入,提取其特征向量,使用訓(xùn)練好的圖像標(biāo)注模型生成對應(yīng)的自然語言描述,輸出檢驗描述,包括數(shù)據(jù)描述、影像描述及圖表描述;
19、使用lda主題提取模型提取數(shù)據(jù)描述、影像描述及圖表描述的主題詞;并依據(jù)訓(xùn)練后的相似度模型判斷數(shù)據(jù)描述、影像描述及圖表描述的主題詞的相似性,輸出主題相似度;在主題相似度低于相似度閾值時,向外部發(fā)出提醒。
20、進(jìn)一步的,分別獲取數(shù)據(jù)描述、影像描述及圖表描述的包含內(nèi)容的字節(jié)量,主題詞出現(xiàn)次數(shù),建立錄入優(yōu)先數(shù)據(jù)集合;由錄入優(yōu)先數(shù)據(jù)集合生成優(yōu)先級系數(shù)yxj,其中,對獲取主題次數(shù)zt及字節(jié)量zj后做無量綱處理,依照如下方式:
21、
22、參數(shù)的意義為:0≤α≤1,0≤β≤1,c2為常數(shù)修正系數(shù);
23、分別獲取數(shù)據(jù)描述、影像描述及圖表描述的優(yōu)先級系數(shù)yxj,并依據(jù)優(yōu)先級系數(shù)yxj的值的大小進(jìn)行排序獲取優(yōu)先級順序,依照優(yōu)先級順序錄入數(shù)據(jù)描述、影像描述及圖表描述,完成醫(yī)學(xué)檢驗數(shù)據(jù)的錄入。
24、進(jìn)一步的,使用自然語言處理算法訓(xùn)練后的結(jié)構(gòu)分析模型,對錄入信息的語法和結(jié)構(gòu)進(jìn)行分析,輸出分析結(jié)果;若存在錯誤,由結(jié)構(gòu)分析模型對錄入信息進(jìn)行標(biāo)注;
25、依據(jù)對錯誤的標(biāo)注判斷產(chǎn)生的錯誤的字節(jié)長度,以字節(jié)長度為錯誤的面積mj,檢索出與該處錯誤距離最近的主題詞,將主題詞與該錯誤間的距離輸出,形成錯誤的距離cl,并且確定該主題詞的出現(xiàn)頻次pc,將面積mj、頻次pc及距離cl匯總后形成建立錄入錯誤數(shù)據(jù)集合。
26、進(jìn)一步的,由錄入錯誤數(shù)據(jù)集合生成錯誤系數(shù)cxs,其中,將面積mj、頻次pc及距離cl無量綱處理后,依照如下公式:
27、
28、其中,0.25≤δ≤0.89,0.21≤θ≤0.98,且δ+θ=1,δ、θ為權(quán)重,其具體值由用戶調(diào)整設(shè)置,r為面積mj與頻次pc之間的相關(guān)性系數(shù)。
29、優(yōu)選的,
30、(三)有益效果
31、本發(fā)明提供了基于圖像識別算法的醫(yī)學(xué)檢驗數(shù)據(jù)錄入方法,具備以下有益效果:
32、1、對圖像采集人員的身份進(jìn)行核驗,維持信息錄入的安全性;通過展開重復(fù)的區(qū)域采樣,在存在若干個采樣時,可以使用圖像質(zhì)量進(jìn)行篩選和替換,對圖像質(zhì)量形成保障,在識別信息和信息錄入時,保障信息錄入的安全性。
33、2、依據(jù)形成的質(zhì)量評價值qts,對子區(qū)塊的圖像質(zhì)量形成評價,依據(jù)評價的結(jié)果能夠從若干個子區(qū)塊中選擇出圖像質(zhì)量最好的部分,以對質(zhì)量不佳的部分進(jìn)行替換。
34、3、依據(jù)質(zhì)量評價值qts篩選出待選子區(qū)塊,將若干待選子區(qū)塊拼接后會形成新區(qū)域圖像,完成區(qū)域圖像修正和重組,而新區(qū)域圖像相對于原區(qū)域圖像的圖像質(zhì)量更好,在進(jìn)行圖像識別時識別的效果更好,保證了文字信息識別的準(zhǔn)確性;在當(dāng)前某個子區(qū)塊的圖像質(zhì)量難以滿足當(dāng)前的圖像識別需求時,也能夠?qū)ζ溥M(jìn)行替換,或者,能用于重復(fù)識別以取得最佳的識別效果,保障識別及信息錄入的完成。
35、4、在將若干個新區(qū)域圖像拼接為修正圖像的基礎(chǔ)上,對信息提取的準(zhǔn)確度進(jìn)行了保障,若信息提取不夠準(zhǔn)確,還能夠?qū)ψ訁^(qū)塊進(jìn)行替換,重復(fù)識別以保障識別效果;使用主題相似度能夠?qū)?shù)據(jù)描述、影像描述及圖表描述間的對應(yīng)性進(jìn)行判斷,在患者醫(yī)學(xué)檢驗信息錄入的準(zhǔn)確性的基礎(chǔ)上,進(jìn)一步保障醫(yī)學(xué)檢驗及相關(guān)數(shù)據(jù)錄入的準(zhǔn)確性。
36、5、依據(jù)形成的優(yōu)先級系數(shù)yxj對患者的數(shù)據(jù)描述、影像描述及圖表描述的輸入順序形成限定,在使用圖像識別的基礎(chǔ)上有序地進(jìn)行信息錄入,在當(dāng)前較忙且患者較多時,可以提高信息錄入的效率和可靠性。
37、6、在核對了特定指示語對管理員的身份進(jìn)行確認(rèn)后,使用結(jié)構(gòu)分析模型繼續(xù)對完成錄入的醫(yī)學(xué)檢驗信息進(jìn)行核驗,若存在錯誤,對需要進(jìn)行修改的部分進(jìn)行標(biāo)記,必要時進(jìn)行修改,從而在語義上保證信息錄入的準(zhǔn)確性,最終使錄入信息與實際的醫(yī)學(xué)檢驗信息相對應(yīng)。