技術(shù)總結(jié)
本發(fā)明提供了一種面向多數(shù)據(jù)源的醫(yī)療機(jī)構(gòu)組織類實體識別方法及裝置,涉及醫(yī)療實體識別技術(shù)領(lǐng)域。方法包括:獲取原始數(shù)據(jù)中的待處理語句;將待處理語句進(jìn)行單字切分,確定每個文字;根據(jù)預(yù)先訓(xùn)練完成的CRF訓(xùn)練模型,確定待處理語句中的每個文字在待處理語句中的實體標(biāo)記,并確定待處理語句的實體標(biāo)記序列;根據(jù)待處理語句的實體標(biāo)記序列,確定待處理語句的第一組候選實體;根據(jù)預(yù)先設(shè)置的醫(yī)療機(jī)構(gòu)組織類術(shù)語切分策略,對待處理語句進(jìn)行術(shù)語切分,確定第二組候選實體;對各候選實體進(jìn)行篩選,分別形成第一組醫(yī)療機(jī)構(gòu)組織類候選實體和第二組醫(yī)療機(jī)構(gòu)組織類候選實體;根據(jù)預(yù)先設(shè)置的判斷策略確定醫(yī)療機(jī)構(gòu)組織類實體結(jié)果。
技術(shù)研發(fā)人員:關(guān)毅;李雪莉;徐國春
受保護(hù)的技術(shù)使用者:黑龍江特士信息技術(shù)有限公司;哈爾濱工業(yè)大學(xué)
文檔號碼:201710101839
技術(shù)研發(fā)日:2017.02.24
技術(shù)公布日:2017.06.13