本發(fā)明屬于計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種中醫(yī)證素的辨證方法及裝置。
背景技術(shù):
在中醫(yī)學(xué)中,證是對(duì)疾病中機(jī)體整體反應(yīng)的階段性病理本質(zhì)的概括,患者的癥狀、體征,如頭痛、目眩、尿黃以及畏寒等,被稱(chēng)為證候,證候的病位和病性被稱(chēng)為證素,證素主要有心、肝、脾等病位和血虛、津虧、血於等病性,中醫(yī)的辨證即對(duì)證候進(jìn)行分析,以確定證候?qū)?yīng)的證素,再將證素組合成證名,例如痰濕證素和血於證素可以組合成痰瘀互結(jié)證,痰瘀互結(jié)即證名中的一種。
自證素辨證提出以來(lái),不少研究人員以臨床數(shù)據(jù)為基礎(chǔ),通過(guò)模糊數(shù)學(xué)、統(tǒng)計(jì)分析和神經(jīng)網(wǎng)絡(luò)等方法在證素分類(lèi)上進(jìn)行研究,然而由于所用學(xué)習(xí)方法自身的缺點(diǎn)和局限性,例如難以處理高維數(shù)據(jù)、需要特征選擇、泛化能力弱、缺乏標(biāo)記關(guān)聯(lián)性,無(wú)法得到較好的辨證效率和辨證效果。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種中醫(yī)證素的辨證方法及裝置,旨在解決由于現(xiàn)有技術(shù)中中醫(yī)證素辨證方法難以處理高維數(shù)據(jù)、需要特征選擇、泛化能力弱、證素之間缺乏關(guān)聯(lián)性,導(dǎo)致證素辨證的效率和效果不佳的問(wèn)題。
一方面,本發(fā)明提供了一種中醫(yī)證素的辨證方法,所述方法包括下述步驟:
接收待分類(lèi)的證候信息,所述證候信息包括多個(gè)證候;
通過(guò)第一數(shù)目個(gè)訓(xùn)練好的證候分類(lèi)器對(duì)所述證候信息進(jìn)行分類(lèi),獲取所述第一數(shù)目個(gè)分類(lèi)結(jié)果,以對(duì)所述證候信息是否屬于預(yù)設(shè)證素信息中的證素進(jìn)行初次預(yù)測(cè),所述證候分類(lèi)器為以隨機(jī)森林為基分類(lèi)器的分類(lèi)器鏈模型;
根據(jù)所述第一數(shù)目個(gè)分類(lèi)結(jié)果和預(yù)設(shè)的置信度閾值,對(duì)所述證候信息是否屬于所述證素信息中的證素進(jìn)行二次預(yù)測(cè),并根據(jù)所述二次預(yù)測(cè)的結(jié)果,確定所述證候信息所屬的所有證素;
根據(jù)所述證候信息所屬的所有證素,合成并輸出所述證候信息對(duì)應(yīng)的證名。
另一方面,本發(fā)明提供了一種中醫(yī)證素的辨證裝置,所述裝置包括:
證候信息接收模塊,用于接收待分類(lèi)的證候信息,所述證候信息包括的證候;
初次預(yù)測(cè)模塊,用于通過(guò)第一數(shù)目個(gè)訓(xùn)練好的證候分類(lèi)器對(duì)所述證候信息進(jìn)行分類(lèi),獲取所述第一數(shù)目個(gè)分類(lèi)結(jié)果,以對(duì)所述證候信息是否屬于預(yù)設(shè)證素信息中的證素進(jìn)行初次預(yù)測(cè),所述證候分類(lèi)器為以隨機(jī)森林為基分類(lèi)器的分類(lèi)器鏈模型;
二次預(yù)測(cè)模塊,用于根據(jù)所述第一數(shù)目個(gè)分類(lèi)結(jié)果和預(yù)設(shè)的置信度閾值,對(duì)所述證候信息是否屬于所述證素信息中的證素進(jìn)行二次預(yù)測(cè),并根據(jù)所述二次預(yù)測(cè)的結(jié)果,確定所述證候信息所屬的所有證素;以及
證名合成模塊,用于根據(jù)所述證候信息所屬的所有證素,合成并輸出所述證候信息對(duì)應(yīng)的證名。
本發(fā)明接收待分類(lèi)的證候信息,通過(guò)第一數(shù)目個(gè)訓(xùn)練好的證候分類(lèi)器對(duì)證候信息進(jìn)行分類(lèi),獲取第一數(shù)目個(gè)分類(lèi)結(jié)果,以對(duì)證候信息是否屬于預(yù)設(shè)證素信息中的證素進(jìn)行初次預(yù)測(cè),根據(jù)第一數(shù)目個(gè)分類(lèi)結(jié)果和預(yù)設(shè)的置信度閾值,對(duì)證候信息是否屬于證素信息中的證素進(jìn)行二次預(yù)測(cè),并根據(jù)二次預(yù)測(cè)的結(jié)果,確定證候信息所屬的所有證素,將所述所有證素合成為證候信息對(duì)應(yīng)的證名,證候分類(lèi)器為以隨機(jī)森林為基分類(lèi)器的分類(lèi)器鏈模型,從而通過(guò)以隨機(jī)森林為基分類(lèi)器的分類(lèi)器鏈模型對(duì)證候信息進(jìn)行一次預(yù)測(cè)、以及后續(xù)的二次預(yù)測(cè),提高了證素辨證(多標(biāo)簽分類(lèi))中高維數(shù)據(jù)處理能力、泛化能力、證素間的關(guān)聯(lián)性,由于隨機(jī)森林自身帶有特征選擇功能,避免在證素辨證過(guò)程中對(duì)證候進(jìn)行特征選擇,進(jìn)而有效地提高了證素分辨過(guò)程的辨證效率和辨證效果。
附圖說(shuō)明
圖1是本發(fā)明實(shí)施例一提供的中醫(yī)證素的辨證方法的實(shí)現(xiàn)流程圖;
圖2是本發(fā)明實(shí)施例一提供的中醫(yī)證素的辨證方法中對(duì)證候信息是否屬于證素信息中的證素進(jìn)行二次預(yù)測(cè)的表格;
圖3是本發(fā)明實(shí)施例一提供的中醫(yī)證素的辨證方法中預(yù)設(shè)的證名與證素的對(duì)應(yīng)表;
圖4是本發(fā)明實(shí)施例二提供的中醫(yī)證素的辨證裝置的結(jié)構(gòu)示意圖;以及
圖5是本發(fā)明實(shí)施例二提供的中醫(yī)證素的辨證裝置的優(yōu)選結(jié)構(gòu)示意圖。
具體實(shí)施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
以下結(jié)合具體實(shí)施例對(duì)本發(fā)明的具體實(shí)現(xiàn)進(jìn)行詳細(xì)描述:
實(shí)施例一:
圖1示出了本發(fā)明實(shí)施例一提供的中醫(yī)證素的辨證方法的實(shí)現(xiàn)流程,為了便于說(shuō)明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分,詳述如下:
在步驟s101中,接收待分類(lèi)的證候信息。
本發(fā)明實(shí)施例適用于對(duì)中醫(yī)證素進(jìn)行辨證的系統(tǒng)或平臺(tái),該系統(tǒng)或平臺(tái)對(duì)證候信息進(jìn)行分類(lèi),確定證候信息對(duì)應(yīng)的(或所屬的)證素,再將這些證素合成為證名,即得到證候?qū)?yīng)的證名。
在本發(fā)明實(shí)施例中,接收待分類(lèi)的證候信息,對(duì)該證候信息進(jìn)行分類(lèi),以確定該證候信息對(duì)應(yīng)的所有證素。證候?yàn)榧膊∵^(guò)程中一定階段的病位、病因、病性、病勢(shì)及機(jī)體抗病能力強(qiáng)弱等本質(zhì)有機(jī)聯(lián)系的反應(yīng)狀態(tài),一份病例中包括相應(yīng)的證候信息,其中證候信息中可存在多個(gè)反應(yīng)狀態(tài),即多個(gè)證候。例如,風(fēng)寒表實(shí)證的證候信息為“發(fā)熱惡寒,頭痛,身痛,無(wú)汗,脈浮緊,舌苔薄白”,風(fēng)寒表實(shí)證為該證候信息對(duì)應(yīng)的證素。
在步驟s102中,通過(guò)第一數(shù)目個(gè)訓(xùn)練好的證候分類(lèi)器對(duì)證候信息進(jìn)行分類(lèi),獲取第一數(shù)目個(gè)分類(lèi)結(jié)果,以對(duì)證候信息是否屬于預(yù)設(shè)證素信息中的證素進(jìn)行初次預(yù)測(cè)。
在本發(fā)明實(shí)施例中,預(yù)先訓(xùn)練好的第一數(shù)目個(gè)證候分類(lèi)器,該證候分類(lèi)器為以隨機(jī)森林為基分類(lèi)器的分類(lèi)器鏈模型,每個(gè)證候分類(lèi)器都可得到一個(gè)分類(lèi)結(jié)果,分類(lèi)結(jié)果為證候信息與證素信息中每個(gè)證素的對(duì)應(yīng)關(guān)系,即對(duì)證候信息是否屬于證素信息中證素的初次預(yù)測(cè),例如,第i個(gè)證候分類(lèi)器分類(lèi)結(jié)果為
在本發(fā)明實(shí)施例中,每個(gè)證候分類(lèi)器中包括第二數(shù)目個(gè)隨機(jī)森林,第二數(shù)目與證素信息中證素的數(shù)目一致,每個(gè)隨機(jī)森林被預(yù)先訓(xùn)練來(lái)確定證候信息是否屬于對(duì)應(yīng)的證素,例如第i個(gè)隨機(jī)森林可確定證候信息是否屬于證素信息中第i個(gè)證素。因此,通過(guò)證候分類(lèi)器對(duì)證候信息進(jìn)行分類(lèi)時(shí),由第二數(shù)目個(gè)隨機(jī)森林對(duì)證候信息進(jìn)行分類(lèi),當(dāng)當(dāng)前的隨機(jī)森林確定證候信息屬于對(duì)應(yīng)的證素時(shí),將該對(duì)應(yīng)的證素設(shè)置為證候加入證候信息中,再由下一個(gè)隨機(jī)森林對(duì)加入新的證候的證候信息進(jìn)行分類(lèi),從而實(shí)現(xiàn)了證素間的關(guān)聯(lián)性。
在本發(fā)明實(shí)施例中,可通過(guò)下述步驟訓(xùn)練出第一數(shù)目個(gè)證候分類(lèi)器中的每個(gè)證候分類(lèi)器:
(1)從訓(xùn)練數(shù)據(jù)集中隨機(jī)與訓(xùn)練數(shù)據(jù)集大小相同的樣本集合。
具體地,訓(xùn)練數(shù)據(jù)集中包括多個(gè)預(yù)先采集的病例信息,一個(gè)病例信息對(duì)應(yīng)一個(gè)樣本,且病例信息中包括證候信息以及證候信息對(duì)應(yīng)的證素。
(2)根據(jù)樣本集合,訓(xùn)練得到以隨機(jī)森林為基分類(lèi)器的分類(lèi)器鏈模型。
具體地,根據(jù)預(yù)設(shè)的第三數(shù)目,在樣本集合中隨機(jī)選取第三數(shù)目個(gè)子樣本集合,該子樣本集合與樣本集合的大小相同。每個(gè)子樣本集合可用來(lái)建立一棵決策樹(shù),因此得到第三數(shù)目棵決策樹(shù),由所有的決策樹(shù)組成一個(gè)隨機(jī)森林,并通過(guò)該隨機(jī)森林對(duì)樣本集合進(jìn)行分類(lèi)。
優(yōu)選地,在訓(xùn)練證候分類(lèi)器時(shí),通過(guò)調(diào)整證候分類(lèi)器的數(shù)目(第一數(shù)目)與隨機(jī)森林中決策樹(shù)的數(shù)目(第二數(shù)目),能夠得到較好的證素分辨效率和效果。
在步驟s103中,根據(jù)第一數(shù)目個(gè)分類(lèi)結(jié)果和預(yù)設(shè)的置信度閾值,對(duì)證候信息是否屬于證素信息中的證素進(jìn)行二次預(yù)測(cè),并根據(jù)二次預(yù)測(cè)的結(jié)果,確定證候信息所屬的所有證素。
在本發(fā)明實(shí)施例中,計(jì)算證候信息對(duì)證素信息中每個(gè)證素的置信度向量,當(dāng)置信度向量超過(guò)預(yù)設(shè)的置信度閾值時(shí),確定證候信息屬于該置信度向量對(duì)應(yīng)的證素。具體地,置信度向量的計(jì)算公式為:
作為示例地,二次預(yù)測(cè)過(guò)程如圖2中的表格所示,yi為證素信息中第i個(gè)證素,
在步驟s104中,根據(jù)證候信息所屬的所有證素,合成并輸出證候信息對(duì)應(yīng)的證名。
在本發(fā)明實(shí)施例中,預(yù)先設(shè)置了證名與證素的對(duì)應(yīng)表,在該對(duì)應(yīng)表中查找包含所有證素的證名,即可找到證候信息對(duì)應(yīng)的證名。例如,圖3示出了證名與證素的對(duì)應(yīng)表。
在本發(fā)明實(shí)施例中,通過(guò)訓(xùn)練好的證候分類(lèi)器(以隨機(jī)森林為基分類(lèi)器的分類(lèi)器鏈模型)對(duì)證候信息進(jìn)行分類(lèi),以對(duì)證候信息是否屬于證素信息中的證素進(jìn)行初步預(yù)測(cè),并根據(jù)分類(lèi)結(jié)果和預(yù)設(shè)的置信度閾值,對(duì)證候信息是否屬于證素信息中的證素進(jìn)行二次預(yù)測(cè),得到證候信息所屬的所有證素,由這些證素組合得到證候信息對(duì)應(yīng)的證名,從而實(shí)現(xiàn)證候信息的證素辨證,通過(guò)隨機(jī)森林和分類(lèi)器鏈的結(jié)合,有效地提高了證素辨證中高位數(shù)據(jù)處理能力、泛化能力以及證素間的關(guān)聯(lián)性,同時(shí)在證素辨證過(guò)程中不需對(duì)證候進(jìn)行特征選擇,有效地提高了證素辨證效率和辨證效果。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,所述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,所述的存儲(chǔ)介質(zhì),如rom/ram、磁盤(pán)、光盤(pán)等。
實(shí)施例二:
圖4示出了本發(fā)明實(shí)施例四提供的中醫(yī)證素的辨證裝置的結(jié)構(gòu),為了便于說(shuō)明,僅示出了與本發(fā)明實(shí)施例相關(guān)的部分,其中包括:
證候信息接收模塊41,用于接收待分類(lèi)的證候信息;
初次預(yù)測(cè)模塊42,用于通過(guò)第一數(shù)目個(gè)訓(xùn)練好的證候分類(lèi)器對(duì)證候信息進(jìn)行分類(lèi),獲取第一數(shù)目個(gè)分類(lèi)結(jié)果,以對(duì)證候信息是否屬于預(yù)設(shè)證素信息中的證素進(jìn)行初次預(yù)測(cè);
二次預(yù)測(cè)模塊43,用于根據(jù)第一數(shù)目個(gè)分類(lèi)結(jié)果和預(yù)設(shè)的置信度閾值,對(duì)證候信息是否屬于證素信息中的證素進(jìn)行二次預(yù)測(cè),并根據(jù)二次預(yù)測(cè)的結(jié)果,確定證候信息所屬的所有證素;以及
證名合成模塊44,用于根據(jù)證候信息所屬的所有證素,合成并輸出證候信息對(duì)應(yīng)的證名。
優(yōu)選地,如圖5所示,初次預(yù)測(cè)模塊42包括隨機(jī)森林分類(lèi)模塊521,其中:
隨機(jī)森林分類(lèi)模塊521,用于在第一數(shù)目個(gè)證候分類(lèi)器中依次獲取對(duì)證候信息進(jìn)行分類(lèi)的當(dāng)前證候分類(lèi)器,并通過(guò)當(dāng)前證候分類(lèi)器中第二數(shù)目個(gè)隨機(jī)森林確定證候信息是否屬于證素信息中相應(yīng)的證素。
優(yōu)選地,二次預(yù)測(cè)模塊43包括置信度向量計(jì)算模塊531和閾值比較模塊532,其中:
置信度向量計(jì)算模塊531,用于根據(jù)第一數(shù)目個(gè)分類(lèi)結(jié)果,計(jì)算證候信息對(duì)應(yīng)證素信息中每個(gè)證素的置信度向量,置信度向量的計(jì)算公式為:
閾值比較模塊532,用于將所有置信度向量與置信度閾值進(jìn)行比較,當(dāng)置信度向量超過(guò)置信度閾值時(shí),確定證候信息屬于置信度向量對(duì)應(yīng)的證素。
優(yōu)選地,證名合成模塊44包括證名合成子模塊541,其中:
證名合成子模塊541,用于根據(jù)預(yù)設(shè)的證素證名對(duì)應(yīng)表,確定對(duì)證候信息所屬的所有證素進(jìn)行合成后對(duì)應(yīng)的證名,并輸出證名。
優(yōu)選地,隨機(jī)森林分類(lèi)模塊521包括隨機(jī)森林分類(lèi)鏈模塊,其中:
隨機(jī)森林分類(lèi)鏈模塊,用于從第二數(shù)目個(gè)隨機(jī)森林中依次獲取對(duì)證候信息進(jìn)行分類(lèi)的當(dāng)前隨機(jī)森林,通過(guò)當(dāng)前隨機(jī)森林確定證候信息是否屬于證素信息中相應(yīng)的證素,當(dāng)證候信息屬于相應(yīng)的證素時(shí),將相應(yīng)的證素設(shè)置為證候信息中的證候。
在本發(fā)明實(shí)施例中,通過(guò)訓(xùn)練好的證候分類(lèi)器(以隨機(jī)森林為基分類(lèi)器的分類(lèi)器鏈模型)對(duì)證候信息進(jìn)行分類(lèi),以對(duì)證候信息是否屬于證素信息中的證素進(jìn)行初步預(yù)測(cè),并根據(jù)分類(lèi)結(jié)果和預(yù)設(shè)的置信度閾值,對(duì)證候信息是否屬于證素信息中的證素進(jìn)行二次預(yù)測(cè),得到證候信息所屬的所有證素,由這些證素組合得到證候信息對(duì)應(yīng)的證名,從而實(shí)現(xiàn)證候信息的證素辨證,通過(guò)隨機(jī)森林和分類(lèi)器鏈的結(jié)合,有效地提高了證素辨證中高位數(shù)據(jù)處理能力、泛化能力以及證素間的關(guān)聯(lián)性,同時(shí)在證素辨證過(guò)程中不需對(duì)證候進(jìn)行特征選擇,有效地提高了證素辨證效率和辨證效果。
在本發(fā)明實(shí)施例中,中醫(yī)證素的辨證裝置的各模塊可由相應(yīng)的硬件或軟件模塊實(shí)現(xiàn),各模塊可以為獨(dú)立的軟、硬件模塊,也可以集成為一個(gè)軟、硬件模塊,在此不用以限制本發(fā)明,各模塊的具體實(shí)施方式可參考前述實(shí)施例一中各步驟的描述,在此不再贅述。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。