本發(fā)明涉及一種標準化的臨床試驗質(zhì)量評估方法,屬于臨床試驗質(zhì)控。
背景技術(shù):
1、目前,我國已備案的藥物臨床試驗機構(gòu)已達1594家,由于地域發(fā)展的差異,醫(yī)院規(guī)模、實踐經(jīng)驗等客觀因素的不同,臨床試驗機構(gòu)間在試驗質(zhì)量管理方面存在著巨大的差異;現(xiàn)有技術(shù)中,缺乏規(guī)范可行的、可推廣復(fù)制的質(zhì)量評價標準。而現(xiàn)有的一些質(zhì)量管理評估方式,往往占用了大量人力物力,又不能很好的發(fā)現(xiàn)風(fēng)險,且不能防范風(fēng)險轉(zhuǎn)化為問題,嚴重制約了我國創(chuàng)新藥研發(fā)的進程。
2、因此,本技術(shù)領(lǐng)域亟需一種標準化的臨床試驗質(zhì)量評估方法,通過該方法可以獲得一套質(zhì)控發(fā)現(xiàn)分類規(guī)則,且通過這一方法可使已有的質(zhì)控發(fā)現(xiàn)分類規(guī)則、質(zhì)量標準持續(xù)性迭代升級,最終形成一套可被業(yè)內(nèi)廣泛接受,可達成共識的臨床試驗質(zhì)量評估標準,以促進我國生物醫(yī)藥產(chǎn)業(yè)高質(zhì)量發(fā)展。
技術(shù)實現(xiàn)思路
1、本發(fā)明的目的是為解決如何獲得一種標準化的臨床試驗質(zhì)量評估方法,并通過該方法獲得規(guī)范化及可自我更新的質(zhì)控發(fā)現(xiàn)分類規(guī)則,以實現(xiàn)質(zhì)量評估的一致性和統(tǒng)一性的技術(shù)問題。
2、為達到解決上述問題的目的,本發(fā)明所采取的技術(shù)方案是提供一種標準化的臨床試驗質(zhì)量評估方法,包括以下步驟:
3、步驟1:獲取臨床試驗質(zhì)量管理數(shù)據(jù),包括臨床試驗質(zhì)控報告;
4、步驟2:通過數(shù)字化工具對臨床試驗質(zhì)控報告進行預(yù)處理,得到標準化治理數(shù)據(jù);
5、通過對臨床試驗質(zhì)控報告文本字段進行分詞,提取要素信息;
6、通過少量質(zhì)控報告形成初始質(zhì)控發(fā)現(xiàn)分類及關(guān)鍵詞庫;在初始質(zhì)控發(fā)現(xiàn)分類及關(guān)鍵詞庫基礎(chǔ)上,通過自訓(xùn)練方法不斷完善質(zhì)控發(fā)現(xiàn)分類及關(guān)鍵詞庫;
7、步驟3:參照初始質(zhì)控發(fā)現(xiàn)分類,持續(xù)擴充質(zhì)控發(fā)現(xiàn)及關(guān)鍵詞庫,直至可識別要素信息匹配度提升至大于95%,形成基于4個等級54種發(fā)現(xiàn)的初始質(zhì)控發(fā)現(xiàn)分類規(guī)則一;初始質(zhì)控發(fā)現(xiàn)分類規(guī)則一具體為表1,質(zhì)控發(fā)現(xiàn)分類規(guī)則v1.0。
8、表1:質(zhì)控發(fā)現(xiàn)分類規(guī)則v1.0
9、
10、
11、
12、
13、
14、優(yōu)選地,上述步驟還包括:
15、步驟4:通過計算可識別要素信息匹配率分析新產(chǎn)生的質(zhì)控報告數(shù)據(jù);分析匹配率不足95%原因;
16、步驟5:總結(jié)新產(chǎn)生質(zhì)控報告中未能匹配的發(fā)現(xiàn),通過人工和數(shù)學(xué)統(tǒng)計工具對未能匹配的發(fā)現(xiàn)進行分析與完善,以形成新的質(zhì)控發(fā)現(xiàn)分類規(guī)則;
17、同時,進行
18、步驟6:質(zhì)控發(fā)現(xiàn)分類規(guī)則自我升級更新:采用數(shù)字化工具半監(jiān)督學(xué)習(xí)的自訓(xùn)練方法,擴大訓(xùn)練要素信息樣本集,在每一輪的訓(xùn)練過程中反復(fù)運用訓(xùn)練結(jié)果,不斷迭代完善質(zhì)控發(fā)現(xiàn)分類規(guī)則;
19、步驟7:重復(fù)以上步驟4-6,并計算可識別要素信息匹配率,直至要素信息匹配率達95%以上,即獲得新的質(zhì)控發(fā)現(xiàn)分類規(guī)則。
20、優(yōu)選地,上述步驟2中還包括將臨床試驗質(zhì)控報告從各種格式轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫,形成可供處理的結(jié)構(gòu)化數(shù)據(jù);將不同質(zhì)控人員撰寫的質(zhì)控報告數(shù)據(jù)統(tǒng)一格式,以確保數(shù)據(jù)一致性;使用自然語言處理nlp工具對文本字段進行分詞,提取要素信息。
21、優(yōu)選地,上述步驟6還包括:
22、步驟6.1:采用數(shù)字化工具半監(jiān)督學(xué)習(xí)的自訓(xùn)練方法,擴大訓(xùn)練要素信息樣本集,在每一輪的訓(xùn)練過程中反復(fù)運用訓(xùn)練結(jié)果,不斷迭代完善質(zhì)控發(fā)現(xiàn)分類規(guī)則;
23、步驟6.2:通過數(shù)據(jù)收集形成兩個數(shù)據(jù)集,包括帶標簽數(shù)據(jù)即帶有關(guān)鍵詞的可識別要素的數(shù)據(jù),未標簽數(shù)據(jù)即持續(xù)積累的質(zhì)控報告數(shù)據(jù);
24、將帶標簽的數(shù)據(jù)劃分為訓(xùn)練集和驗證集;
25、使用帶標簽的訓(xùn)練集訓(xùn)練一個初始監(jiān)督學(xué)習(xí)模型,采用樸素貝葉斯分類器模型執(zhí)行文本分類任務(wù);
26、使用初始模型對未標簽數(shù)據(jù)進行預(yù)測,得到預(yù)測標簽和置信度;
27、將高置信度的預(yù)測結(jié)果作為新的訓(xùn)練數(shù)據(jù),擴充帶標簽的訓(xùn)練集;
28、使用擴充后的訓(xùn)練集重新訓(xùn)練學(xué)習(xí)模型;
29、循環(huán)自訓(xùn)練,持續(xù)循環(huán)上述步驟,直到未標簽數(shù)據(jù)中的高置信度預(yù)測結(jié)果不再增加或達到預(yù)定的迭代次數(shù);
30、步驟6.3:使用驗證集評估最終學(xué)習(xí)模型;
31、步驟6.4:將循環(huán)自訓(xùn)練過程中,關(guān)鍵詞,要素的對應(yīng)關(guān)系,自動化校驗結(jié)果形成報告,供專家進行校對。
32、本發(fā)明提供根據(jù)上述的一種標準化的臨床試驗質(zhì)量評估方法獲得的如上述表1所示的質(zhì)控發(fā)現(xiàn)分類規(guī)則v1.0及應(yīng)用,所述質(zhì)控發(fā)現(xiàn)分類規(guī)則v1.0包含數(shù)據(jù)、質(zhì)量、法規(guī)依從性、安全與倫理和財務(wù)共5類,再將該5類劃分為4個等級,即等級1-4依次遞進,分類描述,等級4中共包含有54種發(fā)現(xiàn)。
33、本發(fā)明提供根據(jù)上述的一種標準化的臨床試驗質(zhì)量評估方法獲得的升級的如下表2所示的質(zhì)控發(fā)現(xiàn)分類規(guī)則v2.0及應(yīng)用。
34、表2:質(zhì)控發(fā)現(xiàn)分類規(guī)則v2.0
35、
36、
37、
38、
39、
40、
41、
42、
43、相比現(xiàn)有技術(shù),本發(fā)明具有如下有益效果:
44、本發(fā)明提供了一種標準化臨床試驗質(zhì)量評估方法,通過該方法有助于確保臨床試驗質(zhì)量評估的準確性,可靠性和一致性,避免因采用不同的評價標準和流程而產(chǎn)生的結(jié)果差異,進一步提高臨床試驗數(shù)據(jù)的質(zhì)量和可信度,也為臨床試驗機構(gòu)提供了共同的、可衡量的質(zhì)量標準,為臨床試驗質(zhì)量數(shù)據(jù)結(jié)果互認奠定了基礎(chǔ),本發(fā)明促進了臨床研究行業(yè)的規(guī)范化和標準化發(fā)展。
1.一種標準化的臨床試驗質(zhì)量評估方法,其特征在于,包括以下步驟:
2.根據(jù)權(quán)利要求1所述的一種標準化的臨床試驗質(zhì)量評估方法,其特征在于,所述步驟還包括:
3.根據(jù)權(quán)利要求1所述的一種標準化的臨床試驗質(zhì)量評估方法,其特征在于,所述步驟2還包括將臨床試驗質(zhì)控報告從各種格式轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫,形成可供處理的結(jié)構(gòu)化數(shù)據(jù);將不同質(zhì)控人員撰寫的質(zhì)控報告數(shù)據(jù)統(tǒng)一格式,以確保數(shù)據(jù)一致性;使用自然語言處理nlp工具對文本字段進行分詞,提取要素信息。
4.根據(jù)權(quán)利要求2所述的一種標準化的臨床試驗質(zhì)量評估方法,其特征在于,所述步驟6還包括:
5.根據(jù)權(quán)利要求1所述的一種標準化的臨床試驗質(zhì)量評估方法獲得說明書表1的質(zhì)控發(fā)現(xiàn)分類規(guī)則v1.0及應(yīng)用,所述質(zhì)控發(fā)現(xiàn)分類規(guī)則v1.0包含數(shù)據(jù)、質(zhì)量、法規(guī)依從性、安全與倫理和財務(wù)共5類,該5類劃分為4個等級,即等級1-4依次遞進,分類描述,等級4中共包含有54問題。
6.根據(jù)權(quán)利要求2所述的一種標準化的臨床試驗質(zhì)量評估方法獲得說明書表2的質(zhì)控發(fā)現(xiàn)分類規(guī)則v2.0及應(yīng)用。