本發(fā)明屬于穿刺路徑規(guī)劃,尤其涉及一種基于改進(jìn)sac算法的穿刺路徑規(guī)劃方法。
背景技術(shù):
1、穿刺路徑的規(guī)劃能夠影響多種體內(nèi)器官的檢查。目前,醫(yī)學(xué)上穿刺路徑規(guī)劃算法主要分為兩大類(lèi):基于傳統(tǒng)的搜索方法以及基于強(qiáng)化學(xué)習(xí)的深度方法。
2、傳統(tǒng)方法考慮到針的物理約束、針與軟組織的相互作用。例如,petruska等人在文獻(xiàn)《magnetic?needle?guidance?for?neurosurgery:initial?design?and?proof?ofconcept》引入了物理約束來(lái)跟蹤高彎曲的磁尖可操縱針軌跡,而不會(huì)損壞組織。hamze等人在文獻(xiàn)《preoperative?trajectory?planning?for?percutaneous?procedures?indeformable?environments》使用干草堆(hst)算法在組織可變形環(huán)境中求解有效的術(shù)前曲線(xiàn)軌跡。li等在文獻(xiàn)《modeling?of?path?planning?and?needle?steering?with?pathtracking?in?anatomical?soft?tissues?for?minimally?invasive?surgery》提出了一種基于三維解剖結(jié)構(gòu)的離散勢(shì)場(chǎng)算法,用于微創(chuàng)手術(shù)中的針路規(guī)劃。上述方法側(cè)重于柔性針頭軌跡約束和生成速度,而忽視穿刺路徑與危險(xiǎn)人體器官的距離。
3、強(qiáng)化學(xué)習(xí)算法被廣泛用于復(fù)雜且未知的環(huán)境中,通過(guò)為不同的狀態(tài)分配不同的獎(jiǎng)勵(lì)值來(lái)做出決策。如kong等(2021)在文獻(xiàn)《constrained?policy?optimization?algorithmfor?autonomous?driving?via?reinforcement?learning》提出了一種基于分層強(qiáng)化學(xué)習(xí)和人工勢(shì)場(chǎng)的路徑規(guī)劃算法,大大提高算法的收斂速度和學(xué)習(xí)效率。然而,傳統(tǒng)的強(qiáng)化學(xué)習(xí)路徑規(guī)劃對(duì)地圖精準(zhǔn)性依賴(lài)度高。手術(shù)規(guī)劃場(chǎng)景中,人體器官環(huán)境狀態(tài)復(fù)雜,容易陷入維度災(zāi)難,導(dǎo)致強(qiáng)化學(xué)習(xí)網(wǎng)絡(luò)收斂速度緩慢。
4、因此,亟需提出一種基于改進(jìn)sac算法的穿刺路徑規(guī)劃方法。
技術(shù)實(shí)現(xiàn)思路
1、為解決上述技術(shù)問(wèn)題,本發(fā)明提出了一種基于改進(jìn)sac算法的穿刺路徑規(guī)劃方法,以解決上述現(xiàn)有技術(shù)存在的問(wèn)題。
2、為實(shí)現(xiàn)上述目的,本發(fā)明提供了一種基于改進(jìn)sac算法的穿刺路徑規(guī)劃方法,包括以下步驟:
3、獲取三維器官模型,對(duì)所述三維器官模型進(jìn)行均勻采樣和體素化處理,獲得重建后的三維模型;
4、基于重建后的三維模型為sac算法提供訓(xùn)練環(huán)境,基于訓(xùn)練后的sac算法規(guī)劃穿刺路徑;
5、規(guī)劃過(guò)程中,為穿刺路徑提供幾何約束,并基于結(jié)合包圍形法和kd樹(shù)的細(xì)粒度碰撞檢測(cè)方法對(duì)穿刺路徑進(jìn)行碰撞檢測(cè);
6、最后采用角度獎(jiǎng)勵(lì)函數(shù)與狀態(tài)獎(jiǎng)勵(lì)函數(shù)對(duì)穿刺路徑進(jìn)行優(yōu)化,獲得優(yōu)化后的穿刺路徑。
7、可選地,所述重建后的三維模型包括:穿刺靶區(qū)、不可穿透的障礙物和可穿透的障礙物。
8、可選地,為穿刺路徑提供幾何約束的過(guò)程包括:獲取穿刺針的當(dāng)前位置和目標(biāo)位置,基于當(dāng)前位置和目標(biāo)位置之間的函數(shù)關(guān)系,計(jì)算穿刺針的方向向量;基于所述方向向量,計(jì)算目標(biāo)方向的俯仰角和偏航角,基于所述俯仰角和偏航角,更新穿刺針的方向向量;預(yù)設(shè)穿刺針的移動(dòng)距離,基于更新后的方向向量和移動(dòng)距離,計(jì)算穿刺針的新位置。
9、可選地,對(duì)穿刺路徑進(jìn)行碰撞檢測(cè)的過(guò)程包括:基于穿刺針移動(dòng)距離最大值的一半確定球體半徑,基于所述球體半徑將穿刺針?lè)纸鉃槿舾蓚€(gè)球體;將訓(xùn)練環(huán)境中所有障礙物的位置數(shù)據(jù)插入kd樹(shù)中,構(gòu)建空間索引;然后對(duì)于穿刺針的每一個(gè)球體,基于kd樹(shù)進(jìn)行細(xì)粒度的碰撞檢測(cè)。
10、可選地,所述角度獎(jiǎng)勵(lì)函數(shù)如下式所示:
11、
12、其中,rewardangle為角度獎(jiǎng)勵(lì)函數(shù),dnew·dtarget是兩個(gè)向量的點(diǎn)積,||dnew||和||dtarget||是向量的范數(shù),λ為系數(shù)。
13、可選地,所述狀態(tài)獎(jiǎng)勵(lì)函數(shù)如下式所示:
14、
15、其中,其中r為獎(jiǎng)勵(lì)函數(shù),變量st和at分別表示第t時(shí)刻的狀態(tài)和動(dòng)作,動(dòng)作at后,狀態(tài)st轉(zhuǎn)換為t+1時(shí)刻的狀態(tài)st+1,setgoal為目標(biāo)靶區(qū),setbone為骨骼區(qū)域,setspleen為脾臟區(qū)域,setartery為動(dòng)脈區(qū)域,setnerve為神經(jīng)和靜脈區(qū)域,starget為目標(biāo)區(qū)域狀態(tài),α為距離懲罰系數(shù),rewardpenalty為算法步驟懲罰。
16、本發(fā)明還提供一種基于改進(jìn)sac算法的穿刺路徑規(guī)劃系統(tǒng),包括:依次連接的模型重建模塊,路徑規(guī)劃模塊和路徑優(yōu)化模塊;
17、所述模型重構(gòu)模塊用于獲取三維器官模型,并對(duì)所述三維器官模型進(jìn)行均勻采樣和體素化處理,獲得重建后的三維模型;
18、所述路徑規(guī)劃模塊用于基于重建后的三維模型為sac算法提供訓(xùn)練環(huán)境,基于訓(xùn)練后的sac算法規(guī)劃穿刺路徑;
19、所述路徑優(yōu)化模塊用于為穿刺路徑提供幾何約束,并對(duì)穿刺路徑進(jìn)行碰撞檢測(cè),最后采用獎(jiǎng)勵(lì)函數(shù)對(duì)穿刺路徑進(jìn)行優(yōu)化,獲得優(yōu)化后的穿刺路徑。
20、可選地,所述模型重建模塊包括采樣單元和體素化單元;
21、所述采樣單元用于對(duì)所述三維器官模型進(jìn)行均勻采樣,獲得模型點(diǎn)云數(shù)據(jù);所述體素化單元用于對(duì)所述模型點(diǎn)云數(shù)據(jù)進(jìn)行體素化處理,獲得重建后的三維模型。
22、可選地,所述路徑規(guī)劃模塊包括算法訓(xùn)練單元和路徑規(guī)劃單元;
23、所述算法訓(xùn)練單元用于基于重建后的三維模型為sac算法提供訓(xùn)練環(huán)境,獲得訓(xùn)練后的sac算法;所述路徑規(guī)劃單元用于基于訓(xùn)練后的sac算法規(guī)劃穿刺路徑。
24、可選地,所述路徑優(yōu)化模塊包括幾何約束單元,碰撞檢測(cè)單元和路徑優(yōu)化單元;
25、所述幾何約束單元用于獲取穿刺針的當(dāng)前位置和目標(biāo)位置,基于當(dāng)前位置和目標(biāo)位置之間的函數(shù)關(guān)系,計(jì)算穿刺針的方向向量;基于所述方向向量,計(jì)算目標(biāo)方向的俯仰角和偏航角,基于所述俯仰角和偏航角,更新穿刺針的方向向量;預(yù)設(shè)穿刺針的移動(dòng)距離,基于更新后的方向向量和移動(dòng)距離,計(jì)算穿刺針的新位置;
26、所述碰撞檢測(cè)單元用于基于穿刺針移動(dòng)距離最大值的一半確定球體半徑,基于所述球體半徑將穿刺針?lè)纸鉃槿舾蓚€(gè)球體;將訓(xùn)練環(huán)境中所有障礙物的位置數(shù)據(jù)插入kd樹(shù)中,構(gòu)建空間索引;然后對(duì)于穿刺針的每一個(gè)球體,基于kd樹(shù)進(jìn)行細(xì)粒度的碰撞檢測(cè);
27、所述路徑優(yōu)化單元用于采用角度獎(jiǎng)勵(lì)函數(shù)與狀態(tài)獎(jiǎng)勵(lì)函數(shù)對(duì)穿刺路徑進(jìn)行優(yōu)化,獲得優(yōu)化后的穿刺路徑。
28、與現(xiàn)有技術(shù)相比,本發(fā)明具有如下優(yōu)點(diǎn)和技術(shù)效果:
29、(1)路徑精確度提高:
30、本發(fā)明改進(jìn)sac算法通過(guò)強(qiáng)化學(xué)習(xí),可以在大量的模擬訓(xùn)練中逐步優(yōu)化穿刺路徑,使得路徑更精準(zhǔn),能夠避開(kāi)障礙物準(zhǔn)確到達(dá)目標(biāo)區(qū)域。
31、(2)碰撞檢測(cè)的高效性:
32、本發(fā)明通過(guò)引入kd樹(shù)結(jié)構(gòu)和包圍球方法進(jìn)行碰撞檢測(cè),可以快速地進(jìn)行障礙物檢測(cè),減少計(jì)算量,提高路徑規(guī)劃的效率;并且kd樹(shù)的使用使得算法能夠在高維空間中快速找到最近鄰,從而進(jìn)行精確的碰撞檢測(cè)。
33、(3)實(shí)時(shí)反饋機(jī)制:
34、本發(fā)明采用實(shí)時(shí)的獎(jiǎng)懲機(jī)制,根據(jù)穿刺路徑的優(yōu)劣實(shí)時(shí)調(diào)整算法參數(shù),使得能夠快速學(xué)習(xí)到最優(yōu)路徑規(guī)劃策略。
35、(4)復(fù)雜環(huán)境中的高效規(guī)劃:
36、改進(jìn)后的sac算法能夠考慮多種幾何和生理約束,進(jìn)行有效的路徑規(guī)劃,特別是對(duì)多種障礙物的處理,能夠智能地繞開(kāi)障礙物,確保安全和有效性。
37、(5)高容錯(cuò)性:
38、通過(guò)不斷的訓(xùn)練和優(yōu)化,sac算法能夠具備更高的容錯(cuò)性,即使在某些環(huán)境中發(fā)生未知情況,也能較好地調(diào)整路徑,避免重大失誤。