亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器及其構(gòu)造方法與流程

文檔序號(hào):12488871閱讀:400來源:國知局
無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器及其構(gòu)造方法與流程

本發(fā)明涉及無軸承永磁同步電機(jī),具體是一種無軸承永磁同步電機(jī)的控制器及構(gòu)造方法,應(yīng)用于機(jī)床電主軸、渦輪分子泵、離心機(jī)、壓縮機(jī)、機(jī)電貯能、航空航天等特殊電氣傳動(dòng)領(lǐng)域,屬于電力傳動(dòng)控制設(shè)備的領(lǐng)域。



背景技術(shù):

無軸承永磁同步電機(jī)的控制器設(shè)計(jì)往往需要精確的電機(jī)參數(shù)值來輔助設(shè)計(jì),如無速度傳感器控制、矢量控制等。但是隨著溫度、負(fù)載和磁飽和程度的變化,電機(jī)的定子電感、繞組電阻和轉(zhuǎn)子永磁磁鏈幅值等參數(shù)值大小都會(huì)隨之而變化。當(dāng)電機(jī)實(shí)際參數(shù)值相對于常溫下的設(shè)計(jì)參數(shù)值發(fā)生比較大變化時(shí),會(huì)對所設(shè)計(jì)的控制器性能造成很大影響,甚至?xí)屍錈o法工作。

自適應(yīng)控制器具有修正自己的特性以適應(yīng)對象擾動(dòng)的能力。在電機(jī)控制系統(tǒng)運(yùn)行中,自適應(yīng)控制器依靠不斷采集控制過程信息,確定被控對象的當(dāng)前實(shí)際工作狀態(tài),以優(yōu)化性能為準(zhǔn)則,產(chǎn)生自適應(yīng)控制規(guī)律,從而實(shí)時(shí)地調(diào)整控制器結(jié)構(gòu)或參數(shù),使系統(tǒng)始終自動(dòng)地工作在最優(yōu)或次最優(yōu)狀態(tài)下。然而要實(shí)施自適應(yīng)控制,通常需要準(zhǔn)確獲得被控對象的數(shù)學(xué)模型,而無軸承永磁同步電機(jī)徑向位置系統(tǒng)是一個(gè)多變量、非線性、強(qiáng)耦合的復(fù)雜系統(tǒng),很難獲取其精確的數(shù)學(xué)模型。

中國專利公開號(hào)為CN102790577A的文獻(xiàn)中公開了一種無軸承永磁同步電機(jī)懸浮子系統(tǒng)控制器的構(gòu)造方法,對無軸承永磁同步電機(jī)的懸浮子系統(tǒng)在不同徑向位置下徑向力進(jìn)行非線性解耦控制設(shè)計(jì)了模糊神經(jīng)網(wǎng)絡(luò)逆解耦控制器,模糊神經(jīng)網(wǎng)絡(luò)需要事先讀取訓(xùn)練數(shù)據(jù),進(jìn)行大量離線訓(xùn)練,權(quán)值一旦固定無法在線調(diào)節(jié),導(dǎo)致控制器無法克服無軸承永磁同步電機(jī)系統(tǒng)參數(shù)變化、負(fù)載突變等不確定因素對系統(tǒng)的影響,魯棒性差。中國專利公開號(hào)為CN103647481A的文獻(xiàn)中公開了一種無軸承永磁同步電機(jī)徑向位置神經(jīng)網(wǎng)絡(luò)自適應(yīng)逆控制器構(gòu)造方法,對無軸承永磁同步電機(jī)轉(zhuǎn)子位于不同徑向位置設(shè)計(jì)了神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器,該神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器將水平位移和垂直位移分開控制,系統(tǒng)復(fù)雜,同時(shí)沒有對電機(jī)速度進(jìn)行控制,但是其研究對象為無軸承永磁同步電機(jī)。

執(zhí)行器–評價(jià)器算法(Actor-Critic,AC),也稱為自適應(yīng)啟發(fā)式評價(jià)算法,是一種重要的強(qiáng)化學(xué)習(xí)算法,具有無模型在線學(xué)習(xí)能力。它包含兩個(gè)部件:執(zhí)行器(Actor)和評價(jià)器(Critic)。執(zhí)行器即策略結(jié)構(gòu),用于選擇動(dòng)作;評價(jià)器即值函數(shù),用于評估執(zhí)行器選擇的動(dòng)作。執(zhí)行器–評價(jià)器算法中,動(dòng)作的選擇與值函數(shù)的更新釆用了相同的策略。評價(jià)器必須了解和評價(jià)執(zhí)行器當(dāng)前采用的策略,評價(jià)采用瞬時(shí)差分誤差的方式,這個(gè)標(biāo)量信號(hào)是評價(jià)器的唯一輸出并推動(dòng)了執(zhí)行器–評價(jià)器的所有學(xué)習(xí)。一般情況下,評價(jià)器是一個(gè)狀態(tài)值函數(shù),評價(jià)器的實(shí)現(xiàn)機(jī)制,即值函數(shù)的更新可以采用時(shí)間差分學(xué)習(xí)(Temporal-Difference learning,TD)。評價(jià)器的作用在于:在每個(gè)動(dòng)作選擇之后,評價(jià)器評估新狀態(tài)來決定事情是否比期望的好或者更糟,這個(gè)評估就是瞬時(shí)差分誤差。如果瞬時(shí)差分誤差是正值,表明未來選擇當(dāng)前動(dòng)作的傾向要被加強(qiáng),但是如果瞬時(shí)差分誤差是負(fù)值,表明傾向要被減弱。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明的目的是為克服上述現(xiàn)有技術(shù)的不足,提供一種可使無軸承永磁同步電機(jī)具有優(yōu)良的動(dòng)、靜態(tài)控制性能的自適應(yīng)強(qiáng)化學(xué)習(xí)控制器以及該控制器的構(gòu)造方法,將人工智能領(lǐng)域強(qiáng)化學(xué)習(xí)中的執(zhí)行器-評價(jià)器算法與傳統(tǒng)矢量控制相結(jié)合,能夠在沒有電機(jī)精確模型的情況下在線更新控制器參數(shù),維持無軸承永磁同步電機(jī)的穩(wěn)定運(yùn)行,抗電機(jī)參數(shù)變化及抗負(fù)載擾動(dòng)能力強(qiáng)。

本發(fā)明無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器采用的技術(shù)方案是:包括懸浮繞組電流控制模塊和轉(zhuǎn)矩繞組電流控制模塊,電機(jī)的實(shí)時(shí)徑向位移值x、y與轉(zhuǎn)子位移指令值x*、y*分別對應(yīng)地比較得到位移誤差ex和ey,實(shí)際轉(zhuǎn)速n與轉(zhuǎn)速指令值n*比較得到轉(zhuǎn)速誤差en,其特征是:懸浮繞組電流控制模塊和轉(zhuǎn)矩繞組電流控制模塊的輸入端分別連接執(zhí)行器-評價(jià)器模塊,執(zhí)行器-評價(jià)器模塊由執(zhí)行器神經(jīng)網(wǎng)絡(luò)、評價(jià)器神經(jīng)網(wǎng)絡(luò)、強(qiáng)化信號(hào)模塊和瞬時(shí)差分模塊組成,評價(jià)器神經(jīng)網(wǎng)絡(luò)和強(qiáng)化信號(hào)模塊的輸出端連接瞬時(shí)差分模塊的輸入端,瞬時(shí)差分模塊的輸出端分別連接執(zhí)行器神經(jīng)網(wǎng)絡(luò)和評價(jià)器神經(jīng)網(wǎng)絡(luò)的輸入端;位移誤差ex、ey和轉(zhuǎn)速誤差en是評價(jià)器神經(jīng)網(wǎng)絡(luò)、強(qiáng)化信號(hào)模塊和執(zhí)行器神經(jīng)網(wǎng)絡(luò)的共同輸入,執(zhí)行器神經(jīng)網(wǎng)絡(luò)的輸出是d-q坐標(biāo)系下的懸浮繞組給定電流iBd*、iBq*與轉(zhuǎn)矩繞組給定電流iMd*、iMq*,懸浮繞組給定電流iBd*、iBq*是懸浮繞組電流控制模塊的輸入,轉(zhuǎn)矩繞組給定電流iMd*、iMq*是轉(zhuǎn)矩繞組電流控制模塊的輸入。

進(jìn)一步地,評價(jià)器神經(jīng)網(wǎng)絡(luò)根據(jù)輸入值生成評價(jià)器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)V(t),強(qiáng)化信號(hào)模塊根據(jù)輸入值生成強(qiáng)化信號(hào)r(t),瞬時(shí)差分模塊根據(jù)強(qiáng)化信號(hào)r(t)和評價(jià)器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)V(t)計(jì)算得到并輸出瞬時(shí)差分信號(hào)δTD(t)。

本發(fā)明無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器的構(gòu)造方法采用的技術(shù)方案是:包括以下步驟:

A.構(gòu)造執(zhí)行器神經(jīng)網(wǎng)絡(luò)與評價(jià)器神經(jīng)網(wǎng)絡(luò),采用一個(gè)有三層的執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò),第一層為輸入層節(jié)點(diǎn)數(shù)為3個(gè),每個(gè)輸入節(jié)點(diǎn)代表狀態(tài)向量x(t)=[ex eyen]T的一個(gè)分量;第二層為隱含層節(jié)點(diǎn)數(shù)為8個(gè),節(jié)點(diǎn)基函數(shù)采用高斯核函數(shù);第三層為輸出層節(jié)點(diǎn)數(shù)為4個(gè),由執(zhí)行器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)Im(t)和評價(jià)器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)V(t)兩個(gè)部分組成;

B.構(gòu)造強(qiáng)化信號(hào)模塊,強(qiáng)化信號(hào)模塊的輸出為強(qiáng)化信號(hào)r(t)=αxrx(t)+αyry(t)+αnrn(t),rx(t)、ry(t)和rn(t)分別為x軸向位移誤差強(qiáng)化信號(hào)、y軸向位移誤差強(qiáng)化信號(hào)和轉(zhuǎn)子轉(zhuǎn)速誤差強(qiáng)化信號(hào),αx、αy和αn分別為x軸向位移誤差強(qiáng)化信號(hào)系數(shù)、y軸向位移誤差強(qiáng)化信號(hào)系數(shù)和轉(zhuǎn)子轉(zhuǎn)速誤差強(qiáng)化信號(hào)系數(shù);

C.構(gòu)造瞬時(shí)差分模塊,瞬時(shí)差分模塊的兩個(gè)輸入分別為強(qiáng)化信號(hào)r(t)、評價(jià)器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)V(t),兩個(gè)輸出都為瞬時(shí)差分信號(hào)δTD(t)=r(t)+γV(t+1)-V(t),TD表示瞬時(shí)差分,0≤γ≤1為折扣因子,V(t+1)和V(t)分別為更新前后的值函數(shù);

D.由執(zhí)行器-評價(jià)器模塊與懸浮繞組電流控制模塊、轉(zhuǎn)矩繞組電流控制模塊共同組成無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器。

本發(fā)明的優(yōu)點(diǎn)在于:

1、本發(fā)明中的評價(jià)器神經(jīng)網(wǎng)絡(luò)輸出值與強(qiáng)化信號(hào)模塊輸出值經(jīng)瞬時(shí)差分模塊處理產(chǎn)生瞬時(shí)差分信號(hào),瞬時(shí)差分信號(hào)同時(shí)指導(dǎo)評價(jià)器神經(jīng)網(wǎng)絡(luò)和執(zhí)行器神經(jīng)網(wǎng)絡(luò)的權(quán)值更新,執(zhí)行器神經(jīng)網(wǎng)絡(luò)最終作為控制器控制復(fù)合被控對象,解決了單一神經(jīng)網(wǎng)絡(luò)控制器需要事先讀取訓(xùn)練數(shù)據(jù),進(jìn)行大量離線訓(xùn)練,權(quán)值一旦固定無法在線調(diào)節(jié)的不足,解決傳統(tǒng)自適應(yīng)控制需要精確數(shù)學(xué)模型的難題,同時(shí)克服了系統(tǒng)參數(shù)變化、負(fù)載突變等不確定因素對系統(tǒng)性能的影響,具有更好的魯棒性,能夠維持無軸承永磁同步電機(jī)的高性能穩(wěn)定運(yùn)行。

2.本發(fā)明采用了執(zhí)行器–評價(jià)器學(xué)習(xí)算法,也稱為自適應(yīng)啟發(fā)式評價(jià)算法,是一種重要的強(qiáng)化學(xué)習(xí)算法。由評價(jià)器評價(jià)無軸承永磁同步電機(jī)系統(tǒng)的轉(zhuǎn)速與位移反饋信息,并指導(dǎo)執(zhí)行器控制無軸承永磁同步電機(jī)的懸浮繞組與轉(zhuǎn)矩繞組電流,實(shí)現(xiàn)了對無軸承永磁同步電機(jī)系統(tǒng)的穩(wěn)定跟蹤控制,能夠在沒有電機(jī)精確模型的情況下在線更新控制器參數(shù),可以解決傳統(tǒng)自適應(yīng)控制需要精確數(shù)學(xué)模型的難題,解決了單一神經(jīng)網(wǎng)絡(luò)控制器需要事先讀取訓(xùn)練數(shù)據(jù),進(jìn)行大量離線訓(xùn)練,權(quán)值一旦固定無法在線調(diào)節(jié)的不足,同時(shí)克服了系統(tǒng)參數(shù)變化、負(fù)載突變等不確定因素對系統(tǒng)性能的影響,具有更好的魯棒性。

3.本發(fā)明采用了徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(RBF network)。RBF神經(jīng)網(wǎng)絡(luò)能夠逼近任意的非線性函數(shù),可以處理系統(tǒng)內(nèi)的難以解析的規(guī)律性,具有良好的泛化能力。同時(shí)RBF神經(jīng)網(wǎng)絡(luò)作為一種局部逼近網(wǎng)絡(luò)相比BP神經(jīng)網(wǎng)絡(luò)等全局逼近網(wǎng)絡(luò)具有更快的學(xué)習(xí)收斂速度。已成功應(yīng)用于非線性函數(shù)逼近、時(shí)間序列分析、數(shù)據(jù)分類、模式識(shí)別、信息處理、圖像處理、系統(tǒng)建模、控制和故障診斷等。

附圖說明

圖1是本發(fā)明無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器的結(jié)構(gòu)框圖;

圖2是圖1中執(zhí)行器–評價(jià)器控制原理示意圖;

圖3是圖2執(zhí)行器–評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖;

圖4是圖2中強(qiáng)化信號(hào)模塊的構(gòu)造原理圖;

圖5是圖2中瞬時(shí)差分模塊的構(gòu)造原理圖;

圖6是圖2中執(zhí)行器-評價(jià)器算法流程圖。

圖中:1.無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器;2.執(zhí)行器-評價(jià)器模塊;3.懸浮繞組電流控制模塊;4.轉(zhuǎn)矩繞組電流控制模塊;5.執(zhí)行器神經(jīng)網(wǎng)絡(luò);6.強(qiáng)化信號(hào)模塊;7.瞬時(shí)差分模塊;8.評價(jià)器神經(jīng)網(wǎng)絡(luò);9.第一PI調(diào)節(jié)器;10.第二PI調(diào)節(jié)器;11.第一PARK變換器;12.第一IPARK變換器;13.第一CLARK變換器;14.第一SVPWM;15.第一電流傳感器;16.第一電壓源逆變器;17.第三PI調(diào)節(jié)器;18.第四PI調(diào)節(jié)器;19.第二PARK變換器;20.第二IPARK變換器;21.第二CLARK變換器;22.第二SVPWM;23.第二電流傳感器;24.第二電壓源逆變器;25.位移傳感器;26.光電編碼器;27.速度計(jì)算模塊;28.復(fù)合被控對象。

具體實(shí)施方式

參見圖1和圖2,本發(fā)明無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器1由執(zhí)行器-評價(jià)器模塊2、懸浮繞組電流控制模塊3和轉(zhuǎn)矩繞組電流控制模塊4組成。懸浮繞組電流控制模塊3和轉(zhuǎn)矩繞組電流控制模塊4的輸入端分別連接執(zhí)行器-評價(jià)器模塊2。執(zhí)行器-評價(jià)器模塊2由執(zhí)行器神經(jīng)網(wǎng)絡(luò)5、評價(jià)器神經(jīng)網(wǎng)絡(luò)8、強(qiáng)化信號(hào)模塊6和瞬時(shí)差分模塊7組成。評價(jià)器神經(jīng)網(wǎng)絡(luò)8和強(qiáng)化信號(hào)模塊6的輸出端連接瞬時(shí)差分模塊7的輸入端,瞬時(shí)差分模塊7的輸出端分別連接執(zhí)行器神經(jīng)網(wǎng)絡(luò)5和評價(jià)器神經(jīng)網(wǎng)絡(luò)8的輸入端,執(zhí)行器神經(jīng)網(wǎng)絡(luò)5的輸出端分別連接懸浮繞組電流控制模塊3和轉(zhuǎn)矩繞組電流控制模塊4的輸入端。

懸浮繞組電流控制模塊3由第一PI調(diào)節(jié)器9、第二PI調(diào)節(jié)器10、第一PARK變換器11、第一IPARK變換器12、第一CLARK變換器13、第一SVPWM(空間矢量脈寬調(diào)制模塊)14、第一電流傳感器15和第一電壓源逆變器16組成。

轉(zhuǎn)矩繞組電流控制模塊4由第三PI調(diào)節(jié)器17、第四PI調(diào)節(jié)器18、第二PARK變換器19、第二IPARK變換器20、第二CLARK變換器21、第二SVPWM22、第二電流傳感器23和第二電壓源逆變器24組成。

無軸承永磁同步電機(jī)采用兩個(gè)電渦流位移傳感器25分別檢測轉(zhuǎn)子的x軸與y軸的實(shí)時(shí)徑向位移值x、y。采用光電編碼器26檢測無軸承永磁同步電機(jī)轉(zhuǎn)子的實(shí)際角位置θ,光電編碼器26的輸出端連接速度計(jì)算模塊27的輸入端,實(shí)際角位置θ經(jīng)速度計(jì)算模塊27得到實(shí)際轉(zhuǎn)速n。

將無軸承永磁同步電機(jī)和懸浮繞組電流控制模塊3、轉(zhuǎn)矩繞組電流控制模塊4、位移傳感器25、光電編碼器26、速度計(jì)算模塊27一起構(gòu)成復(fù)合被控對象28。復(fù)合被控對象28的輸入是執(zhí)行器神經(jīng)網(wǎng)絡(luò)5的輸出,為d-q坐標(biāo)系下的懸浮繞組給定電流iBd*、iBq*與d-q坐標(biāo)系下的轉(zhuǎn)矩繞組給定電流iMd*、iMq*,懸浮繞組給定電流iBd*、iBq*是懸浮繞組電流控制模塊3的輸入,轉(zhuǎn)矩繞組給定電流iMd*、iMq*是轉(zhuǎn)矩繞組電流控制模塊4的輸入。輸出為無軸承永磁同步電機(jī)的實(shí)時(shí)徑向位移值x、y與實(shí)際轉(zhuǎn)速n。

將實(shí)時(shí)徑向位移值x、y分別與轉(zhuǎn)子位移指令值x*、y*分別對應(yīng)地進(jìn)行比較得到對應(yīng)的位移誤差ex和ey,將實(shí)際轉(zhuǎn)速n與轉(zhuǎn)速指令值n*進(jìn)行比較,得到轉(zhuǎn)速誤差en。位移誤差ex、ey和轉(zhuǎn)速誤差en作為評價(jià)器神經(jīng)網(wǎng)絡(luò)8、強(qiáng)化信號(hào)模塊6和執(zhí)行器神經(jīng)網(wǎng)絡(luò)5的共同輸入,評價(jià)器神經(jīng)網(wǎng)絡(luò)8根據(jù)輸入值生成評價(jià)器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)V(t)。強(qiáng)化信號(hào)模塊6根據(jù)輸入值生成強(qiáng)化信號(hào)r(t),強(qiáng)化信號(hào)r(t)的計(jì)算由以下公式得到:

r(t)=αxrx(t)+αyry(t)+αnrn(t)

其中t為當(dāng)前時(shí)刻,rx(t)為x軸向位移誤差強(qiáng)化信號(hào),ry(t)為y軸向位移誤差強(qiáng)化信號(hào),rn(t)為轉(zhuǎn)子轉(zhuǎn)速誤差強(qiáng)化信號(hào)。αx、αy和αn分別為x軸向位移誤差強(qiáng)化信號(hào)系數(shù)、y軸向位移誤差強(qiáng)化信號(hào)系數(shù)和轉(zhuǎn)子轉(zhuǎn)速誤差強(qiáng)化信號(hào)系數(shù),本發(fā)明αx、αy和αn這三個(gè)系數(shù)值都取0.3,系數(shù)的大小會(huì)影響控制器對位移反饋信號(hào)和轉(zhuǎn)速反饋信號(hào)的敏感度。x軸向位移誤差強(qiáng)化信號(hào)rx(t),y軸向位移誤差強(qiáng)化信號(hào)ry(t)和轉(zhuǎn)子轉(zhuǎn)速誤差強(qiáng)化信號(hào)rn(t)的計(jì)算由以下公式得到:

其中εx為x軸向位移誤差信號(hào)的容許誤差帶,εy為y軸向位移誤差信號(hào)的容許誤差帶,εn為轉(zhuǎn)子轉(zhuǎn)速誤差信號(hào)的容許誤差帶。容許誤差帶的選取與反饋量本身的大小有關(guān),這里三個(gè)誤差帶εx、εy、εn統(tǒng)一設(shè)為反饋量大小的1%。

強(qiáng)化信號(hào)模塊6生成的強(qiáng)化信號(hào)r(t)輸入瞬時(shí)差分模塊7,評價(jià)器神經(jīng)網(wǎng)絡(luò)8生成的評價(jià)器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)V(t)也輸入瞬時(shí)差分模塊7。瞬時(shí)差分模塊7根據(jù)強(qiáng)化信號(hào)r(t)和評價(jià)器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)V(t),由公式:

δTD(t)=r(t)+γV(t+1)-V(t)

計(jì)算得到并輸出瞬時(shí)差分信號(hào)δTD(t),TD表示瞬時(shí)差分,γ表示折扣因子,0<γ<1。評價(jià)器神經(jīng)網(wǎng)絡(luò)8根據(jù)公式:

vj(t+1)=vj(t)+αCδTD(t)Φj(t)

更新神經(jīng)網(wǎng)絡(luò)權(quán)值并輸出新的評價(jià)器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)V(t),其中αC為評價(jià)器神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率,vj(t)為第j個(gè)隱含層節(jié)點(diǎn)到評價(jià)器輸出節(jié)點(diǎn)的權(quán)值,vj(t+1)為更新后的第j個(gè)隱含層節(jié)點(diǎn)到評價(jià)器輸出節(jié)點(diǎn)的權(quán)值,Φj(t)為第j個(gè)隱含層節(jié)點(diǎn)的輸出。

瞬時(shí)差分模塊7輸出的瞬時(shí)差分信號(hào)δTD(t)輸入執(zhí)行器神經(jīng)網(wǎng)絡(luò)5中,執(zhí)行器神經(jīng)網(wǎng)絡(luò)5根據(jù)公式:

wjk(t+1)=wjk(t)+αAδTD(t)Φj(t)

更新神經(jīng)網(wǎng)絡(luò)權(quán)值,并最終輸出d-q坐標(biāo)系下的懸浮繞組給定電流iBd*、iBq*與d-q坐標(biāo)系下的轉(zhuǎn)矩繞組給定電流iMd*、iMq*。其中αA為執(zhí)行器神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率,wjk(t)為第j個(gè)隱含層節(jié)點(diǎn)到執(zhí)行器的第k個(gè)輸出節(jié)點(diǎn)的權(quán)值,wjk(t+1)為更新后的第j個(gè)隱含層節(jié)點(diǎn)到執(zhí)行器的第k個(gè)輸出節(jié)點(diǎn)的權(quán)值。

無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器1的具體構(gòu)造方法分以下7步:

1.構(gòu)造懸浮繞組電流控制模塊3

采用第一電流傳感器15檢測無軸承永磁同步電機(jī)的懸浮繞組電流iBa、iBb、iBc,電流傳感器15的輸出端連接第一CLARK變換器13的輸入端,懸浮繞組電流iBa、iBb、iBc經(jīng)第一CLARK變換器13處理后生成α-β坐標(biāo)系下的懸浮繞組電流i、i。第一CLARK變換器13的輸出端連接第一PARK變換器11的輸入端,第一PARK變換器11再依據(jù)光電編碼器26輸出的電機(jī)轉(zhuǎn)子角度θ處理α-β坐標(biāo)系下的懸浮繞組電流i、i,生成d-q坐標(biāo)系下的懸浮繞組電流iBd、iBq。

將懸浮繞組電流iBd、iBq作為反饋電流,與d-q坐標(biāo)系下的懸浮繞組給定電流iBd*、iBq*比較,比較誤差分別輸出到一一對應(yīng)的第一PI調(diào)節(jié)器9和第二PI調(diào)節(jié)器10,比較誤差經(jīng)第一PI調(diào)節(jié)器9和第二PI調(diào)節(jié)器10處理后生成d-q坐標(biāo)系下的懸浮繞組電壓VBd*和VBq*。PI調(diào)節(jié)器9和PI調(diào)節(jié)器10輸出端與IPARK變換器12輸入端連接,第一IPARK變換器12再依據(jù)光電編碼器26輸出的電機(jī)轉(zhuǎn)子角度θ處理d-q坐標(biāo)系下的懸浮繞組電壓VBd*和VBq*,生成α-β坐標(biāo)系下的懸浮繞組電壓V*和V*。第一IPARK變換器12的輸出端與第一SVPWM14的輸入端相連,α-β坐標(biāo)系下的懸浮繞組電壓V*和V*經(jīng)第一SVPWM14處理后生成第一電壓源逆變器16的開關(guān)信號(hào)SB(B=1,2,3,4,5,6)。第一SVPWM14的輸出端與第一電壓源逆變器16的輸入端相連,電壓源逆變器母線電壓VDC輸入電壓第一電壓源逆變器16,第一電壓源逆變器16根據(jù)開關(guān)信號(hào)控制無軸承永磁同步電機(jī)的懸浮繞組。

2.構(gòu)造轉(zhuǎn)矩繞組電流控制模塊4

采用第二電流傳感器23檢測無軸承永磁同步電機(jī)的轉(zhuǎn)矩繞組電流iMa、iMb、iMc,第二電流傳感器23的輸出端連接第二CLARK變換器21的輸入端,轉(zhuǎn)矩繞組電流iMa、iMb、iMc經(jīng)第二CLARK變換器21處理后生成α-β坐標(biāo)系下的轉(zhuǎn)矩繞組電流i、i。第二CLARK變換器21的輸出端連接第二PARK變換器19的輸入端,第二PARK變換器19再依據(jù)光電編碼器26輸出的電機(jī)轉(zhuǎn)子角度θ處理α-β坐標(biāo)系下的轉(zhuǎn)矩繞組電流i、i生成d-q坐標(biāo)系下的轉(zhuǎn)矩繞組電流iMd、iMq。轉(zhuǎn)矩繞組電流iMd、iMq作為反饋電流與d-q坐標(biāo)系下的轉(zhuǎn)矩繞組給定電流iMd*、iMq*比較,比較誤差分別輸出到一一對應(yīng)的第三PI調(diào)節(jié)器17和第四PI調(diào)節(jié)器18,比較誤差經(jīng)第三PI調(diào)節(jié)器17和第四PI調(diào)節(jié)器18處理后生成d-q坐標(biāo)系下的轉(zhuǎn)矩繞組電壓VMd*和VMq*。第三PI調(diào)節(jié)器17和第四PI調(diào)節(jié)器18輸出端與第二IPARK變換器20輸入端連接,第二IPARK變換器20依據(jù)光電編碼器26輸出的電機(jī)轉(zhuǎn)子角度θ處理d-q坐標(biāo)系下的轉(zhuǎn)矩繞組電壓VMd*和VMq*生成α-β坐標(biāo)系下的轉(zhuǎn)矩繞組電壓V*和V*。第二IPARK變換器20的輸出端與第二SVPWM22的輸入端相連,α-β坐標(biāo)系下的轉(zhuǎn)矩繞組電壓V*和V*經(jīng)第二SVPWM22處理后生成電壓源逆變器的開關(guān)信號(hào)ST(T=1,2,3,4,5,6)。第二SVPWM22的輸出端與第二電壓源逆變器24的輸入端相連,電壓源逆變器母線電壓VDC輸入第二電壓源逆變器24,第二電壓源逆變器24根據(jù)開關(guān)信號(hào)控制無軸承永磁同步電機(jī)的轉(zhuǎn)矩繞組。

3.構(gòu)造執(zhí)行器神經(jīng)網(wǎng)絡(luò)5與評價(jià)器神經(jīng)網(wǎng)絡(luò)8

本發(fā)明采用一個(gè)執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)同時(shí)實(shí)現(xiàn)執(zhí)行器和評價(jià)器的學(xué)習(xí),如圖3所示,執(zhí)行器與評價(jià)器共享執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)的輸入層和隱含層資源。執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)共有三層,第一層為輸入層節(jié)點(diǎn)數(shù)為3個(gè),第二層為隱含層節(jié)點(diǎn)數(shù)為8個(gè),第三層為輸出層節(jié)點(diǎn)數(shù)為4個(gè)。第一層為輸入層,每個(gè)輸入節(jié)點(diǎn)代表狀態(tài)向量x(t)=[ex ey en]T的一個(gè)分量,其中T表示矩陣的轉(zhuǎn)置。第二層為隱含層,隱含層的節(jié)點(diǎn)基函數(shù)采用高斯核函數(shù)。第j個(gè)隱含層節(jié)點(diǎn)的輸出為:

其中:μj=[μ1j μ2j μ3j]T為第j個(gè)節(jié)點(diǎn)的基函數(shù)中心向量,μ1j,μ2j,μ3j分別對應(yīng)狀態(tài)變量ex,ey,en的基函數(shù)中心向量,T表示矩陣的轉(zhuǎn)置,σj為第j個(gè)節(jié)點(diǎn)的方差。第三層為輸出層由執(zhí)行器輸出和評價(jià)器輸出兩個(gè)部分組成。執(zhí)行器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)Im(t)和評價(jià)器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)V(t)由下面式子計(jì)算:

其中wjk(t)為第j個(gè)隱含層節(jié)點(diǎn)到執(zhí)行器的第k個(gè)輸出節(jié)點(diǎn)的權(quán)值。I1(t)、I2(t)、I3(t)、I4(t)分別對應(yīng)iBd*、iBq*、iMd*、iMq*。

其中vj(t)為第j個(gè)隱含層節(jié)點(diǎn)到評價(jià)器輸出節(jié)點(diǎn)的權(quán)值。

4.構(gòu)造強(qiáng)化信號(hào)模塊6

如圖4所示強(qiáng)化信號(hào)模塊有三個(gè)輸入端,一個(gè)輸出端。三個(gè)輸入為位移誤差ex、ey和轉(zhuǎn)速誤差en,輸出為強(qiáng)化信號(hào)r(t)。強(qiáng)化信號(hào)的計(jì)算由以下公式得到:

r(t)=αxrx(t)+αyry(t)+αnrn(t),

其中rx(t)、ry(t)和rn(t)分別為x軸向位移誤差強(qiáng)化信號(hào),y軸向位移誤差強(qiáng)化信號(hào)和轉(zhuǎn)子轉(zhuǎn)速誤差強(qiáng)化信號(hào)。αx、αy和αn分別為x軸向位移誤差強(qiáng)化信號(hào)系數(shù),y軸向位移誤差強(qiáng)化信號(hào)系數(shù)和轉(zhuǎn)子轉(zhuǎn)速誤差強(qiáng)化信號(hào)系數(shù)。在這里三個(gè)系數(shù)值都取0.3,系數(shù)的大小會(huì)影響控制器對位移反饋信號(hào)和轉(zhuǎn)速反饋信號(hào)的敏感度。

x軸向位移誤差強(qiáng)化信號(hào)rx(t),y軸向位移誤差強(qiáng)化信號(hào)ry(t)和轉(zhuǎn)子轉(zhuǎn)速誤差強(qiáng)化信號(hào)rn(t)的計(jì)算由以下公式得到:

其中εx、εy和εz分別為x軸向位移誤差信號(hào)的容許誤差帶,y軸向位移誤差信號(hào)的容許誤差帶和轉(zhuǎn)子轉(zhuǎn)速誤差信號(hào)的容許誤差帶。容許誤差帶的選取與反饋量本身的大小有關(guān),這里三個(gè)容許誤差帶統(tǒng)一設(shè)為反饋量大小的1%。

5.構(gòu)造瞬時(shí)差分模塊7

如圖5所示,瞬時(shí)差分模塊7有兩個(gè)輸入端兩個(gè)輸出端。兩個(gè)輸入分別為強(qiáng)化信號(hào)r(t),評價(jià)器神經(jīng)網(wǎng)絡(luò)輸出值函數(shù)V(t),兩個(gè)輸出相同都為瞬時(shí)差分信號(hào)δTD(t),TD表示瞬時(shí)差分。一個(gè)輸出到執(zhí)行器神經(jīng)網(wǎng)絡(luò)5,一個(gè)輸出到評價(jià)器神經(jīng)網(wǎng)絡(luò)8。瞬時(shí)差分信號(hào)δTD(t)的計(jì)算由以下公式得到:

δTD(t)=r(t)+γV(t+1)-V(t),

其中0≤γ≤1為折扣因子,其大小表明了未來的回報(bào)相對于當(dāng)前回報(bào)的重要程度。特別的,γ=0時(shí),相當(dāng)于只考慮立即不考慮長期回報(bào),γ=1時(shí),將長期回報(bào)和立即回報(bào)看得同等重要。V(t+1)和V(t)分別為更新前后的值函數(shù)。

6.確定執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)參數(shù)更新方式

在執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)中需要更新的參數(shù)有wjk,vj,μj和σj。其計(jì)算方法由如下公式得到:

wjk(t+1)=wjk(t)+αAδTD(t)Φj(t)

vj(t+1)=vj(t)+αCδTD(t)Φj(t)

其中αA和αC分別為執(zhí)行器和評價(jià)器的學(xué)習(xí)率,αμ和ασ分別為中心和方差的學(xué)習(xí)率,取值范圍均為0到1。

7.確定執(zhí)行器-評價(jià)器算法流程

本發(fā)明中的強(qiáng)化學(xué)習(xí)執(zhí)行器評價(jià)器算法流程如圖6所示。具體步驟如下:

步驟1:初始化執(zhí)行器評價(jià)器模塊2中各個(gè)參數(shù),包括wjk、vj、μj、σj、αx、αy、αn、εx、εy、εz、γ、αA、αC、αμ、ασ

步驟2:由系統(tǒng)輸出得到反饋值x、y、n。

步驟3:將反饋值x、y、n與給定值x*、y*、n*比較得到誤差ex、ey、en。并構(gòu)造狀態(tài)向量x(t)=[e x ey en]T。

步驟4:計(jì)算執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)的輸出Im(t)、V(t)。

步驟5:計(jì)算強(qiáng)化信號(hào)r(t)。

步驟6:計(jì)算下一采樣時(shí)間的系統(tǒng)輸出。

步驟7:計(jì)算t+1時(shí)刻執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)輸出Im(t+1)、V(t+1)。

步驟8:計(jì)算強(qiáng)化信號(hào)r(t+1)。

步驟9:計(jì)算瞬時(shí)差分信號(hào)δTD(t)。

步驟10:更新執(zhí)行器-評價(jià)器復(fù)合RBF神經(jīng)網(wǎng)絡(luò)的參數(shù)包括wjk、vj、μj、σj。

步驟11:判斷系統(tǒng)是否穩(wěn)定即誤差信號(hào)是否處于容許誤差帶。若系統(tǒng)穩(wěn)定則結(jié)束流程,否則跳轉(zhuǎn)到步驟6。

最終由上述執(zhí)行器-評價(jià)器模塊2與懸浮繞組電流控制模塊3、轉(zhuǎn)矩繞組電流控制模塊4共同組成完整的無軸承永磁同步電機(jī)強(qiáng)化學(xué)習(xí)控制器1,如圖1所示。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1