專利名稱:基于具有離散限制軟計(jì)算的非線性動(dòng)態(tài)控制的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及非線性電子控制系統(tǒng)優(yōu)化。
背景技術(shù):
反饋控制系統(tǒng)廣泛用于維持動(dòng)態(tài)系統(tǒng)的輸出為一個(gè)期望值,盡管外部干擾可能會(huì)使該輸出偏離期望值。例如,受自動(dòng)調(diào)溫器控制的家用空間加熱爐就是反饋控制系統(tǒng)的一個(gè)例子。自動(dòng)調(diào)溫器不斷測(cè)量房間內(nèi)部的空氣溫度,并且當(dāng)溫度低于期望的最小溫度時(shí)自動(dòng)調(diào)溫器開啟加熱爐。當(dāng)內(nèi)部溫度達(dá)到期望的最低溫度時(shí),自動(dòng)調(diào)溫器關(guān)閉加熱爐。不管外部干擾如何,例如外部溫度的降低,自動(dòng)調(diào)溫器—加熱爐系統(tǒng)保持房間內(nèi)的溫度為一個(gè)基本上不變的值。許多應(yīng)用中使用到類似類型的反饋控制。
反饋控制系統(tǒng)內(nèi)的主要元件是可定義為“設(shè)備”的、輸出變量將受到控制的受控對(duì)象、機(jī)器、或過程。在上面例子中,該“設(shè)備”為房間,輸出變量為房間的內(nèi)部空氣溫度,干擾則為通過房間墻壁的熱流動(dòng)(分散)。該設(shè)備被一個(gè)控制系統(tǒng)控制。在上面的例子中,控制系統(tǒng)為自動(dòng)調(diào)溫器結(jié)合加熱爐。自動(dòng)調(diào)溫器—加熱爐系統(tǒng)使用簡(jiǎn)單的開啟—關(guān)閉反饋控制系統(tǒng)來維持房間的溫度。在許多控制環(huán)境下,例如電機(jī)軸位置或者馬達(dá)速度控制系統(tǒng),簡(jiǎn)單的開啟—關(guān)閉反饋控制是不夠的。更高級(jí)的控制系統(tǒng)則依靠比例反饋控制、積分反饋控制與微分反饋控制的結(jié)合?;诒壤答仭⒎e分反饋、及微分反饋之和的反饋控制通常稱為PID(比例積分微分)控制。
PID控制系統(tǒng)為一種基于設(shè)備的動(dòng)力學(xué)模型的線性控制系統(tǒng)。在經(jīng)典的控制系統(tǒng)中,線性動(dòng)力學(xué)模型以通常是常微分方程的動(dòng)態(tài)方程形式獲得。該設(shè)備被假設(shè)為相對(duì)線性、非時(shí)變的、穩(wěn)定的。然而,許多真實(shí)世界的設(shè)備是時(shí)變的、高度非線性的、且不穩(wěn)定。例如,動(dòng)力學(xué)模型可能包含一些參數(shù)(例如質(zhì)量、電感、及空氣動(dòng)力學(xué)系數(shù),等等),它們只是近似已知或者依賴于變化的環(huán)境。如果參數(shù)變化較小,且動(dòng)力學(xué)模型穩(wěn)定,那么PID控制器可能符合要求。然而,如果參數(shù)變化較大或者如果動(dòng)力學(xué)模型不穩(wěn)定,那么一般要給PID控制系統(tǒng)增加自適應(yīng)或智能(AI)控制功能。
AI控制系統(tǒng)使用一種優(yōu)化器,典型為非線性優(yōu)化器,來程序控制PID控制器的運(yùn)轉(zhuǎn),從而改善控制系統(tǒng)的總體運(yùn)轉(zhuǎn)。
經(jīng)典的高級(jí)控制理論是基于下述假設(shè)靠近平衡點(diǎn)的所有受控“設(shè)備”都可以用線性系統(tǒng)近似。不幸的是,這個(gè)假設(shè)在真實(shí)世界中幾乎不成立。絕大多數(shù)設(shè)備是高度非線性的,經(jīng)常沒有簡(jiǎn)單的控制算法。為了滿足對(duì)非線性控制的這些需求,已經(jīng)發(fā)展出了使用諸如遺傳算法(GA)、模糊神經(jīng)網(wǎng)絡(luò)(FNN)、模糊控制器等軟計(jì)算概念的系統(tǒng)。通過這些技術(shù),控制系統(tǒng)及時(shí)進(jìn)化(改變),使自身適應(yīng)受控“設(shè)備”和/或工作環(huán)境內(nèi)可能發(fā)生的變化。
許多受控設(shè)備必須以逐步的方式從一個(gè)控制狀態(tài)轉(zhuǎn)移到另一個(gè)控制狀態(tài)。例如,步進(jìn)馬達(dá)通過按受控增量步進(jìn)來移動(dòng),它不能任意地從第一個(gè)軸位置移動(dòng)到第二個(gè)軸位置而不步進(jìn)經(jīng)過第一軸位置和第二軸位置之間的所有軸位置。基于具有遺傳分析器軟計(jì)算的現(xiàn)有技術(shù)控制系統(tǒng)不一定能很好地適合于必須以逐步方式改變或控制的設(shè)備,其部分原因在于遺傳分析器的運(yùn)轉(zhuǎn)。遺傳分析器的染色體典型地是按照用于控制設(shè)備的一個(gè)或多個(gè)控制參數(shù)的值來編碼。遺傳優(yōu)化器發(fā)現(xiàn)新的控制參數(shù),而不考慮先前控制參數(shù)的值或者從先前的控制參數(shù)移動(dòng)到新控制參數(shù)時(shí)施加的限制。
發(fā)明內(nèi)容
本發(fā)明通過提供基于離散限制(discrete constraints)的遺傳分析器解決了這些或其它難題。在一個(gè)實(shí)施例中,具有步進(jìn)編碼染色體(step-codedchromosomes)的遺傳算法用于獲得教學(xué)信號(hào)(teaching signal),該信號(hào)為諸如步進(jìn)限制控制器等具有離散限制的控制器提供了良好的控制質(zhì)量。步進(jìn)編碼染色體是指至少部分染色體被限制在一個(gè)逐步字符列(stepwise alphabet)中的染色體。步進(jìn)編碼染色體也可以具有為位置編碼(即以非步進(jìn)限制的、相對(duì)更為連續(xù)的方式編碼)的部分。
在一個(gè)實(shí)施例中,控制系統(tǒng)使用基于最小熵這一物理定律的適應(yīng)(性能)函數(shù)。在一個(gè)實(shí)施方案中,遺傳分析器在離線模式下使用,以便為形成知識(shí)庫的模糊邏輯分類器系統(tǒng)提供一個(gè)教學(xué)信號(hào)。該教學(xué)信號(hào)可以通過使用知識(shí)庫的知識(shí)來運(yùn)轉(zhuǎn)的模糊控制器被在線逼近。該控制系統(tǒng)可以用于控制由非線性、非穩(wěn)定、耗散模型描述的復(fù)雜設(shè)備。在一個(gè)實(shí)施例中,步進(jìn)限制控制系統(tǒng)被構(gòu)造成用于控制步進(jìn)馬達(dá)、逐步致動(dòng)器、或其它步進(jìn)限制系統(tǒng)。
在一個(gè)實(shí)施例中,控制系統(tǒng)包含一個(gè)學(xué)習(xí)系統(tǒng),例如由遺傳分析器訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。遺傳分析器使用了可在最大化傳感器信息的同時(shí)最小化熵產(chǎn)生的適應(yīng)函數(shù)。
在一個(gè)實(shí)施例中,懸架控制系統(tǒng)使用來自學(xué)習(xí)控制單元的熵的時(shí)間微分(導(dǎo)數(shù))與受控制過程(或受控制過程的模型)內(nèi)熵的時(shí)間微分之差,作為對(duì)控制性能的度量。在一個(gè)實(shí)施例中,熵的計(jì)算是基于被視為開放式動(dòng)態(tài)系統(tǒng)的受控制過程設(shè)備運(yùn)動(dòng)方程的熱動(dòng)力學(xué)模型。
該控制系統(tǒng)由遺傳分析器訓(xùn)練,該遺傳分析器為各個(gè)解空間產(chǎn)生一個(gè)教學(xué)信號(hào)。被優(yōu)化的控制系統(tǒng)基于從一個(gè)或多個(gè)傳感器獲得的數(shù)據(jù)提供優(yōu)化控制信號(hào)。例如,在懸架系統(tǒng)中,可以使用眾多角度及位置傳感器。在離線學(xué)習(xí)模式下(例如在實(shí)驗(yàn)室、工廠、服務(wù)中心等),使用車輛及其懸架系統(tǒng)的動(dòng)力學(xué)模型(或模擬)制定出模糊規(guī)則。來自動(dòng)力學(xué)模型的數(shù)據(jù)被提供給熵計(jì)算器,該熵計(jì)算器計(jì)算模型的輸入和輸出熵產(chǎn)生。輸入和輸出熵產(chǎn)生被提供給適應(yīng)函數(shù)計(jì)算器,該適應(yīng)函數(shù)計(jì)算器計(jì)算適應(yīng)函數(shù),作為受一個(gè)或多個(gè)約束限制的遺傳分析器的熵產(chǎn)生之差。遺傳分析器使用適應(yīng)函數(shù)獲得用于離線控制系統(tǒng)的訓(xùn)練信號(hào)。來自離線控制系統(tǒng)的控制參數(shù)(以知識(shí)庫的形式)隨后被提供至在設(shè)備內(nèi)的、使用來自知識(shí)庫的信息獲得控制策略的在線控制系統(tǒng)。
一個(gè)實(shí)施例包括一種通過獲得由控制器提供到設(shè)備的熵的時(shí)間微分(dSc/dt)與該設(shè)備的熵的時(shí)間微分(dSu/dt)之間的熵產(chǎn)生之差來控制非線性對(duì)象(設(shè)備)的方法。使用熵產(chǎn)生之差作為適應(yīng)(性能)函數(shù)的步進(jìn)編碼遺傳算法進(jìn)化出在離線控制器中的控制規(guī)則。設(shè)備的非線性穩(wěn)定性特性則使用Lyapunov函數(shù)來評(píng)估。遺傳分析器使熵最小化,并最大化了傳感器信息內(nèi)容。
在一個(gè)實(shí)施例中,該控制方法也包括通過遺傳算法發(fā)展出相對(duì)于控制器變量的控制規(guī)則。遺傳算法使用基于提供到設(shè)備的熵的時(shí)間微分(dSc/dt)與該設(shè)備的熵的時(shí)間微分(dSu/dt)之間的差的適應(yīng)函數(shù)。可以使用發(fā)展的控制規(guī)則來修正變量。
在一個(gè)實(shí)施例中,本發(fā)明包含一個(gè)適于控制非線性設(shè)備的自組織控制系統(tǒng)。該控制系統(tǒng)包括一個(gè)模擬器,該模擬器被設(shè)計(jì)成使用設(shè)備非線性運(yùn)動(dòng)方程的熱動(dòng)力學(xué)模型。在一個(gè)實(shí)施例中,該熱動(dòng)力學(xué)模型基于Lyapunov函數(shù)(V),并且該模擬器使用函數(shù)V來分析設(shè)備狀態(tài)穩(wěn)定性的控制??刂葡到y(tǒng)計(jì)算由控制設(shè)備的低電平控制器提供到設(shè)備的熵對(duì)時(shí)間的微分(dSc/dt)與該設(shè)備的熵對(duì)時(shí)間的微分(dSu/dt)之間的熵產(chǎn)生之差。熵產(chǎn)生之差被遺傳算法所使用以獲得一個(gè)適應(yīng)函數(shù),在該適應(yīng)函數(shù)中該熵產(chǎn)生之差以受限制的方式被最小化。該教學(xué)信號(hào)被提供到模糊邏輯分類器,該模糊邏輯分類器通過使用學(xué)習(xí)過程決定一個(gè)或多個(gè)模糊規(guī)則。模糊邏輯控制器也被設(shè)計(jì)用于形成一個(gè)或多個(gè)設(shè)定車輛內(nèi)控制器的控制變量的控制規(guī)則。
在一個(gè)實(shí)施例中,本發(fā)明包括一種基于最小化熵產(chǎn)生的對(duì)控制質(zhì)量的新的物理估量(physical measure),并把該物理估量用于優(yōu)化控制系統(tǒng)設(shè)計(jì)中遺傳算法的適應(yīng)函數(shù)。該方法在步進(jìn)限制控制系統(tǒng)內(nèi)提供一個(gè)局部熵反饋回路。熵反饋回路通過聯(lián)系設(shè)備的穩(wěn)定性(使用Lyapunov函數(shù))和設(shè)備的可控制性(基于步進(jìn)限制控制系統(tǒng)的產(chǎn)生熵)為優(yōu)化控制結(jié)構(gòu)設(shè)計(jì)做準(zhǔn)備。步進(jìn)限制控制系統(tǒng)適用于諸多控制系統(tǒng),包括例如機(jī)械系統(tǒng)、生物機(jī)械系統(tǒng)、機(jī)器人技術(shù)、機(jī)電系統(tǒng)等控制系統(tǒng)。
圖1示出了基于軟計(jì)算的自組織智能控制系統(tǒng)的總體結(jié)構(gòu)。
圖2示出了控制質(zhì)量模擬系統(tǒng)(SSCQ)。
圖3示出了基于軟計(jì)算的具有限制控制系統(tǒng)的自組織智能控制系統(tǒng)的一般結(jié)構(gòu)。
圖4示出了限制控制系統(tǒng)的控制質(zhì)量模擬系統(tǒng)。
圖5A示出了具有SSCQ動(dòng)態(tài)系統(tǒng)模型的模擬方框圖。
圖5B示出了SSCQ模式的時(shí)間表示。
圖6為SSCQ的流程圖。
圖7A為正常編碼的染色體。
圖7B示出了染色體的步進(jìn)編碼。
圖7C為步進(jìn)限制控制系統(tǒng)的示意圖。
圖8A示出了基因5為位置編碼通配符的示意圖。
圖8B示出了與圖8A對(duì)應(yīng)的位置編碼控制系統(tǒng)的輸出。
圖9A示出了基因5為步進(jìn)編碼通配符的示意圖。
圖9B示出了與圖9A對(duì)應(yīng)的步進(jìn)編碼控制系統(tǒng)的輸出。
圖10為遺傳算法的編碼及評(píng)估運(yùn)算的流程圖。
圖11為輪盤式(roulette wheel)(蒙特—卡羅)選擇運(yùn)算的流程圖。
圖12為交叉運(yùn)算的流程圖。
圖13為突變運(yùn)算的流程圖。
圖14A至圖14N是表示Holmes-Rand(Duffing-Van der Pol)動(dòng)態(tài)系統(tǒng)吸引子的本質(zhì)的曲線圖。
圖15A至圖15C是表示Holmes-Rand(Duffing-Van der Pol)動(dòng)態(tài)系統(tǒng)的三維吸引子的本質(zhì)的曲線圖。
圖16A至圖16N是表示具有正態(tài)概率分布的隨機(jī)激發(fā)下Holmes-Rand(Duffing-Van der Pol)動(dòng)態(tài)系統(tǒng)吸引子的本質(zhì)的曲線圖。
圖17A至圖17C是表示具有正態(tài)概率分布的隨機(jī)激發(fā)下Holmes-Rand(Duffing-Van der Pol)動(dòng)態(tài)系統(tǒng)三維吸引子的本質(zhì)的曲線圖。
圖18示出了具有位置編碼GA(根據(jù)表1進(jìn)行編碼)的Holmes-Rand(Duffing-Van der Pol)動(dòng)態(tài)系統(tǒng)的SSCQ控制的GA優(yōu)化動(dòng)力學(xué)。
圖19示出了具有步進(jìn)GA(根據(jù)表2進(jìn)行編碼)的Holmes-Rand(Duffing-Van der Pol)動(dòng)態(tài)系統(tǒng)的SSCQ控制的GA優(yōu)化動(dòng)力學(xué)。
圖20A至圖20N是表示使用根據(jù)表1的GA編碼方法的控制信號(hào)優(yōu)化結(jié)果的曲線圖。
圖21A至圖21C是表示使用根據(jù)表1的GA編碼方法的控制信號(hào)優(yōu)化的三維結(jié)果的曲線圖。
圖22A至圖22N是表示使用根據(jù)表2的GA編碼方法的控制信號(hào)優(yōu)化的結(jié)果的曲線圖。
圖23A至圖23C是表示使用根據(jù)表2的GA編碼方法的控制信號(hào)優(yōu)化的三維結(jié)果的曲線圖。
圖24A至圖24C是表示時(shí)間間隔為0到60秒時(shí),比較使用根據(jù)表1編碼方法與使用根據(jù)表2編碼方法的控制之間的曲線圖。
圖25A至圖25C是表示時(shí)間間隔為20到15秒時(shí),比較使用根據(jù)表1編碼方法與使用根據(jù)表2編碼方法的控制之間的曲線圖。
圖26A至圖26F是表示使用根據(jù)表1的編碼方法獲得的控制誤差和控制信號(hào)的曲線圖。
圖27A至圖27F是表示使用根據(jù)表2的編碼方法獲得的控制誤差和控制信號(hào)的曲線圖。
圖28A至圖28C是表示控制誤差累積的比較的曲線圖。
圖29A至圖29B是表示隨機(jī)激發(fā)(限帶白噪音的平均值為0.0,方差為1.0)的曲線圖。
圖30A至圖30F是表示時(shí)間間隔為0到15秒時(shí),車輛懸架系統(tǒng)模型的控制結(jié)果的曲線圖。
圖31A至圖31D是表示時(shí)間間隔為0到15秒時(shí),得到的用于控制車輛懸架系統(tǒng)模型的優(yōu)化控制信號(hào)的曲線圖。
圖32A至圖32F是表示圖30A至30F中時(shí)間間隔為5到7秒時(shí)的控制的曲線圖。
圖33A至圖33D是表示圖31A至31D中時(shí)間間隔為5到7秒時(shí)的控制的曲線圖。
圖34A至圖34D是表示適應(yīng)函數(shù)分量累積的曲線圖。
圖35A示出了具有可調(diào)整阻尼器的懸架控制車輛的控制阻尼器布局。
圖35B示出了用于懸架控制車輛的可調(diào)整阻尼器。
圖35C示出了在圖8B的可調(diào)整阻尼器中的用于軟阻尼和硬阻尼的液體流。
圖36示出了圖35A至圖35C所示可調(diào)整阻尼器的阻尼力特性。
具體實(shí)施例方式
圖1為基于軟計(jì)算的用于控制設(shè)備的控制系統(tǒng)100的方框圖。在控制器100內(nèi),參考信號(hào)y被提供到加法器105的第一輸入。加法器105的輸出為一個(gè)誤差信號(hào)ε,該誤差信號(hào)并被提供到模糊控制器(FC)143的輸入以及比例—積分—微分(PID)控制器150的輸入端。PID控制器150的輸出為控制信號(hào)u*,該控制信號(hào)被提供到設(shè)備120的控制輸入以及熵計(jì)算模塊132的第一輸入。干擾m(t)110也被提供到設(shè)備120的輸入。設(shè)備120的輸出為響應(yīng)x,該響應(yīng)被提供到熵計(jì)算模塊132的第二輸入以及加法器105的第二輸入。加法器105的第二輸入被求反,使得加法器105的輸出(誤差信號(hào))為第一輸入的值減去第二輸入的值。
熵計(jì)算模塊132的輸出被作為適應(yīng)函數(shù)提供到遺傳分析器(GA)131。GA131的輸出解被提供到FNN(模糊神經(jīng)網(wǎng)絡(luò))142的輸入。FNN 142的輸出作為知識(shí)庫被提供到FC 143。FC 143的輸出作為增益排表(gain schedule)被提供到PID控制器150。
GA 131與熵計(jì)算模塊132為控制質(zhì)量模擬系統(tǒng)(SSCQ)130的一部分。FNN 142及FC 143為模糊邏輯分類器系統(tǒng)(FLCS)140的一部分。
使用一組輸入以及適應(yīng)函數(shù)132,GA 131工作的方式類似于獲得一個(gè)更靠近優(yōu)化值的解的進(jìn)化過程。GA 131產(chǎn)生多組“染色體”(即,可能的解),隨后通過使用適應(yīng)函數(shù)132評(píng)估各個(gè)解,對(duì)染色體進(jìn)行分類。適應(yīng)函數(shù)132決定各個(gè)解的適應(yīng)程度等級(jí)。更為適應(yīng)的染色體(解)則對(duì)應(yīng)于適應(yīng)程度排位高的解。較不適應(yīng)的染色體則對(duì)應(yīng)于適應(yīng)程度排位低的解。
更為適應(yīng)的染色體被保留(生存),較不適應(yīng)的染色體被遺棄(死亡)。創(chuàng)建新的染色體替代被遺棄的染色體。通過交叉現(xiàn)存染色體的片斷以及引入突變來創(chuàng)建新的染色體。
PID控制器150具有線性傳遞函數(shù),因此是基于受控“設(shè)備”120的線性運(yùn)動(dòng)方程。用于程序控制PID控制器的現(xiàn)有技術(shù)遺傳算法通常使用簡(jiǎn)單的適應(yīng)函數(shù),因此無法解決通常線性模型中可控制性差的問題。如同絕大多數(shù)優(yōu)化器那樣,優(yōu)化的成功與否經(jīng)常最終取決于性能(適應(yīng))函數(shù)的選擇。
評(píng)估非線性設(shè)備的運(yùn)動(dòng)特性通常是困難的,部分原因在于缺乏普適的分析方法。按照慣例,控制具有非線性運(yùn)動(dòng)特性的設(shè)備時(shí),通常是找到設(shè)備的幾個(gè)特定的平衡點(diǎn),設(shè)備的運(yùn)動(dòng)特性在靠近平衡點(diǎn)的附近區(qū)域被線性化。隨后,控制則基于對(duì)平衡點(diǎn)附近的偽(線性化)運(yùn)動(dòng)特性進(jìn)行評(píng)估。這種技術(shù)對(duì)于由不穩(wěn)定或耗散的模型描述的設(shè)備即使有效,其效果也很小。
基于軟計(jì)算的優(yōu)化控制計(jì)算包括GA 131,作為在固定的正解空間內(nèi)全面搜尋優(yōu)化解的第一步。GA 131搜索設(shè)備的一組控制權(quán)重(control weight)K。在產(chǎn)生被施加到設(shè)備的信號(hào)δ(K)中,傳統(tǒng)的比例—積分—微分(PID)控制器150使用權(quán)重向量K={k1,…,kn}。與在此信號(hào)下設(shè)備行為相關(guān)的熵S(δ(K))被假設(shè)為適應(yīng)函數(shù)以最小化。GA 131以規(guī)則的時(shí)間間隔重復(fù)幾次,以產(chǎn)生一組權(quán)重向量。GA 131產(chǎn)生的向量隨后被提供到FNN 142,F(xiàn)NN 142的輸出隨后被提供到模糊控制器143。模糊控制器143輸出為PID控制器150的增益排表的匯集。對(duì)基于GA的軟計(jì)算系統(tǒng),經(jīng)典的控制中經(jīng)常沒有實(shí)際的控制定律,但相反地,本發(fā)明的控制是基于諸如最小熵產(chǎn)生的物理控制定律。
圖2所示為SSCQ 130的一個(gè)實(shí)施例,它是為FLCS 140產(chǎn)生教學(xué)信號(hào)Ki的離線模塊。圖10示出了SSCQ 230的結(jié)構(gòu)。SSCQ 230為SSCQ 130的一個(gè)實(shí)施例。除了SSCQ 230以外,圖2還示出了隨機(jī)激發(fā)信號(hào)發(fā)生器210、模擬模型220、PID控制器250、以及計(jì)時(shí)器20。SSCQ 230包含模式選擇器229、緩沖器i2301、GA 231、緩沖器e2302、PID控制器234、適應(yīng)函數(shù)計(jì)算器232及評(píng)估模型236。
計(jì)時(shí)器200控制SSCQ 230的激活時(shí)刻。計(jì)時(shí)器200的輸出被提供至模式選擇器2304的輸入。模式選擇器2304控制SSCQ 230的運(yùn)行模式。在SSCQ230內(nèi),參考信號(hào)y被提供到適應(yīng)函數(shù)計(jì)算器232的第一輸入。適應(yīng)函數(shù)計(jì)算器232的輸出被提供到GA 231的輸入。GA 231的輸出CGSe通過緩沖器2302被提供到PID控制器234的訓(xùn)練輸入。控制器234的輸出Ue被提供到評(píng)估模型236的輸入。評(píng)估模型236的輸出Xe被提供到適應(yīng)函數(shù)計(jì)算器232的第二輸入。GA 231的輸出CGSi(通過緩沖器2301)被提供到PID控制器250的訓(xùn)練輸入。PID控制器250的控制輸出被提供到懸架系統(tǒng)模擬模型220的控制輸入。隨機(jī)激發(fā)發(fā)生器210,為模擬模型220的干擾輸入和評(píng)估模型236的干擾輸入提供一個(gè)隨機(jī)激發(fā)信號(hào)。系統(tǒng)模擬模型220的響應(yīng)輸出Xi被提供到評(píng)估模型236的訓(xùn)練輸入。通過結(jié)合GA 1031(通過緩沖器2301)的CGSi輸出和系統(tǒng)模擬模型220的響應(yīng)信號(hào)Xi,獲得SSCQ 230的輸出向量Ki。
隨機(jī)激發(fā)信號(hào)發(fā)生器210產(chǎn)生激發(fā)信號(hào)。激發(fā)信號(hào)可以是使用隨機(jī)模擬獲得的激發(fā),或者它可以是真實(shí)的測(cè)量環(huán)境。塊210針對(duì)計(jì)時(shí)器200產(chǎn)生的各個(gè)時(shí)刻產(chǎn)生激發(fā)信號(hào)。
模擬模型220為控制對(duì)象的動(dòng)力學(xué)模型。控制質(zhì)量的模擬系統(tǒng)(SSCQ)230是關(guān)于結(jié)構(gòu)的主優(yōu)化塊。它是一個(gè)離散的時(shí)間塊,其取樣時(shí)間通常等于控制系統(tǒng)的取樣時(shí)間。
在評(píng)估函數(shù)232的內(nèi)部計(jì)算熵產(chǎn)生速率,其值包含在評(píng)估模型的輸出(Xe)內(nèi)。
下述時(shí)間變量被用到TSSCQ調(diào)用的時(shí)間;Tc控制系統(tǒng)的采樣時(shí)間;TeSSCQ的評(píng)估(觀察)時(shí)間;tc具有固定控制參數(shù)的模擬模型的積分間隔,tc∈[T;T+Tc];以及teSSCQ的評(píng)估(觀察)時(shí)間間隔,te∈[T;T+Te]。
在許多實(shí)施例中,當(dāng)控制系統(tǒng)單元用于產(chǎn)生離散脈沖至控制致動(dòng)器,隨后增大或減小與控制致動(dòng)器(圖3)規(guī)格相關(guān)的控制系數(shù)時(shí),SSCQ 130可以用于執(zhí)行不同類型非線性動(dòng)態(tài)系統(tǒng)的優(yōu)化控制。
圖4示出了離散或步進(jìn)限制控制致動(dòng)器的SSCQ 430的結(jié)構(gòu),并在與圖4相關(guān)的正文中對(duì)其進(jìn)行更詳細(xì)地描述。SSCQ 430與SSCQ 230類似,因此兩者都可以用圖5A的流程圖來描述。圖5A闡明了下述五個(gè)步驟1.在初始時(shí)刻(T=0),SSCQ模塊230或430被激活,并產(chǎn)生初始控制信號(hào)2303 CGSi(T)。
2.使用來自隨機(jī)激發(fā)發(fā)生器210的隨機(jī)激發(fā)信號(hào)以及來自第一時(shí)間間隔tc的控制信號(hào)CGSi(T)2303對(duì)模擬模型220積分,模擬模型220產(chǎn)生輸出Xi204。
3.輸出Xi204以及輸出CGSi(T)2301被作為教學(xué)信號(hào)Ki存儲(chǔ)在數(shù)據(jù)文件內(nèi)。
4.時(shí)間T以Tc為增量增加(偽碼,T=T+Tc)。
5.重復(fù)步驟1至4,直到隨機(jī)信號(hào)結(jié)束。
一般而言,SSCQ有兩種工作模式1.使用遺傳算法231更新緩沖器i2301;2.從緩沖器i2301提取CGSi(T)。
模式選擇器2304使用當(dāng)前時(shí)刻T的信息來控制SSCQ430的當(dāng)前模式,如圖5B所示。
圖6為SSCQ調(diào)用流程圖,它結(jié)合了下述步驟1.選擇模式如果為GA模式則轉(zhuǎn)到步驟2,否則轉(zhuǎn)到步驟10;2.初始化GA、初始化評(píng)估模型參數(shù)、清除緩沖器i;
3.啟動(dòng)遺傳算法231;4.產(chǎn)生初始群體;5.通過下述步驟為每個(gè)染色體指定適應(yīng)值i.將當(dāng)前狀態(tài)Xi(T)204設(shè)定為評(píng)估模型236的初始狀態(tài);對(duì)當(dāng)前染色體進(jìn)行解碼并把解碼結(jié)果寫入評(píng)估緩沖器e2302;ii.使用來自發(fā)生器210的隨機(jī)信號(hào)和來自緩沖器e2302的控制信號(hào)CGSe(te)在時(shí)間間隔te上對(duì)評(píng)估模型236積分;iii.在塊232內(nèi)使用輸出Xe來計(jì)算適應(yīng)值,它是評(píng)估模型236對(duì)編碼到當(dāng)前染色體的控制信號(hào)CGSe(te)的響應(yīng)。
6.執(zhí)行GA終止測(cè)試。如果GA終止測(cè)試回答“是”,則隨后結(jié)束GA轉(zhuǎn)到步驟9;否則進(jìn)入步驟7;7.對(duì)當(dāng)前代執(zhí)行遺傳運(yùn)算獲得新一代;8.重復(fù)步驟5至7,直到GA終止測(cè)試結(jié)果為正;9.對(duì)最后一代的最佳染色體進(jìn)行解碼,把解碼結(jié)果寫入緩沖器i2301;10.從緩沖器i2301提取當(dāng)前控制值CGSi(T)2303。
下表1的一組行向量示出了緩沖器i2301及緩沖器e2302的結(jié)構(gòu),其中各行的第一項(xiàng)為時(shí)間值,其它項(xiàng)為與時(shí)間值關(guān)聯(lián)的控制參數(shù)。因此,緩沖器i2301存儲(chǔ)了用于評(píng)估時(shí)間間隔te的優(yōu)化控制值,以控制模擬模型,緩沖器e2302存儲(chǔ)了用于評(píng)估時(shí)間間隔te的暫時(shí)控制值,以計(jì)算適應(yīng)函數(shù)。
表<1>
模擬模型220及評(píng)估模型236通常使用類似的模型。系統(tǒng)微分方程的數(shù)值積分有多種不同方法。實(shí)踐中,這些方法可以分為兩大類a)具有積分誤差控制的變步長(zhǎng)積分方法;以及b)沒有積分誤差控制的固定步長(zhǎng)積分方法。
使用a)型方法的數(shù)值積分非常準(zhǔn)確,但較耗費(fèi)時(shí)間。b)型方法較快,但精度相對(duì)較低。在GA模式中的各次SSCQ調(diào)用時(shí),遺傳算法231調(diào)用適應(yīng)函數(shù)好幾百次。各個(gè)計(jì)算通常包括對(duì)動(dòng)態(tài)系統(tǒng)的模型積分,這引起計(jì)算復(fù)雜性的指數(shù)增長(zhǎng)。
選擇足夠小的積分步長(zhǎng),可以調(diào)整固定步長(zhǎng)的求解器,使得在相對(duì)短的時(shí)間間隔(例如評(píng)估間隔te)內(nèi)的積分誤差較小,從而在對(duì)評(píng)估模型236積分的評(píng)估回路內(nèi)可使用固定步長(zhǎng)積分。為減小總積分誤差,可以在模擬模型220內(nèi)使用高階(high-order)變步長(zhǎng)積分的結(jié)果作為評(píng)估模型積分的初始條件。
為了獲得更高的精確度,使用變步長(zhǎng)求解器對(duì)評(píng)估模型進(jìn)行積分通常是有利的。不幸的是,這種變步長(zhǎng)積分器的速度極慢,特別是動(dòng)力學(xué)模型相對(duì)復(fù)雜時(shí),例如懸架系統(tǒng)模型。
在SSCQ 230內(nèi),適應(yīng)函數(shù)計(jì)算塊232使用評(píng)估模型236對(duì)控制信號(hào)CGSe(te)和參考信號(hào)Y 238的響應(yīng)(Xe)237來計(jì)算適應(yīng)函數(shù)。
適應(yīng)函數(shù)被看作是評(píng)估模型236的響應(yīng)矩陣(xe)的選定分量的向量。其絕對(duì)值平方的通式如下Fitness2=Σt∈[T;Te][Σiwi(xite)2+Σjwj(yj-xjte)2+Σkwk(xkte)2]→min---(1)]]>其中i為絕對(duì)值應(yīng)被最小化的狀態(tài)變量的指數(shù);j為控制誤差應(yīng)被最小化的狀態(tài)變量的指數(shù);k為頻率分量應(yīng)被最小化的狀態(tài)變量的指數(shù);yi為參考信號(hào)Y 238的分量;wr(r=i,j,k)為表達(dá)相應(yīng)參數(shù)的相對(duì)重要性的權(quán)重因子。通過設(shè)定這些權(quán)重因子,可選擇出那些與控制對(duì)象的要求行為更為相關(guān)的評(píng)估模型的輸出單元。例如,為控制車輛懸架系統(tǒng),這些系數(shù)可以用于代表從人的舒適度角度考慮的相應(yīng)要素的重要性。在發(fā)展之初,權(quán)重因子具有一些經(jīng)驗(yàn)值,隨后可以使用實(shí)驗(yàn)結(jié)果來對(duì)其進(jìn)行調(diào)整。
頻率分量的提取可以使用用于獲得濾波器參數(shù)的標(biāo)準(zhǔn)數(shù)字濾波技術(shù)來實(shí)現(xiàn)。標(biāo)準(zhǔn)差分方程可以用于矩陣Xe的xek列分量a(1)f(xke(te(N)))=b(1)xke(te(N))+b(2)xke(te(N-1))+...+b(nb+1)xke(te(N-nb))-]]>-a(2)xke(te(N-1))-...-a(na+1)xke(te(N-na))---(2)]]>其中a、b為濾波器參數(shù);N為當(dāng)前點(diǎn)的數(shù)目;na、nb為過濾器的級(jí)數(shù)。對(duì)于巴特渥斯(Butterworth)濾波器,nb=na。
每個(gè)機(jī)電控制系統(tǒng)具有一定的時(shí)間延遲,這通常是由傳感器信號(hào)的模數(shù)轉(zhuǎn)換、計(jì)算單元內(nèi)控制增益的計(jì)算、以及控制致動(dòng)器的機(jī)械特性等引起。此外,許多控制單元并沒有連續(xù)特性。例如,當(dāng)控制制動(dòng)器為步進(jìn)馬達(dá)時(shí),這些步進(jìn)馬達(dá)在一個(gè)控制周期內(nèi)只能增加一步或減小一步。出于優(yōu)化的考慮,這種步進(jìn)限制可以限制SSCQ 130內(nèi)遺傳算法131的搜尋空間。換而言之,為了控制具有N個(gè)位置的步進(jìn)馬達(dá),每次更新步進(jìn)馬達(dá)的位置時(shí)無需檢查所有可能的N個(gè)位置。只要檢查步進(jìn)馬達(dá)位置前進(jìn)一步、后退一步或是保持原位時(shí)的情況就足夠了。這只給出三種可能性,從而把搜尋空間從N個(gè)點(diǎn)減小到三個(gè)點(diǎn)。搜尋空間的減小將使遺傳算法131的性能更佳,從而提高智能控制系統(tǒng)的總體性能。
如前所述,在許多實(shí)施例中,當(dāng)控制系統(tǒng)單元用于產(chǎn)生離散脈沖至控制致動(dòng)器,隨后增大或減小與控制致動(dòng)器(見圖3)規(guī)格相關(guān)的控制系數(shù)時(shí),SSCQ 130可以用于執(zhí)行不同類型非線性動(dòng)態(tài)系統(tǒng)的優(yōu)化控制。
不失一般性地,(圖1所示的)控制系統(tǒng)100內(nèi)的傳統(tǒng)PID控制器150可以用具有離散限制的PID控制器350替代,如圖3所示,從而形成一個(gè)新的控制系統(tǒng)300。這類控制被稱為步進(jìn)限制控制。用于步進(jìn)限制控制的SSCQ130的結(jié)構(gòu)如圖4所示,該圖為步進(jìn)限制SSCQ 430的方框圖。SSCQ 430在許多方面類似于SSCQ 230。圖2描述的SSCQ結(jié)構(gòu)230與圖4描述的SSCQ結(jié)構(gòu)430之間的不同在于緩沖器i2301和緩沖器e2302的結(jié)構(gòu)以及對(duì)PID控制器234及350的附加限制。此外,SSCQ 430內(nèi)的PID控制器受離散限制所限制,且SSCQ 430內(nèi)GA 231的染色體至少有一部分是步進(jìn)編碼而非位置編碼。在步進(jìn)限制控制的情況下,SSCQ緩沖器2301、2302具有表2所示的結(jié)構(gòu),它們可以通過針對(duì)GA 131內(nèi)的離散限制的新編碼方法來實(shí)現(xiàn)。
表<2>
表2中,時(shí)間列對(duì)應(yīng)染色體解碼之后的時(shí)間賦值,STEP表示在分別對(duì)應(yīng){前進(jìn)、保持、后退}的逐步字符列(alphabet){-1,0,1}內(nèi)的變化方向值。
為了把這些臺(tái)階狀控制信號(hào)對(duì)應(yīng)到控制器真實(shí)參數(shù),通過添加下述變換發(fā)展出一個(gè)接受此類臺(tái)階狀輸入的控制系統(tǒng)的附加模型 圖7A至圖7C示出GA 231的染色體在步進(jìn)編碼情況和位置編碼情況下的對(duì)比例子。
例如,在圖7A中示出了由遺傳算法231產(chǎn)生的用于控制比例步進(jìn)限制控制器的染色體,其步進(jìn)值為1,最小值為0,最大值為8(縱軸),控制器采樣時(shí)間TC為1秒鐘。圖7A至圖7C中的評(píng)估時(shí)間Te為20秒。
圖7B示出了由使用步進(jìn)編碼的GA 231產(chǎn)生的染色體的值。
圖7A及圖7B所示的染色體隨后被傳遞通過控制器,該控制器接收到的實(shí)際控制信號(hào)在圖7中示出。該控制器接收到的信號(hào)與圖7A及圖7B所示的兩個(gè)染色體相同。
在圖8中,示出了當(dāng)位置5為通配符(wildcard)時(shí)圖7A所描述的染色體。圖8A及圖8B中在位置5處使用同心圓表示改變位置5的值可獲得的各種組合??偣灿?種不同的組合,如圖8A所示,但控制系統(tǒng)的機(jī)械限制禁止了除了圖8B所示三種組合以外的其它組合。注意,GA可以獨(dú)立地檢查所有9種組合,即使給出的控制器輸出相同。還應(yīng)注意到,控制器的步進(jìn)限制將導(dǎo)致通配符效果的相對(duì)快速地消失。因此,諸如突變等后面將描述的遺傳運(yùn)算通常只產(chǎn)生局部效應(yīng)。
在圖9中,示出了當(dāng)位置5為通配符時(shí)圖7B所描述的染色體。各個(gè)同心圓表示改變位置5的值可獲得的一種組合??偣灿?種不同的組合(如圖9A),所有組合都將對(duì)控制系統(tǒng)的輸出產(chǎn)生影響(如圖9B)。注意,GA 430可以僅檢查3種組合,且其將具有不同的適應(yīng)值。只有達(dá)到控制信號(hào)范圍的極限,才會(huì)引起通配符效果的消失。因此,諸如突變等遺傳運(yùn)算通常產(chǎn)生全局效應(yīng),該染色體的結(jié)構(gòu)單元(building blocks)更好地對(duì)應(yīng)有效編碼的Goldberg原則。
步進(jìn)編碼減小了GA 430的搜尋空間。在這種情況下,用于GA搜尋空間的控制信號(hào)的范圍就相對(duì)不重要。相對(duì)更重要的參數(shù)則是評(píng)估時(shí)間Te、控制器采樣時(shí)間TC、及用于優(yōu)化的控制參數(shù)的數(shù)目。
GA理論遺傳算法是基于自然進(jìn)化機(jī)制的隨機(jī)搜尋算法。一群個(gè)體一代一代地進(jìn)化,最好的(最適應(yīng)的)個(gè)體的數(shù)量和質(zhì)量將提高,而最差的(較不適應(yīng)的)個(gè)體將消失。從算術(shù)角度來說,任何進(jìn)化算法可描述成下述元素的系統(tǒng)GA=<C,F(xiàn),P0,μ,Ω,Γ,Δ,Ψ>
其中C為編碼系統(tǒng);F為適應(yīng)函數(shù)(質(zhì)量標(biāo)準(zhǔn));P0為初始群體;μ為群體大??;Ω為選擇運(yùn)算;Γ為交叉運(yùn)算;PCR為交叉運(yùn)算的概率;Δ為突變運(yùn)算;PMU為突變運(yùn)算的概率;Ψ為終止條件。
編碼系統(tǒng)C為一個(gè)酉變換(unitary transformation),它定義了物理解空間和定義進(jìn)化(遺傳)運(yùn)算的數(shù)學(xué)空間之間的對(duì)應(yīng)關(guān)系(map)。編碼的一個(gè)簡(jiǎn)單例子為把實(shí)數(shù)映射到二進(jìn)制字符(binary string)的二進(jìn)制編碼A→CB:A∈Rn,B∈Bl={0,1}l]]>其中Rn為n維的真實(shí)向量空間,Bl為長(zhǎng)l的二進(jìn)制字符空間。這種情況下,l值越大,對(duì)Rn的數(shù)學(xué)表示就越真實(shí)。在許多實(shí)現(xiàn)中,使用二進(jìn)制編碼是因?yàn)樗子诙x諸多二進(jìn)制字符的進(jìn)化運(yùn)算。此外,由于數(shù)字計(jì)算機(jī)是基于二進(jìn)制邏輯,因此可以容易地把群體存儲(chǔ)為一組二進(jìn)制數(shù)。
初始群體P0是在編碼空間內(nèi)定義的一組元素。通常,在Bl的串的一個(gè)實(shí)施例中,它是從搜尋空間的所有元素的均勻分布內(nèi)提取的。
群體大小μ是指群體內(nèi)個(gè)體(染色體)的數(shù)目。
適應(yīng)函數(shù)F為一質(zhì)量標(biāo)準(zhǔn),它定義群體內(nèi)某個(gè)特定個(gè)體相對(duì)于該群體的其它元素的優(yōu)良程度。適應(yīng)函數(shù)通常被計(jì)算成一特定函數(shù)或特定動(dòng)態(tài)系統(tǒng)對(duì)相應(yīng)個(gè)體(染色體)內(nèi)編碼信息的響應(yīng)。對(duì)于進(jìn)化多個(gè)計(jì)算的復(fù)雜優(yōu)化問題,適應(yīng)函數(shù)計(jì)算是任何優(yōu)化算法包括進(jìn)化算法中的最耗時(shí)的部分。在絕大部分情況下,在計(jì)算適應(yīng)函數(shù)的絕對(duì)值之后,使用相對(duì)的(歸一化)值來分配群體內(nèi)的重要性。
圖10為遺傳算法的編碼和評(píng)估運(yùn)算的流程圖。選擇運(yùn)算Ω為概率運(yùn)算,其被定義用于把更多的具有高適應(yīng)值的染色體復(fù)制到下一代中。在一個(gè)實(shí)施例中,選擇運(yùn)算從初始群體中選擇一組個(gè)體到一已知的配對(duì)庫。該配對(duì)庫通常是大小為μ的中間群體,從中提取用于遺傳運(yùn)算的個(gè)體。在絕大部分遺傳算法實(shí)現(xiàn)中,選擇是基于如圖11所示的Monte-Carlo(蒙特—卡羅)方法,亦稱為輪盤式方法。輪盤的各個(gè)扇區(qū)代表了群體內(nèi)的一個(gè)體,各個(gè)扇區(qū)的大小正比于相應(yīng)個(gè)體的相對(duì)適應(yīng)度。如果輪盤旋轉(zhuǎn),則具有較高的相對(duì)適應(yīng)度的個(gè)體被選擇的概率正比于其相對(duì)適應(yīng)度(輪盤的扇區(qū)的大小)。
圖12為一典型遺傳算法的交叉運(yùn)算流程圖。交叉運(yùn)算Γ為概率運(yùn)算,其目的在于共享群體內(nèi)最佳個(gè)體之間的信息。交叉運(yùn)算PCR的概率通常是預(yù)先定義的。交叉運(yùn)算Γ的輸入為從選擇運(yùn)算Ω得到的配對(duì)庫。交叉運(yùn)算的機(jī)制如下1.從配對(duì)庫中選擇兩個(gè)染色體;2.從
中產(chǎn)生一個(gè)均勻分布的隨機(jī)數(shù)字。如果產(chǎn)生的數(shù)小于PCR則繼續(xù)下面的步驟;3.產(chǎn)生一個(gè)交叉點(diǎn)(來自[1 l]中的均勻分布的隨機(jī)整數(shù));4.替換從交叉點(diǎn)開始的被選擇染色體的正確部分;5.把染色體放入新群體;6.重復(fù)步驟1至5,直到新群體完整。
圖13為突變運(yùn)算的流程圖。突變運(yùn)算Δ為一概率運(yùn)算,其目的在于將新信息引入一群體中。突變運(yùn)算PMU的概率是預(yù)定的,其取決于搜尋空間的參數(shù)。通常,突變概率小于交叉概率。交叉運(yùn)算之后執(zhí)行突變運(yùn)算Δ。突變運(yùn)算的輸入是交叉運(yùn)算之后得到的新一代。突變運(yùn)算的機(jī)制如下1.從新一代中選擇第一染色體;2.從
中產(chǎn)生一個(gè)均勻分布的隨機(jī)數(shù)字,如果產(chǎn)生的數(shù)小于PMU則繼續(xù)步驟3,否則轉(zhuǎn)到步驟5;3.產(chǎn)生一個(gè)突變點(diǎn)(來自[1 l]中的均勻分布的隨機(jī)整數(shù));4.對(duì)突變點(diǎn)指向的基因進(jìn)行如下變換基因(突變點(diǎn))=基因(突變點(diǎn))1,其中表示模2加法00=0,01=1,10=1,11=0;5.選擇下一個(gè)染色體并重復(fù)步驟2至4,直到新群體的最后一個(gè)染色體經(jīng)過突變過程。
遺傳算法的終止條件可預(yù)先定義,且定義方式根據(jù)具體問題而各不相同。在一個(gè)實(shí)施例中,它可以是群體所賴以進(jìn)化的一定數(shù)目的代。在某些情況下,它可以是說明算法在某種意義上是收斂的。在一個(gè)實(shí)施例中,收斂標(biāo)準(zhǔn)可以基于當(dāng)前代和先前代的最佳適應(yīng)度之間的差別。如果這個(gè)差別小于一預(yù)定數(shù),則算法停止。在一個(gè)實(shí)施例中,當(dāng)整個(gè)代包含相同或類似個(gè)體時(shí),則認(rèn)為算法是收斂的。
各個(gè)遺傳算法都有特定的一組參數(shù),包括群體大小μ、最大數(shù)目代GN、交叉運(yùn)算概率PCR、以及突變運(yùn)算概率PMU。
這些參數(shù)依賴于搜尋空間參數(shù)。利用Holland模式定理的原理可以獲得這些參數(shù)。描述Holland定理需要如下所述的一些附加定義。模式(schemata)是用類似的基因型(例如,選擇染色體的共同部分)來表示群體內(nèi)的個(gè)體組,而用星號(hào)(表示通配符)替換不同部分。例如,對(duì)于一個(gè)二進(jìn)制字符列,染色體[101111]及[101001]可以用模式S=[101**1]表示,其中“*”表示該位置可以為任意值。
在其定義位置上與模式匹配的個(gè)體被稱作該模式的一個(gè)代表。
模式o(S)的級(jí)數(shù)就是被定義位置的數(shù)目。對(duì)于上面模式S,其級(jí)數(shù)為o(S)=4。
保持為1或0的最左邊比特(bit)位置bleft與最右邊比特(bit)位置bright之間的距離稱為模式的定義長(zhǎng)度δ(S),可以通過δ(S)=bright-bleft來計(jì)算。對(duì)于上面的例子,δ(S)=6-3=3。
遺傳算法的隱藏平行(implicit parallelism)對(duì)于長(zhǎng)為l的串,各串代表2l個(gè)模式。例如,串1101長(zhǎng)度為4,因此代表下述24=16個(gè)模式1100、110*、11*0、11**、1*00、1*0*、1**0、1***、*100、*10*、*1*0、*1**、**00、**0*、***0、0***、****。
如果群體有n個(gè)串,模式的總數(shù)NS為2l≤NS≤n2l。由于各個(gè)串可以代表許多模式,所以這就意味著具有多個(gè)串的群體上定義的GA運(yùn)算具有更多數(shù)目的平行模式。這種特性稱為GA的隱藏平行。
如果在時(shí)間t時(shí)在一個(gè)群體中,模式S具有n(S,t)個(gè)代表串,那么就有可能計(jì)算出這些給定模式中有多少個(gè)將出現(xiàn)在下一代n(S,t+1)中。這個(gè)數(shù)目取決于選擇運(yùn)算、交叉運(yùn)算及突變運(yùn)算。接下來將先單獨(dú)地,再組合起來考慮各個(gè)運(yùn)算的效果。
選擇運(yùn)算根據(jù)選擇運(yùn)算的結(jié)構(gòu),個(gè)體xi被復(fù)制到新一代的概率p(xi)取決于其適應(yīng)值f(xi)與群體內(nèi)所有個(gè)體的總適應(yīng)值F之比p(xi)=f(xi)/F (4)因此,代表模式S的一串Si被復(fù)制到下一代的概率p(Si)定義為p(Si)=f(Si)/F (5)其中f(Si)為串Si的適應(yīng)值,F(xiàn)為群體內(nèi)所有串的總適應(yīng)值。
根據(jù)式(4),模式S的各個(gè)代表Si被復(fù)制到配對(duì)庫Nf(Si)/F次。因此,n(S,t+1)=Σi=1nNf(Si)/F---(6)]]>考慮模式S的平均適應(yīng)值,為f(S)=Σi=1nf(Si)n---(7)]]>由方程(7)可知Σi=1nf(Si)=f(S)n---(8)]]>利用方程(8)可以把方程(6)重新寫成n(S,t+1)=n(S,t)Nf(S)/F (9)其中f(S)為模式S的適應(yīng)函數(shù)的平均值;n為不重疊的代表串的數(shù)目;F為群體內(nèi)所有串(N)的所有適應(yīng)函數(shù)之和。
考慮群體內(nèi)所有串的適應(yīng)值的平均值f(P)=F/N。然后方程(9)可以寫成n(S,t+1)=n(S,t)f(S)/f(P)(10)這表明模式代表的數(shù)目一代一代增加,增加的速率取決于其平均適應(yīng)值與群體平均適應(yīng)值之比。適應(yīng)值高的模式,其代表數(shù)目增加。適應(yīng)值小的模式數(shù)目減小。
例如,對(duì)于一個(gè)適應(yīng)值大于群體平均值的模式f(S)=(1+k)f(P)=f(P)+kf(P) (11)于是,n(S,t+1)=n(S,t)[f(P)+kf(P)]/f(P)=n(S,t)(1+k)(12)
n代之后代表S的數(shù)目為n(S,t+n)=n(S,t)(1+k)n+1(13)方程(13)就是著名的Holland定理1。根據(jù)Holland定理1具有大于平均適應(yīng)值(f(S)>f(P))模式代表的數(shù)目在群體內(nèi)指數(shù)增長(zhǎng),而小于平均適應(yīng)值(f(S)<f(P))模式代表的數(shù)目在群體內(nèi)指數(shù)減小。
交叉運(yùn)算盡管復(fù)制運(yùn)算有效地提高了代表的百分比,但該過程基本上是不育的。它無法創(chuàng)建新的更好的串。交叉及突變算子實(shí)現(xiàn)此功能。
例如,假設(shè)群體包含串A和串B。串A為模式S1和S2的代表,而串B既不代表S1也不代表S2。于是,串和模式由下式給出S1=**0*|***1S2=****|01**A=0100|0101(S1、S2)B=1010|1000(沒有S1、沒有S2)交叉算子匹配隨機(jī)的串對(duì)。該算子在隨機(jī)確定的位置切斷串,并把所有位(bit)與剪斷點(diǎn)右邊進(jìn)行交換。對(duì)串A和B進(jìn)行交叉后產(chǎn)生下述新串A’、B’A′=0100|1000(沒有S1、沒有S2)B′=1010|0101(S1)現(xiàn)在串A’不代表模式S1和S2,而串B’代表S2。這個(gè)事實(shí)表明交叉算子可以減小模式代表的數(shù)目。
模式S從隨機(jī)選擇的切斷點(diǎn)(交叉點(diǎn))失去一個(gè)代表的概率Plost可以表示如下Plost=PCRδ(S)/(l-1)其中PCR為交叉概率,l為串的長(zhǎng)度。
Pretaining定義為保留代表的模式S的概率,于是,Pretaining=1-Plast=1-pcδ(S)/(l-1)(14)結(jié)合方程(9)、(14),得n(S,t+1)≥[n(S,t)f(S)/f(P)][1-PCRδ(S)/(l-1)] (15)方程(15)對(duì)應(yīng)Holland定理2,它表明模式的增長(zhǎng)取決于其代表的適應(yīng)函數(shù)的值及其定義長(zhǎng)度。
因此,適應(yīng)函數(shù)大、定義長(zhǎng)度短的模式更為多產(chǎn)。
突變運(yùn)算串的各位有機(jī)會(huì)突變成其相反的值。假設(shè)PMU為任一位的突變概率。于是,位不變化的概率為(1-PMU)。如果串代表具有o(S)位為0或1的模式,那么串內(nèi)所有相應(yīng)的o(S)位不突變的概率為(1-PMU)o(S)。換而言之,突變后的串保留模式的一個(gè)代表的概率為(1-PMU)o(S)(16)由于PMU通常較小,于是式(16)可簡(jiǎn)化為(1-o(S)PMU)(17)復(fù)制、交叉及突變的組合效果可以寫成如下。結(jié)合方程(15)、(17)可以得到下述Holland模式定理n(S,t+1)≥[n(S,t)f(S)/f(P)][1-PCRδ(S)/l-1][1-o(S)PMU] (18)如果模式適應(yīng)值大、定義長(zhǎng)度短、級(jí)數(shù)小,則模式會(huì)指數(shù)增長(zhǎng)。
方程(18)中用到下述符號(hào)名稱n(S,t)為模式S在時(shí)間t時(shí)的代表數(shù)目;f(S)為模式S的平均適應(yīng)函數(shù);f(P)為群體內(nèi)的平均適應(yīng)函數(shù);PCR為交叉概率;l為串長(zhǎng)度;δ(S)為模式S的定義長(zhǎng)度;o(S)為模式S的級(jí)數(shù);PMU為任一位處的突變概率。
編碼問題上面的公開涉及到一種簡(jiǎn)單的編碼方案,它使用二進(jìn)制字符列,而不檢查該二進(jìn)制編碼是否是優(yōu)化的或有效的。實(shí)驗(yàn)觀察顯示,盡管編碼不同,但GA不僅強(qiáng)壯,而且通常會(huì)產(chǎn)生好的結(jié)果。但是,該編碼方法會(huì)對(duì)GA的精確度和效率產(chǎn)生重大影響。
1989年Goldberg提出有效編碼的兩條原則1.最小字符列的原則;以及2.有意義構(gòu)建單元的原則用戶應(yīng)該選擇一種編碼,使得短定義長(zhǎng)度及低級(jí)數(shù)模式與給定的問題相關(guān)聯(lián)。
小的字符列產(chǎn)生的串可能較長(zhǎng)。這種情況下,隱藏平行特性的效率增強(qiáng)。對(duì)于給定長(zhǎng)度的串,二進(jìn)制字符列可產(chǎn)生最大數(shù)目的模式,使得二進(jìn)制字符列成為編碼的優(yōu)化選擇。但是,并非一定要使用二進(jìn)制編碼。GA中也可使用其它編碼方法。例如,可使用具有實(shí)數(shù)或整數(shù)數(shù)字的實(shí)數(shù)編碼的染色體。
遵循遺傳算法理論的結(jié)果,并將GA有效編碼原則映射到限制控制問題,這種控制信號(hào)的最短字符列為步進(jìn)字符列,諸如可解釋為{“后退一步”,“保持原位”,“前進(jìn)一步”}的{-1,0,1}。使用兩個(gè)二進(jìn)制位,并利用下述映射表解釋這些數(shù),可以更有效的計(jì)算機(jī)實(shí)現(xiàn)該字符列
Holmes-Rand(Duffing-Van der Pol)振蕩器的控制Holmes-Rand(Duffing-Van der Pol)動(dòng)態(tài)系統(tǒng)的運(yùn)動(dòng)方程具有如下形式x··+(x2-1)x·-x+x3=u(t)+ζ(t)---(19)]]>其中u(t)為控制信號(hào),ζ(t)為隨機(jī)激發(fā)信號(hào)。
在一個(gè)實(shí)施例中,可以由下述控制函數(shù)產(chǎn)生作為PID控制信號(hào)的控制信號(hào)u(t)u(t)=kP(t)e+kD(t)e·+kI(t)∫0te(t)dt---(20)]]>其中e=y(tǒng)(t)-x(t)為控制誤差,y(t)為用戶定義的參考信號(hào)。
在一個(gè)實(shí)施例中,控制增益kP、kD、kI具有逐步限制。因此,該實(shí)施例的控制系統(tǒng)優(yōu)化結(jié)構(gòu)可以描述成如圖4所示,控制信號(hào)可以根據(jù)表2編碼。
這種情況下,設(shè)備的熵產(chǎn)生速率為dSPdt=1T(x2-1)x·2---(21)]]>控制系統(tǒng)的熵產(chǎn)生速率為dSCdtkDe·2---(22)]]>動(dòng)能為T=x·22---(23)]]>勢(shì)能為
U=x44-x22---(24)]]>圖14A至14N示出了方程(19)的非線性動(dòng)態(tài)系統(tǒng)的自由動(dòng)力學(xué)及熱動(dòng)力學(xué)運(yùn)動(dòng)的模擬結(jié)果。圖14A示出了系統(tǒng)(19)坐標(biāo)x的動(dòng)力學(xué)進(jìn)化。圖14B示出了系統(tǒng)(19)速度 的動(dòng)力學(xué)進(jìn)化,其中x軸為系統(tǒng)坐標(biāo)x,y軸為系統(tǒng)速度 圖14D示出Holmes-Rand振蕩器的動(dòng)能進(jìn)化。圖14E示出Holmes-Rand振蕩器的勢(shì)能導(dǎo)數(shù)的相圖。圖14F示出動(dòng)能的速度相圖。圖14G示出Holmes-Rand振蕩器的勢(shì)能進(jìn)化。圖14H示出Holmes-Rand振蕩器勢(shì)能的坐標(biāo)相圖。圖14I、圖14J及圖14K分別示出Holmes-Rand振蕩器的總能量進(jìn)化、總能量的坐標(biāo)相圖、總能量的速度相圖。
圖14L示出設(shè)備熵產(chǎn)生進(jìn)化。圖14M示出設(shè)備熵進(jìn)化。圖14N示出Holmes-Rand振蕩器的設(shè)備熵的相圖。
圖15A至圖15C示出了非線性動(dòng)態(tài)系統(tǒng)(19)的自由動(dòng)力學(xué)及熱動(dòng)力學(xué)運(yùn)動(dòng)的模擬結(jié)果。圖15A至圖15C中各圖的x軸及y軸分別為坐標(biāo)x及速度 圖15A示出吸引子的總能量。圖15B示出吸引子的熵產(chǎn)生。圖15C示出吸引子的熵。
圖16A至圖16N示出了對(duì)在隨機(jī)激發(fā)下非線性動(dòng)態(tài)系統(tǒng)(19)的動(dòng)力學(xué)及熱動(dòng)力學(xué)運(yùn)動(dòng)的模擬。激發(fā)信號(hào)ζ(t)是平均值為零的限帶白噪音。
圖16A示出了系統(tǒng)(19)的坐標(biāo)x的動(dòng)態(tài)進(jìn)化。圖16B示出了系統(tǒng)(19)的速度 的動(dòng)態(tài)進(jìn)化,其中x軸為系統(tǒng)坐標(biāo)x,y軸為系統(tǒng)速度 圖16D示出Holmes-Rand振蕩器的動(dòng)能進(jìn)化。圖16E示出Holmes-Rand振蕩器相圖的勢(shì)能導(dǎo)數(shù)。圖16F示出動(dòng)能的速度相圖。圖16G示出了Holmes-Rand振蕩器的勢(shì)能進(jìn)化。圖16H示出Holmes-Rand振蕩器的勢(shì)能坐標(biāo)相圖。圖16I、圖16J及圖16K分別示出Holmes-Rand振蕩器的總能量進(jìn)化、總能量的坐標(biāo)相圖、總能量的速度相圖。
圖16L示出設(shè)備熵產(chǎn)生的進(jìn)化。圖16M示出設(shè)備熵的進(jìn)化。圖16N示出Holmes-Rand振蕩器的設(shè)備熵的相圖。
圖17A至圖17C示出了與圖16A至圖16N相應(yīng)的模擬結(jié)果。圖17A至圖17C中各圖的x軸及y軸分別為坐標(biāo)x及速度 圖17A示出吸引子的總能量。圖17B示出吸引子的熵產(chǎn)生。圖17C示出吸引子的熵。
圖18示出了用于SSCQ 230的GA 231的性能。這種情況下,參考信號(hào)y(t)=sin(4π60t)]]>與存在隨機(jī)激發(fā)ζ(t)時(shí)系統(tǒng)(19)的坐標(biāo)x之間的誤差信號(hào)的最小化即為適應(yīng)函數(shù),其中隨機(jī)激發(fā)ζ(t)是平均值為零的限帶高斯(Gaussian)白噪音。為了提高GA 231對(duì)適應(yīng)函數(shù)變化的靈敏度,適應(yīng)函數(shù)被表示成下述形式Fitness=11+Σt=Tt=T+TE(y(t)-x(t))2→max---(25)]]>此時(shí)控制系統(tǒng)具有如下參數(shù)Ki∈
,i={P,D,I}控制器每隔0.01秒鐘就改變?cè)鲆嫦禂?shù)(gain coefficient)(TC=0.01秒),每個(gè)系數(shù)的步進(jìn)為0.1。SSCQ 230的評(píng)估時(shí)間Te取為4秒鐘。對(duì)于這個(gè)例子,GA 231群體大小設(shè)為50個(gè)染色體,GA 231應(yīng)進(jìn)化的代數(shù)(generationnumber)設(shè)為10。
圖18示出了時(shí)間間隔t∈
(第一個(gè)SSCQ調(diào)用)內(nèi)GA 231的性能,其中根據(jù)表1規(guī)定GA的搜尋空間。圖16示出根據(jù)表2規(guī)定GA搜尋空間的相應(yīng)情況。x軸代表代數(shù)。y軸代表適應(yīng)函數(shù)(25)的值。各點(diǎn)代表單個(gè)染色體的適應(yīng)值。在圖18中,初始群體內(nèi)染色體適應(yīng)值的分布范圍為
,10代之后GA達(dá)到適應(yīng)值0.87。
在圖19中,初始群體內(nèi)染色體適應(yīng)值的分布范圍為
,10代之后GA達(dá)到適應(yīng)值0.92。因此,根據(jù)表2的編碼可得到更好的適應(yīng)函數(shù)性能。
圖20A至圖20N以及圖21A至圖21C示出了系統(tǒng)(19)的、基于根據(jù)表1編碼的控制結(jié)果。圖22A至圖22N以及圖23A至圖23C則對(duì)應(yīng)根據(jù)表2的編碼。
圖20A示出系統(tǒng)(19)的坐標(biāo)x的動(dòng)態(tài)進(jìn)化。圖20B示出方程(19)的系統(tǒng)的速度 的動(dòng)態(tài)進(jìn)化,其中x軸為系統(tǒng)坐標(biāo)x,y軸為系統(tǒng)速度 圖20D示出Holmes-Rand振蕩器的動(dòng)能進(jìn)化。圖20E示出Holmes-Rand振蕩器相圖的勢(shì)能導(dǎo)數(shù)。圖20F示出動(dòng)能的速度相圖。圖20G示出了Holmes-Rand振蕩器的勢(shì)能進(jìn)化。圖20H示出Holmes-Rand振蕩器的勢(shì)能坐標(biāo)相圖。圖20I、圖20J及圖20K分別示出Holmes-Rand振蕩器的總能量進(jìn)化、總能量的坐標(biāo)相圖、總能量的速度相圖。
圖20L示出設(shè)備熵產(chǎn)生的進(jìn)化。圖20M示出設(shè)備熵的進(jìn)化。圖20N示出Holmes-Rand振蕩器的設(shè)備熵的相圖。
圖21A至圖21C示出了與圖20A至圖20N相應(yīng)的模擬結(jié)果。圖21A至圖21C中各圖的x軸及y軸分別為坐標(biāo)x及速度 圖21A示出吸引子的總能量。圖21B示出吸引子的熵產(chǎn)生。圖21C示出吸引子的熵。
圖22A示出系統(tǒng)(19)的坐標(biāo)x的動(dòng)態(tài)進(jìn)化。圖22B示出方程(19)的系統(tǒng)的速度 的動(dòng)態(tài)進(jìn)化,其中x軸為系統(tǒng)坐標(biāo)x,y軸為系統(tǒng)速度 圖22D示出Holmes-Rand振蕩器的動(dòng)能進(jìn)化。圖22E示出Holmes-Rand振蕩器相圖的勢(shì)能導(dǎo)數(shù)。圖22F示出動(dòng)能的速度相圖。圖22G示出了Holmes-Rand振蕩器的勢(shì)能進(jìn)化。圖22H示出Holmes-Rand振蕩器的勢(shì)能坐標(biāo)相圖。圖22I、圖22J及圖22K分別示出Holmes-Rand振蕩器的總能量進(jìn)化、總能量的坐標(biāo)相圖、總能量的速度相圖。
圖22L示出設(shè)備熵產(chǎn)生的進(jìn)化。圖22M示出設(shè)備熵的進(jìn)化。圖22N示出Holmes-Rand振蕩器設(shè)備熵的相圖。
圖23A至圖23C示出了與圖22A至圖22N相對(duì)應(yīng)的模擬結(jié)果。圖23A至圖23C中各圖的x軸及y軸分別為坐標(biāo)x及速度 圖23A示出吸引子的總能量。圖23B示出吸引子的熵產(chǎn)生。圖23C示出吸引子的熵。
圖20A至圖20N、圖21A至圖21C、圖22A至圖22N、圖23A至圖23C中所示結(jié)果表明,使用兩種方法對(duì)有噪音的系統(tǒng)(19)的SSCQ控制均具有良好的性能。圖24至圖28示出這些結(jié)果的更多分析。
圖24A至圖24C比較時(shí)間間隔為0到60秒時(shí),使用位置編碼和步進(jìn)編碼的動(dòng)態(tài)結(jié)果。圖24A示出對(duì)位置編碼和步進(jìn)編碼過程的坐標(biāo)x的進(jìn)化。圖24B示出對(duì)位置編碼和步進(jìn)編碼過程的速度 的進(jìn)化。圖24C示出對(duì)位置編碼和步進(jìn)編碼過程的平方控制誤差信號(hào)(squared control error signal)的進(jìn)化。
圖25A至圖25C比較了圖24A至圖24C中時(shí)間間隔為20到25秒時(shí),使用位置編碼和步進(jìn)編碼的動(dòng)態(tài)結(jié)果。圖25A示出對(duì)位置編碼和步進(jìn)編碼過程的坐標(biāo)x的進(jìn)化。圖25B示出對(duì)位置編碼和步進(jìn)編碼過程的速度 的進(jìn)化。圖25C示出對(duì)位置編碼和步進(jìn)編碼過程的平方控制誤差信號(hào)的進(jìn)化。
特別地,圖24C和圖25C表明,與位置編碼相比,步進(jìn)編碼的控制誤差更小,控制性能更佳。由于使用表2所示的編碼縮減了搜尋空間,所以GA 430性能的提高,從而使得控制誤差更小。
圖26A至圖26F示出使用表1所示方法的、用于位置編碼控制的PID控制器的控制誤差進(jìn)化及增益系數(shù)進(jìn)化。類似地,圖27A至圖27F示出使用表2所示方法的、用于位置編碼控制的PID控制器的控制誤差進(jìn)化及增益系數(shù)進(jìn)化。圖26A及圖27A示出了誤差信號(hào)。圖26B及圖27B示出了誤差信號(hào)的時(shí)間導(dǎo)數(shù)。圖26C及圖27C示出了誤差信號(hào)的時(shí)間積分。圖26D及圖27D示出了PID控制器的比例增益(proportional gain)K1。圖26E及圖27E示出了PID控制器的微分增益(derivative gain)K2。圖26F及圖27F示出了PID控制器的積分增益(integral gain)K3。
圖28A至圖28C示出了使用位置編碼和步進(jìn)編碼的平方控制誤差累積(squared control error accumulation)。圖28A至圖28C的y軸被計(jì)算成相應(yīng)的平方控制誤差隨模擬時(shí)間的累積之和。圖28A示出平方誤差累積。圖28B示出平方微分誤差累積(squared differential error accumulation)。圖28C示出平方積分誤差累積(squared integral error accumulation)。圖28A至圖28C中,與表1所描述的位置編碼方法相比,表2所描述的步進(jìn)編碼方法使性能提高約50%。
圖29A示出了上述的Holmes-Rand振蕩器中用到的隨機(jī)激發(fā)信號(hào)。圖29B示出了圖29A的隨機(jī)激發(fā)信號(hào)的概率分布函數(shù)。
車輛懸架系統(tǒng)的控制標(biāo)題為“INTELLIGENT MECHANTRONIC CONTROL SUSPENSIONSYSTEM BASED ON SOFT COMPUTING”的美國(guó)專利公開號(hào)10/033370描述了一種主動(dòng)式車輛懸架控制系統(tǒng),該專利在此被全部引用作為參考。
圖35A示出了車輛主體3510、左側(cè)車輪3532及3534、右側(cè)車輪3531及3533。圖8A也示出了分別為車輪3531至3534提供可調(diào)整阻尼的阻尼器3501至3504。在一個(gè)實(shí)施例中,阻尼器3501至3504為受電子控制器3536控制的電子控制阻尼器。在一個(gè)實(shí)施例中,各個(gè)阻尼器上的一步進(jìn)馬達(dá)致動(dòng)器控制一個(gè)油閥。在各回轉(zhuǎn)閥位置內(nèi)的油流決定了由阻尼器提供的阻尼因子。
圖35B示出一種可調(diào)整阻尼器3517,該阻尼器具有一個(gè)控制回轉(zhuǎn)閥3512的致動(dòng)器3518。硬阻尼閥3511允許液體流入可調(diào)整阻尼器3517以產(chǎn)生硬阻尼。軟阻尼閥3513允許液體流入可調(diào)整阻尼器3517以產(chǎn)生軟阻尼?;剞D(zhuǎn)閥3512控制流過軟阻尼閥3513的液體的數(shù)量。致動(dòng)器3518控制回轉(zhuǎn)閥3512,以允許更多或更小的液體流過軟阻尼閥3513,從而產(chǎn)生預(yù)期的阻尼。在一個(gè)實(shí)施例中,致動(dòng)器3518為一個(gè)步進(jìn)馬達(dá)。該致動(dòng)器3518接收來自控制器3510的控制信號(hào)。
圖35C示出了當(dāng)回轉(zhuǎn)閥3512打開時(shí),液體流過軟阻尼閥3513。圖35C還示出了當(dāng)回轉(zhuǎn)閥3512關(guān)閉時(shí),液體流過硬阻尼閥3512。
圖36示出了阻尼力特性,即當(dāng)回轉(zhuǎn)閥放置在硬阻尼位置及軟阻尼位置時(shí),阻尼力相對(duì)于活塞速度的特性。步進(jìn)馬達(dá)控制該閥,以將其放置在軟阻尼位置和硬阻尼位置之間,以產(chǎn)生中等阻尼力。
下述例子展示了用于控制車輛阻尼器3501至3504(即車輛減震器)的步進(jìn)編碼方法的結(jié)果。該方法是懸架系統(tǒng)應(yīng)用的示意性說明,因?yàn)楦鱾€(gè)控制閥在各控制周期內(nèi)可以改變一個(gè)步進(jìn)位置。在該示意例子中,最大控制閥的范圍為0到8,控制系統(tǒng)的采樣周期為7.5毫秒。
下述結(jié)果表明,步進(jìn)編碼方法對(duì)控制半主動(dòng)車輛懸架性能的改進(jìn)。這里示出的結(jié)果內(nèi)的SSCQ模塊(兩種情況下)具有下述參數(shù)評(píng)估時(shí)間Te=1.5秒、GA 231共50代、GA 231群體大小為100。兩種情況中優(yōu)化的適應(yīng)函數(shù)包含表3所示的各個(gè)分量。
表3 省略了權(quán)重分子的值表示將該參數(shù)排除掉形成了優(yōu)化。
根據(jù)表3和廣義的適應(yīng)函數(shù)方程(1)、車輛懸架系統(tǒng)控制的適應(yīng)函數(shù)可以描述為Fitness2=Σt∈[T;Tc][Σiwi(xite)2]→min---(26)]]>其中i為表3所示的系統(tǒng)狀態(tài)變量的指數(shù),這些分量的絕對(duì)值將被最小化。
在一個(gè)實(shí)施例中,xite代表相應(yīng)狀態(tài)變量的頻率分量??梢愿鶕?jù)乘客的舒適度要求來選擇該頻率分量。
圖30A至圖30F中示出了,具有從表SS1中選取的參數(shù)的適應(yīng)函數(shù)(26)的優(yōu)化模擬結(jié)果。圖30A示出舉起加速度輸出 圖30D示出舉起速度輸出(heave acceleration output) 圖30B示出俯仰加速度輸出(pitch accelerationoutput) 圖30E示出俯仰速度輸出 圖30C示出翻滾加速度輸出(rollacceleration output) 圖30F示出翻滾速度輸出 圖31A至圖31D分別示出了根據(jù)表1所示編碼方法以及根據(jù)表2所示編碼方法得到的左前、右前、左后、右后減震器的控制信號(hào)。
圖32A至圖32F分別為時(shí)間間隔為5到7秒時(shí)、圖30A至圖30F的放大版本。
圖30A至圖30F及圖32A至圖32F表明,當(dāng)使用步進(jìn)方法對(duì)控制信號(hào)進(jìn)行編碼時(shí)優(yōu)化結(jié)果得到改進(jìn)。優(yōu)化的適應(yīng)函數(shù)分量的幅度小于步進(jìn)編碼的情況。
圖34A至圖34D示出了基于控制信號(hào)累積誤差的優(yōu)化性能的比較。圖34A及圖34B示出使用表3中權(quán)重系數(shù)的適應(yīng)函數(shù)的平方分量。結(jié)果表明,對(duì)于依賴于多個(gè)系統(tǒng)參數(shù)和狀態(tài)變量的復(fù)雜適應(yīng)函數(shù),與使用通常的直接編碼方法相比,表2所描述的步進(jìn)編碼方法使優(yōu)化性能得到改進(jìn)。
盡管結(jié)合特定實(shí)施例描述了本發(fā)明,但那些對(duì)于本領(lǐng)域的普通技術(shù)人員而言明顯的實(shí)施例是在本發(fā)明范圍內(nèi)。在不離開本發(fā)明的精神和范圍下,可進(jìn)行諸多改變和修改。因此,本發(fā)明的范圍由隨后的權(quán)利要求定義。
權(quán)利要求
1.一種用于優(yōu)化知識(shí)庫的自組織控制系統(tǒng),包括模糊神經(jīng)網(wǎng)絡(luò),其被設(shè)計(jì)成為模糊控制器發(fā)展知識(shí)庫;遺傳分析器,其被設(shè)計(jì)成為所述模糊邏輯分類器發(fā)展教學(xué)信號(hào),所述教學(xué)信號(hào)被設(shè)計(jì)成提供預(yù)期的一組控制質(zhì)量,所述遺傳分析器使用多個(gè)染色體,所述染色體的一部分被步進(jìn)編碼;及具有離散限制的PID控制器,所述PID控制器被設(shè)計(jì)成接收來自所述模糊控制器的增益排表。
2.根據(jù)權(quán)利要求1所述的自組織控制系統(tǒng),其中,該系統(tǒng)還包括反饋模塊,用于模擬所述模糊邏輯懸架控制器的查找表。
3.根據(jù)權(quán)利要求1所述的自組織控制系統(tǒng),其中,所述遺傳分析器模塊使用適應(yīng)函數(shù),該適應(yīng)函數(shù)降低由所述PID控制器控制的設(shè)備內(nèi)的熵產(chǎn)生。
4.根據(jù)權(quán)利要求1所述的自組織控制系統(tǒng),其中,所述遺傳分析器模塊包含基于最小熵物理定律的適應(yīng)函數(shù)。
5.根據(jù)權(quán)利要求1所述的自組織控制系統(tǒng),其中,所述遺傳分析器在離線模式下使用,以提供所述訓(xùn)練信號(hào)。
6.根據(jù)權(quán)利要求1所述的自組織控制系統(tǒng),其中,所述步進(jìn)編碼染色體包括前進(jìn)、后退、及保持的字符列。
7.根據(jù)權(quán)利要求1所述的自組織控制系統(tǒng),其中,該系統(tǒng)還包括評(píng)估模型,用于為基于熵的適應(yīng)函數(shù)提供輸入。
8.根據(jù)權(quán)利要求7所述的自組織控制系統(tǒng),其中,該系統(tǒng)還包括模糊控制器,其使用來自該知識(shí)庫的知識(shí)來近似該教學(xué)信號(hào)。
9.一種用于設(shè)備的控制系統(tǒng),包括被設(shè)計(jì)成控制模糊控制器的神經(jīng)網(wǎng)絡(luò),所述模糊控制器被設(shè)計(jì)成控制具有離散限制的線性控制器;被設(shè)計(jì)成訓(xùn)練所述神經(jīng)網(wǎng)絡(luò)的遺傳分析器,所述遺傳分析器使用步進(jìn)編碼染色體。
10.根據(jù)權(quán)利要求9所述的控制系統(tǒng),其中,所述遺傳分析器使用來自學(xué)習(xí)控制單元的控制信號(hào)中的熵的時(shí)間微分與該設(shè)備內(nèi)的熵的時(shí)間微分之差,來作為對(duì)控制性能的度量。
11.根據(jù)權(quán)利要求10所述的控制系統(tǒng),其中,所述設(shè)備內(nèi)的熵的熵計(jì)算是基于被視為開放式動(dòng)態(tài)系統(tǒng)的所述設(shè)備的運(yùn)動(dòng)方程的熱動(dòng)力學(xué)模型。
12.根據(jù)權(quán)利要求9所述的控制系統(tǒng),其中,所述遺傳分析器產(chǎn)生一個(gè)教學(xué)信號(hào)。
13.根據(jù)權(quán)利要求9所述的控制系統(tǒng),其中,所述線性控制系統(tǒng)基于從測(cè)量所述設(shè)備的一個(gè)或多個(gè)傳感器獲得的數(shù)據(jù)產(chǎn)生控制信號(hào)。
14.根據(jù)權(quán)利要求13所述的控制系統(tǒng),其中,所述設(shè)備包含懸架系統(tǒng),并且所述一個(gè)或多個(gè)傳感器包含測(cè)量該懸架系統(tǒng)的元件的角度和位置的角度和位置傳感器。
15.根據(jù)權(quán)利要求9所述的控制系統(tǒng),其中,所述模糊控制器使用的模糊規(guī)則是通過在離線學(xué)習(xí)模式下使用該設(shè)備的動(dòng)力學(xué)模型來進(jìn)化。
16.根據(jù)權(quán)利要求15所述的控制系統(tǒng),其中,來自所述動(dòng)力學(xué)模型的數(shù)據(jù)被提供到計(jì)算該設(shè)備的輸入熵產(chǎn)生和輸出熵產(chǎn)生的熵計(jì)算器。
17.根據(jù)權(quán)利要求16所述的控制系統(tǒng),其中,所述輸入熵產(chǎn)生和所述輸出熵產(chǎn)生被提供到適應(yīng)函數(shù)計(jì)算器,該計(jì)算器計(jì)算作為受一個(gè)或多個(gè)權(quán)重限制的熵產(chǎn)生速率之差的適應(yīng)函數(shù)。
18.根據(jù)權(quán)利要求17所述的控制系統(tǒng),其中,所述遺傳分析器使用所述適應(yīng)函數(shù)為離線控制系統(tǒng)發(fā)展一訓(xùn)練信號(hào),該訓(xùn)練信號(hào)對(duì)應(yīng)于操作環(huán)境。
19.根據(jù)權(quán)利要求18所述的控制系統(tǒng),其中,所述步進(jìn)編碼染色體包含前進(jìn)、后退、及保持的編碼。
20.根據(jù)權(quán)利要求9所述的控制系統(tǒng),其中,來自離線控制系統(tǒng)以知識(shí)庫形式的控制參數(shù)被提供到使用來自所述數(shù)據(jù)庫的信息的在線控制系統(tǒng)。
21.一種控制非線性設(shè)備的方法,其通過下述方式進(jìn)行控制獲得該設(shè)備的熵的時(shí)間微分(dSu/dt)與從控制器提供到該設(shè)備的熵的時(shí)間微分(dSc/dt)之間的熵產(chǎn)生之差;使用采用該熵產(chǎn)生之差作為性能函數(shù)的遺傳算法來進(jìn)化具有離散限制的離線控制器的控制規(guī)則;以及,為具有離散限制的在線控制器提供過濾控制規(guī)則,以控制該設(shè)備。
22.根據(jù)權(quán)利要求21所述的方法,其中,還包含使用所述在線控制器來控制步進(jìn)馬達(dá),以改變車輛懸架系統(tǒng)中的一個(gè)或多個(gè)減震器的阻尼因子。
23.根據(jù)權(quán)利要求21所述的方法,其中,還包含通過使用遺傳算法來進(jìn)化出相對(duì)于該控制器的變量的控制規(guī)則,所述遺傳算法使用基于所述熵產(chǎn)生之差的適應(yīng)函數(shù)。
24.一種自組織控制系統(tǒng),包括模擬器,其被設(shè)計(jì)成使用設(shè)備的非線性運(yùn)動(dòng)方程的熱動(dòng)力學(xué)模型;適應(yīng)函數(shù)模塊,其基于所述設(shè)備的熵的時(shí)間微分(dSu/dt)與由控制該設(shè)備的步進(jìn)限制線性控制器提供到該設(shè)備的熵的時(shí)間微分(dSc/dt)之間的熵產(chǎn)生之差來計(jì)算適應(yīng)函數(shù);遺傳分析器,其使用所述適應(yīng)函數(shù)來提供教學(xué)信號(hào);模糊邏輯分類器,其通過使用學(xué)習(xí)過程和所述教學(xué)信號(hào)來確定一個(gè)或多個(gè)模糊規(guī)則;以及,模糊邏輯控制器,其使用所述模糊規(guī)則來設(shè)定該步進(jìn)限制線性控制器的步進(jìn)控制變量。
25.根據(jù)權(quán)利要求24所述的自組織控制系統(tǒng),其中,所述遺傳分析器使用染色體,所述染色體的至少一部分被步進(jìn)編碼。
26.一種控制系統(tǒng),包括步進(jìn)編碼遺傳算法,其使用適應(yīng)函數(shù)來計(jì)算教學(xué)信號(hào),該適應(yīng)函數(shù)基于減小熵產(chǎn)生來提供對(duì)控制質(zhì)量的度量;局部熵反饋回路,其通過使設(shè)備的穩(wěn)定性和該設(shè)備的可控制性相關(guān)聯(lián)來提供控制。
27.根據(jù)權(quán)利要求26所述的控制系統(tǒng),其中,所述步進(jìn)編碼遺傳算法包含步進(jìn)編碼染色體,以限制該遺傳算法的搜尋空間。
28.根據(jù)權(quán)利要求27所述的控制系統(tǒng),其中,使用模糊神經(jīng)網(wǎng)絡(luò),以便從所述教學(xué)信號(hào)來創(chuàng)建數(shù)據(jù)庫。
29.根據(jù)權(quán)利要求28所述的控制系統(tǒng),其中,所述設(shè)備為車輛懸架系統(tǒng)。
30.根據(jù)權(quán)利要求29所述的控制系統(tǒng),其中,一知識(shí)庫對(duì)應(yīng)于用來發(fā)展該教學(xué)信號(hào)的選定隨機(jī)激發(fā)信號(hào)的隨機(jī)特性。
31.一種減震器的優(yōu)化控制方法,包括下述步驟獲得減震器內(nèi)的熵的時(shí)間微分與從控制所述減震器的控制單元提供到所述減震器的熵的時(shí)間微分之差;通過使用離散限制遺傳算法來優(yōu)化所述控制單元的至少一個(gè)控制參數(shù),所述離散限制遺傳算法使用所述差作為適應(yīng)函數(shù),所述遺傳算法受到染色體的至少一個(gè)步進(jìn)限制所限制。
32.根據(jù)權(quán)利要求31所述的優(yōu)化控制方法,其中,所述優(yōu)化步驟的所述時(shí)間微分降低了從所述控制單元提供到所述減震器的熵。
33.根據(jù)權(quán)利要求31所述的優(yōu)化控制方法,其中,所述控制單元包含模糊神經(jīng)網(wǎng)絡(luò),并且通過使用所述遺傳算法來優(yōu)化用于模糊規(guī)則的耦合系數(shù)的值。
34.根據(jù)權(quán)利要求31所述的優(yōu)化控制方法,其中,所述控制單元包含離線模塊以及在線控制模塊,所述方法進(jìn)一步包含下述步驟使用所述性能函數(shù)、基于所述離散限制遺傳算法來優(yōu)化控制參數(shù);基于所述控制參數(shù)來確定所述在線控制模塊的控制參數(shù);并使用所述在線控制模塊來控制所述減震器。
35.根據(jù)權(quán)利要求34所述的優(yōu)化控制方法,其中,所述離線模塊使用模擬模型來提供優(yōu)化,所述模擬模型是基于車輛懸架系統(tǒng)的動(dòng)力學(xué)模型。
36.根據(jù)權(quán)利要求34所述的優(yōu)化控制方法,其中,所述減震器被安排成通過改變由步進(jìn)馬達(dá)控制的油路的截面積來改變阻尼力,并且所述控制單元控制所述步進(jìn)馬達(dá)來調(diào)整所述油路的截面積。
37.一種控制設(shè)備的方法,包含下述步驟計(jì)算與提供到所述設(shè)備的模型的控制信號(hào)的熵產(chǎn)生速率相對(duì)應(yīng)的第一熵產(chǎn)生速率;計(jì)算與所述設(shè)備的所述模型的熵產(chǎn)生速率相對(duì)應(yīng)的第二熵產(chǎn)生速率;利用所述第一熵產(chǎn)生速率和所述第二熵產(chǎn)生速率來確定用于步進(jìn)限制遺傳優(yōu)化器的適應(yīng)函數(shù);將所述適應(yīng)函數(shù)提供給所述遺傳優(yōu)化器;將來自所述步進(jìn)限制遺傳優(yōu)化器的教學(xué)輸出提供給被設(shè)計(jì)成產(chǎn)生知識(shí)庫的模糊神經(jīng)網(wǎng)絡(luò);將所述知識(shí)庫提供給模糊控制器,所述模糊控制器使用誤差信號(hào)和所述知識(shí)庫來生成系數(shù)增益排表;以及,將所述系數(shù)增益排表提供給步進(jìn)限制線性控制器。
38.根據(jù)權(quán)利要求37所述的方法,其中,所述遺傳優(yōu)化器在一個(gè)或多個(gè)限制之下最小化熵產(chǎn)生。
39.根據(jù)權(quán)利要求38所述的方法,其中,所述限制的至少其中之一是與基于控制性能的用戶感知評(píng)價(jià)的權(quán)重相關(guān)聯(lián)。
40.根據(jù)權(quán)利要求37所述的方法,其中,所述設(shè)備的所述模型包含懸架系統(tǒng)的模型。
41.根據(jù)權(quán)利要求37所述的方法,其中,所述第二控制系統(tǒng)被設(shè)計(jì)成控制物理設(shè)備。
42.根據(jù)權(quán)利要求37所述的方法,其中,所述第二控制系統(tǒng)被設(shè)計(jì)成控制減震器。
43.根據(jù)權(quán)利要求37所述的方法,其中,所述第二控制系統(tǒng)被設(shè)計(jì)成控制減震器的阻尼速率。
44.根據(jù)權(quán)利要求37所述的方法,其中,所述線性控制器接收來自監(jiān)控車輛懸架系統(tǒng)的一個(gè)或多個(gè)傳感器的傳感器輸入數(shù)據(jù)。
45.根據(jù)權(quán)利要求44所述的方法,其中,所述傳感器的至少其中之一是測(cè)量車輛垂直運(yùn)動(dòng)的垂直運(yùn)動(dòng)傳感器。
46.根據(jù)權(quán)利要求44所述的方法,其中,所述傳感器的至少其中之一是測(cè)量車輛垂直加速度的加速計(jì)。
47.根據(jù)權(quán)利要求44所述的方法,其中,所述傳感器的至少其中之一是測(cè)量車輛加速度的至少一個(gè)分量的加速計(jì)。
48.根據(jù)權(quán)利要求44所述的方法,其中,所述傳感器的至少其中之一是測(cè)量所述懸架系統(tǒng)的至少一部分的長(zhǎng)度變化的長(zhǎng)度傳感器。
49.根據(jù)權(quán)利要求44所述的方法,其中,所述傳感器的至少其中之一是測(cè)量所述懸架系統(tǒng)的至少一部分相對(duì)于所述車輛的角度的角度傳感器。
50.根據(jù)權(quán)利要求44所述的方法,其中,所述傳感器的至少其中之一是測(cè)量所述懸架系統(tǒng)的第一部分相對(duì)于所述懸架系統(tǒng)第二部分的角度的角度傳感器。
51.根據(jù)權(quán)利要求44所述的方法,其中,所述適應(yīng)函數(shù)包含所述懸架系統(tǒng)的一個(gè)或多個(gè)狀態(tài)變量的加權(quán)組合。
52.根據(jù)權(quán)利要求44所述的方法,其中,所述適應(yīng)函數(shù)包含與乘客舒適度相關(guān)聯(lián)的一個(gè)或多個(gè)變量的加權(quán)組合。
53.根據(jù)權(quán)利要求44所述的方法,其中,所述適應(yīng)函數(shù)包含與乘客舒適度相關(guān)聯(lián)的一個(gè)或多個(gè)變量的加權(quán)組合,并且所述加權(quán)組合的一個(gè)或多個(gè)權(quán)重能根據(jù)乘客要求來調(diào)整。
54.根據(jù)權(quán)利要求44所述的方法,其中,所述適應(yīng)函數(shù)包含車輛運(yùn)動(dòng)的加權(quán)組合,從而所述控制系統(tǒng)將減小所述車輛的一個(gè)或多個(gè)選定運(yùn)動(dòng)。
55.根據(jù)權(quán)利要求37所述的方法,其中,所述第二控制系統(tǒng)被設(shè)計(jì)成控制減震器中的節(jié)流閥。
56.根據(jù)權(quán)利要求37所述的方法,其中,所述適應(yīng)函數(shù)包含一個(gè)或多個(gè)狀態(tài)變量的加權(quán)組合。
57.根據(jù)權(quán)利要求37所述的方法,其中,所述適應(yīng)函數(shù)包含一個(gè)或多個(gè)系統(tǒng)變量的加權(quán)組合。
58.一種控制裝置,包括離線優(yōu)化器件,用于由熵產(chǎn)生速率來決定控制參數(shù),以從步進(jìn)限制遺傳分析器發(fā)現(xiàn)的教學(xué)信號(hào)產(chǎn)生知識(shí)庫;以及,在線控制器件,用于使用所述知識(shí)庫來發(fā)展控制設(shè)備的控制參數(shù)。
全文摘要
本發(fā)明描述了一種使用基于離散限制的遺傳分析器的控制系統(tǒng)。在一個(gè)實(shí)施方案中,具有步進(jìn)編碼染色體的遺傳算法用于獲得教學(xué)信號(hào),該信號(hào)為例如諸如步進(jìn)限制控制器等具有離散限制的控制器提供良好控制。在一個(gè)實(shí)施方案中,控制系統(tǒng)使用了基于熵最小這一物理定律的適應(yīng)(性能)函數(shù)。在一個(gè)實(shí)施方案中,遺傳分析器用于離線模式下,為形成知識(shí)庫的模糊邏輯分類器系統(tǒng)提供一個(gè)教學(xué)信號(hào)。教學(xué)信號(hào)可以被使用知識(shí)庫的知識(shí)來運(yùn)轉(zhuǎn)的模糊控制器在線逼近??刂葡到y(tǒng)可用于控制由非線性、非穩(wěn)定、耗散模型描述的復(fù)雜設(shè)備。在一個(gè)實(shí)施方案中,步進(jìn)限制控制系統(tǒng)被設(shè)計(jì)用于控制步進(jìn)馬達(dá)。
文檔編號(hào)G05B13/04GK1672103SQ03818112
公開日2005年9月21日 申請(qǐng)日期2003年7月29日 優(yōu)先權(quán)日2002年7月30日
發(fā)明者謝爾蓋·V·烏里揚(yáng)諾夫, 謝爾蓋·潘菲洛夫, 高橋一樹 申請(qǐng)人:雅馬哈發(fā)動(dòng)機(jī)株式會(huì)社