用于計(jì)算機(jī)輔助地控制和/或調(diào)節(jié)技術(shù)系統(tǒng)的方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及用于計(jì)算機(jī)輔助地控制和/或調(diào)節(jié)技術(shù)系統(tǒng)、尤其能量產(chǎn)生裝置的方 法。
【背景技術(shù)】
[0002] 在控制或調(diào)節(jié)技術(shù)系統(tǒng)時(shí),經(jīng)常值得期望的是,通過(guò)執(zhí)行相應(yīng)的行動(dòng)這樣地影響 技術(shù)系統(tǒng)的運(yùn)行,使得技術(shù)系統(tǒng)的行為關(guān)于特定的準(zhǔn)則被優(yōu)化。例如在運(yùn)行燃?xì)廨啓C(jī)時(shí)有 意義的是,減少通過(guò)渦輪機(jī)產(chǎn)生的廢氣排放或者保持燃?xì)廨啓C(jī)的燃燒室的燃燒動(dòng)力學(xué)(也 稱(chēng)作燃燒室蜂鳴聲(Brennkammerbrummen))盡可能小。在此例如可能影響關(guān)于將氣體和空 氣輸送到燃?xì)廨啓C(jī)的燃燒室的參數(shù)。
[0003] 由現(xiàn)有技術(shù)已知計(jì)算機(jī)輔助的方法,利用所述方法確定行動(dòng)選擇規(guī)則,據(jù)此對(duì)于 技術(shù)系統(tǒng)的相應(yīng)的相繼狀態(tài)確定行動(dòng),其中所述狀態(tài)通過(guò)系統(tǒng)的適當(dāng)?shù)臓顟B(tài)變量來(lái)表征, 所述行動(dòng)鑒于優(yōu)化準(zhǔn)則、諸如上面提及的低有害物質(zhì)排放或者低燃燒室蜂鳴聲是最優(yōu)的。 在文獻(xiàn)[1]和[2]中描述基于利用由已知狀態(tài)和行動(dòng)組成的訓(xùn)練數(shù)據(jù)學(xué)習(xí)遞歸神經(jīng)網(wǎng)絡(luò)來(lái) 確定行動(dòng)選擇規(guī)則。按照行動(dòng)選擇規(guī)則,對(duì)于技術(shù)系統(tǒng)的當(dāng)前的狀態(tài)在考慮以前的狀態(tài)的 情況下根據(jù)優(yōu)化準(zhǔn)則輸出行動(dòng)序列。
[0004] 用于借助于遞歸神經(jīng)網(wǎng)絡(luò)確定行動(dòng)選擇規(guī)則的已知的方法具有以下缺點(diǎn):在學(xué)習(xí) 遞歸神經(jīng)網(wǎng)絡(luò)時(shí),質(zhì)量標(biāo)準(zhǔn)形式的優(yōu)化準(zhǔn)則一起注入(e i nf 1 i efien )。因此在技術(shù)系統(tǒng)的實(shí) 際運(yùn)行中不能容易地對(duì)變化的優(yōu)化準(zhǔn)則作出反應(yīng),因?yàn)闉榇怂錾窠?jīng)網(wǎng)絡(luò)必須完全重新被 學(xué)習(xí)。
【發(fā)明內(nèi)容】
[0005] 因此本發(fā)明的任務(wù)是,實(shí)現(xiàn)用于計(jì)算機(jī)輔助地控制和/或調(diào)節(jié)技術(shù)系統(tǒng)的方法,所 述方法以簡(jiǎn)單的方式確定按照優(yōu)化準(zhǔn)則在技術(shù)系統(tǒng)處要執(zhí)行的行動(dòng)。
[0006] 所述任務(wù)通過(guò)獨(dú)立專(zhuān)利權(quán)利要求解決。本發(fā)明的改進(jìn)方案在從屬專(zhuān)利權(quán)利要求中 定義。
[0007] 按照本發(fā)明的方法用于計(jì)算機(jī)輔助地控制和/或調(diào)節(jié)技術(shù)系統(tǒng)。所述技術(shù)系統(tǒng)尤 其是能量產(chǎn)生裝置并且在一種特別優(yōu)選的實(shí)施方式中是燃?xì)鉁u輪,如此外在下面進(jìn)一步描 述的。然而必要時(shí),所述技術(shù)系統(tǒng)也可以是再生能量產(chǎn)生裝置形式、諸如風(fēng)力渦輪機(jī)的能量 產(chǎn)生裝置。技術(shù)系統(tǒng)的動(dòng)態(tài)行為在按照本發(fā)明的方法中對(duì)于多個(gè)時(shí)間點(diǎn)分別地通過(guò)技術(shù)系 統(tǒng)的狀態(tài)和在該狀態(tài)下在技術(shù)系統(tǒng)處執(zhí)行的行動(dòng)來(lái)表征,其中在各自時(shí)間點(diǎn)的各自行動(dòng)通 向在下一時(shí)間點(diǎn)技術(shù)系統(tǒng)的新的狀態(tài)。行動(dòng)序列在此表示一個(gè)或多個(gè)相繼地按時(shí)間順序在 技術(shù)系統(tǒng)處要執(zhí)行的行動(dòng)。技術(shù)系統(tǒng)的狀態(tài)包括一個(gè)和優(yōu)選多個(gè)狀態(tài)變量,所述狀態(tài)變量 是技術(shù)系統(tǒng)的運(yùn)行狀態(tài)或者影響技術(shù)系統(tǒng)的運(yùn)行的參量。與此相對(duì)地,行動(dòng)是一個(gè)或多個(gè) 行動(dòng)變量的變化,其中所述行動(dòng)變量必要時(shí)也可以是狀態(tài)變量,所述狀態(tài)變量可以在調(diào)節(jié) 或者控制技術(shù)系統(tǒng)的范圍中被改變。
[0008] 在按照本發(fā)明的方法中,可以為每個(gè)行動(dòng)序列基于技術(shù)系統(tǒng)的、由執(zhí)行行動(dòng)序列 的行動(dòng)得出的狀態(tài)計(jì)算關(guān)于用于運(yùn)行技術(shù)系統(tǒng)的優(yōu)化準(zhǔn)則的質(zhì)量標(biāo)準(zhǔn),其中所述質(zhì)量標(biāo)準(zhǔn) 越高,優(yōu)化準(zhǔn)則越好地被滿(mǎn)足。優(yōu)化準(zhǔn)則的概念在此可以被廣泛地理解,并且所述準(zhǔn)則必要 時(shí)可以包括多個(gè)子準(zhǔn)則或者分準(zhǔn)則。
[0009] 按照本發(fā)明方法的步驟或者特征a),提供技術(shù)系統(tǒng)的模擬模型,利用所述模擬模 型可以為各自的行動(dòng)序列預(yù)測(cè)技術(shù)系統(tǒng)的由此得出的狀態(tài)。這樣的模擬模型自身由現(xiàn)有技 術(shù)是已知的。所述模擬模型可以例如是數(shù)據(jù)驅(qū)動(dòng)式模型,所述模型基于技術(shù)系統(tǒng)運(yùn)行的事 先確定的數(shù)據(jù),或者利用所述數(shù)據(jù)學(xué)習(xí)。同樣地,所述模擬模型可以是技術(shù)系統(tǒng)的分析模型 和/或物理模型。
[0010] 在一種特別優(yōu)選的實(shí)施方式中,神經(jīng)網(wǎng)絡(luò)、尤其遞歸神經(jīng)網(wǎng)絡(luò)形式的數(shù)據(jù)驅(qū)動(dòng)式 模型被用作模擬模型。所述神經(jīng)網(wǎng)絡(luò)在此基于已知的行動(dòng)序列的訓(xùn)練數(shù)據(jù)利用技術(shù)系統(tǒng)的 已知的由此得出的狀態(tài)學(xué)習(xí)。在一種特殊實(shí)施方式中,在出版物[3 ]中描述的神經(jīng)網(wǎng)絡(luò)被使 用用于在按照本發(fā)明的方法的范圍中對(duì)技術(shù)系統(tǒng)的動(dòng)態(tài)的行為進(jìn)行建模。代替神經(jīng)網(wǎng)絡(luò), 所述數(shù)據(jù)驅(qū)動(dòng)式模型必要時(shí)也可以基于高斯過(guò)程和/或基于回歸樹(shù)和/或基于支持向量回 歸(Support Vector Regression)。
[0011] 在按照本發(fā)明的方法的步驟b)中,在來(lái)自相繼的預(yù)先給定的時(shí)間點(diǎn)序列的各自的 預(yù)先給定的時(shí)間點(diǎn),借助于數(shù)字優(yōu)化方法確定具有盡可能高的質(zhì)量標(biāo)準(zhǔn)的行動(dòng)序列,其中 所述優(yōu)化方法使用提供的模擬模型,以便為在數(shù)字優(yōu)化方法的范圍中產(chǎn)生的行動(dòng)序列預(yù)測(cè) 技術(shù)系統(tǒng)的由此得出的狀態(tài),并且接著利用所述預(yù)測(cè)的狀態(tài)確定所產(chǎn)生的行動(dòng)序列的質(zhì)量 標(biāo)準(zhǔn)。所有在數(shù)字優(yōu)化方法范圍中處理的或者生成的行動(dòng)序列并且不僅僅由數(shù)字優(yōu)化方法 確定的和最終輸出的行動(dòng)序列屬于產(chǎn)生的行動(dòng)序列概念。不同于其它方法,數(shù)字優(yōu)化方法 不需要事先執(zhí)行的學(xué)習(xí)步驟。
[0012] 在一種特別優(yōu)選的實(shí)施方式中,將非凸啟發(fā)式優(yōu)化方法和/或無(wú)梯度隨機(jī)搜索方 法用作數(shù)字優(yōu)化方法。特別優(yōu)選地,所述數(shù)字優(yōu)化方法是粒子群優(yōu)化(英語(yǔ) :PartiCle Swarm Optimization(粒子群優(yōu)化))和/或進(jìn)化算法和/或遺傳算法和/或模擬退火 (Simulated Annealing)。所有這些方法自身由現(xiàn)有技術(shù)已知,并且因此不更詳細(xì)地予以描 述。
[0013] 在按照本發(fā)明的方法的步驟c)中,在步驟b)中確定的行動(dòng)序列的行動(dòng)的至少一部 分在技術(shù)系統(tǒng)處被執(zhí)行。換句話(huà)說(shuō),所確定的行動(dòng)序列的第一行動(dòng)和必要時(shí)還有其它之后 的行動(dòng)被執(zhí)行。特別地,可以在步驟c)中僅執(zhí)行第一行動(dòng),其中直接緊接著步驟b)被重復(fù)用 于確定新的要執(zhí)行的行動(dòng)。由此實(shí)現(xiàn),所述行動(dòng)非常好地滿(mǎn)足所使用的優(yōu)化準(zhǔn)則。
[0014] 按照本發(fā)明的方法的特點(diǎn)在于,所使用的模擬模型以及數(shù)字優(yōu)化方法事先在學(xué)習(xí) 過(guò)程的范圍中均不需要所述質(zhì)量標(biāo)準(zhǔn),如這例如在借助于神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)行動(dòng)選擇規(guī)則時(shí)是 這種情況。因此所述方法可以快速地適配在運(yùn)行技術(shù)系統(tǒng)期間的變化的條件,其方式是:所 述質(zhì)量標(biāo)準(zhǔn)或者其計(jì)算適當(dāng)?shù)乇桓淖?。?yōu)選地在此在調(diào)節(jié)和/或控制技術(shù)系統(tǒng)時(shí),設(shè)置用戶(hù) 接口,通過(guò)所述用戶(hù)接口用戶(hù)可以改變質(zhì)量標(biāo)準(zhǔn)。用戶(hù)可以因此在線(xiàn)地在運(yùn)行技術(shù)系統(tǒng)期 間改變質(zhì)量標(biāo)準(zhǔn)。技術(shù)系統(tǒng)的運(yùn)行為此不必被中斷。用戶(hù)可以通過(guò)用戶(hù)接口通過(guò)改變質(zhì)量 標(biāo)準(zhǔn)鑒于運(yùn)行技術(shù)系統(tǒng)的最佳性而調(diào)整由其期望的重心。在燃?xì)鉁u輪形式的技術(shù)系統(tǒng)的情 況下,所述用戶(hù)可以例如在渦輪機(jī)的壽命消耗和效率之間進(jìn)行權(quán)衡。在緊急情形下,可能有 意義的是,運(yùn)行具有提高的壽命消耗的渦輪機(jī),因?yàn)殡娏骺梢燥@著更貴地被出售,并且補(bǔ)償 提尚的耗損。
[0015] 在另一特別優(yōu)選的實(shí)施方式中,所述數(shù)字優(yōu)化方法是粒子群優(yōu)化,其粒子分配給 各自的行動(dòng)序列,所述行動(dòng)序列在初始化粒子群優(yōu)化時(shí)隨機(jī)地被確定,并且在粒子群算法 優(yōu)化的范圍中迭代地借助于各自的速度向量被改變,其中各自的速度向量借助于適應(yīng)度函 數(shù)被確定,所述適應(yīng)度函數(shù)對(duì)應(yīng)于所述質(zhì)量標(biāo)準(zhǔn)。所述粒子群優(yōu)化可以因此在按照本發(fā)明 的方法中以簡(jiǎn)單的方式通過(guò)以下方式被實(shí)現(xiàn):即在此所使用的適應(yīng)度函數(shù)與質(zhì)量標(biāo)準(zhǔn)被看 成一樣的。
[0016] 在另一變型方案中,在粒子群優(yōu)化的范圍中在為各自的粒子計(jì)算速度向量時(shí),按 照預(yù)先給定的拓?fù)浣Y(jié)構(gòu)考慮多個(gè)相鄰粒子。所述拓?fù)浣Y(jié)構(gòu)指定在粒子之間的邊,所述粒子 在該意義下對(duì)應(yīng)于節(jié)點(diǎn)。在此通過(guò)邊與各自的粒子(直接地)連接的所有粒子是各自粒子的 相鄰粒子。通過(guò)基于預(yù)先給定的拓?fù)浣Y(jié)構(gòu)考慮相鄰粒子,借助于粒子群優(yōu)化通常找到更好 的解。
[0017] 在特殊的變型方案中,環(huán)形拓?fù)浣Y(jié)構(gòu)被用作預(yù)先給定的拓?fù)浣Y(jié)構(gòu),其中所述粒子 通過(guò)邊這樣連接,使得粒子與邊構(gòu)成環(huán)。因此每個(gè)粒子在環(huán)上具有至少兩個(gè)相鄰粒子。可選 地,對(duì)于各自的粒子可以設(shè)置一個(gè)或多個(gè)其它的邊,所述邊將各自的粒子與其它粒子連接, 所