專利名稱:使用分級(jí)模型的推理系統(tǒng)及方法和控制系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及人類使用操作或控制對(duì)象時(shí)得到的經(jīng)歷數(shù)據(jù)形成模型特別是形成具有由相互連鎖的目標(biāo)、策略和動(dòng)作構(gòu)成的經(jīng)歷結(jié)構(gòu)的模型的推理系統(tǒng)及方法和使用形成的模型自動(dòng)地操作或控制對(duì)象的系統(tǒng)及方法。
本發(fā)明的系統(tǒng)和方法對(duì)于工廠的自動(dòng)化特別是制造設(shè)備和傳輸設(shè)備的實(shí)時(shí)動(dòng)態(tài)的控制操作是非常有用的。
工廠自動(dòng)化的目的在于為了處理傳感器的信號(hào)及控制傳動(dòng)機(jī)構(gòu),通過(guò)開(kāi)發(fā)電-機(jī)裝置及計(jì)算機(jī)算法語(yǔ)言而提高生產(chǎn)效率。很多裝置和算法語(yǔ)言已將人們從無(wú)聊的、激烈的、重復(fù)性多的并且危險(xiǎn)的工作中解放了出來(lái)。盡管如此,在制造業(yè)和其他產(chǎn)業(yè)領(lǐng)域,有些希望實(shí)現(xiàn)自動(dòng)化的工作依然需要人來(lái)作。為了提高生產(chǎn)效率、降低成本、減少浪費(fèi)、提高產(chǎn)品質(zhì)量、改善勞動(dòng)的安全性和減少培訓(xùn)所需要的費(fèi)用,應(yīng)該進(jìn)一步推進(jìn)自動(dòng)化。
在競(jìng)爭(zhēng)的社會(huì),人們謀求更有效的生產(chǎn)質(zhì)量更高的產(chǎn)品的更高明的工廠的自動(dòng)化手段。這種手段之一,就是形成人的操作的自動(dòng)化模型的裝置。
在關(guān)系人的知識(shí)的人工智能(AI)領(lǐng)域,關(guān)于如何構(gòu)筑該模型的模型化有很多逼近方法。
最一般的逼近方法,就是專家系統(tǒng)。它是將通過(guò)訪問(wèn)而收集的專家的知識(shí)用一群規(guī)則表現(xiàn)。一群規(guī)則由邏輯推理機(jī)構(gòu)進(jìn)行處理,并據(jù)此生成說(shuō)明、預(yù)測(cè)或暗示。邏輯推理機(jī)制具有包括模糊邏輯的各種方法。通常,規(guī)則用概念或狀況的程度表示知識(shí)。
數(shù)據(jù)指向性最強(qiáng)的逼近方法是稱為事件庫(kù)推理(case-basedreasoning)的逼近方法。它就是存儲(chǔ)事件并進(jìn)行比較的學(xué)習(xí)戰(zhàn)略。即,通過(guò)與存儲(chǔ)在存儲(chǔ)器內(nèi)的先前的同樣的狀況進(jìn)行比較和對(duì)比來(lái)解決新的狀況。這就是認(rèn)識(shí)新的狀況,進(jìn)行新的推理,當(dāng)不能進(jìn)行推理時(shí),就發(fā)出詢問(wèn)。通常,事件用操作程度表示知識(shí)。
本發(fā)明提供擴(kuò)展到規(guī)則庫(kù)逼近(rule-based approach)和事件庫(kù)逼近兩方面的新的逼近方法。
在本發(fā)明中,為了將人對(duì)對(duì)象的操作或控制模式化并根據(jù)該模式利用機(jī)械再現(xiàn)人的操作或控制,根據(jù)下面的行動(dòng)原則進(jìn)行。
“動(dòng)作中存在某些策略,策略中存在某些目標(biāo)?!痹诒景l(fā)明中,以人的實(shí)際的操作或控制的記錄為信息源。通過(guò)從該記錄抽出策略,從策略導(dǎo)出目標(biāo),構(gòu)筑由目標(biāo)、策略和動(dòng)作構(gòu)成的等級(jí)結(jié)構(gòu)的模式。
本發(fā)明的推理方法若最抽象地進(jìn)行規(guī)定,則為如下所述。
本發(fā)明的推理方法是取入由通過(guò)操作或控制對(duì)象而得到的輸入輸出變量值的組構(gòu)成的一連串的動(dòng)作數(shù)據(jù),著眼于取入的上述動(dòng)作數(shù)據(jù)中的輸入變量值,對(duì)每個(gè)輸入變量作成以上述操作或控制為目標(biāo)的目標(biāo),著眼于取入的上述動(dòng)作數(shù)據(jù)中的輸出變量值,作成為了達(dá)到上述目標(biāo)的策略,將上述目標(biāo)與尚未達(dá)到該目標(biāo)的策略連鎖,將上述策略與實(shí)現(xiàn)該策略的動(dòng)作數(shù)據(jù)連鎖,借此形成由相互連鎖的目標(biāo)、策略和動(dòng)作構(gòu)成的等級(jí)結(jié)構(gòu)的模型。
先有的事件庫(kù)推理,是限于經(jīng)驗(yàn)的水平即動(dòng)作情況的推理,沒(méi)有超過(guò)該經(jīng)驗(yàn)的發(fā)展性。當(dāng)出現(xiàn)過(guò)去沒(méi)有經(jīng)驗(yàn)過(guò)的情況時(shí),就不能獲得適當(dāng)?shù)慕狻?br>
按照本發(fā)明,根據(jù)實(shí)際的動(dòng)作取樣作成目標(biāo),然后作成為了達(dá)到該目標(biāo)的策略。并且,將目標(biāo)、策略和動(dòng)作相互連結(jié)。因此,為了進(jìn)行操作及控制,按照概念的程度確定方向性(目標(biāo)),向著該目標(biāo)按照與該目標(biāo)連鎖的策略進(jìn)行與狀況對(duì)應(yīng)的意志決定。最后,根據(jù)與策略連鎖的動(dòng)作情況進(jìn)行具體的意志決定(輸出值的決定)。
在包括模糊規(guī)則的規(guī)則庫(kù)推理中,為了作成規(guī)則,需要訪問(wèn)專家,進(jìn)行將其知識(shí)規(guī)則化的作業(yè)。按照本發(fā)明,可以根據(jù)過(guò)去的操作記錄自動(dòng)地作成目標(biāo)和策略。
若具體地規(guī)定本發(fā)明的推理方法,則如下所述。
本發(fā)明的推理方法是取入由通過(guò)操作或控制對(duì)象而得到的輸入輸出變量值的組構(gòu)成的一連串的動(dòng)作數(shù)據(jù),著眼于取入的上述動(dòng)作取樣中的輸入變量值,對(duì)每個(gè)輸入變量作成使用輸入變量值的最初的值、最后的值、最大值和最小值規(guī)定的目標(biāo)路線,著眼于取入的上述動(dòng)作取樣中的輸出變量值,抽出輸出變量值保持同一性的輸入變量的范圍,對(duì)于各范圍作成將輸入變量的范圍與輸出變量值連結(jié)的策略路線,將具有不滿足上述目標(biāo)路線的條件的輸入變量范圍的策略路線與該編碼路線連鎖,將具有進(jìn)入上述策略路線的輸入變量范圍的輸入變量值的動(dòng)作路線與該策略路線連鎖,借此形成由相互連鎖的目標(biāo)路線、策略路線和動(dòng)作路線構(gòu)成的等級(jí)結(jié)構(gòu)的模型在極佳的實(shí)施例中,取入的上述動(dòng)作取樣變換為指定位的二進(jìn)制數(shù)據(jù)。
在其他極佳的實(shí)施例中,作成目標(biāo)路線的上述步驟由作成臨時(shí)的目標(biāo)路線的步驟、輸出作成的目標(biāo)路線的步驟和將接收用戶評(píng)價(jià)后的目標(biāo)路線作為最終的目標(biāo)路線的步驟構(gòu)成。
上述用戶的評(píng)價(jià)包括對(duì)目標(biāo)路線的追加、刪除和變更。
作成策略路線的上述步驟更具體地說(shuō)是由當(dāng)順序比較按時(shí)間順序排列的輸出變量值的相鄰的值,有變化時(shí),由存儲(chǔ)前后的輸出變量值作成策略取樣的步驟、參照上述動(dòng)作取樣將上述策略取樣變換為具有do…when…until…min…max的形式的策略路線的步驟、和使變換后的上述策略路線最優(yōu)化的步驟構(gòu)成。
使上述策略路線最優(yōu)化的步驟的一個(gè)例子,就是減少具有相同輸出變量值的2個(gè)以上的策略路線的數(shù)。
策略路線與目標(biāo)路線的連鎖,具體地說(shuō),在存儲(chǔ)器中是利用設(shè)在各策略路線中的指向目標(biāo)路線的指針和設(shè)在各目標(biāo)路線中的指向策略路線的指針實(shí)現(xiàn)的。
動(dòng)作路線與策略路線的連鎖,具體地說(shuō),在存儲(chǔ)器中是利用設(shè)在各動(dòng)作路線中的指向策略路線的指針和設(shè)在各策略路線中的指向動(dòng)作路線的指針實(shí)現(xiàn)的。
動(dòng)作路線是通過(guò)將由完全相同的輸入、輸出變量值的組構(gòu)成的動(dòng)作取樣留下1個(gè)將其他刪除而作成的。
這樣作成的模型通過(guò)將上述一系列的動(dòng)作取樣作為輸入輸出數(shù)據(jù)進(jìn)行驗(yàn)證。
即,通過(guò)按時(shí)間順序逐一取入上述動(dòng)作取樣,搜尋具有取入的動(dòng)作取樣的輸入變量值不滿足的條件的目標(biāo)路線,將與搜尋出的目標(biāo)路線連鎖的策略路線列表,從上述列表的策略路線中搜尋具有上述取入的輸入變量值滿足的條件的策略路線,將與搜尋出的策略路線連鎖的動(dòng)作路線列表,在上述列表的動(dòng)作路線中輸出具有和上述取入的輸入變量值一致或最接近的輸入變量值的動(dòng)作路線的輸出變量值,進(jìn)行該驗(yàn)證。用戶通過(guò)比較該輸出值和動(dòng)作取樣的輸出變量值,驗(yàn)證上述模型。
另外,本發(fā)明還提供使用按上述推理方法作成的模型操作或控制對(duì)象的方法。
該方法順序取入從對(duì)象得到的輸入數(shù)據(jù),搜尋具有取入的輸入數(shù)據(jù)不滿足的條件的目標(biāo)路線,將與搜尋出的目標(biāo)路線連鎖的策略路線列表,從上述列表的策略路線中搜尋具有上述取入的輸入數(shù)據(jù)滿足的條件的策略路線,將與搜尋出的策略路線連鎖的動(dòng)作路線列表,在上述列表的動(dòng)作路線中輸出具有與上述取入的輸入數(shù)據(jù)一致的或最接近的輸入變量值的動(dòng)作路線的輸出變量值,每次取入輸入數(shù)據(jù)都反復(fù)進(jìn)行上述處理。
本發(fā)明還提供執(zhí)行上述推理方法和控制方法的系統(tǒng)。
本發(fā)明的推理系統(tǒng)具有取入并存儲(chǔ)由通過(guò)操作或控制對(duì)象而得到的輸入輸出變量值的組構(gòu)成的一系列的動(dòng)作取樣的存儲(chǔ)裝置、著眼于取入的上述動(dòng)作取樣中的輸入變量值對(duì)每個(gè)輸入變量作成使用輸入變量值的最初的值、最后的值、最大值和最小值規(guī)定的目標(biāo)路線的作成裝置、著眼于取入,的上述動(dòng)作取樣中的輸出變量值抽出輸出變量值具有同一性的輸入變量的范圍并對(duì)各范圍作成將輸入變量的范圍與輸出變量值連結(jié)的策略路線的作成裝置、將具有不滿足上述目標(biāo)路線的條件的輸入變量范圍的策略路線與該目標(biāo)路線連鎖的連鎖裝置和將具有進(jìn)入上述策略路線的輸入變量范圍的輸入變量值的動(dòng)作路線于該策略路線連鎖的連鎖裝置,借此形成由相互連鎖的目標(biāo)路線、策略路線和動(dòng)作路線構(gòu)成的等級(jí)結(jié)構(gòu)的模型。
使用由上述推理系統(tǒng)作成的模型操作或控制對(duì)象的系統(tǒng)具有順序取入從對(duì)象得到的輸入數(shù)據(jù)的輸入裝置、搜尋具有取入的輸入數(shù)據(jù)不滿足的條件的目標(biāo)路線并在存儲(chǔ)器中將與搜尋出的目標(biāo)路線連鎖的策略路線列表的列表裝置、從上述列表的策略路線中搜尋具有上述取入的輸入數(shù)據(jù)滿足的條件的策略路線并將與搜尋出的策略路線連鎖的動(dòng)作路線在存儲(chǔ)器中列表的列表裝置、在上述列表的動(dòng)作路線中輸出具有與上述取入的輸入數(shù)據(jù)一致或最接近的輸入變量值的動(dòng)作路線的輸出變量值的輸出裝置和每次取入輸入數(shù)據(jù)時(shí)反復(fù)進(jìn)行上述處理的控制裝置。
本發(fā)明的其他特征和優(yōu)點(diǎn),通過(guò)參照
實(shí)施例便可清楚。
圖1是在模型形成模式中包括控制對(duì)象的整個(gè)系統(tǒng)的結(jié)構(gòu)的框圖。
圖2是在問(wèn)題解決模式中包括控制對(duì)象的整個(gè)系統(tǒng)的結(jié)構(gòu)的框圖。
圖3是表示使用等級(jí)結(jié)構(gòu)模型的本發(fā)明的系統(tǒng)的結(jié)構(gòu)例的框圖。
圖4是表示作為控制對(duì)象例的升降機(jī)控制系統(tǒng)的斜視圖。
圖5是振動(dòng)角檢測(cè)用的其他結(jié)構(gòu)例。
圖6是表示進(jìn)行升降機(jī)控制的模擬的系統(tǒng)的框圖。
圖7是表示模擬的變量。
圖8a和圖8b是表示模型形成模式的處理順序的流程圖。
圖9是表示在升降機(jī)控制的模擬中得到的輸入、輸出數(shù)據(jù)的一個(gè)例子。
圖10是表示通過(guò)將圖9所示的輸入、輸出數(shù)據(jù)進(jìn)行二進(jìn)制編碼而得到的二進(jìn)制字符串。
圖11是表示在升降機(jī)控制的模擬數(shù)據(jù)中按每個(gè)輸入變量作成的目標(biāo)路線作成用的列表的例子。
圖12是表示升降機(jī)控制的目標(biāo)路線的例子。
圖13是升降機(jī)控制的策略取樣的例子。
圖14~圖16是用于說(shuō)明向策略取樣的策略路線變換的簡(jiǎn)單的例子,圖14是動(dòng)作取樣的例子,圖15是策略取樣的例子,圖16是動(dòng)作取樣的曲線圖。
圖17是升降機(jī)控制的動(dòng)作取樣的曲線圖。
圖18a和圖18b是表示升降機(jī)控制的策略路線的例子。
圖19是圖18a和圖18b的策略路線的二進(jìn)制字符串。
圖20是表示各目標(biāo)路線向策略路線的連鎖。
圖21是表示各策略路線向目標(biāo)路線和動(dòng)作路線的連鎖。
圖22是表示各動(dòng)作路線向策略路線的連鎖。
圖23是表示由目標(biāo)、策略和動(dòng)作構(gòu)成的等級(jí)結(jié)構(gòu)。
圖24是表示問(wèn)題解決模式的處理順序的流程圖。
圖25是表示問(wèn)題解決模式的輸入、輸出數(shù)據(jù)的例子。
實(shí)施本發(fā)明的最佳的實(shí)施例(1)系統(tǒng)的2個(gè)模式使用等級(jí)結(jié)構(gòu)模型的本發(fā)明的系統(tǒng)具有2個(gè)模式。其一是模型形成模式,其二是問(wèn)題解決模式。
在模型形成模式中,輸入人(操作者)實(shí)際操作控制對(duì)象(被控制系統(tǒng))時(shí)得到的數(shù)據(jù)(操作量和控制量),形成后面所述的具有等級(jí)結(jié)構(gòu)的模型。
在問(wèn)題解決模式中,按照已形成的模型對(duì)控制對(duì)象現(xiàn)實(shí)地進(jìn)行控制。
圖1是模型形成模式中包括控制對(duì)象的整個(gè)系統(tǒng)的結(jié)構(gòu)。本發(fā)明的系統(tǒng)以模型形成模式(或?qū)W習(xí)系統(tǒng))進(jìn)行體現(xiàn)。
控制對(duì)象(被控制系統(tǒng))10的控制量通常由傳感器11,12,…,1k進(jìn)行檢測(cè)。檢測(cè)的控制量(輸入數(shù)據(jù)x1,x2,…,xk)輸入操作裝置20。操作者觀察著控制對(duì)象的狀況,根據(jù)需要觀察著顯示的控制量(例如確認(rèn)儀表的指針的位置)進(jìn)行操作使控制對(duì)象成為所希望的狀態(tài)。從操作裝置20輸出的操作量y(輸出數(shù)據(jù))(不限于1種)輸入調(diào)節(jié)器21,由調(diào)節(jié)器21實(shí)際驅(qū)動(dòng)或運(yùn)轉(zhuǎn)控制對(duì)象10。有時(shí)控制量x1,x2,…,xk的全部或一部分也不輸入操作裝置20??刂屏恳部梢允菑目刂茖?duì)象10得到的邏輯值(或計(jì)算值或估算值)。
由傳感器11~1k檢測(cè)的控制量x1~xk和從操作裝置20輸出的操作量y輸入模型形成系統(tǒng)1A。調(diào)節(jié)器21的輸出或其測(cè)量值也可以作為操作量輸入模型形成系統(tǒng)1A。模型形成系統(tǒng)1A使用這些輸入數(shù)據(jù)x1~xk和輸出數(shù)據(jù)y作成關(guān)于控制(或操作)的模型。
圖2是問(wèn)題解決模式中包括控制對(duì)象的整個(gè)系統(tǒng)的結(jié)構(gòu)。本發(fā)明的系統(tǒng)以自動(dòng)控制系統(tǒng)(自動(dòng)操作系統(tǒng))1B進(jìn)行體現(xiàn)。
自動(dòng)控制系統(tǒng)1B取入由傳感器11~1k檢測(cè)的控制對(duì)象10的控制量x1~xk,按照前面作成的模型計(jì)算應(yīng)輸入控制對(duì)象10的操作量y。操作量y輸入驅(qū)動(dòng)控制對(duì)象10的調(diào)節(jié)器21(另外,控制調(diào)節(jié)器21以使調(diào)節(jié)器21的輸出成為計(jì)算的值)。這樣,控制對(duì)象10便和操作者使用操作裝置20控制(操作)控制對(duì)象20一樣,由自動(dòng)控制系統(tǒng)1B進(jìn)行控制(操作)。(2)系統(tǒng)結(jié)構(gòu)和應(yīng)用例圖3是根據(jù)模式使用作為模型形成系統(tǒng)或自動(dòng)控制系統(tǒng)而體現(xiàn)的本發(fā)明的等級(jí)結(jié)構(gòu)模型的系統(tǒng)的結(jié)構(gòu)例子。
本系統(tǒng)基本上利用計(jì)算機(jī)30實(shí)現(xiàn)。計(jì)算機(jī)30不論是所謂的個(gè)人計(jì)算機(jī)還是大型、小型或其他通用計(jì)算機(jī)都可以使用。
在計(jì)算機(jī)30中設(shè)有存儲(chǔ)用于執(zhí)行模型形成模式和問(wèn)題解決模式的處理的程序的存儲(chǔ)器31和存儲(chǔ)在這些處理中生成的或使用的數(shù)據(jù)(包括表示模型的數(shù)據(jù))的存儲(chǔ)器32。這些存儲(chǔ)器31和32利用ROM、RAM、硬盤、軟盤、光盤等實(shí)現(xiàn)。既可以存儲(chǔ)器31和32都利用硬盤實(shí)現(xiàn),也可以存儲(chǔ)器31利用ROM和硬盤或軟盤實(shí)現(xiàn),而存儲(chǔ)器32利用RAM和硬盤實(shí)現(xiàn)。這里,存儲(chǔ)器31和32是根據(jù)存儲(chǔ)的數(shù)據(jù)的種類而分類的概念。
另外,輸入裝置33和作為輸出裝置的顯示裝置34及打印機(jī)35與計(jì)算機(jī)30連接。輸入裝置33包括鍵盤和鼠標(biāo)器。也可以將顯示菜單畫面的顯示裝置34視為輸入裝置33的一部分。作為輸出裝置,只要有顯示裝置34和打印機(jī)35中的至少任意一種(最好是顯示裝置34)就可以。
此外,將由傳感器11~1k檢測(cè)的控制對(duì)象10的控制量(通常為模擬量)變換為數(shù)字?jǐn)?shù)據(jù)的A/D變換器36、在模型形成模式中將從操作裝置20輸出的操作量(為模擬量時(shí))變換為數(shù)字?jǐn)?shù)據(jù)的A/D變換器37和在問(wèn)題解決模式中根據(jù)需要將計(jì)算的輸入調(diào)節(jié)器21的操作量(通常為數(shù)字量)變換為模擬量的D/A變換器38與計(jì)算機(jī)30連接。這些A/D變換器和D/A變換器也可以內(nèi)裝在計(jì)算機(jī)內(nèi)使用。另外,如果不需要這些A/D變換器和D/A變換器,就可以不必設(shè)置。例如,當(dāng)調(diào)節(jié)器是可以接收數(shù)字量的調(diào)節(jié)器時(shí),就不需要D/A變換器38。
在計(jì)算機(jī)30中,根據(jù)需要還可以設(shè)置用于控制量及操作量的輸入和操作量的輸出的接口(如后面所述的微分電路等)。
圖4是作為控制對(duì)象的例子的升降機(jī)控制系統(tǒng)。為了簡(jiǎn)單起見(jiàn),該升降機(jī)系統(tǒng)是只包含1條軌道的升降機(jī)。
1條軌道50水平地架設(shè)在適當(dāng)高度的位置。架空平臺(tái)(臺(tái)車)40通過(guò)滑輪41支持在該軌道50上,可以自由移動(dòng)?;?1由運(yùn)行電機(jī)42直接或通過(guò)減速器進(jìn)行轉(zhuǎn)動(dòng)驅(qū)動(dòng)。
另外,在架空平臺(tái)40上設(shè)置提升機(jī)。該提升機(jī)包括滑輪44、驅(qū)動(dòng)滑輪44的提升電機(jī)46和繞在滑輪44上的鋼絲繩47?;?4固定在轉(zhuǎn)軸45上,轉(zhuǎn)軸45架設(shè)到固定在架空平臺(tái)40上的軸承架43上,可以自由轉(zhuǎn)動(dòng),該轉(zhuǎn)軸45由電機(jī)46直接或通過(guò)減速器進(jìn)行轉(zhuǎn)動(dòng)驅(qū)動(dòng)。掛鉤48安裝在鋼絲繩47的下端,重物49掛在該掛鉤48上。
假定進(jìn)行如下升降控制。即,通過(guò)使架空平臺(tái)40從軌道50上的一點(diǎn)A運(yùn)行到另一點(diǎn)B搬運(yùn)重物49。這時(shí),為了盡可能減小鋼絲繩47的振動(dòng)角(在架空平臺(tái)移動(dòng)方向的振動(dòng)角)(將其限制在指定的角度以內(nèi),稱此角度為最大容許振動(dòng)角度)進(jìn)行架空平臺(tái)40的運(yùn)行控制。
作為控制量,可以采用架空平臺(tái)40的位置、振動(dòng)角度和振動(dòng)角度的微分值。
架空平臺(tái)40的位置,取以出發(fā)點(diǎn)A為原點(diǎn)指向終點(diǎn)B的方向?yàn)檎较?。該位置由設(shè)在電機(jī)42的轉(zhuǎn)軸或滑輪41的軸上的轉(zhuǎn)動(dòng)傳感器(圖中未示出)進(jìn)行檢測(cè)。從轉(zhuǎn)動(dòng)傳感器輸出的脈沖串(或表示位置的數(shù)字?jǐn)?shù)據(jù))輸入計(jì)算機(jī)(不需要A/D變換器36)。根據(jù)需要,可以設(shè)置檢測(cè)架空平臺(tái)40位于出發(fā)點(diǎn)A的原點(diǎn)檢測(cè)器。
鋼絲繩47的振動(dòng)角由安裝在架空平臺(tái)40上的并且用于對(duì)鋼絲繩47進(jìn)行攝像而配置的電視攝像機(jī)51和對(duì)該攝像機(jī)51的圖像信號(hào)進(jìn)行圖像處理的處理裝置進(jìn)行檢測(cè)。圖像處理裝置可以利用計(jì)算機(jī)30的一部分實(shí)現(xiàn)。這時(shí),攝像機(jī)51的圖像信號(hào)通過(guò)A/D變換器36輸入計(jì)算機(jī)30。用于對(duì)線狀物體的垂線的角度檢測(cè)的圖像處理,可以利用眾所周知的方法進(jìn)行。
振動(dòng)角的微分值,可以利用計(jì)算機(jī)30進(jìn)行運(yùn)算。
如圖5所示,使用旋轉(zhuǎn)吊桿47A取代鋼絲繩47起吊重物時(shí),可以更簡(jiǎn)單地檢測(cè)振動(dòng)角。旋轉(zhuǎn)吊桿47A的上端固定在轉(zhuǎn)軸45上。轉(zhuǎn)軸45支持在軸承架43上,可以自由轉(zhuǎn)動(dòng)。旋轉(zhuǎn)吊桿47A的下端為掛鉤48。轉(zhuǎn)軸45的轉(zhuǎn)動(dòng)角由角度傳感器52檢測(cè)。當(dāng)角度傳感器52的輸出信號(hào)為模擬量時(shí),由A/D變換器36變換為數(shù)字量后輸入計(jì)算機(jī)30。另外,角度傳感器52的輸出信號(hào)由微分電路進(jìn)行微分,該微分信號(hào)通過(guò)A/D變換器36作為振動(dòng)角的微分值輸入計(jì)算機(jī)30。當(dāng)然,微分處理也可以利用計(jì)算機(jī)30進(jìn)行。當(dāng)角度傳感器52的輸出為數(shù)字量時(shí),就直接輸入計(jì)算機(jī)30。
操作量是架空平臺(tái)40的移動(dòng)速度。移動(dòng)速度也可以作為加到運(yùn)行電機(jī)42上的電壓或電流進(jìn)行表現(xiàn)。
本發(fā)明的系統(tǒng)也可以應(yīng)用于沒(méi)有檢測(cè)控制量的傳感器及輸入操作量的調(diào)節(jié)器的控制對(duì)象,例如股票的預(yù)測(cè)系統(tǒng)。這時(shí),輸入數(shù)據(jù)是當(dāng)天的股票價(jià)格(對(duì)于各品種的)、當(dāng)天的平均股票價(jià)格等,從鍵盤、通信裝置、軟盤驅(qū)動(dòng)器等輸入。輸出數(shù)據(jù)是賣出決定、買入決定及其數(shù)量。這些數(shù)值從顯示裝置及打印機(jī)輸出。
作為其他例子,就是店鋪的銷售預(yù)測(cè)系統(tǒng)。輸入數(shù)據(jù)是星期、氣候、庫(kù)存量等,從鍵盤、通信裝置、軟盤驅(qū)動(dòng)器等輸入。輸出數(shù)據(jù)是預(yù)測(cè)銷售額、采購(gòu)量等,從顯示裝置及打印機(jī)輸出。
下面,以上述升降機(jī)控制系統(tǒng)為例詳細(xì)說(shuō)明模型形成模式和問(wèn)題解決模式。在模型形成模式中使用的實(shí)際的運(yùn)轉(zhuǎn)數(shù)據(jù)是根據(jù)模擬得到的數(shù)據(jù)。模擬系統(tǒng)的例子示于圖6。該系統(tǒng)由計(jì)算機(jī)30、程序存儲(chǔ)器31、數(shù)據(jù)存儲(chǔ)器32、輸入裝置33、顯示裝置34和打印機(jī)35構(gòu)成。在該系統(tǒng)中,也可以進(jìn)行問(wèn)題解決模式的處理??梢哉f(shuō)圖6是利用本發(fā)明的系統(tǒng)的最小限度的結(jié)構(gòu)(當(dāng)然,作為輸出裝置,只要有顯示裝置和打印機(jī)中的任意一種就可以了)。
在模擬中,求架空平臺(tái)的位置x和轉(zhuǎn)動(dòng)角度θ使用的計(jì)算公式為(參見(jiàn)圖7)d2xdt2=(m2m1)·g·θ+Fm1+(m2m1)·e·(dθdt)2·θ]]>d2θdt2=-(m1+m2m1e)·e·θFm2m1em1·(dθdt)2·θ]]>其中,m1為架空平臺(tái)的質(zhì)量m2為重物的質(zhì)量l為鋼絲繩的長(zhǎng)度g為重力加速度F為電機(jī)的推進(jìn)力,可以由下式求出。
F=K1ω1+K2ω2+K3V其中,ω1=Vd-Vω2=∫t0ω1(τ)dτ]]>式中,K1、K2、K3是常數(shù)。
V1是電機(jī)速度,Vd是電機(jī)的目標(biāo)速度,在模擬中是由操作者給定的操作量。即,Vd取如下數(shù)值。Vd=(-40(m/min),0,40(m/min))(3)模型形成模式的處理本項(xiàng)和下面的((4)問(wèn)題解決模式的處理)主要利用計(jì)算機(jī)30執(zhí)行。因此,只要未特別聲明,下面所述的具體的處理都是指利用計(jì)算機(jī)30進(jìn)行的處理。
模型具有由目標(biāo)(目的或目標(biāo))、策略(戰(zhàn)略)和動(dòng)作(執(zhí)行,行動(dòng))3個(gè)層次構(gòu)成的等級(jí)結(jié)構(gòu)。該結(jié)構(gòu)基于如下原理。
“在所有的動(dòng)作中,存在與其關(guān)聯(lián)的至少1個(gè)策略,在所有的策略中,存在與其關(guān)聯(lián)的至少1個(gè)目標(biāo)?!毕旅妫瑓⒄?qǐng)D8a和圖8b說(shuō)明模型形成模式的具體的處理順序。
在S101,操作者使用操作裝置20實(shí)際操作(運(yùn)轉(zhuǎn))控制對(duì)象10。這時(shí),按一定時(shí)間間隔對(duì)從傳感器11~1k得到的控制量(輸入數(shù)據(jù))和供給調(diào)節(jié)器21的操作量(輸出數(shù)據(jù))進(jìn)行采樣,并輸入計(jì)算機(jī)30。這些輸入、輸出數(shù)據(jù)作為教師數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)存儲(chǔ)器32內(nèi)。輸入、輸出數(shù)據(jù)是實(shí)際的操作記錄。
圖9是在上述升降機(jī)控制系統(tǒng)的模擬中得到的輸入、輸出數(shù)據(jù)的一個(gè)例子。
輸入、輸出數(shù)據(jù)每0.3秒采樣一次。如上所述,升降機(jī)按前進(jìn)、后退和停止3種操作進(jìn)行運(yùn)轉(zhuǎn)。前進(jìn)時(shí),設(shè)定操作輸出(架空平臺(tái)的移動(dòng)速度輸出數(shù)據(jù))u=+40(m/min),后退時(shí),設(shè)定u=-40(m/min),停止時(shí),設(shè)定u=0(m/min)。輸入數(shù)據(jù)是架空平臺(tái)的位置x(m)、鋼絲繩的振動(dòng)角θ(rad)和振動(dòng)角的變化率(微分值)dθ(rad/sec)(以下,將dθ/dt表為dθ)。
在圖9中,用T1表示的時(shí)間帶是架空平臺(tái)的起動(dòng)時(shí)間,調(diào)整操作輸出u使振動(dòng)角θ限制在盡可能小的范圍內(nèi)。在T2表示的時(shí)間帶,架空平臺(tái)以恒定速度運(yùn)轉(zhuǎn)。在T3表示的時(shí)間帶,調(diào)整操作輸出u以使架空平臺(tái)恰好在目的地點(diǎn)B停止。時(shí)間帶T4是架空平臺(tái)基本上到達(dá)地點(diǎn)B而重物的振動(dòng)角θ逐漸減小的過(guò)程。
在S102,將輸入輸出數(shù)據(jù)2值化,變換為形成二進(jìn)制字符串。將干二進(jìn)制字符串稱為動(dòng)作取樣。
圖9所示的輸入輸出數(shù)據(jù)的二進(jìn)制字符串示于圖10。輸入數(shù)據(jù)x、θ、dθ和輸出數(shù)據(jù)u分別由8位構(gòu)成。
在編碼處理中,不論哪個(gè)輸入、輸出變量,其最小值都變換為00000000,最大值都變換為11111111。位置x的最小值為-1(m),最大值為22(m)。振動(dòng)角θ的最小值為-0.1(rad),最大值為+0.1(rad)。其微分值dθ的最小值為-0.1(rad/sec),最大值為+0.1(rad/sec)。移動(dòng)速度u的最小值為-40(m/min),最大值為+40(m/min)。為了容易理解圖10,位置x=0(m)、振動(dòng)角θ=0(rad)、振動(dòng)角的微分值dθ=0(rad/sec)和移動(dòng)速度u=0(m/min)分別預(yù)先用二進(jìn)制值00001011,10000000,10000000,10000000表示。
用高級(jí)語(yǔ)言編寫模型形成模式的處理程序時(shí),二進(jìn)制編碼特別有意義。采用二進(jìn)制編碼的第1個(gè)理由在于,容易改變動(dòng)作取樣的分辨率。例如,通過(guò)舍棄16位的數(shù)據(jù)的低8位,可以獲得8位數(shù)據(jù)。第2個(gè)理由在于,最優(yōu)化算法語(yǔ)言之一即遺傳算法語(yǔ)言的最佳的表現(xiàn)方法就是二進(jìn)制字符串。
在S103-1,首先,對(duì)每個(gè)輸入變量抽出最初的(初始)動(dòng)作取樣和最終的(終點(diǎn))動(dòng)作取樣,通過(guò)求它們的差進(jìn)行比較。另外,對(duì)每個(gè)輸入變量計(jì)算最大值和最小值。
在圖9所示的例子中,時(shí)間t=0.00的動(dòng)作取樣是最初的動(dòng)作取樣(值),時(shí)間t=29.10的動(dòng)作取樣是最終的動(dòng)作取樣(值)。對(duì)它們都加上虛線的長(zhǎng)方形框。另外,輸入變量θ、dθ的最大值和最小值都加上實(shí)線的長(zhǎng)方形框。輸入變量x的最大值和最小值是加虛線的長(zhǎng)方形框的最終值和最初值。
在S103-2,作成在S103-1得到的結(jié)果的列表。當(dāng)然,在數(shù)據(jù)存儲(chǔ)器32中也作成該列表。
對(duì)圖9所示的例子得到的列表示于圖11。
在S103-3,如果(最大值)-(最小值)=0,則不計(jì)該輸入變量,將該輸入變量掩蔽。
最大值和最小值相等的輸入變量,在控制對(duì)象的操作中是完全不變化的,對(duì)操作及控制也沒(méi)有任何影響。
在S103-4,當(dāng)最初值與最終值之差不為0時(shí),對(duì)于該輸入變量,目標(biāo)條件表為如下形式目標(biāo)jxi“最終狀態(tài)”的值=(最終值)目標(biāo)j+ixi“過(guò)渡狀態(tài)”寬度=[最小值,最大值]在控制對(duì)象的實(shí)際操作中,對(duì)于輸入變量,最初值和最終值不同就意味著該操作一定要使輸入變量xi從(最初值)變化為(最終值)。并且,可以斷定一定是使這時(shí)的輸入變量xi的變化幅度限制在(最小值)與(最大值)之間。因此,對(duì)于輸入變量xi的目標(biāo)(控制目的)就是使輸入變量xi的值從(最初值)出發(fā)最后成為(最終值),這時(shí),將xi的變化幅度限制在(最小值)與(最大值)之間。
在圖11所示的例子中,輸入變量x的最初值和最終值不同。因此,對(duì)于輸入變量x,臨時(shí)設(shè)定如下目標(biāo)條件。
目標(biāo)1x“最終狀態(tài)”的值=9.467目標(biāo)2x“過(guò)渡狀態(tài)”寬度=
在S103-5,當(dāng)最初值與最終值之差為0時(shí),對(duì)于該輸入變量,目標(biāo)條件表為如下形式目標(biāo)jxi“過(guò)渡狀態(tài)”寬度=[最小值,最大值]對(duì)于某一輸入變量,當(dāng)其最初值和最終值相同時(shí),不論根據(jù)最初值還是最終值都不能導(dǎo)出目標(biāo)。這時(shí),在操作的過(guò)程中寧可將輸入變量保持在一定的范圍內(nèi)。這就是上述目標(biāo)條件的意義。
在圖11所示的例子中,不論振動(dòng)角θ還是其微分值dθ,它們的最初值和最終值都相同(都是0.000)。因此,對(duì)于輸入變量θ、dθ,臨時(shí)設(shè)定如下目標(biāo)條件。
目標(biāo)3θ“過(guò)渡狀態(tài)”寬度=[-0.029,0.027]目標(biāo)4dθ“過(guò)渡狀態(tài)”寬度=[-0.039,0.042]在S103-6,上述S103-3、103-4和103-5的結(jié)果由打印機(jī)35進(jìn)行打印。另外,在顯示裝置34上進(jìn)行顯示。
在S103-7,上述目標(biāo)條件按照如下排列編碼為二進(jìn)制字符串。
“目標(biāo)序號(hào)輸入變量類型·標(biāo)志值”對(duì)于該排列,在下面的S104的說(shuō)明中詳細(xì)說(shuō)明。
在S104,用戶看了利用打印機(jī)35打印的或由顯示裝置34顯示的目標(biāo)的假說(shuō)(臨時(shí)設(shè)定的上述目標(biāo)1~4)之后,對(duì)它們進(jìn)行評(píng)價(jià),根據(jù)需要添加新的目標(biāo)條件或刪除某個(gè)目標(biāo)條件或者修正目標(biāo)條件。
在升降機(jī)的控制系統(tǒng)的例子中,在設(shè)定的上述假說(shuō)(目標(biāo)1~4)中,目標(biāo)2作為不需要的目標(biāo)而刪除了。目標(biāo)2是關(guān)于輸入變量x(表示位置)的過(guò)渡狀態(tài)寬度的目標(biāo),位置x只要從最初值向最終值單調(diào)地增加就可以了,所以,關(guān)于過(guò)渡狀態(tài)寬度的目標(biāo)假說(shuō)是不需要的。這樣,目標(biāo)3和目標(biāo)4的目標(biāo)序號(hào)便逐一上移1,分別成為目標(biāo)2和目標(biāo)3。
經(jīng)過(guò)用戶的評(píng)價(jià)最后得到的目標(biāo)稱為目標(biāo)路線。在上述例子中,最終得到的3個(gè)目標(biāo)路線與其二進(jìn)制字符串一起示于圖12。
下面,先說(shuō)明二進(jìn)制字符串的各項(xiàng)的排列和該二進(jìn)制數(shù)據(jù)(參見(jiàn)S103-7)。
開(kāi)頭的目標(biāo)1、目標(biāo)2、目標(biāo)3的1、2、3是“目標(biāo)路線序號(hào)(目標(biāo)序號(hào))”,用2位表示。
第2項(xiàng)的x、θ、dθ是“輸入變量”的種類,它們都用2位表示。x為00,θ為01,dθ為10。
第3項(xiàng)的“類型·標(biāo)志”是表示“最終狀態(tài)”的值或“過(guò)渡狀態(tài)”的寬度。該類型·標(biāo)志為2位,“最終狀態(tài)”的值用01表示,“過(guò)渡狀態(tài)”的寬度用10表示。
最后一項(xiàng)的“值”隨類型·標(biāo)志而不同。類型·標(biāo)志為01時(shí),“值”為“最終值”(用8位表示)。由于“最終值”只有1個(gè),所以,該8位數(shù)據(jù)反復(fù)2次。類型·標(biāo)志為10時(shí),“值”為按最小值,最大值(都用8位表示)的順序排列的16位數(shù)據(jù)(參見(jiàn)圖9、圖10、圖11)。
在S105,對(duì)于輸出變量,通過(guò)比較動(dòng)作取樣抽出策略。
具體地說(shuō),就是先將輸出變量的最初值和最終值存儲(chǔ)到數(shù)據(jù)存儲(chǔ)器32內(nèi)。然后,將時(shí)刻t的輸出數(shù)據(jù)(動(dòng)作取樣)與其后的時(shí)刻t+1的輸出數(shù)據(jù)進(jìn)行比較。如果這兩個(gè)輸出數(shù)據(jù)不同,就存儲(chǔ)時(shí)刻t的輸出數(shù)據(jù)和時(shí)刻t+1的輸出數(shù)據(jù)。這一處理從t=0進(jìn)行到t=最終時(shí)刻,將t的值逐次增加1反復(fù)進(jìn)行。將這樣存儲(chǔ)到存儲(chǔ)器中的數(shù)據(jù)稱為“策略取樣”。
下面,使用升降機(jī)控制系統(tǒng)的動(dòng)作取樣具體地說(shuō)明。參照?qǐng)D10所示的二進(jìn)制字符串。
圖13是最后得到的策略取樣。這里,為了便于參照,也示出了時(shí)刻和動(dòng)作取樣序號(hào)。
存儲(chǔ)輸出變量的最初值10000000(時(shí)刻t=0.00,取樣序號(hào)=1)和最終值10000000(時(shí)刻t=29.10,取樣序號(hào)=98)。
由于時(shí)刻t=0.00的輸出變量值10000000與時(shí)刻t=0.30的輸出變量值11111111不同,所以,存儲(chǔ)時(shí)刻t=0.30的輸出變量值(時(shí)刻t=0.00的輸出變量值已存儲(chǔ)過(guò)了)。
將時(shí)刻t=0.30的輸出變量值11111111與時(shí)刻t=0.60的輸出變量值10000000進(jìn)行比較。由于它們相互不同,所以,存儲(chǔ)這兩個(gè)值。
同樣,由于時(shí)刻t=0.60的值與時(shí)刻t=0.90的值不同,時(shí)刻t=0.90的值與時(shí)刻t=1.20的值不同,以及時(shí)刻t=1.20的值與時(shí)刻t=1.50的值不同,所以,存儲(chǔ)這些值。
從時(shí)刻1.50到時(shí)刻14.40的值相同。因此,不存儲(chǔ)這些時(shí)刻的輸出變量值。
時(shí)刻14.40的值與時(shí)刻14.70的值不同,因此,存儲(chǔ)這兩個(gè)時(shí)刻的輸出變量值。
時(shí)刻14.70的值與時(shí)刻15.00的值相同,因此,不存儲(chǔ)這兩個(gè)時(shí)刻的值。
由于時(shí)刻15.00的值與時(shí)刻15.30的值不同,時(shí)刻15.30的值與時(shí)刻15.60的值不同,時(shí)刻15.60的值與時(shí)刻15.90的值不同,所以,存儲(chǔ)這些值。
由于時(shí)刻15.90的值與時(shí)刻16.20的值相同,所以,不存儲(chǔ)這兩個(gè)值。
由于時(shí)刻16.20的值與時(shí)刻16.50的值不同,所以,存儲(chǔ)這兩個(gè)值。
由于時(shí)刻16.50以后的輸出變量值直至最終時(shí)刻29.10都相同,所以,不存儲(chǔ)這些值。
這樣,尋找輸出變量變化的位置,將其前后時(shí)刻的輸出變量值存儲(chǔ)到存儲(chǔ)器內(nèi)。
在上述例子中,說(shuō)明了輸出變量只為一種的情況,但是,輸出變量的種類為多種時(shí)也一樣。這時(shí),如果某一種輸出變量的值發(fā)生變化,在輸出變量變化后,就存儲(chǔ)該變化前后所有的輸出變量的值。
在S106,參照動(dòng)作取樣將這樣抽出的策略取樣變換為具有如下形式的策略路線。
“do…when…until…min…max…”在do之后,接輸出變量(1種或多種)的值。在when之后,接輸入變量的值(1個(gè)或多個(gè))。在until之后,也接輸入變量的值。在min之后,排列各輸入變量的最小值,在max之后,排列各輸入變量的最大值。
下面,參照?qǐng)D14~圖16使用簡(jiǎn)單的例子進(jìn)行說(shuō)明。在這些圖中,輸入變量為2種,即x1、x2,輸出變量為1種,即u。時(shí)刻用tp~tp+11表示。
圖14是動(dòng)作取樣的簡(jiǎn)單例子。圖15是根據(jù)圖14的動(dòng)作取樣作成的策略取樣。在圖14中,著眼于輸出變量,當(dāng)輸出變量變化時(shí),通過(guò)抽出其前后時(shí)刻的輸出變量的值,便可得到圖15所示的策略取樣,如在S105說(shuō)明的那樣。
圖16是輸入變量空間的動(dòng)作取樣的曲線圖。正交的2個(gè)軸為輸入變量x1和x2。用長(zhǎng)方形表示輸出變量u保持一定值的范圍。
在輸入變量種類為3個(gè)時(shí)形成的3維輸入變量空間,用長(zhǎng)方體表示輸出變量保持一定值的范圍。在4維以上的輸入空間,用雙曲盒(超長(zhǎng)方體)表示該范圍。在以下的說(shuō)明中,不論輸入變量空間是2維還是3維,對(duì)于包括長(zhǎng)方形、長(zhǎng)方體在內(nèi)的所有情況,使用稱為雙曲盒的術(shù)語(yǔ)。
在圖16中,雙曲盒Q是輸出變量u為90的范圍,雙曲盒Q+1是u為100的范圍。
規(guī)定1個(gè)雙曲盒的輸入、輸出變量的集合稱為策略路線。以策略路線Q為例,則可表為dou=90 when x1=3.0,x2=20until x1=4.5,x2=45min x1=3.0,x2=10max x1=5.5,x2=45其意義如下“從輸入為x1=3,x2=20上到x1=4.5,x2=45時(shí),使輸出u為90。但是,對(duì)于輸入x1,容許范圍為從最小值3.0到最大值5.5,對(duì)于輸入x2,容許范圍為從最小值10到最大值45。
雙曲盒Q的1個(gè)頂點(diǎn)用(x1的最小值,x2的最小值)(該點(diǎn)在圖16中表為MIN)表示,與其相對(duì)的另一個(gè)頂點(diǎn)用(x1的最大值,x2的最大值)(該點(diǎn)在圖16中表為MAX)表示。
容易理解,策略路線Q+1可以表為dou=100 when x1=3.5,x2=47until x1=1.0,x2=34min x1=1.0,x2=34max x1=3.5,x2=48對(duì)于升降機(jī)控制的上述例子,輸入空間的動(dòng)作取樣的曲線圖示于圖17。為了簡(jiǎn)單起見(jiàn),示出了以位置x和振動(dòng)角θ為正交的2個(gè)坐標(biāo)軸的2維輸入變量空間(當(dāng)然,正確地說(shuō)應(yīng)是以x、θ、dθ為相互正交的坐標(biāo)軸的3維輸入變量空間)。
參照?qǐng)D13所示的策略取樣得到的策略路線示于圖18a、圖18b和圖19。圖18a和圖18b是用10進(jìn)制數(shù)的數(shù)值表示,圖19是變換為二進(jìn)制字符串的情況(參見(jiàn)圖10)。
在圖18a和圖18b中,接在do之后的是輸出變量值。另外,在when之后,輸入變量值(when項(xiàng)的輸入變量值)按輸入變量x、θ、dθ的順序排列。同樣,在until、min、max之后,輸入變量值(until項(xiàng)、min項(xiàng)和max項(xiàng)的輸入變量值)也按x、θ、dθ的順序排列。
在圖19中,2進(jìn)制代碼對(duì)各變量值用8位表示。其順序?yàn)閣hen項(xiàng)的x、θ、dθ的輸入變量值,until項(xiàng)的x、θ、dθ的輸入變量值,min項(xiàng)的x、θ、dθ的輸入變量值,max項(xiàng)的x、θ、dθ的輸入變量值,并且,最后是do項(xiàng)的輸出變量值。
在圖17中,策略路線1,2,3,4,7和8不是長(zhǎng)方形(雙曲盒),用1點(diǎn)表示(該點(diǎn)也可以包含在雙曲盒的概念內(nèi))。
在S107,在經(jīng)過(guò)上述處理得到的所有的策略路線中,通過(guò)不計(jì)(刪除)不需要的策略路線,使策略路線實(shí)現(xiàn)最優(yōu)化。
首先,看一下是否有具有相同的輸出變量值的2個(gè)以上的策略路線。當(dāng)發(fā)現(xiàn)了具有相同的輸出變量值的2個(gè)以上的策略路線時(shí),就根據(jù)輸入變量值(雙曲盒)計(jì)算這些路線的遠(yuǎn)近程度。當(dāng)遠(yuǎn)近程度接近時(shí),就留下1個(gè)策略路線,刪除其他策略路線或者將這些策略路線合而為一。
例如,當(dāng)2個(gè)以上的策略路線的雙曲盒完全重合時(shí),就留下其中的1個(gè),將其他刪除。
此外,例如計(jì)算2個(gè)以上的雙曲盒的距離,當(dāng)?shù)玫降木嚯x小于指定的閾值時(shí),就將這些策略路線合而為一或者刪除掉一方。作為距離,例如著眼于由在when(或until)項(xiàng)記述的輸入變量值表示的輸入變量空間的點(diǎn)(或MIN點(diǎn)或MAX點(diǎn)),可以使用2個(gè)路線的這些點(diǎn)間的距離。
對(duì)于盡可能減少策略路線的數(shù)量的方法,有很多逼近方法。
在升降機(jī)控制系統(tǒng)的例子中,雖然輸出變量u的值相等的路線有多個(gè),但是,由那些輸入變量值表示的點(diǎn)相當(dāng)遠(yuǎn),所以,所有的策略路線就都需要保留。
在S108,將按上述方式作成的目標(biāo)路線和策略路線作如下聯(lián)系(或連接、連鎖)。
在S108-1,對(duì)于第1個(gè)策略路線(參見(jiàn)圖18a或圖19),將其狀態(tài)量與各目標(biāo)路線的目標(biāo)條件進(jìn)行比較。所謂狀態(tài)量,在策略路線中,就是when項(xiàng)的輸入變量值(或until項(xiàng)的輸入變量值)。
在S108-2,當(dāng)狀態(tài)量不滿足目標(biāo)條件時(shí),將第1個(gè)策略路線與該目標(biāo)條件聯(lián)系。當(dāng)滿足目標(biāo)條件時(shí),就不將它們聯(lián)系。因?yàn)闈M足目標(biāo)條件時(shí)不需要針對(duì)該目標(biāo)的策略。
在S108-3,對(duì)所有的策略路線反復(fù)進(jìn)行S108-1和108-2的處理。
作為狀態(tài)量,取when項(xiàng)的輸入變量值,對(duì)于上述升降機(jī)控制系統(tǒng)的例子,試具體地進(jìn)行該聯(lián)系。
參照?qǐng)D12所示的目標(biāo)路線和圖18a及圖18b所示的策略路線。
對(duì)于策略路線序號(hào)1,在when項(xiàng)記述的輸入變量x的值為0.000。該值不滿足目標(biāo)序號(hào)1的目標(biāo)條件(“最終狀態(tài)”的值=9.467)。因此,將策略路線1與目標(biāo)路線1連鎖。
在策略路線1的when項(xiàng)記述的輸入變量θ的值為0.000。該值滿足目標(biāo)路線2的目標(biāo)條件(“過(guò)渡狀態(tài)”的寬度=[-0.029,0.027])。因此,不將策略路線1與目標(biāo)路線2連鎖。
同樣,在策略路線1的when項(xiàng)記述的輸入變量dθ的值為0.000。該值滿足目標(biāo)路線3的目標(biāo)條件(“過(guò)渡狀態(tài)”的寬度=[-0.039,0.042])。因此,也不將策略路線1與目標(biāo)路線3連鎖。
結(jié)果,策略路線1便只與目標(biāo)路線1連鎖(連接)。
同樣,對(duì)于策略路線2~10應(yīng)用上述S108-1,108-2的處理,可以得到如下結(jié)果。
策略路線2、3、4、5、6、8、9和10只與目標(biāo)路線1連鎖。
策略路線7與目標(biāo)路線1和7連鎖。
相反,如果從目標(biāo)路線的角度說(shuō),則為如下表述。
目標(biāo)路線1與策略路線1、2、3、4、5、6、7、8、9和10連鎖。
目標(biāo)路線2與任何策略路線都不連鎖。
目標(biāo)路線3只與策略路線7連鎖。
為了將這些連鎖存儲(chǔ)到存儲(chǔ)器內(nèi),各策略路線具有指向與其連鎖的所有的目標(biāo)路線的指針(與表示各策略路線的數(shù)據(jù)對(duì)應(yīng)地存儲(chǔ)這些指針)。另外,各目標(biāo)路線具有指向與其連鎖的所有的策略路線的指針。
圖20是設(shè)在各目標(biāo)路線中的指針。PL表示指向策略路線的指針,由PL之后的箭頭指示的序號(hào)是與該目標(biāo)路線連鎖的策略路線的序號(hào)。指針PL按各目標(biāo)路線序號(hào)設(shè)置。
圖21是與各策略路線序號(hào)對(duì)應(yīng)地設(shè)置的指針。指針PH是指向目標(biāo)路線的指針,指針PL是指向動(dòng)作路線的指針(下面說(shuō)明)。由PH之后的箭頭指示的序號(hào)是與該策略路線連鎖的目標(biāo)路線的序號(hào),由PL之后的箭頭指示的序號(hào)是與該策略路線連鎖的動(dòng)作路線的序號(hào)。
這樣的策略路線與目標(biāo)路線的連鎖,根據(jù)需要進(jìn)行顯示或打印。用戶可以根據(jù)需要添加新的策略路線,刪除不需要的策略路線,修正現(xiàn)有的策略路線。
在S109,將策略路線與動(dòng)作路線進(jìn)行如下聯(lián)系(或連接、連鎖)。所謂動(dòng)作路線,是指各時(shí)刻的輸入表述值與輸出表述值的組,與動(dòng)作取樣的意義大致相同。但是,從動(dòng)作路線中將具有完全相同值的動(dòng)作取樣刪除。
在S109-1,對(duì)于第1個(gè)動(dòng)作路線(參見(jiàn)圖9或圖10),將其狀態(tài)量與各策略路線的策略條件進(jìn)行比較。所謂狀態(tài)量,是指動(dòng)作路線的輸入表述值組。所謂策略條件,是指從在策略路線的when項(xiàng)記述的輸入表述值組到在until項(xiàng)記述的輸入表述值組的范圍(以下,將其稱為when~until范圍)。
在S109-2,當(dāng)狀態(tài)量滿足策略條件時(shí),就將第1個(gè)動(dòng)作路線與該策略路線聯(lián)系。
在S109-3,對(duì)所有的動(dòng)作路線反復(fù)進(jìn)行S109-1和109-2的處理。
對(duì)上述升降機(jī)控制系統(tǒng)的例子,試進(jìn)行這種聯(lián)系。參照?qǐng)D9和圖18a及圖18b。圖9所示的所有的動(dòng)作取樣是動(dòng)作路線。但是,由于第1個(gè)動(dòng)作路線表示架空平臺(tái)的靜止?fàn)顟B(tài),所以,在模型形成和問(wèn)題解決模式中沒(méi)有意義,沒(méi)有必要特別進(jìn)行聯(lián)系。因此,從第2個(gè)動(dòng)作路線開(kāi)始進(jìn)行聯(lián)系。
在第2個(gè)動(dòng)作路線(序號(hào)2)中,狀態(tài)量為x=0.000,θ=0.000,dθ=0.000,它們都在策略路線序號(hào)1的when~until范圍(x=0.000~0.000,θ=0.000~0.000,dθ=0.000~0.000)內(nèi)。另外,動(dòng)作路線2的狀態(tài)量不在其他策略路線的when~until范圍內(nèi)。因此,動(dòng)作路線2只與策略路線1連鎖。
同樣,對(duì)其他動(dòng)作路線進(jìn)行時(shí)鐘連鎖處理(S109-1,109-2),可以得到圖22所示的連鎖。
在圖22中,對(duì)每個(gè)動(dòng)作路線序號(hào),用指針PH表示與該動(dòng)作路線連鎖的策略路線。指針PH是指向連鎖的策略路線的動(dòng)作路線的指針。在指針PH的箭頭之后,記述連鎖的策略路線序號(hào)。
對(duì)每個(gè)策略路線,也設(shè)置指向與其連鎖的動(dòng)作路線的指針。這就是在圖21中用PL所示的指針。由對(duì)各策略路線序號(hào)設(shè)置的指針PL的箭頭指示的序號(hào)是與該策略路線連鎖的動(dòng)作路線。
由目標(biāo)路線、策略路線和動(dòng)作路線構(gòu)成的模型具有圖23所示的等級(jí)結(jié)構(gòu),并且,可知它們相互關(guān)聯(lián)。目標(biāo)(路線)位于最高位的等級(jí)(概念的意志決定的等級(jí))。策略(路線)位于中間的等級(jí)(根據(jù)狀況的意志決定的等級(jí))。動(dòng)作(路線)位于最低位的等級(jí)(經(jīng)驗(yàn)的意志決定的等級(jí))。
在S110,如果需要,就驗(yàn)證這樣作成的模型。
為了進(jìn)行驗(yàn)證,可以使用上述動(dòng)作取樣(教師數(shù)據(jù);圖9或圖10)。使用動(dòng)作取樣的輸入數(shù)據(jù),按照和后面所述的問(wèn)題解決模式的順序相同的順序(S121的輸入變量值讀入和編碼不一定需要),根據(jù)前面作成的模型計(jì)算輸出。將得到的輸出數(shù)據(jù)和動(dòng)作取樣的輸出數(shù)據(jù)進(jìn)行比較。如果兩個(gè)輸出數(shù)據(jù)是相等的值或接近的值(例如,兩數(shù)據(jù)之差小于指定的閾值),就可以認(rèn)為作成的模型正確。
此外,如果需要,還可以隨機(jī)地生成輸入數(shù)據(jù),并將該輸入數(shù)據(jù)輸入系統(tǒng)。系統(tǒng)根據(jù)模型計(jì)算輸出數(shù)據(jù)并進(jìn)行輸出。輸出數(shù)據(jù)是否妥當(dāng),由用戶進(jìn)行判斷。
在S111,最后,從存儲(chǔ)器的作業(yè)區(qū)域?qū)⒈硎咀鞒傻哪P偷臄?shù)據(jù)傳送到文件區(qū)域進(jìn)行保存。(4)問(wèn)題解決模式的處理在問(wèn)題解決模式中,系統(tǒng)使用上述模型實(shí)際控制(運(yùn)轉(zhuǎn)或操作)控制對(duì)象(參見(jiàn)圖2)。其處理順序示于圖24。
在S121,將傳感器11、12、1k(圖2)或表示位置x的振動(dòng)傳感器的輸出和表示振動(dòng)角的角度傳感器等(圖4、圖5)的輸入變量值讀入系統(tǒng)1。將這些輸入值以適當(dāng)?shù)姆直媛首儞Q為2值數(shù)據(jù)。
在S122,將得到的輸入數(shù)據(jù)與包含在模型中的目標(biāo)路線的目標(biāo)條件進(jìn)行比較。如果有具有輸入數(shù)據(jù)不滿足的目標(biāo)條件的目標(biāo)路線,就將與該目標(biāo)路線連鎖的策略路線進(jìn)行列表。
在本階段,系統(tǒng)通過(guò)決定適當(dāng)?shù)哪繕?biāo)路線,進(jìn)行概念等級(jí)的意志決定。這樣,便可決定適當(dāng)?shù)牟呗月肪€。
在S123,將輸入數(shù)據(jù)與在上述S122選擇的策略路線進(jìn)行比較。如果有具有與輸入數(shù)據(jù)匹配的策略條件(when~until范圍)的策略路線,就將與該策略路線連鎖的動(dòng)作路線進(jìn)行列表。
在本階段,系統(tǒng)通過(guò)決定適當(dāng)?shù)牟呗月肪€進(jìn)行狀況的意志決定。結(jié)果,便可決定適當(dāng)?shù)膭?dòng)作路線。
在S124,在S123選擇的動(dòng)作路線中,選擇具有與輸入數(shù)據(jù)完全一致的輸入變量值的或與輸入數(shù)據(jù)最接近的輸入變量值的(輸入變量空間的距離最短的)路線作為候補(bǔ)路線。
在S125,通常,由于在S124選擇1個(gè)候補(bǔ),所以,將該候補(bǔ)的動(dòng)作路線的輸出變量值作為輸出數(shù)據(jù)而輸出。當(dāng)存在2個(gè)以上的候補(bǔ)時(shí),就選擇最佳的候補(bǔ),將該動(dòng)作路線的輸出變量值作為輸出數(shù)據(jù)而輸出。例如,2個(gè)策略路線的雙曲盒一部分重復(fù),當(dāng)輸入數(shù)據(jù)包含在該重復(fù)的空間時(shí),就從2個(gè)策略路線導(dǎo)出不同的輸出變量值。這時(shí),例如選擇從輸入數(shù)據(jù)與雙曲盒的端點(diǎn)(MIN或MAX點(diǎn))的距離近的雙曲盒得到的輸出值,或者無(wú)條件地選擇在處理中最初得到的輸出值。
圖25示出了根據(jù)模型自動(dòng)運(yùn)轉(zhuǎn)升降機(jī)控制系統(tǒng)時(shí)得到的輸入數(shù)據(jù)、根據(jù)模型計(jì)算的輸出數(shù)據(jù)(升降機(jī)控制用的)和在得到輸出值的過(guò)程中選擇的路線的序號(hào)。最右邊的括號(hào)內(nèi)的3個(gè)數(shù)字(用箭頭聯(lián)系)表示根據(jù)前面選擇的目標(biāo)路線序號(hào)、策略路線序號(hào)和動(dòng)作路線序號(hào)。
例如,輸入輸出數(shù)據(jù)序號(hào)1的輸入數(shù)據(jù)是x=0.000,θ=0.000,dθ=0.000。這些輸入數(shù)據(jù)不滿足目標(biāo)路線1的目標(biāo)條件,滿足其他目標(biāo)路線2,3的目標(biāo)條件(參見(jiàn)圖12)。因此,選擇與目標(biāo)路線1連鎖的10個(gè)策略路線1、2、3、4、5、6、7、8、9和10(參見(jiàn)圖20)(S122)。
在這些策略路線1~10中,具有滿足上述輸入數(shù)據(jù)的策略條件的只是策略路線1(參見(jiàn)圖18a)。因此,選擇與策略路線1連鎖的動(dòng)作路線2(參見(jiàn)圖21)(S123)。
因此,將動(dòng)作路線2的輸出變量值u=40.00作為輸出數(shù)據(jù)而輸出(參見(jiàn)圖9)(S124、125)。
在圖25中,不僅輸入輸出數(shù)據(jù)序號(hào)8~10的輸入數(shù)據(jù)x不滿足目標(biāo)路線1的目標(biāo)條件,而且輸入數(shù)據(jù)θ也不滿足目標(biāo)路線2的目標(biāo)條件。因此,選擇目標(biāo)路線1和2。但是,與目標(biāo)路線2連鎖的策略路線不存在。因此,從與目標(biāo)路線1連鎖的策略路線1~10中選擇輸入數(shù)據(jù)匹配的策略路線。具有滿足輸入輸出數(shù)據(jù)序號(hào)8~10的全部輸入數(shù)據(jù)x、θ、dθ的策略條件的策略路線不存在。這時(shí),選擇與輸入數(shù)據(jù)最接近的(例如一部分輸入變量的輸入數(shù)據(jù)滿足策略條件或具有位于與輸入數(shù)據(jù)最接近的距離的雙曲盒)策略路線。這里,選擇策略路線5。
在與策略路線6連鎖的動(dòng)作路線中(參見(jiàn)圖21),分別選擇具有與各輸入輸出數(shù)據(jù)序號(hào)8、9、10的輸入數(shù)據(jù)最接近的輸入變量值的動(dòng)作路線9、10、11,將這些動(dòng)作路線的輸出變量值(u=40.000)作為輸出數(shù)據(jù)而輸出。
每次從控制對(duì)象讀入輸入數(shù)據(jù)(每隔一定時(shí)間),反復(fù)進(jìn)行圖24的S121~125的處理。
權(quán)利要求
1.一種推理方法,其特征在于取入由通過(guò)操作或控制對(duì)象而得到的輸入輸出變量值的組構(gòu)成的一連串的動(dòng)作數(shù)據(jù),著眼于取入的上述動(dòng)作取樣中的輸入變量值,對(duì)每個(gè)輸入變量作成使用輸入變量值的最初的值、最后的值、最大值和最小值規(guī)定的目標(biāo)路線,著眼于取入的上述動(dòng)作取樣中的輸出變量值,抽出輸出變量值保持同一性的輸入變量的范圍,對(duì)于各范圍作成將輸入變量的范圍與輸出變量值連結(jié)的策略路線,將具有不滿足上述目標(biāo)路線的條件的輸入變量范圍的策略路線與該編碼路線連鎖,將具有進(jìn)入上述策略路線的輸入變量范圍的輸入變量值的動(dòng)作路線與該策略路線連鎖,借此形成由相互連鎖的目標(biāo)路線、策略路線和動(dòng)作路線構(gòu)成的等級(jí)結(jié)構(gòu)的模型。
2.按權(quán)利要求1所述的推理方法,其特征在于包括將取入的上述動(dòng)作取樣變換為指定位的二進(jìn)制數(shù)據(jù)的步驟。
3.按權(quán)利要求1所述的推理方法,其特征在于作成目標(biāo)路線的上述步驟由作成臨時(shí)的目標(biāo)路線的步驟、輸出作成的目標(biāo)路線的步驟和將接收用戶的評(píng)價(jià)后的目標(biāo)路線作為最終的目標(biāo)路線的步驟構(gòu)成。
4.按權(quán)利要求3所述的推理方法,其特征在于上述用戶的評(píng)價(jià)包括目標(biāo)路線的添加、刪除和改變。
5.按權(quán)利要求1所述的推理方法,其特征在于作成策略路線的上述步驟由順序比較按時(shí)間順序排列的輸出變量值的相鄰的數(shù)值并當(dāng)有變化時(shí)就存儲(chǔ)其前后的輸出變量值作成策略取樣的步驟、參照上述動(dòng)作取樣將上述翠綠取樣變換為具有do…when…until…min…max的形式的策略路線的步驟和使變換后的上述策略路線實(shí)現(xiàn)最優(yōu)化的步驟構(gòu)成。
6.按權(quán)利要求5所述的推理方法,其特征在于使上述策略路線實(shí)現(xiàn)最優(yōu)化的步驟是減少具有相同的輸出變量值的2個(gè)以上的策略路線的數(shù)量。
7.按權(quán)利要求1所述的推理方法,其特征在于利用設(shè)在各策略路線中的指向目標(biāo)路線的指針和設(shè)在各目標(biāo)路線中的指向策略路線的指針實(shí)現(xiàn)策略路線與目標(biāo)路線的連鎖。
8.按權(quán)利要求1所述的推理方法,其特征在于利用設(shè)在各動(dòng)作路線中的指向策略路線的指針和設(shè)在各策略路線中的指向動(dòng)作路線的指針實(shí)現(xiàn)動(dòng)作路線與策略路線的連鎖。
9.按權(quán)利要求1所述的推理方法,其特征在于通過(guò)將由完全相同的輸入輸出變量值的組構(gòu)成的動(dòng)作取樣只留下1個(gè)將其他刪除,作成動(dòng)作路線。
10.按權(quán)利要求1所述的推理方法,其特征在于將上述一系列的動(dòng)作取樣作為用于驗(yàn)證上述模型的數(shù)據(jù)使用,按其時(shí)間順序逐一取入上述動(dòng)作取樣,搜尋具有取入的動(dòng)作取樣的輸入變量值不滿足的條件的目標(biāo)路線,將與搜尋出的目標(biāo)路線連鎖的策略路線進(jìn)行列表,從上述列表的策略路線中搜尋具有上述取入的輸入變量值滿足的條件的策略路線,將與搜尋出的策略路線連鎖的動(dòng)作路線進(jìn)行列表,在上述列表的動(dòng)作路線中,輸出與上述取入的輸入變量值一致的或具有最接近的輸入變量值的動(dòng)作路線的輸出變量值,借此驗(yàn)證上述模型。
11.一種用于使用根據(jù)由權(quán)利要求1所述的推理方法作成的模型操作或控制對(duì)象的方法,該控制方法的特征在于順序取入從對(duì)象得到的輸入數(shù)據(jù),搜尋具有取入的輸入數(shù)據(jù)不滿足的條件的目標(biāo)路線,將與搜尋出的目標(biāo)路線連鎖的策略路線列表,從上述列表的策略路線中搜尋具有上述取入的輸入數(shù)據(jù)滿足的條件的策略路線,將與搜尋出的策略路線連鎖的動(dòng)作路線列表,在上述列表的動(dòng)作路線中輸出具有與上述取入的輸入數(shù)據(jù)一致的或最接近的輸入變量值的動(dòng)作路線的輸出變量值,每次取入輸入數(shù)據(jù)都反復(fù)進(jìn)行上述處理。
12.一種推理方法,其特征在于取入由通過(guò)操作或控制對(duì)象而得到的輸入輸出變量值的組構(gòu)成的一連串的動(dòng)作數(shù)據(jù),著眼于取入的上述動(dòng)作數(shù)據(jù)中的輸入變量值,對(duì)每個(gè)輸入變量作成以上述操作或控制為目標(biāo)的目標(biāo),著眼于取入的上述動(dòng)作數(shù)據(jù)中的輸出變量值,作成為了達(dá)到上述目標(biāo)的策略,將上述目標(biāo)與尚未達(dá)到該目標(biāo)的策略連鎖,將上述策略與實(shí)現(xiàn)該策略的動(dòng)作數(shù)據(jù)連鎖,借此形成由相互連鎖的目標(biāo)、策略和動(dòng)作構(gòu)成的等級(jí)結(jié)構(gòu)的模型。
13.一種推理系統(tǒng),其特征在于具有取入并存儲(chǔ)由通過(guò)操作或控制對(duì)象而得到的輸入輸出變量值的組構(gòu)成的一系列的動(dòng)作取樣的存儲(chǔ)裝置、著眼于取入的上述動(dòng)作取樣中的輸入變量值對(duì)每個(gè)輸入變量作成使用輸入變量值的最初的值、最后的值、最大值和最小值規(guī)定的目標(biāo)路線的作成裝置、著眼于取入,的上述動(dòng)作取樣中的輸出變量值抽出輸出變量值具有同一性的輸入變量的范圍并對(duì)各范圍作成將輸入變量的范圍與輸出變量值連結(jié)的策略路線的作成裝置、將具有不滿足上述目標(biāo)路線的條件的輸入變量范圍的策略路線與該目標(biāo)路線連鎖的連鎖裝置和將具有進(jìn)入上述策略路線的輸入變量范圍的輸入變量值的動(dòng)作路線于該策略路線連鎖的連鎖裝置,借此形成由相互連鎖的目標(biāo)路線、策略路線和動(dòng)作路線構(gòu)成的等級(jí)結(jié)構(gòu)的模型。
14.按權(quán)利要求13所述的推理系統(tǒng),其特征在于取入上述動(dòng)作取樣的存儲(chǔ)裝置包括將取入的上述動(dòng)作取樣變換為指定位的二進(jìn)制數(shù)據(jù)的裝置。
15.按權(quán)利要求13所述的推理系統(tǒng),其特征在于作成目標(biāo)路線的上述作成裝置由作成臨時(shí)目標(biāo)路線的裝置、輸出作成的目標(biāo)路線的裝置和將接收用戶的評(píng)價(jià)后的目標(biāo)路線作為最終的目標(biāo)路線進(jìn)行存儲(chǔ)的裝置構(gòu)成。
16.按權(quán)利要求15所述的推理系統(tǒng),其特征在于上述用戶的評(píng)價(jià)包括目標(biāo)路線的添加、刪除和改變。
17.按權(quán)利要求13所述的推理系統(tǒng),其特征在于作成策略路線的上述作成裝置由順序比較按時(shí)間順序排列的輸出變量值的相鄰的數(shù)值并當(dāng)有變化時(shí)就存儲(chǔ)其前后的輸出變量值作成策略取樣的裝置、參照上述動(dòng)作取樣將上述翠綠取樣變換為具有do…when…until…min…max的形式的策略路線的裝置和使變換后的上述策略路線實(shí)現(xiàn)最優(yōu)化的裝置構(gòu)成。
18.按權(quán)利要求17所述的推理系統(tǒng),其特征在于使上述策略路線實(shí)現(xiàn)最優(yōu)化的裝置是減少具有相同的輸出變量值的2個(gè)以上的策略路線的數(shù)量的裝置。
19.按權(quán)利要求13所述的推理系統(tǒng),其特征在于使上述策略路線與目標(biāo)路線連鎖的裝置利用設(shè)在各策略路線中的指向目標(biāo)路線的指針和設(shè)在各目標(biāo)路線中的指向策略路線的指針實(shí)現(xiàn)策略路線與目標(biāo)路線的連鎖。
20.按權(quán)利要求13所述的推理系統(tǒng),其特征在于使上述動(dòng)作路線與策略路線連鎖的裝置利用設(shè)在各動(dòng)作路線中的指向策略路線的指針和設(shè)在各策略路線中的指向動(dòng)作路線的指針實(shí)現(xiàn)動(dòng)作路線與策略路線的連鎖。
21.按權(quán)利要求13所述的推理系統(tǒng),其特征在于通過(guò)將由完全相同的輸入輸出變量值的組構(gòu)成的動(dòng)作取樣只留下1個(gè)將其他刪除,作成動(dòng)作路線。
22.按權(quán)利要求13所述的推理系統(tǒng),其特征在于還具有為了作為驗(yàn)證用的數(shù)據(jù)使用而按時(shí)間順序逐一取入上述動(dòng)作取樣的輸入裝置、搜尋具有取入的輸入數(shù)據(jù)不滿足的條件的目標(biāo)路線并在存儲(chǔ)器中將與搜尋出的目標(biāo)路線連鎖的策略路線列表的列表裝置、從上述列表的策略路線中搜尋具有上述取入的輸入數(shù)據(jù)滿足的條件的策略路線并將與搜尋出的策略路線連鎖的動(dòng)作路線在存儲(chǔ)器中列表的列表裝置、在上述列表的動(dòng)作路線中輸出具有與上述取入的輸入數(shù)據(jù)一致或最接近的輸入變量值的動(dòng)作路線的輸出變量值的輸出裝置,借此驗(yàn)證上述模型。
23.一種用于使用根據(jù)由權(quán)利要求13所述的推理系統(tǒng)作成的模型操作或控制對(duì)象的系統(tǒng),該控制系統(tǒng)的特征在于具有順序取入從對(duì)象得到的輸入數(shù)據(jù)的輸入裝置、搜尋具有取入的輸入數(shù)據(jù)不滿足的條件的目標(biāo)路線并在存儲(chǔ)器中將與搜尋出的目標(biāo)路線連鎖的策略路線列表的列表裝置、從上述列表的策略路線中搜尋具有上述取入的輸入數(shù)據(jù)滿足的條件的策略路線并將與搜尋出的策略路線連鎖的動(dòng)作路線在存儲(chǔ)器中列表的列表裝置、在上述列表的動(dòng)作路線中輸出具有與上述取入的輸入數(shù)據(jù)一致或最接近的輸入變量值的動(dòng)作路線的輸出變量值的輸出裝置和每次取入輸入數(shù)據(jù)時(shí)反復(fù)進(jìn)行上述處理的控制裝置。
全文摘要
本發(fā)明取入由通過(guò)操作或控制對(duì)象而得到的輸入輸出變量值的組構(gòu)成的一系列的動(dòng)作取樣,對(duì)每個(gè)輸入變量作成使用輸入變量值的最初的值、最后的值、最大值和最小值規(guī)定的目標(biāo)路線,抽出輸出變量值保持同一性的輸入變量的范圍,對(duì)各范圍作成將輸入變量的范圍與輸出變量值聯(lián)系的策略路線。將具有不滿足目標(biāo)路線的條件的輸入變量范圍的策略路線與該目標(biāo)路線連鎖。將具有進(jìn)入策略路線的輸入變量范圍的輸入變量值的動(dòng)作路線與該策略路線連鎖。
文檔編號(hào)G05B13/02GK1142269SQ95191798
公開(kāi)日1997年2月5日 申請(qǐng)日期1995年12月14日 優(yōu)先權(quán)日1994年12月28日
發(fā)明者井坂曉 申請(qǐng)人:歐姆龍株式會(huì)社