本發(fā)明涉及自動控制領(lǐng)域,尤其是一種單站點傳送帶給料生產(chǎn)加工站系統(tǒng)的工作方法。
背景技術(shù):隨著現(xiàn)代工業(yè)的快速的發(fā)展,機(jī)械臂自動化生產(chǎn)線在工業(yè)生產(chǎn)領(lǐng)域的應(yīng)用日趨廣泛,如在電子制造、汽車制造、加工包裝、貨物分揀等領(lǐng)域。特別是機(jī)器視覺技術(shù)在生產(chǎn)線上的運用,極大地提高了系統(tǒng)的柔性化、智能化和自動化水平。該類自動化生產(chǎn)線通常配置一個或多個用于揀取或加工的機(jī)械臂作為具體執(zhí)行機(jī)構(gòu);配置一條或多條傳送帶用于輸送工件和包裝盒;配置工業(yè)視覺系統(tǒng)用于工件的定位、識別、尺寸測量等不同的操作。然而隨著社會經(jīng)濟(jì)的發(fā)展,生產(chǎn)加工的特殊化、專業(yè)化、隨機(jī)化對自動化生產(chǎn)線的生產(chǎn)效率、生產(chǎn)多用性、智能性以及靈活性提出了更高的要求。傳統(tǒng)的生產(chǎn)線往往適應(yīng)單一工件流,并且按照固定節(jié)拍在固定點加工工件。針對非固定節(jié)拍、隨機(jī)供料、多品種小批量等生產(chǎn)方式的適應(yīng)性和生產(chǎn)效率不高。
技術(shù)實現(xiàn)要素:本發(fā)明是為了克服現(xiàn)有技術(shù)存在的不足之處,提供一種基于機(jī)械臂的單站點給料生產(chǎn)加工系統(tǒng)的工作方法,以期能夠提高針對非固定節(jié)拍、隨機(jī)供料、非固定點加工的單站點機(jī)械臂生產(chǎn)線的生產(chǎn)效率,從而為工業(yè)生產(chǎn)中的單站點機(jī)械臂生產(chǎn)線優(yōu)化調(diào)度提供依據(jù)。本發(fā)明為解決技術(shù)問題采用如下技術(shù)方案:本發(fā)明一種基于機(jī)械臂的單站點給料生產(chǎn)加工系統(tǒng)的工作方法,所述單站點給料生產(chǎn)加工系統(tǒng)包括:機(jī)械臂、傳送帶、工業(yè)相機(jī)、容量為M的緩存庫、容量為N的成品庫和工件;所述機(jī)械臂位于所述傳送帶的一側(cè),在所述機(jī)械臂的兩側(cè)分別設(shè)置有所述緩存庫和成品庫;所述工業(yè)相機(jī)處于所述機(jī)械臂的上游,且垂直正對所述傳送帶上的工件,令所述工業(yè)相機(jī)垂直正對的位置為拍照點Pcam;且所述工業(yè)相機(jī)能將位于拍照點Pcam下游的工件位置傳遞給所述機(jī)械臂;定義所述機(jī)械臂的前視點為Plook,且位于所述前視點Plook下游的工件無法被所述機(jī)械臂抓取;定義緩存庫中的空余量為m;m∈[0,M];定義所述機(jī)械臂的抓手的位置為p;當(dāng)p=1時,表示所述機(jī)械臂的抓手的位置在成品庫中;當(dāng)p=0時,表示所述機(jī)械臂的抓手的位置p在緩存庫中;由空余量m和抓手的位置p構(gòu)成所述加工系統(tǒng)的聯(lián)合狀態(tài)Sm,p;定義以所述前視點Plook為起點的一段觀測距離為前視距離定義工件經(jīng)過所述前視距離所花費的時間為前視時間定義所述機(jī)械臂在所述傳送帶上的工作范圍為Wpick,并在所述工作范圍Wpick內(nèi)進(jìn)行卸載操作,在緩存庫上進(jìn)行服務(wù)操作;所述卸載操作是將所述工件從所述傳送帶上抓取至所述緩存庫中;所述服務(wù)操作是將所述緩存庫中的工件進(jìn)行加工后放入所述成品庫中;定義完成卸載操作的時間為卸載時間定義完成服務(wù)操作的時間為服務(wù)時間在完成卸載操作后所述機(jī)械臂的抓手處于所述緩存庫中;在完成服務(wù)操作后所述機(jī)械臂的抓手處于所述成品庫中;其特點是,所述工作方法是按如下步驟進(jìn)行:步驟1、所述加工系統(tǒng)開始運行,工件隨機(jī)到達(dá)機(jī)械臂工作區(qū)間;設(shè)定傳送帶速度、機(jī)械臂速度、工件到達(dá)率、工件加工率;定義變量i,并初始化i=1;步驟2、所述機(jī)械臂獲取第i次的空余量mi和抓手位置pi,根據(jù)最優(yōu)控制策略v*選擇第i次前視距離步驟3、判斷所述第i次的最優(yōu)前視距離內(nèi)是否有工件,若有工件,則所述機(jī)械臂對處于所述第i次的最優(yōu)前視距離內(nèi)最靠近前視點Plook的工件進(jìn)行卸載操作后,執(zhí)行步驟4;若沒有工件,則所述機(jī)械臂對所述緩存庫中的工件進(jìn)行服務(wù)操作后,執(zhí)行步驟5;步驟4、判斷最靠近前視點Plook的工件的第i次卸載時間是否大于所述最靠近前視點Plook的工件的第i次前視時間若大于,則將i+1賦值給i后,返回步驟2執(zhí)行;否則,經(jīng)過第i次的卸載延時后,將i+1賦值給i,并返回步驟2執(zhí)行;步驟5、判斷最靠近前視點Plook的工件的第i次服務(wù)時間是否大于所述最靠近前視點Plook的工件的第i次前視時間若大于,則將i+1賦值給i后,返回步驟2執(zhí)行;否則,經(jīng)過第i次服務(wù)延時后,將i+1賦值給i,并返回步驟2執(zhí)行。本發(fā)明所述的基于機(jī)械臂的單站點給料生產(chǎn)加工系統(tǒng)的工作方法的特點也在于:所述加工系統(tǒng)是以所述空余量m和抓手位置p作為狀態(tài)來控制所述前視距離的長短,進(jìn)而控制所述機(jī)械臂的操作方式;當(dāng)空余量m較小時,則所述機(jī)械臂選取較短的前視距離所述機(jī)械臂趨向于服務(wù)操作;當(dāng)空余量m較大時,則所述機(jī)械臂選取較長的前視距離所述機(jī)械臂趨向于卸載操作。所述最優(yōu)控制策略v*按以下步驟獲得:步驟1、所述加工系統(tǒng)以緩存庫的空余量和抓手位置作為狀態(tài),前視距離的選取作為行動,建立半Markov決策模型;步驟2、通過策略迭代算法對半Markov模型進(jìn)行優(yōu)化求解,得到最優(yōu)控制策略v*。所述半Markov模型按以下步驟建立:步驟1、定義所述緩存庫的狀態(tài)為其空余量m,則所述緩存庫的狀態(tài)空間為Φ1,并有Φ1={0,1,...,M};定義抓手位置p的狀態(tài)空間為Φ2,并有Φ2={0,1};當(dāng)p=0時,表示所述機(jī)械臂的抓手的位置p在緩存庫中,當(dāng)p=1時,表示所述機(jī)械臂的抓手的位置在成品庫中;定義所述加工系統(tǒng)的聯(lián)合狀態(tài)Sm,p的狀態(tài)空間為Φ,并有Φ=Φ1×Φ2;步驟2、以前視距離作為所述加工系統(tǒng)在聯(lián)合狀態(tài)Smp下的行動,所述加工系統(tǒng)的一個平穩(wěn)控制策略v為所有的聯(lián)合狀態(tài)到行動的映射,并有其中表示當(dāng)緩存庫中的空余量為m,抓手的位置在緩存庫中時加工系統(tǒng)的行動;表示當(dāng)緩存庫中的空余量為m,抓手的位置在成品庫中時加工系統(tǒng)的行動;定義所有策略v的集合為Ω,Ω={v|v=(v(1),v(2),v(3),…,v(N)),v(i)∈D};所述加工系統(tǒng)不存在SM,0和S0,1這兩個狀態(tài),則相應(yīng)的行動記為NaN;步驟3、定義Ti為所述加工系統(tǒng)的第i次決策時刻,令T0=0;定義所述加工系統(tǒng)進(jìn)行第i次Markov無后效性處理時的卸載操作延時為服務(wù)操作延時為當(dāng)所述機(jī)械臂的第i次操作為卸載操作時,則第i+1次決策時刻Ti+1為:第i+1次聯(lián)合狀態(tài)為Xi+1=Sm-1,0,表示抓手(7)位置為p=0,緩存庫(4)中的空余量為m-1;第i次卸載操作延時為:當(dāng)所述機(jī)械臂的第i次操作為服務(wù)操作時,則第i+1次決策時刻Ti+1為:第i+1次聯(lián)合狀態(tài)為Xi+1=Sm+1,1;表示抓手(7)位置為p=1,緩存庫(4)中的空余量為m+1;第i次服務(wù)操作延時為:定義半Markov核Qv(t)為:式(5)中,表示矩陣相乘的操作符;t表示系統(tǒng)時刻;Pv表示Markov嵌入鏈在策略v下的轉(zhuǎn)移矩陣,F(xiàn)v(t)表示在策略v下的逗留時間分布矩陣,并有:式(6)中是從狀態(tài)Sm,p采取行動轉(zhuǎn)移到Sm',p'的概率,式(7)中是在狀態(tài)Sm,p采取行動到下一狀態(tài)是Sm',p'的逗留時間分布;步驟4、定義期望性能函數(shù)fv為:式(8)中,表示加工系統(tǒng)采取行動從聯(lián)合狀態(tài)Sm,p轉(zhuǎn)移到下一狀態(tài)Sm',p'的單位時間期望代價;步驟5、建立如式(9)所示的SMDP模型:X=(Xt,Φ,D,Qv(t),fv)(9)式(9)中,Xt表示t時刻加工系統(tǒng)的狀態(tài)過程。所述策略迭代算法按以下步驟進(jìn)行:步驟1、根據(jù)半Markov核Qv(t)和期望性能函數(shù)fv,定義等價無窮小和等價性能矩陣并將SMDP模型X=(Xt,Φ,D,Qv(t),fv)轉(zhuǎn)換為連續(xù)時間Markov決策過程α是折扣因子,α∈[0,1];步驟2、定義變量k,定義vk為加工系統(tǒng)的第k次策略;初始化k=0;且第0次策略v0為:步驟3、利用式(11)獲得第k次策略vk的性能勢向量式(11)中;I是單位對角矩陣;e為單位列向量;并有:表示在狀態(tài)i的平均逗留時間,表示等價Markov決策過程中第k次的穩(wěn)態(tài)分布;并有:步驟4、利用式(15)獲得第k+1次策略vk+1:步驟5、利用式(11)獲得第k+1次策略vk+1的性能勢向量步驟6、判斷是否成立,ξ為一較小的常量;若成立,則表示所獲得的第k+1次策略vk+1即為最優(yōu)控制策略v*,并退出算法,否則;將k+1賦值給k后,返回步驟4。與已有技術(shù)相比,本發(fā)明的有益效果體現(xiàn)在:本發(fā)明采用一種基于半Markov模型的單站點機(jī)械臂生產(chǎn)加工系統(tǒng)工作方法,能夠有效的處理非固定節(jié)拍、非固定撿取點、工件隨機(jī)到達(dá)的生產(chǎn)線加工問題,提高了生產(chǎn)線各工序的平衡性和生產(chǎn)效率。1、本發(fā)明采用半Markov模型對單站點機(jī)械臂生產(chǎn)加工系統(tǒng)進(jìn)行建模,把隨機(jī)到達(dá)的工件流分成很多小段的獨立的滿足Markov過程的工件序列,相比傳統(tǒng)方法按照固定節(jié)拍對工件進(jìn)行處理,本發(fā)明能夠更有效的處理隨機(jī)到達(dá)工件的撿取、加工問題。2、本發(fā)明以前視距離的控制作為加工系統(tǒng)的行動,可以根據(jù)生產(chǎn)線實時的工件、緩存庫和成品庫的情況,調(diào)整加工策略。有效提高了生產(chǎn)線各工序之間的平衡性,加強(qiáng)了生產(chǎn)線的魯棒性。3、本發(fā)明采用策略迭代...