交互學(xué)習(xí)式機(jī)器人和機(jī)器人群集的制作方法
【專利摘要】本實(shí)用新型提供了一種交互學(xué)習(xí)式機(jī)器人和機(jī)器人群集。根據(jù)一個(gè)實(shí)施例,交互學(xué)習(xí)式機(jī)器人包括存儲(chǔ)裝置、可見光通信收發(fā)器、編解碼器和認(rèn)證生成裝置。其中,存儲(chǔ)裝置存儲(chǔ)機(jī)器人的認(rèn)知模型;可見光通信收發(fā)器接收經(jīng)另一機(jī)器人編碼和發(fā)送的可見光信號(hào);編解碼器與編解碼器連接,對(duì)經(jīng)解碼的信號(hào)進(jìn)行分類,并且根據(jù)機(jī)器人的認(rèn)知模型對(duì)經(jīng)分類的信號(hào)進(jìn)行學(xué)習(xí),以便形成機(jī)器人針對(duì)可見光信號(hào)的新認(rèn)知結(jié)果;其中,可見光通信收發(fā)器還發(fā)送新認(rèn)知結(jié)果。還提供了交互學(xué)習(xí)式機(jī)器人群集。
【專利說明】
交互學(xué)習(xí)式機(jī)器人和機(jī)器人群集
技術(shù)領(lǐng)域
[0001]本實(shí)用新型總體涉及機(jī)器人領(lǐng)域,尤其涉及交互學(xué)習(xí)式機(jī)器人和機(jī)器人群集以及機(jī)器人交互的方法。【背景技術(shù)】
[0002]群體性機(jī)器人可在機(jī)器人個(gè)體之間不斷進(jìn)行交流和溝通,以實(shí)現(xiàn)個(gè)體之間彼此聯(lián)系、合作、競爭,從而完成加復(fù)雜的協(xié)同任務(wù)。因此,群體性機(jī)器人相比個(gè)體機(jī)器人具有更強(qiáng)的學(xué)習(xí)、交互能力,在智能探索、智能家居、家庭娛樂、看護(hù)陪伴等領(lǐng)域有著廣泛的應(yīng)用。
[0003]群體性機(jī)器人通常通過在初期(例如,出廠前)進(jìn)行機(jī)器人訓(xùn)練,以使每一個(gè)機(jī)器人個(gè)體形成個(gè)體的動(dòng)作模式。然而,這種訓(xùn)練往往使群體性機(jī)器人的個(gè)體都具有相同的動(dòng)作模式。也就是說,這些機(jī)器人出廠后在彼此間的交流與協(xié)作僅基于出廠時(shí)的設(shè)置。這些機(jī)器人不具有自主的學(xué)習(xí)、交互能力,進(jìn)而不具有個(gè)體認(rèn)知。
[0004]因此,需要一種能夠彼此學(xué)習(xí)、交互的群體性機(jī)器人。【實(shí)用新型內(nèi)容】
[0005]因此,為了提供能夠彼此學(xué)習(xí)、交互的群體性機(jī)器人,提供本實(shí)用新型。
[0006]實(shí)施例提供一種交互學(xué)習(xí)式機(jī)器人,所述交互學(xué)習(xí)式機(jī)器人包括存儲(chǔ)裝置、可見光通信收發(fā)器、編解碼器和認(rèn)證生成裝置。其中,存儲(chǔ)裝置存儲(chǔ)機(jī)器人的認(rèn)知模型;可見光通信收發(fā)器接收經(jīng)另一機(jī)器人編碼和發(fā)送的可見光信號(hào);編解碼器與編解碼器連接,對(duì)經(jīng)解碼的信號(hào)進(jìn)行分類,并且根據(jù)機(jī)器人的認(rèn)知模型對(duì)經(jīng)分類的信號(hào)進(jìn)行學(xué)習(xí),以便形成機(jī)器人針對(duì)可見光信號(hào)的新認(rèn)知結(jié)果;其中,可見光通信收發(fā)器還發(fā)送新認(rèn)知結(jié)果。
[0007]在進(jìn)一步的實(shí)施例中,認(rèn)知生成裝置包括分類器,分類器將經(jīng)解碼的信號(hào)分類為感測數(shù)據(jù)和認(rèn)知數(shù)據(jù)。在更進(jìn)一步的實(shí)施例中,感測數(shù)據(jù)包括圖片數(shù)據(jù)、聲音數(shù)據(jù)、觸覺數(shù)據(jù)中的一者或多者,認(rèn)知數(shù)據(jù)包括個(gè)體意識(shí)數(shù)據(jù)、任務(wù)指令數(shù)據(jù)、策略數(shù)據(jù)、推理數(shù)據(jù)中的一者或多者。在更進(jìn)一步的實(shí)施例中,分類器還用于將經(jīng)解碼的信號(hào)分類為圖片數(shù)據(jù)、聲音數(shù)據(jù)、觸覺數(shù)據(jù)、個(gè)體意識(shí)數(shù)據(jù)、任務(wù)指令數(shù)據(jù)、策略數(shù)據(jù)或推理數(shù)據(jù)。在更進(jìn)一步的實(shí)施例中,認(rèn)知生成裝置還包括特征提取器和學(xué)習(xí)裝置,其中,特征提取器提取經(jīng)分類的數(shù)據(jù)中的特征;學(xué)習(xí)裝置根據(jù)認(rèn)知模型對(duì)所提取的特征進(jìn)行推理和判斷以形成新認(rèn)知結(jié)果,其中,新認(rèn)知結(jié)果用于更新認(rèn)知模型。在更進(jìn)一步的實(shí)施例中,所提取的特征是認(rèn)知模型中的概念或事件。在更進(jìn)一步的實(shí)施例中,認(rèn)知模型通過概念與事件之間的聯(lián)系來確定機(jī)器人的新認(rèn)知結(jié)果。在更進(jìn)一步的實(shí)施例中,交互學(xué)習(xí)式機(jī)器人還包括控制器,所述控制器用于根據(jù)認(rèn)知結(jié)果來控制機(jī)器人的動(dòng)作。
[0008]在進(jìn)一步的實(shí)施例中,可見光通信收發(fā)器是LED可見光通信收發(fā)器、熒光可見光通信收發(fā)器中的一者或多者。在更進(jìn)一步的實(shí)施例中,可見光通信收發(fā)器被安裝于機(jī)器人的眼部。
[0009]在進(jìn)一步的實(shí)施例中,可見光通信收發(fā)器還與云端通信,并且存儲(chǔ)裝置連接到可見光通信收發(fā)器以從云端下載認(rèn)知模型和/或向云端上傳經(jīng)更新的認(rèn)知模型。
[0010]另一實(shí)施例提供一種交互學(xué)習(xí)式機(jī)器人群集,包括至少兩個(gè)如上述任一項(xiàng)所述的交互學(xué)習(xí)式機(jī)器人,所述至少兩個(gè)機(jī)器人以可見光通信方式通信連接。
[0011]又一實(shí)施例提供一種機(jī)器人交互學(xué)習(xí)方法,所述方法包括:接收步驟:由機(jī)器人接收來自另一機(jī)器人的可見光通信信號(hào);解碼步驟:對(duì)可見光通信信號(hào)進(jìn)行解碼;分類步驟: 對(duì)經(jīng)解碼的信號(hào)進(jìn)行分類;學(xué)習(xí)步驟:根據(jù)機(jī)器人的認(rèn)知模型來學(xué)習(xí)經(jīng)分類的信號(hào),以形成對(duì)可見光通信信號(hào)的新認(rèn)知結(jié)果;更新步驟:存儲(chǔ)新認(rèn)知結(jié)果以更新機(jī)器人的認(rèn)知模型;以及發(fā)送步驟:發(fā)送新認(rèn)知結(jié)果。
[0012]在進(jìn)一步的實(shí)施例中,分類步驟還包括:將經(jīng)解碼的信號(hào)分類為感測數(shù)據(jù)和認(rèn)知數(shù)據(jù)。在更進(jìn)一步的實(shí)施例中,分類步驟還包括:進(jìn)一步將感測數(shù)據(jù)分類為圖片數(shù)據(jù)、聲音數(shù)據(jù)或觸覺數(shù)據(jù);并且/或者進(jìn)一步將認(rèn)知數(shù)據(jù)分類為個(gè)體意識(shí)數(shù)據(jù)、任務(wù)指令數(shù)據(jù)、策略數(shù)據(jù)或推理數(shù)據(jù)。在更進(jìn)一步的實(shí)施例中,學(xué)習(xí)步驟還包括:提取經(jīng)分類的信號(hào)中的特征; 以及根據(jù)認(rèn)知模型,對(duì)所提取的特征進(jìn)行推理和判斷以形成新認(rèn)知結(jié)果。在更進(jìn)一步的實(shí)施例中,所提取的特征是認(rèn)知模型中的概念或事件。在更進(jìn)一步的實(shí)施例中,認(rèn)知模型通過概念與事件之間的聯(lián)系來確定機(jī)器人的新認(rèn)知結(jié)果。[0〇13]在進(jìn)一步的實(shí)施例中,接收步驟還包括:從云端下載認(rèn)知模型和/或向云端上傳經(jīng)更新的認(rèn)知模型。
[0014]本公開具有以下益處:
[0015](1)認(rèn)知生成裝置的使用使機(jī)器人個(gè)體具有自主的學(xué)習(xí)、推斷能力,從而具有自主的認(rèn)知;
[0016](2)機(jī)器人利用快速、安全、可靠可見光通信來接收信號(hào),提高了學(xué)習(xí)的效率和可靠性?!靖綀D說明】
[0017]在結(jié)合以下附圖閱讀對(duì)本公開的多個(gè)實(shí)施例的詳細(xì)描述之后,能夠更好地理解本公開的上述特征和優(yōu)點(diǎn)。在附圖中,以相同或類似的附圖標(biāo)記來指定各附圖所共有的相同或類似的元件。為了便于說明,在以下描述中將“交互式學(xué)習(xí)機(jī)器人”簡稱為“機(jī)器人”,并將 “交互式學(xué)習(xí)機(jī)器人群集”簡稱為“機(jī)器人群集”。
[0018]圖1示出根據(jù)本公開的一些實(shí)施例的機(jī)器人100的組成模塊示意圖。
[0019]圖2示出根據(jù)本公開的一些實(shí)施例的機(jī)器人群集200的組成模塊示意圖。[〇〇2〇]圖3示出根據(jù)本公開的一些實(shí)施例的機(jī)器人交互學(xué)習(xí)方法300的流程圖?!揪唧w實(shí)施方式】[〇〇21]以下結(jié)合附圖和具體實(shí)施例對(duì)本公開作詳細(xì)描述。注意,以下結(jié)合附圖和具體實(shí)施例描述的諸方面僅是示例性的,而不應(yīng)被理解為對(duì)本公開的保護(hù)范圍進(jìn)行任何限制。
[0022]圖1示出根據(jù)本公開的一些實(shí)施例的機(jī)器人100的組成模塊示意圖。在圖1中,機(jī)器人100可包括存儲(chǔ)裝置110、收發(fā)器120、編解碼器130和認(rèn)知生成裝置140。[〇〇23]存儲(chǔ)裝置110存儲(chǔ)機(jī)器人100的認(rèn)知模型111。收發(fā)器120接收經(jīng)另一機(jī)器人編碼和發(fā)送的信號(hào)。編解碼器130與收發(fā)器120連接,并且對(duì)來自收發(fā)器120的信號(hào)進(jìn)行解碼。認(rèn)知生成裝置140與編解碼器130連接,對(duì)經(jīng)解碼的信號(hào)進(jìn)行分類,并且根據(jù)機(jī)器人100的認(rèn)知模型111對(duì)經(jīng)分類的信號(hào)進(jìn)行學(xué)習(xí),從而形成機(jī)器人100對(duì)收發(fā)器120接收到的信號(hào)的新認(rèn)知結(jié)果。[〇〇24] 在一些實(shí)施例中,收發(fā)器120可以是可見光通信收發(fā)器。相應(yīng)地,機(jī)器人100通過可見光通信從另一機(jī)器人接收信號(hào)。[〇〇25]在至少一些實(shí)施例中,收發(fā)器120可以是LED可見光通信收發(fā)器,機(jī)器人100接收來自經(jīng)另一機(jī)器人編碼的特定頻率的可見光信號(hào)。在替代實(shí)施例中,收發(fā)器120可以是熒光可見光通信收發(fā)器。[〇〇26] 在一些實(shí)施例中,收發(fā)器120可安裝在機(jī)器人100的眼部。在至少一些實(shí)施例中,當(dāng)需要接收信號(hào)時(shí),機(jī)器人100與另一機(jī)器人眼部對(duì)準(zhǔn)以實(shí)現(xiàn)彼此間的通信。
[0027]在一些實(shí)施例中,認(rèn)知生成裝置140可包括分類器141。分類器141用于對(duì)經(jīng)解碼的信號(hào)進(jìn)行分類。
[0028]在一些實(shí)施例中,分類器141將經(jīng)解碼的信號(hào)分類成感測數(shù)據(jù)和認(rèn)知數(shù)據(jù)。
[0029]在一些實(shí)施例中,感測數(shù)據(jù)可包括圖片數(shù)據(jù)、聲音數(shù)據(jù)、觸覺數(shù)據(jù)中的一者或多者。
[0030]在一個(gè)實(shí)施例中,圖片數(shù)據(jù)可以是靜止圖片的幀或反映圖片的像素點(diǎn)的集合。在一個(gè)實(shí)施例中,聲音數(shù)據(jù)可以是采用各種音頻協(xié)議編碼的音頻數(shù)據(jù)。在一個(gè)實(shí)施例中,觸覺數(shù)據(jù)可以是接觸表面的壓力值。
[0031]在一些實(shí)施例中,認(rèn)知數(shù)據(jù)可包括個(gè)體意識(shí)數(shù)據(jù)、任務(wù)指令數(shù)據(jù)、策略數(shù)據(jù)、推理數(shù)據(jù)中的一者或多者。
[0032]在一個(gè)實(shí)施例中,個(gè)體意識(shí)可表示機(jī)器人100對(duì)環(huán)境作出的反應(yīng)。例如,在一個(gè)實(shí)施例中,機(jī)器人100響應(yīng)于感測到附近的熱源而發(fā)出響聲,從而反映機(jī)器人100對(duì)危險(xiǎn)物的個(gè)體意識(shí)。在另一個(gè)實(shí)施例中,機(jī)器人100響應(yīng)于感測到另一機(jī)器人(同伴)在附近而發(fā)出紅色指示光,從而反映機(jī)器人100在有同伴陪伴時(shí)喜悅的個(gè)體意識(shí)。
[0033]在另一實(shí)施例中,任務(wù)指令數(shù)據(jù)可對(duì)應(yīng)于機(jī)器人100的協(xié)同任務(wù)能力。例如,在一個(gè)實(shí)施例中,另一機(jī)器人正在執(zhí)行某項(xiàng)任務(wù)(例如,推動(dòng)物體),機(jī)器人100響應(yīng)于感測到該另一機(jī)器人自身無法單獨(dú)完成該任務(wù)(例如,感測到物體未移動(dòng))而接收與該另一機(jī)器人相同的任務(wù)指令(例如,推動(dòng)物體),從而與該另一機(jī)器人協(xié)同執(zhí)行該任務(wù)(例如,推動(dòng)箱子)。 憑借該協(xié)同任務(wù)能力,每一個(gè)機(jī)器人個(gè)體可在有限的通信范圍內(nèi)實(shí)現(xiàn)群集間的協(xié)作。
[0034]在又一實(shí)施例中,策略數(shù)據(jù)可反映機(jī)器人100響應(yīng)于外部條件而執(zhí)行的策略。例如,在一個(gè)實(shí)施例中,機(jī)器人100可響應(yīng)于檢測到周圍的障礙物而執(zhí)行避障策略。[〇〇35]在其他實(shí)施例中,推理數(shù)據(jù)反映機(jī)器人100對(duì)彼此間存在關(guān)聯(lián)的事物作出合理推斷的能力。例如,在一個(gè)實(shí)施例中,另一機(jī)器人發(fā)出“我餓了”的聲音,并且拿起蘋果,機(jī)器人 100根據(jù)另一機(jī)器人的這兩個(gè)動(dòng)作,推斷出該另一個(gè)機(jī)器人“想吃東西”。
[0036]認(rèn)知生成裝置140還可包括特征提取器142,用于對(duì)經(jīng)分類的信號(hào)進(jìn)行特征提取。 提取特征的目的在于,使經(jīng)分類的信號(hào)通過各自的特征能夠被聯(lián)系起來,有助于機(jī)器人1〇〇 進(jìn)行學(xué)習(xí)。
[0037]在一些實(shí)施例中,提取特征可包括關(guān)聯(lián)從不同信號(hào)中提取的特征以形成概念集。 例如,在一個(gè)實(shí)施例中,經(jīng)分類的第一信號(hào)表示一張圖片,該圖片中有一個(gè)蘋果;經(jīng)分類的第二信號(hào)表示一段聲音:“具有蘋果”。在該實(shí)施例中,特征提取器142從第一信號(hào)中提取出表示該蘋果的像素集,并且從第二信號(hào)中從提取出唯一的名詞“蘋果”,從而將概念“蘋果” 與表示蘋果的像素集關(guān)聯(lián)起來以獲取對(duì)圖形的概括能力
[0038]在另一些實(shí)施例中,提取特征可包括從經(jīng)分類的信號(hào)中提取出事件以形成事件集。例如,在一個(gè)實(shí)施例中,經(jīng)分類的信號(hào)表示連續(xù)拍攝的兩張圖片,在拍攝這兩張圖片的過程中,另一機(jī)器人拿起一只蘋果。在該實(shí)施例中,特征提取器142通過分析另一機(jī)器人的手部和蘋果在第一圖片與第二圖片中的位置變化推斷出事件“拿起蘋果”。從該實(shí)施例中可見,特征提取器142使機(jī)器人100可建立相同的信號(hào)在不同時(shí)刻和/或空間處的聯(lián)系。[〇〇39] 認(rèn)知生成裝置140還可包括學(xué)習(xí)裝置143,該學(xué)習(xí)裝置143用于對(duì)特征提取器142提取的特征進(jìn)行推理、判斷,以形成機(jī)器人100的新認(rèn)知結(jié)果。
[0040]在一些實(shí)施例中,學(xué)習(xí)裝置143用于對(duì)特征提取器142提取的概念集合/或事件集進(jìn)行推理、判斷。例如,在一個(gè)實(shí)施例中,特征提取器142提取的概念集包括概念“餓”,且事件集中包括事件“拿起蘋果”,則學(xué)習(xí)裝置143通過概念“餓”與事件“拿起蘋果”之間的聯(lián)系, 推斷出結(jié)論“想吃東西”。當(dāng)然,在其他實(shí)施例中,學(xué)習(xí)裝置143還可聯(lián)系更多概念和/或事件之間的來進(jìn)行推理、判斷。
[0041]在一些實(shí)施例中,學(xué)習(xí)裝置143生成的新認(rèn)知結(jié)果可存儲(chǔ)到存儲(chǔ)裝置110中以更新機(jī)器人100的認(rèn)知模型111。[〇〇42]上文中對(duì)分類器141、特征提取器142和學(xué)習(xí)裝置143分別進(jìn)行操作的實(shí)施例,以下提供多個(gè)實(shí)施例來說明這三者一起操作以實(shí)現(xiàn)機(jī)器人100的學(xué)習(xí)的實(shí)施例。
[0043]在一個(gè)實(shí)施例中,機(jī)器人100通過學(xué)習(xí)獲取了新的個(gè)體意識(shí)。在該實(shí)施例中,機(jī)器人100從另一機(jī)器人接收到一張圖片和一段聲音,這張圖片上顯示有熱源,這一段聲音包括另一機(jī)器人發(fā)出的警告“前方危險(xiǎn)”。機(jī)器人100的分類器141首先將從另一機(jī)器人接收到的信號(hào)分類為圖片數(shù)據(jù)、聲音數(shù)據(jù)以及另一機(jī)器人對(duì)危險(xiǎn)作出反應(yīng)的個(gè)體意識(shí)數(shù)據(jù)。隨后,特征提取器142從圖片數(shù)據(jù)中提取出概念特征“熱源”,從聲音數(shù)據(jù)中提取出概念數(shù)據(jù)“危險(xiǎn)”, 并且從個(gè)體意識(shí)數(shù)據(jù)中提取出事件“就危險(xiǎn)發(fā)出警告”。最后,學(xué)習(xí)裝置143將概念“熱源”與概念“危險(xiǎn)”聯(lián)系起來,并且將概念“危險(xiǎn)”與事件“就危險(xiǎn)發(fā)出警告”關(guān)聯(lián)起來,以此形成機(jī)器人100對(duì)外界危險(xiǎn)作出反應(yīng)的個(gè)體意識(shí)。
[0044]在另一實(shí)施例中,機(jī)器人100通過學(xué)習(xí)獲取了新的任務(wù)指令。在該實(shí)施例中,機(jī)器人100從另一機(jī)器人接收到一段聲音“一起跳舞”,并接收到一張反映跳舞的圖片。機(jī)器人 100的分類器首先將接收到的信號(hào)分類為聲音數(shù)據(jù)、圖片數(shù)據(jù)以及另一機(jī)器人發(fā)出跳舞指令的任務(wù)指令數(shù)據(jù)。隨后,特征提取器142從聲音數(shù)據(jù)中提取出概念“一起”、“跳舞”,從圖片數(shù)據(jù)中提取出概念“跳舞”,并且從任務(wù)指令數(shù)據(jù)中提取出事件“發(fā)出指令”。最后,學(xué)習(xí)裝置 143通過概念“跳舞”將聲音數(shù)據(jù)與圖片數(shù)據(jù)聯(lián)系起來,將概念“一起”與事件“發(fā)出指令”聯(lián)系起來,使得機(jī)器人100推斷出應(yīng)當(dāng)與另一機(jī)器人協(xié)同完成任務(wù),而該任務(wù)如圖片中的概念 “跳舞”所示。作為響應(yīng),機(jī)器人100將與另一機(jī)器人一起跳舞。
[0045]在又一實(shí)施例中,機(jī)器人100通過學(xué)習(xí)獲取了新的策略。在該實(shí)施例中,機(jī)器人100 從另一機(jī)器人接收到一段聲音“前方障礙”,并接收到該另一機(jī)器人避開障礙過程中的一系列圖片數(shù)據(jù),在這一系列圖片中,該另一機(jī)器人相對(duì)于障礙物的位置發(fā)生變化,這體現(xiàn)了一種避障策略。對(duì)此,機(jī)器人100的分類器首先將接收到的信號(hào)分類為聲音數(shù)據(jù)和圖片數(shù)據(jù)。隨后,特征提取器142從聲音數(shù)據(jù)中提取出概念“障礙”,從圖片數(shù)據(jù)中提取出事件“避障”, 并且從一系列圖片中提取出概念“避障策略”。最后,學(xué)習(xí)裝置143將概念“障礙”與事件“避障”聯(lián)系起來,將該聯(lián)系再與概念“避障策略”相關(guān)聯(lián),使得機(jī)器人100獲取了避開障礙的策略。[〇〇46]在其他實(shí)施例中,機(jī)器人100通過學(xué)習(xí)獲取了新的推理能力。在該實(shí)施例中,機(jī)器人100從另一機(jī)器人接收到一段聲音“我餓了”以及一系列圖片,這一系列圖片反映該另一機(jī)器人拿起一只蘋果的過程。對(duì)此,機(jī)器人100的分類器首先將接收到的信號(hào)分類為聲音數(shù)據(jù)、圖片數(shù)據(jù)以及體現(xiàn)該另一機(jī)器人拿起蘋果的動(dòng)機(jī)的個(gè)體意識(shí)數(shù)據(jù)。隨后,特征提取器 142從聲音數(shù)據(jù)中提取出概念“餓”,從一系列圖片中蘋果和另一機(jī)器人的手部的相對(duì)運(yùn)動(dòng)提取出事件“拿起蘋果”,并且從個(gè)體意識(shí)數(shù)據(jù)中提取概念“想吃東西”。最后,學(xué)習(xí)裝置143 將概念“餓”與事件“拿起蘋果”聯(lián)系起來,并且將該聯(lián)系與概念“想吃東西”關(guān)聯(lián)起來。這樣, 機(jī)器人100獲取了從概念“餓”與事件“拿起蘋果”之間的聯(lián)系推導(dǎo)出概念“想吃東西”的推理能力。[〇〇47]以上描述了認(rèn)知生成單元140的分類器141、特征提取器142和學(xué)習(xí)裝置143協(xié)作以從接收到的信號(hào)中進(jìn)行學(xué)習(xí)以獲得機(jī)器人100的新認(rèn)知結(jié)果的多個(gè)實(shí)施例。應(yīng)當(dāng)理解,以上實(shí)施例僅是示例性的。在其他實(shí)施例中,可任選地合并多個(gè)實(shí)施例;或者,可僅執(zhí)行單個(gè)實(shí)施例的部分。
[0048]在一些實(shí)施例中,認(rèn)知生成單元140可連接至存儲(chǔ)裝置110,以便將生成的新認(rèn)知結(jié)果存儲(chǔ)到存儲(chǔ)裝置110中來更新認(rèn)知模型111。
[0049]機(jī)器人100還可包括控制器150??刂破?50基于存儲(chǔ)裝置110中的認(rèn)知模型111來控制機(jī)器人100的動(dòng)作。
[0050]存儲(chǔ)裝置110用于存儲(chǔ)機(jī)器人100的認(rèn)知模型111。認(rèn)知模型111反映機(jī)器人100執(zhí)行各種動(dòng)作的規(guī)則。
[0051]在一些實(shí)施例中,認(rèn)知模型111可通過概念與事件之間的聯(lián)系來確定機(jī)器人的認(rèn)知結(jié)果。
[0052]在一些實(shí)施例中,還可以通過訓(xùn)練來使機(jī)器人100獲得初始的認(rèn)知模型111。在一個(gè)實(shí)施例中,訓(xùn)練在機(jī)器人1〇〇出廠前進(jìn)行,在訓(xùn)練過程中,機(jī)器人1〇〇從另一機(jī)器人接收信號(hào)。與機(jī)器人100后的學(xué)習(xí)過程不同,在訓(xùn)練過程中,機(jī)器人100接收到的信號(hào)帶有標(biāo)識(shí),該標(biāo)識(shí)指示信號(hào)的類別。作為示例,這些類別可以是圖片、聲音、觸覺、個(gè)體意識(shí)、任務(wù)指令、策略或推理中的一者或多者。[〇〇53]在一些實(shí)施例中,存儲(chǔ)裝置110還可連接至收發(fā)器120,以便通過收發(fā)器120從云端下載認(rèn)知模型或?qū)⒄J(rèn)知模型上傳到云端。由此,可利用云端來更新機(jī)器人100的認(rèn)知模型 111,并且通過機(jī)器人100將認(rèn)知模型111上傳到云端,機(jī)器人100可潛在地影響其他機(jī)器人的認(rèn)知,從而實(shí)現(xiàn)機(jī)器人之間的學(xué)習(xí)、交互。
[0054]圖2示出根據(jù)本公開的一些實(shí)施例的機(jī)器人群集200的組成模塊示意圖。在一些實(shí)施例中,機(jī)器人群集200包括機(jī)器人210、220,并且機(jī)器人210、220經(jīng)由鏈路230通信連接。應(yīng)當(dāng)理解,雖然在圖中示出機(jī)器人群集200由兩個(gè)機(jī)器人組成,但是,在其他實(shí)施例中,機(jī)器人群集200也可由三個(gè)或更多個(gè)機(jī)器人組成。
[0055]在一些實(shí)施例中機(jī)器人210、220中的任一者都可以是以上討論的機(jī)器人100的多個(gè)實(shí)施例。
[0056] 在一些實(shí)施例中,鏈路230可以是可見光通信鏈路(S卩,空氣介質(zhì))。在這些實(shí)施例中,機(jī)器人210、220各自具有可見光通信收發(fā)器,并且經(jīng)由鏈路230進(jìn)行可見光通信。[〇〇57]圖3示出根據(jù)本公開的一些實(shí)施例的機(jī)器人交互學(xué)習(xí)方法300的流程圖。在以下描述中,為了使描述簡潔,針對(duì)一個(gè)機(jī)器人從另一機(jī)器人接收信號(hào)以進(jìn)行交互學(xué)習(xí)的情況來描述方法。當(dāng)然,本公開的范圍不限于此。例如,可由一個(gè)機(jī)器人與多個(gè)機(jī)器人通信以進(jìn)行交互學(xué)習(xí),或者可由一些機(jī)器人與另一些機(jī)器人通信以進(jìn)行交互學(xué)習(xí)。[〇〇58] 如圖3中所示,方法300可包括:接收步驟301、解碼步驟302、分類步驟303、學(xué)習(xí)步驟304、更新步驟305以及發(fā)送步驟306。
[0059]在接收步驟301中,由機(jī)器人接收來自另一機(jī)器人的信號(hào)。在優(yōu)選實(shí)施例中,機(jī)器人通過可見光通信與另一機(jī)器人通信,相應(yīng)地,此機(jī)器人接收來自另一機(jī)器人的可見光信號(hào)。在此,可見光信號(hào)可以指由另一機(jī)器人編碼的特定頻率的可見光信號(hào)。作為非限制性示例,此可見光信號(hào)可由LED可見光通信模塊或熒光可見光通信模塊來發(fā)送和接收。
[0060]在解碼步驟302中,對(duì)接收到的信號(hào)進(jìn)行解碼。
[0061]在分類步驟303中,對(duì)經(jīng)解碼的信號(hào)進(jìn)行分類。在一個(gè)實(shí)施例中,可以將經(jīng)解碼的信號(hào)分類成感測數(shù)據(jù)和認(rèn)知數(shù)據(jù)。在另一實(shí)施例中,可以進(jìn)一步將感測數(shù)據(jù)分類為圖片數(shù)據(jù)、聲音數(shù)據(jù)或觸覺數(shù)據(jù)。在又一實(shí)施例中,可以進(jìn)一步將認(rèn)知數(shù)據(jù)分類為個(gè)體意識(shí)數(shù)據(jù)、 任務(wù)指令數(shù)據(jù)、策略數(shù)據(jù)或推理數(shù)據(jù)。在此所述的各種類型的數(shù)據(jù)都可以是上文中參照機(jī)器人100所述的相應(yīng)的數(shù)據(jù)。[〇〇62]在學(xué)習(xí)步驟304中,可根據(jù)機(jī)器人的認(rèn)知模型來學(xué)習(xí)經(jīng)分類的信號(hào),以形成對(duì)接收到的信號(hào)的新認(rèn)知結(jié)果。在此,認(rèn)知模型可以是上文中參照機(jī)器人100所述的認(rèn)知模型111。 在一個(gè)實(shí)施例中,認(rèn)知模型可通過上文中針對(duì)機(jī)器人100所描述的訓(xùn)練方式來獲得。在替代實(shí)施例中,也可從云端下載此認(rèn)知模型。在進(jìn)一步的實(shí)施例中,還可以提取經(jīng)分類的信號(hào)中的特征,并且基于認(rèn)知模型來對(duì)此提取的特征進(jìn)行推理和判斷,從而形成機(jī)器人的新認(rèn)知結(jié)果。在進(jìn)一步的實(shí)施例中,所提取的特征可以是認(rèn)知模型中的概念或事件。在進(jìn)一步的實(shí)施例中,認(rèn)知模型可通過概念與事件之間的聯(lián)系來確定機(jī)器人的新認(rèn)知結(jié)果。作為特定示例,此學(xué)習(xí)步驟304可以是上文中結(jié)合分類器141、特征提取器142和學(xué)習(xí)裝置143進(jìn)行操作而實(shí)現(xiàn)的機(jī)器人1 〇〇的學(xué)習(xí)過程的實(shí)施例。[〇〇63] 在更新步驟305中,存儲(chǔ)此新認(rèn)知結(jié)果以更新機(jī)器人的認(rèn)知模型。換言之,機(jī)器人通過學(xué)習(xí)之后獲得的新認(rèn)知結(jié)果成為此機(jī)器人的認(rèn)知模型的部分。[〇〇64]在發(fā)送步驟306中,可發(fā)送新認(rèn)知結(jié)果。在一個(gè)實(shí)施例中,可將此新認(rèn)知結(jié)果發(fā)送至一個(gè)或多個(gè)其他機(jī)器人,用于其他機(jī)器人進(jìn)行學(xué)習(xí)。[〇〇65]此外,還可將經(jīng)更新的認(rèn)知模型上傳至云端,用于由其他機(jī)器人從云端獲取此經(jīng)更新的認(rèn)知模型。
[0066]以上描述的根據(jù)本公開的各實(shí)施例具有以下益處:[〇〇67](1)認(rèn)知生成裝置的使用使機(jī)器人個(gè)體具有自主的學(xué)習(xí)、推斷能力,從而具有自主的認(rèn)知;
[0068](2)機(jī)器人利用快速、安全、可靠可見光通信來接收信號(hào),提高了學(xué)習(xí)的效率和可靠性。
[0069]上文中已針對(duì)根據(jù)本公開的各實(shí)施例描述了本公開的多個(gè)方面,應(yīng)當(dāng)理解,以上各實(shí)施例僅是示例性而非限制性的,并且可組合以上多個(gè)實(shí)施例以形成新的替代實(shí)施例, 或者可僅執(zhí)行一個(gè)實(shí)施例的子集來實(shí)踐本公開。
[0070]本領(lǐng)域技術(shù)人員將進(jìn)一步領(lǐng)會(huì),結(jié)合本文中所公開的實(shí)施例來描述的各種說明性邏輯塊、模塊、電路和算法步驟可實(shí)現(xiàn)為電子硬件、計(jì)算機(jī)軟件、或這兩者的組合。為清楚地說明硬件與軟件的可互換性,各種說明性組件、框、模塊、電路和步驟在上文中是以其功能性的形式來作出一般化描述的。此類功能性是被實(shí)現(xiàn)為硬件還是軟件取決于具體應(yīng)用和施加于整體系統(tǒng)的設(shè)計(jì)約束。本領(lǐng)域技術(shù)人員對(duì)于每種特定應(yīng)用可以用不同的方式來實(shí)現(xiàn)所描述的功能性,但是此類實(shí)現(xiàn)決策不應(yīng)被視為背離本公開的范圍。
[0071]結(jié)合本文所公開的實(shí)施例描述的各種說明性邏輯模塊和電路可以用通用處理器、 數(shù)字信號(hào)處理器(DSP)、專用集成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)或其他可編程邏輯器件、分立的門或晶體管邏輯、分立的硬件組件、或其設(shè)計(jì)成執(zhí)行本文所描述功能的任何組合來實(shí)現(xiàn)或執(zhí)行。通用處理器可以是微處理器,但在替換方案中,該處理器可以是任何常規(guī)的處理器、控制器、微控制器、或狀態(tài)機(jī)。處理器還可以被實(shí)現(xiàn)為計(jì)算設(shè)備的組合,例如DSP 與微處理器的組合、多個(gè)微處理器、與DSP核心協(xié)作的一個(gè)或多個(gè)微處理器、或任何其他此類配置。
[0072]結(jié)合本文中公開的實(shí)施例描述的方法或算法的步驟可直接在硬件中、在由處理器執(zhí)行的軟件模塊中、或在這兩者的組合中具體化。軟件模塊可駐留在RAM存儲(chǔ)器、閃存、ROM 存儲(chǔ)器、EPROM存儲(chǔ)器、EEPR0M存儲(chǔ)器、寄存器、硬盤、可移動(dòng)盤、CD-ROM、或本領(lǐng)域中所知的任何其他形式的存儲(chǔ)介質(zhì)中。示例性存儲(chǔ)介質(zhì)連接到處理器以使得該處理器能從/向該存儲(chǔ)介質(zhì)讀取和寫入信息。在替換方案中,存儲(chǔ)介質(zhì)可以被整合到處理器。處理器和存儲(chǔ)介質(zhì)可駐留在ASIC中。ASIC可駐留在用戶終端中。在替換方案中,處理器和存儲(chǔ)介質(zhì)可作為分立組件駐留在用戶終端中。
[0073]在一個(gè)或多個(gè)示例性實(shí)施例中,所描述的功能可在硬件、軟件、固件或其任何組合中實(shí)現(xiàn)。如果在軟件中實(shí)現(xiàn)為計(jì)算機(jī)程序產(chǎn)品,則各功能可以作為一條或更多條指令或代碼存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上或經(jīng)由其進(jìn)行傳送。計(jì)算機(jī)可讀介質(zhì)包括計(jì)算機(jī)存儲(chǔ)介質(zhì)和通信介質(zhì)兩者,其包括促成計(jì)算機(jī)程序從一地向另一地轉(zhuǎn)移的任何介質(zhì)。存儲(chǔ)介質(zhì)可以是能被計(jì)算機(jī)訪問的任何可用介質(zhì)。作為示例而非限定,此類計(jì)算機(jī)可讀介質(zhì)可包括ram、rom、 EEPR0M、CD-R0M或其他光盤存儲(chǔ)、磁盤存儲(chǔ)或其他磁存儲(chǔ)設(shè)備、或能被用來攜帶或存儲(chǔ)指令或數(shù)據(jù)結(jié)構(gòu)形式的合意程序代碼且能被計(jì)算機(jī)訪問的任何其他介質(zhì)。任何連接也被正當(dāng)?shù)胤Q為計(jì)算機(jī)可讀介質(zhì)。例如,如果軟件是使用同軸電纜、光纖電纜、雙絞線、數(shù)字訂戶線 (DSL)、或諸如紅外、無線電、以及微波之類的無線技術(shù)從web網(wǎng)站、服務(wù)器、或其他遠(yuǎn)程源傳送而來,則該同軸電纜、光纖電纜、雙絞線、DSL、或諸如紅外、無線電、以及微波之類的無線技術(shù)就被包括在介質(zhì)的定義之中。如本文中所使用的盤(di sk)包括壓縮碟(CD )、激光碟、光碟、數(shù)字多用碟(DVD)、軟盤和藍(lán)光碟,其中盤(disk)往往以磁的方式再現(xiàn)數(shù)據(jù),而碟(disc) 用激光以光學(xué)方式再現(xiàn)數(shù)據(jù)。上述的組合也應(yīng)被包括在計(jì)算機(jī)可讀介質(zhì)的范圍內(nèi)。
[0074]提供對(duì)本公開的先前描述是為使得本領(lǐng)域任何技術(shù)人員都能夠制作或使用本公開。對(duì)本公開的各種修改對(duì)本領(lǐng)域技術(shù)人員來說都將是顯而易見的,且本文中所定義的普適原理可被應(yīng)用到其他變體而不會(huì)脫離本公開的精神或范圍。由此,本公開并非旨在被限定于本文中所描述的示例和設(shè)計(jì),而是應(yīng)被授予與本文中所公開的原理和新穎性特征相一致的最廣范圍。
【主權(quán)項(xiàng)】
1.一種交互學(xué)習(xí)式機(jī)器人,包括:存儲(chǔ)裝置,存儲(chǔ)所述機(jī)器人的認(rèn)知模型;可見光通信收發(fā)器,接收經(jīng)另一機(jī)器人編碼和發(fā)送的可見光信號(hào);編解碼器,與所述收發(fā)器連接,對(duì)所述可見光信號(hào)進(jìn)行解碼;以及認(rèn)知生成裝置,與所述編解碼器連接,所述認(rèn)知生成裝置包括分類器、與所述分類器連 接的特征提取器以及與所述特征提取器連接的學(xué)習(xí)裝置,其中,所述分類器對(duì)經(jīng)解碼的信 號(hào)進(jìn)行分類,所述特征提取器提取經(jīng)分類的信號(hào)的特征,并且所述學(xué)習(xí)裝置基于所述認(rèn)知 模型和經(jīng)提取的特征來生成新認(rèn)知結(jié)果以更新所述認(rèn)知模型;其中,所述可見光通信收發(fā)器還發(fā)送所述新認(rèn)知結(jié)果。2.如權(quán)利要求1所述的機(jī)器人,其特征在于,還包括:控制器,連接至所述存儲(chǔ)裝置,并且用于根據(jù)所述認(rèn)知結(jié)果控制所述機(jī)器人的動(dòng)作。3.如權(quán)利要求1所述的機(jī)器人,其特征在于,所述可見光通信收發(fā)器是LED可見光通信 收發(fā)器、焚光可見光通信收發(fā)器中的一者或多者。4.如權(quán)利要求3所述的機(jī)器人,其特征在于,所述可見光通信收發(fā)器被安裝于所述機(jī)器 人的眼部。5.如權(quán)利要求1所述的機(jī)器人,其特征在于,所述可見光通信收發(fā)器還與云端通信,并 且所述存儲(chǔ)裝置連接到所述可見光通信收發(fā)器以從所述云端下載所述認(rèn)知模型和/或向所 述云端上傳經(jīng)更新的認(rèn)知模型。6.—種交互學(xué)習(xí)式機(jī)器人群集,包括至少兩個(gè)如權(quán)利要求1-5中的任一項(xiàng)所述的機(jī)器 人,所述至少兩個(gè)機(jī)器人以可見光通信方式通信連接。
【文檔編號(hào)】B25J9/16GK205668270SQ201620274539
【公開日】2016年11月2日
【申請(qǐng)日】2016年3月31日
【發(fā)明人】不公告發(fā)明人
【申請(qǐng)人】深圳光啟合眾科技有限公司