專利名稱:機(jī)器人頭部的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及機(jī)器人,尤其是指一種機(jī)器人頭部。
背景技術(shù):
機(jī)器人視覺(jué)是機(jī)器人研究的重要研究領(lǐng)域,但機(jī)器人僅有視覺(jué)還是遠(yuǎn)遠(yuǎn)不夠的。人們面對(duì)面的交流中,聽(tīng)和說(shuō)是重要的交流手段,而且都是由頭部完成的。
目前,國(guó)內(nèi)還沒(méi)有能夠看得見(jiàn)、聽(tīng)得見(jiàn)、會(huì)說(shuō)話、能夠識(shí)別中文語(yǔ)音命令的機(jī)器人。當(dāng)然,也沒(méi)有這樣的機(jī)器人頭部,這使得人和機(jī)器人的交互很困難。
國(guó)際上,日本本田技研株式會(huì)社(Honda)的人形機(jī)器人Asimo(http//world.honda.com/ASIMO/)具有看、聽(tīng)、說(shuō)的能力,能夠識(shí)別約50條日語(yǔ)語(yǔ)音命令。用于語(yǔ)音識(shí)別和視覺(jué)處理的計(jì)算機(jī)安裝在ASIMO機(jī)器人的背部,是機(jī)器人背包的一部分。但還不能識(shí)別中文語(yǔ)音命令。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種機(jī)器人頭部,具有更小的體積;本發(fā)明的次要目的在于提供一種機(jī)器人頭部,具有中文語(yǔ)音控制裝置,能夠識(shí)別中文語(yǔ)音命令;本發(fā)明的再一目的在于提供一種機(jī)器人頭部,具有更好的可用性的視覺(jué)傳感功能。
為實(shí)現(xiàn)上述目的,本發(fā)明提供的一種機(jī)器人頭部,它利用兩臺(tái)攝像機(jī)作為眼睛,無(wú)線話筒作耳朵,喇叭作嘴巴。
其包括兩臺(tái)計(jì)算機(jī),采用兩臺(tái)計(jì)算機(jī)控制機(jī)器人的行動(dòng);其中一臺(tái)為頭部計(jì)算機(jī),安裝在機(jī)器人頭部?jī)?nèi),用于中文語(yǔ)音合成、圖像采集和圖像處理;另一臺(tái)為上位計(jì)算機(jī),安裝在機(jī)器人外部,比如控制臺(tái),用于中文語(yǔ)音識(shí)別、圖像監(jiān)控和對(duì)外信息交換;兩臺(tái)計(jì)算機(jī)之間采用無(wú)線局域網(wǎng)連接。
在機(jī)器人頭部?jī)?nèi)的上位計(jì)算機(jī)安裝的兩臺(tái)攝像機(jī),用于采集圖像。其中兩臺(tái)攝像機(jī)的光軸中心線的夾角可以調(diào)整,還裝有自動(dòng)調(diào)光鏡頭。頭部計(jì)算機(jī)對(duì)一臺(tái)攝像機(jī)的圖像進(jìn)行壓縮,傳送給上位計(jì)算機(jī),經(jīng)解壓縮后顯示,實(shí)現(xiàn)機(jī)器人的圖像監(jiān)控。本發(fā)明利用無(wú)線局域網(wǎng)進(jìn)行壓縮圖像的傳輸,抗干擾能力強(qiáng),受遮擋物的影響小,即保證了機(jī)器人的運(yùn)動(dòng)靈活性,又保證了圖像傳輸?shù)目煽啃浴?br>
在機(jī)器人頭部?jī)?nèi)的上位計(jì)算機(jī)安裝的喇叭,用于發(fā)出聲頻信號(hào)。上位計(jì)算機(jī)裝有無(wú)線話筒接收器,用于接受語(yǔ)音。通過(guò)軟件處理,能夠接受不同講話人的非標(biāo)準(zhǔn)普通話中文語(yǔ)音命令,能夠?qū)φZ(yǔ)音命令作出中文語(yǔ)音應(yīng)答。
其中頭部計(jì)算機(jī)采用嵌入式計(jì)算機(jī),上位計(jì)算機(jī)采用臺(tái)式計(jì)算機(jī)。
本發(fā)明可以安裝在移動(dòng)平臺(tái)上,用于機(jī)器人的導(dǎo)航、定位和人機(jī)語(yǔ)音交互。
本發(fā)明的突出特點(diǎn)是將語(yǔ)音處理和圖像處理分別放在兩臺(tái)計(jì)算機(jī)上完成,并集成為一體,既解決了計(jì)算資源不足問(wèn)題,又降低了機(jī)器人的體積。
本發(fā)明的另一個(gè)突出特點(diǎn)是能夠接受不同講話人的非標(biāo)準(zhǔn)普通話語(yǔ)音命令。
圖1為本發(fā)明機(jī)器人頭部結(jié)構(gòu)示意圖;圖2為本發(fā)明機(jī)器人頭部硬件原理示意圖。
具體實(shí)施例方式
請(qǐng)同時(shí)參閱圖1和圖2。
頭部計(jì)算機(jī)1由CPU101、圖像采集器102、I/O卡103、聲卡104組成;與圖像采集器102連接裝有兩臺(tái)攝像機(jī)11,用于采集圖像;與聲卡104連接裝有喇叭12,用于發(fā)出聲頻信號(hào);與I/O卡103連接裝有控制按鈕1031和狀態(tài)指示1032;通過(guò)無(wú)線網(wǎng)卡13和無(wú)線網(wǎng)卡23,頭部計(jì)算機(jī)1與上位計(jì)算機(jī)2之間接受和發(fā)送信息。
上位計(jì)算機(jī)2由CPU201、顯卡202、網(wǎng)卡203、聲卡204組成;與聲卡204連接裝有無(wú)線接收器2042和無(wú)線話筒21,用于接受語(yǔ)音,由語(yǔ)音識(shí)別軟件識(shí)別語(yǔ)音命令,還連接有喇叭2041;與顯卡202連接還裝有圖像監(jiān)視器24,當(dāng)頭部計(jì)算機(jī)1對(duì)一臺(tái)攝像機(jī)11的圖像進(jìn)行壓縮,傳送給上位計(jì)算機(jī)2,經(jīng)解壓縮后顯示,實(shí)現(xiàn)機(jī)器人的圖像監(jiān)控;另外與網(wǎng)卡203還接設(shè)有一個(gè)信息接口22,用以連接機(jī)器人其他部件,由此發(fā)出指令。
在本發(fā)明的一較佳實(shí)施例中,上位計(jì)算機(jī)2配置為CPU主頻2.0GHz,內(nèi)存256M,硬盤(pán)80G,華碩533主板,主板集成聲卡和顯卡,17英寸顯示器。上位計(jì)算機(jī)2配有TP-Link 10/100Mbps網(wǎng)卡和ORINOCO無(wú)線網(wǎng)卡,TP-Link網(wǎng)卡用于對(duì)外信息交換,ORINOCO無(wú)線網(wǎng)卡用于與頭部計(jì)算機(jī)交換數(shù)據(jù)。采用TAKSTAR DM-715型定向無(wú)線話筒,無(wú)線話筒接收器接入聲卡的麥克風(fēng)接口。喇叭接入聲卡的耳機(jī)接口,用于系統(tǒng)調(diào)試。
頭部計(jì)算機(jī)1采用SBS PC104嵌入式計(jì)算機(jī),CPU主頻800MHz,內(nèi)存128M,硬盤(pán)40G。頭部計(jì)算機(jī)1配有ORINOCO無(wú)線網(wǎng)卡,聲卡,圖像采集卡和I/O卡。ORINOCO無(wú)線網(wǎng)卡用于與上位計(jì)算機(jī)交換數(shù)據(jù)。上位計(jì)算機(jī)2與頭部計(jì)算機(jī)1的無(wú)線網(wǎng)卡采用Peer-to-Peer方式連接。兩只喇叭12接入聲卡的耳機(jī)接口,用于機(jī)器人發(fā)聲。兩臺(tái)攝像機(jī)11接入圖像采集卡,用于視覺(jué)圖像采集。狀態(tài)指示與控制按鈕通過(guò)I/O卡接入頭部計(jì)算機(jī)。本實(shí)施例中,兩臺(tái)攝像機(jī)均采用MINTRON彩色攝像機(jī),并加裝自動(dòng)調(diào)光鏡頭。
頭部計(jì)算機(jī)1、兩臺(tái)攝像機(jī)11和喇叭12等均安裝于機(jī)器人頭部,請(qǐng)參閱圖3。此外,機(jī)器人頭部還裝有電源開(kāi)關(guān)、復(fù)位按鈕、散熱風(fēng)扇等。
頭部計(jì)算機(jī)1、兩臺(tái)攝像機(jī)11以及散熱風(fēng)扇等均采用12VDC電源,由機(jī)器人身體部分的蓄電池供電。
本實(shí)施例達(dá)到的主要指標(biāo)如下 視覺(jué)導(dǎo)航粗定位頻率>5次/秒。
視覺(jué)定位提供目標(biāo)位姿,相對(duì)誤差<1%,定位頻率>2次/秒。
語(yǔ)音命令輸入非特定人普通話語(yǔ)音命令正確接受率>95%。
語(yǔ)音命令條數(shù)1~200條。
語(yǔ)音應(yīng)答延遲時(shí)間<1秒。
圖像監(jiān)視圖像壓縮傳輸速度>4幀/秒。
頭部外形尺寸250×220×200mm。
頭部重量<4Kg。
有效控制距離頭部與上位計(jì)算機(jī)之間距離0~20m以上,話筒與上位計(jì)算機(jī)之間距離0~30m以上。
室內(nèi)環(huán)境要求無(wú)光強(qiáng)劇烈變化型光干擾,如電焊弧光;無(wú)電磁封閉性空間;無(wú)強(qiáng)電磁干擾;滿足普通計(jì)算機(jī)能夠工作的室內(nèi)環(huán)境。
權(quán)利要求
1.一種機(jī)器人頭部,其特征在于其包括兩臺(tái)計(jì)算機(jī),用以控制機(jī)器人的行動(dòng);其中一臺(tái)為頭部計(jì)算機(jī),安裝在機(jī)器人頭部?jī)?nèi),用于中文語(yǔ)音合成、圖像采集和圖像處理;另一臺(tái)為上位計(jì)算機(jī),安裝在機(jī)器人外部,用于中文語(yǔ)音識(shí)別、圖像監(jiān)控和對(duì)外信息交換;兩臺(tái)計(jì)算機(jī)之間采用無(wú)線局域網(wǎng)連接。
2.如權(quán)利要求1所述的機(jī)器人頭部,其特征在于,在機(jī)器人頭部?jī)?nèi)頭部計(jì)算機(jī)安裝的兩臺(tái)攝像機(jī),用于采集圖像。
3.如權(quán)利要求2所述的機(jī)器人頭部,其特征在于,其中兩臺(tái)攝像機(jī)的光軸中心線的夾角可以調(diào)整。
4.如權(quán)利要求3所述的機(jī)器人頭部,其特征在于,其中攝像機(jī)裝有自動(dòng)調(diào)光鏡頭。
5.如權(quán)利要求1所述的機(jī)器人頭部,其特征在于,在機(jī)器人頭部?jī)?nèi)頭部計(jì)算機(jī)安裝的喇叭,用于發(fā)出聲頻信號(hào)。
6.如權(quán)利要求1所述的機(jī)器人頭部,其特征在于,上位計(jì)算機(jī)安裝的無(wú)線話筒接收器,用于接受語(yǔ)音。
7.如權(quán)利要求1所述的機(jī)器人頭部,其特征在于,頭部計(jì)算機(jī)對(duì)一臺(tái)攝像機(jī)的圖像進(jìn)行壓縮,傳送給上位計(jì)算機(jī),經(jīng)解壓縮后顯示,實(shí)現(xiàn)機(jī)器人的圖像監(jiān)控。
8.如權(quán)利要求1所述的機(jī)器人頭部,其特征在于,頭部計(jì)算機(jī)采用嵌入式計(jì)算機(jī),上位計(jì)算機(jī)采用臺(tái)式計(jì)算機(jī)。
9.如權(quán)利要求1所述的機(jī)器人頭部,其特征在于,其中上位計(jì)算機(jī)能夠接受不同講話人的非標(biāo)準(zhǔn)普通話中文語(yǔ)音命令。
10.如權(quán)利要求1所述的機(jī)器人頭部,其特征在于,其中上位計(jì)算機(jī)能夠?qū)φZ(yǔ)音命令作出中文語(yǔ)音應(yīng)答。
全文摘要
一種機(jī)器人頭部,利用兩臺(tái)攝像機(jī)作為眼睛,無(wú)線話筒作耳朵,喇叭作嘴巴。它由兩臺(tái)計(jì)算機(jī)控制,其中頭部計(jì)算機(jī)采用嵌入式計(jì)算機(jī),安裝在機(jī)器人頭內(nèi),用于中文語(yǔ)音合成、圖像采集和圖像處理;另一上位計(jì)算機(jī)安裝在機(jī)器人頭部以外的總控制臺(tái),用于中文語(yǔ)音識(shí)別和對(duì)外信息交換。頭部計(jì)算機(jī)與上位計(jì)算機(jī)之間采用無(wú)線局域網(wǎng)連接。本發(fā)明具有視覺(jué)導(dǎo)航、視覺(jué)定位、語(yǔ)音識(shí)別、語(yǔ)音應(yīng)答和圖像監(jiān)控功能。本發(fā)明將語(yǔ)音處理和圖像處理分別放在兩臺(tái)計(jì)算機(jī)上完成,并集成為一體,解決了計(jì)算資源不足問(wèn)題,并降低了機(jī)器人的體積。利用無(wú)線局域網(wǎng)進(jìn)行壓縮圖像的傳輸,抗干擾能力強(qiáng),受遮擋物的影響小,即保證了機(jī)器人的運(yùn)動(dòng)靈活性,又保證了圖像傳輸?shù)目煽啃浴?br>
文檔編號(hào)G06F19/00GK1598855SQ0315898
公開(kāi)日2005年3月23日 申請(qǐng)日期2003年9月18日 優(yōu)先權(quán)日2003年9月18日
發(fā)明者徐德, 譚民, 涂志國(guó), 江澤民, 趙曉光, 王麟琨 申請(qǐng)人:中國(guó)科學(xué)院自動(dòng)化研究所