專利名稱:機(jī)器人的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種機(jī)器人。
背景技術(shù):
機(jī)器人技術(shù)有了很大的發(fā)展,未來(lái),機(jī)器人將會(huì)扮演越來(lái)越重要的角色。傳統(tǒng)的機(jī)器人需要人來(lái)控制,它不能自主地根據(jù)外部環(huán)境的信息來(lái)處理外部環(huán)境 中的事件,也不能針對(duì)曾經(jīng)發(fā)生過(guò)的事件吸取經(jīng)驗(yàn),并且它不能跟人們很好地互動(dòng),智能化 水平、對(duì)各方面的應(yīng)對(duì)能力以及對(duì)外界的學(xué)習(xí)能力不高。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種機(jī)器人,其具有較高的智能化水平和學(xué)習(xí)能力。根據(jù)本發(fā)明的一個(gè)方面,本發(fā)明提供了一種機(jī)器人,包括信息采集單元,用于采 集環(huán)境中的信息;信息處理單元,用于對(duì)信息采集單元采集的信息進(jìn)行處理并根據(jù)處理結(jié) 果產(chǎn)生任務(wù)執(zhí)行命令;任務(wù)執(zhí)行單元,用于根據(jù)信息處理單元生成的任務(wù)執(zhí)行命令執(zhí)行任 務(wù)。優(yōu)選地,所述信息采集單元包括聲音獲取單元,信息處理單元包括語(yǔ)音識(shí)別單元, 任務(wù)執(zhí)行單元包括運(yùn)動(dòng)單元和/或發(fā)聲單元。優(yōu)選地,所述語(yǔ)音識(shí)別單元包括語(yǔ)音檢測(cè)單元,用于從語(yǔ)音數(shù)據(jù)中檢測(cè)出人的語(yǔ) 音;特征提取單元,用于從語(yǔ)音數(shù)據(jù)中提取出語(yǔ)音特征;匹配單元,用于將語(yǔ)音特征與分別 存儲(chǔ)在模型存儲(chǔ)單元、字典存儲(chǔ)單元、語(yǔ)法存儲(chǔ)單元中的模型、字詞、語(yǔ)法進(jìn)行匹配,以得出 語(yǔ)音識(shí)別結(jié)果;模型存儲(chǔ)單元,用于存儲(chǔ)語(yǔ)音模型;字典存儲(chǔ)單元,用于存儲(chǔ)跟語(yǔ)音相對(duì)應(yīng) 的字詞;語(yǔ)法存儲(chǔ)單元,用于存儲(chǔ)跟語(yǔ)音相對(duì)應(yīng)的語(yǔ)法。優(yōu)選地,所述機(jī)器人還包括噪聲存儲(chǔ)單元,用于存儲(chǔ)噪聲字?jǐn)?shù)據(jù)。優(yōu)選地,所述語(yǔ)音檢測(cè)單元在檢測(cè)語(yǔ)音的過(guò)程中從噪聲存儲(chǔ)單元中讀取噪聲字?jǐn)?shù) 據(jù)以區(qū)分噪音。優(yōu)選地,所述匹配單元一旦識(shí)別出噪聲,便將噪聲字?jǐn)?shù)據(jù)存儲(chǔ)在噪聲存儲(chǔ)單元中。
優(yōu)選地,所述信息采集單元包括攝像單元,信息處理單元包括人臉識(shí)別單元,任務(wù) 執(zhí)行單元包括發(fā)生單元。優(yōu)選地,所述信息采集單元包括傳感單元,信息處理單元包括數(shù)據(jù)分析單元,任務(wù) 執(zhí)行單元包括通信單元。
圖1為本發(fā)明的第一個(gè)實(shí)施例的框圖。圖2為本發(fā)明第一個(gè)實(shí)施例的語(yǔ)音識(shí)別單元的框圖。圖3為本發(fā)明的第二個(gè)實(shí)施例的框圖。圖4為本發(fā)明的第三個(gè)實(shí)施例的框圖。
圖5為本發(fā)明的第四個(gè)實(shí)施例的框圖。
具體實(shí)施例方式參考圖1。在本實(shí)施例中,信息采集單元為錄音單元101,信息處理單元為語(yǔ)音識(shí) 別單元102,任務(wù)執(zhí)行單元為運(yùn)動(dòng)單元103。錄音單元101錄入聲音信息后對(duì)聲音信息進(jìn)行 模數(shù)轉(zhuǎn)換,然后把轉(zhuǎn)換后的聲音數(shù)據(jù)傳到語(yǔ)音識(shí)別單元102。參考圖2,語(yǔ)音識(shí)別單元102 包括語(yǔ)音檢測(cè)單元202、特征提取單元203、匹配單元205、模型存儲(chǔ)單元204、字典存儲(chǔ)單 元206、語(yǔ)法存儲(chǔ)單元207和噪聲存儲(chǔ)單元201,語(yǔ)音檢測(cè)單元202、特征提取單元203、匹 配單元205、模型存儲(chǔ)單元204、字典存儲(chǔ)單元206、語(yǔ)法存儲(chǔ)單元207和噪聲存儲(chǔ)單元201 之間的電連接關(guān)系如圖2所示。聲音數(shù)據(jù)傳到語(yǔ)音檢測(cè)單元202和特征提取單元203。接 收到該聲音數(shù)據(jù)后,特征提取單元203以幀為單位執(zhí)行該聲音數(shù)據(jù)的MFCC(Mel Frequency Cepstrum Coeff icient,麥爾頻率對(duì)數(shù)倒頻譜系數(shù))分析,并向匹配單元205輸出MFCC分 析結(jié)果作為特征參數(shù)(特征向量)。特征提取單元203提取特性參數(shù),如線性預(yù)測(cè)系數(shù)、對(duì) 數(shù)倒頻譜系數(shù)、線譜對(duì)和在每個(gè)預(yù)定頻帶中的功率(濾波器組的輸出)。根據(jù)從特征提取 單元203提供的特性參數(shù),匹配單元205根據(jù)一個(gè)連續(xù)分布HMM(Hidden Markov Model,隱 藏馬爾科夫)方法通過(guò)引用模型存儲(chǔ)單元204、字典存儲(chǔ)單元206和語(yǔ)法存儲(chǔ)單元207執(zhí) 行聲音數(shù)據(jù)的語(yǔ)音識(shí)別。模型存儲(chǔ)單元204存儲(chǔ)用于指示語(yǔ)音中每個(gè)音素或每個(gè)音節(jié)的聲 音特征的聲音模型。語(yǔ)音識(shí)別根據(jù)連續(xù)分布HMM方法執(zhí)行。HMM被用作聲音模型。字典存 儲(chǔ)單元206存儲(chǔ)包含每個(gè)字詞的發(fā)音的信息(音素信息)。語(yǔ)法存儲(chǔ)單元207存儲(chǔ)語(yǔ)法規(guī) 則,該語(yǔ)法規(guī)則描述在字典存儲(chǔ)單元206中記錄的字詞如何連接和聯(lián)系。例如,語(yǔ)法規(guī)則可 以是上下文無(wú)關(guān)的語(yǔ)法或基于統(tǒng)計(jì)單詞連接概率的規(guī)則。匹配單元205引用字典存儲(chǔ)單元 206中的字詞數(shù)據(jù)以連接存儲(chǔ)在模型存儲(chǔ)單元204中的聲音模型,因此形成字詞的聲音模 型(字詞模型)。匹配單元205也引用存儲(chǔ)在語(yǔ)法存儲(chǔ)單元207中的語(yǔ)法規(guī)則,以連接字 詞模型,并使用所連接的單詞模型,以通過(guò)使用連續(xù)分布HMM方法和根據(jù)特性參數(shù)識(shí)別聲 音數(shù)據(jù)。也就是說(shuō),匹配單元205檢測(cè)特征提取單元203輸出的一系列字詞模型,輸出對(duì)應(yīng) 于所述字詞模型序列的字詞串的音素信息作為語(yǔ)音識(shí)別結(jié)果。匹配單元205累加對(duì)應(yīng)于所 連接的單詞模型的單詞串的每個(gè)特性參數(shù)的概率,并將所累加的數(shù)值作為分?jǐn)?shù)。匹配單元 205輸出關(guān)于具有最高分?jǐn)?shù)的字詞串的音素信息作為語(yǔ)音識(shí)別結(jié)果。語(yǔ)音檢測(cè)單元202按 照特征提取單元203執(zhí)行MFCC分析的方式計(jì)算每個(gè)幀中的功率。語(yǔ)音檢測(cè)單元202將每 個(gè)幀中的功率與預(yù)定閾值比較,并檢測(cè)由功率大于或等于預(yù)定閾值的一個(gè)幀形成的部分作 為語(yǔ)音數(shù)據(jù)。語(yǔ)音檢測(cè)單元202向特征提取單元203和匹配單元205提供所檢測(cè)的語(yǔ)音數(shù) 據(jù)。特征提取單元203和匹配單元205執(zhí)行語(yǔ)音數(shù)據(jù)的識(shí)別處理。噪聲存儲(chǔ)單元201存儲(chǔ) 了多個(gè)接近要消除的噪聲的字。以前曾經(jīng)被識(shí)別為噪聲的字以及來(lái)自語(yǔ)音環(huán)境的與噪聲字 數(shù)據(jù)類似的一些字存儲(chǔ)在噪聲存儲(chǔ)單元201中。當(dāng)語(yǔ)音識(shí)別的結(jié)果是在噪聲存儲(chǔ)單元201 中的一個(gè)字時(shí),匹配單元201將此語(yǔ)音識(shí)別結(jié)果判定為噪聲。當(dāng)特征提取單元203和匹配 單元205無(wú)法對(duì)聲音數(shù)據(jù)進(jìn)行語(yǔ)音識(shí)別并且噪聲存儲(chǔ)單元201中也沒(méi)有存儲(chǔ)對(duì)應(yīng)該聲音數(shù) 據(jù)的噪聲時(shí),匹配單元205將該聲音數(shù)據(jù)判定為噪聲并反饋歸噪聲存儲(chǔ)單元201。任務(wù)執(zhí)行單元還可以是發(fā)聲單元303,如圖3所示,發(fā)聲單元303根據(jù)語(yǔ)音識(shí)別單 元302對(duì)語(yǔ)音數(shù)據(jù)的識(shí)別結(jié)果調(diào)用語(yǔ)音數(shù)據(jù)庫(kù)并發(fā)聲。
參考圖4。在本實(shí)施例中,信息采集單元是攝像單元401,信息處理單元是人臉識(shí) 別單元402,任務(wù)執(zhí)行單元是發(fā)聲單元403。攝像單元401獲取周圍環(huán)境中的圖像,并將拍 攝到的人臉圖像發(fā)送到人臉識(shí)別單元402中。人臉識(shí)別單元402對(duì)人臉圖像進(jìn)行識(shí)別并把 識(shí)別結(jié)果發(fā)送給發(fā)聲單元403,發(fā)聲單元403根據(jù)人臉識(shí)別的結(jié)果從數(shù)據(jù)庫(kù)中查找人名并 調(diào)用語(yǔ)音數(shù)據(jù)庫(kù)以將人名說(shuō)出來(lái)。參考圖5。在本實(shí)施例中,信息采集單元是傳感單元501,信息處理單元是數(shù)據(jù)分 析單元502,任務(wù)執(zhí)行單元是通信單元503。傳感單元501探測(cè)周圍環(huán)境中的信息,如溫度、 氣體、濕度,并將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào),發(fā)送到數(shù)據(jù)分析單元502中。數(shù)據(jù)分析單元502 從傳感單元501中接收以數(shù)字信號(hào)為載體的環(huán)境信息并進(jìn)行分析。通信單元503將分析結(jié) 果發(fā)送給外部設(shè)備,如服務(wù)器、手機(jī)、電腦等。
權(quán)利要求
1.一種機(jī)器人,包括信息采集單元,用于采集環(huán)境中的信息;信息處理單元,用于對(duì)信息采集單元采集的信息進(jìn)行處理并根據(jù)處理結(jié)果產(chǎn)生任務(wù)執(zhí) 行命令;任務(wù)執(zhí)行單元,用于根據(jù)信息處理單元生成的任務(wù)執(zhí)行命令執(zhí)行任務(wù)。
2.根據(jù)權(quán)利要求1所述的機(jī)器人,其特征是所述信息采集單元包括聲音獲取單元,信 息處理單元包括語(yǔ)音識(shí)別單元,任務(wù)執(zhí)行單元包括運(yùn)動(dòng)單元和/或發(fā)聲單元。
3.根據(jù)權(quán)利要求2所述的機(jī)器人,其特征是所述語(yǔ)音識(shí)別單元包括語(yǔ)音檢測(cè)單元,用 于從語(yǔ)音數(shù)據(jù)中檢測(cè)出人的語(yǔ)音;特征提取單元,用于從語(yǔ)音數(shù)據(jù)中提取出語(yǔ)音特征;匹 配單元,用于將語(yǔ)音特征與分別存儲(chǔ)在模型存儲(chǔ)單元、字典存儲(chǔ)單元、語(yǔ)法存儲(chǔ)單元中的模 型、字詞、語(yǔ)法進(jìn)行匹配,以得出語(yǔ)音識(shí)別結(jié)果;模型存儲(chǔ)單元,用于存儲(chǔ)語(yǔ)音模型;字典存 儲(chǔ)單元,用于存儲(chǔ)跟語(yǔ)音相對(duì)應(yīng)的字詞;語(yǔ)法存儲(chǔ)單元,用于存儲(chǔ)跟語(yǔ)音相對(duì)應(yīng)的語(yǔ)法。
4.根據(jù)權(quán)利要求2或3所述的機(jī)器人,其特征是所述機(jī)器人還包括噪聲存儲(chǔ)單元,用 于存儲(chǔ)噪聲字?jǐn)?shù)據(jù)。
5.根據(jù)權(quán)利要求2至4中任意一項(xiàng)所述的機(jī)器人,其特征是所述語(yǔ)音檢測(cè)單元在檢測(cè) 語(yǔ)音的過(guò)程中從噪聲存儲(chǔ)單元中讀取噪聲字?jǐn)?shù)據(jù)以區(qū)分噪音。
6.根據(jù)權(quán)利要求2至5中任意一項(xiàng)所述的機(jī)器人,其特征是所述匹配單元一旦識(shí)別出 噪聲,便將噪聲字?jǐn)?shù)據(jù)存儲(chǔ)在噪聲存儲(chǔ)單元中。
7.根據(jù)權(quán)利要求1所述的機(jī)器人,其特征是所述信息采集單元包括攝像單元,信息處 理單元包括人臉識(shí)別單元,任務(wù)執(zhí)行單元包括發(fā)生單元。
8.根據(jù)權(quán)利要求1所述的機(jī)器人,其特征是所述信息采集單元包括傳感單元,信息處 理單元包括數(shù)據(jù)分析單元,任務(wù)執(zhí)行單元包括通信單元。
全文摘要
本發(fā)明公開(kāi)了一種機(jī)器人,包括信息采集單元,用于采集環(huán)境中的信息;信息處理單元,用于對(duì)信息采集單元采集的信息進(jìn)行處理并根據(jù)處理結(jié)果產(chǎn)生任務(wù)執(zhí)行命令;任務(wù)執(zhí)行單元,用于根據(jù)信息處理單元生成的任務(wù)執(zhí)行命令執(zhí)行任務(wù)。本發(fā)明的機(jī)器人具有較高的智能化水平和學(xué)習(xí)能力。
文檔編號(hào)G05D1/02GK102141812SQ20101054655
公開(kāi)日2011年8月3日 申請(qǐng)日期2010年11月16日 優(yōu)先權(quán)日2010年11月16日
發(fā)明者何志軍, 周全, 李磊 申請(qǐng)人:深圳中科智酷機(jī)器人科技有限公司