一種智能語(yǔ)音門(mén)鈴系統(tǒng)及其實(shí)現(xiàn)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于智能家居技術(shù)領(lǐng)域,特別涉及一種帶人臉識(shí)別、語(yǔ)音合成、語(yǔ)音識(shí)別技術(shù)的智能門(mén)鈴。
【背景技術(shù)】
[0002]目前市場(chǎng)上的門(mén)鈴功能單一,大多只有簡(jiǎn)單的響鈴功能。少數(shù)門(mén)鈴可以聯(lián)網(wǎng),但是沒(méi)有人臉和語(yǔ)音識(shí)別功能。物聯(lián)網(wǎng)技術(shù)逐漸興起,Android、Windows等智能操作系統(tǒng)已經(jīng)廣泛應(yīng)用于各個(gè)領(lǐng)域,智能家居將是以后發(fā)展的主導(dǎo)方向。隨著信息技術(shù)的發(fā)展,人臉識(shí)別技術(shù)和語(yǔ)音識(shí)別技術(shù)日臻成熟。一種能夠識(shí)別用戶,并通過(guò)自然語(yǔ)言和用戶交流的門(mén)鈴會(huì)使我們的生活更加美好。
【發(fā)明內(nèi)容】
[0003]本發(fā)明公開(kāi)了一種智能語(yǔ)音門(mén)鈴系統(tǒng),其特征在于:所述門(mén)鈴系統(tǒng)包括用于獲取人臉圖像的攝像頭、用于將人臉圖像轉(zhuǎn)換為用戶ID的人臉識(shí)別模塊、包含用戶ID和用戶稱(chēng)呼的用戶數(shù)據(jù)表、用于將文本轉(zhuǎn)換為語(yǔ)音的語(yǔ)音合成模塊、用于播放聲音的揚(yáng)聲器、用于連接互聯(lián)網(wǎng)的無(wú)線聯(lián)網(wǎng)模塊。
[0004]優(yōu)選的,所述門(mén)鈴系統(tǒng)還包括用于檢測(cè)是否有來(lái)訪者接近門(mén)鈴的人體感應(yīng)器、用于檢測(cè)門(mén)是否開(kāi)啟的門(mén)磁。
[0005]優(yōu)選的,所述門(mén)鈴系統(tǒng)還包括用于顯示圖文信息和接受觸摸輸入的觸摸顯示屏。
[0006]優(yōu)選的,所述門(mén)鈴系統(tǒng)還包括用于接受語(yǔ)音輸入的麥克風(fēng)、用于保存聲音圖像數(shù)據(jù)的存儲(chǔ)器。
[0007]優(yōu)選的,所述門(mén)鈴系統(tǒng)還包括用于將語(yǔ)音轉(zhuǎn)換為文本的語(yǔ)音識(shí)別模塊、包含關(guān)鍵詞和動(dòng)作命令的命令數(shù)據(jù)表。
[0008]本發(fā)明還公開(kāi)了一種智能語(yǔ)音門(mén)鈴實(shí)現(xiàn)方法,其特征在于,包括以下步驟:
攝像頭獲取來(lái)訪者的人臉圖像;
人臉識(shí)別模塊將人臉圖像轉(zhuǎn)換為用戶ID ;
系統(tǒng)根據(jù)用戶ID從用戶數(shù)據(jù)表中獲取對(duì)應(yīng)的用戶稱(chēng)呼文本;
語(yǔ)音合成模塊根據(jù)用戶稱(chēng)呼文本合成包含用戶稱(chēng)呼的問(wèn)候語(yǔ)音;
揚(yáng)聲器播放包含用戶稱(chēng)呼的問(wèn)候語(yǔ)音。
[0009]優(yōu)選的,還包括以下步驟:
根據(jù)人臉圖像添加用戶稱(chēng)呼文本;
系統(tǒng)將用戶ID及對(duì)應(yīng)的用戶稱(chēng)呼文本添加到用戶數(shù)據(jù)表。
[0010]優(yōu)選的,還包括以下步驟:
麥克風(fēng)接受用戶輸入語(yǔ)音;
語(yǔ)音識(shí)別模塊將用戶輸入語(yǔ)音轉(zhuǎn)換為用戶輸入文本;
系統(tǒng)在用戶輸入文本中查找命令數(shù)據(jù)表中的關(guān)鍵詞,如果匹配到關(guān)鍵詞則執(zhí)行對(duì)應(yīng)動(dòng)作命令。
[0011]優(yōu)選的,還包括以下步驟:
人體感應(yīng)器檢測(cè)到有來(lái)訪者在門(mén)鈴前逗留時(shí),系統(tǒng)自動(dòng)點(diǎn)亮觸摸顯示屏或自動(dòng)打開(kāi)攝像頭;
人體感應(yīng)器檢測(cè)到來(lái)訪者已經(jīng)離開(kāi)門(mén)鈴時(shí),系統(tǒng)自動(dòng)關(guān)閉觸摸顯示屏或自動(dòng)關(guān)閉攝像頭;
門(mén)磁檢測(cè)到門(mén)開(kāi)啟時(shí),系統(tǒng)自動(dòng)停止播放門(mén)鈴鈴聲。
[0012]優(yōu)選的,還包括以下步驟:
麥克風(fēng)、攝像頭接受用戶語(yǔ)音留言或視頻留言;
系統(tǒng)將用戶語(yǔ)音留言或視頻留言保存在存儲(chǔ)器中;
系統(tǒng)將來(lái)訪者的圖像、語(yǔ)音、視頻通過(guò)互聯(lián)網(wǎng)發(fā)送到業(yè)主的移動(dòng)設(shè)備上。
【附圖說(shuō)明】
[0013]圖1為實(shí)施例1系統(tǒng)組成。
[0014]圖2為實(shí)施例2系統(tǒng)組成。
[0015]圖3為實(shí)施例3系統(tǒng)組成。
[0016]圖4為用戶數(shù)據(jù)表結(jié)構(gòu)。
[0017]圖5為命令數(shù)據(jù)表結(jié)構(gòu)。
[0018]圖6為識(shí)別問(wèn)候用戶的步驟。
[0019]圖7為標(biāo)注用戶稱(chēng)呼的步驟。
[0020]圖8為識(shí)別語(yǔ)音命令的步驟。
【具體實(shí)施方式】
[0021]下面結(jié)合附圖對(duì)本發(fā)明做進(jìn)一步的詳細(xì)介紹。
[0022]實(shí)施例1:
系統(tǒng)組成
參見(jiàn)圖1,門(mén)鈴系統(tǒng)包括樹(shù)莓派電腦板、SYN6288語(yǔ)音合成模塊、揚(yáng)聲器。樹(shù)莓派電腦板包括主板、與主板相連接的ARM處理器、內(nèi)存、Flash、USB和GP1接口。OV5647攝像頭模塊通過(guò)排線與主板相連,WIFI模塊通過(guò)USB與主板相連。SYN6288語(yǔ)音合成模塊包括電路板、與電路板相連接的SYN6288單片機(jī)、音頻輸出口、GP1接口。SYN6288語(yǔ)音合成模塊通過(guò)TTL與主板連接通訊,揚(yáng)聲器接SYN6288模塊的音頻輸出口。門(mén)鈴系統(tǒng)運(yùn)行Debian操作系統(tǒng),人臉識(shí)別模塊為基于OpenCV的本地應(yīng)用程序。
[0023]實(shí)現(xiàn)方法
參見(jiàn)圖6,門(mén)鈴系統(tǒng)通過(guò)WIFI連接互聯(lián)網(wǎng),系統(tǒng)啟動(dòng)后運(yùn)行門(mén)鈴服務(wù)程序。攝像頭定時(shí)檢測(cè)畫(huà)面中是否有人臉特征,如果檢測(cè)到人臉則自動(dòng)拍攝照片,并通過(guò)互聯(lián)網(wǎng)將照片發(fā)送到業(yè)主的智能手機(jī)上。人臉識(shí)別模塊將人臉照片轉(zhuǎn)換為用戶ID,然后從本地用戶數(shù)據(jù)表中查找是否有相應(yīng)的用戶ID,用戶數(shù)據(jù)表結(jié)構(gòu)如圖4所示。如果用戶ID不存在,揚(yáng)聲器播放默認(rèn)問(wèn)候語(yǔ)音,例如您好,歡迎光臨!”如果用戶ID已存在,則提取對(duì)應(yīng)的用戶姓名,并用語(yǔ)音合成模塊合成包含用戶姓名的問(wèn)候語(yǔ)音,例如張三您好,歡迎光臨! ”揚(yáng)聲器播放問(wèn)候語(yǔ)音。
[0024]參見(jiàn)圖7,業(yè)主的智能手機(jī)上安裝有門(mén)鈴管理APP程序。業(yè)主收到用戶照片后可以標(biāo)注用戶姓名并回傳到門(mén)鈴系統(tǒng),門(mén)鈴系統(tǒng)將用戶ID和用戶姓名一起保存到用戶數(shù)據(jù)表中,用于下次識(shí)別用戶。
[0025]實(shí)施例2:
系統(tǒng)組成
參見(jiàn)圖2,門(mén)鈴系統(tǒng)包括平板電腦、擴(kuò)展模塊。平板電腦包括主板、集成在主板上的CPU、內(nèi)存、存儲(chǔ)器、WIFI模塊、3G/4G模塊、Micro USB接口,攝像頭、麥克風(fēng)、揚(yáng)聲器、觸摸顯示屏通過(guò)排線與主板相連,平板電腦運(yùn)行Android操作系統(tǒng)。人臉識(shí)別模塊為基于谷歌、訊飛或百度的人臉識(shí)別程序,語(yǔ)音合成模塊為基于谷歌、訊飛或百度的TTS語(yǔ)音合成引擎,語(yǔ)音識(shí)別模塊為基于谷歌、訊飛或百度的語(yǔ)音識(shí)別程序。擴(kuò)展模塊包括電路板、與電路板相連的MCU、紅外傳感器、門(mén)磁開(kāi)關(guān)、USB接口。擴(kuò)展模塊通過(guò)USB與平板電腦連接通信。
[0026]實(shí)現(xiàn)方法
參見(jiàn)圖6,門(mén)鈴系統(tǒng)通過(guò)WIF1、3G/4G連接互聯(lián)網(wǎng),系統(tǒng)啟動(dòng)后運(yùn)行門(mén)鈴服務(wù)程序。紅外傳感器檢測(cè)是否有人靠近門(mén)鈴,如果有人在門(mén)鈴前逗留則自動(dòng)點(diǎn)亮觸摸顯示屏并在觸摸屏上顯示門(mén)鈴菜單。攝像頭檢測(cè)到人臉時(shí)拍攝照片,并將照片發(fā)送到業(yè)主的智能移動(dòng)設(shè)備上。人臉識(shí)別模塊將人臉照片轉(zhuǎn)換為用戶ID。然后從本地用戶數(shù)據(jù)表中查找是否有相應(yīng)的用戶ID,用戶數(shù)據(jù)表結(jié)構(gòu)如圖4所示。如果用戶ID不存在,揚(yáng)聲器播放默認(rèn)問(wèn)候語(yǔ)音,例如:“您好,歡迎光臨! ”如果用戶ID已存在,則提取對(duì)應(yīng)的用戶稱(chēng)呼,并用語(yǔ)音合成模塊合成包含用戶稱(chēng)呼的問(wèn)候語(yǔ)音,例如張先生,歡迎您再次光臨!您要找我家主人嗎?”然后揚(yáng)聲器播放問(wèn)候語(yǔ)音。
[0027]參見(jiàn)圖8,麥克風(fēng)接收用戶語(yǔ)音輸入,此時(shí)用戶的回答可能是:
“是的,我找李四?!?br> “李四在家嗎? ”
“家里有人嗎?”
“有人在家嗎?”
語(yǔ)音識(shí)別模塊將上述用戶輸入語(yǔ)音轉(zhuǎn)換為用戶輸入文本,然后查找命令數(shù)據(jù)表中的關(guān)鍵詞,命令數(shù)據(jù)表結(jié)構(gòu)如圖5所示。如果在用戶輸入文本中找到對(duì)應(yīng)的關(guān)鍵詞,則執(zhí)行相應(yīng)的命令。例如用戶說(shuō)“李老師在不在家?”,匹配到“在家”則揚(yáng)聲器自動(dòng)播放門(mén)鈴聲音。如果用戶說(shuō)“我要留言?!保ヅ涞健傲粞浴眲t開(kāi)始給用戶錄像留言。如果語(yǔ)音無(wú)法識(shí)別或未匹配到任何關(guān)鍵詞,用戶還可以點(diǎn)擊觸摸顯示屏上的門(mén)鈴菜單按響門(mén)鈴。如果業(yè)主在家聽(tīng)到門(mén)鈴出來(lái)開(kāi)門(mén),門(mén)磁開(kāi)關(guān)檢測(cè)到門(mén)被打開(kāi)