本發(fā)明涉及智能家居系統(tǒng)控制領(lǐng)域,主要應(yīng)用于語(yǔ)音控制系統(tǒng)的用戶聲紋識(shí)別及控制信號(hào)判定。
背景技術(shù):
目前智能家居產(chǎn)品都具有基本的控制信號(hào)識(shí)別能力,但在語(yǔ)音控制方面就語(yǔ)音識(shí)別精度及遠(yuǎn)程控制的技術(shù)上卻較為落后,造成用戶只有通過(guò)近距離控制設(shè)備,無(wú)法做到在室內(nèi)“隨說(shuō)隨控”,導(dǎo)致用戶體驗(yàn)不佳。
專利CN2016105091951提供了一種智能家居的廚房解決方案,實(shí)施案例僅可以對(duì)廚房?jī)?nèi)部的系統(tǒng)實(shí)施控制,由于未考慮參考采樣設(shè)備所在的相對(duì)位置數(shù)據(jù)產(chǎn)生的對(duì)識(shí)別率產(chǎn)生的優(yōu)化作用,在多個(gè)設(shè)備同時(shí)采樣時(shí)會(huì)由于多個(gè)設(shè)備的采樣重疊,后臺(tái)數(shù)據(jù)分析階段勢(shì)必?zé)o法對(duì)人發(fā)出的指令做出正確判斷(聲音混疊)。相對(duì)的,產(chǎn)品也僅能對(duì)廚房?jī)?nèi)設(shè)備做出響應(yīng),不能對(duì)整個(gè)房間非廚用設(shè)備做出響應(yīng),有較大的局限性。專利CN2014103967469結(jié)合了現(xiàn)有組網(wǎng)設(shè)備之間的互相通信,但需要隨身攜帶聲音采集設(shè)備,造成用戶使用不方便。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是實(shí)現(xiàn)智能家居的“隨說(shuō)隨控”,有效改善用戶體驗(yàn)。
為了達(dá)到上述目的,本發(fā)明的一個(gè)技術(shù)方案是提供了一種智能家居語(yǔ)音控制識(shí)別系統(tǒng),其特征在于,包括至少一個(gè)主控裝置及至少一個(gè)入網(wǎng)產(chǎn)品,入網(wǎng)產(chǎn)品與一個(gè)主控裝置進(jìn)行自組網(wǎng),形成包含距離信息的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),其中:
主控裝置包括用于捕捉用戶發(fā)出的語(yǔ)音的拾音器或麥克風(fēng);
用于對(duì)拾音器或麥克風(fēng)捕捉到的語(yǔ)音信號(hào)進(jìn)行去噪、壓縮的聲音去噪壓縮模塊;
中央處理器,用于獲取主控裝置的聲音去噪壓縮模塊的語(yǔ)音信息及各入網(wǎng)產(chǎn)品傳輸?shù)恼Z(yǔ)音數(shù)據(jù),預(yù)估發(fā)出語(yǔ)音控制指令的用戶的位置信息,根據(jù)位置信息對(duì)獲得的語(yǔ)音信號(hào)進(jìn)行多設(shè)備音頻數(shù)據(jù)對(duì)齊,擬合,獲取語(yǔ)音指令;
人機(jī)交互模塊,用于預(yù)先錄入用戶的語(yǔ)音指令;
控制/采集分析單元,用于根據(jù)中央處理器獲得語(yǔ)音指令控制對(duì)應(yīng)的家居設(shè)備,或采集環(huán)境數(shù)據(jù);
無(wú)線傳輸模塊,用于在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的各設(shè)備之間傳輸數(shù)據(jù);
入網(wǎng)產(chǎn)品包括用于捕捉用戶發(fā)出的語(yǔ)音的拾音器或麥克風(fēng);
用于對(duì)拾音器或麥克風(fēng)捕捉到的語(yǔ)音信號(hào)進(jìn)行去噪、壓縮的聲音去噪壓縮模塊;
處理運(yùn)算模塊,用于采集自身聲音去噪壓縮模塊輸出的語(yǔ)音信息,收集當(dāng)前入網(wǎng)產(chǎn)品的入網(wǎng)設(shè)備數(shù)據(jù),對(duì)語(yǔ)音信息按照預(yù)估計(jì)方法進(jìn)行空間位置補(bǔ)償,加快聲音識(shí)別效率并有效初階去噪,通過(guò)無(wú)線傳輸模塊將數(shù)據(jù)上傳至主控裝置,并通過(guò)無(wú)線傳輸模塊接收主控裝置反饋的控制指令;
控制/采集分析單元,用于獲得的控制指令控制對(duì)應(yīng)的家居設(shè)備,或采集環(huán)境數(shù)據(jù);
無(wú)線傳輸模塊,用于在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的各設(shè)備之間傳輸數(shù)據(jù)。
本發(fā)明的另一個(gè)技術(shù)方案是提供了一種基于上述的智能家居語(yǔ)音控制系統(tǒng)的智能家居語(yǔ)音控制識(shí)別方法,其特征在于,包括以下步驟:
第一步、用戶通過(guò)人機(jī)交互模塊在主控裝置中錄入指定的控制指令語(yǔ)音信息;
第二步、入網(wǎng)產(chǎn)品與一個(gè)主控裝置進(jìn)行自組網(wǎng),在自組網(wǎng)過(guò)程中,主控裝置根據(jù)入網(wǎng)產(chǎn)品間及入網(wǎng)產(chǎn)品與主控裝置間的信號(hào)衰減情況得到各個(gè)入網(wǎng)產(chǎn)品的相對(duì)位置信息,從而形成包含距離信息的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu);
第三步、用戶在任意位置發(fā)出包含控制指令的語(yǔ)音信號(hào),入網(wǎng)產(chǎn)品或主控裝置的拾音器或麥克風(fēng)捕捉到該語(yǔ)音信號(hào)后,通過(guò)聲音去噪壓縮模塊對(duì)語(yǔ)音信號(hào)進(jìn)行初階(基礎(chǔ))去噪、壓縮,保留語(yǔ)音信號(hào)中的人聲段數(shù)據(jù)流形成語(yǔ)音信息,由當(dāng)前入網(wǎng)產(chǎn)品的處理運(yùn)算模塊形成語(yǔ)音數(shù)據(jù),通過(guò)無(wú)線傳輸模塊發(fā)送給主控裝置;
第四步、主控裝置匯總各入網(wǎng)產(chǎn)品上傳的語(yǔ)音數(shù)據(jù)及自身語(yǔ)音信息后,根據(jù)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中各個(gè)入網(wǎng)產(chǎn)品的相對(duì)位置信息以及各語(yǔ)音數(shù)據(jù)中包含的音量信息預(yù)估發(fā)出語(yǔ)音信號(hào)的用戶的位置,得到發(fā)聲人位置信息;
第五步、主控裝置根據(jù)發(fā)聲人位置信息對(duì)多個(gè)語(yǔ)音數(shù)據(jù)進(jìn)行多設(shè)備音頻數(shù)據(jù)對(duì)齊,剔除回聲,從而得到有效指令段;
第六步、主控裝置的中央處理器將有效指令段與預(yù)先錄入的控制指令語(yǔ)音信息進(jìn)行聲紋比對(duì),從而獲得控制指令,根據(jù)控制指令對(duì)應(yīng)的家居設(shè)備,中央處理器或?qū)⒖刂浦噶畎l(fā)送給當(dāng)前主控裝置的控制/采集分析單元,由控制/采集分析單元根據(jù)控制指令控制對(duì)應(yīng)的家居設(shè)備,或?qū)⒖刂浦噶钔ㄟ^(guò)無(wú)線傳輸模塊發(fā)送給對(duì)應(yīng)的入網(wǎng)產(chǎn)品,由入網(wǎng)產(chǎn)品的控制/采集分析單元根據(jù)控制指令控制對(duì)應(yīng)的家居設(shè)備。
優(yōu)選地,在所述第三步中,由當(dāng)前入網(wǎng)產(chǎn)品的處理運(yùn)算模塊在語(yǔ)音信息上打上時(shí)間戳后形成語(yǔ)音數(shù)據(jù);
在所述第四步中,主控裝置將自身的語(yǔ)音信息打上時(shí)間戳后形成語(yǔ)音數(shù)據(jù);
在所述第五步中,主控裝置將語(yǔ)音數(shù)據(jù)匯總后,根據(jù)時(shí)間戳顯示的時(shí)間先后順序進(jìn)行排序,選取位于最前的3~5個(gè)語(yǔ)音數(shù)據(jù),對(duì)選取的語(yǔ)音數(shù)據(jù)進(jìn)行多設(shè)備音頻數(shù)據(jù)對(duì)齊后,進(jìn)行擬合,對(duì)擬合后的信號(hào)進(jìn)行去噪補(bǔ)償,從而剔除回聲,得到有效指令段。
優(yōu)選地,所述第四步中,發(fā)聲人位置信息的獲取方法為:
通過(guò)各語(yǔ)音數(shù)據(jù)計(jì)算傳輸各語(yǔ)音數(shù)據(jù)的各個(gè)入網(wǎng)產(chǎn)品與發(fā)出語(yǔ)音信號(hào)的用戶之間的位置差,根據(jù)位置差及各個(gè)入網(wǎng)產(chǎn)品的相對(duì)位置信息得到發(fā)聲人位置信息,其中,設(shè)當(dāng)前第i個(gè)入網(wǎng)產(chǎn)品與發(fā)出語(yǔ)音信號(hào)的用戶之間的位置差為di,則根據(jù)Lfs=32.44+20lg di+20lg f計(jì)算得到di,式中,Lfs為語(yǔ)音信號(hào)在空氣中的傳輸損耗,f為第i個(gè)入網(wǎng)產(chǎn)品接收到的語(yǔ)音信號(hào)的頻率,根據(jù)di的值與聲音在空氣中的傳播速度反推因第i個(gè)入網(wǎng)產(chǎn)品所處位置導(dǎo)致的時(shí)間差進(jìn)行時(shí)間戳補(bǔ)償與數(shù)據(jù)對(duì)齊。
本發(fā)明能夠根據(jù)設(shè)備安裝位置信息來(lái)優(yōu)化語(yǔ)音識(shí)別算法,使智能家居系統(tǒng)在其應(yīng)用場(chǎng)合中,實(shí)現(xiàn)“隨說(shuō)隨控”,有效改善用戶體驗(yàn)。
附圖說(shuō)明
圖1為本發(fā)明的硬件模塊圖;
圖2為入網(wǎng)產(chǎn)品運(yùn)行流程圖;
圖3為主控設(shè)備運(yùn)行流程圖;
圖4為位置差計(jì)算示意圖;
圖5A為設(shè)備一于0:00:00.00開(kāi)始采集的數(shù)據(jù);
圖5B為設(shè)備二于0:00:00.00開(kāi)始采集的數(shù)據(jù);
圖5C為擬合后的信號(hào)示意圖;
圖5D為信號(hào)去噪示意圖。
具體實(shí)施方式
為使本發(fā)明更明顯易懂,茲以優(yōu)選實(shí)施例,并配合附圖作詳細(xì)說(shuō)明如下。
本發(fā)明提供的一種智能家居語(yǔ)音控制識(shí)別系統(tǒng)的最小組成構(gòu)件要素包括至少一個(gè)主控裝置和至少一個(gè)具有采集音頻功能并帶有其他智能家居類產(chǎn)品采集、執(zhí)行功能的入網(wǎng)產(chǎn)品。
主控裝置及入網(wǎng)產(chǎn)品的硬件構(gòu)成均可以參考圖1。對(duì)于入網(wǎng)產(chǎn)品而言,其包含拾音器或者麥克風(fēng)、聲音去噪壓縮模塊、無(wú)線傳輸模塊、處理運(yùn)算模塊、電源處理單元、控制或采集分析類單元等。而主控裝置的硬件構(gòu)成與入網(wǎng)產(chǎn)品大致相同,但為了提高處理性能,需要將處理運(yùn)算模塊更換為中央處理器,并且,主控裝置又由于其需要與用戶有更多的交互功能,因此,需要增加適當(dāng)?shù)娜藱C(jī)交互單元。
上述各個(gè)硬件模塊的功能介紹如下:
電源處理單元,完成將安裝位置的交流電轉(zhuǎn)化為內(nèi)部包含并不僅限于拾音器或麥克風(fēng)、聲音去噪壓縮模塊、無(wú)線傳輸模塊、中央處理器或處理運(yùn)算模塊、控制或采集分析類單元等在內(nèi)的模塊供電。
拾音器或麥克風(fēng),采集音頻數(shù)據(jù)。
聲音去噪壓縮模塊,對(duì)信號(hào)進(jìn)行基礎(chǔ)去噪處理并壓縮數(shù)據(jù)。
無(wú)線傳輸模塊,包括并不僅限于WIFI、藍(lán)牙、Zigbee等無(wú)線傳輸方式,用于主控裝置與入網(wǎng)產(chǎn)品間及入網(wǎng)產(chǎn)品之間的位置定位與數(shù)據(jù)收發(fā)。
處理運(yùn)算模塊,用于采集自身聲音去噪壓縮模塊輸出的語(yǔ)音信息,收集當(dāng)前入網(wǎng)產(chǎn)品的入網(wǎng)設(shè)備數(shù)據(jù),對(duì)語(yǔ)音信息按照預(yù)估計(jì)方法進(jìn)行空間位置補(bǔ)償,加快聲音識(shí)別效率并有效去噪,通過(guò)無(wú)線傳輸模塊將數(shù)據(jù)上傳至主控裝置,并通過(guò)無(wú)線傳輸模塊接收主控裝置反饋的控制指令。
中央處理器,用于獲取主控裝置的聲音去噪壓縮模塊的語(yǔ)音信息及各入網(wǎng)產(chǎn)品傳輸?shù)恼Z(yǔ)音數(shù)據(jù),預(yù)估發(fā)出語(yǔ)音控制指令的用戶的位置信息,根據(jù)位置信息對(duì)獲得的語(yǔ)音信號(hào)進(jìn)行多設(shè)備音頻數(shù)據(jù)對(duì)齊,獲取語(yǔ)音指令。
控制或采集分析類單元,包含并不僅包含控制類單元(設(shè)備開(kāi)關(guān)邏輯控制、設(shè)備調(diào)光等)、空間采集分析類單元(人體位置感應(yīng)、空間溫濕度環(huán)境記錄等)。
結(jié)合圖2,入網(wǎng)產(chǎn)品的運(yùn)行流程包括以下步驟:
步驟1、電源上電后,入網(wǎng)產(chǎn)品開(kāi)始工作;
步驟2、初始化,各入網(wǎng)產(chǎn)品與一個(gè)主控裝置通過(guò)無(wú)線傳輸模塊進(jìn)行互相組網(wǎng)通信,在組網(wǎng)獲取到一個(gè)主控裝置后上傳自己與附近設(shè)備間的信號(hào)衰減信息,分析自己與附近產(chǎn)品的拓?fù)潢P(guān)系,并始終允許組網(wǎng)重構(gòu)拓?fù)鋱D,主控裝置根據(jù)信號(hào)衰減信息得到各個(gè)入網(wǎng)產(chǎn)品的相對(duì)位置信息,從而形成包含距離信息的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu);
入網(wǎng)產(chǎn)品的空間采集類設(shè)備采集數(shù)據(jù),控制類設(shè)備按照默認(rèn)控制策略對(duì)相應(yīng)的家居設(shè)備執(zhí)行操作;
步驟3、若用戶在任意位置發(fā)出包含控制指令的語(yǔ)音信號(hào),入網(wǎng)產(chǎn)品的拾音器或麥克風(fēng)捕捉到該語(yǔ)音信號(hào)后,通過(guò)聲音去噪壓縮模塊對(duì)語(yǔ)音信號(hào)進(jìn)行初階(基礎(chǔ))去噪、壓縮,保留語(yǔ)音信號(hào)中的人聲段數(shù)據(jù)流形成語(yǔ)音信息,由當(dāng)前入網(wǎng)產(chǎn)品的處理運(yùn)算模塊對(duì)語(yǔ)音信息加上時(shí)間戳后形成語(yǔ)音數(shù)據(jù),通過(guò)無(wú)線傳輸模塊發(fā)送給主控裝置;
步驟4、接收主控器下發(fā)的控制指令,根據(jù)控制指令控制相應(yīng)的家居設(shè)備后,等待下一個(gè)控制循環(huán)。
結(jié)合圖3,主控裝置的運(yùn)行流程包括以下步驟:
步驟1、電源上電后,主控裝置開(kāi)始工作;
步驟2、主控裝置的無(wú)線傳輸模塊開(kāi)始工作,始終收集入網(wǎng)設(shè)備位置數(shù)據(jù),確認(rèn)網(wǎng)絡(luò)拓?fù)潢P(guān)系;
步驟3、若主控裝置處于指令錄入階段,則用戶通過(guò)人機(jī)交互模塊在主控裝置中錄入指定的控制指令語(yǔ)音信息;
若主控裝置處于指令識(shí)別階段,若主控裝置的拾音器或麥克風(fēng)捕捉到用戶發(fā)出的語(yǔ)音信號(hào),則通過(guò)聲音去噪壓縮模塊對(duì)語(yǔ)音信號(hào)進(jìn)行初階(基礎(chǔ))去噪、壓縮,保留語(yǔ)音信號(hào)中的人聲段數(shù)據(jù)流形成語(yǔ)音信息,由主控裝置的中央處理器對(duì)語(yǔ)音信息加上時(shí)間戳后形成語(yǔ)音數(shù)據(jù),中央處理器同時(shí)匯總來(lái)自各入網(wǎng)產(chǎn)品的語(yǔ)音數(shù)據(jù),中央處理器將語(yǔ)音數(shù)據(jù)匯總后,根據(jù)時(shí)間戳顯示的時(shí)間先后順序進(jìn)行排序,選取位于最前的3~5個(gè)語(yǔ)音數(shù)據(jù);
步驟4根據(jù)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中各個(gè)入網(wǎng)產(chǎn)品的相對(duì)位置信息以及各語(yǔ)音數(shù)據(jù)中包含的音量信息預(yù)估發(fā)出語(yǔ)音信號(hào)的用戶的位置,得到發(fā)聲人位置信息,再根據(jù)發(fā)聲人位置信息對(duì)選取的語(yǔ)音數(shù)據(jù)進(jìn)行多設(shè)備音頻數(shù)據(jù)對(duì)齊后,進(jìn)行擬合,對(duì)擬合后的信號(hào)進(jìn)行去噪補(bǔ)償,從而剔除回聲,得到有效指令段;
步驟5、主控裝置的中央處理器將有效指令段與預(yù)先錄入的控制指令語(yǔ)音信息進(jìn)行聲紋比對(duì),從而獲得控制指令,根據(jù)控制指令對(duì)應(yīng)的家居設(shè)備,中央處理器或?qū)⒖刂浦噶畎l(fā)送給當(dāng)前主控裝置的控制/采集分析單元,由控制/采集分析單元根據(jù)控制指令控制對(duì)應(yīng)的家居設(shè)備,或?qū)⒖刂浦噶钔ㄟ^(guò)無(wú)線傳輸模塊發(fā)送給對(duì)應(yīng)的入網(wǎng)產(chǎn)品,由入網(wǎng)產(chǎn)品的控制/采集分析單元根據(jù)控制指令控制對(duì)應(yīng)的家居設(shè)備。
結(jié)合圖4,上述步驟中,獲取發(fā)聲人位置信息的原理為:
假設(shè)傳輸空間較為理想,簡(jiǎn)化聲音傳輸都在一個(gè)樓層內(nèi)各個(gè)不同居室內(nèi)接收。不考慮房間內(nèi)間隔產(chǎn)生的衰減,信號(hào)的直線傳播的衰減距離與設(shè)備安裝位置的關(guān)系即可作為定位數(shù)據(jù)參考值。
根據(jù)已知的物理關(guān)系通信距離與發(fā)射功率、接收靈敏度和工作頻率有關(guān),則根據(jù)式(1)可以計(jì)算得到當(dāng)前入網(wǎng)產(chǎn)品與發(fā)出語(yǔ)音信號(hào)的用戶之間的位置差d:
Lfs=32.44+201gd+201gf (1)
式(1)中,Lfs為語(yǔ)音信號(hào)在空氣中的傳輸損耗,f為當(dāng)前入網(wǎng)產(chǎn)品接收到的語(yǔ)音信號(hào)的頻率。
由于在組網(wǎng)時(shí)已經(jīng)獲得了各個(gè)入網(wǎng)產(chǎn)品的相對(duì)位置信息,結(jié)合位置差d,就可以得到發(fā)聲人位置信息。其中d的值又可與聲音在空氣中的傳播速度反推因各個(gè)設(shè)備所處位置采樣時(shí)的時(shí)間差,進(jìn)行時(shí)間戳補(bǔ)償與數(shù)據(jù)對(duì)齊。
本發(fā)明中,根據(jù)發(fā)聲人位置信息進(jìn)行擬合去噪的原理可以參考圖5A至圖5D,假設(shè)得到設(shè)備一的語(yǔ)音數(shù)據(jù)如圖5A所示,得到設(shè)備二的語(yǔ)音數(shù)據(jù)如圖5B所示,則根據(jù)發(fā)聲人位置信息將圖5A的數(shù)據(jù)與圖5B的數(shù)據(jù)對(duì)齊,對(duì)齊后,將兩個(gè)數(shù)據(jù)進(jìn)行擬合,如圖5D所示,左框?yàn)橛铱虻脑悸曉?,?dāng)入網(wǎng)產(chǎn)品足夠多每一次采樣都會(huì)對(duì)后一次的可能回聲數(shù)據(jù)進(jìn)行加權(quán),直至最后隱沒(méi)在背景中,即設(shè)備越多回聲去噪越明顯,利用上述原理對(duì)擬合后的信號(hào)進(jìn)行去噪補(bǔ)償,從而剔除回聲,得到有效指令段。
本發(fā)明的主控裝置或入網(wǎng)設(shè)備自啟動(dòng)組網(wǎng)后,采集音頻數(shù)據(jù)并最終分析數(shù)據(jù)下發(fā)控制或數(shù)據(jù)采集指令的一個(gè)循環(huán)作為最小的系統(tǒng)運(yùn)行狀態(tài)實(shí)施案例。該案例可擴(kuò)展至辦公場(chǎng)所及地鐵通道等大空間的室內(nèi)控制環(huán)境,達(dá)到受控用戶對(duì)入網(wǎng)設(shè)備的遠(yuǎn)程控制。