一種語(yǔ)音交互智能家居系統(tǒng)及語(yǔ)音交互方法
【專(zhuān)利摘要】本發(fā)明涉及智能家居【技術(shù)領(lǐng)域】,具體是一種能實(shí)現(xiàn)語(yǔ)音交互功能的智能家居系統(tǒng)及語(yǔ)音交互方法,包括硬件端和服務(wù)器端,所述的硬件端由網(wǎng)關(guān)、ZigBee路由器和ZigBee終端節(jié)點(diǎn)組成,若干電器設(shè)備或傳感器都會(huì)接到ZigBee的終端節(jié)點(diǎn)上,每個(gè)ZigBee終端節(jié)點(diǎn)上都有Mic語(yǔ)音輸入模塊,用于采集用戶的語(yǔ)音模擬信息,并將其轉(zhuǎn)換成數(shù)字信息,通過(guò)ZigBee路由器傳輸給ZigBee協(xié)調(diào)器,所述的網(wǎng)關(guān)由ZigBee協(xié)調(diào)器、Wifi模塊、語(yǔ)音處理模塊和控制命令表模塊構(gòu)成。本發(fā)明同現(xiàn)有技術(shù)相比,其優(yōu)點(diǎn)在于:可在增加硬件成本很少的前提下,顯著提高語(yǔ)音識(shí)別的運(yùn)算速度;具有自我學(xué)習(xí)的功能,節(jié)省前期各種語(yǔ)音使用環(huán)境的預(yù)設(shè)值的編程工作量;采用語(yǔ)音識(shí)別模塊頻譜分析方法,提高語(yǔ)音識(shí)別的正確率。
【專(zhuān)利說(shuō)明】一種語(yǔ)音交互智能家居系統(tǒng)及語(yǔ)音交互方法
[【技術(shù)領(lǐng)域】]
[0001]本發(fā)明涉及智能家居【技術(shù)領(lǐng)域】,具體是一種能實(shí)現(xiàn)語(yǔ)音交互功能的智能家居系統(tǒng)及語(yǔ)音交互方法。
[【背景技術(shù)】]
[0002]隨著科技的發(fā)展,語(yǔ)音交互模塊被越來(lái)越多的應(yīng)用到智能家居系統(tǒng)里面??紤]到智能家居的應(yīng)用性、便捷性和小型化需求,目前應(yīng)用于智能家居的語(yǔ)音交互系統(tǒng)基本都是使用嵌入式系統(tǒng),這些嵌入式系統(tǒng)大都采用專(zhuān)門(mén)的語(yǔ)音識(shí)別芯片,如MCU,DSP和語(yǔ)音識(shí)別專(zhuān)用芯片,其存儲(chǔ)容量和運(yùn)算速度都有一定的限制。在目前市場(chǎng)上的語(yǔ)音識(shí)別模塊中,基本都使用的非特定人語(yǔ)音識(shí)別模塊,但是這個(gè)模塊里面只能存儲(chǔ)50個(gè)詞條,存儲(chǔ)容量有限,并且每個(gè)詞條都是前期根據(jù)應(yīng)用場(chǎng)景預(yù)先輸入進(jìn)去的,比如“將臥室的燈打開(kāi)”這句話可以是一個(gè)詞條,如果用戶說(shuō)了一句“將臥室的燈”,這個(gè)語(yǔ)音識(shí)別模塊是識(shí)別不了的。除此之夕卜,這種語(yǔ)音識(shí)別模塊也不能識(shí)別一些諸如嗯、啊的語(yǔ)氣詞。
[0003]同時(shí),目前業(yè)界的智能家居語(yǔ)音交互系統(tǒng)都只能實(shí)現(xiàn)簡(jiǎn)單的語(yǔ)音指令操作,這些語(yǔ)音指令,也都是前期預(yù)設(shè)在嵌入式系統(tǒng)中,如果用戶所說(shuō)的語(yǔ)音不是系統(tǒng)預(yù)設(shè)的,系統(tǒng)就不能識(shí)別。
[
【發(fā)明內(nèi)容】
]
[0004]本發(fā)明為了解決上述的嵌入式語(yǔ)音系統(tǒng)存儲(chǔ)容量和運(yùn)算速度有限的問(wèn)題,提供一種不僅能根據(jù)系統(tǒng)預(yù)設(shè)的語(yǔ)音指令進(jìn)行操作以外,還可以讓系統(tǒng)根據(jù)用戶自己的語(yǔ)言使用習(xí)慣,學(xué)習(xí)用戶的語(yǔ)言,從而提高語(yǔ)音識(shí)別的正確性的語(yǔ)音交互智能家居系統(tǒng)及語(yǔ)音交互方法。
[0005]為了實(shí)現(xiàn)上述目的,提供一種語(yǔ)音交互智能家居系統(tǒng),包括硬件端和服務(wù)器端,所述的硬件端由網(wǎng)關(guān)、ZigBee路由器和ZigBee終端節(jié)點(diǎn)組成,若干電器設(shè)備或傳感器都會(huì)接到ZigBee的終端節(jié)點(diǎn)上,每個(gè)ZigBee終端節(jié)點(diǎn)上都有Mic語(yǔ)音輸入模塊,用于采集用戶的語(yǔ)音模擬信息,并將其轉(zhuǎn)換成數(shù)字信息,通過(guò)ZigBee路由器傳輸給ZigBee協(xié)調(diào)器,所述的網(wǎng)關(guān)由ZigBee協(xié)調(diào)器、Wifi模塊、語(yǔ)音處理模塊和控制命令表模塊構(gòu)成,ZigBee協(xié)調(diào)器在收到終端節(jié)點(diǎn)發(fā)來(lái)的語(yǔ)音信號(hào)之后,將收到的語(yǔ)音信號(hào)輸出給語(yǔ)音處理模塊進(jìn)行語(yǔ)音識(shí)另IJ,語(yǔ)音識(shí)別工作完成后,將識(shí)別的字符輸出給控制命令表模塊中進(jìn)行查詢,找到語(yǔ)音信息想要操控的設(shè)備指令,然后將其輸出給ZigBee協(xié)調(diào)器,協(xié)調(diào)器再將控制指令下發(fā)給終端節(jié)點(diǎn)。
[0006]所述的語(yǔ)音處理模塊在語(yǔ)音識(shí)別過(guò)程中,遇到了語(yǔ)音處理模塊中沒(méi)有存儲(chǔ)的生詞的話,語(yǔ)音處理模塊會(huì)將沒(méi)有識(shí)別的語(yǔ)音通過(guò)Wif i模塊連接到以太網(wǎng)中,將其傳輸給WEB服務(wù)器,WEB服務(wù)器內(nèi)部設(shè)有同樣的語(yǔ)音處理模塊,服務(wù)器端存儲(chǔ)的詞庫(kù)量比硬件端的詞庫(kù)量大,且不受嵌入式便攜設(shè)備的存儲(chǔ)容量的限制,就可以將沒(méi)有識(shí)別出的生詞識(shí)別處理,然后再通過(guò)以太網(wǎng),將其生詞的詞條傳輸給用戶家中網(wǎng)關(guān)上的語(yǔ)音處理模塊,替換網(wǎng)關(guān)中從來(lái)沒(méi)用過(guò)的詞語(yǔ)。
[0007]所述的語(yǔ)音識(shí)別模塊需要增加額外的詞條庫(kù),并采用輪詢調(diào)用的方式去詞條庫(kù)提取詞條,按順序每次提取50個(gè)詞條存儲(chǔ)到語(yǔ)音識(shí)別模塊中,同時(shí)為了增加語(yǔ)音識(shí)別的靈活性,將每個(gè)詞條都改成單個(gè)字、兩個(gè)、三個(gè)或者四個(gè)連詞;為了確保語(yǔ)音里面的所有字或詞語(yǔ)是否都已識(shí)別完全,沒(méi)有遺漏,所述的語(yǔ)音識(shí)別模塊采用頻譜分析方法識(shí)別語(yǔ)音識(shí)別模塊中字的個(gè)數(shù)。
[0008]所述的語(yǔ)音識(shí)別模塊頻譜分析方法如下:漢字是有聲母和韻母的,通過(guò)聲母頻譜序列庫(kù)與語(yǔ)音的頻譜分析圖比對(duì),這樣就可以得到語(yǔ)音的漢字個(gè)數(shù);漢字的聲母一共有23個(gè),它們是b pmfdtnlgkhjqxzhchshrzcsyw,先將所有聲母的發(fā)音采集,經(jīng)A/D模數(shù)轉(zhuǎn)換后,通過(guò)傅里葉頻譜分析,得到這23個(gè)聲母的頻譜圖,將其特征值存入聲母頻譜序列庫(kù),之后在采集用戶的聲音信號(hào)時(shí),也是先經(jīng)過(guò)A/D模數(shù)轉(zhuǎn)換模塊將其轉(zhuǎn)換成數(shù)字信號(hào),然后進(jìn)行傅里葉頻譜分析,根據(jù)頻譜分析得到的特征值,與之前的聲母頻譜序列庫(kù)的頻譜特征值進(jìn)行比對(duì)分析,提取出一句話中的所有聲母,從而得到語(yǔ)音的漢字個(gè)數(shù),同樣的,對(duì)于一些常用的沒(méi)有聲母的漢字,就將其整個(gè)字的整帶頻譜存儲(chǔ)到零聲母頻譜序列庫(kù)中;對(duì)于漢字中的語(yǔ)氣詞,將其整帶頻譜存儲(chǔ)在語(yǔ)氣詞頻譜序列庫(kù)中,與頻譜分析得到的頻譜進(jìn)行比對(duì),從而完成語(yǔ)氣詞的識(shí)別。
[0009]所述的語(yǔ)音交互智能家居系統(tǒng)會(huì)先將用戶的語(yǔ)音信號(hào)進(jìn)行音頻信號(hào)采集,A/D模塊轉(zhuǎn)換成數(shù)字信號(hào),之后將其存儲(chǔ)到RAM存儲(chǔ)器中;RAM存儲(chǔ)器會(huì)首先將當(dāng)前的語(yǔ)音信號(hào)進(jìn)行頻譜分析,然后結(jié)合聲母頻譜序列庫(kù)、零聲母頻譜序列庫(kù)和語(yǔ)氣詞頻譜序列庫(kù)對(duì)其聲母、或者整個(gè)字或者詞進(jìn)行識(shí)別校對(duì),校對(duì)后,既可以識(shí)別出語(yǔ)音中的零聲母字和語(yǔ)氣詞,還能識(shí)別出語(yǔ)音的累計(jì)計(jì)數(shù),從而最終得出音頻信號(hào)的待識(shí)別序列數(shù);由于每個(gè)中文漢子都有其聲母,所以這里采用聲母識(shí)別方式,去識(shí)別一句話的中文字?jǐn)?shù);之后RAM存儲(chǔ)器中的信息通過(guò)16位以上的高速D/A轉(zhuǎn)化模塊,將數(shù)字信號(hào)轉(zhuǎn)換成模擬信號(hào),輸入到語(yǔ)音識(shí)別模塊,語(yǔ)音識(shí)別模塊會(huì)按順序從詞條庫(kù)提取出若干詞條與模擬信號(hào)相比對(duì),進(jìn)行真值查詢,如果從此次詞條庫(kù)中匹配出正確的字符,就會(huì)輸出識(shí)別的字符,之前頻譜分析后已經(jīng)識(shí)別出的零聲母和語(yǔ)氣詞也會(huì)和當(dāng)前識(shí)別出的字符一起進(jìn)入到下一環(huán)節(jié),與之前通過(guò)頻譜分析得出的待識(shí)別序列數(shù)的個(gè)數(shù)相比較,如果相同,則代表識(shí)別工作已經(jīng)完成,那么之后就可以將文字字符碼輸出,進(jìn)入到基本語(yǔ)法分析器進(jìn)行語(yǔ)法分析,從而得到文意表達(dá)知識(shí)信息,最終得出用戶的使用意圖;如果在非特定人語(yǔ)音識(shí)別模塊處真值查詢沒(méi)有識(shí)別到字符,那么就會(huì)重新從RAM存儲(chǔ)器中讀取數(shù)字信號(hào),將其進(jìn)行D/A轉(zhuǎn)化后,再次輸入到語(yǔ)音識(shí)別模塊,然后再?gòu)脑~條庫(kù)中提取下一組一定數(shù)量的詞條與其比對(duì)匹配,然后反復(fù)這樣的流程,直到將音頻信號(hào)中的所有字符都識(shí)別出來(lái);如果整個(gè)詞庫(kù)都比對(duì)過(guò)后,也沒(méi)有完全識(shí)別用戶的語(yǔ)音,那么將其傳輸?shù)椒?wù)器端進(jìn)行識(shí)別,在整個(gè)語(yǔ)音信號(hào)的字或者詞全部識(shí)別出來(lái)之后,整個(gè)文字字符是亂序的,這個(gè)時(shí)候,需要結(jié)合之前頻譜識(shí)別校對(duì)的結(jié)果進(jìn)行文字字符的排序,然后輸出正確順序的文字字符。
[0010]一種采用語(yǔ)音交互智能家居系統(tǒng)的語(yǔ)音交互方法,語(yǔ)音識(shí)別模塊采用非特定人語(yǔ)音識(shí)別模塊,并在該語(yǔ)音模塊中額外添加Flash芯片,存儲(chǔ)詞條庫(kù),在語(yǔ)音識(shí)別的時(shí)候,順序從詞條庫(kù)中提取一定數(shù)量的詞條和輸入的語(yǔ)音比對(duì),直到比對(duì)出結(jié)果;系統(tǒng)在與用戶交互過(guò)程中,會(huì)將常用的字詞,調(diào)整順序,排到詞條庫(kù)的最前面,這樣就可以漸漸地加快語(yǔ)音識(shí)別的運(yùn)算速度,同時(shí),系統(tǒng)在與用戶語(yǔ)音交互的過(guò)程中,遇到了一些詞條庫(kù)沒(méi)有存儲(chǔ)的詞匯的話,系統(tǒng)會(huì)將這句話的音頻記錄下來(lái),在系統(tǒng)空閑的時(shí)候,通過(guò)網(wǎng)絡(luò),將生詞的音頻資源傳輸?shù)骄W(wǎng)絡(luò)服務(wù)器端,網(wǎng)絡(luò)服務(wù)器會(huì)將這些生詞的音頻資源與服務(wù)器端比較全面的詞條庫(kù)進(jìn)行比對(duì)匹配,從而得出該音頻所對(duì)應(yīng)的生詞的詞條,之后再將這個(gè)詞條通過(guò)網(wǎng)絡(luò)傳輸?shù)綄?duì)應(yīng)家庭的語(yǔ)音模塊的Flash詞條庫(kù)中,用于后續(xù)語(yǔ)音交互使用。
[0011]本發(fā)明同現(xiàn)有技術(shù)相比,其優(yōu)點(diǎn)在于:可在增加硬件成本很少的前提下,顯著提高語(yǔ)音識(shí)別的運(yùn)算速度;具有自我學(xué)習(xí)的功能,可以節(jié)省前期各種語(yǔ)音使用環(huán)境的預(yù)設(shè)值的編程工作量,從而節(jié)省人力,提升用戶體驗(yàn);采用語(yǔ)音識(shí)別模塊頻譜分析方法,對(duì)聲母、或者整個(gè)字或者詞進(jìn)行識(shí)別校對(duì),提高語(yǔ)音識(shí)別的正確率。
[【專(zhuān)利附圖】
【附圖說(shuō)明】]
[0012]圖1為系統(tǒng)整體的架構(gòu)圖;
[0013]圖2為語(yǔ)音模塊語(yǔ)音信號(hào)識(shí)別流程圖;
[0014]圖3為人工智能學(xué)習(xí)流程圖。
[【具體實(shí)施方式】]
[0015]下面結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步說(shuō)明,這種裝置的結(jié)構(gòu)和原理對(duì)本專(zhuān)業(yè)的人來(lái)說(shuō)是非常清楚的。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0016]實(shí)施例1
[0017]如圖1所示,整個(gè)系統(tǒng)分成兩部分,一部分是用戶家里的硬件端,另一部分是服務(wù)器端。關(guān)于硬件端,主要由網(wǎng)關(guān)、ZigBee路由器和ZigBee終端節(jié)點(diǎn)組成:家里的所有電器設(shè)備、傳感器等都會(huì)接到ZigBee的終端節(jié)點(diǎn)上,每個(gè)ZigBee終端節(jié)點(diǎn)上都有Mic語(yǔ)音輸入模塊,可以采集用戶的語(yǔ)音模擬信息,并將其轉(zhuǎn)換成數(shù)字信息,通過(guò)ZigBee路由器傳輸給ZigBee協(xié)調(diào)器;網(wǎng)關(guān)由ZigBee協(xié)調(diào)器、Wifi模塊、語(yǔ)音處理模塊和控制命令表這個(gè)幾個(gè)核心模塊構(gòu)成。ZigBee協(xié)調(diào)器在收到終端節(jié)點(diǎn)發(fā)來(lái)的語(yǔ)音信號(hào)之后,需要將收到的語(yǔ)音信號(hào)輸出給語(yǔ)音處理模塊進(jìn)行語(yǔ)音識(shí)別。語(yǔ)音識(shí)別工作完成后,會(huì)將識(shí)別的字符輸出給控制命令表中進(jìn)行查詢,找到語(yǔ)音信息想要操控的設(shè)備指令,然后將其輸出給ZigBee協(xié)調(diào)器,協(xié)調(diào)器將控制指令下發(fā)給終端節(jié)點(diǎn),從而完成相應(yīng)的操作。如果語(yǔ)音處理模塊在語(yǔ)音識(shí)別過(guò)程中,遇到了語(yǔ)音處理模塊中沒(méi)有存儲(chǔ)的生詞的話,語(yǔ)音處理模塊會(huì)將沒(méi)有識(shí)別的語(yǔ)音通過(guò)Wifi模塊連接到以太網(wǎng)中,將其傳輸給WEB服務(wù)器,WEB服務(wù)器內(nèi)部有同樣的語(yǔ)音處理模塊,只不過(guò)服務(wù)器端存儲(chǔ)的詞庫(kù)量非常的大,不受嵌入式便攜設(shè)備的存儲(chǔ)容量的限制,就可以將沒(méi)有識(shí)別出的生詞識(shí)別處理,然后再通過(guò)以太網(wǎng),將其生詞的詞條傳輸給用戶家中網(wǎng)關(guān)上的語(yǔ)音處理模塊,替換網(wǎng)關(guān)中從來(lái)沒(méi)用過(guò)的詞語(yǔ)。
[0018]因?yàn)榇蠖鄶?shù)的漢字都是有聲母和韻母的,這里可以通過(guò)聲母頻譜序列庫(kù)與語(yǔ)音的頻譜分析圖比對(duì),這樣就可以得到語(yǔ)音的漢字個(gè)數(shù)。對(duì)于一些常用的沒(méi)有聲母的漢字,就將其整個(gè)字的整帶頻譜存儲(chǔ)到零聲母頻譜序列庫(kù)中。這樣在頻譜分析比對(duì)的時(shí)候,就可以比對(duì)出漢字的個(gè)數(shù)。另外,對(duì)于一些語(yǔ)氣詞,嗯,啊之類(lèi)的,市場(chǎng)上的非特定人語(yǔ)音識(shí)別模塊也是不能識(shí)別的,本發(fā)明的系統(tǒng)也會(huì)將其整帶頻譜存儲(chǔ)在語(yǔ)氣詞頻譜序列庫(kù)中,與頻譜分析得到的頻譜進(jìn)行比對(duì),從而完成語(yǔ)氣詞的識(shí)別。
[0019]如圖2所示,為語(yǔ)音模塊的語(yǔ)音信號(hào)識(shí)別流程圖。首先智能家居語(yǔ)音交互模塊會(huì)先將用戶的語(yǔ)音信號(hào)進(jìn)行音頻信號(hào)采集,A/D模塊轉(zhuǎn)換成數(shù)字信號(hào),之后將其存儲(chǔ)到RAM存儲(chǔ)器中。RAM存儲(chǔ)器會(huì)首先將當(dāng)前的語(yǔ)音信號(hào)進(jìn)行頻譜分析,然后結(jié)合聲母頻譜序列庫(kù)、零聲母頻譜序列庫(kù)和語(yǔ)氣詞頻譜序列庫(kù)對(duì)其聲母、或者整個(gè)字或者詞進(jìn)行識(shí)別校對(duì),校對(duì)后,既可以識(shí)別出語(yǔ)音中的零聲母字和語(yǔ)氣詞,還能識(shí)別出語(yǔ)音的累計(jì)計(jì)數(shù),從而最終得出音頻信號(hào)的待識(shí)別序列數(shù)。由于每個(gè)中文漢子都有其聲母,所以這里采用聲母識(shí)別方式,去識(shí)別一句話的中文字?jǐn)?shù),之后RAM存儲(chǔ)器中的信息通過(guò)16位以上的高速D/A轉(zhuǎn)化模塊,將數(shù)字信號(hào)轉(zhuǎn)換成模擬信號(hào),輸入到非特定人語(yǔ)音識(shí)別模塊,非特定人語(yǔ)音識(shí)別模塊會(huì)按順序從詞條庫(kù)提取出一定數(shù)量的詞條與模擬信號(hào)相比對(duì),進(jìn)行真值查詢,如果從此次詞條庫(kù)中匹配出正確的字符,就會(huì)輸出識(shí)別的字符,之前頻譜分析后已經(jīng)識(shí)別出的零聲母和語(yǔ)氣詞也會(huì)和當(dāng)前識(shí)別出的字符一起進(jìn)入到下一環(huán)節(jié),與之前通過(guò)頻譜分析得出的待識(shí)別序列數(shù)的個(gè)數(shù)相比較,如果相同,則代表識(shí)別工作已經(jīng)完成,那么之后就可以將文字字符碼輸出,進(jìn)入到基本語(yǔ)法分析器進(jìn)行語(yǔ)法分析,從而得到文意表達(dá)知識(shí)信息,最終得出用戶的使用意圖。如果在非特定人語(yǔ)音識(shí)別模塊處真值查詢沒(méi)有識(shí)別到字符,那么就會(huì)重新從RAM存儲(chǔ)器中讀取數(shù)字信號(hào),將其進(jìn)行D/A轉(zhuǎn)化后,再次輸入到非特定人語(yǔ)音識(shí)別模塊,然后再?gòu)脑~條庫(kù)中提取下一組一定數(shù)量的詞條與其比對(duì)匹配,然后反復(fù)這樣的流程,直到將音頻信號(hào)中的所有字符都識(shí)別出來(lái)。如果整個(gè)詞庫(kù)都比對(duì)過(guò)后,也沒(méi)有完全識(shí)別用戶的語(yǔ)音,參照?qǐng)D1,將其傳輸?shù)椒?wù)器端進(jìn)行識(shí)別。在整個(gè)語(yǔ)音信號(hào)的字或者詞全部識(shí)別出來(lái)之后,整個(gè)文字字符是亂序的,這個(gè)時(shí)候,需要結(jié)合之前頻譜識(shí)別校對(duì)的結(jié)果進(jìn)行文字字符的排序,然后輸出正確順序的文字字符。
[0020]如圖3所示,為人工智能學(xué)習(xí)流程圖。下述的流程主要目的是完成系統(tǒng)自主學(xué)習(xí)用戶的語(yǔ)音,學(xué)習(xí)完成后,系統(tǒng)以后再聽(tīng)到用戶的相同的語(yǔ)音,就會(huì)自己去執(zhí)行相應(yīng)的操作指令。比如,用戶走進(jìn)一間房間說(shuō)“房間好悶,打開(kāi)窗戶”,這個(gè)時(shí)候,系統(tǒng)首先將語(yǔ)音信息采集后,進(jìn)行語(yǔ)音處理,識(shí)別出正確順序的文字字符之后,系統(tǒng)需要采用人工智能原理,將其表達(dá)的含義分析處理,并做判斷,初步確認(rèn)兩句話,是否有關(guān)聯(lián)的可能性,如果初步判定有關(guān)聯(lián)性,需與用戶做確認(rèn),得到確認(rèn)信息后,后續(xù)用戶只需要說(shuō)“房間好悶”,系統(tǒng)就會(huì)自動(dòng)將窗戶打開(kāi),而不需要用戶說(shuō)明。具體實(shí)現(xiàn)流程如下:當(dāng)語(yǔ)音信息經(jīng)過(guò)語(yǔ)音處理模塊輸出文字字符之后,會(huì)輸入到謂詞邏輯分析器,經(jīng)過(guò)謂詞分析后,可以獲得文意表達(dá)知識(shí)信息,從而得到人的使用意圖,首先部分意圖指令會(huì)進(jìn)入執(zhí)行模塊,進(jìn)行指令執(zhí)行,同時(shí),這個(gè)時(shí)候系統(tǒng)需要進(jìn)行判斷,判斷剛才識(shí)別出的人的使用意圖之間,是否有關(guān)聯(lián)的可能性,如果判斷沒(méi)有關(guān)聯(lián)性,則丟棄,如果系統(tǒng)判斷覺(jué)得這個(gè)意圖有關(guān)聯(lián)的可能性,那么就需要跟用戶進(jìn)行語(yǔ)音交互,即詢問(wèn)用戶,是否后續(xù)再說(shuō)“房間很悶”,就執(zhí)行“打開(kāi)窗戶”?用戶會(huì)回答系統(tǒng),如果回答否定,那么就丟棄,說(shuō)明用戶剛才說(shuō)的話之間沒(méi)有關(guān)聯(lián)性。如果用戶回答肯定,那么系統(tǒng)將會(huì)將剛才識(shí)別的意圖建立意義的關(guān)聯(lián),之后再到系統(tǒng)的控制指令表中進(jìn)行檢索,從而建立指令關(guān)聯(lián),這樣就實(shí)現(xiàn)了系統(tǒng)自主學(xué)習(xí)的功能。
【權(quán)利要求】
1.一種語(yǔ)音交互智能家居系統(tǒng),包括硬件端和服務(wù)器端,其特征在于所述的硬件端由網(wǎng)關(guān)、ZigBee路由器和ZigBee終端節(jié)點(diǎn)組成,若干電器設(shè)備或傳感器都會(huì)接到ZigBee的終端節(jié)點(diǎn)上,每個(gè)ZigBee終端節(jié)點(diǎn)上都有Mic語(yǔ)音輸入模塊,用于采集用戶的語(yǔ)音模擬信息,并將其轉(zhuǎn)換成數(shù)字信息,通過(guò)ZigBee路由器傳輸給ZigBee協(xié)調(diào)器,所述的網(wǎng)關(guān)由ZigBee協(xié)調(diào)器、Wifi模塊、語(yǔ)音處理模塊和控制命令表模塊構(gòu)成,ZigBee協(xié)調(diào)器在收到終端節(jié)點(diǎn)發(fā)來(lái)的語(yǔ)音信號(hào)之后,將收到的語(yǔ)音信號(hào)輸出給語(yǔ)音處理模塊進(jìn)行語(yǔ)音識(shí)別,語(yǔ)音識(shí)別工作完成后,將識(shí)別的字符輸出給控制命令表模塊中進(jìn)行查詢,找到語(yǔ)音信息想要操控的設(shè)備指令,然后將其輸出給ZigBee協(xié)調(diào)器,協(xié)調(diào)器再將控制指令下發(fā)給終端節(jié)點(diǎn)。
2.如權(quán)利要求1所述的一種語(yǔ)音交互智能家居系統(tǒng),其特征在于所述的語(yǔ)音處理模塊在語(yǔ)音識(shí)別過(guò)程中,遇到了語(yǔ)音處理模塊中沒(méi)有存儲(chǔ)的生詞的話,語(yǔ)音處理模塊會(huì)將沒(méi)有識(shí)別的語(yǔ)音通過(guò)Wifi模塊連接到以太網(wǎng)中,將其傳輸給WEB服務(wù)器,WEB服務(wù)器內(nèi)部設(shè)有同樣的語(yǔ)音處理模塊,服務(wù)器端存儲(chǔ)的詞庫(kù)量比硬件端的詞庫(kù)量大,且不受嵌入式便攜設(shè)備的存儲(chǔ)容量的限制,就可以將沒(méi)有識(shí)別出的生詞識(shí)別處理,然后再通過(guò)以太網(wǎng),將其生詞的詞條傳輸給用戶家中網(wǎng)關(guān)上的語(yǔ)音處理模塊,替換網(wǎng)關(guān)中從來(lái)沒(méi)用過(guò)的詞語(yǔ)。
3.如權(quán)利要求1所述的一種語(yǔ)音交互智能家居系統(tǒng),其特征在于所述的語(yǔ)音識(shí)別模塊需要增加額外的詞條庫(kù),并采用輪詢調(diào)用的方式去詞條庫(kù)提取詞條,按順序每次提取50個(gè)詞條存儲(chǔ)到語(yǔ)音識(shí)別模塊中,同時(shí)為了增加語(yǔ)音識(shí)別的靈活性,將每個(gè)詞條都改成單個(gè)字、兩個(gè)、三個(gè)或者四個(gè)連詞;為了確保語(yǔ)音里面的所有字或詞語(yǔ)是否都已識(shí)別完全,沒(méi)有遺漏,所述的語(yǔ)音識(shí)別模塊采用頻譜分析方法識(shí)別語(yǔ)音識(shí)別模塊中字的個(gè)數(shù)。
4.如權(quán)利要求3所述的一種語(yǔ)音交互智能家居系統(tǒng),其特征在于所述的語(yǔ)音識(shí)別模塊頻譜分析方法如下:漢字是 有聲母和韻母的,通過(guò)聲母頻譜序列庫(kù)與語(yǔ)音的頻譜分析圖比對(duì),這樣就可以得到語(yǔ)音的漢字個(gè)數(shù);漢字的聲母一共有23個(gè),它們是b P m f d t η I gk h j q X zh ch sh r z c s y w,先將所有聲母的發(fā)音采集,經(jīng)A/D模數(shù)轉(zhuǎn)換后,通過(guò)傅里葉頻譜分析,得到這23個(gè)聲母的頻譜圖,將其特征值存入聲母頻譜序列庫(kù),之后在采集用戶的聲音信號(hào)時(shí),也是先經(jīng)過(guò)A/D模數(shù)轉(zhuǎn)換模塊將其轉(zhuǎn)換成數(shù)字信號(hào),然后進(jìn)行傅里葉頻譜分析,根據(jù)頻譜分析得到的特征值,與之前的聲母頻譜序列庫(kù)的頻譜特征值進(jìn)行比對(duì)分析,提取出一句話中的所有聲母,從而得到語(yǔ)音的漢字個(gè)數(shù),同樣的,對(duì)于一些常用的沒(méi)有聲母的漢字,就將其整個(gè)字的整帶頻譜存儲(chǔ)到零聲母頻譜序列庫(kù)中;對(duì)于漢字中的語(yǔ)氣詞,將其整帶頻譜存儲(chǔ)在語(yǔ)氣詞頻譜序列庫(kù)中,與頻譜分析得到的頻譜進(jìn)行比對(duì),從而完成語(yǔ)氣詞的識(shí)別。
5.如權(quán)利要求3所述的一種語(yǔ)音交互智能家居系統(tǒng),其特征在于所述的語(yǔ)音交互智能家居系統(tǒng)會(huì)先將用戶的語(yǔ)音信號(hào)進(jìn)行音頻信號(hào)采集,A/D模塊轉(zhuǎn)換成數(shù)字信號(hào),之后將其存儲(chǔ)到RAM存儲(chǔ)器中;RAM存儲(chǔ)器會(huì)首先將當(dāng)前的語(yǔ)音信號(hào)進(jìn)行頻譜分析,然后結(jié)合聲母頻譜序列庫(kù)、零聲母頻譜序列庫(kù)和語(yǔ)氣詞頻譜序列庫(kù)對(duì)其聲母、或者整個(gè)字或者詞進(jìn)行識(shí)別校對(duì),校對(duì)后,既可以識(shí)別出語(yǔ)音中的零聲母字和語(yǔ)氣詞,還能識(shí)別出語(yǔ)音的累計(jì)計(jì)數(shù),從而最終得出音頻信號(hào)的待識(shí)別序列數(shù);由于每個(gè)中文漢子都有其聲母,所以這里采用聲母識(shí)別方式,去識(shí)別一句話的中文字?jǐn)?shù);之后RAM存儲(chǔ)器中的信息通過(guò)16位以上的高速D/A轉(zhuǎn)化模塊,將數(shù)字信號(hào)轉(zhuǎn)換成模擬信號(hào),輸入到語(yǔ)音識(shí)別模塊,語(yǔ)音識(shí)別模塊會(huì)按順序從詞條庫(kù)提取出若干詞條與模擬信號(hào)相比對(duì),進(jìn)行真值查詢,如果從此次詞條庫(kù)中匹配出正確的字符,就會(huì)輸出識(shí)別的字符,之前頻譜分析后已經(jīng)識(shí)別出的零聲母和語(yǔ)氣詞也會(huì)和當(dāng)前識(shí)別出的字符一起進(jìn)入到下一環(huán)節(jié),與之前通過(guò)頻譜分析得出的待識(shí)別序列數(shù)的個(gè)數(shù)相比較,如果相同,則代表識(shí)別工作已經(jīng)完成,那么之后就可以將文字字符碼輸出,進(jìn)入到基本語(yǔ)法分析器進(jìn)行語(yǔ)法分析,從而得到文意表達(dá)知識(shí)信息,最終得出用戶的使用意圖;如果在非特定人語(yǔ)音識(shí)別模塊處真值查詢沒(méi)有識(shí)別到字符,那么就會(huì)重新從RAM存儲(chǔ)器中讀取數(shù)字信號(hào),將其進(jìn)行D/A轉(zhuǎn)化后,再次輸入到語(yǔ)音識(shí)別模塊,然后再?gòu)脑~條庫(kù)中提取下一組一定數(shù)量的詞條與其比對(duì)匹配,然后反復(fù)這樣的流程,直到將音頻信號(hào)中的所有字符都識(shí)另拙來(lái);如果整個(gè)詞庫(kù)都比對(duì)過(guò)后,也沒(méi)有完全識(shí)別用戶的語(yǔ)音,那么將其傳輸?shù)椒?wù)器端進(jìn)行識(shí)別,在整個(gè)語(yǔ)音信號(hào)的字或者詞全部識(shí)別出來(lái)之后,整個(gè)文字字符是亂序的,這個(gè)時(shí)候,需要結(jié)合之前頻譜識(shí)別校對(duì)的結(jié)果進(jìn)行文字字符的排序,然后輸出正確順序的文字字符。
6.一種采用如權(quán)利要求1所述的語(yǔ)音交互智能家居系統(tǒng)的語(yǔ)音交互方法,其特征在于語(yǔ)音識(shí)別模塊采用非特定人語(yǔ)音識(shí)別模塊,并在該語(yǔ)音模塊中額外添加Flash芯片,存儲(chǔ)詞條庫(kù),在語(yǔ)音識(shí)別的時(shí)候,順序從詞條庫(kù)中提取一定數(shù)量的詞條和輸入的語(yǔ)音比對(duì),直到比對(duì)出結(jié)果;系統(tǒng)在與用戶交互過(guò)程中,會(huì)將常用的字詞,調(diào)整順序,排到詞條庫(kù)的最前面,這樣就可以漸漸地加快語(yǔ)音識(shí)別的運(yùn)算速度,同時(shí),系統(tǒng)在與用戶語(yǔ)音交互的過(guò)程中,遇到了一些詞條庫(kù)沒(méi)有存儲(chǔ)的詞匯的話,系統(tǒng)會(huì)將這句話的音頻記錄下來(lái),在系統(tǒng)空閑的時(shí)候,通過(guò)網(wǎng)絡(luò),將生詞的音頻資源傳輸?shù)骄W(wǎng)絡(luò)服務(wù)器端,網(wǎng)絡(luò)服務(wù)器會(huì)將這些生詞的音頻資源與服務(wù)器端比較全面的詞條庫(kù)進(jìn)行比對(duì)匹配,從而得出該音頻所對(duì)應(yīng)的生詞的詞條,之后再將這個(gè)詞條通過(guò)網(wǎng)絡(luò)傳輸?shù)綄?duì)應(yīng)家庭的語(yǔ)音模塊的Flash詞條庫(kù)中,用于后續(xù)語(yǔ)音交互使用。
【文檔編號(hào)】G10L15/28GK103745722SQ201410046639
【公開(kāi)日】2014年4月23日 申請(qǐng)日期:2014年2月10日 優(yōu)先權(quán)日:2014年2月10日
【發(fā)明者】徐曉青, 林銘鋒, 李傳鋒, 李紅瓊 申請(qǐng)人:上海金牌軟件開(kāi)發(fā)有限公司