語音控制裝置及基于多麥克風的語音控制方法與流程

文檔序號：11867387閱讀：348來源：國知局

導航： X技術> 最新專利>樂器;聲學設備的制造及制作,分析技術

本發(fā)明涉及智能控制技術領域，特別涉及一種基于多麥克風的語音控制方法以及一種語音控制裝置。

背景技術：

隨著智能產(chǎn)品行業(yè)的發(fā)展，語音指令控制被人們所熟悉。語音指令控制能給用戶提供更具人性化的體驗。

但是，當采用多個麥克風對應同一服務器或控制中心時，將給服務器或控制中心帶來很大的處理壓力，從而大大降低了響應速度，降低用戶體驗。

技術實現(xiàn)要素：

本發(fā)明旨在至少在一定程度上解決相關技術中的技術問題之一。

為此，本發(fā)明的第一個目的在于提出一種基于多麥克風的語音控制方法，先通過同一區(qū)域內具有語音處理功能的麥克風對聲音信息進行解析以提取有效的語音指令信息，再將該語音指令信息發(fā)送至服務器，從而有效提高語音指令響應速度，提高用戶體驗。

本發(fā)明的第二個目的在于提出一種語音控制裝置。

為實現(xiàn)上述目的，本發(fā)明第一方面實施例提出了一種基于多麥克風的語音控制方法，包括以下步驟：服務器接收用戶的語音指令信息，所述語音指令信息是通過第一麥克風對第一聲音信息和第二聲音信息進行解析后獲得，其中，所述第一聲音信息是通過所述第一麥克風接收獲得，所述第二聲音信息是通過與所述第一麥克風處于同一區(qū)域內的多個第二麥克風接收獲得；以及所述服務器根據(jù)所述語音指令信息獲取播放內容，并控制所述同一區(qū)域的至少一個揚聲器進行播放。

根據(jù)本發(fā)明實施例的基于多麥克風的語音控制方法，首先通過第一麥克風對第一聲音信息和第二聲音信息進行解析以獲得用戶的語音指令信息，然后再將用戶的語音指令信息發(fā)送至服務器，其中，第一聲音信息是通過第一麥克風接收獲得，第二聲音信息是通過與第一麥克風處于同一區(qū)域內的多個第二麥克風接收獲得，服務器在接收到用戶的語音指令信息后，根據(jù)語音指令信息獲取播放內容，并控制同一區(qū)域的至少一個揚聲器進行播放，從而有效提高語音指令響應速度，提高用戶體驗。

根據(jù)本發(fā)明的一個實施例，所述服務器在接收到所述用戶的語音指令信息后，還包括：所述服務器確認所述第一麥克風所在區(qū)域，并根據(jù)所述第一麥克風所在區(qū)域選擇對應的線程；以及通過對應的線程根據(jù)所述語音指令信息獲取播放內容和控制所述區(qū)域的至少一個揚聲器進行播放。

根據(jù)本發(fā)明的一個實施例，所述第一麥克風對第一聲音信息和第二聲音信息進行解析，包括：對所述第一聲音信息和所述第二聲音信息進行合成以獲得第三聲音信息；對所述第三聲音信息進行回聲消除和降噪處理以提取所述語音指令信息。

根據(jù)本發(fā)明的一個實施例，上述的基于多麥克風的語音控制方法，還包括：所述多個第二麥克風中的每個麥克風檢測所述第二聲音信息的分貝和頻率，并判斷所述第二聲音信息的分貝是否大于預設分貝，以及判斷所述第二聲音信息的頻率是否在預設頻率范圍內；如果所述第二聲音信息的分貝大于所述預設分貝且所述第二聲音信息的頻率在所述預設范圍內，則對應的麥克風發(fā)送所述第二聲音信息至所述第一麥克風。

根據(jù)本發(fā)明的一個實施例，所述第一麥克風和所述多個第二麥克風設置在家用電器中。

為實現(xiàn)上述目的，本發(fā)明第二方面實施例提出了一種語音控制裝置，包括：多個語音接收模塊，用于接收同一區(qū)域的聲音信息以獲得第二聲音信息；語音處理模塊，用于接收所述同一區(qū)域的聲音信息以獲得第一聲音信息，并接收所述多個語音接收模塊獲得的所述第二聲音信息，以及對所述第一聲音信息和所述第二聲音信息進行解析以獲得用戶的語音指令信息；以及控制模塊，用于根據(jù)所述語音指令信息獲取播放內容，并控制所述同一區(qū)域的至少一個揚聲器進行播放。

根據(jù)本發(fā)明實施例的語音控制裝置，首先通過多個語音接收模塊接收同一區(qū)域的聲音信息以獲得第二聲音信息，并通過語音處理模塊接收同一區(qū)域的聲音信息以獲得第一聲音信息，然后，語音處理模塊對第一聲音信息和第二聲音信息進行解析以獲得用戶的語音指令信息，控制模塊根據(jù)語音指令信息獲取播放內容，并控制同一區(qū)域的至少一個揚聲器進行播放，從而有效提高語音指令響應速度，提高用戶體驗。

根據(jù)本發(fā)明的一個實施例，所述控制模塊還用于：確認所述語音處理模塊所在區(qū)域，并根據(jù)所述語音處理模塊所在區(qū)域選擇對應的線程，以及通過對應的線程根據(jù)所述語音指令信息獲取播放內容和控制所述區(qū)域的至少一個揚聲器進行播放。

根據(jù)本發(fā)明的一個實施例，所述語音處理模塊在對所述第一聲音信息和所述第二聲音信息進行解析以獲得用戶的語音指令信息時，其中，所述語音處理模塊對所述第一聲音信息和所述第二聲音信息進行合成以獲得第三聲音信息，并對所述第三聲音信息進行回聲消除和降噪處理以提取所述語音指令信息。

根據(jù)本發(fā)明的一個實施例，所述多個語音接收模塊中的每個語音接收模塊檢測所述第二聲音信息的分貝和頻率，并判斷所述第二聲音信息的分貝是否大于預設分貝，以及判斷所述第二聲音信息的頻率是否在預設范圍內，其中，如果所述第二聲音信息的分貝大于所述預設分貝且所述第二聲音信息的頻率在所述預設范圍內，則發(fā)送所述第二聲音信息至所述語音處理模塊。

根據(jù)本發(fā)明的一個實施例，所述多個語音接收模塊和所述語音處理模塊設置在家用電器中。

附圖說明

圖1是根據(jù)本發(fā)明一個實施例的基于多麥克風的語音控制方法的流程圖；

圖2是根據(jù)本發(fā)明一個具體示例的麥克風和揚聲器的布局示意圖；

圖3是根據(jù)本發(fā)明一個實施例的基于多麥克風的語音控制方法的原理圖；

圖4是根據(jù)本發(fā)明另一個實施例的基于多麥克風的語音控制方法的流程圖；

圖5是根據(jù)本發(fā)明另一個實施例的基于多麥克風的語音控制方法的原理圖；

圖6是根據(jù)本發(fā)明又一個實施例的基于多麥克風的語音控制方法的流程圖；以及

圖7是根據(jù)本發(fā)明一個實施例的語音控制裝置的框圖。

具體實施方式

下面詳細描述本發(fā)明的實施例，所述實施例的示例在附圖中示出，其中自始至終相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實施例是示例性的，旨在用于解釋本發(fā)明，而不能理解為對本發(fā)明的限制。

下面參照附圖來描述根據(jù)本發(fā)明實施例提出的基于多麥克風的語音控制方法以及語音控制裝置。

圖1是根據(jù)本發(fā)明一個實施例的基于多麥克風的語音控制方法的流程圖。如圖1所示，基于多麥克風的語音控制方法包括以下步驟：

S110，服務器接收用戶的語音指令信息，語音指令信息是通過第一麥克風對第一聲音信息和第二聲音信息進行解析后獲得，其中，第一聲音信息是通過第一麥克風接收獲得，第二聲音信息是通過與第一麥克風處于同一區(qū)域內的多個第二麥克風接收獲得。

根據(jù)本發(fā)明的一個實施例，第一麥克風對第一聲音信息和第二聲音信息進行解析，包括：對第一聲音信息和第二聲音信息進行合成以獲得第三聲音信息；對第三聲音信息進行回聲消除和降噪處理以提取語音指令信息。

具體地，由于語音識別對環(huán)境的要求較高，環(huán)境噪聲和區(qū)域內的回聲(墻壁回彈噪聲)等會影響語音識別的質量，因此，可以在同一區(qū)域內，根據(jù)現(xiàn)場情況設置兩個以上的麥克風，以抑制干擾噪聲。

作為一個具體示例，如圖2所示，可以將餐廳和客廳作為同一區(qū)域A，根據(jù)餐廳和客廳的面積和結構可以設置六個麥克風；將圖中右上角的側臥室作為同一區(qū)域B，根據(jù)側臥室的面積可以設置兩個麥克風；將圖中右下角的主臥室作為同一區(qū)域C，根據(jù)主臥室的面積可以設置三個麥克風，以通過設置在區(qū)域內的多個麥克風獲取所在區(qū)域內的聲音信息。如果此時將多個麥克風獲取的聲音信息同時上傳至服務器，則服務器的壓力會很大，導致服務器的處理速度要求高，從而增加成本，同時導致語音指令的響應速度變慢。因此，可以先將麥克風接收到的聲音信息發(fā)送至同一區(qū)域內具有語音處理能力的麥克風，通過該麥克風提取用戶的語音指令信息，然后再將該語音指令信息上傳至服務器。

具體地，如圖3所示，分別在區(qū)域A和區(qū)域B中設置一個具有語音處理能力的第一麥克風，而同一區(qū)域的其他麥克風在接收到聲音信息后，發(fā)送聲音信息至同一區(qū)域內的第一麥克風，第一麥克風對接收到的同一區(qū)域的聲音信息進行合成，并最終分離出用戶的語音指令信息(可采用現(xiàn)有技術實現(xiàn)，具體這里不再贅述)，然后將該語音指令信息發(fā)送至服務器。

S120，服務器根據(jù)語音指令信息獲取播放內容，并控制同一區(qū)域的至少一個揚聲器進行播放。

具體地，如圖2所示，可以在區(qū)域A中設置五個揚聲器；在區(qū)域B中設置兩個揚聲器；在區(qū)域C中設置兩個揚聲器。如圖3所示，服務器在接收到用戶的語音指令信息后，可以從搜索引擎上獲取播放內容，例如音樂、新聞和廣播等，然后控制該語音指令信息對應的第一麥克風所在區(qū)域內的一個或多個揚聲器進行播放。

進一步地，考慮到不同區(qū)域的用戶會同時發(fā)送語音指令信息至服務器，為了能夠進一步提高語音響應速度，在本發(fā)明的一個實施例中，如圖4所示，服務器在接收到用戶的語音指令信息后，還包括：

S121，服務器確認第一麥克風所在區(qū)域，并根據(jù)第一麥克風所在區(qū)域選擇對應的線程。

S122，通過對應的線程根據(jù)語音指令信息獲取播放內容和控制區(qū)域的至少一個揚聲器進行播放。

也就是說，當不同區(qū)域的不同用戶同時向服務器發(fā)送語音指令信息時，可以通過不同的線程來進行處理，以實現(xiàn)不同區(qū)域多個用戶同時使用語音來控制。具體而言，如圖5所示，服務器同時通過不同的線程對用戶的語音指令信息進行處理，即每個線程根據(jù)相應麥克風發(fā)送的語音指令信息從搜索引擎中獲取播放內容，然后控制對應區(qū)域中的至少一個揚聲器進行播放。

可以理解的是，在本發(fā)明的實施例中，麥克風可通過無線方式接入服務器，因此，區(qū)域數(shù)目的增加并不需要增加布線，只要增加帶寬即可，同時服務器中只需增加對應的線程即可，實現(xiàn)簡單。

根據(jù)本發(fā)明實施例的基于多麥克風的語音控制方法，服務器在接收到多個區(qū)域的語音指令信息后，選擇每個區(qū)域所對應的線程，然后通過對應的線程根據(jù)語音指令信息獲取播放內容，并控制對應的區(qū)域中的至少一個揚聲器進行播放，從而通過獨立的線程對對應區(qū)域的語音指令信息進行處理，實現(xiàn)不同區(qū)域多個用戶同時使用語音指令的交互控制，保證響應時間，提高用戶體驗。

另外，考慮到實際應用中，當多個麥克風同時上傳數(shù)據(jù)到同一區(qū)域的具有語音處理能力的第一麥克風時，可能出現(xiàn)擁堵現(xiàn)象，為此，在本發(fā)明的實施例中，可以先對每個第二麥克風收集到的聲音信息進行判斷，如果聲音信息滿足一定要求，則再將該聲音信息發(fā)送至具有語音處理能力的第一麥克風，以減少因同時上傳較多數(shù)據(jù)導致帶寬擁堵現(xiàn)象發(fā)生。

如圖6所示，基于多麥克風的語音控制方法還包括：

S130，多個第二麥克風中的每個麥克風檢測第二聲音信息的分貝和頻率，并判斷第二聲音信息的分貝是否大于預設分貝，以及判斷第二聲音信息的頻率是否在預設頻率范圍內。

S140，如果第二聲音信息的分貝大于預設分貝且第二聲音信息的頻率在預設范圍內，則對應的麥克風發(fā)送第二聲音信息至第一麥克風。

具體而言，如圖3所示，當區(qū)域A中有聲音時，區(qū)域A中的5個第二麥克風會自動檢測聲音的大小(分貝)，并判斷該聲音是否在人聲范圍內。如果聲音比較大，如：聲音信息的分貝大于預設分貝，并且該聲音在人聲范圍內，如：聲音信息的頻率在預設范圍內，則第二麥克風自動將聲音信息發(fā)送至具有語音處理能力的第一麥克風，從而使得多個第二麥克風只傳送更有效的部分，減少了對傳輸帶寬的要求，減少了具有語音處理能力的第一麥克風的解析處理時間，提高了響應速度。

可以理解的是，在本發(fā)明的實施例中，可以將第一麥克風和多個第二麥克風設置在家用電器中，以增強整個設備群的隱蔽性，提高室內的美觀度，提高用戶體驗。

根據(jù)本發(fā)明實施例的基于多麥克風的語音控制方法，在第二麥克風收集到聲音信息時，還自動檢測該聲音信息是否滿足一定要求，如果滿足，再將該聲音信息發(fā)送至具有語音處理能力的第一麥克風，從而使得第二麥克風只傳送更有效的部分，減少了對傳輸帶寬的要求，減少了具有語音處理能力的第一麥克風的處理時間，提高了響應速度。而且，通過將麥克風設置在不同的家用電器中，增強了整個設備群的隱蔽性，提高了室內的美觀度，提高了用戶體驗。

圖7是根據(jù)本發(fā)明一個實施例的語音控制裝置的框圖。如圖7所示，該語音控制裝置包括：多個語音接收模塊10、語音處理模塊20和控制模塊30。

具體地，多個語音接收模塊10用于接收同一區(qū)域的聲音信息以獲得第二聲音信息，語音處理模塊20用于接收同一區(qū)域的聲音信息以獲得第一聲音信息，并接收多個語音接收模塊10獲得的第二聲音信息，以及對第一聲音信息和第二聲音信息進行解析以獲得用戶的語音指令信息。

根據(jù)本發(fā)明的一個實施例，語音處理模塊20在對第一聲音信息和第二聲音信息進行解析以獲得用戶的語音指令信息時，其中，語音處理模塊20對第一聲音信息和第二聲音信息進行合成以獲得第三聲音信息，并對第三聲音信息進行回聲消除和降噪處理以提取語音指令信息。

具體而言，由于語音識別對環(huán)境的要求較高，環(huán)境噪聲和區(qū)域內的回聲等會影響語音識別的質量，因此，可以在同一區(qū)域內，根據(jù)現(xiàn)場情況設置兩個以上的語音接收模塊10，以抑制干擾噪聲。另外考慮到，如果直接將多個語音接收模塊10獲取的聲音信息同時上傳至控制模塊30，則控制模塊30的壓力會很大，導致控制模塊30的處理速度要求高，從而增加成本，同時導致語音指令的響應速度變慢。因此，可以先將語音接收模塊10接收到的聲音信息發(fā)送至同一區(qū)域內既能接收區(qū)域內的聲音信息，又具有語音處理能力的語音處理模塊20，通過語音處理模塊20提取用戶的語音指令信息，然后再將該語音指令信息上傳至控制模塊30。

其中，語音接收模塊10可以為麥克風，語音處理模塊20可以為具有語音處理能力的麥克風。具體地，如圖3所示，分別在區(qū)域A和區(qū)域B中設置一個具有語音處理能力的麥克風，而同一區(qū)域的其他麥克風在接收到聲音信息后，發(fā)送聲音信息至該麥克風，該麥克風對接收到的同一區(qū)域的聲音信息進行合成，并最終分離出用戶的語音指令信息，然后將該語音指令信息發(fā)送至控制模塊30。

控制模塊30用于根據(jù)語音指令信息獲取播放內容，并控制同一區(qū)域的至少一個揚聲器進行播放。

也就是說，控制模塊30在接收到用戶的語音指令信息后，可以從搜索引擎上獲取播放內容，例如音樂、新聞和廣播等，然后控制該語音指令信息對應的語音處理模塊20所在區(qū)域內的一個或多個揚聲器進行播放。

進一步地，考慮到不同區(qū)域的用戶會同時發(fā)送語音指令信息至控制模塊30，為了能夠進一步提高語音響應速度，在本發(fā)明的一個實施例中，控制模塊30還用于：確認語音處理模塊所在區(qū)域，并根據(jù)語音處理模塊所在區(qū)域選擇對應的線程，并通過對應的線程根據(jù)所述語音指令信息獲取播放內容和控制所述區(qū)域的至少一個揚聲器進行播放。

也就是說，當不同區(qū)域的不同用戶同時向控制模塊30發(fā)送語音指令信息時，可以通過不同的線程來進行處理，以實現(xiàn)不同區(qū)域多個用戶同時使用語音來控制。即言，控制模塊30同時通過不同的線程對用戶的語音指令信息進行處理，即每個線程根據(jù)相應語音處理模塊20發(fā)送的語音指令信息從搜索引擎中獲取播放內容，然后控制對應區(qū)域中的至少一個揚聲器進行播放。

可以理解的是，在本發(fā)明的實施例中，語音處理模塊20可通過無線方式接入控制模塊30，因此，區(qū)域數(shù)目的增加并不需要增加布線，只要增加帶寬即可，同時控制模塊30中只需增加對應的線程即可，實現(xiàn)簡單。

根據(jù)本發(fā)明實施例的語音控制裝置，控制模塊在接收到多個區(qū)域的語音指令信息后，選擇每個區(qū)域所對應的線程，然后通過對應的線程根據(jù)語音指令信息獲取播放內容，并控制對應的區(qū)域中的至少一個揚聲器進行播放，從而通過獨立的線程對對應區(qū)域的語音指令信息進行處理，實現(xiàn)不同區(qū)域多個用戶同時使用語音指令的交互控制，保證響應時間，提高用戶體驗。

另外，考慮到實際應用中，當多個語音接收模塊10同時上傳數(shù)據(jù)到同一區(qū)域的語音處理模塊20時，可能出現(xiàn)擁堵現(xiàn)象。

為此，在本發(fā)明的一個實施例中，多個語音接收模塊10中的每個語音接收模塊10檢測第二聲音信息的分貝和頻率，并判斷第二聲音信息的分貝是否大于預設分貝，以及判斷第二聲音信息的頻率是否在預設范圍內，其中，如果第二聲音信息的分貝大于預設分貝且第二聲音信息的頻率在預設范圍內，則發(fā)送第二聲音信息至語音處理模塊20。

也就是說，在本發(fā)明的實施例中，可以先對每個語音接收模塊10收集到的聲音信息進行判斷，如果聲音信息滿足一定要求，則再將該聲音信息發(fā)送至語音處理模塊20，以減少因同時上傳較多數(shù)據(jù)導致帶寬擁堵現(xiàn)象發(fā)生。

具體而言，語音接收模塊10在接收到聲信息后，自動檢測聲音的大小(分貝)，并判斷該聲音是否在人聲范圍內。如果聲音比較大，如：聲音信息的分貝大于預設分貝，并且該聲音在人聲范圍內，如：聲音信息的頻率在預設范圍內，則語音接收模塊10自動將聲音信息發(fā)送至語音處理模塊20，從而使得多個語音接收模塊10只傳送更有效的部分，減少了對傳輸帶寬的要求，減少了語音處理模塊20的解析處理時間，提高了響應速度。

可以理解的是，在本發(fā)明的實施例中，可以將多個語音接收模塊10和語音處理模塊20設置在家用電器中，以增強整個設備群的隱蔽性，提高室內的美觀度，提高用戶體驗。

根據(jù)本發(fā)明實施例的語音控制裝置，在語音接收模塊收集到聲音信息時，還自動檢測該聲音信息是否滿足一定要求，如果滿足，再將該聲音信息發(fā)送至語音處理模塊，從而使得語音接收模塊只傳送更有效的部分，減少了對傳輸帶寬的要求，減少了語音處理模塊的處理時間，提高了響應速度。而且，通過將語音處理模塊和語音接收模塊設置在不同的家用電器中，增強了整個設備群的隱蔽性，提高了室內的美觀度，提高了用戶體驗。

在本發(fā)明的描述中，需要理解的是，術語“第一”、“第二”僅用于描述目的，而不能理解為指示或暗示相對重要性或者隱含指明所指示的技術特征的數(shù)量。由此，限定有“第一”、“第二”的特征可以明示或者隱含地包括至少一個該特征。在本發(fā)明的描述中，“多個”的含義是至少兩個，例如兩個，三個等，除非另有明確具體的限定。

在本發(fā)明中，除非另有明確的規(guī)定和限定，術語“安裝”、“相連”、“連接”、“固定”等術語應做廣義理解，例如，可以是固定連接，也可以是可拆卸連接，或成一體；可以是機械連接，也可以是電連接；可以是直接相連，也可以通過中間媒介間接相連，可以是兩個元件內部的連通或兩個元件的相互作用關系，除非另有明確的限定。對于本領域的普通技術人員而言，可以根據(jù)具體情況理解上述術語在本發(fā)明中的具體含義。

在本說明書的描述中，參考術語“一個實施例”、“一些實施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結合該實施例或示例描述的具體特征、結構、材料或者特點包含于本發(fā)明的至少一個實施例或示例中。在本說明書中，對上述術語的示意性表述不必須針對的是相同的實施例或示例。而且，描述的具體特征、結構、材料或者特點可以在任一個或多個實施例或示例中以合適的方式結合。此外，在不相互矛盾的情況下，本領域的技術人員可以將本說明書中描述的不同實施例或示例以及不同實施例或示例的特征進行結合和組合。

盡管上面已經(jīng)示出和描述了本發(fā)明的實施例，可以理解的是，上述實施例是示例性的，不能理解為對本發(fā)明的限制，本領域的普通技術人員在本發(fā)明的范圍內可以對上述實施例進行變化、修改、替換和變型。

完整全部詳細技術資料下載

當前第1頁1 2 3