對象監(jiān)控方法及裝置的制造方法

文檔序號：10539208閱讀：457來源：國知局

對象監(jiān)控方法及裝置的制造方法
【專利摘要】本公開是關于一種對象監(jiān)控方法及裝置，其中，對象監(jiān)控方法包括：當采集到的聲音中存在目標聲音時，判斷目標聲音的發(fā)聲原因；向移動終端推送發(fā)聲信息，該發(fā)聲信息攜帶有發(fā)聲原因。本公開實施例，通過判斷采集到的目標聲音的發(fā)聲原因，并向移動終端推送攜帶有發(fā)聲原因的發(fā)聲信息，使得用戶可以獲得被監(jiān)控對象的發(fā)聲原因，達到很好的監(jiān)控目的。
【專利說明】
對象監(jiān)控方法及裝置
技術領域
[0001 ]本公開涉及移動互聯(lián)網(wǎng)技術領域，尤其涉及一種對象監(jiān)控方法及裝置。
【背景技術】
[0002]隨著攝像技術的發(fā)展，出現(xiàn)了智能攝像機，智能攝像機是采用當今最新的科技成果、最精尖的制造工藝，綜合多年的寶貴經(jīng)驗研制成功的攝像機。
[0003]隨著網(wǎng)絡化、數(shù)字化、高清化的廣泛應用，人們對智能化的需求日益增多，智能攝像機的應用越來越廣，其種種特性使之適用于各行各業(yè)活動目標的監(jiān)控。例如，可以對智能大廈、城市道路、電力部門、機場和車站等進行監(jiān)控等。
[0004]由此可見，智能攝像機可用于監(jiān)控各種對象，因此，如何更好地利用智能攝像機為用戶提供監(jiān)控服務，是目前急需解決的技術問題之一。

【發(fā)明內(nèi)容】

[0005]為克服相關技術中存在的問題，本公開提供一種對象監(jiān)控方法及裝置。
[0006]根據(jù)本公開實施例的第一方面，提供一種對象監(jiān)控方法，包括:
[0007]當采集到的聲音中存在目標聲音時，判斷所述目標聲音的發(fā)聲原因；
[0008]向移動終端推送發(fā)聲信息，所述發(fā)聲信息攜帶有所述發(fā)聲原因。
[0009]在一實施例中，在所述向移動終端推送發(fā)聲信息之后，所述方法還包括:
[0010]接收所述移動終端發(fā)送的視頻獲取指令；
[0011 ]根據(jù)所述視頻獲取指令向所述移動終端推送視頻信息，以使所述移動終端顯示所述視頻信息。
[0012]在一實施例中，在所述根據(jù)所述視頻獲取指令向所述移動終端推送視頻信息之前，所述方法還包括:
[0013]獲取所述目標聲音的發(fā)聲位置；
[0014]控制攝像頭轉向所述發(fā)聲位置對應的方向，并采集所述視頻信息。
[0015]在一實施例中，所述判斷所述目標聲音的發(fā)聲原因，包括:
[0016]對所述目標聲音進行特征提取，得到目標聲音特征信息；
[0017]將所述目標聲音特征信息與預存的多個聲音模板進行匹配，并根據(jù)匹配結果得到所述目標聲音的發(fā)聲原因，所述多個聲音模板用于識別不同原因引起的目標聲音。
[0018]在一實施例中，所述對所述目標聲音進行特征提取，得到目標聲音特征信息，包括:
[0019]對所述目標聲音進行壓縮處理，得到壓縮聲音信息；
[0020]對所述壓縮聲音信息進行特征提取，得到所述目標聲音特征信息。
[0021]在一實施例中，所述判斷所述目標聲音的發(fā)聲原因，包括:
[0022]向服務器發(fā)送所述目標聲音；
[0023]接收所述服務器返回的所述目標聲音的發(fā)聲原因。
[0024]在一實施例中，所述方法還包括:
[0025]若檢測到所述當前監(jiān)控設備未接入網(wǎng)絡，則廣播報文，以使所述移動終端顯示所述當前監(jiān)控設備未接入網(wǎng)絡的提示信息；
[0026]接收所述移動終端廣播的路由器的名稱和密碼，并向所述路由器發(fā)送連接請求，以連接到所述路由器上。
[0027]在一實施例中，所述方法還包括:
[0028]針對每個聲音模板，對當前聲音模板進行訓練。
[0029]在一實施例中，所述對當前聲音模板進行訓練，包括:
[0030]采集預設數(shù)量的目標聲音特征樣本；
[0031]將所述預設數(shù)量的目標聲音特征樣本輸入當前聲音模板，得到所述預設數(shù)量的目標聲音特征樣本相對于當前聲音模板的失真距離，所述失真距離用于表示所述預設數(shù)量的目標聲音特征樣本與通過所述當前聲音模板輸出的目標聲音之間的差距；
[0032]若所述失真距離小于預設距離，則停止對所述當前聲音模板進行訓練；
[0033]若所述失真距離大于等于預設距離，則繼續(xù)對所述當前聲音模板進行訓練，直至所述失真距離小于預設距離。
[0034]在一實施例中，所述發(fā)聲信息還攜帶有所述目標聲音。
[0035]根據(jù)本公開實施例的第二方面，提供一種對象監(jiān)控裝置，包括:
[0036]判斷模塊，被配置為當采集到的聲音中存在目標聲音時，判斷所述目標聲音的發(fā)聲原因；
[0037]第一推送模塊，被配置為向移動終端推送發(fā)聲信息，所述發(fā)聲信息攜帶有所述判斷模塊判斷出的所述發(fā)聲原因。
[0038]在一實施例中，所述裝置還包括:
[0039]接收模塊，被配置為在所述第一推送模塊向移動終端推送發(fā)聲信息之后，接收所述移動終端發(fā)送的視頻獲取指令；
[0040]第二推送模塊，被配置為根據(jù)所述接收模塊接收的所述視頻獲取指令向所述移動終端推送視頻信息，以使所述移動終端顯示所述視頻信息。
[0041]在一實施例中，所述裝置還包括:
[0042]獲取模塊，被配置為在所述第二推送模塊根據(jù)所述視頻獲取指令向所述移動終端推送視頻信息之前，獲取所述目標聲音的發(fā)聲位置；
[0043]轉向采集模塊，被配置為控制攝像頭轉向所述獲取模塊獲取的所述發(fā)聲位置對應的方向，并采集所述視頻信息。
[0044]在一實施例中，所述判斷模塊包括:
[0045]提取子模塊，被配置為對所述目標聲音進行特征提取，得到目標聲音特征信息；
[0046]匹配子模塊，被配置為將所述提取子模塊提取到的所述目標聲音特征信息與預存的多個聲音模板進行匹配，并根據(jù)匹配結果得到所述目標聲音的發(fā)聲原因，所述多個聲音模板用于識別不同原因引起的目標聲音。
[0047]在一實施例中，所述提取子模塊包括:
[0048]壓縮單元，被配置為對所述目標聲音進行壓縮處理，得到壓縮聲音信息；
[0049]提取單元，被配置為對所述壓縮單元得到的所述壓縮聲音信息進行特征提取，得到所述目標聲音特征信息。
[0050]在一實施例中，所述判斷模塊包括:
[0051 ]發(fā)送子模塊，被配置為向服務器發(fā)送所述目標聲音；
[0052]接收子模塊，被配置為接收所述服務器返回的所述目標聲音的發(fā)聲原因。
[0053]在一實施例中，所述裝置還包括:
[0054]檢測廣播模塊，被配置為若檢測到所述當前監(jiān)控設備未接入網(wǎng)絡，則廣播報文，以使所述移動終端顯示所述當前監(jiān)控設備未接入網(wǎng)絡的提示信息；
[0055]接收連接模塊，被配置為接收所述移動終端廣播的路由器的名稱和密碼，并向所述路由器發(fā)送連接請求，以連接到所述路由器上。
[0056]在一實施例中，所述裝置還包括:
[0057]訓練模塊，被配置為針對每個聲音模板，對當前聲音模板進行訓練。
[0058]在一實施例中，所述訓練模塊包括:
[0059]采集子模塊，被配置為采集預設數(shù)量的目標聲音特征樣本；
[0060]輸入子模塊，被配置為將所述采集子模塊采集到的所述預設數(shù)量的目標聲音特征樣本輸入當前聲音模板，得到所述預設數(shù)量的目標聲音特征樣本相對于當前聲音模板的失真距離，所述失真距離用于表示所述預設數(shù)量的目標聲音特征樣本與通過所述當前聲音模板輸出的目標聲音之間的差距；
[0061]第一訓練子模塊，被配置為若所述輸入子模塊得到的所述失真距離小于預設距離，則停止對所述當前聲音模板進行訓練；
[0062]第二訓練子模塊，被配置為若所述輸入子模塊得到的所述失真距離大于等于預設距離，則繼續(xù)調用所述訓練模塊對所述當前聲音模板進行訓練，直至所述失真距離小于預設距離。
[0063]在一實施例中，所述發(fā)聲信息還攜帶有所述目標聲音。
[0064]根據(jù)本公開實施例的第三方面，提供一種對象監(jiān)控裝置，包括:
[0065]處理器；
[0066]用于存儲處理器可執(zhí)行指令的存儲器；
[0067]其中，處理器被配置為:
[0068]當采集到的聲音中存在目標聲音時，判斷所述目標聲音的發(fā)聲原因；
[0069]向移動終端推送發(fā)聲信息，所述發(fā)聲信息攜帶有所述發(fā)聲原因。
[0070]本公開的實施例提供的技術方案可以包括以下有益效果:通過判斷采集到的目標聲音的發(fā)聲原因，并向移動終端推送攜帶有發(fā)聲原因的發(fā)聲信息，使得用戶可以獲得被監(jiān)控對象的發(fā)聲原因，達到很好的監(jiān)控目的。
[0071]通過向移動終端推送視頻信息，使得移動終端可以顯示該視頻信息，從而方便用戶遠程查看該視頻信息。
[0072]通過獲取目標聲音的發(fā)聲位置來采集視頻信息，實現(xiàn)方式簡單。
[0073]通過將提取到的目標聲音特征信息與預存的已經(jīng)訓練好的多個聲音模板進行匹配，得到目標聲音的發(fā)聲原因，實現(xiàn)方式簡單，得到的發(fā)聲原因準確率高。
[0074]通過對目標聲音進行壓縮處理，達到降低系統(tǒng)的運算和存儲負擔以及去除目標聲音相關性的目的。
[0075]通過與服務器進行交互也可以判斷目標聲音的發(fā)聲原因，由此可見，可以通過多種方式判斷目標聲音的發(fā)聲原因。
[0076]通過與移動終端進行交互以接入路由器，從而為二者建立綁定關系提供條件，進而為后續(xù)進行監(jiān)控提供條件。
[0077]通過對聲音模板進行訓練，為判斷目標聲音的發(fā)聲原因提供條件。
[0078]通過將預設數(shù)量的目標聲音特征樣本輸入當前聲音模板，得到失真距離，并將失真距離與預設距離進行比較，來完成聲音模板的訓練過程，實現(xiàn)方式簡單，訓練出的聲音模板可以準確地識別出目標聲音的發(fā)聲原因。
[0079]通過描述發(fā)聲信息還攜帶有目標聲音，展示了向移動終端推送的發(fā)聲信息的多樣性。
[0080]應當理解的是，以上的一般描述和后文的細節(jié)描述僅是示例性和解釋性的，并不能限制本公開。
【附圖說明】
[0081]此處的附圖被并入說明書中并構成本說明書的一部分，示出了符合本發(fā)明的實施例，并與說明書一起用于解釋本發(fā)明的原理。
[0082]圖1是根據(jù)一示例性實施例示出的一種對象監(jiān)控方法的流程圖。
[0083]圖2是根據(jù)一示例性實施例示出的另一種對象監(jiān)控方法的流程圖。
[0084]圖3是根據(jù)一示例性實施例示出的一種對象監(jiān)控方法的場景圖。
[0085]圖4是根據(jù)一示例性實施例示出的一種判斷目標聲音的發(fā)聲原因的流程圖。
[0086]圖5是根據(jù)一示例性實施例示出的一種對當前聲音模板進行訓練的流程圖。
[0087]圖6是根據(jù)一示例性實施例示出的一種對象監(jiān)控裝置的框圖。
[0088]圖7是根據(jù)一示例性實施例示出的另一種對象監(jiān)控裝置的框圖。
[0089]圖8是根據(jù)一示例性實施例示出的另一種對象監(jiān)控裝置的框圖。
[0090]圖9是根據(jù)一示例性實施例示出的另一種對象監(jiān)控裝置的框圖。
[0091]圖10是根據(jù)一示例性實施例示出的另一種對象監(jiān)控裝置的框圖。
[0092]圖11是根據(jù)一示例性實施例示出的另一種對象監(jiān)控裝置的框圖。
[0093]圖12是根據(jù)一示例性實施例示出的另一種對象監(jiān)控裝置的框圖。
[0094]圖13是根據(jù)一示例性實施例示出的另一種對象監(jiān)控裝置的框圖。
[0095]圖14是根據(jù)一示例性實施例示出的另一種對象監(jiān)控裝置的框圖。
[0096]圖15是根據(jù)一示例性實施例示出的一種適用于對象監(jiān)控裝置的框圖。
【具體實施方式】
[0097]這里將詳細地對示例性實施例進行說明，其示例表示在附圖中。下面的描述涉及附圖時，除非另有表示，不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本發(fā)明相一致的所有實施方式。相反，它們僅是與如所附權利要求書中所詳述的、本發(fā)明的一些方面相一致的裝置和方法的例子。
[0098]圖1是根據(jù)一示例性實施例示出的一種對象監(jiān)控方法的流程圖，如圖1所示，該對象監(jiān)控方法可應用于監(jiān)控設備上，該監(jiān)控設備可以包括但不局限于智能攝像機，該方法包括以下步驟S101-S102:
[0099]在步驟SlOl中，當采集到的聲音中存在目標聲音時，判斷該目標聲音的發(fā)聲原因。
[0100]其中，可以通過內(nèi)置在攝像機中的麥克風采集被監(jiān)控對象的聲音，被監(jiān)控對象可以包括但不局限于兒童、老人等，目標聲音可以指哭聲等。
[0101]在該實施例中，智能攝像機在采集到目標聲音例如哭聲后，可以通過提取哭聲特征信息，并將提取的哭聲特征信息與已經(jīng)訓練好的多個聲音模板進行匹配來得到哭聲的發(fā)聲原因。
[0102]另外，智能攝像機也可以通過與服務器進行交互來獲得哭聲的發(fā)聲原因。例如，智能攝像機可以向服務器發(fā)送目標聲音，服務器在接收到目標聲音后也可以通過提取哭聲特征信息，并將提取的哭聲特征信息與已經(jīng)訓練好的多個聲音模板進行匹配來得到哭聲的發(fā)聲原因，然后向智能攝像機返回哭聲的發(fā)聲原因。
[0103]在步驟S102中，向移動終端推送發(fā)聲信息，發(fā)聲信息攜帶有發(fā)聲原因。
[0104]在該實施例中，在判斷目標聲音的發(fā)聲原因之后，可以向移動終端例如手機推送攜帶有發(fā)聲原因的發(fā)聲信息，以提示用戶兒童哭泣的原因。
[0105]另外，該發(fā)聲信息中也可以攜帶有目標聲音，例如可以向手機推送兒童的哭聲及哭泣的原因。
[0106]上述對象監(jiān)控方法實施例，通過判斷采集到的目標聲音的發(fā)聲原因，并向移動終端推送攜帶有發(fā)聲原因的發(fā)聲信息，使得用戶可以獲得被監(jiān)控對象的發(fā)聲原因，達到很好的監(jiān)控目的。
[0107]圖2是根據(jù)一示例性實施例示出的另一種對象監(jiān)控方法的流程圖，如圖2所示，在上述步驟S102之后，該方法還可以包括如下步驟:
[0108]在步驟S103中，接收移動終端發(fā)送的視頻獲取指令。
[0109]在該實施例中，當前監(jiān)控設備例如內(nèi)置有無線保真(WIFI)芯片的智能攝像機在向移動終端推送發(fā)聲信息之后，如果用戶希望查看被監(jiān)控對象的視頻信息，例如兒童的視頻信息，則可以通過移動終端上的應用程序(APP)向智能攝像機發(fā)送視頻獲取指令。
[0110]在該實施例中，智能攝像機與上述APP可以通過同一用戶賬號建立綁定關系。而在二者建立綁定關系之前，智能攝像機可以與該移動終端接入到同一路由器上，智能攝像機接入路由器的過程可以為:
[0111]智能攝像機檢測到自己未接入網(wǎng)絡，則廣播報文，以使移動終端顯示智能攝像機未接入網(wǎng)絡的提示信息，用戶在看到該提示信息后，可以通過移動終端向智能攝像機廣播自己所連接的路由器的名稱和密碼，智能攝像機在接收到路由器的名稱和密碼后，可以向該路由器發(fā)送連接請求，以連接到該路由器上。
[0112]由于智能攝像機和移動終端連接到同一路由器即位于同一局域網(wǎng)內(nèi)，因此，APP可以通過掃描獲得智能攝像機的綁定狀態(tài)，并顯示智能攝像機的綁定狀態(tài)。其中，綁定狀態(tài)包括已綁定和未綁定兩種狀態(tài)。
[0113]當智能攝像機的綁定狀態(tài)為未綁定時，如果用戶想控制該智能攝像機，則可以觸發(fā)綁定操作，然后該APP向服務器發(fā)送攜帶智能攝像機的標識和用戶賬號例如小米賬號的請求，這樣，服務器可以根據(jù)該請求將智能攝像機與用戶賬號進行綁定。
[0114]當該智能攝像機與移動終端APP通過同一用戶賬號綁定后，用戶可以通過該移動終端APP向智能攝像機發(fā)送控制指令例如視頻獲取指令。
[0115]在步驟S104中，根據(jù)該視頻獲取指令向移動終端推送視頻信息，以使移動終端顯示視頻信息。
[0116]在該實施例中，智能攝像機可以獲取目標聲音的發(fā)聲位置，并控制攝像頭轉向發(fā)聲位置對應的方向，然后采集視頻信息。該視頻信息采集方式簡單，易于實現(xiàn)。
[0117]在智能攝像機采集好視頻信息之后，若接收到來自移動終端的視頻獲取指令，則可以向該移動終端推送視頻信息，以方便用戶遠程查看被監(jiān)控對象例如兒童的視頻信息。
[0118]下面結合圖3對本公開進行示例性說明，如圖3所示，智能攝像機31通過內(nèi)置的麥克風采集到聲音中存在哭聲后，通過提取哭聲特征信息，并將提取的哭聲特征信息與已經(jīng)訓練好的多個聲音模板進行匹配來得到哭聲的發(fā)聲原因。由于智能攝像機31和手機32連接到同一路由器33即位于同一局域網(wǎng)內(nèi)，因此，智能攝像機31與位于手機32中的APP可以通過當前用戶賬號建立綁定關系，故智能攝像機31可以通過服務器34向手機32推送發(fā)聲信息，該發(fā)聲信息攜帶有哭聲的發(fā)聲原因，此時若用戶希望查看智能攝像機31拍攝的視頻信息，則可以通過手機32向智能攝像機31發(fā)送視頻獲取指令，智能攝像機31在接收到該視頻獲取指令后，可以向手機32推送獲取的視頻信息，使得用戶可以遠程查看視頻信息。
[0119]上述實施例，通過向移動終端推送視頻信息，使得移動終端可以顯示該視頻信息，從而方便用戶遠程查看該視頻信息。
[0120]圖4是根據(jù)一示例性實施例示出的一種判斷目標聲音的發(fā)聲原因的流程圖，該實施例從監(jiān)控設備例如智能攝像機側進行描述，也可以從服務器側進行描述，即監(jiān)控設備和服務器均可以通過以下方式判斷目標聲音的發(fā)聲原因，如圖4所示，該方法包括如下步驟:
[0121]在步驟S401中，針對每個聲音模板，對當前聲音模板進行訓練。
[0122]在該實施例中，首先需要對多個聲音模板中的每個聲音模板進行訓練，以達到將目標聲音輸入聲音模板后，可以識別出發(fā)聲原因。其中，多個聲音模板用于識別不同原因引起的目標聲首。
[0123]其中，如圖5所示，對當前聲音模板進行訓練的過程可以包括如下步驟:
[0124]在步驟S4011中，采集預設數(shù)量的目標聲音特征樣本。
[0125]在步驟S4012中，將預設數(shù)量的目標聲音特征樣本輸入當前聲音模板，得到預設數(shù)量的目標聲音特征樣本相對于當前聲音模板的失真距離。
[0126]失真距離用于表示預設數(shù)量的目標聲音特征樣本與通過當前聲音模板輸出的目標聲音之間的差距。
[0127]在步驟S4013中，判斷失真距離是否小于預設距離，若失真距離小于預設距離，則停止對當前聲音模板進行訓練，若失真距離大于等于預設距離，則轉向執(zhí)行步驟S4011。
[0128]其中，失真距離越小，則表明預設數(shù)量的目標聲音特征樣本與通過當前聲音模板輸出的目標聲音之間的差距越小。
[0129]當失真距離小于預設距離，則完成對當前聲音模板的訓練，否則，繼續(xù)訓練，直至失真距離小于預設距離。
[0130]在步驟S402中，對目標聲音進行特征提取，得到目標聲音特征信息。
[0131 ]在該實施例中，若目標聲音例如哭聲數(shù)據(jù)量比較大，則可以先對目標聲音進行壓縮處理，以降低系統(tǒng)的運算和存儲負擔，另外，壓縮后的目標聲音可以去除目標聲音的相關性，例如去除哭聲的相關性，以達到用較少的特征信息來表達哭聲信號的目的。當然，若目標聲音數(shù)據(jù)量不大且已去除相關性，則不需要進行壓縮處理。其中，可以采用已有的壓縮技術例如無損壓縮技術對目標聲音進行壓縮處理。
[0132]在該實施例中，在對目標聲音進行壓縮處理，得到壓縮聲音信息之后，可以對壓縮聲音信息進行特征提取，得到目標聲音特征信息。
[0133]在步驟S403中，將目標聲音特征信息與預存的多個聲音模板進行匹配，并根據(jù)匹配結果得到目標聲音的發(fā)聲原因。
[0134]在該實施例中，可以將提取到的目標聲音特征信息與預存的已經(jīng)訓練好的多個聲音模板進行匹配，從而得到目標聲音的發(fā)聲原因。
[0135]上述實施例，通過將提取到的目標聲音特征信息與預存的已經(jīng)訓練好的多個聲音模板進行匹配，得到目標聲音的發(fā)聲原因，實現(xiàn)方式簡單，得到的發(fā)聲原因準確率高。
[0136]與前述對象監(jiān)控方法實施例相對應，本公開還提供了對象監(jiān)控裝置實施例。
[0137]圖6是根據(jù)一示例性實施例示出的一種對象監(jiān)控裝置的框圖，如圖6所示，該對象監(jiān)控裝置包括:判斷模塊61和第一推送模塊62。
[0138]判斷模塊61被配置為當采集到的聲音中存在目標聲音時，判斷目標聲音的發(fā)聲原因。
[0139]其中，判斷模塊6丨可以通過內(nèi)置在攝像機中的麥克風采集被監(jiān)控對象的聲音，被監(jiān)控對象可以包括但不局限于兒童、老人等，目標聲音可以指哭聲等。
[0140]在該實施例中，智能攝像機在采集到目標聲音例如哭聲后，可以通過提取哭聲特征信息，并將提取的哭聲特征信息與已經(jīng)訓練好的多個聲音模板進行匹配來得到哭聲的發(fā)聲原因。
[0141 ]另外，智能攝像機也可以通過與服務器進行交互來獲得哭聲的發(fā)聲原因。例如，智能攝像機可以向服務器發(fā)送目標聲音，服務器在接收到目標聲音后也可以通過提取哭聲特征信息，并將提取的哭聲特征信息與已經(jīng)訓練好的多個聲音模板進行匹配來得到哭聲的發(fā)聲原因，然后向智能攝像機返回哭聲的發(fā)聲原因。
[0142]第一推送模塊62被配置為向移動終端推送發(fā)聲信息，發(fā)聲信息攜帶有判斷模塊61判斷出的發(fā)聲原因。
[0143]在該實施例中，在判斷目標聲音的發(fā)聲原因之后，可以向移動終端例如手機推送攜帶有發(fā)聲原因的發(fā)聲信息，以提示用戶兒童哭泣的原因。
[0144]另外，該發(fā)聲信息中也可以攜帶有目標聲音，例如可以向手機推送兒童的哭聲及哭泣的原因。
[0145]如圖6所示的裝置用于實現(xiàn)上述如圖1所示的方法流程，涉及到的相關內(nèi)容描述相同，此處不贅述。
[0146]上述實施例，通過判斷采集到的目標聲音的發(fā)聲原因，并向移動終端推送攜帶有發(fā)聲原因的發(fā)聲信息，使得用戶可以獲得被監(jiān)控對象的發(fā)聲原因，達到很好的監(jiān)控目的。
[0147]圖7是根據(jù)一示例性實施例示出的另一種對象監(jiān)控裝置的框圖，如圖7所示，在上述圖6所示實施例的基礎上，該裝置還可包括:接收模塊63和第二推送模塊64。
[0148]接收模塊63，被配置為在第一推送模塊62向移動終端推送發(fā)聲信息之后，接收移動終端發(fā)送的視頻獲取指令。
[0149]在該實施例中，當前監(jiān)控設備例如內(nèi)置有無線保真(WIFI)芯片的智能攝像機在向移動終端推送發(fā)聲信息之后，如果用戶希望查看被監(jiān)控對象的視頻信息，例如兒童的視頻信息，則可以通過移動終端上的應用程序(APP)向智能攝像機發(fā)送視頻獲取指令。
[0150]當該智能攝像機與移動終端APP通過同一用戶賬號綁定后，用戶可以通過該移動終端APP向智能攝像機發(fā)送控制指令例如視頻獲取指令。
[0151]第二推送模塊64，被配置為根據(jù)接收模塊63接收的視頻獲取指令向移動終端推送視頻信息，以使移動終端顯示視頻信息。
[0152]如圖7所示的裝置用于實現(xiàn)上述如圖2所示的方法流程，涉及到的相關內(nèi)容描述相同，此處不贅述。
[0153]上述實施例，通過向移動終端推送視頻信息，使得移動終端可以顯示該視頻信息，從而方便用戶遠程查看該視頻信息。
[0154]圖8是根據(jù)一示例性實施例示出的另一種對象監(jiān)控裝置的框圖，如圖8所示，在上述圖7所示實施例的基礎上，該裝置還可以包括:獲取模塊65和轉向采集模塊66。
[0155]獲取模塊65被配置為在第二推送模塊64根據(jù)視頻獲取指令向移動終端推送視頻信息之前，獲取目標聲音的發(fā)聲位置。
[0156]轉向采集模塊66被配置為控制攝像頭轉向獲取模塊65獲取的發(fā)聲位置對應的方向，并米集視頻?目息。
[0157]在該實施例中，智能攝像機可以獲取目標聲音的發(fā)聲位置，并控制攝像頭轉向發(fā)聲位置對應的方向，然后采集視頻信息。該視頻信息采集方式簡單，易于實現(xiàn)。
[0158]如圖8所示的裝置用于實現(xiàn)上述如圖2所示的方法流程，涉及到的相關內(nèi)容描述相同，此處不贅述。
[0159]上述實施例，通過獲取目標聲音的發(fā)聲位置來采集視頻信息，實現(xiàn)方式簡單。
[0160]圖9是根據(jù)一示例性實施例示出的另一種對象監(jiān)控裝置的框圖，如圖9所示，在上述圖6所示實施例的基礎上，判斷模塊61可包括:提取子模塊611和匹配子模塊612。
[0161 ]提取子模塊611被配置為對目標聲音進行特征提取，得到目標聲音特征信息。
[0162]匹配子模塊612被配置為將提取子模塊611提取到的目標聲音特征信息與預存的多個聲音模板進行匹配，并根據(jù)匹配結果得到目標聲音的發(fā)聲原因，多個聲音模板用于識別不同原因引起的目標聲音。
[0163]在該實施例中，可以將提取到的目標聲音特征信息與預存的已經(jīng)訓練好的多個聲音模板進行匹配，從而得到目標聲音的發(fā)聲原因。
[0164]如圖9所示的裝置用于實現(xiàn)上述如圖4所示的方法流程，涉及到的相關內(nèi)容描述相同，此處不贅述。
[0165]上述實施例，通過將提取到的目標聲音特征信息與預存的已經(jīng)訓練好的多個聲音模板進行匹配，得到目標聲音的發(fā)聲原因，實現(xiàn)方式簡單，得到的發(fā)聲原因準確率高。
[0166]圖10是根據(jù)一示例性實施例示出的另一種對象監(jiān)控裝置的框圖，如圖10所示，在上述圖9所示實施例的基礎上，提取子模塊611可包括:壓縮單元6111和提取單元6112。
[0167]壓縮單元6111被配置為對目標聲音進行壓縮處理，得到壓縮聲音信息。
[0168]提取單元6112被配置為對壓縮單元6111得到的壓縮聲音信息進行特征提取，得到目標聲音特征信息。
[0169]如圖10所示的裝置用于實現(xiàn)上述如圖4所示的方法流程，涉及到的相關內(nèi)容描述相同，此處不贅述。
[0170]在該實施例中，若目標聲音例如哭聲數(shù)據(jù)量比較大，則可以先對目標聲音進行壓縮處理，以降低系統(tǒng)的運算和存儲負擔，另外，壓縮后的目標聲音可以去除目標聲音的相關性，例如去除哭聲的相關性，以達到用較少的特征信息來表達哭聲信號的目的。當然，若目標聲音數(shù)據(jù)量不大且已去除相關性，則不需要進行壓縮處理。其中，可以采用已有的壓縮技術例如無損壓縮技術對目標聲音進行壓縮處理。
[0171]上述實施例，通過對目標聲音進行壓縮處理，達到降低系統(tǒng)的運算和存儲負擔以及去除目標聲音相關性的目的。
[0172]圖11是根據(jù)一示例性實施例示出的另一種對象監(jiān)控裝置的框圖，如圖11所示，在上述圖6所示實施例的基礎上，判斷模塊61可包括:發(fā)送子模塊613和接收子模塊614。
[0173]發(fā)送子模塊613被配置為向服務器發(fā)送目標聲音。
[0174]接收子模塊614被配置為接收服務器返回的目標聲音的發(fā)聲原因。
[0175]對象監(jiān)控裝置例如智能攝像機可以通過與服務器進行交互來獲得哭聲的發(fā)聲原因。例如，智能攝像機可以向服務器發(fā)送目標聲音，服務器在接收到目標聲音后也可以通過提取哭聲特征信息，并將提取的哭聲特征信息與已經(jīng)訓練好的多個聲音模板進行匹配來得到哭聲的發(fā)聲原因，然后向智能攝像機返回哭聲的發(fā)聲原因。
[0176]如圖11所示的裝置用于實現(xiàn)上述如圖1所示的方法流程，涉及到的相關內(nèi)容描述相同，此處不贅述。
[0177]上述實施例，通過與服務器進行交互也可以判斷目標聲音的發(fā)聲原因，由此可見，可以通過多種方式判斷目標聲音的發(fā)聲原因。
[0178]圖12是根據(jù)一示例性實施例示出的另一種對象監(jiān)控裝置的框圖，如圖12所示，在上述圖7所示實施例的基礎上，該裝置還可包括:檢測廣播模塊67和接收連接模塊68。
[0179]檢測廣播模塊67被配置為若檢測到當前監(jiān)控設備未接入網(wǎng)絡，則廣播報文，以使移動終端顯示當前監(jiān)控設備未接入網(wǎng)絡的提示信息。
[0180]接收連接模塊68被配置為接收移動終端廣播的路由器的名稱和密碼，并向路由器發(fā)送連接請求，以連接到路由器上。
[0181]在該實施例中，智能攝像機與上述APP可以通過同一用戶賬號建立綁定關系。而在二者建立綁定關系之前，智能攝像機可以與該移動終端接入到同一路由器上，智能攝像機接入路由器的過程可以為:
[0182]智能攝像機檢測到自己未接入網(wǎng)絡，則廣播報文，以使移動終端顯示智能攝像機未接入網(wǎng)絡的提示信息，用戶在看到該提示信息后，可以通過移動終端向智能攝像機廣播自己所連接的路由器的名稱和密碼，智能攝像機在接收到路由器的名稱和密碼后，可以向該路由器發(fā)送連接請求，以連接到該路由器上。
[0183]由于智能攝像機和移動終端連接到同一路由器即位于同一局域網(wǎng)內(nèi)，因此，APP可以通過掃描獲得智能攝像機的綁定狀態(tài)，并顯示智能攝像機的綁定狀態(tài)。其中，綁定狀態(tài)包括已綁定和未綁定兩種狀態(tài)。
[0184]當智能攝像機的綁定狀態(tài)為未綁定時，如果用戶想控制該智能攝像機，則可以觸發(fā)綁定操作，然后該APP向服務器發(fā)送攜帶智能攝像機的標識和用戶賬號例如小米賬號的請求，這樣，服務器可以根據(jù)該請求將智能攝像機與用戶賬號進行綁定。
[0185]如圖12所示的裝置用于實現(xiàn)上述如圖2所示的方法流程，涉及到的相關內(nèi)容描述相同，此處不贅述。
[0186]上述實施例，通過與移動終端進行交互以接入路由器，從而為二者建立綁定關系提供條件，進而為后續(xù)進行監(jiān)控提供條件。
[0187]圖13是根據(jù)一示例性實施例示出的另一種對象監(jiān)控裝置的框圖，如圖13所示，在上述圖9所示實施例的基礎上，該裝置還可包括:訓練模塊69。
[0188]訓練模塊69被配置為針對每個聲音模板，對當前聲音模板進行訓練。
[0189]在該實施例中，首先需要對多個聲音模板中的每個聲音模板進行訓練，以達到將目標聲音輸入聲音模板后，可以識別出發(fā)聲原因。其中，多個聲音模板用于識別不同原因引起的目標聲首。
[0190]如圖13所示的裝置用于實現(xiàn)上述如圖4所示的方法流程，涉及到的相關內(nèi)容描述相同，此處不贅述。
[0191]上述實施例，通過對聲音模板進行訓練，為判斷目標聲音的發(fā)聲原因提供條件。
[0192]圖14是根據(jù)一示例性實施例示出的另一種對象監(jiān)控裝置的框圖，如圖14所示，在上述圖13所示實施例的基礎上，訓練模塊69可包括:采集子模塊691、輸入子模塊692、第一訓練子模塊693和第二訓練子模塊694。
[0193]采集子模塊691被配置為采集預設數(shù)量的目標聲音特征樣本。
[0194]輸入子模塊692被配置為將采集子模塊691采集到的預設數(shù)量的目標聲音特征樣本輸入當前聲音模板，得到預設數(shù)量的目標聲音特征樣本相對于當前聲音模板的失真距離，失真距離用于表示預設數(shù)量的目標聲音特征樣本與通過當前聲音模板輸出的目標聲音之間的差距。
[0195]第一訓練子模塊693被配置為若輸入子模塊692得到的失真距離小于預設距離，則停止對當前聲音模板進行訓練。
[0196]第二訓練子模塊694被配置為若輸入子模塊692得到的失真距離大于等于預設距離，則繼續(xù)調用訓練模塊對當前聲音模板進行訓練，直至失真距離小于預設距離。
[0197]其中，失真距離越小，則表明預設數(shù)量的目標聲音特征樣本與通過當前聲音模板輸出的目標聲音之間的差距越小。
[0198]當失真距離小于預設距離，則完成對當前聲音模板的訓練，否則，繼續(xù)訓練，直至失真距離小于預設距離。
[0199]如圖14所示的裝置用于實現(xiàn)上述如圖5所示的方法流程，涉及到的相關內(nèi)容描述相同，此處不贅述。
[0200]上述實施例，通過將預設數(shù)量的目標聲音特征樣本輸入當前聲音模板，得到失真距離，并將失真距離與預設距離進行比較，來完成聲音模板的訓練過程，實現(xiàn)方式簡單，訓練出的聲音模板可以準確地識別出目標聲音的發(fā)聲原因。
[0201]關于上述實施例中的裝置，其中各個模塊、子模塊執(zhí)行操作的具體方式已經(jīng)在有關該方法的實施例中進行了詳細描述，此處將不做詳細闡述說明。
[0202]圖15是根據(jù)一示例性實施例示出的一種適用于對象監(jiān)控裝置的框圖。例如，裝置1500可以是移動電話，計算機，數(shù)字廣播終端，消息收發(fā)設備，游戲控制臺，平板設備，醫(yī)療設備，健身設備，個人數(shù)字助理，飛行器等。
[0203]參照圖15，裝置1500可以包括以下一個或多個組件:處理組件1502，存儲器1504，電源組件1506，多媒體組件1508，音頻組件1510，輸入/輸出(I /0)的接口 1512，傳感器組件1514，以及通信組件1516。
[0204]處理組件1502通?？刂蒲b置1500的整體操作，諸如與顯示，電話呼叫，數(shù)據(jù)通信，相機操作和記錄操作相關聯(lián)的操作。處理元件1502可以包括一個或多個處理器1520來執(zhí)行指令，以完成上述的方法的全部或部分步驟。此外，處理組件1502可以包括一個或多個模塊，便于處理組件1502和其他組件之間的交互。例如，處理部件1502可以包括多媒體模塊，以方便多媒體組件1508和處理組件1502之間的交互。
[0205]存儲器1504被配置為存儲各種類型的數(shù)據(jù)以支持在設備1500的操作。這些數(shù)據(jù)的示例包括用于在裝置1500上操作的任何應用程序或方法的指令，聯(lián)系人數(shù)據(jù)，電話簿數(shù)據(jù)，消息，圖片，視頻等。存儲器1504可以由任何類型的易失性或非易失性存儲設備或者它們的組合實現(xiàn)，如靜態(tài)隨機存取存儲器(SRAM)，電可擦除可編程只讀存儲器(EEPROM)，可擦除可編程只讀存儲器(EPR0M)，可編程只讀存儲器(PROM)，只讀存儲器(ROM)，磁存儲器，快閃存儲器，磁盤或光盤。
[0206]電源組件1506為裝置1500的各種組件提供電力。電源組件1506可以包括電源管理系統(tǒng)，一個或多個電源，及其他與為裝置1500生成、管理和分配電力相關聯(lián)的組件。
[0207]多媒體組件1508包括在所述裝置1500和用戶之間的提供一個輸出接口的屏幕。在一些實施例中，屏幕可以包括液晶顯示器(LCD)和觸摸面板(TP)。如果屏幕包括觸摸面板，屏幕可以被實現(xiàn)為觸摸屏，以接收來自用戶的輸入信號。觸摸面板包括一個或多個觸摸傳感器以感測觸摸、滑動和觸摸面板上的手勢。所述觸摸傳感器可以不僅感測觸摸或滑動動作的邊界，而且還檢測與所述觸摸或滑動操作相關的持續(xù)時間和壓力。在一些實施例中，多媒體組件1508包括一個前置攝像頭和/或后置攝像頭。當設備1500處于操作模式，如拍攝模式或視頻模式時，前置攝像頭和/或后置攝像頭可以接收外部的多媒體數(shù)據(jù)。每個前置攝像頭和后置攝像頭可以是一個固定的光學透鏡系統(tǒng)或具有焦距和光學變焦能力。
[0208]音頻組件1510被配置為輸出和/或輸入音頻信號。例如，音頻組件1510包括一個麥克風(MIC)，當裝置1500處于操作模式，如呼叫模式、記錄模式和語音識別模式時，麥克風被配置為接收外部音頻信號。所接收的音頻信號可以被進一步存儲在存儲器1504或經(jīng)由通信組件1516發(fā)送。在一些實施例中，音頻組件1510還包括一個揚聲器，用于輸出音頻信號。
[0209]I/O接口 1512為處理組件1502和外圍接口模塊之間提供接口，上述外圍接口模塊可以是鍵盤，點擊輪，按鈕等。這些按鈕可包括但不限于:主頁按鈕、音量按鈕、啟動按鈕和鎖定按鈕。
[0210]傳感器組件1514包括一個或多個傳感器，用于為裝置1500提供各個方面的狀態(tài)評估。例如，傳感器組件1514可以檢測到設備1500的打開/關閉狀態(tài)，組件的相對定位，例如所述組件為裝置1500的顯示器和小鍵盤，傳感器組件1514還可以檢測裝置1500或裝置1500—個組件的位置改變，用戶與裝置1500接觸的存在或不存在，裝置1500方位或加速/減速和裝置1500的溫度變化。傳感器組件1514可以包括接近傳感器，被配置用來在沒有任何的物理接觸時檢測附近物體的存在。傳感器組件1514還可以包括光傳感器，如CMOS或CCD圖像傳感器，用于在成像應用中使用。在一些實施例中，該傳感器組件1514還可以包括加速度傳感器，陀螺儀傳感器，磁傳感器，壓力傳感器或溫度傳感器。
[0211]通信組件1516被配置為便于裝置1500和其他設備之間有線或無線方式的通信。裝置1500可以接入基于通信標準的無線網(wǎng)絡，如WiFi，2G或3G，或它們的組合。在一個示例性實施例中，通信部件1516經(jīng)由廣播信道接收來自外部廣播管理系統(tǒng)的廣播信號或廣播相關信息。在一個示例性實施例中，所述通信部件1516還包括近場通信(NFC)模塊，以促進短程通信。例如，在NFC模塊可基于射頻識別(RFID)技術，紅外數(shù)據(jù)協(xié)會(IrDA)技術，超寬帶(UWB)技術，藍牙(BT)技術和其他技術來實現(xiàn)。
[0212]在示例性實施例中，裝置1500可以被一個或多個應用專用集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理設備(DSPD)、可編程邏輯器件(PLD)、現(xiàn)場可編程門陣列(FPGA)、控制器、微控制器、微處理器或其他電子元件實現(xiàn)，用于執(zhí)行上述方法。
[0213]在示例性實施例中，還提供了一種包括指令的非臨時性計算機可讀存儲介質，例如包括指令的存儲器1504，上述指令可由裝置1500的處理器1520執(zhí)行以完成上述方法。例如，所述非臨時性計算機可讀存儲介質可以是R0M、隨機存取存儲器(RAM)、CD-R0M、磁帶、軟盤和光數(shù)據(jù)存儲設備等。
[0214]本領域技術人員在考慮說明書及實踐這里公開的公開后，將容易想到本公開的其它實施方案。本申請旨在涵蓋本公開的任何變型、用途或者適應性變化，這些變型、用途或者適應性變化遵循本公開的一般性原理并包括本公開未公開的本技術領域中的公知常識或慣用技術手段。說明書和實施例僅被視為示例性的，本公開的真正范圍和精神由下面的權利要求指出。
[0215]應當理解的是，本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結構，并且可以在不脫離其范圍進行各種修改和改變。本公開的范圍僅由所附的權利要求來限制。
【主權項】
1.一種對象監(jiān)控方法，其特征在于，所述方法包括: 當采集到的聲音中存在目標聲音時，判斷所述目標聲音的發(fā)聲原因；向移動終端推送發(fā)聲信息，所述發(fā)聲信息攜帶有所述發(fā)聲原因。2.根據(jù)權利要求1所述的對象監(jiān)控方法，其特征在于，在所述向移動終端推送發(fā)聲信息之后，所述方法還包括: 接收所述移動終端發(fā)送的視頻獲取指令；根據(jù)所述視頻獲取指令向所述移動終端推送視頻信息，以使所述移動終端顯示所述視頻信息。3.根據(jù)權利要求2所述的對象監(jiān)控方法，其特征在于，在所述根據(jù)所述視頻獲取指令向所述移動終端推送視頻信息之前，所述方法還包括: 獲取所述目標聲音的發(fā)聲位置；控制攝像頭轉向所述發(fā)聲位置對應的方向，并采集所述視頻信息。4.根據(jù)權利要求1所述的對象監(jiān)控方法，其特征在于，所述判斷所述目標聲音的發(fā)聲原因，包括: 對所述目標聲音進行特征提取，得到目標聲音特征信息；將所述目標聲音特征信息與預存的多個聲音模板進行匹配，并根據(jù)匹配結果得到所述目標聲音的發(fā)聲原因，所述多個聲音模板用于識別不同原因引起的目標聲音。5.根據(jù)權利要求4所述的對象監(jiān)控方法，其特征在于，所述對所述目標聲音進行特征提取，得到目標聲音特征信息，包括: 對所述目標聲音進行壓縮處理，得到壓縮聲音信息；對所述壓縮聲音信息進行特征提取，得到所述目標聲音特征信息。6.根據(jù)權利要求1所述的對象監(jiān)控方法，其特征在于，所述判斷所述目標聲音的發(fā)聲原因，包括: 向服務器發(fā)送所述目標聲音；接收所述服務器返回的所述目標聲音的發(fā)聲原因。7.根據(jù)權利要求2所述的對象監(jiān)控方法，其特征在于，所述方法還包括: 若檢測到所述當前監(jiān)控設備未接入網(wǎng)絡，則廣播報文，以使所述移動終端顯示所述當前監(jiān)控設備未接入網(wǎng)絡的提示信息；接收所述移動終端廣播的路由器的名稱和密碼，并向所述路由器發(fā)送連接請求，以連接到所述路由器上。8.根據(jù)權利要求4所述的對象監(jiān)控方法，其特征在于，所述方法還包括: 針對每個聲音模板，對當前聲音模板進行訓練。9.根據(jù)權利要求8所述的對象監(jiān)控方法，其特征在于，所述對當前聲音模板進行訓練，包括: 采集預設數(shù)量的目標聲音特征樣本；將所述預設數(shù)量的目標聲音特征樣本輸入當前聲音模板，得到所述預設數(shù)量的目標聲音特征樣本相對于當前聲音模板的失真距離，所述失真距離用于表示所述預設數(shù)量的目標聲音特征樣本與通過所述當前聲音模板輸出的目標聲音之間的差距；若所述失真距離小于預設距離，則停止對所述當前聲音模板進行訓練；若所述失真距離大于等于預設距離，則繼續(xù)對所述當前聲音模板進行訓練，直至所述失真距離小于預設距離。10.根據(jù)權利要求1至9任一項所述的對象監(jiān)控方法，其特征在于，所述發(fā)聲信息還攜帶有所述目標聲音。11.一種對象監(jiān)控裝置，其特征在于，所述裝置包括: 判斷模塊，被配置為當采集到的聲音中存在目標聲音時，判斷所述目標聲音的發(fā)聲原因；第一推送模塊，被配置為向移動終端推送發(fā)聲信息，所述發(fā)聲信息攜帶有所述判斷模塊判斷出的所述發(fā)聲原因。12.根據(jù)權利要求11所述的對象監(jiān)控裝置，其特征在于，所述裝置還包括: 接收模塊，被配置為在所述第一推送模塊向移動終端推送發(fā)聲信息之后，接收所述移動終端發(fā)送的視頻獲取指令；第二推送模塊，被配置為根據(jù)所述接收模塊接收的所述視頻獲取指令向所述移動終端推送視頻信息，以使所述移動終端顯示所述視頻信息。13.根據(jù)權利要求12所述的對象監(jiān)控裝置，其特征在于，所述裝置還包括: 獲取模塊，被配置為在所述第二推送模塊根據(jù)所述視頻獲取指令向所述移動終端推送視頻信息之前，獲取所述目標聲音的發(fā)聲位置；轉向采集模塊，被配置為控制攝像頭轉向所述獲取模塊獲取的所述發(fā)聲位置對應的方向，并采集所述視頻信息。14.根據(jù)權利要求11所述的對象監(jiān)控裝置，其特征在于，所述判斷模塊包括: 提取子模塊，被配置為對所述目標聲音進行特征提取，得到目標聲音特征信息；匹配子模塊，被配置為將所述提取子模塊提取到的所述目標聲音特征信息與預存的多個聲音模板進行匹配，并根據(jù)匹配結果得到所述目標聲音的發(fā)聲原因，所述多個聲音模板用于識別不同原因引起的目標聲音。15.根據(jù)權利要求14所述的對象監(jiān)控裝置，其特征在于，所述提取子模塊包括: 壓縮單元，被配置為對所述目標聲音進行壓縮處理，得到壓縮聲音信息；提取單元，被配置為對所述壓縮單元得到的所述壓縮聲音信息進行特征提取，得到所述目標聲音特征信息。16.根據(jù)權利要求11所述的對象監(jiān)控裝置，其特征在于，所述判斷模塊包括: 發(fā)送子模塊，被配置為向服務器發(fā)送所述目標聲音；接收子模塊，被配置為接收所述服務器返回的所述目標聲音的發(fā)聲原因。17.根據(jù)權利要求12所述的對象監(jiān)控裝置，其特征在于，所述裝置還包括: 檢測廣播模塊，被配置為若檢測到所述當前監(jiān)控設備未接入網(wǎng)絡，則廣播報文，以使所述移動終端顯示所述當前監(jiān)控設備未接入網(wǎng)絡的提示信息；接收連接模塊，被配置為接收所述移動終端廣播的路由器的名稱和密碼，并向所述路由器發(fā)送連接請求，以連接到所述路由器上。18.根據(jù)權利要求14所述的對象監(jiān)控裝置，其特征在于，所述裝置還包括: 訓練模塊，被配置為針對每個聲音模板，對當前聲音模板進行訓練。19.根據(jù)權利要求18所述的對象監(jiān)控裝置，其特征在于，所述訓練模塊包括: 采集子模塊，被配置為采集預設數(shù)量的目標聲音特征樣本；輸入子模塊，被配置為將所述采集子模塊采集到的所述預設數(shù)量的目標聲音特征樣本輸入當前聲音模板，得到所述預設數(shù)量的目標聲音特征樣本相對于當前聲音模板的失真距離，所述失真距離用于表示所述預設數(shù)量的目標聲音特征樣本與通過所述當前聲音模板輸出的目標聲音之間的差距；第一訓練子模塊，被配置為若所述輸入子模塊得到的所述失真距離小于預設距離，則停止對所述當前聲音模板進行訓練；第二訓練子模塊，被配置為若所述輸入子模塊得到的所述失真距離大于等于預設距離，則繼續(xù)調用所述訓練模塊對所述當前聲音模板進行訓練，直至所述失真距離小于預設距離。20.根據(jù)權利要求11至19任一項所述的對象監(jiān)控裝置，其特征在于，所述發(fā)聲信息還攜帶有所述目標聲音。21.一種對象監(jiān)控裝置，其特征在于，包括: 處理器；用于存儲處理器可執(zhí)行指令的存儲器；其中，所述處理器被配置為: 當采集到的聲音中存在目標聲音時，判斷所述目標聲音的發(fā)聲原因；向移動終端推送發(fā)聲信息，所述發(fā)聲信息攜帶有所述發(fā)聲原因。
【文檔編號】G10L15/10GK105898219SQ201610258363
【公開日】2016年8月24日
【申請日】2016年4月22日
【發(fā)明人】賈偉光, 馬娜, 侯恩星
【申請人】北京小米移動軟件有限公司

完整全部詳細技術資料下載