專利名稱:一種基于聲紋識(shí)別和定位跟蹤的交叉監(jiān)控方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于監(jiān)測(cè)系統(tǒng)領(lǐng)域,尤其涉及一種同時(shí)采用生物識(shí)別技術(shù)和電子定位方法對(duì)被監(jiān)管對(duì)象進(jìn)行識(shí)別和定位的交叉監(jiān)控方法和系統(tǒng)。
背景技術(shù):
相對(duì)于監(jiān)獄矯正,社區(qū)矯正不僅可以降低行刑成本,減輕國家在刑罰上的投入,避免監(jiān)獄內(nèi)人滿為患,防止監(jiān)獄內(nèi)的交叉感染,還有助于罪犯的改造和回歸社會(huì)。
經(jīng)過長期的實(shí)踐,社區(qū)矯正作為一種經(jīng)濟(jì)而又有效的犯人改造和教養(yǎng)方式,在西方主要發(fā)達(dá)國家得到了廣泛的發(fā)展。根據(jù)國外的發(fā)展經(jīng)驗(yàn),我們國家也已經(jīng)在多個(gè)省市區(qū)開始了社區(qū)矯正的試點(diǎn),并計(jì)劃于近期在全國全面推開社區(qū)矯正工作。
很多國家將部分危害風(fēng)險(xiǎn)低的犯人(包括緩刑、輕罪、假釋等犯人)推向社會(huì),實(shí)行社區(qū)矯正改造,由此帶來了如何有效監(jiān)管的技術(shù)問題。
類似地,對(duì)于企業(yè)移動(dòng)工作隊(duì)伍和業(yè)務(wù)人員也一直存在如何有效監(jiān)管和跟蹤的技術(shù)問題,比如企業(yè)銷售業(yè)務(wù)人員、野外巡視人員、物流配送人員、連鎖經(jīng)營企業(yè)的巡檢人員和醫(yī)療看護(hù)人員等。
隨著現(xiàn)代通信技術(shù)和定位技術(shù)的快速發(fā)展,特別是無線移動(dòng)通信和全球衛(wèi)星定位的曰益普及,對(duì)具有定位和通信功能的裝置開展遠(yuǎn)程定位跟蹤變得越來越方便,定位監(jiān)控系統(tǒng)的成本越來越低,這吸引了大量企業(yè)和政府組織對(duì)這種遠(yuǎn)程定位監(jiān)控技術(shù)產(chǎn)生了濃厚的興趣。
目前,主流的遠(yuǎn)程定位技術(shù)主要采用包括移動(dòng)通信基站定位、衛(wèi)星定位、衛(wèi)星與移動(dòng)通信基站混合定位等方法。
然而,無論采用上述哪種定位技術(shù)方法,現(xiàn)階段在技術(shù)上還很難做到將具有遠(yuǎn)程定位和移動(dòng)通信功能的個(gè)人便攜式終端裝置(比如手機(jī)/移動(dòng)通信電話或者衛(wèi)星定位信號(hào)接收裝置等)嵌入到被監(jiān)管對(duì)象的身體內(nèi)部,因而用于定位監(jiān)控的定位通信終端裝置物往往只能被附著在被監(jiān)管對(duì)象的身體表面或者由被監(jiān)管對(duì)象近距離地持有。
由于這種定位通信裝置物,可能有意或者無意地被脫落或丟棄,造成人機(jī)分離/ "金蟬脫殼"的狀況,使得被監(jiān)管對(duì)象隨時(shí)可以逃脫定位監(jiān)控;現(xiàn)有的定位監(jiān)控方法或系統(tǒng)本質(zhì)上只能定位跟蹤用于定位通信的裝置物,而無法直接定位跟蹤被監(jiān)管對(duì)象的人體本身;只有通過人為假設(shè),認(rèn)為被監(jiān)管對(duì)象總是現(xiàn)場(chǎng)持有該定位通信裝置物,才能把所述定位通信裝置物的移動(dòng)軌跡當(dāng)作所述被監(jiān)管對(duì)象的人體活動(dòng)軌跡。
因此,現(xiàn)有的定位監(jiān)控方法或系統(tǒng)普遍存在一個(gè)"只認(rèn)物、不認(rèn)人"的重大缺陷。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種基于聲紋識(shí)別和定位跟蹤的交叉監(jiān)控方法和系統(tǒng),其可實(shí)現(xiàn)對(duì)被監(jiān)管對(duì)象人體的遠(yuǎn)程定位跟蹤,除了可以對(duì)被監(jiān)管對(duì)象進(jìn)行定位監(jiān)測(cè),還可以實(shí)現(xiàn)對(duì)被監(jiān)管對(duì)象的非接觸式生物身份識(shí)別,克服了現(xiàn)有定位監(jiān)控方法或系統(tǒng)"只認(rèn)物、不認(rèn)人"的重大缺陷,滿足了遠(yuǎn)距離、非接觸式地監(jiān)控被監(jiān)管對(duì)象的需要。
本發(fā)明的技術(shù)方案是提供一種基于聲紋識(shí)別和定位跟蹤的交叉監(jiān)控方法,其特征是,所述的交叉監(jiān)控方法至少包括以下步驟
A、 針對(duì)被監(jiān)管對(duì)象,采集其個(gè)人信息,注冊(cè)其用戶標(biāo)識(shí)和個(gè)人信息,采集其注冊(cè)語音樣本并構(gòu)建其聲紋模型,指定其個(gè)人專用的定位通信終端,設(shè)置其監(jiān)管方案,設(shè)定其違規(guī)報(bào)警方案;所述定位通信終端的網(wǎng)絡(luò)身份ID具有唯一性,將所述網(wǎng)絡(luò)身份ID與所述被監(jiān)管對(duì)象的用戶標(biāo)識(shí)一一對(duì)應(yīng)地綁定;
B、 針對(duì)所述定位通信終端,反復(fù)地自動(dòng)執(zhí)行定位監(jiān)控步驟,分析和存儲(chǔ)每次定位監(jiān)控的結(jié)果;
C、 針對(duì)被監(jiān)管對(duì)象,反復(fù)地自動(dòng)執(zhí)行以聲紋識(shí)別為核心的語音監(jiān)控步驟,分析和存儲(chǔ)每次語音監(jiān)控的結(jié)果;
D、 針對(duì)所述被監(jiān)管對(duì)象及其指定使用的定位通信終端,臨時(shí)被要求或周期性自
動(dòng)地交叉統(tǒng)計(jì)和分析在同一統(tǒng)計(jì)時(shí)間段內(nèi)發(fā)生的定位監(jiān)控和語音監(jiān)控各自產(chǎn)生的結(jié)果記錄,最終給出一個(gè)反映了所述被監(jiān)管對(duì)象的人體活動(dòng)軌跡和實(shí)際違規(guī)狀況的完整
報(bào)告,供其監(jiān)管工作人員考察和評(píng)估所述被監(jiān)管對(duì)象的業(yè)績表現(xiàn);
E、 監(jiān)管工作人員不定期地要求和評(píng)估關(guān)于被監(jiān)管對(duì)象活動(dòng)表現(xiàn)的統(tǒng)計(jì)分析報(bào)告,觀察其活動(dòng)軌跡和狀態(tài)或依據(jù)其業(yè)績表現(xiàn)調(diào)整其監(jiān)管方案。
其中,上述的監(jiān)管方案包括以下部分或者全部信息項(xiàng)所述定位監(jiān)控步驟反復(fù)發(fā)
生的時(shí)間與頻率、監(jiān)控系統(tǒng)主動(dòng)請(qǐng)求還是被動(dòng)接收定位信息、被監(jiān)管對(duì)象的活動(dòng)區(qū)域限制,所述語音監(jiān)控步驟反復(fù)發(fā)生的時(shí)間與頻率、被監(jiān)管對(duì)象主動(dòng)發(fā)起語音呼叫還是被動(dòng)接受語音呼叫、系統(tǒng)語音提示一用戶語音應(yīng)答的要求方式與內(nèi)容選擇、交叉統(tǒng)計(jì)和分析監(jiān)控結(jié)果的時(shí)間周期;所述的違規(guī)報(bào)警方案至少包括啟動(dòng)報(bào)警的條件、發(fā)送報(bào)警的方式和/或接收?qǐng)?bào)警的對(duì)象。
如果個(gè)性化的監(jiān)管和報(bào)警方案未被設(shè)置,則系統(tǒng)缺省的方案設(shè)置被采用。
進(jìn)一步的,其所述的定位監(jiān)控步驟和語音監(jiān)控步驟,按照被監(jiān)管對(duì)象的監(jiān)管和/或報(bào)警方案的不同,可以分別獨(dú)立地和/或并行地被執(zhí)行。
具體的,上述的定位監(jiān)控步驟至少包括利用定位技術(shù)方法,遠(yuǎn)程地獲取定位通信終端的網(wǎng)絡(luò)身份ID和地理位置,以及定位發(fā)生的時(shí)間;根據(jù)所述網(wǎng)絡(luò)身份ID與用戶標(biāo)識(shí)之間的綁定關(guān)系,查詢所述網(wǎng)絡(luò)身份ID所唯一綁定的被監(jiān)管對(duì)象的用戶標(biāo)識(shí)和活動(dòng)區(qū)域限制;判斷所獲取的地理位置是否違規(guī)超越了被監(jiān)管對(duì)象的活動(dòng)區(qū)域限制,如果這次違規(guī)觸發(fā)了報(bào)警條件,那么使用指定的報(bào)警方式向指定的報(bào)警對(duì)象發(fā)送報(bào)警消息;將此次定位監(jiān)控的結(jié)果與所述用戶標(biāo)識(shí)對(duì)應(yīng)關(guān)聯(lián)地存儲(chǔ);
其中,所述定位監(jiān)控的結(jié)果可以包括網(wǎng)絡(luò)身份ID、地理位置、定位發(fā)生時(shí)間與違規(guī)越界狀態(tài);
其所述的定位技術(shù)可以是衛(wèi)星定位、無線移動(dòng)通信網(wǎng)絡(luò)基站定位或衛(wèi)星與無線移動(dòng)通信網(wǎng)絡(luò)基站的混合定位,其所述的定位技術(shù)通過定位通信終端和/或無線移動(dòng)通信網(wǎng)絡(luò)服務(wù)來實(shí)現(xiàn)。
具體的,上述的語音監(jiān)控步驟至少包括建立人機(jī)交互語音對(duì)話,獲取被監(jiān)管對(duì)象所持有的定位通信終端的網(wǎng)絡(luò)身份ID,遠(yuǎn)程實(shí)時(shí)地錄取被監(jiān)管對(duì)象根據(jù)播放的隨機(jī)語音提示或要求所輸入的應(yīng)答語音;對(duì)所錄取的應(yīng)答語音開展聲紋識(shí)別,驗(yàn)證所述被監(jiān)控對(duì)象的生物身份;為了驗(yàn)證真人在場(chǎng)說話,可以選擇性地增加針對(duì)應(yīng)答語音的內(nèi)容識(shí)別步驟,即鑒定所述應(yīng)答語音的內(nèi)容是否切合匹配實(shí)際播放的語音提示或要求;綜合利用所述網(wǎng)絡(luò)身份ID、聲紋識(shí)別結(jié)果和/或應(yīng)答內(nèi)容的鑒定結(jié)果,判斷所述被監(jiān)管對(duì)象是否現(xiàn)場(chǎng)持有其指定'使用的定位通信終端,設(shè)定違規(guī)狀態(tài);如果發(fā)生違規(guī)并觸發(fā)了報(bào)警條件,則使用指定的報(bào)警方式向指定的報(bào)警對(duì)象發(fā)送報(bào)警消息;將此次語音監(jiān)控的結(jié)果與所述被監(jiān)管對(duì)象的用戶標(biāo)識(shí)對(duì)應(yīng)關(guān)聯(lián)地存儲(chǔ);
其中,所述語音監(jiān)控的結(jié)果可以包括網(wǎng)絡(luò)身份ID、聲紋識(shí)別結(jié)果和/或語音內(nèi)容鑒定結(jié)果、違規(guī)狀態(tài)或監(jiān)控的發(fā)生時(shí)間。
在所述的定位監(jiān)控和語音監(jiān)控步驟中,所述違規(guī)報(bào)警的發(fā)送步驟與所述監(jiān)控結(jié)果的存儲(chǔ)步驟之間的先后執(zhí)行次序無關(guān)。
具體的,上述的聲紋識(shí)別可以分為聲紋注冊(cè)和聲紋驗(yàn)證兩種階段;
其中,所述的聲紋注冊(cè)階段至少包括聲紋特征提取步驟,用于對(duì)用戶語音做數(shù)字信號(hào)處理,并從該語音處理結(jié)果中提取可表征其發(fā)音生理和行為特點(diǎn)的聲紋特征序列;
其所述的聲紋模型建立步驟,用于根據(jù)從用戶注冊(cè)語音中提取出的聲紋特征序列建立表征用戶本人發(fā)音特點(diǎn)的聲紋模型;
其中,所述的聲紋驗(yàn)證階段至少包括聲紋特征提取步驟,用于對(duì)用戶語音做數(shù)字信號(hào)處理,并從該語音處理結(jié)果中提取可表征其發(fā)音生理和行為特點(diǎn)的聲紋特征序列;
其所述的聲紋模式匹配步驟,用于根據(jù)從用戶驗(yàn)證語音中提取出的聲紋特征序列與對(duì)應(yīng)的用戶聲紋模型進(jìn)行比對(duì),從而確認(rèn)所述用戶的身份。
本發(fā)明還提供了一種按照上述方法進(jìn)行工作的基于聲紋識(shí)別和定位跟蹤的交叉監(jiān)控系統(tǒng),包括被監(jiān)管對(duì)象和監(jiān)管工作人員,其中,被監(jiān)管對(duì)象接受來自監(jiān)控系統(tǒng)的自動(dòng)監(jiān)控和來自監(jiān)管工作人員的管理;監(jiān)管工作人員操作監(jiān)控系統(tǒng),管理被監(jiān)管對(duì)象;其特征是
設(shè)置一定位通信終端,作為一種個(gè)人便攜式硬件裝置被附著在被監(jiān)管對(duì)象的身體表面或者由被監(jiān)管對(duì)象近距離所持有;
設(shè)置一應(yīng)用服務(wù)器,用于提供至少以下服務(wù)功能語音通信、數(shù)據(jù)通信、系統(tǒng)管理、聲紋認(rèn)證和/或信息存儲(chǔ);
設(shè)置一監(jiān)管操作終端,作為客戶端,與所述的應(yīng)用服務(wù)器形成Browser/Server或Client/Server的服務(wù)架構(gòu);監(jiān)管工作人員可以通過它管理被監(jiān)管對(duì)象的個(gè)人信息、設(shè)定監(jiān)管方案、設(shè)定報(bào)警條件、指定報(bào)警方式和對(duì)象、發(fā)布消息通知與命令、接收?qǐng)?bào)警通知、觀察被監(jiān)管對(duì)象的地理位置和活動(dòng)軌跡或查閱被監(jiān)管對(duì)象的統(tǒng)計(jì)分析報(bào)告;
所述的定位通信終端與應(yīng)用服務(wù)器之間,通過第一聯(lián)接網(wǎng)絡(luò)連接,
所述的第一通信網(wǎng)絡(luò)用于傳輸和協(xié)調(diào)那些涉及被監(jiān)管對(duì)象的語音通信和數(shù)據(jù)通
信;
所述的監(jiān)管操作終端與應(yīng)用服務(wù)器之間,通過第二聯(lián)接網(wǎng)絡(luò)連接,所述的第二通信網(wǎng)絡(luò)用于傳輸和轉(zhuǎn)送那些涉及監(jiān)管工作人員的數(shù)據(jù)通信和/或語音通信。
具體的,其所述的定位通信終端具有唯一的網(wǎng)絡(luò)身份ID;用于數(shù)據(jù)通信,接收/發(fā)送定位信號(hào),參與系統(tǒng)定位;還可用于語音通信,在人機(jī)交互語音對(duì)話過程中播放系統(tǒng)的隨機(jī)語音提示或要求,采集和傳輸被監(jiān)管對(duì)象輸入的應(yīng)答語音;
其所述的應(yīng)用服務(wù)器,由單臺(tái)計(jì)算機(jī)所代表的實(shí)體性服務(wù)器或由彼此之間通過網(wǎng)絡(luò)連接協(xié)調(diào)工作的多臺(tái)計(jì)算機(jī)共同組成的虛擬性服務(wù)器所構(gòu)成,其可以包括一個(gè)或多個(gè)服務(wù)子系統(tǒng),還可以用于選擇性地提供語音內(nèi)容識(shí)別、文字語音合成和地理信息服務(wù)等可選的輔助服務(wù)功能;若所述應(yīng)用服務(wù)器是由多臺(tái)計(jì)算機(jī)所構(gòu)成的虛擬性服務(wù)器,則所述的多臺(tái)計(jì)算機(jī)可以被集中部署在同一個(gè)局域網(wǎng),也可以被分散部署在地理分布不同的區(qū)域網(wǎng)點(diǎn),而且所述計(jì)算機(jī)是由網(wǎng)絡(luò)連接并被系統(tǒng)管理服務(wù)所協(xié)調(diào)與控制;
其所述的應(yīng)用服務(wù)器通過系統(tǒng)管理與信息存儲(chǔ)服務(wù)功能,根據(jù)用戶標(biāo)識(shí)與定位通
信終端的網(wǎng)絡(luò)身份ID之間的綁定關(guān)系,交叉統(tǒng)計(jì)和分析同一統(tǒng)計(jì)時(shí)間段內(nèi)發(fā)生的定
位監(jiān)控和語音監(jiān)控的結(jié)果,為監(jiān)管工作人員提供關(guān)于被監(jiān)管對(duì)象的人體活動(dòng)軌跡和違
規(guī)表現(xiàn)狀況報(bào)告;
其所述的第一通信網(wǎng)絡(luò),參與執(zhí)行所述的定位監(jiān)控和/或語音監(jiān)控;
其所述的第二通信網(wǎng)絡(luò),參與執(zhí)行所述的系統(tǒng)操控與管理、顯示被監(jiān)管對(duì)象的地理位置、活動(dòng)軌跡、違規(guī)狀況和/或統(tǒng)計(jì)分析報(bào)告。
進(jìn)一步的,上述的人機(jī)交互語音對(duì)話至少涉及被監(jiān)管對(duì)象、定位通信終端以及應(yīng)用服務(wù)器;其允許以主動(dòng)呼叫和被動(dòng)接聽兩種方式來啟動(dòng)語音通信;
其主動(dòng)呼叫方式是由被監(jiān)管對(duì)象通過其持有的定位通信終端主動(dòng)呼叫應(yīng)用服務(wù)器,所述應(yīng)用服務(wù)器接受該語音呼叫,并探測(cè)識(shí)別所述定位通信終端的網(wǎng)絡(luò)身份ID;
其被動(dòng)接聽方式是由應(yīng)用服務(wù)器先選擇作為監(jiān)控目標(biāo)的被監(jiān)管對(duì)象,査詢與被監(jiān)管對(duì)象綁定的定位通信終端的網(wǎng)絡(luò)身份ID,應(yīng)用服務(wù)器根據(jù)所査詢的網(wǎng)絡(luò)身份ID,主動(dòng)外呼具有該網(wǎng)絡(luò)身份ID的定位通信終端,由持有該定位通信終端的被監(jiān)管對(duì)象
接聽電話呼叫。
與現(xiàn)有技術(shù)比較,本發(fā)明的優(yōu)點(diǎn)是
1. 采用聲紋認(rèn)證和定位跟蹤的雙重電子監(jiān)控方法和系統(tǒng),除了可以對(duì)被監(jiān)管對(duì)象進(jìn)行定位監(jiān)測(cè),還可以實(shí)現(xiàn)對(duì)被監(jiān)管對(duì)象的非接觸式生物身份識(shí)別,克服了現(xiàn)有監(jiān)測(cè)方法或系統(tǒng)"只認(rèn)物、不認(rèn)人"的不足,滿足了遠(yuǎn)距離、非接觸式監(jiān)控被監(jiān)管對(duì)象的
需要;
2. 不僅對(duì)被監(jiān)管對(duì)象的空間活動(dòng)狀況進(jìn)行定位跟蹤,并且通過以聲紋識(shí)別為核心的語音監(jiān)控方式,按預(yù)定計(jì)劃或者隨機(jī)地查驗(yàn)被監(jiān)管對(duì)象是否與現(xiàn)場(chǎng)持有其預(yù)先指定使用的定位通信終端裝置物,從而有效地阻止被監(jiān)管對(duì)象長時(shí)間地采取人體與定位通信終端裝置物遠(yuǎn)距離地分離的方式逃脫電子監(jiān)控;而且在語音監(jiān)控方面,系統(tǒng)隨機(jī)地外呼用戶開展聲紋認(rèn)證可以比用戶主動(dòng)呼入系統(tǒng)做聲紋認(rèn)證,更加有效地杜絕"人機(jī)
10分離"的違規(guī)現(xiàn)象;
3.在真正意義上實(shí)現(xiàn)了對(duì)被監(jiān)管對(duì)象人體的遠(yuǎn)程定位跟蹤,可以幫助監(jiān)管機(jī)構(gòu)實(shí)現(xiàn)對(duì)地理分布不同的大規(guī)模用戶進(jìn)行自動(dòng)化監(jiān)控與管理,從而大大地減輕監(jiān)管工作人員的工作負(fù)擔(dān),提高監(jiān)管的有效率性和可靠性,在針對(duì)移動(dòng)工作隊(duì)伍和社區(qū)矯正犯人等的電子監(jiān)控方面具有特別重要的應(yīng)用。
圖l是本發(fā)明監(jiān)控系統(tǒng)的結(jié)構(gòu)示意圖2是本發(fā)明實(shí)施例中應(yīng)用服務(wù)器的聲紋認(rèn)證服務(wù)子系統(tǒng)的結(jié)構(gòu)示意圖;圖3是本發(fā)明交叉監(jiān)控方法的工作流程方框圖;圖4是本發(fā)明定位監(jiān)控的工作流程方框圖;圖5是本發(fā)明語音監(jiān)控的工作流程方框圖。
具體實(shí)施例方式
本發(fā)明的核心思想是建立人機(jī)交互語音對(duì)話,遠(yuǎn)程、實(shí)時(shí)地錄取被監(jiān)管對(duì)象的應(yīng)答語音,對(duì)所錄取的應(yīng)答語音開展聲紋識(shí)別和/或內(nèi)容識(shí)別,驗(yàn)證所述被監(jiān)管對(duì)象的生物身份,并判斷其是否現(xiàn)場(chǎng)持有指定使用的定位通信終端;通過定位跟蹤方法,
遠(yuǎn)程獲取所述被監(jiān)管對(duì)象指定使用的定位通信終端的地理位置,并記錄所述定位通信
終端的移動(dòng)軌跡;交叉統(tǒng)計(jì)和分析定位跟蹤和聲紋認(rèn)證的結(jié)果,可以有效可靠地獲得所述被監(jiān)管對(duì)象的人體活動(dòng)軌跡和違規(guī)狀況;關(guān)鍵是以聲紋識(shí)別為核心的語音監(jiān)控可以有效地阻止被監(jiān)管對(duì)象采用"人機(jī)分離"的方式逃脫電子監(jiān)控,所以上述定位通信終端的地理位置和移動(dòng)軌跡可以被可靠地認(rèn)為是被監(jiān)管對(duì)象人體的位置和活動(dòng)軌跡。下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明做進(jìn)一步說明。
在圖1中,本發(fā)明的交叉監(jiān)控系統(tǒng)1至少由應(yīng)用服務(wù)器10、定位通信終端20、監(jiān)管操作終端30、被監(jiān)管對(duì)象40和監(jiān)管工作人員50組成,其中應(yīng)用服務(wù)器10包括數(shù)據(jù)通信服務(wù)子系統(tǒng)101、語音通信服務(wù)子系統(tǒng)102、系統(tǒng)管理服務(wù)子系統(tǒng)103、信息存儲(chǔ)服務(wù)子系統(tǒng)104、聲紋認(rèn)證服務(wù)子系統(tǒng)105、語音內(nèi)容識(shí)別服務(wù)子系統(tǒng)106、地理信息服務(wù)子系統(tǒng)107以及子系統(tǒng)之間的互連接口 108。
其定位通信終端與應(yīng)用服務(wù)器之間,通過第一通信網(wǎng)絡(luò)ll連接。其監(jiān)管操作終端與應(yīng)用服務(wù)器之間,通過第二通信網(wǎng)絡(luò)12連接。其中,定位通信終端,具有唯一的網(wǎng)絡(luò)身份ID (例如,移動(dòng)電話號(hào)碼),在單個(gè)硬件裝置里集成了定位功能模塊和數(shù)據(jù)/語音通信功能模塊,被附著在被監(jiān)管對(duì)象的身體表面或者被其近距離所持有,再結(jié)合無線通信網(wǎng)絡(luò)與服務(wù)一起,用于獲取所述定位通信終端的位置信息、實(shí)現(xiàn)數(shù)據(jù)通信和語音通話等。
應(yīng)用服務(wù)器,被集中或分散部署在數(shù)據(jù)與語音通信網(wǎng)絡(luò)上,其可以是由單臺(tái)計(jì)算機(jī)所代表的實(shí)體性服務(wù)器,也可以是由彼此之間通過網(wǎng)絡(luò)連接協(xié)調(diào)工作的多臺(tái)計(jì)算機(jī)共同組成的虛擬性服務(wù)器(如由多臺(tái)計(jì)算機(jī)聯(lián)網(wǎng)組成的集中式或者分布式機(jī)群),用于提供了六項(xiàng)服務(wù)功能數(shù)據(jù)通信、語音通信、系統(tǒng)管理、信息存儲(chǔ)、聲紋認(rèn)證、語音內(nèi)容識(shí)別、以及地理信息服務(wù)。在實(shí)際應(yīng)用中,如果需要更靈活的動(dòng)態(tài)語音播報(bào),還可以選擇集成另外的文字語音合成服務(wù)功能。
監(jiān)管操作終端,作為客戶端,與所述應(yīng)用服務(wù)器形成Browser/Server或者Client/Server的服務(wù)架構(gòu);通過它,監(jiān)管工作人員可以管理被監(jiān)管對(duì)象的個(gè)人信息、設(shè)定監(jiān)管方案、設(shè)定報(bào)警條件、指定報(bào)警方式和對(duì)象、發(fā)布消息通知與命令、接收?qǐng)?bào)警通知、觀察被監(jiān)管對(duì)象的地理位置和活動(dòng)軌跡、查閱被監(jiān)管對(duì)象的統(tǒng)計(jì)分析報(bào)告、依據(jù)其業(yè)績表現(xiàn)可能調(diào)整其監(jiān)管方案等。
其第一通信網(wǎng)絡(luò)用于傳輸和協(xié)調(diào)那些涉及被監(jiān)管對(duì)象的語音通信和數(shù)據(jù)通信,參與執(zhí)行所述的定位監(jiān)控和/或語音監(jiān)控。
其第二通信網(wǎng)絡(luò)用于傳輸和轉(zhuǎn)送那些涉及監(jiān)管工作人員的數(shù)據(jù)通信和/或語音通信,參與執(zhí)行所述的系統(tǒng)操控與管理、顯示被監(jiān)管對(duì)象的地理位置、活動(dòng)軌跡、違規(guī)狀況和/或統(tǒng)計(jì)分析報(bào)告。
第一通信網(wǎng)絡(luò)可以為無線通信/電話網(wǎng)絡(luò),第二通信網(wǎng)絡(luò)可以為有線或無線形式的廣域網(wǎng)或局域網(wǎng)網(wǎng)絡(luò)。
具體地說,
定位監(jiān)控的實(shí)現(xiàn)過程可以包括定位通信終端和/或無線移動(dòng)通信網(wǎng)絡(luò)服務(wù)參與獲取所述定位通信終端的定位信息和網(wǎng)絡(luò)身份ID,無線移動(dòng)通信網(wǎng)絡(luò)傳送定位信息和網(wǎng)絡(luò)身份ID,數(shù)據(jù)通信服務(wù)子系統(tǒng)接收定位信息和網(wǎng)絡(luò)身份ID,從定位信息中分析得出地理位置信息,查詢所述網(wǎng)絡(luò)身份ID所綁定的用戶標(biāo)識(shí)所代表的被監(jiān)管對(duì)象的活動(dòng)區(qū)域限制,通過比較所述地理位置和活動(dòng)區(qū)域限制決定違規(guī)越界狀態(tài),把定位監(jiān)控的結(jié)果交給信息存儲(chǔ)服務(wù)子系統(tǒng)保存,若發(fā)生違規(guī)越界則發(fā)送報(bào)警。
語音監(jiān)控的實(shí)現(xiàn)過程可以包括通過定位通信終端和無線移動(dòng)通信網(wǎng)絡(luò),獲取定位通信終端的網(wǎng)絡(luò)身份ID,建立被監(jiān)管對(duì)象與語音通信服務(wù)子系統(tǒng)之間的人機(jī)交互語音對(duì)話過程;在對(duì)話過程中,被監(jiān)管對(duì)象根據(jù)播放的隨機(jī)語音提示或要求輸入其應(yīng)答語音,定位通信終端采集和傳送所述應(yīng)答語音,語音通信服務(wù)子系統(tǒng)接收所述應(yīng)答語音,并把接收的應(yīng)答語音分別交給聲紋認(rèn)證服務(wù)子系統(tǒng)和語音內(nèi)容識(shí)別服務(wù)子系統(tǒng);聲紋認(rèn)證服務(wù)子系統(tǒng)對(duì)所述應(yīng)答語音開展聲紋識(shí)別,驗(yàn)證被監(jiān)管對(duì)象的生物身份,把聲紋認(rèn)證結(jié)果交給信息存儲(chǔ)服務(wù)子系統(tǒng),若身份被拒絕則可能啟動(dòng)報(bào)警;語音內(nèi)容識(shí)別服務(wù)子系統(tǒng)對(duì)所述應(yīng)答語音開展語音識(shí)別或鑒別,鑒定應(yīng)答語音的內(nèi)容是否切合匹配系統(tǒng)播放的隨機(jī)提示或要求,從而判斷應(yīng)答語音是來自真人現(xiàn)場(chǎng)說話還是錄音回放產(chǎn)生的聲音,并把應(yīng)答語音的內(nèi)容鑒定結(jié)果交給信息存儲(chǔ)服務(wù)子系統(tǒng),若存在錄音回放欺詐則可能啟動(dòng)報(bào)警;綜合所述網(wǎng)絡(luò)身份ID、聲紋認(rèn)證結(jié)果和語音內(nèi)容鑒定結(jié)果,可以判斷被監(jiān)管對(duì)象是否現(xiàn)場(chǎng)持有其指定使用的定位通信終端;將最后的語音監(jiān)控結(jié)果交給語音通信服務(wù)子系統(tǒng),在線語音播報(bào)給被監(jiān)管對(duì)象,結(jié)束人機(jī)對(duì)話過程。
在所述人機(jī)交互語音對(duì)話過程中,人工預(yù)先錄制的語音文件被用來組合系統(tǒng)的語音提示/要求以及語音監(jiān)控結(jié)果的語音播報(bào);在實(shí)際應(yīng)用中,如果系統(tǒng)需要更加靈活的動(dòng)態(tài)語音播報(bào),還可以通過集成另外的文字語音合成服務(wù)來動(dòng)態(tài)產(chǎn)生這些語音。
定位通信終端的網(wǎng)絡(luò)身份ID的獲取方式分為兩種情況
(1) 在被監(jiān)管對(duì)象主動(dòng)發(fā)起語音呼叫的情況下,語音通信服務(wù)子系統(tǒng)能自動(dòng)探測(cè)識(shí)別所述定位通信終端的網(wǎng)絡(luò)身份ID,信息存儲(chǔ)服務(wù)子系統(tǒng)可以根據(jù)網(wǎng)絡(luò)身份ID查詢與其綁定的用戶標(biāo)識(shí),而所述的用戶標(biāo)識(shí)具體地代表了所述被監(jiān)管對(duì)象;
(2) 在語音通信服務(wù)子系統(tǒng)主動(dòng)發(fā)起語音呼叫的情況下,先選擇具體的某個(gè)被監(jiān)管對(duì)象作為對(duì)話目標(biāo),讓信息存儲(chǔ)服務(wù)子系統(tǒng)根據(jù)該被監(jiān)管對(duì)象的用戶標(biāo)識(shí)查詢與其綁定的定位通信終端的網(wǎng)絡(luò)身份ID,語音通信服務(wù)子系統(tǒng)根據(jù)所述網(wǎng)絡(luò)身份ID外呼具有該網(wǎng)絡(luò)身份ID的定位通信終端。
現(xiàn)有的基于定位技術(shù)的電子監(jiān)控系統(tǒng)普遍存在一個(gè)"只認(rèn)物、不認(rèn)人"的致命缺陷,解決這一難題的重要方法是采用生物識(shí)別技術(shù)進(jìn)行身份認(rèn)證,而語音生物特征(聲紋)識(shí)別是唯一可用于非接觸式、通過電話網(wǎng)絡(luò)遠(yuǎn)程安全控制的生物識(shí)別技術(shù)方法。
語音生物特征識(shí)別,又稱說話人識(shí)別,俗稱聲紋識(shí)別,是根據(jù)說話人的發(fā)音生理和行為特征,自動(dòng)識(shí)別說話人身份的一種生物識(shí)別方法。
聲紋識(shí)別所提供的安全性可與其他生物識(shí)別技術(shù)(如指紋、掌形和虹膜)相媲美,而且語音采集裝置造價(jià)低廉,只需電話/手機(jī)或電腦麥克風(fēng)即司.,無需特殊的設(shè)備;它與說話語言無關(guān),與方言腔調(diào)無關(guān),不涉及隱私問題,適應(yīng)人群范圍很廣;聲音信號(hào)便于遠(yuǎn)程傳輸和獲取,在基于電信和網(wǎng)絡(luò)的身份識(shí)別應(yīng)用中,聲紋識(shí)別更為擅長,得天獨(dú)厚。在圖2中,給出了利用聲紋識(shí)別開展身份認(rèn)證的工作過程
聲紋認(rèn)證服務(wù)子系統(tǒng)105包括聲紋特征提取單元1051、聲紋模型構(gòu)建單元1052、聲紋模式匹配單元1053、以及聲紋模型庫1054。
聲紋特征提取單元1051用于根據(jù)用戶所說的語音,去除無效的語音片段(例如靜音和噪音等),開展語音數(shù)字信號(hào)處理,從該處理結(jié)果中提取可以表征該用戶發(fā)音器官參數(shù)或發(fā)音方式及特點(diǎn)等的一組特征矢量,稱為聲紋特征,供后續(xù)的建模或比對(duì)時(shí)使用。
聲紋特征提取單元1051是聲紋模型構(gòu)建單元1052和聲紋模式匹配單元1053公用的模塊。
聲紋模型構(gòu)建單元1052用于根據(jù)聲紋特征提取單元1051從用戶聲紋建模用的語音中提取出來的聲紋特征序列,為之構(gòu)建特定的聲紋模型。
為了充分表征該用戶發(fā)音中的個(gè)性信息,該建模方法可以基于一種分類器或者混合使用多種分類器,常用的分類器可以包括神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(jī)(SVM)、概率統(tǒng)計(jì)(HMM/GMM-UBM)、矢量量化(VQ)、動(dòng)態(tài)時(shí)間規(guī)整(DTW)等。
聲紋模式匹配單元1053用于利用從用戶的驗(yàn)證語音中提取出來的聲紋特征序列,與其所申明身份對(duì)應(yīng)的已建立的聲紋模型進(jìn)行比對(duì),得到相似度分?jǐn)?shù),再根據(jù)預(yù)設(shè)的判別閾值,確認(rèn)是接受還是拒絕該用戶,從而完成基于聲紋識(shí)別技術(shù)的身份驗(yàn)證過程。
在上述聲紋認(rèn)證過程中,為了防止錄音回放欺詐,還可以對(duì)全部或者部分驗(yàn)證語音開展語音內(nèi)容識(shí)別,鑒定用戶的應(yīng)答語音的內(nèi)容是否切合系統(tǒng)的隨機(jī)提示或要求,從而驗(yàn)證是否真人在場(chǎng)說話判斷;為了適應(yīng)語音信道變化和人體聲音老化等因素,可以利用驗(yàn)證語音對(duì)聲紋模型進(jìn)行更新與調(diào)整。
在圖3中,給出了本發(fā)明監(jiān)控方法的工作流程方框圖,其基本監(jiān)控思路如下
在SIO,部署電子監(jiān)控系統(tǒng),設(shè)置應(yīng)用服務(wù)器和與之相連的監(jiān)管操作終端,形成Browser/Server或Client/Server的網(wǎng)絡(luò)服務(wù)架構(gòu);
在S20,執(zhí)行被監(jiān)管對(duì)象注冊(cè)步驟,包括采集被監(jiān)管對(duì)象的個(gè)人信息和用于聲紋注冊(cè)的語音樣本、注冊(cè)被監(jiān)管對(duì)象的個(gè)人信息和用戶標(biāo)識(shí)、根據(jù)其注冊(cè)語音樣本構(gòu)建其聲紋模型、指定其個(gè)人專用的定位通信終端、綁定其用戶標(biāo)識(shí)與其定位通信終端的網(wǎng)絡(luò)身份ID、設(shè)置其監(jiān)管方案和報(bào)警方案等;
在S30,按照被監(jiān)管對(duì)象的監(jiān)管和報(bào)警方案,針對(duì)其指定使用的定位通信終端,反復(fù)自動(dòng)地執(zhí)行定位監(jiān)控步驟(參見圖4),保存定位監(jiān)控結(jié)果;
在S40,按照被監(jiān)管對(duì)象的監(jiān)管和報(bào)警方案,針對(duì)被監(jiān)管對(duì)象,反復(fù)自動(dòng)地執(zhí)行基于聲紋識(shí)別和/或語音內(nèi)容識(shí)別的語音監(jiān)控步驟(參見圖5),保存語音監(jiān)控結(jié)果;
此處的定位監(jiān)控步驟和語音監(jiān)控步驟,按照被監(jiān)管對(duì)象的監(jiān)管和/或報(bào)警方案的不同,可以分別獨(dú)立地和/或并行地被執(zhí)行。
在S50,周期性和/或臨時(shí)執(zhí)行交叉統(tǒng)計(jì)分析工作,即交叉對(duì)比分析在同一統(tǒng)計(jì)時(shí)間段內(nèi)發(fā)生的語音監(jiān)控和定位監(jiān)控的結(jié)果,根據(jù)所述被監(jiān)管對(duì)象是否現(xiàn)場(chǎng)持有其指定使用的定位通信終端以及該定位通信終端的移動(dòng)軌跡,推斷出所述被監(jiān)管對(duì)象的人體活動(dòng)軌跡,最終給出一個(gè)反映了所述被監(jiān)管對(duì)象的人體活動(dòng)軌跡和實(shí)際違規(guī)狀況的完整報(bào)告。
在上述定位監(jiān)控和語音監(jiān)控步驟的執(zhí)行過程中,被監(jiān)管對(duì)象違規(guī)報(bào)警的發(fā)送步驟與對(duì)被監(jiān)管對(duì)象的監(jiān)控結(jié)果的存儲(chǔ)步驟之間的先后執(zhí)行次序無關(guān)。
在S60,監(jiān)管工作人員不定期地要求調(diào)閱關(guān)于被監(jiān)管對(duì)象活動(dòng)的統(tǒng)計(jì)分析報(bào)告,
評(píng)估其業(yè)績表現(xiàn),據(jù)此還可能適當(dāng)?shù)卣{(diào)整其監(jiān)管方案,另外還可結(jié)合地理信息服務(wù)子系統(tǒng)提供的電子地圖,觀察被監(jiān)管對(duì)象的活動(dòng)軌跡和狀態(tài)。
在圖4中,給出了在S30中執(zhí)行的定位監(jiān)控的工作流程方框圖,其基本步驟包括
在S301,根據(jù)采取的定位技術(shù),定位通信終端和/或無線移動(dòng)通信網(wǎng)絡(luò)服務(wù)參與獲取和傳輸所述定位通信終端的定位信息和網(wǎng)絡(luò)身份ID;
在S302,應(yīng)用服務(wù)器接收定位信息和網(wǎng)絡(luò)身份ID,從所述定位信息中分析得出定位通信終端的地理位置;
在S303,査詢所述網(wǎng)絡(luò)身份ID所綁定的用戶標(biāo)識(shí)以及所述用戶標(biāo)識(shí)所代表的被監(jiān)管對(duì)象的活動(dòng)區(qū)域限制;
在S304,通過比較所述地理位置和所述活動(dòng)區(qū)域限制決定所述定位通信終端的違規(guī)越界狀態(tài),將所述用戶標(biāo)識(shí)與本次定位監(jiān)控的結(jié)果對(duì)應(yīng)關(guān)聯(lián)地存儲(chǔ),其中所述定位監(jiān)控的結(jié)果包括網(wǎng)絡(luò)身份ID、地理位置、定位時(shí)間、違規(guī)越界狀態(tài)等;
在S305,執(zhí)行條件判斷,根據(jù)所述定位通信終端的違規(guī)越界狀態(tài)采取不同的處理行動(dòng)如果沒有發(fā)生違規(guī)越界,那么直接結(jié)束本次定位監(jiān)控過程;否則,依照?qǐng)?bào)警方案,按指定的方式向指定的對(duì)象發(fā)送報(bào)警通知,然后結(jié)束本次定位監(jiān)控過程。
在圖5中,給出了在S40中執(zhí)行的語音監(jiān)控的工作流程方框圖,其基本步驟包括
在S401,借助定位通信終端,在被監(jiān)管對(duì)象與應(yīng)用服務(wù)器之間,建立人機(jī)交互語音對(duì)話過程,從中獲取所述定位通信終端的網(wǎng)絡(luò)身份ID;依照監(jiān)管方案,所述人機(jī)對(duì)話過程要么由被監(jiān)管對(duì)象主動(dòng)呼叫應(yīng)用服務(wù)器來啟動(dòng),要么由被監(jiān)管對(duì)象被動(dòng)接聽來自應(yīng)用服務(wù)器的語音呼叫來啟動(dòng)。在實(shí)際應(yīng)用中,通過系統(tǒng)隨機(jī)對(duì)外呼叫被監(jiān)管對(duì)象的人機(jī)對(duì)話啟動(dòng)方式更為有效,可以很好地杜絕被監(jiān)管對(duì)象"人機(jī)分離"的現(xiàn)象。
S402是一個(gè)條件決策步驟,但它只是在人機(jī)對(duì)話過程由被監(jiān)管對(duì)象主動(dòng)呼叫應(yīng)用
服務(wù)器而啟動(dòng)的情況下適用,在被監(jiān)管對(duì)象被動(dòng)接聽語音呼叫的情況下,可以直接忽
略這個(gè)步驟;在S402,査詢是否存在一個(gè)被監(jiān)管對(duì)象的用戶標(biāo)識(shí)與所述定位通信終端的網(wǎng)絡(luò)身份ID對(duì)應(yīng)綁定,如果不存在這樣的用戶標(biāo)識(shí),中斷人機(jī)對(duì)話過程,并提前結(jié)束本次語音監(jiān)控過程;否則,繼續(xù)執(zhí)行下一個(gè)步驟。
在S403,應(yīng)用服務(wù)器通過定位通信終端播放系統(tǒng)隨機(jī)的語音提示/要求,持有該定位通信終端的被監(jiān)管對(duì)象按照系統(tǒng)的語音提示/要求輸入對(duì)應(yīng)的應(yīng)答語音,應(yīng)用服務(wù)器錄取所述被監(jiān)管對(duì)象輸入的應(yīng)答語音;為了錄取更多的語音和更有效地鑒別錄音回放的欺詐,S403所描述的提示一應(yīng)答一錄音步驟可以被連續(xù)多次地執(zhí)行;在采集足夠的應(yīng)答語音后,分別通過S404和S405對(duì)所錄取的應(yīng)答語音開展聲紋識(shí)別和語音內(nèi)容識(shí)別。
在S404,對(duì)所錄取的應(yīng)答語音開展聲紋識(shí)別,驗(yàn)證所述網(wǎng)絡(luò)身份ID所綁定的被監(jiān)管對(duì)象的生物身份;若其身份認(rèn)證被否認(rèn)則依照?qǐng)?bào)警方案可能啟動(dòng)報(bào)警。
在S405,對(duì)所錄取的應(yīng)答語音開展語音內(nèi)容識(shí)別,通過判斷應(yīng)答語音的內(nèi)容是否切合匹配系統(tǒng)播放的隨機(jī)語音提示/要求來鑒定該應(yīng)答語音是由錄音回放還是真人現(xiàn)場(chǎng)說話產(chǎn)生;若存在錄音回放欺詐則依照?qǐng)?bào)警方案可能啟動(dòng)報(bào)警。
在S406,通過綜合S404和S405分別產(chǎn)生的識(shí)別結(jié)果,決定違規(guī)狀態(tài)被監(jiān)管對(duì)象是否現(xiàn)場(chǎng)持有其指定使用的定位通信終端;將本次語音監(jiān)控的結(jié)果與所述被監(jiān)管對(duì)象的用戶標(biāo)識(shí)對(duì)應(yīng)關(guān)聯(lián)地存儲(chǔ),其中所述語音監(jiān)控的結(jié)果包括網(wǎng)絡(luò)身份ID、聲紋識(shí)別結(jié)果和/或應(yīng)答內(nèi)容鑒定結(jié)果、違規(guī)狀態(tài)、監(jiān)控發(fā)生時(shí)間等。
在S407,向所述被監(jiān)管對(duì)象在線語音播報(bào)聲紋認(rèn)證的結(jié)果,中斷人機(jī)交互語音對(duì)話過程,結(jié)束本次語音監(jiān)控步驟。
在上述技術(shù)方案中,基于衛(wèi)星定位和/或移動(dòng)網(wǎng)絡(luò)基站的無線定位技術(shù)本身,已經(jīng)是非常成熟的現(xiàn)有技術(shù);聲紋識(shí)別/聲紋認(rèn)證技術(shù)的本身,也應(yīng)視為現(xiàn)有技術(shù);已經(jīng)有多篇關(guān)于聲紋認(rèn)證或聲紋識(shí)別的專利文獻(xiàn)被公開,諸如CN 200610148399.3 "具有特征篩選和閾值自適應(yīng)的說話人身份確認(rèn)系統(tǒng)"、CN 200710041252.9 "基于聲紋認(rèn)證的網(wǎng)絡(luò)支付方法和系統(tǒng)"、CN 2004100861卯.X "聲紋認(rèn)證系統(tǒng)和聲紋認(rèn)證程序"等,其均可作為有助于理解本申請(qǐng)技術(shù)方案的背景資料,故此,關(guān)于聲紋識(shí)別/聲紋認(rèn)證和無線定位技術(shù)的工作方法、具體線路結(jié)構(gòu)或原理,在此不再敘述。在上述技術(shù)方案或說明書附圖中所設(shè)涉及的各個(gè)模塊、單元或系統(tǒng),均采用本領(lǐng)域的通用技術(shù)術(shù)語和描述方法,本領(lǐng)域的技術(shù)人員,在充分領(lǐng)會(huì)和掌握了本發(fā)明解決問題的方法、思路及系統(tǒng)構(gòu)成拓?fù)浣Y(jié)構(gòu)后,完全可以不經(jīng)過創(chuàng)造性的勞動(dòng),實(shí)現(xiàn)與之相同或相似的技術(shù)效果,達(dá)到相同的實(shí)施目標(biāo),故在此不再敘述。
現(xiàn)有的無線/電子定位技術(shù)存在"只認(rèn)物,不認(rèn)人"的缺陷,而聲紋識(shí)別作為一
種非接觸式的、可以遠(yuǎn)程安全操控的生物識(shí)別技術(shù),正好具有"只認(rèn)人,不認(rèn)物"的
優(yōu)點(diǎn),本發(fā)明的技術(shù)方案將這兩種技術(shù)方法交叉融合起來,真正意義上達(dá)到對(duì)被監(jiān)管
對(duì)象人體的遠(yuǎn)程定位跟蹤。
由于本發(fā)明的技術(shù)方案充分/有機(jī)地融合了聲紋識(shí)別技術(shù)和定位跟蹤技術(shù),不僅
可以通過定位通信終端裝置物來間接地跟蹤被監(jiān)管對(duì)象,而且通過聲紋認(rèn)證開展語音監(jiān)控的方式,可以有效地防止被監(jiān)管對(duì)象采取"人機(jī)分離"的方式逃脫電子監(jiān)控,克服了現(xiàn)有的基于定位技術(shù)的電子監(jiān)控系統(tǒng)普遍存在的"只認(rèn)物、不認(rèn)人"的缺陷。本發(fā)明可廣泛用于非接觸式電子監(jiān)控和身份識(shí)別領(lǐng)域。
1權(quán)利要求
1.一種基于聲紋識(shí)別和定位跟蹤的交叉監(jiān)控方法,其特征是,所述的交叉監(jiān)控方法至少包括以下步驟A、針對(duì)被監(jiān)管對(duì)象,采集其個(gè)人信息,注冊(cè)其用戶標(biāo)識(shí)和個(gè)人信息,采集其注冊(cè)語音樣本并構(gòu)建其聲紋模型,指定其個(gè)人專用的定位通信終端,設(shè)置其監(jiān)管方案,設(shè)定其違規(guī)報(bào)警方案;所述定位通信終端的網(wǎng)絡(luò)身份ID具有唯一性,將所述網(wǎng)絡(luò)身份ID與所述被監(jiān)管對(duì)象的用戶標(biāo)識(shí)一一對(duì)應(yīng)地綁定;B、針對(duì)所述定位通信終端,反復(fù)地自動(dòng)執(zhí)行定位監(jiān)控步驟,分析和存儲(chǔ)每次定位監(jiān)控的結(jié)果;C、針對(duì)被監(jiān)管對(duì)象,反復(fù)地自動(dòng)執(zhí)行以聲紋識(shí)別為核心的語音監(jiān)控步驟,分析和存儲(chǔ)每次語音監(jiān)控的結(jié)果;D、針對(duì)所述被監(jiān)管對(duì)象及其指定使用的定位通信終端,臨時(shí)被要求或周期性自動(dòng)地交叉統(tǒng)計(jì)和分析在同一統(tǒng)計(jì)時(shí)間段內(nèi)發(fā)生的定位監(jiān)控和語音監(jiān)控各自產(chǎn)生的結(jié)果記錄,最終給出一個(gè)反映了所述被監(jiān)管對(duì)象的人體活動(dòng)軌跡和實(shí)際違規(guī)狀況的完整報(bào)告,供其監(jiān)管工作人員考察和評(píng)估所述被監(jiān)管對(duì)象的業(yè)績表現(xiàn);E、監(jiān)管工作人員不定期地要求和評(píng)估關(guān)于被監(jiān)管對(duì)象活動(dòng)表現(xiàn)的統(tǒng)計(jì)分析報(bào)告,觀察其活動(dòng)軌跡和狀態(tài)或依據(jù)其業(yè)績表現(xiàn)調(diào)整其監(jiān)管方案。
2. 按照權(quán)利要求1所述的基于聲紋識(shí)別和定位跟蹤的交叉監(jiān)控方法,其特征是所 述的監(jiān)管方案包括以下部分或者全部信息項(xiàng)所述定位監(jiān)控步驟反復(fù)發(fā)生的時(shí)間與頻 率、監(jiān)控系統(tǒng)主動(dòng)請(qǐng)求還是被動(dòng)接收定位信息、被監(jiān)管對(duì)象的活動(dòng)區(qū)域限制,所述語 音監(jiān)控步驟反復(fù)發(fā)生的時(shí)間與頻率、被監(jiān)管對(duì)象主動(dòng)發(fā)起語音呼叫還是被動(dòng)接受語音 呼叫、系統(tǒng)語音提示一用戶語音應(yīng)答的要求方式與內(nèi)容選擇、交叉統(tǒng)計(jì)和分析監(jiān)控結(jié) 果的時(shí)間周期;所述的違規(guī)報(bào)警方案至少包括啟動(dòng)報(bào)警的條件、發(fā)送報(bào)警的方式和/ 或接收?qǐng)?bào)警的對(duì)象;如果個(gè)性化的監(jiān)管和報(bào)警方案未被設(shè)置,則系統(tǒng)缺省的方案設(shè)置 被采用。
3. 按照權(quán)利要求1所述的基于聲紋識(shí)別和定位跟蹤的交叉監(jiān)控方法,其特征是所 述的定位監(jiān)控步驟和語音監(jiān)控步驟,按照被監(jiān)管對(duì)象的監(jiān)管和/或報(bào)警方案的不同,可 以分別獨(dú)立地和/或并行地被執(zhí)行。
4. 按照權(quán)利要求1所述的基于聲紋識(shí)別和定位跟蹤的交叉監(jiān)控方法,其特征是所 述的定位監(jiān)控步驟進(jìn)一步包括,利用定位技術(shù)方法,遠(yuǎn)程地獲取定位通信終端的網(wǎng)絡(luò)身份ID和地理位置,以及定位發(fā)生的時(shí)間;根據(jù)所述網(wǎng)絡(luò)身份ID與用戶標(biāo)識(shí)之間的 綁定關(guān)系,査詢所述網(wǎng)絡(luò)身份ID所唯一綁定的被監(jiān)管對(duì)象的用戶標(biāo)識(shí)和活動(dòng)區(qū)域限 制;判斷所獲取的地理位置是否違規(guī)超越了被監(jiān)管對(duì)象的活動(dòng)區(qū)域限制,如果這次違 規(guī)觸發(fā)了報(bào)警條件,那么使用指定的報(bào)警方式向指定的報(bào)警對(duì)象發(fā)送報(bào)警消息;將此 次定位監(jiān)控的結(jié)果與所述用戶標(biāo)識(shí)對(duì)應(yīng)關(guān)聯(lián)地存儲(chǔ);其中,所述定位監(jiān)控的結(jié)果至少包括網(wǎng)絡(luò)身份ID、地理位置或定位發(fā)生時(shí)間與 違規(guī)越界狀態(tài);所述的定位技術(shù)可以是衛(wèi)星定位、無線移動(dòng)通信網(wǎng)絡(luò)基站定位或衛(wèi)星與無線移 動(dòng)通信網(wǎng)絡(luò)基站的混合定位,其所述的定位技術(shù)通過定位通信終端和/或無線移動(dòng)通信 網(wǎng)絡(luò)服務(wù)來實(shí)現(xiàn)。
5. 按照權(quán)利要求1所述的基于聲紋識(shí)別和定位跟蹤的交叉監(jiān)控方法,其特征是所 述的語音監(jiān)控步驟進(jìn)一步包括,建立人機(jī)交互語音對(duì)話,獲取被監(jiān)管對(duì)象所持有的定 位通信終端的網(wǎng)絡(luò)身份ID,遠(yuǎn)程實(shí)時(shí)地錄取被監(jiān)管對(duì)象根據(jù)播放的隨機(jī)語音提示或要 求所輸入的應(yīng)答語音;對(duì)所錄取的應(yīng)答語音開展聲紋識(shí)別,驗(yàn)證所述被監(jiān)控對(duì)象的生 物身份;為了驗(yàn)證真人在場(chǎng)說話,可以選擇性地增加針對(duì)應(yīng)答語音的內(nèi)容識(shí)別步驟, 即鑒定所述應(yīng)答語音的內(nèi)容是否切合匹配實(shí)際播放的語音提示或要求;綜合利用所述 網(wǎng)絡(luò)身份ID、聲紋識(shí)別結(jié)果和/或應(yīng)答內(nèi)容的鑒定結(jié)果,判斷所述被監(jiān)管對(duì)象是否現(xiàn) 場(chǎng)持有其指定使用的定位通信終端,設(shè)定違規(guī)狀態(tài);如果發(fā)生違規(guī)并觸發(fā)了報(bào)警條件, 則使用指定的報(bào)警方式向指定的報(bào)警對(duì)象發(fā)送報(bào)警消息;將此次語音監(jiān)控的結(jié)果與所 述被監(jiān)管對(duì)象的用戶標(biāo)識(shí)對(duì)應(yīng)關(guān)聯(lián)地存儲(chǔ);其中,所述語音監(jiān)控的結(jié)果可以包括網(wǎng)絡(luò)身份ID、聲紋識(shí)別結(jié)果和/或語音內(nèi) 容鑒定結(jié)果、違規(guī)狀態(tài)或監(jiān)控的發(fā)生時(shí)間。
6. 按照權(quán)利要求4或5所述的基于聲紋識(shí)別和定位跟蹤的交叉監(jiān)控方法,其特征 是在所述的定位監(jiān)控和語音監(jiān)控步驟中,所述違規(guī)報(bào)警的發(fā)送步驟與所述監(jiān)控結(jié)果的 存儲(chǔ)步驟之間的先后執(zhí)行次序無關(guān)。
7. 按照權(quán)利要求1或5所述的基于聲紋識(shí)別和定位跟蹤的交叉監(jiān)控方法,其特征 是所述的聲紋識(shí)別可以分為聲紋注冊(cè)和聲紋驗(yàn)證兩種階段;其中,所述的聲紋注冊(cè)階段至少包括聲紋特征提取步驟,用于對(duì)用戶語音做數(shù) 字信號(hào)處理,并從該語音處理結(jié)果中提取可表征其發(fā)音生理和行為特點(diǎn)的聲紋特征序 列;其所述的聲紋模型建立步驟,用于根據(jù)從用戶注冊(cè)語音中提取出的聲紋特征序列建立表征用戶本人發(fā)音特點(diǎn)的聲紋模型;其中,所述的聲紋驗(yàn)證階段至少包括聲紋特征提取步驟,用于對(duì)用戶語音做數(shù) 字信號(hào)處理,并從該語音處理結(jié)果中提取可表征其發(fā)音生理和行為特點(diǎn)的聲紋特征序 列;其所述的聲紋模式匹配步驟,用于根據(jù)從用戶驗(yàn)證語音中提取出的聲紋特征序 列與對(duì)應(yīng)的用戶聲紋模型進(jìn)行比對(duì),從而確認(rèn)所述用戶的身份。
8. —種按照權(quán)利要求1所述的基于聲紋識(shí)別和定位跟蹤的交叉監(jiān)控系統(tǒng),包括被 監(jiān)管對(duì)象和監(jiān)管工作人員,其中,被監(jiān)管對(duì)象接受來自監(jiān)控系統(tǒng)的自動(dòng)監(jiān)控和來自監(jiān) 管工作人員的管理;監(jiān)管工作人員操作監(jiān)控系統(tǒng),管理被監(jiān)管對(duì)象;其特征是設(shè)置一定位通信終端,作為一種個(gè)人便攜式硬件裝置被附著在被監(jiān)管對(duì)象的身 體表面或者由被監(jiān)管對(duì)象近距離所持有;設(shè)置一應(yīng)用服務(wù)器,用于提供至少以下服務(wù)功能語音通信、數(shù)據(jù)通信、系統(tǒng) 管理、聲紋認(rèn)證和/或信息存儲(chǔ);設(shè)置一監(jiān)管操作終端,作為客戶端,與所述的應(yīng)用服務(wù)器形成Browser/Server 或Client/Server的服務(wù)架構(gòu);監(jiān)管工作人員可以通過它管理被監(jiān)管對(duì)象的個(gè)人信息、 設(shè)定監(jiān)管方案、設(shè)定報(bào)警條件、指定報(bào)警方式和對(duì)象、發(fā)布消息通知與命令、接收?qǐng)?bào) 警通知、觀察被監(jiān)管對(duì)象的地理位置和活動(dòng)軌跡或查閱被監(jiān)管對(duì)象的統(tǒng)計(jì)分析報(bào)告;所述的定位通信終端與應(yīng)用服務(wù)器之間,通過第一聯(lián)接網(wǎng)絡(luò)連接,所述的第一通信網(wǎng)絡(luò)用于傳輸和協(xié)調(diào)那些涉及被監(jiān)管對(duì)象的語音通信和數(shù)據(jù)通信;所述的監(jiān)管操作終端與應(yīng)用服務(wù)器之間,通過第二聯(lián)接網(wǎng)絡(luò)連接, 所述的第二通信網(wǎng)絡(luò)用于傳輸和轉(zhuǎn)送那些涉及監(jiān)管工作人員的數(shù)據(jù)通信和/或 語音通信。
9. 按照權(quán)利要求8所述的基于聲紋識(shí)別和定位跟蹤的交叉監(jiān)控系統(tǒng),其特征是 所述的定位通信終端具有唯一的網(wǎng)絡(luò)身份ID;用于數(shù)據(jù)通信,接收/發(fā)送定位信號(hào),參與系統(tǒng)定位;還可用于語音通信,在人機(jī)交互語音對(duì)話過程中播放系統(tǒng)的隨 機(jī)語音提示或要求,釆集和傳輸被監(jiān)管對(duì)象輸入的應(yīng)答語音;所述的應(yīng)用服務(wù)器,由單臺(tái)計(jì)算機(jī)所代表的實(shí)體性服務(wù)器或由彼此之間通過網(wǎng) 絡(luò)連接協(xié)調(diào)工作的多臺(tái)計(jì)算機(jī)共同組成的虛擬性服務(wù)器所構(gòu)成,其可以包括一個(gè)或多 個(gè)服務(wù)子系統(tǒng),還可以用于選擇性地提供語音內(nèi)容識(shí)別、文字語音合成和地理信息服 務(wù)等可選的輔助服務(wù)功能;若所述應(yīng)用服務(wù)器是由多臺(tái)計(jì)算機(jī)所構(gòu)成的虛擬性服務(wù)器,則所述的多臺(tái)計(jì)算機(jī)可以被集中部署在同一個(gè)局域網(wǎng),也可以被分散部署在地理 分布不同的區(qū)域網(wǎng)點(diǎn),而且所述計(jì)算機(jī)是由網(wǎng)絡(luò)連接并被系統(tǒng)管理服務(wù)所協(xié)調(diào)與控制; 所述的應(yīng)用服務(wù)器通過系統(tǒng)管理與信息存儲(chǔ)服務(wù)功能,根據(jù)用戶標(biāo)識(shí)與定位通 信終端的網(wǎng)絡(luò)身份ID之間的綁定關(guān)系,交叉統(tǒng)計(jì)和分析同一統(tǒng)計(jì)時(shí)間段內(nèi)發(fā)生的定位 監(jiān)控和語音監(jiān)控的結(jié)果,為監(jiān)管工作人員提供關(guān)于被監(jiān)管對(duì)象的人體活動(dòng)軌跡和違規(guī) 表現(xiàn)狀況報(bào)告;所述的第一通信網(wǎng)絡(luò),參與執(zhí)行所述的定位監(jiān)控和/或語音監(jiān)控; 所述的第二通信網(wǎng)絡(luò),參與執(zhí)行所述的系統(tǒng)操控與管理、顯示被監(jiān)管對(duì)象的地 理位置、活動(dòng)軌跡、違規(guī)狀況和/或統(tǒng)計(jì)分析報(bào)告。
10.按照權(quán)利要求9所述的基于聲紋識(shí)別和定位跟蹤的交叉監(jiān)控系統(tǒng),其特征是 所述的人機(jī)交互語音對(duì)話至少涉及被監(jiān)管對(duì)象、定位通信終端以及應(yīng)用服務(wù) 器;其允許以主動(dòng)呼叫和被動(dòng)接聽兩種方式來啟動(dòng)語音通信;其所述的主動(dòng)呼叫方式是由被監(jiān)管對(duì)象通過其持有的定位通信終端主動(dòng)呼叫 應(yīng)用服務(wù)器,所述應(yīng)用服務(wù)器接受該語音呼叫,并探測(cè)識(shí)別所述定位通信終端的網(wǎng)絡(luò) 身份ID;其所述的被動(dòng)接聽方式是由應(yīng)用服務(wù)器先選擇作為監(jiān)控目標(biāo)的被監(jiān)管對(duì)象,查 詢與被監(jiān)管對(duì)象綁定的定位通信終端的網(wǎng)絡(luò)身份ID,應(yīng)用服務(wù)器根據(jù)所查詢的網(wǎng)絡(luò)身 份ID,主動(dòng)外呼具有該網(wǎng)絡(luò)身份ID的定位通信終端,由持有該定位通信終端的被監(jiān) 管對(duì)象接聽電話呼叫。
全文摘要
一種基于聲紋識(shí)別和定位跟蹤的交叉監(jiān)控方法和系統(tǒng),屬監(jiān)測(cè)系統(tǒng)領(lǐng)域。其對(duì)被監(jiān)管對(duì)象采集個(gè)人信息和語音樣本并構(gòu)建其聲紋模型,而后通過無線定位通信終端采集其定位信息和聲紋信息,與數(shù)據(jù)庫中的存檔信息進(jìn)行比對(duì),輸出一個(gè)反映被監(jiān)管對(duì)象的人體活動(dòng)軌跡和實(shí)際違規(guī)狀況的完整報(bào)告,供其監(jiān)管工作人員考察和評(píng)估被監(jiān)管對(duì)象的業(yè)績表現(xiàn);監(jiān)管工作人員可不定期地要求和評(píng)估關(guān)于被監(jiān)管對(duì)象活動(dòng)表現(xiàn)的統(tǒng)計(jì)分析報(bào)告,觀察其活動(dòng)軌跡和狀態(tài)或依據(jù)其業(yè)績表現(xiàn)調(diào)整其監(jiān)管方案。其實(shí)現(xiàn)了對(duì)被監(jiān)管對(duì)象的遠(yuǎn)程定位跟蹤,實(shí)現(xiàn)了對(duì)被監(jiān)管對(duì)象的非接觸式生物身份識(shí)別,滿足了遠(yuǎn)距離、非接觸式地監(jiān)控被監(jiān)管對(duì)象的需要。可廣泛用于非接觸式電子監(jiān)控和身份識(shí)別領(lǐng)域。
文檔編號(hào)G10L13/04GK101673544SQ200910196988
公開日2010年3月17日 申請(qǐng)日期2009年10月10日 優(yōu)先權(quán)日2009年10月10日
發(fā)明者熊電元 申請(qǐng)人:上海電虹軟件有限公司;熊電元