專利名稱:面向司法社區(qū)矯正的生物識(shí)別遠(yuǎn)程身份驗(yàn)證方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種聲紋識(shí)別和人臉識(shí)別方法,尤其是涉及一種面向司法社區(qū)矯正的生物識(shí)別遠(yuǎn)程身份驗(yàn)證方法。
背景技術(shù):
社區(qū)矯正,是指將社區(qū)矯正對(duì)象置于社區(qū)內(nèi),由專門的國(guó)家機(jī)關(guān)負(fù)責(zé)并組織社會(huì)力量對(duì)其采取監(jiān)督管理、教育、幫助措施,矯正其犯罪心理和行為惡習(xí),促進(jìn)其順利回歸社會(huì)的非監(jiān)禁刑罰執(zhí)行活動(dòng)。目前,社區(qū)矯正對(duì)象的監(jiān)管方法,主要通過被監(jiān)管對(duì)象攜帶的定位通信終端,采用基于位置的服務(wù)/全球定位系統(tǒng)(LBS/GPS)等定位技術(shù)來定位被監(jiān)管對(duì)象的位置,由于不能將定位終端嵌入到被監(jiān)管對(duì)象的身體內(nèi)部,只能假設(shè)定位的終端或設(shè)備實(shí)時(shí)被攜帶在被監(jiān)管對(duì)象身上,因此定位技術(shù)目前“只認(rèn)物,不認(rèn)人”,存在“人機(jī)分離”的嚴(yán)重問題,容易造成被監(jiān)管對(duì)象“金蟬脫殼”?,F(xiàn)有的“人機(jī)分離”抽查手段主要有電話抽查、短信抽查、拍照抽查等,雖然在一定程度上降低了矯正對(duì)象“人機(jī)分離”的風(fēng)險(xiǎn),但是這些抽查手段存在以下缺點(diǎn)首先,全部靠人工確認(rèn)矯正對(duì)象身份的做法,會(huì)極大地增加人工成本,增大司法社區(qū)矯正的推廣難度;其次,依靠人工來做判斷的方法,其客觀性會(huì)被質(zhì)疑,從而失去監(jiān)管的公平性;此外,通過電話抽查、短信抽查、拍照抽查等手段,人工地確認(rèn)矯正對(duì)象身份,其準(zhǔn)確性不高。近年來,聲紋識(shí)別技術(shù)逐漸發(fā)展起來,并為越來越多的人所熟悉和認(rèn)可。聲紋識(shí)別技術(shù)依據(jù)人的語音來識(shí)別人的身份,它能通過我們最常使用的手機(jī)或固定電話自動(dòng)識(shí)別千里之外的人的身份,可以理解為“遠(yuǎn)程DNA”。鑒于聲紋識(shí)別技術(shù)的這些特點(diǎn),有人提出結(jié)合聲紋識(shí)別技術(shù)和定位技術(shù)來解決“人機(jī)分離”難題的方法,特別是中國(guó)專利CN200910196988. 2 “ 一種基于聲紋識(shí)別和定位跟蹤的交叉監(jiān)控方法和系統(tǒng)”中,詳細(xì)地對(duì)該方法作了說明,并針對(duì)聲紋識(shí)別中存在的錄音回放冒充提出了解決方案。但是,在實(shí)際應(yīng)用中,我們常用的通信終端就是手機(jī)或固定電話,而這些設(shè)備一般都具有“呼叫轉(zhuǎn)移”功能,該功能的存在意味著,即便結(jié)合聲紋識(shí)別技術(shù)和定位技術(shù),“人機(jī)分離”的情況照樣存在,而且沒有任何改善。如果被監(jiān)管對(duì)象將來電呼轉(zhuǎn)到另一部手機(jī),將被監(jiān)控的手機(jī)放置在合法范圍內(nèi),那么被監(jiān)管對(duì)象只要拿著另一部手機(jī),就能四處逍遙了??偟膩碚f,在“人機(jī)分離”的問題中,光靠聲紋識(shí)別技術(shù)和定位技術(shù),還不能完全解決問題。另外,聲紋識(shí)別也存在技術(shù)上的局限性,在非常嘈雜的環(huán)境中,識(shí)別性能迅速下降,而近年來使用越來越普遍的人臉識(shí)別技術(shù),則不受環(huán)境噪音影響。由于人臉識(shí)別技術(shù)依賴于所獲取到的圖像的質(zhì)量,因此它容易受到光線因素的影響,在光線很弱的環(huán)境中會(huì)失效。但是,如果將聲紋識(shí)別技術(shù)和人臉識(shí)別技術(shù)結(jié)合起來,就能克服兩者各自的缺陷,在黑暗的環(huán)境中使用聲紋識(shí)別來進(jìn)行驗(yàn)證身份,而在嘈雜的環(huán)境中使用人臉識(shí)別來驗(yàn)證身份。近年來,通信終端的發(fā)展速度非常快,來自Google的一項(xiàng)調(diào)查報(bào)告顯示,到目前為止,中國(guó)城市的智能手機(jī)普及率已經(jīng)達(dá)到33%,而且,越來越多的智能手機(jī)具備了視頻通話的功能,國(guó)內(nèi)通信網(wǎng)絡(luò)的技術(shù)水平也發(fā)展越來越快,也就是說聲紋識(shí)別所需要的音頻信號(hào)和人臉識(shí)別所需要的視頻信號(hào)都能輕易地通過智能手機(jī)取得。除了上述提到的幾個(gè)問題,目前針對(duì)司法社區(qū)矯正中“人機(jī)分離”問題的監(jiān)控系統(tǒng),還存在以下技術(shù)上的風(fēng)險(xiǎn)1)錄音冒充。在聲紋識(shí)別技術(shù)中,當(dāng)錄音設(shè)備和回放設(shè)備都高保真時(shí),很難檢測(cè)到系統(tǒng)所獲取到的錄音是否來自錄音回放,所以,一旦有人能獲取到某人的高保真錄音時(shí),很大程度上就能成功冒充該人的身份。2)照片或視頻冒充。在人臉識(shí)別系統(tǒng)中,如果該系統(tǒng)不能檢測(cè)所獲取到的圖像是否來活動(dòng)的人(也就是所謂的“活體”),那么冒充者就能憑借某人的照片或一段視頻冒充該人的身份。在上述的專利“一種基于聲紋識(shí)別和定位跟蹤的交叉監(jiān)控方法和系統(tǒng)”中,未能很好地解決因聲紋識(shí)別技術(shù)本身的局限性所帶來的幾個(gè)問題1)噪音環(huán)境下,識(shí)別率迅速下降的問題。當(dāng)矯正對(duì)象身處噪音環(huán)境(比如在公交車上)中時(shí),由于聲紋識(shí)別系統(tǒng)受到噪音干擾,系統(tǒng)無法準(zhǔn)確識(shí)別矯正對(duì)象的身份,嚴(yán)重影響到社區(qū)矯正監(jiān)控系統(tǒng)的正常運(yùn)作。2)錄音冒充的問題。上述專利中,通過將聲紋識(shí)別和語音識(shí)別相結(jié)合的方法來解決錄音冒充的問題,系統(tǒng)隨機(jī)選擇問題對(duì)矯正對(duì)象進(jìn)行詢問,識(shí)別矯正對(duì)象對(duì)這些問題的回答內(nèi)容,在回答的內(nèi)容正確的基礎(chǔ)上用聲紋識(shí)別技術(shù)來識(shí)別身份。這樣做有一個(gè)非常大的局限性,就是系統(tǒng)能成功識(shí)別矯正對(duì)象身份的概率,依賴于語音識(shí)別的精度。而實(shí)際情況是,成千上萬的矯正對(duì)象操著不同的方言,即便會(huì)說普通話,也可能是帶著濃濃的地方特色。所以,這種將聲紋識(shí)別和語音識(shí)別結(jié)合的方法在實(shí)際操作中,會(huì)面臨非常多的問題。3)呼叫轉(zhuǎn)移的問題。如果矯正對(duì)象將來電呼轉(zhuǎn)到其他電話上,對(duì)其進(jìn)行的地理位置定位將失去意義。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對(duì)在司法社區(qū)矯正中,對(duì)被監(jiān)管對(duì)象的遠(yuǎn)程定位跟蹤中存在的“只認(rèn)物,不認(rèn)人”的嚴(yán)重問題,并更大限度上減少采集被監(jiān)管對(duì)象個(gè)人生物特征信息時(shí),對(duì)使用環(huán)境的要求及被監(jiān)管對(duì)象因自身身體問題(如重感冒及其它情況,使得發(fā)音有問題)所帶來的使用上的不便,提供一種面向司法社區(qū)矯正的生物識(shí)別遠(yuǎn)程身份驗(yàn)證方法。本發(fā)明包括以下步驟 I)針對(duì)被監(jiān)管對(duì)象,采集其個(gè)人信息,注冊(cè)其用戶標(biāo)識(shí)碼(ID)和個(gè)人信息,指定被監(jiān)管對(duì)象個(gè)人專用的定位通信終端,并設(shè)置其監(jiān)管方案;在步驟I)中,所述個(gè)人信息包括姓名、年齡、監(jiān)管時(shí)間等;所述被監(jiān)管對(duì)象個(gè)人專用的定位通信終端,具有獨(dú)一無二的設(shè)備標(biāo)識(shí)碼(ID),除了具備定位功能之外,還具備視頻通話功能,能同時(shí)傳送音頻信號(hào)和視頻信號(hào),主要用于被監(jiān)管對(duì)象攜帶在身體表面上,提供基于位置的服務(wù)/全球定位系統(tǒng)(LBS/GPS)數(shù)據(jù)及生物特征數(shù)據(jù)(包括聲紋特征數(shù)據(jù)和人臉特征數(shù)據(jù))上報(bào)功能;所述監(jiān)管方案,是指針對(duì)被監(jiān)管對(duì)象個(gè)人專用的定位通信終端設(shè)置的定位監(jiān)控范圍、定位監(jiān)控頻率及時(shí)間,以及針對(duì)被監(jiān)管對(duì)象本人設(shè)置的身份驗(yàn)證頻率及時(shí)間。2)針對(duì)被監(jiān)管對(duì)象,采集被監(jiān)管對(duì)象的生物特征信息;在步驟2)中,所述 被監(jiān)管對(duì)象的生物特征信息包括被監(jiān)管對(duì)象的聲紋特征信息和人臉特征信息;所述采集被監(jiān)管對(duì)象生物特征信息的方法可為被監(jiān)管對(duì)象通過已核定的定位通信終端對(duì)指定的生物特征登記熱線發(fā)起視頻呼叫,并根據(jù)語音提示,錄制登記語音樣本、采集人臉圖像信息,分別構(gòu)建被監(jiān)管對(duì)象的聲紋模型和人臉模型。3 )根據(jù)監(jiān)管方案,定期或不定期對(duì)被監(jiān)管對(duì)象個(gè)人專用的定位通信終端進(jìn)行定位監(jiān)控,獲取其位置信息并保存于數(shù)據(jù)庫中;在步驟3)中,所述對(duì)被監(jiān)管對(duì)象個(gè)人專用的定位通信終端進(jìn)行定位監(jiān)控包括監(jiān)控系統(tǒng)主動(dòng)請(qǐng)求定位信息和被動(dòng)接受定位信息。4)根據(jù)監(jiān)管方案,定期或不定期對(duì)被監(jiān)管對(duì)象進(jìn)行身份驗(yàn)證,包括聲紋驗(yàn)證和人臉驗(yàn)證,并將身份驗(yàn)證的結(jié)果保存于數(shù)據(jù)庫中;在步驟4)中,所述對(duì)被監(jiān)管對(duì)象進(jìn)行身份驗(yàn)證,是指監(jiān)控系統(tǒng)與被監(jiān)管對(duì)象個(gè)人專用的通信終端之間建立視頻通話連接,被監(jiān)管對(duì)象按照系統(tǒng)的語音或圖像提示,錄制其語音樣本或采集其人臉圖像,進(jìn)行聲紋驗(yàn)證或人臉驗(yàn)證;所述視頻通話連接包括監(jiān)控系統(tǒng)主動(dòng)呼叫被監(jiān)管對(duì)象和被監(jiān)管對(duì)象主動(dòng)呼叫監(jiān)控系統(tǒng)兩種情況;聲紋驗(yàn)證或人臉驗(yàn)證中任意一種驗(yàn)證通過,都算作身份驗(yàn)證成功;否則,身份驗(yàn)證失敗;在步驟4)中,所述聲紋驗(yàn)證,是指文本提示型聲紋驗(yàn)證,被監(jiān)管對(duì)象需要按照監(jiān)控系統(tǒng)的提不朗讀相應(yīng)的內(nèi)容;在步驟4)中,所述人臉驗(yàn)證,是指具有活體檢測(cè)功能的人臉識(shí)別技術(shù),監(jiān)控系統(tǒng)能根據(jù)被監(jiān)管對(duì)象的動(dòng)作來判斷其是否是活動(dòng)的人,而不是照片或視頻。5)根據(jù)步驟3)和步驟4)中所保存的定位信息和身份驗(yàn)證結(jié)果,監(jiān)管工作人員可以查看或生成任意被監(jiān)管對(duì)象在某一段時(shí)間內(nèi)的人體活動(dòng)軌跡和人機(jī)分離狀況報(bào)表,并根據(jù)該報(bào)表考察和評(píng)估被監(jiān)管對(duì)象的守紀(jì)表現(xiàn)。在上述的監(jiān)控 系統(tǒng)中,系統(tǒng)主動(dòng)呼叫被監(jiān)管對(duì)象時(shí),為防止被監(jiān)管對(duì)象將來電呼轉(zhuǎn)到其他通信設(shè)備上,系統(tǒng)將通過設(shè)置通信網(wǎng)絡(luò)的信令參數(shù),從而達(dá)到限制被監(jiān)管對(duì)象進(jìn)行來電呼轉(zhuǎn)的目的。與現(xiàn)有的同類技術(shù)相比,本發(fā)明的突出優(yōu)點(diǎn)和技術(shù)效果包括1.本發(fā)明將使用人臉識(shí)別來彌補(bǔ)聲紋識(shí)別對(duì)噪音敏感這一個(gè)缺陷。當(dāng)錄音環(huán)境非常嘈雜,以及識(shí)別對(duì)象得了重感冒或聲線受到較大影響時(shí),識(shí)別效果會(huì)受到很大影響,驗(yàn)證時(shí)的通過率會(huì)降低,給被監(jiān)管對(duì)象帶來使用上的不便。在這種情形下,我們采用人臉識(shí)別做為候選驗(yàn)證手段。因?yàn)槿四樧R(shí)別對(duì)光線因素較敏感,所以,如果矯正對(duì)象所處環(huán)境光線暗淡,不便于采集人臉圖像時(shí),則可以切換至聲紋識(shí)別,使用聲音來進(jìn)行身份驗(yàn)證。2.本發(fā)明涉及到的聲紋識(shí)別技術(shù),將使用文本提示型聲紋識(shí)別,有效防止錄音冒充。聲紋識(shí)別可分為文本相關(guān)型、文本無關(guān)型以及文本提示型,文本相關(guān)型的聲紋識(shí)別技術(shù)要求用戶按照規(guī)定的內(nèi)容發(fā)音,并且識(shí)別時(shí)的發(fā)音內(nèi)容和注冊(cè)時(shí)的一致;而文本無關(guān)型的聲紋識(shí)別不限制說話人的口音和發(fā)音內(nèi)容;文本提示型的聲紋識(shí)別要求用戶按照提示的內(nèi)容發(fā)音,并且識(shí)別時(shí)的發(fā)音內(nèi)容不一定與注冊(cè)時(shí)的一致。在文本無關(guān)型聲紋識(shí)別技術(shù)中,防錄音冒充的做法是,隨機(jī)提示一組問題讓用戶回答,識(shí)別系統(tǒng)首先使用語音識(shí)別技術(shù)將用戶回答的內(nèi)容識(shí)別出來,若問題回答錯(cuò)誤,則身份驗(yàn)證失敗。而在識(shí)別用戶回答的內(nèi)容時(shí),因?yàn)椴皇敲恳粋€(gè)用戶都能說一口清晰的普通話,識(shí)別很可能出錯(cuò),也就是說,這種做法非常依賴語音識(shí)別技術(shù)的精度和處理非標(biāo)準(zhǔn)普通話的效果。而使用文本提示型的聲紋識(shí)別技術(shù),可以有效解決錄音冒充的問題,因?yàn)樽R(shí)別時(shí)用戶需要朗讀的語音內(nèi)容是隨機(jī)的,即使有人將某人的注冊(cè)語音錄制下來也無濟(jì)于事,并且用戶不需要操著一口標(biāo)準(zhǔn)的普通話。
3.針對(duì)呼叫轉(zhuǎn)移問題,本發(fā)明通過設(shè)置通信網(wǎng)絡(luò)的信令參數(shù),限制被監(jiān)管對(duì)象進(jìn)行來電呼轉(zhuǎn)。在現(xiàn)有的交叉監(jiān)控方案中,沒有考慮到呼叫轉(zhuǎn)移問題的存在,被監(jiān)管對(duì)象只要將來電呼轉(zhuǎn)到其他任何通信終端,定位監(jiān)控將完全失效。本發(fā)明所述的監(jiān)控系統(tǒng)中,系統(tǒng)主動(dòng)呼叫被監(jiān)管對(duì)象時(shí),為防止被監(jiān)管對(duì)象將來電呼轉(zhuǎn)到其他通信設(shè)備上,系統(tǒng)將通過設(shè)置通信網(wǎng)絡(luò)的信令參數(shù),從而達(dá)到限制被監(jiān)管對(duì)象進(jìn)行來電呼轉(zhuǎn)的目的。
圖1是本發(fā)明所述監(jiān)控系統(tǒng)的結(jié)構(gòu)示意圖。圖2是本發(fā)明基于定位技術(shù)和遠(yuǎn)程身份驗(yàn)證技術(shù)的監(jiān)控方法的工作流程圖。圖3是本發(fā)明所述監(jiān)控系統(tǒng)定位監(jiān)控的工作流程圖。圖4是本發(fā)明基于聲紋識(shí)別技術(shù)和人臉識(shí)別技術(shù)的遠(yuǎn)程身份監(jiān)控的工作流程圖。圖5是本發(fā)明基于文本提示型聲紋識(shí)別技術(shù)的身份驗(yàn)證方法的結(jié)構(gòu)示意圖。圖6是本發(fā)明基于活體檢測(cè)的人臉識(shí)別技術(shù)的身份驗(yàn)證方法的結(jié)構(gòu)示意圖。
具體實(shí)施例方式本發(fā)明的核心思想是 在司法社區(qū)矯正中,針對(duì)被監(jiān)管對(duì)象的遠(yuǎn)程定位跟蹤中存在的“只認(rèn)物,不認(rèn)人”的嚴(yán)重問題,結(jié)合聲紋識(shí)別技術(shù)、人臉識(shí)別技術(shù)以及定位技術(shù),在視頻通話的基礎(chǔ)上,采集被監(jiān)管對(duì)象的語音樣本和人臉圖像,進(jìn)行多生物特征識(shí)別,以驗(yàn)證所述被監(jiān)管對(duì)象是否在指定的合法區(qū)域內(nèi)由本人持有其個(gè)人專用的定位通信終端;在所述的兩種生物特征中,任意一種驗(yàn)證成功,都算作身份驗(yàn)證成功,以適應(yīng)復(fù)雜的身份驗(yàn)證環(huán)境,避免在嘈雜的環(huán)境或光線暗淡的環(huán)境中,聲紋識(shí)別或人臉識(shí)別都不奏效的情況發(fā)生;采用文本提示型聲紋識(shí)別技術(shù),以防止錄音冒充,并且相對(duì)采用文本無關(guān)型的聲紋識(shí)別技術(shù)和語音識(shí)別技術(shù)的防錄音冒充方案,本發(fā)明所述方案具有不過度依賴語音識(shí)別精度的優(yōu)點(diǎn),對(duì)于方言眾多的國(guó)內(nèi)應(yīng)用環(huán)境來講,應(yīng)用范圍更廣;針對(duì)“呼叫轉(zhuǎn)移”問題,本發(fā)明通過設(shè)置通信網(wǎng)絡(luò)的信令參數(shù),以防止被監(jiān)管對(duì)象將其個(gè)人專用的通信終端進(jìn)行“呼叫轉(zhuǎn)移”。圖1是本發(fā)明所述監(jiān)控系統(tǒng)的結(jié)構(gòu)示意圖。在圖1中,本發(fā)明中所述監(jiān)控系統(tǒng)至少由應(yīng)用服務(wù)器組1、定位通信終端2、監(jiān)管操作終端3、被監(jiān)管對(duì)象4和監(jiān)管工作人員5,其中應(yīng)用服務(wù)器組I包括多媒體通信服務(wù)器ll、web管理服務(wù)器12、業(yè)務(wù)流程處理服務(wù)器13、遠(yuǎn)程身份認(rèn)證服務(wù)器14、LBS/GPS定位服務(wù)器15、數(shù)據(jù)庫管理服務(wù)器16、TTS語音合成服務(wù)器17,各服務(wù)器之間通過確定的通信接口 18進(jìn)行通信。通信網(wǎng)絡(luò)6連接定位通信和多媒體通信服務(wù)器,通信網(wǎng)絡(luò)7連接監(jiān)管操作終端和web管理服務(wù)器。定位通信終端2,具有獨(dú)一無二的設(shè)備標(biāo)識(shí)碼(例如,移動(dòng)電話號(hào)碼),除了具備定位功能之外,還具備視頻通話功能,能同時(shí)傳送音頻信號(hào)和視頻信號(hào),主要用于被監(jiān)管對(duì)象攜帶在身體表面上,提供基于位置的服務(wù)/全球定位系統(tǒng)(LBS/GPS)數(shù)據(jù)及生物特征數(shù)據(jù)(包括聲紋特征數(shù)據(jù)和人臉特征數(shù)據(jù))上報(bào)功能。監(jiān)管操作終端3,作為與web管理服務(wù)器12對(duì)應(yīng)的客戶端,提供給監(jiān)管工作人員對(duì)被監(jiān)管對(duì)象的個(gè)人信息、監(jiān)管方案等進(jìn)行管理,并可查看被監(jiān)管對(duì)象在某一段時(shí)間內(nèi)的人體活動(dòng)軌跡和人機(jī)分離狀況報(bào)表。通信網(wǎng)絡(luò)6用于傳輸定位信息、語音信息以及視頻信息,這些信息用于定位監(jiān)控和身份驗(yàn)證。該網(wǎng)絡(luò)可以為有線電話網(wǎng)絡(luò)或無線通信網(wǎng)絡(luò)。通信網(wǎng)絡(luò)7用于傳輸監(jiān)管工作人員所需的被監(jiān)管對(duì)象的活動(dòng)軌跡信息、人機(jī)分離狀況報(bào)表數(shù)據(jù)以及存儲(chǔ)于數(shù)據(jù)庫管理服務(wù)器16上的語音樣本信息和人臉圖像信息。該網(wǎng)絡(luò)可以為有線或無線形式的廣域網(wǎng)或局域網(wǎng)網(wǎng)絡(luò)。應(yīng)用服 務(wù)器組I中,多媒體服務(wù)器11通過通信網(wǎng)絡(luò)6與定位通信終端2進(jìn)行通信,獲取定位通信終端的地理位置信息以及被監(jiān)管對(duì)象的語音樣本和人臉圖像信息,交給業(yè)務(wù)流程處理服務(wù)器13進(jìn)行處理,業(yè)務(wù)流程處理服務(wù)器調(diào)用LBS/GPS定位服務(wù)器15,以便計(jì)算所述定位通信終端是否越過規(guī)定的位置范圍,并且調(diào)用遠(yuǎn)程身份認(rèn)證服務(wù)器14,以便計(jì)算所述被監(jiān)管對(duì)象其身份是否驗(yàn)證成功,最后將計(jì)算的結(jié)果保存在數(shù)據(jù)庫管理服務(wù)器16上。應(yīng)用服務(wù)器組中的TTS語音合成服務(wù)器用于合成提示語音,這些提示語音用于被監(jiān)管對(duì)象與所述監(jiān)控系統(tǒng)進(jìn)行視頻通話的交互過程中的語音提示,特別是文本提示型的聲紋識(shí)別所需的隨機(jī)提示語音。監(jiān)管工作人員使用監(jiān)管操作終端3,通過通信網(wǎng)絡(luò)7連接到web管理服務(wù)器12上,web管理服務(wù)器調(diào)用數(shù)據(jù)庫管理服務(wù)器,查詢上述產(chǎn)生的定位通信終端的定位信息以及被監(jiān)管對(duì)象的身份驗(yàn)證信息,計(jì)算并生成被監(jiān)管對(duì)象在某一段時(shí)間內(nèi)的人體活動(dòng)軌跡和人機(jī)分離狀況報(bào)表,供監(jiān)管工作人員參考。圖2是本發(fā)明基于定位技術(shù)和遠(yuǎn)程身份驗(yàn)證技術(shù)的監(jiān)控方法的工作流程圖,其基本流程如下在步驟10中,采集被監(jiān)管對(duì)象的個(gè)人信息,設(shè)置其個(gè)人專用的定位通信終端,并制定其監(jiān)管方案。其中,所述設(shè)置被監(jiān)管對(duì)象個(gè)人專用的定位通信終端,包括設(shè)置標(biāo)識(shí)定位通信終端唯一性的標(biāo)識(shí)碼,監(jiān)控系統(tǒng)通過該標(biāo)識(shí)碼可以與通信終端建立視頻通話。所述的監(jiān)管方案,至少包括設(shè)置被監(jiān)管對(duì)象的活動(dòng)范圍、定位監(jiān)控的頻率以及遠(yuǎn)程身份驗(yàn)證的頻率。在步驟20中,借助被監(jiān)管對(duì)象個(gè)人專用的定位通信終端,與所述多媒體通信服務(wù)器建立視頻通話,被監(jiān)管對(duì)象根據(jù)該通話過程中的語音提示及圖像提示,朗讀相應(yīng)的文本并采集其人臉圖像,以登記聲紋特征和人臉特征。在步驟30中,根據(jù)監(jiān)管方案,定期或不定期地對(duì)被監(jiān)管對(duì)象個(gè)人專用的定位通信終端發(fā)起定位監(jiān)控,并將監(jiān)控結(jié)果保存于數(shù)據(jù)庫中。在步驟40中,根據(jù)監(jiān)管方案,定期或不定期地對(duì)被監(jiān)管對(duì)象發(fā)起遠(yuǎn)程身份認(rèn)證,并將身份認(rèn)證的結(jié)果保存于數(shù)據(jù)庫中。在步驟50中,監(jiān)管工作人員根據(jù)上述步驟所產(chǎn)生的監(jiān)控結(jié)果,查看或生成被監(jiān)管對(duì)象在某一段時(shí)間內(nèi)的人體活動(dòng)軌跡和人機(jī)分離狀況報(bào)表,并根據(jù)該報(bào)表考察和評(píng)估被監(jiān)管對(duì)象的守紀(jì)表現(xiàn)。圖3是本發(fā)明所述監(jiān)控系統(tǒng)定位監(jiān)控的工作流程圖。在步驟301中,根據(jù)所采取的定位技術(shù),由被監(jiān)管對(duì)象個(gè)人專用的定位通信終端和/或移動(dòng)通信網(wǎng)絡(luò)的定位服務(wù)獲取并傳送所述定位通信終端的定位信息及其設(shè)備標(biāo)識(shí)碼。這里所述的定位信息,其獲取方式至少包括兩種,即借助定位通信終端自身所具有的定位功能主動(dòng)上報(bào)其定位信息,或由通信網(wǎng)絡(luò)的定位服務(wù)獲取定位通信終端的定位信息并上報(bào)。在步驟302中,由所述的應(yīng)用服務(wù)器組接收定位信息和設(shè)備標(biāo)識(shí)碼。根據(jù)所獲取的定位信息,查詢所述定位通信終端的地理位置;根據(jù)所獲取的設(shè)備標(biāo)識(shí)碼,查詢與該設(shè)備綁定的被監(jiān)管對(duì)象的定位監(jiān)控范圍。所述的定位監(jiān)控范圍,是指針對(duì)每個(gè)被監(jiān)管對(duì)象所設(shè)置的監(jiān)管方案中,指定被監(jiān)管對(duì)象可活動(dòng)的范圍。在步驟303中,根據(jù)步驟302中的查詢結(jié)果,計(jì)算被監(jiān)管對(duì)象個(gè)人專用的定位通信終端是否超出定位監(jiān)控范圍(即越界),并將包括越界狀況信息在內(nèi)的數(shù)據(jù)保存于數(shù)據(jù)庫中。在步驟304中,執(zhí)行條件判斷。如果出現(xiàn)越界狀況,則執(zhí)行步驟305,給監(jiān)管工作人員和被監(jiān)管對(duì)象雙方發(fā)送告警信息,或者對(duì)被監(jiān)管對(duì)象發(fā)起語音呼叫,讓其知曉其越界狀況;如果沒有出現(xiàn)越界狀況,則結(jié)束此次定位監(jiān)控。圖4是本發(fā)明基于聲紋識(shí)別技術(shù)和人臉識(shí)別技術(shù)的遠(yuǎn)程身份監(jiān)控的工作流程圖。在步驟401中,在圖1中所述的多媒體通信服務(wù)器與被監(jiān)管對(duì)個(gè)人專用的定位通信終端之間建立視頻通話連接,展開語音與視頻交互。所述的定位通信終端具有視頻通話功能,能與多媒體通信服務(wù)器互傳語音與圖像數(shù)據(jù)。所述的建立視頻通話連接,包含多媒體通信服務(wù)器主動(dòng)呼叫定位通信終端和被動(dòng)接收定位通信終端的呼叫請(qǐng)求兩種情況,其中,多媒體通信服務(wù)器主動(dòng)發(fā)出的呼叫請(qǐng)求中,通過修改通信網(wǎng)絡(luò)的信令參數(shù),以便限制被監(jiān)管對(duì)象設(shè)置呼叫轉(zhuǎn)移。在步驟402中,被監(jiān)管對(duì)象根據(jù)視頻通話中的語音和視頻提示,按照提示的指定文本錄制語音,以及/或者按照提示的方式采集人臉圖像。所述的語音和視頻提示,均指建立在視頻通話基礎(chǔ)上監(jiān)控系統(tǒng)所產(chǎn)生的要求被監(jiān)管對(duì)象錄制語音和采集人臉圖像的提示性語音和提示性圖像。提示性語音產(chǎn)生兩個(gè)作用第一,提示被監(jiān)管對(duì)象按指定步驟操作;第二,要求被監(jiān)管對(duì)象按指定方式操作。提示性圖像至少包含一項(xiàng)功能,即顯示語音錄制文本,要求被監(jiān)管對(duì)象按照該文本錄制語音。在步驟403中,對(duì)獲取到的語音樣本和/或人臉圖像分別展開聲紋識(shí)別和/或人臉識(shí)別。對(duì)獲取到的語 音樣本,展開聲紋識(shí)別,如果被監(jiān)管對(duì)象不是按照提示的文本(比如,
8-5-4-6-3-7-0-1-9-2)朗讀,聲紋驗(yàn)證將會(huì)失??;對(duì)獲取到的人臉圖像,展開人臉識(shí)別,如果被監(jiān)管對(duì)象不是按照提示的方式(比如,張開嘴、搖搖頭、點(diǎn)點(diǎn)頭等)采集,人臉驗(yàn)證將會(huì)失敗。在步驟404中,執(zhí)行條件判斷,根據(jù)步驟403所進(jìn)行的聲紋識(shí)別或人臉識(shí)別的結(jié)果,判斷是否有任意一種驗(yàn)證成功如果有,則執(zhí)行步驟406,保存此次遠(yuǎn)程身份驗(yàn)證結(jié)果,并結(jié)束此次遠(yuǎn)程身份監(jiān)控;如果沒有,則執(zhí)行步驟405,給監(jiān)管工作人員發(fā)送告警信息,提示其上述被監(jiān)管對(duì)象出現(xiàn)“人機(jī)分離”狀況,并結(jié)束此次監(jiān)控。圖5是本發(fā)明基于文本提示型聲紋識(shí)別技術(shù)的身份驗(yàn)證方法的結(jié)構(gòu)示意圖,其中至少包含前端處理單元B101、建模單元B102、模式匹配單元B103及模型庫B104。每個(gè)單元的工作過程如下在BlOl中,首先對(duì)輸入的語音進(jìn)行去零漂和歸一化處理,并去除語音中無效的片段(即有效語音檢測(cè)),然后提取語音中的聲紋特征。其中,所述的輸入語音,均指定其文本內(nèi)容;所述的去零漂,是指去除因錄音設(shè)備而產(chǎn)生的語音波形中的偏移;所述的歸一化處理,是指將所有語音歸一化到統(tǒng)一的分貝水平;所述的聲紋特征,是指從語音中提出出來的反應(yīng)人的生理和行為特征的數(shù)據(jù)。
在B102中,根據(jù)BlOl中提取的聲紋特征,對(duì)其進(jìn)行建模,并得到特定的聲紋模型,存儲(chǔ)于模型庫B104中。本發(fā)明中涉及的聲紋識(shí)別是文本提示型的,其建模方法可以基于HMM/UBM、GMM-UBM等。為了適應(yīng)因年齡等因素帶來的聲音特征變化,可對(duì)聲紋模型進(jìn)行定期更新。在B103中,根據(jù)BlOl中提取的聲紋特征以及B104中待匹配的聲紋模型,對(duì)其進(jìn)行模式匹配并得到匹配結(jié)果,作為本次聲紋識(shí)別的判決結(jié)果。在B104中,保存所有人的聲紋模型,形成模型庫,以供識(shí)別時(shí)調(diào)用。圖6是本發(fā)明基于活體檢測(cè)的人臉識(shí)別技術(shù)的身份驗(yàn)證方法的結(jié)構(gòu)示意圖,其中至少包含前端處理單元B201、建模單元B202、模式匹配單元B203及模型庫B204。每個(gè)單元的工作過程如下在B201中,根據(jù)采集的人臉圖像,對(duì)其進(jìn)行人臉檢測(cè)和特征提取。為了防止冒充者使用圖像或視頻進(jìn)行冒充,這里所采集的人臉圖像都是按照提示的動(dòng)作進(jìn)行采集的。所述的人臉檢測(cè),是指根據(jù)人臉圖像,將包括人臉的部分圖像提取出來;所述的特征提取,是指對(duì)所提取的人臉圖像部分,提取能刻畫人臉特征的數(shù)據(jù)。在B202中,根據(jù)B201提取的人臉特征數(shù)據(jù),對(duì)其進(jìn)行建模,并得到特征的人臉模型,存儲(chǔ)于模型庫B203中。本發(fā)明中涉及的人臉識(shí)別,其建模方法可以是基于LGBP的人臉識(shí)別方法、基于AdaBoost的Gabor特征選擇及判別分析方法、基于SV的Kernel判別分析方法SV-KFD或基于特定人臉子空間的人臉識(shí)別方法。在B203中,首先判斷被識(shí)別的人是不是按照指定的方式采集的人臉圖像,比如是否張著口或側(cè)著臉,如果是,則根據(jù) B201中提取的人臉特征數(shù)據(jù)以及B204中待匹配的人臉模型,對(duì)其進(jìn)行模式匹配并得到匹配結(jié)果;如果不是,則本次人臉驗(yàn)證失敗。在B204中,保存所有人的人臉模型,形成模型庫,以供識(shí)別時(shí)調(diào)用。上述的聲紋識(shí)別技術(shù)和人臉識(shí)別技術(shù),參考了多篇專利文獻(xiàn),包括CN201010613010.4 “在線聲紋認(rèn)證系統(tǒng)及其實(shí)現(xiàn)方法”、CN 200810118520. 7 “人臉識(shí)別方法及系統(tǒng)、人臉識(shí)別模型訓(xùn)練方法及系統(tǒng)”。
權(quán)利要求
1.面向司法社區(qū)矯正的生物識(shí)別遠(yuǎn)程身份驗(yàn)證方法,其特征在于包括以下步驟 1)針對(duì)被監(jiān)管對(duì)象,采集其個(gè)人信息,注冊(cè)其用戶標(biāo)識(shí)碼(ID)和個(gè)人信息,指定被監(jiān)管對(duì)象個(gè)人專用的定位通信終端,并設(shè)置其監(jiān)管方案; 2)針對(duì)被監(jiān)管對(duì)象,采集被監(jiān)管對(duì)象的生物特征信息; 3)根據(jù)監(jiān)管方案,定期或不定期對(duì)被監(jiān)管對(duì)象個(gè)人專用的定位通信終端進(jìn)行定位監(jiān)控,獲取其位置信息并保存于數(shù)據(jù)庫中; 4)根據(jù)監(jiān)管方案,定期或不定期對(duì)被監(jiān)管對(duì)象進(jìn)行身份驗(yàn)證,包括聲紋驗(yàn)證和人臉驗(yàn)證,并將身份驗(yàn)證的結(jié)果保存于數(shù)據(jù)庫中; 5)根據(jù)步驟3)和步驟4)中所保存的定位信息和身份驗(yàn)證結(jié)果,監(jiān)管工作人員可以查看或生成任意被監(jiān)管對(duì)象在某一段時(shí)間內(nèi)的人體活動(dòng)軌跡和人機(jī)分離狀況報(bào)表,并根據(jù)該報(bào)表考察和評(píng)估被監(jiān)管對(duì)象的守紀(jì)表現(xiàn)。
2.如權(quán)利要求1所述的面向司法社區(qū)矯正的生物識(shí)別遠(yuǎn)程身份驗(yàn)證方法,其特征在于在步驟I)中,所述個(gè)人信息包括姓名、年齡、監(jiān)管時(shí)間等;所述被監(jiān)管對(duì)象個(gè)人專用的定位通信終端,具有獨(dú)一無二的設(shè)備標(biāo)識(shí)碼,除了具備定位功能之外,還具備視頻通話功能,能同時(shí)傳送音頻信號(hào)和視頻信號(hào),主要用于被監(jiān)管對(duì)象攜帶在身體表面上,提供基于位置的服務(wù)/全球定位系統(tǒng)數(shù)據(jù)及生物特征數(shù)據(jù)上報(bào)功能;所述監(jiān)管方案,是指針對(duì)被監(jiān)管對(duì)象個(gè)人專用的定位通信終端設(shè)置的定位監(jiān)控范圍、定位監(jiān)控頻率及時(shí)間,以及針對(duì)被監(jiān)管對(duì)象本人設(shè)置的身份驗(yàn)證頻率及時(shí)間。
3.如權(quán)利要求2所述的面向司法社區(qū)矯正的生物識(shí)別遠(yuǎn)程身份驗(yàn)證方法,其特征在于所述生物特征數(shù)據(jù)包括聲紋特征數(shù)據(jù)和人臉特征數(shù)據(jù)。
4.如權(quán)利要求1所述的面向司法社區(qū)矯正的生物識(shí)別遠(yuǎn)程身份驗(yàn)證方法,其特征在于在步驟2)中,所述被監(jiān)管對(duì)象的生物特征信息包括被監(jiān)管對(duì)象的聲紋特征信息和人臉特征信息;所述采集被監(jiān)管對(duì)象生物特征信息的方法為被監(jiān)管對(duì)象通過已核定的定位通信終端對(duì)指定的生物特征登記熱線發(fā)起視頻呼叫,并根據(jù)語音提示,錄制登記語音樣本、采集人臉圖像信息,分別構(gòu)建被監(jiān)管對(duì)象的聲紋模型和人臉模型。
5.如權(quán)利要求1所述的面向司法社區(qū)矯正的生物識(shí)別遠(yuǎn)程身份驗(yàn)證方法,其特征在于在步驟3)中,所述對(duì)被監(jiān)管對(duì)象個(gè)人專用的定位通信終端進(jìn)行定位監(jiān)控包括監(jiān)控系統(tǒng)主動(dòng)請(qǐng)求定位信息和被動(dòng)接受定位信息。
6.如權(quán)利要求1所述的面向司法社區(qū)矯正的生物識(shí)別遠(yuǎn)程身份驗(yàn)證方法,其特征在于在步驟4)中,所述對(duì)被監(jiān)管對(duì)象進(jìn)行身份驗(yàn)證,是指監(jiān)控系統(tǒng)與被監(jiān)管對(duì)象個(gè)人專用的通信終端之間建立視頻通話連接,被監(jiān)管對(duì)象按照系統(tǒng)的語音或圖像提示,錄制其語音樣本或采集其人臉圖像,進(jìn)行聲紋驗(yàn)證或人臉驗(yàn)證;所述視頻通話連接包括監(jiān)控系統(tǒng)主動(dòng)呼叫被監(jiān)管對(duì)象和被監(jiān)管對(duì)象主動(dòng)呼叫監(jiān)控系統(tǒng)兩種情況;聲紋驗(yàn)證或人臉驗(yàn)證中任意一種驗(yàn)證通過,都算作身份驗(yàn)證成功;否則,身份驗(yàn)證失敗。
7.如權(quán)利要求1所述的面向司法社區(qū)矯正的生物識(shí)別遠(yuǎn)程身份驗(yàn)證方法,其特征在于在步驟4)中,所述聲紋驗(yàn)證是指文本提示型聲紋驗(yàn)證,被監(jiān)管對(duì)象需要按照監(jiān)控系統(tǒng)的提示朗讀相應(yīng)的內(nèi)容。
8.如權(quán)利要求1所述的面向司法社區(qū)矯正的生物識(shí)別遠(yuǎn)程身份驗(yàn)證方法,其特征在于在步驟4)中,所述人臉驗(yàn)證是指具有活體檢測(cè)功能的人臉識(shí)別技術(shù),監(jiān)控系統(tǒng)能根據(jù)被監(jiān)管對(duì)象的動(dòng)作來判 斷其是否是活動(dòng)的人,而不是照片或視頻。
全文摘要
面向司法社區(qū)矯正的生物識(shí)別遠(yuǎn)程身份驗(yàn)證方法,涉及一種聲紋識(shí)別和人臉識(shí)別方法。其特征在于1)針對(duì)被監(jiān)管對(duì)象,采集其個(gè)人信息,注冊(cè)其用戶標(biāo)識(shí)碼和個(gè)人信息,指定被監(jiān)管對(duì)象個(gè)人專用的定位通信終端并設(shè)置其監(jiān)管方案;2)針對(duì)被監(jiān)管對(duì)象,采集其生物特征信息;3)根據(jù)監(jiān)管方案,對(duì)被監(jiān)管對(duì)象個(gè)人專用的定位通信終端進(jìn)行定位監(jiān)控,獲取其位置信息并保存于數(shù)據(jù)庫中;4)根據(jù)監(jiān)管方案,對(duì)被監(jiān)管對(duì)象進(jìn)行身份驗(yàn)證,并將身份驗(yàn)證的結(jié)果保存于數(shù)據(jù)庫中;5)根據(jù)步驟3)和步驟4)中保存的定位信息和身份驗(yàn)證結(jié)果,監(jiān)管工作人員可以查看或生成任意被監(jiān)管對(duì)象在某一段時(shí)間內(nèi)的人體活動(dòng)軌跡和人機(jī)分離狀況報(bào)表,根據(jù)該報(bào)表考察和評(píng)估被監(jiān)管對(duì)象的守紀(jì)表現(xiàn)。
文檔編號(hào)G06K9/00GK103067460SQ20121055237
公開日2013年4月24日 申請(qǐng)日期2012年12月14日 優(yōu)先權(quán)日2012年12月14日
發(fā)明者洪青陽, 李稀敏, 湯躍鵬 申請(qǐng)人:廈門天聰智能軟件有限公司