一種在電話滿意度調(diào)查中檢測身份冒充的系統(tǒng)與方法
【專利摘要】本發(fā)明提出一種在電話滿意度調(diào)查中檢測身份冒充的系統(tǒng)與方法,解決了以往電話滿意度調(diào)查中身份冒充檢測只能針對單通道電話語音進行檢測且處理語音的方式比較粗糙,電話調(diào)查語音中存在噪音、回鈴音等多種非有效語音等問題。本發(fā)明由待檢測語音庫101、預處理模塊102、說話人語音分割模塊103、調(diào)查對象聲紋庫104、聲紋訓練模塊105、調(diào)查對象語音庫106、驗證語音選取模塊107、調(diào)查對象驗證語音庫108、聲紋驗證模塊109、得分統(tǒng)計分析模塊110和檢測報告生成模塊111組成。利用聲紋識別技術和說話人語音分割技術,檢測身份冒充情況,并最終給出清晰可讀的身份冒充檢測報告,以反映在電話滿意度調(diào)查中調(diào)查數(shù)據(jù)的真實性。
【專利說明】一種在電話滿意度調(diào)查中檢測身份冒充的系統(tǒng)與方法
【技術領域】
[0001]本發(fā)明涉及聲紋識別【技術領域】,特別是一種在電話滿意度調(diào)查中檢測身份冒充的系統(tǒng)與方法。
【背景技術】
[0002]在電話滿意度調(diào)查中,存在調(diào)查對象以一充多的身份冒充情況,即調(diào)查對象A在不同的電話調(diào)查中,分別冒充了 B、C、D等其他人的身份。這樣的情況會直接影響調(diào)查數(shù)據(jù)的可信度,損害調(diào)查任務委托方的利益。以汽車用戶滿意度調(diào)查為例。汽車廠商在渠道管理方面的工作之一便是對經(jīng)銷商進行滿意度調(diào)查,考核結(jié)果直接與經(jīng)銷商利益相關,因為考核分數(shù)高的話,廠商會給經(jīng)銷商適當?shù)姆道?。而某些與經(jīng)銷商發(fā)生沖突或?qū)?jīng)銷商不滿意的車主的調(diào)查會直接影響經(jīng)銷商在客戶滿意度方面的最終得分,所以經(jīng)銷商在給廠商的車主檔案里會進行這樣一些有意的回避或造假。經(jīng)銷商造假的方式之一便是指派一人接聽不同電話接受廠商調(diào)查,以冒充那些發(fā)生沖突或者不滿意車主的身份。
[0003]目前,市場上大部分調(diào)查公司仍在依靠人工審查錄音記錄來排查身份冒充問題,不僅費時費力,而且還難以確保排查結(jié)果的準確性。此外,在部分滿意度調(diào)查案例中,由于涉及到的調(diào)查對象數(shù)目巨大,人工排查的方式已無法解決問題。
[0004]隨著技術的發(fā)展,科學家已發(fā)現(xiàn),人的聲音跟人的指紋一樣具有唯一'I"生,而聲音的這種唯一性特征,我們稱之為“聲紋”。聲紋識別技術屬于生物識別技術的一種,是一項根據(jù)語音波形中反應說話人生理和行為特征的語音參數(shù),自動識別說話人身份的技術。聲紋識別有兩類,即說話人辨認和說話人確認。前者用以判斷某段語音時若干人中的哪一個人所說的,是“多選一”問題;而后者用以確認某段語音是否是指定的某個人所說的,是“一對一判別”問題。不同的任務和應用會使用不同的聲紋識別技術,如從多人中找到某個特定人時需要辨認技術,而做交易時則需要確認技術。不管是辨認還是確認,都需要先對說話人的聲紋進行建模,這就是所謂的“訓練”或“學習”過程。我們能利用聲紋識別技術從人的聲音中識別人的身份信息,而一旦能夠從人的聲音中識別其身份信息,我們就能解決上述電話滿意度調(diào)查中的身份冒充問題。
[0005]近年來,說話人語音分割技術也得到了快速發(fā)展,在對廣播語音和會議語音的自動分類整理任務中,獲得了良好的性能。所謂說話人語音分割,即在一段同時包含N個說話人的錄音中,給出“誰在什么時候說話”的信息。說話人語音分割技術的發(fā)展,使得對多通道錄音資料的處理成為可能。
[0006]目前市場上,已有部分軟件系統(tǒng)基于聲紋識別技術對電話滿意度調(diào)查中的語音進行身份冒充檢測,但是存在如下幾個問題:
[0007]1、只能針對單通道電話語音進行檢測。但是絕大多數(shù)電話錄音系統(tǒng)都是進行雙軌錄音的,即錄音文件中包含調(diào)查員與調(diào)查對象雙方的語音。(所謂調(diào)查員,在本發(fā)明中是指電話滿意度調(diào)查中主動發(fā)起電話調(diào)查的工作人員,其不作為身份冒充的檢車對象;所謂調(diào)查對象,是指調(diào)查員調(diào)查的對象,也是身份冒充的檢測對象。)[0008]2、處理語音的方式比較粗糙,直接對整段語音進行登記和識別,為精細化處理。電話調(diào)查語音中,可能存在噪音、回鈴音、掛機音等多種非有效語音,也可能因未能完整分離單通道語音而存在調(diào)查員的聲音。
【發(fā)明內(nèi)容】
[0009]本發(fā)明提出一種在電話滿意度調(diào)查中檢測身份冒充的系統(tǒng)與方法,解決了以往電話滿意度調(diào)查中身份冒充檢測只能針對單通道電話語音進行檢測且處理語音的方式比較粗糙,電話調(diào)查語音中存在噪音、回鈴音等多種非有效語音等問題。
[0010]為解決上述技術問題,本發(fā)明公開了一種在電話滿意度調(diào)查中檢測身份冒充的系統(tǒng),該系統(tǒng)組成如下:
[0011]一種在電話滿意度調(diào)查中檢測身份冒充的系統(tǒng),包括:
[0012]語音處理模塊,用于對待檢測語音庫內(nèi)的音頻進行處理,包括去除待檢測語音中的非有效語音;
[0013]檢驗分析模塊,用于對處理過的待檢驗語音庫中的語音進行驗證語音選取和聲紋訓練,從而通過聲紋驗證來檢測身份冒充情況,對冒充檢測結(jié)果進行統(tǒng)計分析;
[0014]檢測報告模塊,用于將檢驗分析模塊得到的結(jié)果生成檢驗報告。
[0015]進一步的,所述語音處理模塊包括預處理模塊;
[0016]預處理模塊,用于對待檢測語音進行分貝歸一化、去“零漂”處理,去除待檢測語音庫中的非有效語音。
[0017]更進一步的,所述語音處理模塊還包括說話人語音分割模塊;
[0018]說話人語音分割模塊,當待檢測語音庫為雙通道語音時,該模塊用來分離待檢測語音中調(diào)查員和調(diào)查對象的語音,該模塊的最終輸出為調(diào)查對象語音庫。
[0019]進一步的,所述說話人語音分割模塊包括調(diào)查員聲紋庫、說話人分割引擎和聲紋識別引擎;
[0020]調(diào)查員聲紋庫,為預先為調(diào)查員建立的聲紋庫;
[0021]說話人分割引擎,用于對待檢測語音庫進行處理,生成調(diào)查員和調(diào)查對象語音庫;
[0022]聲紋識別引擎,利用調(diào)查員聲紋庫,從調(diào)查員和調(diào)查對象語音庫中選出調(diào)查對象語音庫。
[0023]進一步的,所述檢驗分析模塊包括聲紋訓練模塊、驗證語音庫選取模塊、聲紋驗證模塊以及得分統(tǒng)計分析模塊;
[0024]聲紋訓練模塊,利用聲紋識別技術,根據(jù)所述調(diào)查對象語音庫訓練得到調(diào)查對象聲紋庫;
[0025]驗證語音庫選取模塊,用于從調(diào)查對象語音庫中選取用于進行聲紋驗證的語音庫,生成調(diào)查對象驗證語音庫;
[0026]聲紋驗證模塊,利用聲紋識別技術,根據(jù)調(diào)查對象驗證語音庫和調(diào)查對象聲紋庫,自動檢測調(diào)查對象身份歸屬信息;
[0027]得分統(tǒng)計分析模塊,根據(jù)聲紋驗證模塊的處理結(jié)果,分析待檢測語音庫中的身份冒充情況。[0028]進一步的,所述檢測報告模塊包括檢測報告分析模塊;
[0029]檢測報告分析模塊,根據(jù)得分統(tǒng)計分析模塊的輸出,自動生成身份冒充檢測報告。
[0030]為解決上述技術問題,本發(fā)明公開了一種在電話滿意度調(diào)查中檢測身份冒充的方法,該方法包括:
[0031]一種在電話滿意度調(diào)查中檢測身份冒充的方法,包括:
[0032]步驟1、針對待檢測語音庫進行預處理,得到調(diào)查對象聲紋庫和調(diào)查對象驗證語音庫;
[0033]步驟2、通過聲紋驗證模塊進行身份冒充檢測,然后通過得分統(tǒng)計分析模塊對所得結(jié)果進行分析,檢驗出待檢測語音庫中的身份冒充情況;
[0034]步驟3、由步驟2中得到的身份冒充情況生成檢測報告。
[0035]進一步的,所述步驟I針對待檢測語音庫進行處理進一步包括:
[0036]步驟1.1、先對待檢測語音進行分貝歸一化、去“零漂”處理,然后去除待檢測語音庫中的非有效語音;
[0037]步驟1.2、如果待檢測語音為單通道語音,則跳過此步驟,直接進行下一步處理,同時將處理過的待檢測語音庫置為調(diào)查對象語音庫;如果待檢測語音為雙通道語音,需對處理過的待檢測語音庫進行說話人語音分割處理,分割得到僅包含調(diào)查對象語音的語音庫,并將其置為調(diào)查對象語音庫;
[0038]步驟1.3、根據(jù)調(diào)查對象語音庫訓練得到調(diào)查對象聲紋庫,同時從調(diào)查對象語音庫中選取語音,以組成調(diào)查對象驗證語音庫。
[0039]進一步的,所述步驟1.2中對處理過的待檢測語音庫進行說話人語音分割處理進一步還包括:
[0040]步驟1.2.1、建立調(diào)查員聲紋庫;
[0041]步驟1.2.2、利用說話人分割引擎將已處理的待檢測語音庫內(nèi)的語音進行語音分害I],得到調(diào)查員和調(diào)查對象語音庫;
[0042]步驟1.2.3、將步驟1.2.2中調(diào)查員和調(diào)查對象語音庫與步驟1.2.1中調(diào)查員聲紋庫通過聲紋識別引擎進行聲紋識別,篩選出調(diào)查對象語音庫。
[0043]進一步的,所述步驟2對處理過的待檢測語音庫進行身份冒充檢測進一步包括:
[0044]步驟2.1、根據(jù)步驟1.3將生成的調(diào)查對象聲紋庫和調(diào)查對象驗證語音庫,用聲紋驗證模塊對語音庫進行身份冒充檢測,得到相似度,再與預設的閾值比較,確認是接受用戶還是拒絕用戶,從而完成聲紋驗證過程;
[0045]步驟2.2、將聲紋驗證模塊的處理結(jié)果送入得分統(tǒng)計模塊,得到冒充檢測得分報表。
[0046]由上述對本發(fā)明的描述可知,和現(xiàn)有技術相比,本發(fā)明具有如下優(yōu)點:
[0047]一、本發(fā)明針對以往電話滿意度調(diào)查中身份冒充檢測方法的缺點,提出了一個基于聲紋識別技術和說話人語音分割技術的解決方案,相對于傳統(tǒng)的人工排查身份冒充的方法,極大的提高了檢測效率、降低了檢測錯誤率,并且使得在調(diào)查對象人數(shù)眾多的電話滿意度調(diào)查中進行身份冒充的自動檢測成為可能。
[0048]二、相對于目前市場上已有的利用聲紋識別技術進行身份冒充檢測的方法,本發(fā)明在兩個方面做了改進:其一,本發(fā)明利用說話人語音分割技術,針對雙通道電話語音進行語音分離,并且事先為調(diào)查員建立聲紋庫,在此基礎上有效分離出調(diào)查對象的語音,而現(xiàn)有的方法未能有效解決多通道語音中的身份冒充檢測問題;其二,本發(fā)明對待檢測語音庫進行了精細化處理,包括去除噪音、回鈴音等非有效語音,在此基礎上,將調(diào)查對象語音庫分割長訓練語音庫和驗證語音庫,并且二者不重合,以確保檢測結(jié)果的客觀性。
【專利附圖】
【附圖說明】
[0049]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0050]圖1為本發(fā)明所涉及的一種在電話滿意度調(diào)查中檢測身份冒充系統(tǒng)的結(jié)構(gòu)框圖;
[0051]圖2為圖1所示結(jié)構(gòu)框圖中說話人語音分割系統(tǒng)的結(jié)構(gòu)框圖;
[0052]圖3為本發(fā)明所涉及的一種在電話滿意度調(diào)查中檢測身份冒充的方法的流程框圖;
[0053]圖4為本發(fā)明中得分統(tǒng)計模塊工作流程圖。
【具體實施方式】
[0054]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0055]本發(fā)明的核心思想是:在電話滿意度調(diào)查中,利用聲紋識別技術和說話人語音分割技術,檢測身份冒充情況,并最終給出清晰可讀的身份冒充檢測報告,以反映滿意度調(diào)查數(shù)據(jù)的真實性。
[0056]圖1描述了本發(fā)明所涉及的一種在電話滿意度調(diào)查中檢測身份冒充系統(tǒng)的結(jié)構(gòu)框圖,在圖1中,本發(fā)明由待檢測語音庫101、預處理模塊102、說話人語音分割模塊103、調(diào)查對象聲紋庫104、聲紋訓練模塊105、調(diào)查對象語音庫106、驗證語音選取模塊107、調(diào)查對象驗證語音庫108、聲紋驗證模塊109、得分統(tǒng)計分析模塊110和檢測報告生成模塊111組成。
[0057]待檢測語音庫101,當所述待檢測語音為單通道語音時,待檢測語音庫由多個調(diào)查對象的錄音資料組成;當所述待檢測語音為雙通道語音時,它由多個包含調(diào)查員和調(diào)查對象語音的錄音資料組成。在本發(fā)明中,待檢測語音專指電話調(diào)查錄音資料。
[0058]預處理模塊102,該模塊用于對語音進行分貝歸一化、去“零漂”等處理,去除待檢測語音中包含的噪音、回鈴音等非有效語音,剔除有效語音過短的待檢測語音。
[0059]說話人語音分割模塊103,該模塊僅當所述待檢測語音為雙通道語音時才生效。
[0060]說話人語音分割模塊103的內(nèi)部系統(tǒng)如圖2所示,它由已處理的待檢測語音庫201、說話人語音分割引擎202、調(diào)查員和調(diào)查對象語音庫203、聲紋識別引擎205、調(diào)查對象語音庫204以及調(diào)查員聲紋庫206組成。
[0061]其中,已處理的待檢測語音庫201就是所述預處理模塊102的輸出;說話人語音分割引擎202,有較多的成熟算法可以參考,本發(fā)明優(yōu)選清華大學的博士論文一《電話信道下多說話人識別研究》(清華大學學位論文服務系統(tǒng))中公開的技術方案,此技術方案可以高效地進行雙通道的語音分割;所述調(diào)查員和調(diào)查對象語音庫203,就是所述說話人語音分割引擎202的處理結(jié)果;所述聲紋識別引擎205,利用所述調(diào)查員聲紋庫206,從所述調(diào)查員和調(diào)查對象語音庫203中選出調(diào)查對象語音庫204。
[0062]本發(fā)明中引入調(diào)查員聲紋庫的優(yōu)點為:其一,對雙通道語音進行有監(jiān)督的分離,準確性遠遠高于非監(jiān)督的語音分離方式,而極大的簡化了語音分割流程;其二,調(diào)查員的語音獲取方便,便于為其建立聲紋庫,而且調(diào)查員聲紋庫可以在相對一段較長的時間內(nèi)連續(xù)使用。
[0063]調(diào)查對象語音庫106,用于提供身份冒充檢測的語音庫,當所述待檢驗語音庫101為雙通道語音時,所述調(diào)查對象語音庫106是從預處理過的所述待檢測語音庫中經(jīng)說話人語音分割模塊分離出來的。
[0064]聲紋訓練模塊105,利用聲紋識別技術,根據(jù)所述調(diào)查對象語音庫106訓練調(diào)查對象聲紋庫。所述聲紋訓練模塊105是整個系統(tǒng)的核心模塊之一,它基于目前較為成熟的聲紋識別技術,根據(jù)說話人的語音提取說話人的身份信息,保存在聲紋庫中。
[0065]調(diào)查對象聲紋庫104,由所述調(diào)查對象語音庫106訓練而來,保存了每個調(diào)查對象的聲紋信息。
[0066]驗證語音選取模塊107,用于從所述調(diào)查對象語音庫106中選取用于進行聲紋驗證的語音庫。該模塊遵循兩個原則:一、確保驗證語音庫與訓練語音庫不重疊;二、驗證語音的有效時長不宜大于對應的訓練語音時長,也不宜過短。如果在所述調(diào)查對象語音庫中,某個調(diào)查對象所對應的全部有效語音時長過短,則將該調(diào)查對象分離出來單獨分析。本發(fā)明中,所述驗證語音時長以I分鐘左右有效語音時長為佳。滿足上述原則的調(diào)查對象語音,都被分割成兩段語音,即訓練語音和驗證語音,我們將此處的驗證語音稱之為“調(diào)查對象本人參考語音”。
[0067]調(diào)查對象驗證語音庫108,由所述驗證語音選取模塊107從所述調(diào)查對象語音庫106中選取而來,該語音庫為本發(fā)明中對所述待檢測語音庫101的精細化處理。相比于現(xiàn)有方法中將整段語音進行訓練和驗證的處理方式,這樣做的好處是,調(diào)查對象本人參考語音對本人的聲紋驗證得分可以為得分統(tǒng)計模塊110提供一個額外的參考得分。
[0068]聲紋驗證模塊109,利用聲紋識別技術,根據(jù)調(diào)查對象驗證語音庫和調(diào)查對象聲紋庫,自動檢測調(diào)查對象身份歸屬信息。該模塊是整個系統(tǒng)的核心模塊之一,其性能的好壞直接影響到身份冒充檢測的效果。
[0069]得分統(tǒng)計分析模塊110,該模塊根據(jù)聲紋驗證模塊109的處理結(jié)果,分析待檢測語音庫101中的身份冒充情況。
[0070]檢測報告生成模塊111,根據(jù)得分統(tǒng)計模塊110輸出的分析結(jié)果,自動生成可讀性強的身份冒充檢測報告;本發(fā)明中,檢測報告生成模塊111至少需要生成所述待檢測語音庫101中每個調(diào)查對象的基本信息及其身份冒充記錄,以及對應的冒充對象的基本信息及被冒充的可能性大小,檢測報告中會清晰地描述有哪些調(diào)查對象冒充了不同的人、冒充的是哪些人。
[0071]一種在電話滿意度調(diào)查中檢測身份冒充的方法,包括:[0072]步驟1、針對待檢測語音庫進行預處理,得到調(diào)查對象聲紋庫和調(diào)查對象驗證語音庫;
[0073]步驟2、通過聲紋驗證模塊進行身份冒充檢測,然后通過得分統(tǒng)計分析模塊對所得結(jié)果進行分析,檢驗出待檢測語音庫中的身份冒充情況;
[0074]步驟3、由步驟2中得到的身份冒充情況生成檢測報告。
[0075]進一步的,所述步驟I針對待檢測語音庫進行處理進一步包括:
[0076]步驟1.1、先對待檢測語音進行分貝歸一化、去“零漂”處理,然后去除待檢測語音庫中的非有效語音;
[0077]對于非有效語音的檢測方法,有非常多的成熟算法可以參考,本發(fā)明中優(yōu)選專利文獻一《基于非監(jiān)督學習的噪聲譜估計和語音活動度檢測方法》(中國專利
【發(fā)明者】李稀敏, 肖龍源 申請人:廈門快商通信息技術有限公司