通話錄音服務器、通話數據管理系統及通話數據管理方法
【專利摘要】提供能更簡單地監(jiān)視多個IP電話的通話內容的通話錄音服務器。通話錄音服務器(410)包括:語音記錄控制單元(414),依次獲取通過IP電話網傳輸的通話的語音數據,并將該語音數據記錄至存儲器;通話開始獲取單元(415),基于所獲取的語音數據中附帶的控制信息,獲取開始通話的通話開始時序;以及語音辨識控制單元(416),在所獲取的通話開始時序之后,立即開始對所記錄的語音數據進行語音辨識處理。
【專利說明】
通話錄音服務器、通話數據管理系統及通話數據管理方法
技術領域
[0001]本發(fā)明涉及記錄并管理IP(Internet Protocol,互聯網協議)電話網中的通話的語音數據的通話錄音服務器、通話數據管理系統及通話數據管理方法。
【背景技術】
[0002]以往,確認或監(jiān)控(以下稱為“監(jiān)視”)通話內容,以實現各種目的例如提高呼叫中心的服務質量。另外,近年來,使用了VoIP(Voice over Internet Protocol,互聯網語音協議)技術的IP電話正在普及。因此,已存在用于記錄并管理IP電話網中的通話的語音數據的各種技術(例如參照專利文獻I)。
[0003]在專利文獻I所記載的技術(以下稱為“以往技術”)中,呼叫中心的話務員終端將在電話應答結束后由話務員制成的業(yè)務履歷信息、和對于通話語音的語音數據的語音辨識處理的結果即語音辨識信息發(fā)送至服務器。管理者的終端獲取業(yè)務履歷信息及語音辨識信息,并提示管理者。
[0004]根據上述現有技術,管理者能夠在通話結束后,確認對IP電話網中的通話語音的語音辨識結果。即,能夠通過使用現有技術來監(jiān)視IP電話的通話內容。
[0005]現有技術文獻
[0006]專利文獻
[0007]專利文獻1:日本特開2008-211271號公報
【發(fā)明內容】
[0008]發(fā)明要解決的問題
[0009]但是,以下的作業(yè)會耗費工夫,該作業(yè)是指在各通話結束后,找到需要確認的通話,檢索所找到的通話的語音數據,并對所存儲的語音辨識結果或語音數據進行確認。在像大規(guī)模呼叫中心這樣的IP電話的個數多的情況下,服務器所存儲的上述業(yè)務履歷信息及語音辨識信息的量也會增大,上述作業(yè)會變得非常繁雜。因此,現有技術難以適用于作為監(jiān)視對象的IP電話的個數多的情況。
[0010]本發(fā)明的目的在于提供能更簡單地監(jiān)視多個IP電話的通話內容的通話錄音服務器、通話數據管理系統及通話數據管理方法。
[0011]解決問題的方案
[0012]本發(fā)明的通話錄音服務器包括:語音記錄控制單元,依次獲取通過IP電話網傳輸的通話的語音數據,并將所述語音數據記錄至存儲器;通話開始獲取單元,基于所獲取的所述語音數據中附帶的控制信息,獲取開始所述通話的通話開始時序;以及語音辨識控制單元,在所獲取的所述通話開始時序之后,立即開始對所記錄的所述語音數據進行語音辨識處理。
[0013]本發(fā)明的通話數據管理系統包括:通話錄音服務器,記錄通過IP電話網傳輸的通話的語音數據;語音辨識服務器,對所記錄的所述語音數據進行語音辨識處理,并生成作為所述語音辨識處理的結果的文本數據;以及監(jiān)視裝置,對應地提示所記錄的所述語音數據與所生成的所述文本數據,其中,所述通話錄音服務器包括:語音記錄控制單元,從IP電話網依次獲取所述語音數據,并將所述語音數據記錄至存儲器;通話開始獲取單元,基于所獲取的所述語音數據中附帶的控制信息,獲取開始所述通話的通話開始時序;以及語音辨識控制單元,向所述語音辨識服務器輸出所記錄的所述語音數據,使所述語音辨識服務器在所獲取的所述通話開始時序之后,立即開始對所述語音數據進行語音辨識處理。
[0014]本發(fā)明的通話數據管理方法包括以下步驟:依次獲取通過IP電話網傳輸的通話的語音數據,并將所述語音數據記錄至存儲器的步驟;基于所獲取的所述語音數據中附帶的控制信息,獲取開始所述通話的通話開始時序的步驟;以及在所獲取的所述通話開始時序之后,立即開始對所記錄的所述語音數據進行語音辨識處理的步驟。
[0015]發(fā)明的效果
[0016]根據本發(fā)明,在通話開始時序之后,立即開始對通過IP電話網傳輸的通話的語音數據進行語音辨識處理,因此,能夠在通話過程中基本實時地提示語音辨識結果。因此,根據本發(fā)明,能更簡單地監(jiān)視多個IP電話的通話內容。
【附圖說明】
[0017]圖1是表示本發(fā)明的一實施方式的包含通話數據管理系統的通信系統的結構的一例的系統結構圖。
[0018]圖2是表示本實施方式的通話錄音服務器的結構的一例的方框圖。
[0019]圖3是表示本實施方式的通話錄音服務器的動作的一例的流程圖。
[0020]圖4是表示本實施方式的通信系統的動作流程的一例的序列圖。
[0021]附圖標記說明
[0022]100:通信系統
[0023]200:外部網
[0024]300:內部網
[0025]310:電話
[0026]320:網絡設備
[0027]330: PBX 裝置
[0028]400:通話管理網
[0029]410:通話錄音服務器
[0030]411:電話網通信單元
[0031]412:管理網通信單元
[0032]413:存儲器
[0033]414:語音記錄控制單元
[0034]415:通話開始獲取單元
[0035]416:語音辨識控制單元
[0036]420:管理服務器
[0037]430:語音辨識服務器
[0038]440:監(jiān)視裝置
【具體實施方式】
[0039]以下,參照附圖詳細地說明本發(fā)明的一實施方式。本實施方式是將本發(fā)明應用于設置有多個IP電話的呼叫中心的通話監(jiān)視系統時的具體方式的一例。
[0040]<系統結構>
[0041]首先,說明本實施方式的包含通話數據管理系統的通信系統的結構。
[0042]圖1是表示本實施方式的包含通話數據管理系統的通信系統的結構的一例的系統結構圖。
[0043]圖1中,通信系統100包括外部網200、內部網300及通話管理網400。
[0044]外部網200是互聯網等公共網,且是連接著呼叫中心的顧客所使用的IP終端(未圖示)的通信網絡。即,外部網200構成由呼叫中心形成的IP電話網的一部分。
[0045]內部網300是構建在呼叫中心中的LAN(Local Area Network,局域網)等通信網絡的一部分。內部網300包括第一電話31(h?第N電話310n、網絡設備320及PBX(PrivateBranch eXchange,用戶交換機)裝置330。
[0046]各電話310是進行顧客應答的話務員所使用的IP電話。第一電話31(h?第N電話310n經由網絡設備320分別連接于PBX裝置330。
[0047]網絡設備320是在各電話310與PBX裝置330之間轉發(fā)IP信息包的中繼裝置,例如是交換式集線器、TAP(Test Access Point,分路器)盒或路由器。但是,網絡設備320是通過端口鏡像等功能,向通話管理網400發(fā)送轉發(fā)的IP信息包的副本。
[0048]PBX裝置330是用戶交換機,其連接于外部網200 JBX裝置330從外部網200接收發(fā)往第一電話310!?第N電話310n的IP信息包,并轉發(fā)給網絡設備320。另外,PBX裝置330從網絡設備320接收發(fā)往外部網200的IP電話(未圖示)的IP信息包,并轉發(fā)給外部網200。
[0049]S卩,內部網300構成IP電話網的一部分,傳輸由呼叫中心進行的多個通話的IP信息包,并且向通話管理網400發(fā)送傳輸的IP信息包的副本。
[0050]通話管理網400例如是構建在呼叫中心中的LAN等通信網絡的一部分,且是與本發(fā)明的通話數據管理系統對應的部分。通話管理網400包括通話錄音服務器410、管理服務器420、語音辨識服務器430及監(jiān)視裝置440。
[0051]此外,各裝置的連接關系并不限定于圖1所示的連接線。各裝置例如分別連接于LAN,能在任何裝置之間進行通信。
[0052]通話錄音服務器410連接于內部網300的網絡設備320。通話錄音服務器410接收網絡設備320所發(fā)送的IP信息包,從接收到的IP信息包中提取并記錄通話的語音數據。即,通話錄音服務器410記錄通過IP電話網傳輸的通話的語音數據。
[0053]圖2是表示通話錄音服務器410的結構的一例的方框圖。
[0054]圖2中,通話錄音服務器410包括電話網通信單元411、管理網通信單元412、存儲器413、語音記錄控制單元414、通話開始獲取單元415及語音辨識控制單元416。
[0055]電話網通信單元411是用于與內部網300的通信網絡連接的通信接口,其連接于網絡設備320。電話網通信單元411接收網絡設備320所發(fā)送的IP信息包,并依次向語音記錄控制單元414及通話開始獲取單元415輸出接收到的IP信息包。
[0056]管理網通信單元412是用于與通話管理網400的通信網絡連接的通信接口,其連接于管理服務器420、語音辨識服務器430及監(jiān)視裝置440。
[0057]存儲器413是硬盤等記錄介質,其可讀取地保持由語音記錄控制單元414存儲的信息。
[0058]語音記錄控制單元414對所輸入的IP信息包進行分析,從各個IP信息包中提取語音數據(通話語音信號)及控制信息(通信控制信號)。接著,語音記錄控制單元414將提取到的語音數據與控制信息等用于確定語音數據的信息相對應地依次存儲至存儲器413。即,語音記錄控制單元414從IP電話網依次獲取語音數據,并將該語音數據記錄至存儲器413。
[0059]語音數據是包含通話雙方的說話人的發(fā)聲語音的聲音數據。控制信息是語音數據附帶的信息,其包含通話識別信息、說話人識別信息及時刻信息。通話識別信息是用于對通話進行識別的信息(例如雙方的電話號碼)。說話人識別信息是用于對語音數據中所含的發(fā)聲語音的說話人(IP電話)進行識別的信息。時刻信息是表示語音數據所對應的時刻的信息??刂菩畔⒓瓤梢詮腎P信息包的標頭部分獲取,也可以從IP信息包的負載部分獲取。
[0060]通話開始獲取單元415對所輸入的IP信息包進行分析,從各個IP信息包中提取包含通話識別信息的控制信息。通話開始獲取單元415基于提取到的控制信息,對每次通話確定電話網通信單元411最初接收到該通話的IP信息包時的時序。通話開始獲取單元415獲取已確定的上述時序作為該通話開始的時序(以下稱為“通話開始時序”)。接著,通話開始獲取單元415每當獲取通話開始時序時,將通話開始時序與對應通話的控制信息一起通知語音辨識控制單元416。
[0061]此外,在控制信息中包含表示通話開始時刻的信息等直接表示通話開始時序的信息的情況下,通話開始獲取單元415也可以從該信息獲取通話開始時序。
[0062]另外,還可以由電話網通信單元411從IP信息包中提取語音數據及控制信息。
[0063]語音辨識控制單元416在被通知了通話開始時序后,經由管理網通信單元412對管理服務器420發(fā)送表示通話開始時序的通話開始通知。通話開始通知中例如包含控制信息。
[0064]另外,語音辨識控制單元416在經由管理網通信單元412接收語音數據的發(fā)送請求(以下稱為“語音發(fā)送請求”)后,向請求方回復存儲器413所記錄的作為請求對象的語音數據。語音發(fā)送請求中包含控制信息等確定語音數據的信息。另外,語音發(fā)送請求例如由語音辨識服務器430及監(jiān)視裝置440發(fā)送。語音發(fā)送請求例如是以下的內容,該內容指定通話識別信息,并請求一旦存儲對應通話的語音數據,就依次回復該語音數據。
[0065]如后述那樣,在發(fā)送通話開始通知后,語音辨識服務器430會通過管理服務器420的管理功能,向通話錄音服務器410請求語音數據,并開始對回復的語音數據進行語音辨識處理。
[0066]S卩,語音辨識控制單元416發(fā)送通話開始通知的結果是,向語音辨識服務器430輸出所記錄的語音數據,在通話開始時序之后,立即使語音辨識服務器430開始對存儲器413所記錄的語音數據進行語音辨識處理。
[0067]圖1的管理服務器420通過接收通話錄音服務器410所發(fā)送的通話開始通知來獲取通話開始時序。接著,管理服務器420基于獲取的通話開始時序,對通話錄音服務器410、語音辨識服務器430及監(jiān)視裝置440各自的動作時序進行控制。
[0068]更具體來說,管理服務器420在接收通話開始通知后,基于通話開始通知中所含的控制信息,決定是否對通話開始通知所示的通話的語音數據進行語音辨識處理。
[0069]接著,管理服務器420在判斷為進行語音辨識的情況下,對語音辨識服務器430發(fā)送開始對通話錄音服務器410所記錄的語音數據進行語音辨識處理的請求(以下稱為“辨識開始請求”)。辨識開始請求中包含控制信息等確定語音數據的信息。
[0070]另外,管理服務器420在判斷為進行語音辨識的情況下,對監(jiān)視裝置440轉發(fā)通話開始通知。而且,管理服務器420在從語音辨識服務器430接收表示語音辨識處理已開始的通知(以下稱為“辨識開始通知”)后,向監(jiān)視裝置440轉發(fā)該辨識開始通知。辨識開始通知中包含控制信息等確定語音數據的信息。
[0071 ]語音辨識服務器430在接收辨識開始請求后,對通話錄音服務器410發(fā)送以與辨識開始請求相同的語音數據為對象的語音發(fā)送請求。接著,語音辨識服務器430對通話錄音服務器410所回復的語音數據進行語音辨識處理,生成作為語音辨識處理的結果的文本數據,并將該文本數據存儲至語音辨識服務器430的存儲器(未圖示)。
[0072]語音辨識服務器430進行利用公知的語音辨識技術的語音辨識處理。例如,語音辨識服務器包括語音辨識數據庫、聲音分析單元及辨識解碼單元(均未圖示)。
[0073]語音辨識數據庫預先存儲有聲音模型、字典及語言模型。聲音模型是將語音特征量與發(fā)音記號之間的概率性對應關系數據化所得的模型。字典記述有多個文本陣列作為語音辨識處理的語音辨識結果的候選組。語言模型是對于字典所記述的各個文本陣列,將出現概率或連接概率數據化所得的模型。
[0074]聲音分析單元對語音信號進行幀處理,并對每一幀進行包含傅里葉分析的規(guī)定處理,從而提取語音特征量。接著,聲音分析單元根據分析結果,檢測出包含發(fā)聲語音的語音區(qū)間,生成僅基于語音區(qū)間的語音特征量的時間序列數據。
[0075]辨識解碼單元基于聲音分析單元所生成的語音特征量的時間序列數據,并參照語音辨識數據庫的聲音模型、字典及語言模型來決定語音辨識結果。
[0076]此外,在語音辨識已成功的情況下,語音辨識結果中包含將發(fā)聲語音文本化所得的文本數據。即,語音辨識服務器430對通話錄音服務器410所記錄的語音數據進行語音辨識處理,生成作為語音辨識處理的結果的文本數據。
[0077]另外,語音辨識服務器430在從監(jiān)視裝置440接收發(fā)送文本數據的請求(以下稱為“辨識結果發(fā)送請求”)后,向監(jiān)視裝置440回復所保存的作為請求對象的語音數據的語音辨識結果。辨識結果發(fā)送請求中包含基礎語音數據的控制信息等確定語音數據的信息。辨識結果發(fā)送請求例如是以下的內容,該內容指定通話識別信息,并請求一旦生成對應通話的語音辨識結果,就依次回復該語音辨識結果。
[0078]監(jiān)視裝置440是監(jiān)視呼叫中心的各通話的管理者所使用的個人電腦中的作為網頁瀏覽器發(fā)揮功能的部分。監(jiān)視裝置440在從管理服務器420接收通話開始通知后,對通話錄音服務器410發(fā)送語音發(fā)送請求,并對語音辨識服務器430發(fā)送辨識結果發(fā)送請求。
[0079]接著,監(jiān)視裝置440將通話錄音服務器410所回復的語音數據、與語音辨識服務器430所回復的語音辨識結果中的至少文本數據對應地顯示在液晶顯示器等顯示單元中。即,監(jiān)視裝置440在通話開始時序之后,立即對管理者對應地提示語音數據與其語音辨識結果(文本數據)。
[0080]此外,通話錄音服務器410、管理服務器420、語音辨識服務器430及監(jiān)視裝置440各自包括未圖示的例如CPlKCentral Processing Unit,中央處理器)、存儲有控制程序的ROM(Read Only Memory,只讀存儲器)等存儲媒體、RAM(Random Access Memory,隨機存取存儲器)等作業(yè)用存儲器及通信電路等。在此情況下,上述各裝置及各單元的功能通過由CPU執(zhí)行控制程序來實現。
[0081]在如上所述的通信系統100中,通話錄音服務器410能夠利用流式傳輸,向語音辨識服務器430提供通過IP電話網傳輸的通話的語音數據。而且,語音辨識服務器430能夠利用流式傳輸,向監(jiān)視裝置440提供對于語音數據的語音辨識結果。
[0082]S卩,通信系統100能夠在通話開始時序之后,立即開始提示語音辨識處理及語音辨識結果,因此,能夠在通話過程中基本實時地提示語音辨識結果。
[0083]<通話錄音服務器的動作>
[0084]其次,說明通話錄音服務器的動作。
[0085]圖3是表示通話錄音服務器410的動作的一例的流程圖。
[0086]首先,在步驟SllOO中,電話網通信單元411判斷是否從外部網200接收到了IP信息包。電話網通信單元411在接收到了 IP信息包的情況下(31100:是),使處理向步驟31200前進。另外,電話網通信單元411在尚未接收到IP信息包的情況下(S1100:否),使處理向后述的步驟S1500前進。
[0087]在步驟S1200中,語音記錄控制單元414從IP信息包中提取語音數據,將語音數據與控制信息等確定語音數據的信息相對應地記錄至存儲器413。另外,通話開始獲取單元415從IP信息包中提取控制信息。
[0088]接著,在步驟S1300中,通話開始獲取單元415基于控制信息,判斷是否為通話開始時序。通話開始獲取單元415在是通話開始時序的情況下(S1300:是),使處理向步驟S1400前進。另外,通話開始獲取單元415在并非通話開始時序的情況下(S1300:否),使處理向后述的步驟S1500前進。
[0089]在步驟S1400中,語音辨識控制單元416經由管理網通信單元412向管理服務器420發(fā)送通話開始通知。
[0090]接著,在步驟S1500中,語音辨識控制單元416判斷是否經由管理網通信單元412接收到了語音發(fā)送請求。語音辨識控制單元416在接收到了語音發(fā)送請求的情況下(S1500:是),使處理向步驟S1600前進。另外,語音辨識控制單元416在尚未接收到語音發(fā)送請求的情況下(S1500:否),使處理向后述的步驟S1700前進。
[0091]在步驟S1600中,語音辨識控制單元416開始向語音發(fā)送請求的發(fā)送方(請求方)轉發(fā)語音數據。
[0092]接著,在步驟S1700中,語音辨識控制單元416判斷是否通過管理者的操作等指示了結束對通話數據進行監(jiān)視的處理。語音辨識控制單元416在尚未指示結束處理的情況下(S1700:否),使處理返回步驟S1100。另外,語音辨識控制單元416在指示了結束處理的情況下(S1700:是),結束一系列的處理。
[0093]通過如上所述的動作,通話錄音服務器410能夠獲取通過IP電話網傳輸的通話的通話開始時序,并在通話開始時序之后,立即開始對通過IP電話網傳輸的通話的語音數據進行語音辨識處理。
[0094]<整個系統的動作>
[0095]其次,說明整個通信系統100的動作流程的一例。
[0096]圖4是表示通信系統100的動作流程的一例的序列圖。
[0097]首先,監(jiān)視裝置440向管理服務器420發(fā)送作為語音辨識處理對象的語音數據的條件,并預先設定該條件(S2010)。該條件例如是指在說話人識別信息、通話時段、通話中包含規(guī)定的單詞。即,監(jiān)視裝置440預先將語音辨識處理對象注冊在管理服務器420中。接著,在通話開始后,網絡設備320開始向通話錄音服務器410發(fā)送IP信息包(S2020)。
[0098]通信錄音服務器410開始進行從發(fā)送來的各個IP信息包中提取語音數據及控制信息的處理與語音數據的記錄(S2030),并且向管理服務器420發(fā)送通話開始通知(S2040)。在該時序,通話錄音服務器410中至少存儲有通話的最初部分的語音數據。
[0099]管理服務器420基于通話開始通知中所含的控制信息與S2010所設定的條件,判斷是否對語音數據進行語音辨識(S2050)。管理服務器420在判斷為進行語音辨識的情況下,向語音辨識服務器430發(fā)送辨識開始請求(S2060),并且向監(jiān)視裝置440發(fā)送通話開始通知(S2070)。語音辨識服務器430接受辨識開始請求,并向通話錄音服務器410發(fā)送語音發(fā)送請求(S2080)。
[0100]如上所述,通話錄音服務器410中至少存儲有通話的最初部分的語音數據。因此,通話錄音服務器410接受語音發(fā)送請求,并向語音辨識服務器430回復所存儲的語音數據(S2090)。此外,為了獲得高精度的語音辨識結果,優(yōu)選向語音辨識服務器430發(fā)送的語音數據維持從IP信息包中提取到的語音數據的質量。
[0101]這樣,語音辨識服務器430開始對通話錄音服務器410所存儲的語音數據進行語音辨識處理(S2100)。在該時序,語音辨識服務器430中至少存儲有通話的最初部分的語音辨識結果。另外,語音辨識服務器430向管理服務器420發(fā)送辨識開始通知(S2110)。
[0102]通過進行上述辨識開始通知,即使像網頁瀏覽器這樣通過拖拽動作獲取顯示對象的監(jiān)視裝置440也能實時地獲取并顯示語音數據及語音辨識結果。
[0103]管理服務器420向監(jiān)視裝置440轉發(fā)從語音辨識服務器430接收到的辨識開始通知(S2120)。此外,優(yōu)選在該辨識開始通知或步驟S2070所發(fā)送的通話開始通知中,包含語音辨識服務器430的識別信息作為表示語音辨識結果的獲取源的信息。監(jiān)視裝置440接受辨識開始通知,并向語音辨識服務器430發(fā)送辨識結果發(fā)送請求(S2130)。
[0104]如上所述,語音辨識服務器430中至少存儲有通話的最初部分的語音辨識結果。因此,語音辨識服務器430接受辨識結果發(fā)送請求,并向監(jiān)視裝置440發(fā)送所存儲的語音辨識結果(S2140)。
[0105]監(jiān)視裝置440還向通話錄音服務器410發(fā)送語音發(fā)送請求(S2150),并從通話錄音服務器410接收語音數據(S2160)。此外,優(yōu)選通話錄音服務器410在語音辨識控制單元416中,將向監(jiān)視裝置440發(fā)送的語音數據轉換成網頁瀏覽器所能輸出的形式的語音數據。接著,監(jiān)視裝置440對應地顯示接收到的語音數據及語音辨識結果(S2170)。
[0106]例如在多個作為監(jiān)視對象的通話同時進行的情況下,監(jiān)視裝置440能夠基于各語音數據的控制信息中所含的通話識別信息或說話人識別信息,對每次通話獲取與上述多個通話相關的語音辨識結果。在此情況下,優(yōu)選監(jiān)視裝置440將與上述多個通話相關的語音辨識結果同時顯示在一個網頁瀏覽器畫面中。
[0107]通過如上所述的動作,通信系統100能夠將語音辨識對象縮小到必需的的范圍內,并且能夠在通話開始時序之后,立即提示語音辨識處理及語音辨識結果。另外,通信系統100能夠在網頁瀏覽器中實時地顯示通話的語音數據及語音辨識結果。
[0108]此外,對于通信系統100所發(fā)送的各種請求,既可通過一次請求來請求對整個通話的數據進行處理,也可將信息包、幀或匯總的語音辨識結果等作為單位,對每次通話的一部分的數據請求進行處理。在后者的情況下,例如能夠將幀編號或語音辨識結果的事件編號等用作指定處理對象的識別信息。
[0109]<本實施方式的效果>
[0110]如上所述,根據本實施方式的包含通話數據管理系統的通信系統100,在通話開始時序之后,立即開始對通過形成IP電話網的內部網300傳輸的通話的語音數據進行語音辨識處理。由此,通信系統100能夠在通話過程中基本實時地提示對IP電話網的通話的語音數據的語音辨識結果。
[0111]如上所述,在IP電話的個數龐大的情況下,以下的作業(yè)會變得非常繁雜,該作業(yè)是指在各通話結束后,找到需要確認的通話,檢索通話的語音數據,對所存儲的語音辨識結果或語音數據進行確認。
[0112]在上述方面,本實施方式的通信系統100實時地對管理者提示各通話的內容,因此,能避免如上所述的繁雜的作業(yè),并且能高效地監(jiān)視各通話。因此,根據本實施方式的通信系統100,能夠更簡單地實時監(jiān)視多個IP電話的通話內容。
[0113]另外,在進行管理者對話務員提出建議等的動作的情況下,若像現有技術那樣,在通話結束后確定通話內容,則會導致上述動作比適當的時序晚。在此方面,本實施方式的通信系統100能夠實時地監(jiān)視各IP電話的通話內容,因此,能以準確的時序進行對應于通話內容的動作。
[0114]另外,本實施方式的通信系統100是由管理服務器420基于控制信息,對每次通話對通話錄音服務器410、語音辨識服務器430及監(jiān)視裝置440各自的動作時序進行控制。由此,即使通話錄音服務器410、語音辨識服務器430及監(jiān)視裝置440為獨立的裝置,本實施方式的通信系統100也能夠通過最小限度地改變這些裝置,使這些裝置聯合地進行動作,取得上述效果。
[0115]另外,在本實施方式的通信系統100中,監(jiān)視裝置440從語音辨識服務器430獲取語音辨識服務器430所存儲的語音辨識結果,并提示該語音辨識結果。因此,即使在存在多個監(jiān)視裝置440的情況下,本實施方式的通信系統100也能夠利用各監(jiān)視裝置440獨立地提示語音辨識結果。
[0116]另外,本實施方式的通信系統100能夠動態(tài)地選擇作為語音辨識對象的語音數據(通話、IP電話或說話人等),因此,能更高效地監(jiān)視多個IP電話的通話內容。
[0117]另外,本實施方式的通信系統100從IP電話網獲取通話的語音數據,因此,能夠高質量且高效地獲取各通話的語音數據。例如,與在各IP電話中設置用于獲取語音數據的設備的情況相比,本實施方式的通信系統100能夠減少必需的設備成本及設備空間。另外,本實施方式的通信系統100能夠獲取完全分離地對呼出語音與接聽語音進行錄音所得的高質量的語音數據,因此,能夠獲得精度高的文本數據作為語音辨識結果,從而能夠實現更高的可靠性。
[0118]此外,通過IP電話網傳輸的通話的語音數據的獲取方式并不限定于上述例子。例如,通話錄音服務器410在設置在各通話的語音數據的傳輸路徑上的情況下,也可以在轉發(fā)語音數據時獲取該語音數據的副本。
[0119]另外,管理服務器420、語音辨識服務器430及監(jiān)視裝置440三者的功能的一部分或全部也可以設置在通話錄音服務器410中。
[0120]例如,通話錄音服務器410還可以包括處理對象決定單元,該處理對象決定單元基于所獲取的控制信息,決定是否對所記錄的語音數據進行語音辨識處理。在此情況下,能夠由通話錄音服務器410縮小語音辨識對象的范圍,從而能夠減少通話開始通知的發(fā)送次數。
[0121]另外,本發(fā)明的應用并非限定于呼叫中心。本發(fā)明能應用于政府機關或企業(yè)的接待及營業(yè)等的各種窗口電話總機、或公司內部電話網等可進行多個通話的各種IP電話網。
[0122]本發(fā)明的通話錄音服務器包括:語音記錄控制單元,依次獲取通過IP電話網傳輸的通話的語音數據,并將上述語音數據記錄至存儲器;通話開始獲取單元,基于所獲取的上述語音數據附帶的控制信息,獲取開始上述通話的通話開始時序;以及語音辨識控制單元,在所獲取的上述通話開始時序之后,立即開始對所記錄的上述語音數據進行語音辨識處理。
[0123]此外,上述通話錄音服務器也可以包括處理對象決定單元,基于所獲取的上述控制信息,決定是否對所記錄的上述語音數據進行上述語音辨識處理。
[0124]另外,上述通話錄音服務器也可以包括電話網通信單元,從上述IP電話網接收信息包,上述信息包存儲有上述語音數據且被賦予了包含上述通話的識別信息的上述控制信息,上述通話開始獲取單元基于上述控制信息,確定上述電話網通信單元最初接收到上述通話的上述信息包時的時序,并獲取所確定的上述時序作為上述通話開始時序。
[0125]另外,在上述通話錄音服務器中,上述語音辨識控制單元也可以基于上述控制信息,對每次上述通話,與所記錄的上述語音數據相對應地管理作為上述語音辨識處理的結果的文本數據。
[0126]本發(fā)明的通話數據管理系統也可以包括:通話錄音服務器,記錄通過IP電話網傳輸的通話的語音數據;語音辨識服務器,對所記錄的上述語音數據進行語音辨識處理,并生成作為上述語音辨識處理的結果的文本數據;以及監(jiān)視裝置,對應地提示所記錄的上述語音數據與所生成的上述文本數據,其中,上述通話錄音服務器包括:語音記錄控制單元,從IP電話網依次獲取上述語音數據,并將上述語音數據記錄至存儲器;通話開始獲取單元,基于所獲取的上述語音數據附帶的控制信息,獲取開始上述通話的通話開始時序;以及語音辨識控制單元,向上述語音辨識服務器輸出所記錄的上述語音數據,使上述語音辨識服務器在所獲取的上述通話開始時序之后,立即開始對上述語音數據進行語音辨識處理。
[0127]此外,在上述通話數據管理系統中也可以,上述語音辨識控制單元根據來自上述監(jiān)視裝置的請求,向上述監(jiān)視裝置輸出所記錄的上述語音數據,上述語音辨識服務器根據來自上述監(jiān)視裝置的請求,向上述監(jiān)視裝置輸出所生成的上述文本數據,上述通話數據管理系統包括管理服務器,從上述通話錄音服務器獲取上述通話開始時序,并基于所獲取的上述通話開始時序,對上述通話錄音服務器、上述語音辨識服務器及上述監(jiān)視裝置各自的動作時序進行控制。
[0128]另外,在上述通話數據管理系統中,上述通話錄音服務器也可以包括電話網通信單元,從上述IP電話網接收信息包,上述信息包存儲有上述語音數據且被賦予了包含上述通話的識別信息的上述控制信息,上述管理服務器基于上述控制信息,對每次上述通話控制上述通話錄音服務器、上述語音辨識服務器及上述監(jiān)視裝置各自的動作時序。
[0129]另外,在上述通話數據管理系統中,上述管理服務器也可以基于上述控制信息,決定是否對上述通話錄音服務器所記錄的通話的上述語音數據進行上述語音辨識處理。
[0130]本發(fā)明的通話數據管理方法也可以包括以下步驟:依次獲取通過IP電話網傳輸的通話的語音數據,并將上述語音數據記錄至存儲器的步驟;基于所獲取的上述語音數據附帶的控制信息,獲取開始上述通話的通話開始時序的步驟;以及在所獲取的上述通話開始時序之后,立即開始對所記錄的上述語音數據進行語音辨識處理的步驟。
[0131]在2014年3月17日申請的特愿第2014-053355號的日本專利申請所包含的說明書、附圖和說明書摘要的公開內容全部引用于本申請。
[0132]工業(yè)實用性
[0133]本發(fā)明作為能更簡單地監(jiān)視多個IP電話的通話內容的通話錄音服務器、通話數據管理系統及通話數據管理方法是有用的。
【主權項】
1.一種通話錄音服務器,包括: 語音記錄控制單元,依次獲取通過互聯網協議電話網傳輸的通話的語音數據,并將所述語音數據記錄至存儲器; 通話開始獲取單元,基于所獲取的所述語音數據中附帶的控制信息,獲取開始所述通話的通話開始時序;以及 語音辨識控制單元,在所獲取的所述通話開始時序之后,立即開始對所記錄的所述語音數據進行語音辨識處理。2.如權利要求1所述的通話錄音服務器,其中, 包括處理對象決定單元,其基于所獲取的所述控制信息,決定是否對所記錄的所述語音數據進行所述語音辨識處理。3.如權利要求1所述的通話錄音服務器,其中, 包括電話網通信單元,其從所述互聯網協議電話網接收信息包,所述信息包存儲有所述語音數據且被賦予了包含有所述通話的識別信息的所述控制信息, 所述通話開始獲取單元基于所述控制信息,確定所述電話網通信單元最初接收到所述通話的所述信息包的時序,并獲取所確定的所述時序,以作為所述通話開始時序。4.如權利要求1所述的通話錄音服務器,其中, 所述語音辨識控制單元基于所述控制信息,對每次所述通話,與所記錄的所述語音數據相對應地管理作為所述語音辨識處理的結果的文本數據。5.一種通話數據管理系統,包括: 通話錄音服務器,記錄通過互聯網協議電話網傳輸的通話的語音數據; 語音辨識服務器,對所記錄的所述語音數據進行語音辨識處理,并生成作為所述語音辨識處理的結果的文本數據;以及 監(jiān)視裝置,對應地提示所記錄的所述語音數據與所生成的所述文本數據, 其中,所述通話錄音服務器包括: 語音記錄控制單元,從互聯網協議電話網依次獲取所述語音數據,并將所述語音數據記錄至存儲器; 通話開始獲取單元,基于所獲取的所述語音數據中附帶的控制信息,獲取開始所述通話的通話開始時序;以及 語音辨識控制單元,向所述語音辨識服務器輸出所記錄的所述語音數據,使所述語音辨識服務器在所獲取的所述通話開始時序之后,立即開始對所述語音數據進行語音辨識處理。6.如權利要求5所述的通話數據管理系統,其中, 所述語音辨識控制單元根據來自所述監(jiān)視裝置的請求,向所述監(jiān)視裝置輸出所記錄的所述語音數據, 所述語音辨識服務器根據來自所述監(jiān)視裝置的請求,向所述監(jiān)視裝置輸出所生成的所述文本數據, 所述通話數據管理系統包括管理服務器,其從所述通話錄音服務器獲取所述通話開始時序,并基于所獲取的所述通話開始時序,對所述通話錄音服務器、所述語音辨識服務器及所述監(jiān)視裝置各自的動作時序進行控制。7.如權利要求6所述的通話數據管理系統,其中, 所述通話錄音服務器包括電話網通信單元,其從所述互聯網協議電話網接收信息包,所述信息包存儲有所述語音數據且被賦予了包含有所述通話的識別信息的所述控制信息, 所述管理服務器基于所述控制信息,對每次所述通話控制所述通話錄音服務器、所述語音辨識服務器及所述監(jiān)視裝置各自的動作時序。8.如權利要求6所述的通話數據管理系統,其中, 所述管理服務器基于所述控制信息,決定是否對所述通話錄音服務器所記錄的通話的所述語音數據進行所述語音辨識處理。9.一種通話數據管理方法,包括以下步驟: 依次獲取通過互聯網協議電話網傳輸的通話的語音數據,并將所述語音數據記錄至存儲器的步驟; 基于所獲取的所述語音數據中附帶的控制信息,獲取開始所述通話的通話開始時序的步驟;以及 在所獲取的所述通話開始時序之后,立即開始對所記錄的所述語音數據進行語音辨識處理的步驟。
【文檔編號】H04M3/53GK106068641SQ201580012625
【公開日】2016年11月2日
【申請日】2015年3月11日 公開號201580012625.2, CN 106068641 A, CN 106068641A, CN 201580012625, CN-A-106068641, CN106068641 A, CN106068641A, CN201580012625, CN201580012625.2, PCT/2015/1338, PCT/JP/15/001338, PCT/JP/15/01338, PCT/JP/2015/001338, PCT/JP/2015/01338, PCT/JP15/001338, PCT/JP15/01338, PCT/JP15001338, PCT/JP1501338, PCT/JP2015/001338, PCT/JP2015/01338, PCT/JP2015001338, PCT/JP201501338
【發(fā)明人】新井政悟, 堤滿, 森肋健
【申請人】日商先進媒體公司