亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語音識(shí)別設(shè)備、語音識(shí)別方法、以及用于識(shí)別語音的程序的制作方法

文檔序號(hào):2830426閱讀:349來源:國知局
專利名稱:語音識(shí)別設(shè)備、語音識(shí)別方法、以及用于識(shí)別語音的程序的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及語音識(shí)別設(shè)備、語音識(shí)別方法、以及用于識(shí)別語音的程序, 更具體地,涉及用于執(zhí)行適合關(guān)于電話呼叫語音的內(nèi)容的語音識(shí)別過程、 語音識(shí)別方法、以及用于識(shí)別語音的程序。
背景技術(shù)
近年來,使用在電話的自動(dòng)應(yīng)答和呼叫日志中的語音識(shí)別技術(shù)已廣泛 應(yīng)用在呼叫中心等處。 一般地,語音識(shí)別技術(shù)是基于電話的語音提取預(yù)先 登記的詞,以及自動(dòng)地將該詞轉(zhuǎn)換為字符信息的技術(shù)。在該技術(shù)中,準(zhǔn)備 表示具有頻率等的每個(gè)語音的最小識(shí)別單元的聲音模型、將語音組合定義 為詞的識(shí)別字典、以及示出詞和表達(dá)之間連接關(guān)系的語言模型,以及參照 其執(zhí)行語音識(shí)別。
在語音識(shí)別技術(shù)中,預(yù)先準(zhǔn)備與要識(shí)別的語音信號(hào)的特征、類型和環(huán) 境相對(duì)應(yīng)的聲音模型、識(shí)別字典以及語言模型可以有效地降低錯(cuò)誤識(shí)別并 且提高識(shí)別準(zhǔn)確度。作為使用這種語音識(shí)別技術(shù)的示例,專利文件l公開 了呼叫內(nèi)容詳寫系統(tǒng),其中針對(duì)電話的傳輸側(cè)信道和接收側(cè)信道獨(dú)立地準(zhǔn) 備在語音識(shí)別中要使用的基本數(shù)據(jù),從而執(zhí)行適合相應(yīng)信道的語音識(shí)別; 專利文件2公開了用于根據(jù)電話的呼叫方號(hào)碼選擇在語音識(shí)別中使用的語 音字典的通信設(shè)備。
專利文件h日本待審專利公開號(hào)No.2005-123869
專利文件2:日本待審專利公開號(hào)No.2005-12503
發(fā)明內(nèi)容
然而,在專利文件1中公開的系統(tǒng)只在傳輸側(cè)和接收側(cè)單獨(dú)地執(zhí)行語 音識(shí)別,以及對(duì)于接收側(cè)的語音(來自呼叫方未指定號(hào)碼的語音),不執(zhí) 行適合其特征的語音識(shí)別。即使將專利文件1的這種系統(tǒng)應(yīng)用在呼叫中心
等的自動(dòng)應(yīng)答或呼叫日志,也不能期望提高語音識(shí)別的準(zhǔn)確度,因?yàn)椴粓?zhí) 行與用戶語音相對(duì)應(yīng)的語音識(shí)別。
在專利文件2中描述的通信設(shè)備中,需要預(yù)先準(zhǔn)備根據(jù)電話的呼叫方 號(hào)碼的用于預(yù)測呼叫內(nèi)容的信息,此外,存在如下缺點(diǎn)如果被呼叫方設(shè) 置阻止呼叫方號(hào)碼,則不能執(zhí)行語音識(shí)別。
本發(fā)明旨在提供呼叫中心等工作中使用的語音識(shí)別設(shè)備、語音識(shí)別方 法以及程序,用于在改進(jìn)現(xiàn)有技術(shù)缺陷的基礎(chǔ)上識(shí)別語音,其中以高精確 度執(zhí)行語音識(shí)別,而不需要呼叫的呼叫方信息。
為了實(shí)現(xiàn)上述目標(biāo),本發(fā)明的語音識(shí)別設(shè)備包括呼叫接收單元,用 于接收向多個(gè)用于接收的電話號(hào)碼做出的呼叫;呼叫語音信號(hào)輸入裝置,
用于輸入所接收呼叫的呼叫語音信號(hào);接收電話號(hào)碼輸入裝置,用于輸入
與輸入呼叫語音信號(hào)相關(guān)的、用于接收的電話號(hào)碼,作為呼叫的接收電話
號(hào)碼;語音識(shí)別信息存儲(chǔ)裝置,用于存儲(chǔ)用于語音識(shí)別的語音識(shí)別信息, 其中,將語音識(shí)別為與用于接收的電話號(hào)碼相對(duì)應(yīng)的語言信息;語音識(shí)別 信息選擇裝置,用于從所存儲(chǔ)的語音識(shí)別信息中選擇與接收電話號(hào)碼相對(duì) 應(yīng)的語音識(shí)別信息;以及語音識(shí)別裝置,用于使用所選擇的語音識(shí)別信息, 將輸入至呼叫語音信號(hào)輸入裝置的呼叫語音信號(hào)識(shí)別為語言信息,以及指 定語音內(nèi)容。
根據(jù)這種語音識(shí)別設(shè)備,根據(jù)要接收的呼叫內(nèi)容(例如針對(duì)要處理的 相應(yīng)內(nèi)容或針對(duì)相應(yīng)的呼叫區(qū)域)提供多個(gè)用于接收的電話號(hào)碼,以及針 對(duì)所接收呼叫的語音信號(hào),執(zhí)行與呼叫的接收電話號(hào)碼(即,對(duì)其做出呼 叫的用于接收的電話號(hào)碼)相對(duì)應(yīng)的語音識(shí)別,從而可以執(zhí)行與呼叫內(nèi)容 相對(duì)應(yīng)的高精度語音識(shí)別,以及可以精確地指定語音內(nèi)容。
語音識(shí)別信息可以是以下至少一個(gè)示出語音和詞匯的對(duì)應(yīng)關(guān)系的識(shí) 別字典、以語音的最小識(shí)別單位來代表聲音特征的聲音模型、代表詞的連 接關(guān)系的語言模型、以及指示語音識(shí)別過程的信息或識(shí)別參數(shù)。在這種情 況下,通過使呼叫語音信號(hào)和識(shí)別字典、聲音模型、以及其語言模型相互 關(guān)聯(lián),執(zhí)行語音識(shí)別。
此外,本發(fā)明的語音識(shí)別設(shè)備包括呼叫接收單元,用于接收向多個(gè)用 于接收的電話號(hào)碼做出的呼叫;呼叫語音信號(hào)輸入裝置,用于輸入所接收 呼叫的呼叫語音信號(hào);接收電話號(hào)碼輸入裝置,用于輸入與輸入呼叫語音 信號(hào)相關(guān)的、用于接收的電話號(hào)碼,作為呼叫的接收電話號(hào)碼;修正內(nèi)容 信息存儲(chǔ)裝置,用于存儲(chǔ)指示與用于接收的電話號(hào)碼相對(duì)應(yīng)的語音信號(hào)修
正的內(nèi)容的修正內(nèi)容信息;修正內(nèi)容信息選擇裝置,用于選擇與呼叫的接 收電話號(hào)碼相對(duì)應(yīng)的修正內(nèi)容信息;語音修正裝置,用于執(zhí)行通過所選擇 的、與輸入至所述呼叫語音信號(hào)輸入裝置的呼叫語音信號(hào)有關(guān)的修正內(nèi)容 信息所指示的語音修正過程;以及語音識(shí)別裝置,用于將語音修正裝置修 正的呼叫語音信號(hào)識(shí)別為語言信息,以及指定語音內(nèi)容。
相應(yīng)地,可以針對(duì)呼叫語音信號(hào)執(zhí)行與呼叫的內(nèi)容相對(duì)應(yīng)的語音修正 過程。語音修正過程的示例包括噪聲去除過程以及信號(hào)失真修正過程、壓 縮后的語音修正過程等,其中通過這種語音修正過程將與語音識(shí)別不相關(guān) 的聲音從呼叫語音信號(hào)中去除。因而,呼叫語音信號(hào)與發(fā)話人的聲音語音 信號(hào)(即原始語音信號(hào))更加接近,可以正確地執(zhí)行語音識(shí)別,以及增強(qiáng) 語音識(shí)別的精確度。
根據(jù)本發(fā)明的語音識(shí)別方法包括接收向多個(gè)用于接收的電話號(hào)碼做
出呼叫的呼叫接收步驟;輸入所接收呼叫的呼叫語音信號(hào)的呼叫語音信號(hào)
輸入步驟;輸入與輸入呼叫語音信號(hào)相關(guān)的、用于接收的電話號(hào)碼,作為 呼叫的接收電話號(hào)碼的接收電話號(hào)碼輸入步驟;根據(jù)呼叫的接收電話號(hào) 碼,選擇用于其中將語音識(shí)別為語言信息的語音識(shí)別的識(shí)別信息選擇步 驟;以及通過使用所選擇的語音識(shí)別過程信息,將在呼叫語音信號(hào)輸入步 驟中輸入的呼叫語音信號(hào)識(shí)別為語言信息,以及指定語音內(nèi)容的語音識(shí)別 步驟。
根據(jù)這種語音識(shí)別方法,根據(jù)要接收的呼叫內(nèi)容(例如針對(duì)要處理的 相應(yīng)內(nèi)容或針對(duì)相應(yīng)的呼叫區(qū)域)提供多個(gè)接收的電話號(hào)碼,以及在所接 收呼叫的語音信號(hào)上執(zhí)行與呼叫的接收電話號(hào)碼(即,對(duì)其做出呼叫的用 于接收的電話號(hào)碼)相對(duì)應(yīng)的語音識(shí)別,從而可以執(zhí)行與呼叫內(nèi)容相對(duì)應(yīng) 的高精度語音識(shí)別,以及可以精確地指定語音內(nèi)容。
在上述語音識(shí)別方法中,語音識(shí)別信息可以是以下至少一個(gè)示出語
音和詞匯對(duì)應(yīng)關(guān)系的識(shí)別字典、以語音的最小識(shí)別單位來代表聲音特征的 聲音模型、代表詞的連接關(guān)系的語言模型、以及指示語音識(shí)別過程的信息
或識(shí)別參數(shù)。
此外,本發(fā)明的語音識(shí)別方法包括接收向多個(gè)用于接收的電話號(hào)碼 做出呼叫的呼叫接收步驟;輸入所接收呼叫的呼叫語音信號(hào)的呼叫語音信
號(hào)輸入步驟;輸入與輸入呼叫語音信號(hào)相關(guān)的、用于接收的電話號(hào)碼作為 呼叫的接收電話號(hào)碼的接收電話號(hào)碼輸入步驟;根據(jù)呼叫的接收電話號(hào)
碼,從預(yù)先存儲(chǔ)的與用于接收的電話號(hào)碼相對(duì)應(yīng)的修正內(nèi)容信息中選擇指
示語音信號(hào)修正內(nèi)容的修正內(nèi)容信息的修正內(nèi)容信息選擇步驟;與在呼叫 語音信號(hào)輸入步驟中輸入的呼叫語音信號(hào)有關(guān)的執(zhí)行所選擇的修正內(nèi)容 信息指示的語音修正過程的語音修正步驟;以及將在語音修正步驟中修正 的語音信號(hào)識(shí)別為語言信息、并指定語音內(nèi)容的語音識(shí)別步驟。
相應(yīng)地,可以在呼叫語音信號(hào)上執(zhí)行與呼叫的內(nèi)容相對(duì)應(yīng)的語音修正 過程。語音修正過程的示例包括噪聲去除過程以及信號(hào)失真修正過程、壓 縮后的語音修正過程等,其中通過這種語音修正過程將與語音識(shí)別不相關(guān) 的聲音從呼叫語音信號(hào)中去除。因而,呼叫語音信號(hào)與發(fā)話人的聲音語音 信號(hào)(即原始語音信號(hào))更加接近,可以正確地執(zhí)行語音識(shí)別,以及增強(qiáng) 語音識(shí)別的精確度。
本發(fā)明的識(shí)別語音程序使計(jì)算機(jī)執(zhí)行接收向多個(gè)用于接收的電話號(hào) 碼做出呼叫的呼叫接收過程;輸入所接收呼叫的呼叫語音信號(hào)的呼叫語音 信號(hào)輸入過程;將輸入與輸入呼叫語音信號(hào)相關(guān)的、用于接收的電話號(hào)碼 作為呼叫的接收電話號(hào)碼的接收電話號(hào)碼輸入過程;根據(jù)呼叫的接收電話
號(hào)碼,選擇用于將語音識(shí)別為語言信息的語音識(shí)別信息的識(shí)別信息選擇步 驟;以及通過利用所選擇的語音識(shí)別信息,將在呼叫語音信號(hào)輸入過程中 輸入的呼叫語音信號(hào)識(shí)別為語言信息,以及指定語音內(nèi)容的語音識(shí)別過程。
根據(jù)識(shí)別語音的這種程序,提供與呼叫內(nèi)容相對(duì)應(yīng)的多個(gè)用于接收的 電話號(hào)碼,以及通過使用與呼叫的接收電話號(hào)碼(即,對(duì)其做出呼叫的用 于接收的電話號(hào)碼)相對(duì)應(yīng)的語音識(shí)別信息,識(shí)別相關(guān)呼叫的語音信號(hào), 從而可以執(zhí)行與呼叫內(nèi)容相對(duì)應(yīng)的高精度語音識(shí)別,以及可以精確地指定 語音內(nèi)容。
語音識(shí)別信息可以是以下至少一個(gè)示出語音和詞匯對(duì)應(yīng)的識(shí)別字 典、以語音的最小識(shí)別單位來代表聲音特征的聲音模型、代表詞的連接關(guān) 系的語言模型、以及指示語音識(shí)別過程的信息或識(shí)別參數(shù)。
此外,本發(fā)明的用于識(shí)別語音的程序使計(jì)算機(jī)執(zhí)行接收向多個(gè)用于接
收的電話號(hào)碼做出呼叫的呼叫接收過程;輸入所接收呼叫的呼叫語音信號(hào) 的呼叫語音信號(hào)輸入過程;輸入與輸入呼叫語音信號(hào)相關(guān)的、用于接收的 電話號(hào)碼作為呼叫的接收電話號(hào)碼的接收電話號(hào)碼輸入過程;根據(jù)呼叫的 接收電話號(hào)碼,從針對(duì)用于接收的相應(yīng)電話號(hào)碼預(yù)先定義的修正內(nèi)容信息 中選擇指示語音信號(hào)修正內(nèi)容的修正內(nèi)容信息的語音修正選擇過程;根據(jù) 所選擇的修正內(nèi)容信息,修正在呼叫語音輸入過程中輸入的呼叫語音信號(hào) 的語音修正過程;以及將在語音修正過程中修正的語音信號(hào)識(shí)別為語言信 息,以及指定語音內(nèi)容的語音識(shí)別過程。
相應(yīng)地,可以針對(duì)呼叫語音信號(hào)執(zhí)行與呼叫的內(nèi)容相對(duì)應(yīng)的語音修正 過程。語音修正過程的示例包括噪聲去除過程以及信號(hào)失真修正過程、壓 縮后的語音修正過程等,其中通過這種語音修正過程將與語音識(shí)別不相關(guān) 的聲音從呼叫語音信號(hào)中去除。因而,呼叫語音信號(hào)與發(fā)話人的聲音語音 信號(hào)(即原始語音信號(hào))更加接近,可以正確地執(zhí)行語音識(shí)別,以及增強(qiáng) 語音識(shí)別的精確度。
本發(fā)明如上配置并運(yùn)行,由此可以針對(duì)所接收呼叫的語音信號(hào)執(zhí)行與 呼叫內(nèi)容相對(duì)應(yīng)的語音識(shí)別過程,結(jié)果,可以高效地執(zhí)行具有很少錯(cuò)誤識(shí) 別以及高精度的語音識(shí)別。
具體實(shí)施例方式
將參照附圖描述本發(fā)明的一個(gè)示例性實(shí)施例。 圖1是示出示例性實(shí)施例配置的概述的功能框圖。 圖1中示出的語音識(shí)別設(shè)備1是用于識(shí)別來自外界的呼叫語音以及指 定語音內(nèi)容的裝置。語音識(shí)別設(shè)備1與公共通信網(wǎng)絡(luò)2相連,以及通過以
下裝置配置呼叫接收單元11、呼叫語音信號(hào)輸入裝置12、接收電話號(hào)
碼輸入裝置13、語音修正裝置14、用于預(yù)處理的模塊存儲(chǔ)單元15、語音 修正過程選擇裝置16、語音識(shí)別裝置17、識(shí)別字典、模型以及參數(shù)存儲(chǔ) 單元18、語音識(shí)別過程選擇裝置19、以及識(shí)別結(jié)果輸出裝置20。
呼叫接收單元11,其中多個(gè)用于接收的電話號(hào)碼分配用于接收向用于 接收的相應(yīng)電話號(hào)碼做出的呼叫。專用分支交換、VoIP (基于IP的語音 技術(shù))服務(wù)器等用于呼叫接收單元11。
在呼叫中心的一般工作中,根據(jù)要處理的工作和呼叫區(qū)域,分配不同 的電話號(hào)碼,以對(duì)用戶做出響應(yīng),從而達(dá)到提高應(yīng)答電話的效率的目的。 根據(jù)示例性實(shí)施例,針對(duì)其提供的多個(gè)用于接收的電話號(hào)碼,要響應(yīng)的內(nèi) 容針對(duì)相應(yīng)電話號(hào)碼而不同。
呼叫語音信號(hào)輸入裝置12輸入呼叫的呼叫語音信號(hào),在呼叫接收單 元ll處接收到的呼叫中,要針對(duì)所述呼叫的呼叫語音信號(hào)執(zhí)行語音識(shí)別。
接收電話號(hào)碼輸入裝置13將作為與呼叫語音信號(hào)輸入裝置12輸入的呼叫
語音信號(hào)相關(guān)的呼叫的目的地的用于接收的電話號(hào)碼輸入作為呼叫的接
收電話號(hào)碼。即,輸入呼叫語音信號(hào)輸入裝置12中的呼叫語音信號(hào)與接 收電話號(hào)碼輸入裝置13中的接收電話號(hào)碼輸入相對(duì)應(yīng)。
上述呼叫語音信號(hào)輸入裝置12和接收電話號(hào)碼輸入裝置13可以具有 編程以由計(jì)算機(jī)執(zhí)行的功能內(nèi)容。
語音修正裝置14針對(duì)由呼叫語音信號(hào)輸入裝置12輸入的呼叫語音信 號(hào)執(zhí)行諸如噪聲去除的語音修正處理,作為語音識(shí)別的預(yù)處理。由于發(fā)話 人周圍的噪聲、編碼過程中的失真、便攜電話語音壓縮所造成的語音降級(jí) 等,所以針對(duì)來自電話線路上的語音信號(hào),執(zhí)行語音識(shí)別比較困難。因而, 修正呼叫語音信號(hào)從而使能執(zhí)行正確的語音識(shí)別。
語音修正過程選擇裝置16從用作用于預(yù)處理的模塊存儲(chǔ)單元15中存 儲(chǔ)的修正內(nèi)容信息的預(yù)處理模塊中,選擇適合的預(yù)處理模塊來修正其相應(yīng) 的聲音質(zhì)量根據(jù)諸如便攜式電話、PHS終端等的電話類型和呼叫區(qū)域等的 不同而改變的呼叫語音。語音修正裝置14通過使用語音修正過程選擇裝 置16選擇的預(yù)處理模塊修正呼叫語音信號(hào)。
用于預(yù)處理的模塊存儲(chǔ)單元15用作修正內(nèi)容信息存儲(chǔ)裝置,用于存 儲(chǔ)針對(duì)根據(jù)應(yīng)用和目的的用于接收的相應(yīng)電話號(hào)碼而準(zhǔn)備的多個(gè)預(yù)處理 模塊。語音修正過程選擇裝置16用作修正內(nèi)容信息選擇裝置,用于根據(jù) 接收電話號(hào)碼輸入裝置13輸入的接收電話號(hào)碼選擇預(yù)處理模塊。該預(yù)處 理模塊用于傳統(tǒng)語音處理技術(shù)中,以及可以是用于噪聲去除過程的模塊、
用于語音信號(hào)失真修正的模塊、用于壓縮后的語音修正的模塊等。
作為修正呼叫語音信號(hào)的特定示例,存在用于接收的電話號(hào)碼是免費(fèi) 號(hào)碼的情況。利用該免費(fèi)號(hào)碼,可以指定允許呼入的被叫方電話的類型, 因而,通過提前準(zhǔn)備為相應(yīng)的電話類型(例如為陸地電話線路和便攜式電 話線路)而設(shè)置的預(yù)處理模塊,以及將相應(yīng)的預(yù)處理模塊與電話號(hào)碼相對(duì) 應(yīng),'從而用于便攜式電話線路的預(yù)處理模塊與來自便攜式電話的呼入呼叫 所被允許的電話號(hào)碼相對(duì)應(yīng),以及用于衛(wèi)星電話線路的預(yù)處理模塊與來自 衛(wèi)星電話的呼入呼叫所被允許的電話號(hào)碼相對(duì)應(yīng),可以針對(duì)接收呼叫的相 應(yīng)電話號(hào)碼選擇預(yù)處理模塊。
另一個(gè)示例是接收的電話號(hào)碼國外和國內(nèi)不同的情況。由于電話線路 的類型和信號(hào)編碼方法根據(jù)國家而不同,所以準(zhǔn)備為相應(yīng)國家設(shè)置的預(yù)處 理模塊以適應(yīng)這樣的情況,以及使每個(gè)預(yù)處理模塊與電話號(hào)碼相對(duì)應(yīng)。針 對(duì)以國外電話號(hào)碼接收的呼叫,選擇針對(duì)相對(duì)應(yīng)國家設(shè)置的預(yù)處理模塊, 以及針對(duì)以國內(nèi)電話號(hào)碼接收的呼叫,選擇針對(duì)國內(nèi)而設(shè)置的預(yù)處理模 塊。
因而,在示例性實(shí)施例中,由于接收電話的語音特性因?yàn)橄鄳?yīng)的接收 電話號(hào)碼而不同,所以選擇與特性相對(duì)應(yīng)的預(yù)處理模塊。此外,可以準(zhǔn)備 公共預(yù)處理模塊,以響應(yīng)以下情況呼叫的語音信號(hào)特性在與多個(gè)用于接 收的電話號(hào)碼相對(duì)應(yīng)的呼叫中不會(huì)彼此不同。此外,可以選擇多個(gè)預(yù)處理 模塊,以及在這種情況下,針對(duì)相應(yīng)的接收電話號(hào)碼也可提前定義處理順 序,從而語音修正裝置14以所定義的順序執(zhí)行該過程。如果預(yù)處理沒有 必要,則語音修正裝置14可以不執(zhí)行預(yù)處理。
如上所述,在示例性實(shí)施例中,從為用于接收的相應(yīng)電話號(hào)碼而準(zhǔn)備 的多個(gè)預(yù)處理模塊中選擇與呼叫的接收電話號(hào)碼相對(duì)應(yīng)的預(yù)處理模塊,以 及通過使用所選擇的預(yù)處理模塊修正呼叫語音信號(hào)。憑此,語音修正裝置 14針對(duì)呼叫語音信號(hào)執(zhí)行對(duì)針對(duì)相應(yīng)接收電話號(hào)碼定義的內(nèi)容的語音修 正處理。
用作修正內(nèi)容信息的預(yù)處理模塊可以具有其被編程的內(nèi)容,以及語音
修正裝置14和語音修正過程選擇裝置16可以具有編程由計(jì)算機(jī)執(zhí)行的功
能內(nèi)容。圖1中示出的語音識(shí)別裝置17針對(duì)呼叫語音信號(hào)執(zhí)行語音識(shí)別過程。
識(shí)別字典、模型、以及參數(shù)存儲(chǔ)裝置18用作語音識(shí)別信息存儲(chǔ)裝置,用
于根據(jù)目的和應(yīng)用存儲(chǔ)多個(gè)識(shí)別字典、聲音模型、語言模型、識(shí)別參數(shù)等 作為準(zhǔn)備用于接收的相應(yīng)電話號(hào)碼的語音識(shí)別信息。語音識(shí)別過程選擇裝
置19用作語音識(shí)別信息選擇裝置,用于根據(jù)接收電話號(hào)碼輸入裝置13輸 入的接收電話號(hào)碼,在語音識(shí)別裝置17中選擇在語音識(shí)別過程中使用的 識(shí)別字典、聲音模型、語言模型、識(shí)別參數(shù)等。
艮P,語音識(shí)別裝置17使用根據(jù)呼叫的接收電話號(hào)碼所選擇的識(shí)別字 典、聲音模型、語言模型、識(shí)別參數(shù)等,來執(zhí)行與聲音質(zhì)量相對(duì)應(yīng)的語音 識(shí)別,所述聲音質(zhì)量依據(jù)諸如便攜式電話和PHS終端的電話類型、呼叫區(qū) 域、取決于要處理的內(nèi)容和呼叫區(qū)域而不同的所使用的詞匯量等而有很大 不同。
示出語音和詞匯的對(duì)應(yīng)的識(shí)別字典、以語音的最小識(shí)別單位來代表聲 音特征的聲音模型、代表詞的連接關(guān)系的語言模型、以及指示語音識(shí)別過 程的信息或識(shí)別參數(shù)在傳統(tǒng)的語音識(shí)別技術(shù)中所使用。之后可以將識(shí)別字 典、聲音模型、語言模型、識(shí)別參數(shù)等統(tǒng)稱為語音識(shí)別資源。
針對(duì)呼叫語音信號(hào)執(zhí)行語音識(shí)別過程的特定示例包括以下情況要處 理的工作內(nèi)容、產(chǎn)品等針對(duì)用于接收的相應(yīng)電話號(hào)碼而不同。在這種情況 下,由于在呼叫中所使用的詞針對(duì)用于接收的相應(yīng)電話號(hào)碼是不同的,所 以針對(duì)與呼叫內(nèi)容相對(duì)應(yīng)的用于接收的相應(yīng)電話號(hào)碼準(zhǔn)備識(shí)別字典和語 言模型。例如,即使詞是相同的,依據(jù)工作要列入優(yōu)先的詞表達(dá)方式也會(huì) 不同,g卩,詞在一個(gè)工作中可以kana表示,但在另一個(gè)工作中可以kanji 表示,或者數(shù)字在一個(gè)工作中可以中文數(shù)字表示,但在另一個(gè)工作中可以 阿拉伯?dāng)?shù)字表示,因而,針對(duì)用于接收的相應(yīng)電話號(hào)碼,準(zhǔn)備具有要列入 優(yōu)先的不同詞表達(dá)方式的識(shí)別字典,以及從中選擇相應(yīng)的識(shí)別字典。
另一種示例是以下情況利用其指定了呼叫側(cè)的電話的類型和呼叫區(qū) 域的電話號(hào)碼(例如免費(fèi)號(hào)碼)是用于接收的電話號(hào)碼。在這種情況下, 針對(duì)用于接收的相應(yīng)電話號(hào)碼,選擇適合的語音識(shí)別資源,諸如與電話類 型相對(duì)應(yīng)的聲音模型、識(shí)別字典和與呼叫區(qū)域相對(duì)應(yīng)的語言模型等。
另一個(gè)示例是以下情況針對(duì)用于接收的相應(yīng)電話號(hào)碼,呼叫重要性
的等級(jí)是不相同的。對(duì)于用于接收進(jìn)行重要對(duì)話的呼叫的電話號(hào)碼,例如 通過在較大范圍內(nèi)執(zhí)行搜索過程,選擇用于提高認(rèn)證精確度的識(shí)別參數(shù), 或選擇所調(diào)整的識(shí)別字典和語言模型,從而不會(huì)將指定詞錯(cuò)誤地識(shí)別為不 同的詞并將其忽略。
因此,在示例性實(shí)施例中,由于接收呼叫的內(nèi)容針對(duì)用于接收的相應(yīng) 電話號(hào)碼而不同,所以選擇與其相對(duì)應(yīng)的語音識(shí)別資源。此外,當(dāng)多個(gè)用 于接收的電話號(hào)碼中的呼叫的聲音質(zhì)量和所用詞匯量不存在不同時(shí),可以 準(zhǔn)備公共語音識(shí)別資源。在圖2的表中示出分配給每個(gè)用于接收的電話號(hào) 碼的背景信息,以及如上描述的與其相對(duì)應(yīng)的要選擇的項(xiàng)目。
語音識(shí)別裝置17和語音識(shí)別過程選擇裝置19可以具有編程以由計(jì)算
機(jī)執(zhí)行的功能內(nèi)容。
圖1中示出的識(shí)別結(jié)果輸出裝置20以適合應(yīng)用和目的的格式輸出通 過語音識(shí)別設(shè)備17獲得的識(shí)別結(jié)果。在這種情況下,將時(shí)間信息等與識(shí) 別結(jié)果一起輸出,從而可以建立原始呼叫語音信號(hào)和識(shí)別結(jié)果之間的對(duì)應(yīng) 關(guān)系(如必要)。
接下來,將參照附圖在以下描述示例性實(shí)施例的處理操作。同時(shí)也將 說明和描述本發(fā)明的語音識(shí)別方法。
圖3是根據(jù)本發(fā)明示例性實(shí)施例的示出語音識(shí)別設(shè)備的處理操作的流 程圖。
首先,當(dāng)在呼叫接收單元11處接收到來自用戶的呼叫時(shí)(呼叫接收 步驟),通過呼叫語音信號(hào)輸入裝置12和接收電話號(hào)碼輸入裝置13輸入
所接收呼叫的呼叫語音信號(hào)以及利用其接收相關(guān)呼叫的呼叫的接收電話 號(hào)碼(圖3:步驟S1,呼叫語音信號(hào)輸入步驟、接收電話號(hào)碼輸入步驟)。 通過語音修正過程選擇裝置16確定分配給所輸入的接收電話號(hào)碼的 預(yù)處理模塊是否出現(xiàn)在用于預(yù)處理的模塊存儲(chǔ)單元15中(圖3:步驟S2, 修正內(nèi)容信息選擇步驟),以及如果與接收電話號(hào)碼相對(duì)應(yīng)的預(yù)處理模塊 出現(xiàn),則將相關(guān)預(yù)處理模塊應(yīng)用到呼叫語音信號(hào),以及執(zhí)行語音修正處理 (圖3:步驟S3,語音修正步驟)。如果與接收電話號(hào)碼相對(duì)應(yīng)的預(yù)處理
模塊沒有出現(xiàn),則不執(zhí)行針對(duì)呼叫語音信號(hào)的語音修正處理(圖3:步驟 S2中的否)。
之后,通過語音識(shí)別過程選擇裝置19從存儲(chǔ)在識(shí)別字典、模型、參 數(shù)存儲(chǔ)單元18的資源中,選擇分配給所輸入的接收電話號(hào)碼的語音識(shí)別
資源(圖3:步驟S4,識(shí)別信息選擇步驟),以及通過語音識(shí)別裝置17針
對(duì)呼叫語音信號(hào)執(zhí)行使用所選擇的語音識(shí)別資源的語音識(shí)別過程(圖3:
步驟S5,語音識(shí)別過程)。
識(shí)別結(jié)果輸出裝置20以適合目的的格式輸出在語音識(shí)別裝置17中獲 得的識(shí)別結(jié)果(圖3:步驟S6)。將時(shí)間信息等與識(shí)別結(jié)果一起輸出,從 而可以建立原始呼叫語音信號(hào)和識(shí)別結(jié)果之間的對(duì)應(yīng)關(guān)系(如必要)。
如上所述,可以將示例性實(shí)施例應(yīng)用于在呼叫中心執(zhí)行的自動(dòng)應(yīng)答、 呼叫排序以及呼叫日志創(chuàng)建等中使用的呼叫語音識(shí)別,其中,在要響應(yīng)的 一個(gè)位置修正向多個(gè)電話號(hào)碼(包括分機(jī)號(hào)碼)做出的呼叫。此外,由于 與要響應(yīng)的內(nèi)容或呼叫區(qū)域相對(duì)應(yīng)而準(zhǔn)備不同的電話號(hào)碼,所以當(dāng)呼叫方 給服務(wù)于該目的的電話號(hào)碼打電話時(shí),可以針對(duì)呼叫語音執(zhí)行與相關(guān)電話 號(hào)碼相對(duì)應(yīng)的語音識(shí)別過程。


圖1是示出了本發(fā)明的一個(gè)示例性實(shí)施例配置概述的功能框圖。 圖2是示出了根據(jù)圖1中示出的示例性實(shí)施例的針對(duì)用于接收的相應(yīng) 電話號(hào)碼要分配的背景信息、以及與其相對(duì)應(yīng)的要選擇/調(diào)整的項(xiàng)目的表。 圖3是示出了圖1中示出的示例性實(shí)施例的處理操作的流程圖。
符號(hào)描述
1 語音識(shí)別設(shè)備
2 公共通信網(wǎng)絡(luò) 11 呼叫接收單元ll
12呼叫語音信號(hào)輸入裝置 13接收電話號(hào)碼輸入裝置 14語音修正裝置 15用于預(yù)處理的模塊存儲(chǔ)單元 16語音修正過程選擇裝置17語音識(shí)別裝置
18識(shí)別字典、模型以及參數(shù)存儲(chǔ)單元 19語音識(shí)別過程選擇裝置 20識(shí)別結(jié)果輸出裝置
權(quán)利要求
1. 一種語音識(shí)別設(shè)備,包括呼叫接收單元,用于接收向多個(gè)用于接收的電話號(hào)碼做出的呼叫;呼叫語音信號(hào)輸入裝置,用于輸入所接收呼叫的呼叫語音信號(hào);接收電話號(hào)碼輸入裝置,用于輸入與輸入呼叫語音信號(hào)相關(guān)的、用于接收的電話號(hào)碼,作為呼叫的接收電話號(hào)碼;語音識(shí)別信息存儲(chǔ)裝置,用于存儲(chǔ)要在語音識(shí)別中使用的語音識(shí)別信息,所述語音識(shí)別用于將語音識(shí)別為與所述接收電話號(hào)碼相對(duì)應(yīng)的語言信息;語音識(shí)別信息選擇裝置,用于從所述存儲(chǔ)的語音識(shí)別信息中選擇與呼叫的接收電話號(hào)碼相對(duì)應(yīng)的語音識(shí)別信息;以及語音識(shí)別裝置,用于通過使用所選擇的語音識(shí)別信息,將輸入至所述呼叫語音信號(hào)輸入裝置的所述呼叫語音信號(hào)識(shí)別為語言信息,以及指定語音內(nèi)容。
2.如權(quán)利要求1所述的語音識(shí)別設(shè)備,其中所述語音識(shí)別信息是以 下至少一個(gè)示出語音和詞匯的對(duì)應(yīng)關(guān)系的識(shí)別字典、以語音的最小識(shí)別單位來代表聲音特征的聲音模型、代表詞的連接關(guān)系的語言模型、以及指 示語音識(shí)別過程的信息或識(shí)別參數(shù)。
3. —種語音識(shí)別設(shè)備,包括呼叫接收單元,用于接收向多個(gè)用于接收的電話號(hào)碼做出的呼叫; 呼叫語音信號(hào)輸入裝置,用于輸入所接收呼叫的呼叫語音信號(hào); 接收電話號(hào)碼輸入裝置,用于輸入與輸入呼叫語音信號(hào)相關(guān)的、用于接收的電話號(hào)碼,作為呼叫的接收電話號(hào)碼;修正內(nèi)容信息存儲(chǔ)裝置,用于存儲(chǔ)指示與所述用于接收的電話號(hào)碼相對(duì)應(yīng)的語音信號(hào)修正的內(nèi)容的修正內(nèi)容信息;修正內(nèi)容信息選擇裝置,用于從所述存儲(chǔ)的修正內(nèi)容信息中選擇與呼叫的接收電話號(hào)碼相對(duì)應(yīng)的修正內(nèi)容信息;語音修正裝置,用于執(zhí)行通過所選擇的、與輸入至所述呼叫語音信號(hào)輸入裝置的呼叫語音信號(hào)有關(guān)的修正內(nèi)容信息所指示的語音修正過程;以 及語音識(shí)別裝置,用于將語音修正裝置修正的語音信號(hào)識(shí)別為語言信 息,以及指定語音內(nèi)容。
4. 如權(quán)利要求3所述的語音識(shí)別設(shè)備,其中所述修正內(nèi)容信息是以下 至少一個(gè)針對(duì)噪聲去除過程的信息、針對(duì)語音信號(hào)失真修正的信息、以 及針對(duì)壓縮后的語音修正的信息。
5. —種語音識(shí)別方法,包括呼叫接收步驟,用于接收向多個(gè)用于接收的電話號(hào)碼做出的呼叫;呼叫語音信號(hào)輸入步驟,用于輸入所接收呼叫的呼叫語音信號(hào);接收電話號(hào)碼輸入步驟,用于輸入與輸入呼叫語音信號(hào)相關(guān)的、用于接收的電話號(hào)碼,作為呼叫的接收電話號(hào)碼;識(shí)別信息選擇步驟,用于根據(jù)呼叫的接收電話號(hào)碼,從與用于接收的 電話號(hào)碼相對(duì)應(yīng)的預(yù)先存儲(chǔ)的語音識(shí)別信息中選擇用于將語音識(shí)別為語 言信息的語音識(shí)別中的語音識(shí)別信息;以及語音識(shí)別步驟,通過使用所選擇的語音識(shí)別過程信息,將輸入至所述 呼叫語音信號(hào)輸入步驟的所述呼叫語音信號(hào)識(shí)別為語言信息,以及指定語 音內(nèi)容。
6. 如權(quán)利要求5所述的語音識(shí)別方法,其中所述語音識(shí)別信息是以 下至少一個(gè)示出語音和詞匯的對(duì)應(yīng)關(guān)系的識(shí)別字典、以語音的最小識(shí)別單位來代表聲音特征的聲音模型、代表i臥的連接關(guān)系的語言模型、以及指 示語音識(shí)別過程的信息或識(shí)別參數(shù)。
7. —種語音識(shí)別方法,包括呼叫接收步驟,用于接收向多個(gè)用于接收的電話號(hào)碼做出的呼叫; 呼叫語音信號(hào)輸入步驟,用于輸入所接收呼叫的呼叫語音信號(hào); 接收電話號(hào)碼輸入步驟,用于輸入與輸入呼叫語音信號(hào)相關(guān)的、用于接收的電話號(hào)碼,作為呼叫的接收電話號(hào)碼;修正內(nèi)容信息選擇步驟,用于根據(jù)呼叫的接收電話號(hào)碼,從預(yù)先存儲(chǔ)的與用于接收的電話號(hào)碼相對(duì)應(yīng)的修正內(nèi)容信息中選擇指示語音信號(hào)修正的內(nèi)容的修正內(nèi)容信息;語音修正步驟,用于執(zhí)行通過所選擇的、與在呼叫語音信號(hào)輸入步驟 中輸入的呼叫語音信號(hào)有關(guān)的修正內(nèi)容信息所指示的語音修正過程;以及 語音識(shí)別步驟,用于將在語音修正步驟中修正的語音信號(hào)識(shí)別為語言 信息,以及指定語音內(nèi)容。
8. 如權(quán)利要求7所述的語音識(shí)別方法,其中所述修正內(nèi)容信息是以 下至少一個(gè)針對(duì)噪聲去除過程的信息、針對(duì)語音信號(hào)失真修正的信息、以及針對(duì)壓縮后的語音修正的信息。
9. 一種用于識(shí)別語音的程序,用于使計(jì)算機(jī)執(zhí)行 呼叫接收過程,用于接收向多個(gè)用于接收的電話號(hào)碼做出的呼叫; 呼叫語音信號(hào)輸入過程,用于輸入所接收呼叫的呼叫語音信號(hào); 接收電話號(hào)碼輸入過程,用于輸入與輸入呼叫語音信號(hào)相關(guān)的、用于接收的電話號(hào)碼,作為呼叫的接收電話號(hào)碼;識(shí)別信息選擇過程,用于根據(jù)呼叫的接收電話號(hào)碼,選擇要用于將語 音識(shí)別為語言信息的語音識(shí)別信息;以及語音識(shí)別過程,用于通過使用所選擇的語音識(shí)別信息,將在呼叫語音 信號(hào)輸入過程中輸入的呼叫語音信號(hào)識(shí)別為語言信息,以及指定語音內(nèi) 容。
10. 如權(quán)利要求9所述的用于識(shí)別語音的程序,其中所述語音識(shí)別信 息是以下至少一個(gè)示出語音和詞匯對(duì)應(yīng)關(guān)系的識(shí)別字典、以語音的最小 識(shí)別單位來代表聲音特征的聲音模型、代表詞的連接關(guān)系的語言模型、以 及指示語音識(shí)別過程的信息或識(shí)別參數(shù)。
11. 一種用于識(shí)別語音的程序,用于使計(jì)算機(jī)執(zhí)行 呼叫接收過程,用于接收向多個(gè)用于接收的電話號(hào)碼做出的呼叫; 呼叫語音信號(hào)輸入過程,用于輸入所接收呼叫的呼叫語音信號(hào); 接收電話號(hào)碼輸入過程,用于輸入與輸入呼叫語音信號(hào)相關(guān)的、用于接收的電話號(hào)碼,作為呼叫的接收電話號(hào)碼;語音修正選擇過程,用于根據(jù)呼叫的接收電話號(hào)碼,從針對(duì)用于接收 的相應(yīng)電話號(hào)碼預(yù)先定義的修正內(nèi)容信息中選擇指示語音信號(hào)修正的內(nèi) 容的修正內(nèi)容信息;語音修正過程,用于根據(jù)所選擇的修正內(nèi)容信息,修正在呼叫語音輸 入過程中輸入的呼叫語音信號(hào);以及 語音識(shí)別過程,用于將在語音修正過程中修正的語音信號(hào)識(shí)別為語言 信號(hào),以及指定語音內(nèi)容。
12.如權(quán)利要求11所述的用于識(shí)別語音的方法,其中所述修正內(nèi)容 信息是以下至少一個(gè)針對(duì)噪聲去除過程的信息、針對(duì)語音信號(hào)失真修正 的信息、以及針對(duì)壓縮后的語音修正的信息。
全文摘要
[要解決的問題]在語音識(shí)別設(shè)備中,提供語音識(shí)別方法以及用于識(shí)別語音的程序,來執(zhí)行具有高精確度的語音識(shí)別。[解決方法]當(dāng)其中將多個(gè)用于接收的電話號(hào)碼分配給呼叫的相應(yīng)內(nèi)容的呼叫接收單元(11)從呼叫方接收呼叫時(shí),呼叫語音信號(hào)輸入裝置(12)輸入呼叫的呼叫語音信號(hào),以及接收電話號(hào)碼輸入裝置(13)輸入呼叫的接收電話號(hào)碼。然后,語音修正裝置(14)根據(jù)接收電話號(hào)碼執(zhí)行針對(duì)呼叫語音信號(hào)的語音修正處理,以及語音識(shí)別裝置(17)根據(jù)接收電話號(hào)碼執(zhí)行針對(duì)呼叫語音信號(hào)的語音識(shí)別處理。
文檔編號(hào)G10L15/00GK101379550SQ20078000469
公開日2009年3月4日 申請(qǐng)日期2007年1月31日 優(yōu)先權(quán)日2006年2月6日
發(fā)明者中澤聰, 佐藤研治, 坂尾要祐, 池田崇博 申請(qǐng)人:日本電氣株式會(huì)社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1