專利名稱:數(shù)字秘書的制作方法
電話應(yīng)答機(jī)一般允許從被叫方重放錄下的消息,并錄下主叫的消息,可以按鍵序列的形式提供許多選項(xiàng),允許主叫連到一系列可能的被叫方中特定的一個(gè),另外,也可提供許多話音菜單以幫助主叫選擇可能的選項(xiàng)。例如,AT&T公司的AUDIX系統(tǒng)就允許這種選項(xiàng),可以根據(jù)主叫選擇的被叫方或選項(xiàng)來定制錄下的響應(yīng)消息。但是,如果被叫方希望應(yīng)答前屏蔽掉呼入的呼叫,目前這種可能性是有限的,例如,我們知道可以使用一個(gè)專用號碼,在允許訪問被叫方之前讓主叫方從按鍵盤輸入這個(gè)號碼,但這需要事先在主叫方與被叫方間做好安排,而這在許多情況下是不方便的,而且易引起丟失或誤鍵入號碼等許多問題。我們已知道可使用呼入的電話號碼或語音識別來驗(yàn)證主叫的身份。這些技術(shù)一般可由軟硬件的多種組合在數(shù)字系統(tǒng)中實(shí)現(xiàn)。但是,語音識別要求對語音識別系統(tǒng)進(jìn)行非常多次的訓(xùn)練以達(dá)到足夠的精度。
語音識別已使用在移動電話中,其中當(dāng)說出一個(gè)特定詞組時(shí)就拔打?qū)?yīng)的電話號碼以提供免提拔號的功能,語音識別和語音合成也應(yīng)用于個(gè)人計(jì)算機(jī)(PC)中,例如,可訓(xùn)練的語音識別已經(jīng)用來實(shí)現(xiàn)各種計(jì)算機(jī)操作的控制,如拷貝一個(gè)文件或啟動一個(gè)應(yīng)用執(zhí)行等。文本到語音的合成也應(yīng)用于許多應(yīng)用中,在這些應(yīng)用中PC的操作員敲入或輸入文本。典型的應(yīng)用包括讀入較長的文擋或說出簡單請求以輸入要求的數(shù)據(jù)等。但是,目前的語音識別技術(shù)還只局限于不依賴于講話者發(fā)音的相對較少數(shù)目的單詞,這些單詞可以被較精確地識別出,特別是在較低成本系統(tǒng)中實(shí)現(xiàn)這種技術(shù)更是如此。而且系統(tǒng)識別一個(gè)給定單詞的時(shí)間對于在許多交談場合中要求很快的反應(yīng)而言是過分地長了,特別是在識別技術(shù)是在低成本系統(tǒng)中實(shí)現(xiàn)的情況更為突出。
我已經(jīng)發(fā)明了一種電話應(yīng)答機(jī)和方法,它們使用語音識別以確定主叫是否為所能接受的預(yù)定義主叫列表中的一員。主叫列表可用多種輸入技術(shù)生成,包括在被叫方語音輸入,或用鍵盤或圖形界面輸入。如果主叫確定為列表中的一員,機(jī)器允許呼叫沿第一順序進(jìn)行,它一般包括了向被叫話機(jī)振鈴,如果被叫話機(jī)不應(yīng)答,第一順序就經(jīng)主叫方提供一個(gè)用以響應(yīng)的定制消息。如果主叫確認(rèn)為不是列表中的一員,機(jī)器允許呼叫沿第二順序進(jìn)行,它一般包括響應(yīng)以一個(gè)標(biāo)準(zhǔn)的錄音消息。在這兩種情況下,主叫一般都可以給被叫方留下一段消息。也可提供其它的列表,比如用來確定呼叫的內(nèi)容。
圖1顯示了發(fā)明的技術(shù)的一個(gè)典型系統(tǒng)實(shí)現(xiàn)圖。
圖2顯示了實(shí)現(xiàn)發(fā)明的典型序列。
以下的詳細(xì)描述涉及電話應(yīng)答機(jī)和其使用方法。本發(fā)明的技術(shù)允許數(shù)字應(yīng)答機(jī)根據(jù)主叫身份來屏蔽呼叫,也允許被叫根據(jù)主叫的身份留下相應(yīng)的可播放的定制消息,一個(gè)典型的操作順序如下所示,其中如果要求的話,步驟1和2可以在激活系統(tǒng)在線前脫機(jī)執(zhí)行。
1.控制應(yīng)答機(jī)的人員(被叫方)生成一個(gè)“允許接收呼叫”的列表,它包括了特定的單個(gè)人或多個(gè)人,并指明僅當(dāng)特定的一個(gè)人發(fā)出呼叫時(shí),被叫方才被提供給一個(gè)呼入呼叫的指示,允許接收呼叫的列表也可由被叫方通過應(yīng)答機(jī)的麥克風(fēng)說話或鍵入或圖形界面選擇的方法來生成。
2.被叫方可以進(jìn)一步地指明當(dāng)允許呼叫列表中的人呼叫時(shí)播放一段特定的(定制的)消息。
3.接收呼入的呼叫。應(yīng)答機(jī)應(yīng)答,要求主叫方標(biāo)明身份。
4.主叫方說明自己的姓名。
5.應(yīng)答機(jī)分析主叫方所說的姓名并確定所說的名字是否在允許接收呼叫列表中。
6.如果主叫方不在允許接收呼叫列表中,則應(yīng)答機(jī)要求主叫方留言。
7.如果主叫方在允許接收呼叫列表中,應(yīng)答機(jī)給被叫方提供呼入呼叫的指示(如振鈴該話機(jī))。
8.如果在步驟7被叫方?jīng)]有應(yīng)答,應(yīng)答機(jī)播放一段錄好的消息,它可以包括在步驟2給這個(gè)主叫提供的定制消息,應(yīng)答機(jī)進(jìn)一步要求主叫方留言。
雖然以上給出了代表性的操作序列,仍然可以包括另外的選項(xiàng)或忽略一些選項(xiàng),這將在以下討論。注意到步驟5對主叫方身份的分析并不要求象在目前許多語音識別應(yīng)用中非常高速的軟硬件,因?yàn)橹恍枰谙鄬Π^少單詞的列表(允許接收列表)中比較出一些所說的單詞(一般為一個(gè)或二個(gè)單詞的名字)。在大多數(shù)情況下,允許接收列表只有100個(gè)名字或更少,經(jīng)常只有12個(gè)名字或更少。這樣只要低價(jià)的軟硬件就可以應(yīng)付了。另外,在步驟5允許用于分析和制定的時(shí)間可以達(dá)到數(shù)秒鐘,這可以通過當(dāng)進(jìn)行分析時(shí),對應(yīng)答機(jī)編程讓其播放“請等待”或其它一些短消息的簡單方法來實(shí)現(xiàn)。這類似于當(dāng)話務(wù)員應(yīng)答電話時(shí)所期待的回答,就允許實(shí)現(xiàn)分析功能的軟硬件的組合成本較低。
本發(fā)明的一個(gè)典型系統(tǒng)實(shí)現(xiàn)在圖1中所示,其中電話線100連至一部具有麥克風(fēng)102和揚(yáng)聲器103的話機(jī)101。該話機(jī)實(shí)現(xiàn)基本的電話功能,包括拔號和向/從電話線發(fā)送/接收音頻和振鈴信號,及任何必需的2-4線混合轉(zhuǎn)換。話機(jī)101也可包括一個(gè)用于把模擬語音轉(zhuǎn)換為數(shù)字脈沖編碼調(diào)制(PCM)格式和相反轉(zhuǎn)換的CDDEC15。話機(jī)101連至一個(gè)包括了語音分析器105和語音合成器106的應(yīng)答機(jī)104,在這里使用的術(shù)語“語音分析器”和“語音生成器”指的是實(shí)現(xiàn)給定功能所必需的硬件和軟件。在多數(shù)情況下,語音識別和語音生成功能共享硬件,而僅需對軟件稍做修改來用于實(shí)現(xiàn)特定功能。語音分析器和語音合成器最好使用數(shù)字信號處理器(DSP)技術(shù)來實(shí)現(xiàn)。本領(lǐng)域中已知有許多軟硬件組合以實(shí)現(xiàn)這些功能,任何以所要求價(jià)格和復(fù)雜性達(dá)到合適性能的技術(shù)都可用于實(shí)現(xiàn)本發(fā)明。
應(yīng)答機(jī)也包括程序內(nèi)存109和消息內(nèi)存110,它們可以是物理上分離的或共享一塊內(nèi)存空間。程序內(nèi)存一般為只讀內(nèi)存(ROM)107,但也可以是電可擦除可編程的只讀內(nèi)存(EEPROM)以用來進(jìn)行版本更新。程序內(nèi)存也可包括隨機(jī)存取內(nèi)存(RAM)109以加快運(yùn)行速度。消息內(nèi)存110可以包括用于存儲去話消息的ROM、EEPROM或RAM,及用于存儲來話消息的RAM或EEPROM。它也可包括這里所指的一些或所有的“錄音通知”,雖然如果需要的話它們中的一些可以永久地存貯在ROM中。在應(yīng)答機(jī)領(lǐng)域使用“音頻RAM”(ARAM)也是熟知的技術(shù),ARAM是指允許有很少缺陷比特的RAM,這樣就可使用低價(jià)的集成電路內(nèi)存芯片。去話消息和通知可以任何合適的數(shù)字化語音格式,一般是一種壓縮格式存貯以減少內(nèi)存空間。去話消息和通知也可以例如ASCII格式存貯,這就允許從鍵盤和其它輸入裝置輸入要求的信息。
“允許接收呼叫列表”保存在內(nèi)存111中,而主叫的身份,以語音分析器確定的主叫名字的數(shù)字表示形式存貯在內(nèi)存112中。使用一個(gè)數(shù)字比較器108來比較存貯在內(nèi)存112中的主叫身份和內(nèi)存111中的允許接收呼叫列表。在以下描述的許多其它功能可以使用另外硬件(沒有畫出)或在許多情況下另外的軟件來實(shí)現(xiàn),軟件一般都存貯在以上提到的程序內(nèi)存和消息內(nèi)存中。DSP、程序ROM和比較器(105,106,107,108)可以集成在第一塊集成電路上,其它內(nèi)存(109,110,111,112,113,114)如果需要的話可以集成在第二塊集成電路上,當(dāng)然其它劃分方案也是可能的。
注意到如果需要的話,方框101和方框104的所有功能可以包括在單一的組合話機(jī)/應(yīng)答機(jī)中,并且麥克風(fēng)102和/或揚(yáng)聲器103也可包含在其中?;蛘?,電話機(jī)功能可在與應(yīng)答機(jī)分離的單元中實(shí)現(xiàn)。如果需要,電話的功能可以包括在個(gè)人計(jì)算機(jī)中,例如麥克風(fēng)和揚(yáng)聲器可以包括在視頻監(jiān)視器中。應(yīng)答機(jī)的功能可以很方便地使用在PC主板或作為外插部件的內(nèi)存和邏輯電路來實(shí)現(xiàn)。雖然可以使用以上指明的標(biāo)準(zhǔn)的模擬電話,但也可使用包含模數(shù)和數(shù)模轉(zhuǎn)換器的數(shù)字話機(jī),例如,可以使用ISDN(綜合業(yè)務(wù)數(shù)字網(wǎng))話機(jī),或是一部連到寬帶網(wǎng)或Internet網(wǎng)上的話機(jī)。如果需要的話,可以修改傳統(tǒng)模擬話機(jī)提供的振鈴和呼入呼叫接收功能。例如,可以提供一種可視的“振鈴”顯示,并且對特定的實(shí)現(xiàn),呼入呼叫可由特定數(shù)字比特序列而不是模擬振鈴電壓來識別。
在圖2顯示了典型的操作順序的流程圖。接收到一個(gè)呼入呼叫(200)并向主叫方發(fā)送問候(201),通過在應(yīng)答機(jī)中提供一個(gè)時(shí)鐘,使問候可以是時(shí)間相關(guān)的(“早上好”或“下午好”),然后一般說出被叫方的名字(“Smith先生的電話”)。問候之后,發(fā)送一個(gè)查詢主叫方姓名的消息(“誰在呼叫?”)。一旦接收了主叫的姓名語音識別硬/軟件就分析這個(gè)名字(202)。分析的結(jié)果與在允許接收呼叫列表中的名字比較,如果匹配的話就設(shè)置一個(gè)標(biāo)志。如果需要求,PCM格式的主叫名也可轉(zhuǎn)換為另一種格式(ASCII等)以用于字母數(shù)字顯示。注意到如果分析軟/硬件足夠快,就可在說出名字的同時(shí)實(shí)時(shí)地進(jìn)行音頻分析。但是,現(xiàn)在所使用的典型分析技術(shù),一般要求暫時(shí)存貯數(shù)字格式的名字的音頻波形以便于稍后可執(zhí)行分析。分析的結(jié)果接著數(shù)字地與一般也是以PCM格式表示的允許接收呼叫列表中的名字相比較,如果匹配,提供一個(gè)呼入呼叫的指示,一般是給話機(jī)振鈴(204)。此后,如果在預(yù)定的時(shí)間或振鈴次數(shù)后應(yīng)答了呼叫(205),就可以進(jìn)行通話了,通話的最后,被叫方掛機(jī)(206),應(yīng)答機(jī)被重置以等待另一次呼入呼叫(200)。
在上述的步驟203,如果主叫的名字不在允許接收呼叫列表中,將提供一個(gè)預(yù)先錄制的通知(“Smith先生無法應(yīng)答”)(207),然后可提供一個(gè)選項(xiàng)讓主叫留言。這個(gè)選項(xiàng)可以用多種方式實(shí)現(xiàn),如在嘟嘟聲后開始留言。另外,可以按鍵以指明對這個(gè)要求回答是“Yes”或“No”。如果留了言,需要的話,可以向主叫提供一個(gè)選項(xiàng)以修改錄下的消息(209),在錄音之后,或如果沒有留言,需要的話,被叫方可以提供一個(gè)預(yù)先錄制的通知(“謝謝,再見”),就可掛上電話(210)。
在以上的步驟205中,如果被叫沒有摘機(jī),就可決定是否應(yīng)向主叫提供一個(gè)特殊消息(211)。該判定是根據(jù)在以上步驟202確定的主叫身份而做出的,如果不提供特殊消息,則提供一個(gè)標(biāo)準(zhǔn)的留言請求(207,208),上述流程繼續(xù)進(jìn)行。如果提供了特殊消息,就給主叫播放(212)。特殊消息可以是留給允許接收呼叫列表中的所有主叫的單個(gè)消息,但它也可為給單個(gè)主叫的定制消息,因?yàn)樯鲜龅牟襟E202已經(jīng)確定了主叫的身份,如果需要的話,消息可以是為一組主叫定制的,比如用于通知會議的參加者會議的時(shí)間和地點(diǎn)的變化。如果向特定的用戶播放特殊消息,這個(gè)事實(shí)可以存貯在與消息相關(guān)的標(biāo)志中,這允許被叫方確定是否可以檢索消息。接著要求主叫留言(213),如果要錄下消息,流程繼續(xù)沿步驟209執(zhí)行;如果不留言,流程沿步驟210繼續(xù)執(zhí)行。如果需要的話,從允許接收呼叫列表中的主叫來的消息可以做上標(biāo)志以便于與其它消息分開地檢索,例如,在方框209可以在主叫姓名和內(nèi)容上加上標(biāo)志。
話機(jī)掛機(jī)后,應(yīng)答機(jī)回到呼叫等待狀態(tài)(200)。注意到當(dāng)應(yīng)答機(jī)沒有正在處理呼叫時(shí),可以對上述功能或通知編程。這可由脫機(jī)編程提供(214),脫機(jī)編程可由多種方法實(shí)現(xiàn)。例如,當(dāng)向允許接收呼叫列表中輸入信息時(shí),被叫方可以簡單地說出名字輸入到列表中,前面提到的語音識另軟/硬件可以用來把名字轉(zhuǎn)換成合適數(shù)字格式。注意到由于在本發(fā)明的技術(shù)中語音識別軟/硬件一般是與說話者發(fā)音無關(guān)的,所以這是可能的。另一種輸入名字的技術(shù)是從鍵盤敲入名字,也可使用圖形界面,從存貯的目錄中指定所需要的名字。另一種技術(shù)中,包含各名字的文件可以輸出到列表中。也應(yīng)注意到可以用同樣的方式從列表中刪除名字。另外,上面提到的任何通知和特殊消息在應(yīng)答機(jī)不處理呼叫時(shí)是可以修改的,選項(xiàng)也可以修改。雖然術(shù)語“脫機(jī)”用來指明在簡單系統(tǒng)中用于執(zhí)行編程步驟214的合適的時(shí)間,但在合適的系統(tǒng)中當(dāng)正在處理呼叫時(shí)(應(yīng)答在線)時(shí)仍可以完成編程工作。
對于以上描述的本發(fā)明的各種功能而言,很明顯還有許多功能沒有包括。例如,在播放特殊消息前,可以進(jìn)行附加的對主叫話音的分析以鑒別主叫的真?zhèn)?。這種鑒別在本發(fā)明技術(shù)中較容易實(shí)現(xiàn),因?yàn)閷﹄娫捳疋?步驟204)所需要的時(shí)間可用于對以前存貯在數(shù)字內(nèi)存的主叫的話音波形進(jìn)行進(jìn)一步分析。另一種選項(xiàng)利用了在識別步驟后識別為允許接收呼叫列表中一員的主叫方的名子可被保存在內(nèi)存中。然后被叫就可以通過話音或其他方法詢問應(yīng)答機(jī)是否特定的一方發(fā)出了呼叫(“John Smith發(fā)出呼叫了嗎?”)。這個(gè)信息可以很容易地用合成話音或可視指示給出,如果需要的話,可以提供更多的信息,如呼叫的時(shí)間和日期(存貯在內(nèi)存114中)和主叫是否留言。如果留了言,被叫方可以播放消息。這時(shí),主叫方的留言可以任何要求的順序檢索出來,不一定以消息接收的時(shí)間順序檢索。被叫方也可要求應(yīng)答機(jī)讀出自從該機(jī)激活后允許接收呼叫列表中所有發(fā)出呼叫的主叫的名字。
除了以上描述的根據(jù)主叫名字識別主叫外,也可進(jìn)行語音識別以確定給定呼叫的主題和內(nèi)容,即應(yīng)答機(jī)可以查詢呼叫的特性,如果呼叫者說出了特定的單詞,應(yīng)答機(jī)就采取特定的行動。例如,如果查詢呼叫的特性并呼叫者說出了單詞“緊急情況”,呼叫就轉(zhuǎn)發(fā)到一部便攜式電話而不是被錄下來。另一個(gè)例子是,如果響應(yīng)呼叫者說出的單詞“水管2”或“電工”的查詢,就可向被叫方的住處或辦公地點(diǎn)的話機(jī)發(fā)出特殊的消息。另外,應(yīng)答機(jī)可以包括合適的軟硬件以允許被叫可選擇地播放包含一個(gè)或多個(gè)給定內(nèi)容單詞的消息。例如,被叫方可以播放包含單詞“職工會議”的所有呼叫,當(dāng)以上述類似的方式對應(yīng)答機(jī)編程時(shí),被叫方可以輸入可被識別的查詢和單詞,存貯在內(nèi)存113中的相應(yīng)數(shù)據(jù)如圖1所示。因此,“呼叫內(nèi)容”列表可以包括識別呼叫主題的單詞。如果需要的話,呼叫內(nèi)容和允許接收呼叫列表都可存貯在單一內(nèi)存中,也可使用本發(fā)明的技術(shù)進(jìn)行一些改進(jìn)。
權(quán)利要求
1.電話應(yīng)答機(jī)其特征在于一個(gè)呼叫識別器(101)用于確定存在一個(gè)呼入呼叫,和一個(gè)語音發(fā)生器(105)用于提示主叫姓名;一個(gè)語音識別器(106)用于把主叫姓名轉(zhuǎn)換為可和存貯的名字列表比較的數(shù)字表示形式;一個(gè)可以接受的存貯姓名列表(111);一個(gè)比較器(108)用于比較主叫名字的數(shù)字表示和存貯的名字列表;一個(gè)指示器以向被叫方指明給定的主叫名字在存貯的名字列表中;和一個(gè)錄音機(jī)用于錄下主叫方的消息。
2.權(quán)利要求1的電話應(yīng)答機(jī),其中所述的應(yīng)答機(jī)包括一個(gè)語音發(fā)生器用于當(dāng)所述指示器指明主叫在存貯名字列表中時(shí),向所述呼叫者播放特殊消息,并當(dāng)所述指示器指明主叫不在存貯名字列表中時(shí)播放標(biāo)準(zhǔn)消息。
3.權(quán)利要求1的電話應(yīng)答機(jī),其中所述應(yīng)答機(jī)包括裝置用于播放從給定主叫來的消息。
4.權(quán)利要求2的電話應(yīng)答機(jī),其中所述應(yīng)答機(jī)進(jìn)一步包括用于給在所述存貯名字列表中的一個(gè)特定主叫定制特殊消息的裝置。
5.權(quán)利要求1的電話應(yīng)答機(jī),其中所述應(yīng)答機(jī)包括內(nèi)容單詞的存貯列表,從而確定呼叫的內(nèi)容。
6.權(quán)利要求1的電話應(yīng)答機(jī),其中所述應(yīng)答機(jī)包括用于提供所有留言的主叫者的名字的裝置。
7.權(quán)利要求6的電話應(yīng)答機(jī),其中所述應(yīng)答機(jī)進(jìn)一步包括用于播放選定的主叫的消息的裝置。
8.權(quán)利要求1的電話應(yīng)答機(jī),其中所述應(yīng)答機(jī)包括用于確定一個(gè)給定主叫是否已經(jīng)檢索了一個(gè)消息的裝置。
9.權(quán)利要求1的電話應(yīng)答機(jī),其中所述應(yīng)答機(jī)包括一個(gè)呼叫內(nèi)容單詞的存貯列表。
10.權(quán)利要求9的電話應(yīng)答機(jī),其中所述應(yīng)答機(jī)包括用于播放具有一個(gè)給定內(nèi)容單詞的消息的裝置。
11.權(quán)利要求1的電話應(yīng)答機(jī),其中所述應(yīng)答機(jī)包括一個(gè)提供了麥克風(fēng)和揚(yáng)聲器的電話機(jī)。
12.權(quán)利要求1的電話應(yīng)答機(jī),其中所述電話機(jī)是一個(gè)包括了2-4線混合變換器的模擬電話。
13.如權(quán)利要求1的電話應(yīng)答機(jī),其中所述電話機(jī)是一個(gè)包括模/數(shù)轉(zhuǎn)換器和數(shù)/模轉(zhuǎn)換器的數(shù)字電話。
全文摘要
電話應(yīng)答機(jī)和所使用的方法利用了語音識別以從可能的主叫的預(yù)定義的列表中識別出一個(gè)主叫方。該列表可由各種輸入技術(shù)產(chǎn)生,包括在主叫位置的話音,鍵盤或圖形輸入技術(shù)。如果識別出主叫在列表中,應(yīng)答機(jī)就允許呼叫沿第一順序進(jìn)行,包括振鈴被叫電話。如果識別出主叫不在列表中,應(yīng)答機(jī)使呼叫沿第二順序進(jìn)行,包括用標(biāo)準(zhǔn)錄音消息響應(yīng)。無論哪種情況,通常允許主叫給被叫留言,也可提供附加的預(yù)定列表,以確定呼叫的內(nèi)容。
文檔編號H04M1/64GK1140371SQ96102329
公開日1997年1月15日 申請日期1996年6月19日 優(yōu)先權(quán)日1995年6月29日
發(fā)明者普拉默德·瓦桑特·阿格達(dá) 申請人:美國電報(bào)電話Ipm公司