專利名稱:用于語音啟動裝置的講話用戶接口的制作方法
背景技術(shù):
I.發(fā)明領(lǐng)域本發(fā)明一般涉及通信領(lǐng)域,更具體地涉及用于語音啟動裝置的用戶接口。
II.背景技術(shù)話音識別(VR)代表一種最重要的技術(shù),可賦予設(shè)備模擬智能,以識別用戶或用戶話音命令,并有助于人們與設(shè)備對接。VR還代表一種用于人們語聲理解的關(guān)鍵技術(shù)。應(yīng)用技術(shù)從語音信號發(fā)現(xiàn)語音信息的系統(tǒng)稱為話音識別器。這里使用的術(shù)語“話音識別器”通常指任何講話用戶接口啟動裝置。話音識別器通常包含抽取獲得對輸入原始語言進行VR所必需的承載信息的特征或矢量序列的聲處理器,和對特征或矢量序列進行解碼以獲得有意義的期望輸出格式,例如與輸入發(fā)音對應(yīng)的語言單詞序列的解碼器。為增強給定系統(tǒng)的性能,需進行訓(xùn)練以使系統(tǒng)配置有效參數(shù)。換言之,在可最佳運行前,系統(tǒng)需要學(xué)習(xí)。
聲處理器是話音識別器中的前端語音分析子系統(tǒng)。響應(yīng)于輸入語音信號,聲處理器提供適當(dāng)?shù)谋磉_以表征隨時間變化的語音信號。聲處理器排除不相關(guān)的信息,如背景噪聲、信道失真、講話者特點及講話方式等。有效的聲處理為話音識別器提供增強的聲鑒別能力。為達到該目的,要分析的一個有用特征是短時間頻譜包絡(luò)。兩種常用的用于表征短時間頻譜包絡(luò)的頻譜分析技術(shù)是線性預(yù)測編碼(LPC)和濾波器組(filter-bank)頻譜模擬。示范的LPC技術(shù)在USP5414796的美國專利及L.B.Rabiner和R.W.Schafer Digital Processing ofSpeech Signal396-453(1978)中揭示,該專利轉(zhuǎn)讓給本發(fā)明的受讓人,并通過引用,該專利與上述論文與本申請完全結(jié)合。
由于安全的原因,VR(也常稱為語音識別)正變得日益重要。例如,VR可用于代替按壓無線電話鍵盤上按鈕的人工操作。這在用戶邊駕駛汽車邊啟動電話呼叫時,尤其重要。在使用無VR功能的電話時,駕駛員必須把一只手從駕駛盤上移開并注視電話鍵盤,同時按壓按鈕以撥號呼叫。這些動作增大了汽車意外事故的可能性。語音啟動電話(即設(shè)計用作語音識別的電話)允許駕駛員連續(xù)注視道路,同時進行電話呼叫。免提汽車配套系統(tǒng)還允許駕駛員在啟動電話期間,兩手保持在駕駛盤上。
語音識別裝置分為取決于講話者的裝置或獨立于講話者的裝置。獨立于講話者的裝置可從任何使用者接受話音命令。最通用的取決于講話者的裝置可加以訓(xùn)練以識別來自特定用戶的命令。取決于講話者的VR裝置通常以兩個階段運作,訓(xùn)練階段和識別階段。在訓(xùn)練階段,VR系統(tǒng)提示用戶講一次或兩次系統(tǒng)詞匯表中的各單詞,從而系統(tǒng)可對這些特定單詞或短語學(xué)習(xí)用戶語音的特征。對于免提汽車套件的示范性詞匯表可包括鍵盤上的數(shù)字;關(guān)鍵詞“呼叫(call)”、“發(fā)送(send)”、“撥號(dial)”、“取消(cancel)”、“消除(clear)”、“增加(add)”、“刪除(delete)”、“歷史(history)”、“程序(program)”、“是(yes)”和“不(no)”;預(yù)定數(shù)量的經(jīng)常呼叫的同事、朋友或家庭成員的名字。一旦訓(xùn)練完成,用戶可通過講經(jīng)訓(xùn)練的關(guān)鍵詞在識別階段啟動呼叫。例如,如果“John”是訓(xùn)練的名字之一,則用戶可通過講短語“呼叫JOhn”啟動對John的呼叫。VR系統(tǒng)可識別單詞“呼叫”和“John”并撥用戶預(yù)先輸入作為John電話號碼的號。
通常VR裝置依賴于講話用戶接口,該接口不同于鍵盤和監(jiān)視器等圖形用戶接口,而允許用戶與VR裝置交互作用。用戶可例如通過進行電話呼叫、接收電話呼叫或使用講話命令接用例如語音便箋、語音郵件及電子郵件等服務(wù)性能,而與VR裝置交互作用。用戶輸入用已知的VR技術(shù)獲取,經(jīng)文字到語音(TTS)變換或記錄的提示提供向用戶的反饋。
用戶講孤立的單詞,存儲在VR裝置的存儲器中例如要呼叫的姓名,或口述要執(zhí)行的命令,諸如編制電話薄、記錄和播放話音便箋、或發(fā)送附有用戶講話作為語音附件的電子郵件等命令時,VR裝置使用孤立詞識別。常規(guī)VR技術(shù)對高達約40或50單詞的孤立詞識別是相當(dāng)成熟的。從而,蜂窩式電話上的處理器和存儲器資源可用于建立對講話用戶輸入極精確的機構(gòu)。
但是,對于使用者講電話號碼并要VR裝置呼叫該號碼的情況,VR裝置必須具有連續(xù)語音識別(CSR)能力,因為人們在講述電話號碼時通常在各號碼間不作停頓。VR裝置必須把捕獲的發(fā)音(講述的電話號碼)與10的N次冪個組合的存儲模式(10數(shù)字,講話者無關(guān)詞匯表)進行比較,這里N是電話號碼的位數(shù)。CSR技術(shù)還要求用戶用語音輸入向VR裝置輸入電子信箱地址。這甚至要求更高的處理和存儲能力,因為26的N次冪個組合必須與捕獲的發(fā)音比較。與孤立單詞識別技術(shù)相比,CSR技術(shù)通常要求更多的處理器和存儲器資源,從而增大了VR裝置(例如蜂窩式電話)的制造成本。而且,CSR技術(shù)不對語音輸入,尤其是蜂窩式電話通常使用的噪聲環(huán)境,提供滿意精度的機構(gòu)。
從而,雖然多數(shù)具有用于數(shù)字輸入的講話用戶接口的常規(guī)VR產(chǎn)品使用與講話者獨立的CSR技術(shù),但在處理器、存儲器和/或電池功率迫使禁止使用CSR技術(shù)時,常會用傳統(tǒng)鍵盤輸入代替講話用戶接口的數(shù)字輸入性能。蜂窩式電話制造商,例如常使用該途徑,提示用戶用鍵盤輸入電話號碼。但是,多數(shù)用戶不愿花時間和作出努力手動向電話薄輸入所有電話號碼,使各號碼有各自話音標記。因此,需要用現(xiàn)存信息,在VR裝置中建立具有語音標記的用戶電話薄這樣一種機構(gòu)。
在本發(fā)明另一發(fā)明中,語音啟動裝置最好包括用于使用戶與所述語音啟動裝置雙向交換信息的裝置;用于響應(yīng)于用戶限定事件的產(chǎn)生,提示用戶講與所述語音啟動裝置呼叫歷史中的項關(guān)聯(lián)的話音標記的裝置。
在本發(fā)明的另一方面中,一種提示用戶把話音標記輸入電話的方法,包括下述步驟在電話上從特定源接收用戶限定數(shù)消息;在所述接收步驟后提示用戶向電話輸入與所述特定源關(guān)聯(lián)的語音標記。
在本發(fā)明另一方面中,一種提示用戶把話音標記輸入至電話的方法,包括下述步驟在電話上發(fā)送用戶限定數(shù)的消息至特定目的地;在所述發(fā)送步驟后,提示用戶向電話輸入與所述特定目的地關(guān)聯(lián)的話音標記。
在本發(fā)明的示范性實施例中,電子郵件消息可從遠處發(fā)送至電話,該電子郵件消息同時發(fā)送至至少一個其它電子郵件地址,以便用電子郵件地址擴充電話的電話薄。
在本發(fā)明的示范性實施例中,電子郵件消息可從遠處發(fā)送至電話,該電子郵件消息同時拷貝至至少一個其它電子郵件地址,以用電子郵件地址擴充電話的電話薄。
在本發(fā)明的另一方面,一種提示用戶向電話輸入語音標記的用戶接口,包括在電話上從特定源號碼接收用戶限定數(shù)的消息的裝置;在從特定源號碼接收用戶限定數(shù)的消息后,提示用戶向所述電話輸入與所述特定源關(guān)聯(lián)的語音標記的裝置。
在本發(fā)明的另一方面,一種提示用戶向電話輸入語音標記的用戶接口,包括在電話上向特定目的地發(fā)送用戶限定數(shù)的消息的裝置;在向所述特定目的地發(fā)送用戶限定數(shù)的消息后,提示用戶向電話輸入與所述特定目的地關(guān)聯(lián)的語音標記的裝置。
圖2是用于例如圖l所示系統(tǒng)等的語音識別系統(tǒng)的處理器及相關(guān)存儲媒體的框圖。
圖3是說明例如
圖1所示系統(tǒng)等的語音識別系統(tǒng),執(zhí)行用于處理用戶接口消息的方法步驟的流程圖。
圖4是說明例如圖1所示系統(tǒng)等的語音識別系統(tǒng),執(zhí)行用于完成代理程序動作的方法步驟的流程圖。
圖5是說明例如圖1所示系統(tǒng)等的語音識別系統(tǒng),執(zhí)行用于處理呼叫者ID的方法步驟的流程圖。
圖6是說明例如圖1所示系統(tǒng)等的語音識別系統(tǒng),執(zhí)行用于處理電子郵件地址的方法步驟的流程圖。
圖7A是說明例如圖1所示系統(tǒng)等的語音識別系統(tǒng),執(zhí)行用于提示用戶處理的方法步驟的流程圖。
圖7B是在圖7A流程圖中,說明訓(xùn)練子程序的流程圖。
圖8是是說明例如圖1所示系統(tǒng)等的語音識別系統(tǒng),執(zhí)行用于設(shè)置代理程序選項的方法步驟的流程圖。
較佳實施例的詳細說明根據(jù)一個示于圖1的實施例,語音識別系統(tǒng)10包含模數(shù)轉(zhuǎn)換器(A/D)12、聲處理器14、VR模板數(shù)據(jù)庫16、模式比較邏輯18、決定邏輯20。聲處理器14包含端點檢測器22。VR系統(tǒng)10可例如設(shè)置在無線電話或免提汽車套件中。
VR系統(tǒng)10處于語音識別階段時,某人(未圖示)講一個單詞或短語,從而產(chǎn)生語音信號。用常規(guī)變換器(未圖示)把語音信號轉(zhuǎn)換成語音電信號S(t)。向A/D轉(zhuǎn)換器12提供語音信號S(t),后者根據(jù)熟知的采樣方法,例如脈沖編碼調(diào)制(PCM),把該語音信號轉(zhuǎn)換成數(shù)字化的語音采樣信號(Sn)。
語音采樣信號S(n)提供至聲處理器14用于確定參數(shù)。聲處理器14產(chǎn)生一組參數(shù),對輸入語音信號S(t)的特征建模。根據(jù)包括例如在上述USP 5414796中敘述的、語音編碼器基于編碼和使用快速傅里葉變換(FFT)的對數(shù)倒頻譜系數(shù)的多種已知語音參數(shù)確定技術(shù)中的任一種技術(shù),確定該參數(shù)。聲處理器14可用數(shù)字信號處理器(DSP)來實現(xiàn)。該DSP可包含語音編碼器?;蛘?,聲處理器14可用語音編碼器來實現(xiàn)。
也可在VR系統(tǒng)10訓(xùn)練期間進行參數(shù)確定,其中,對VR系統(tǒng)10詞匯表的所有詞發(fā)送一組模板至VR模板數(shù)據(jù)庫,用于在其中永久存儲。VR模板數(shù)據(jù)庫16最好是用例如快閃存儲器等非易失性存儲媒體等任何常規(guī)方式實現(xiàn)。從而在VR系統(tǒng)10的電源斷開時,可在VR模板數(shù)據(jù)庫16中保持模板。
向模式比較邏輯18提供該組參數(shù)。模式比較邏輯18檢測發(fā)音的起點和終點,計算動態(tài)聲特征(例如時間導(dǎo)數(shù),兩階時間導(dǎo)數(shù)等),通過選擇有關(guān)幀壓縮聲特征,并且對靜態(tài)和動態(tài)聲特征進行量化。在例如Lawrence Rabiner &Biing_Hwang Juang,F(xiàn)undamentals of Speech Recognition(1993)中,敘述了關(guān)于終點檢測、動態(tài)聲特征導(dǎo)數(shù)、模式壓縮和模式量化的各種已知方法,該文通過引用與本申請充分結(jié)合。模式比較邏輯18把該組參數(shù)與VR模板數(shù)據(jù)庫16中存儲的所有模板進行比較。向決定邏輯20提供比較結(jié)果或該組參數(shù)與所有存儲在VR模板數(shù)據(jù)庫16中的所有模板間的距離。決定邏輯20從VR模板數(shù)據(jù)庫16中選擇與該組參數(shù)匹配最緊密的模板?;蛘?,決定邏輯20可使用常規(guī)“N最佳”選擇算法,在預(yù)定匹配門限值中選擇N個最接近的匹配。然后詢問講話人打算選擇哪個。決定邏輯20的輸出是關(guān)于口述詞表中哪個詞的決定。
模式比較邏輯18和決定邏輯20可用微處理器來實現(xiàn),這在下文參照圖2進行敘述。VR系統(tǒng)10例如可是一個專用應(yīng)用集成電路(ASIC)。VR系統(tǒng)10的識別精度是該系統(tǒng)可多正確地識別詞表中單詞或短語的度量。例如,95%的識別精寬表示VR系統(tǒng)10在100次中可正確識別詞表中的單詞95次。
根據(jù)示于圖2的實施例,VR裝置(未圖示)包括處理器100和第1及第2存儲媒體102、104。處理器100最好是微處理器,但也可是任何普通形式的處理器、專用處理器、數(shù)字信號處理器(DSP)、控制器或狀態(tài)機。處理器100耦合至第1存儲媒體102,后者最好由快閃存儲器、EEPROM存儲器或RAM存儲器來實現(xiàn)。第1存儲媒體102可是單片RAM存儲器,或處理器100和第1存儲媒體102可駐留在ASIC中。第2存儲媒體104耦合至處理器100,最好由ROM存儲器實現(xiàn),后者構(gòu)建成保持在處理器100上運行的固件指令或軟件模塊。或者,第2存儲媒體104可用常規(guī)非易失性存儲器的任何形式實現(xiàn)。
在一個實施例中,VR裝置是無線電話。在另一實施例中,VR裝置是免提汽車套件。VR裝置包含存儲在VR裝置中的呼叫歷史。該呼叫歷史是一個包含發(fā)出呼叫、接收呼叫、遺漏呼叫等的表。講話用戶接口詢問用戶,如果如下文參照圖3~圖8所示進行這些呼叫的話,就把這些呼叫號碼加至用戶電話薄。從而,使用現(xiàn)存的信息完成了最困難的語音輸入(電話號碼數(shù)字輸入)任務(wù)。
在一個實施例中,用戶可選擇接通或斷開該特征。如果接通特征,則下文參照附3~圖8說明的智能代理程序監(jiān)視用戶呼叫模式。VR裝置處于待機模式時,代理程序“喚醒”,并執(zhí)行與電話薄相關(guān)的薄記任務(wù)。在下次用戶使用VR裝置時,用戶可講名字呼叫電話薄中的一項。
在另一實施例中,如下文參照圖3~8所述,電子郵件地址可通過智能代理程序輸入電話薄。VR裝置保持輸入字母數(shù)字頁的歷史。如果呼叫者ID是電子郵件地址,則智能代理程序作出該事實的注釋。代理程序有用戶注意碼時,代理程序取得話音標記或姓名標記附加至電子郵件地址。電子郵件地址在電話薄中登記后,用戶可記錄話音便箋,并使用語音命令發(fā)送該話音便箋作為因特網(wǎng)發(fā)送的電子郵件的附件。用戶可從計算機發(fā)送電子郵件或字母數(shù)字頁至其VR裝置,把其他電子郵件地址加至TO字段或CC字段,以用電子郵件地址擴充其電話薄。
圖2的第2存儲媒體最好是ROM存儲器,用于保存包含由處理器100執(zhí)行的、下文參照圖3~8敘述的一系列指令的軟件模件或固件模件,該處理器可是通用微處理器或DSP等特定用途處理器。指令或代碼最好用C++語音編寫,但也可用本領(lǐng)域技術(shù)人員熟知的其它任何編程語言編寫。第l存儲媒體102最好是快閃存儲器,用于保存下文參照圖3~8敘述的各種表。如本領(lǐng)域技術(shù)人員所理解,處理器100和第1及第2存儲媒體102、104可替換為邏輯上等價的硬件部件,例如寄存器和FIFO,或分立晶體管。
根據(jù)一個實施例,VR裝置(未圖示)使用智能代理程序軟件模塊(未圖示)執(zhí)行圖3~8流程圖中的算法步驟,以使用現(xiàn)存信息而不需用戶輸入電話號碼和電子郵件地址。圖3步驟200中,VR裝置接收用戶接口消息。然后智能代理程序進到步驟202。在步驟202,代理程序確定用戶接口消息是否代理程序的消息。用戶或手動(例如按VR裝置上的鍵盤)、或通過對VR裝置的微音器講而聲響輸入消息。如果消息是代理程序的消息,則代理程序進到步驟204。另一方面,如果消息不是代理程序的消息,則代理程序進至步驟206。在步驟206,代理程序退出算法。
在步驟204,代理程序確定代理程序處于激活模式還是“喚醒”模式(與待機或“入睡”模式相反)。如果代理程序處于喚醒模式,則代理程序進至步驟208。另一方面,如果代理程序不在喚醒模式,則代理程序進至步驟210。
在步驟210,代理程序確定消息是否是喚醒代理程序消息,即是否要進至喚醒模式。如果消息是喚醒消息,則代理程序進至步驟212。另一方面,如果消息不是喚醒消息,則代理程序進至步驟214。在步驟212,代理程序進入喚醒模式。然后代理程序進至步驟216。在步驟216,代理程序退出算法。在步驟214,代理程序向其它用戶接口部件(未圖示)告知代理程序處于入睡模式的“AGENT ASLEEP”消息。代理程序接著進至步驟218。在步驟218,代理程序退出算法。
在步驟208,代理程序確定消息是用戶設(shè)定代理程序選項的命令或是偏好。偏好可包含例如用戶按鍵盤則啟動特定鍵盤以喚醒代理程序,或在代理程序詢問用戶是否要對號碼附加話音標記前,對特定號碼建立最小數(shù)的用戶電話呼叫。如果消息是用戶設(shè)置代理程序選頂命令,則代理程序進至步驟220。另一方面,如果消息不是用戶設(shè)置代理程選項命令,則代理程序進至步驟222。在步驟220,代理程序進入下文參照圖8敘述的子程序,以根據(jù)用戶命令設(shè)置代理程序選擇。
在步驟222,代理程序確定消息是否需要代理程序采取特定動作。如果是,則代理程序進至步驟224。另一方面如果不是,則代理程序進至步驟226。在步驟226,代理程序向其它接口部件公布消息“INVALID AGENT MESSAGE”,告知消息是代理程序無效消息。接著,代理程序進至步驟228。在步驟228,代理程序退出算法。在步驟224,代理程序進入下文參照圖4敘述的子程序,以執(zhí)行用戶要求的特定動作。
在一個實施例中,代理程序按照圖4流程圖所述的算法執(zhí)行代理程序動作。在步驟300,代理程序進入執(zhí)行代理程序動作的子程序。接著,代理程序進至步驟302。在步驟302,代理程序確定是否有對VR裝置的呼入電話呼叫。如果有,則代理程序進至步驟304。另一方面,如果沒有呼入電話呼叫,則代理程序進至步驟306。在步驟304,代理程序進入下文參照圖5敘述的子程序,以處理呼叫者ID 。
在步驟306,代理程序確定是否有對VR裝置的輸入頁。如果有,則代理程序進至步驟308。另一方面,如果沒有輸入頁,則代理程序進至步驟310。在步驟308,代理程序進入下文參照圖6敘述的子程序以處理電子郵件地址。
在步驟310,代理程序確定是否有來自VR裝置的呼出電話呼叫。如果有呼出電話呼叫,則代理程序進至步驟312。另一方面如果沒有,代理程序進至步驟314。在步驟312,代理程序進入下文參照圖5敘述的子程序,處理呼叫者ID。
在步驟314,代理程序確定是否有VR裝置的呼出頁。如果有,代理程序進至步驟316。另一方面如果沒有,代理程序進至步驟318。在步驟316,代理程序進入下文參照圖6敘述的子程序,處理電子郵件地址。在步驟318,代理程序進入下文參照圖7A~7B敘述的子程序,提示用戶處理。例如,用戶可能需要例如每小時一次提示,用戶是否已為提示用的代理程序設(shè)置了定時器?;蚶?,用戶可能已規(guī)定,代理程序在VR裝置功率升高或降低時提示用戶?;蚶缬脩粢褑佑脩籼崾咎幚?。
在一個實施例中,代理程序根據(jù)圖5流程說明的計算步驟,對呼入或呼出話呼叫處理呼叫者ID。在步驟400,代理程序進入子程序,以處理呼叫者ID。接著代理程序進至步驟402。在步驟402,代理程序確定是否處于喚醒模式。如果是處于喚醒模式,則代理程序進至步驟404。另一方面如果不處于喚醒模式,則代理程序進至步驟406。在步驟406,代理程序它其它用戶接口部件告示消息“AGENT ASLEEP”,告知代理程序處于入睡模式。然后代理程序進至步驟408。在步驟408,代理程序退出算法。
在步驟404,代理程序確定呼入或呼出電話呼叫的呼叫者ID是否在VR裝置的電話薄中。如果在電話薄中,則代理程序進至步驟410。另一方面,如果不在電話薄中,則代理程序進至步驟412。在步驟410,代理程序退出算法。
在步驟412,代理程序確定呼叫者ID是否在VR裝置的快閃存儲器所保存的更新表中,即確定以前是否至少有一次呼叫者ID號已呼叫VR裝置,或以前至少有一次VR裝置已呼叫呼叫者ID號。如果呼叫者ID在更新表中,則代理程序進至步驟414。另一方面,如果呼叫者ID不在更新表中,則代理程序進至步驟416。在步驟416,代理程序向更新表附加該呼叫者ID。接著,代理程序進至步驟418。在步驟418,代理程序退出算法。
在步驟414,代理程序確定呼叫者ID是否超過最小門限數(shù),即ID號呼叫VR裝置或VR裝置呼叫呼叫者號是否已有某個最小門限次數(shù)。最小門限數(shù)最好由用戶設(shè)置成代理程序選擇或優(yōu)選。如果呼叫者ID計超過最小門限數(shù),則代理程序進至步驟420。另一方面如果不超過,則代理程序進至步驟422。
在步驟422,代理程序把呼叫者ID計數(shù)遞增1。然后代理程序進至步驟424。在步驟424,代理程序退出算法。在步驟420,代理程序把呼叫者ID加至提示表,從而提示用戶把呼叫者ID號加至電話薄并用該呼叫者ID關(guān)聯(lián)一話音標記。接著代理程序進至步驟426。在步驟426,代理程序從更新表去除呼叫者ID。接著代理程序進至步驟428。在步驟428,代理程序退出算法。
在一個實施例中,代理程序按照圖6流程圖敘述的算法步驟對呼入或呼出頁處理電子郵件地址。在步驟500,代理程序進入子程序,以處理電子郵件地址。接著,代理程序進至步驟502。在步驟502,代理程序確定是否處于喚醒模式。如果是,則代理程序進至步驟504。另一方面如果不是,代理程序進至步驟506。在步驟506,代理程序向其它的用戶接口部件告示消息“AGENTASLFEP”,告知代理程序處于入睡模式。接著,代理程序進至步驟508。在步驟508,代理程序退出算法。
在步驟504,代理程序確定呼叫或呼出頁電子郵件地址是否在VR裝置的電話薄中。如果是,則代理程序進至步驟510。另一方面如果電子郵件地址不在電話薄中,則代理程序進至步驟512。在步驟510,代理程序退出算法。
在步驟512,代理程序確定電子郵件地址是否在VR裝置的快閃存儲器所保存的更新表中,即,代理程序確定電子郵件地址是否以前至少有一次是送至VR裝置的頁資源,或以前至少一次VR裝置向電子郵件地址發(fā)送過電子郵件。如果電子郵件地址在更新表中,則代理程序進至步驟514。另一方面,如果電子郵件地址不在更新表中,則代理程序進至步驟516。在步驟516,代理程序向更新表附加電子郵件地址。接著代理程序進至步驟518。在步驟518,代理程序退出算法。
在步驟514,代理程序確定電子郵件地址計數(shù)是否超過最小門限數(shù),即確定電子郵件地址是發(fā)送至VR裝置的頁的資源或VR裝置向該電子郵件地址發(fā)送的電子郵件已達到某最小門限次數(shù)。最小門限數(shù)最好由用戶設(shè)置成代理程序選擇或優(yōu)選。如果電子郵件地址計數(shù)超過最小門限數(shù),則代理程序進至步驟520。另一方面,如果電子郵件地址計數(shù)不超過最小門限數(shù),則代理程序進至步驟522。
在步驟522,代理程序把電子郵件地址計數(shù)遞增1。然后代理程序進至步驟524。在步驟524,代理程序退出算法。在步驟520,代理程序向提示表附加電子郵件地址,從而向用戶提示,把電子郵件地址加至電話薄并用電子郵件地址關(guān)聯(lián)一話音標記。然后代理程序進至步驟526。在步驟526,代理程序從更新表取掉該電子郵件地址,接著,代理程序進至步驟528。在步驟528,代理程序退出算法。
在一個實施例中,代理程序提示用戶按照圖7A流程圖所示的算法步驟進行處理。在步驟600,代理程序進入子程序,以提示用戶處理。用戶提示處理可由用戶啟動,或通過VR裝置加電和/或降電(如果用戶規(guī)定)、或響應(yīng)于用戶規(guī)定定時器而啟動。接著,代理程序進至步驟602。在步驟602,代理程序把提示表中項數(shù)(即提示表規(guī)模)設(shè)置成N。然后代理程序進至步驟604。
在步驟604,代理程序確定N是否等于零。如果是,即提示表中無項目,則代理程序進至步驟606。在步驟606,代理程序退出子程序。另一方面,如果在步驟604,N不等于零,則代理程序進至步驟608。在步驟608,代理程序進入下文參照圖7B敘述的子程序,以訓(xùn)練提示表中下一項。
在圖7B訓(xùn)練子程序中,代理程序進入子程序以在步驟610訓(xùn)練提示表中的項。接著代理程序進至步驟612。在步驟612,代理程序?qū)υ擁椨?xùn)練姓名標記或話音標記。在一個實施例中,通過VR裝置上的揚聲器聲響方式發(fā)出單詞“NAME PLEASE”訓(xùn)練姓名標記。一旦聽到該單詞,用戶報出姓名。接著代理程序進至步驟614。在步驟614,代理程序通過在VR裝置的屏幕上向用戶產(chǎn)生消息“PLEASE TYPE NAME”,從用戶取得名字。一旦看到該消息,用戶用VR裝置的鍵盤打出該名字。接著代理程序進至步驟616。如果如IS-41、GSM-MAP等中“呼叫姓名表示”(“Calling Name Presentation”)協(xié)議中規(guī)定那樣,姓名已存在于VR裝置的呼叫歷史中,則代理程序可跳過步驟614,直接從步驟612進至步驟616。在步驟616,代理程序返回圖7A子程序。
圖7B訓(xùn)練子程序完成時,代理程序進至圖7A的步驟618。在步驟618,代理程序把N遞減1。接著代理程序進至步驟620。在步驟620,在處理被用戶或用戶接口的其它部件中斷時,代理程序從提示表刪去最近附加的項目。接著代理程序返回步驟604。
在另一個實施例中,可控制或處理提示表,使提示表不再根據(jù)呼叫何時接收或撥號、或根據(jù)電子郵件何時接收或發(fā)送而加以安排。例如,提示表可以最頻繁被叫/接收的電話數(shù)和最頻繁發(fā)送/接收的電子郵件地址次序分類。這可更好地與用戶感覺匹配。
在一個實施例中,按照圖8流程圖所說明的算法步驟,代理程序發(fā)送一個代理程序選項。在步驟700,代理程序進入子程序,以提示用戶處理。接著代理程序進至步驟702。在步驟702,代理程序確定用戶是否要在VR裝置加電期間向電話薄附加提示表。代理程序通過在VR裝置的屏幕上對用戶產(chǎn)生消息而作出其判定?;蛘撸沓绦蚩赏ㄟ^VR裝置的揚聲器以聲音方式詢問用戶。如果用戶想要在VR裝置加電期間向電話薄附加提示表,則用戶按壓VR裝置上第1預(yù)定鍵盤。如果用戶不要在VR裝置加電期間向電話薄附加提字表,則用戶按壓VR裝置上的第2預(yù)定鍵盤。
如果在步驟702,以VR裝置加電期間,提示表附加至電話薄,則代理程序進至步驟704。另一方面,如果不是上述情況,則代理程序進至步驟706。在步驟704,代理程序把參數(shù)UPDATE_POWERUP設(shè)置成1。接著代理程序進至步驟708。在步驟706,代理程序把參數(shù)UPDATE_PDWERUP設(shè)置成零。接著代理程序進至步驟708。
在步驟708,代理程序確定用戶是否要在VR裝置降電期間向電話薄附加提示表。代理程序通過在VR裝置的屏幕上向用戶產(chǎn)生消息來作出該判定?;蛘撸沓绦蚩山?jīng)VR裝置的揚聲器以聲音方式詢問用戶。如果用戶想要在VR裝置降電期間向電話薄附加提示表,則用戶按壓VR裝置上的第1預(yù)定鍵盤。反之,用戶按壓VR裝置上的第2預(yù)定鍵盤。
如果在步驟708,在VR裝置降電期間向電話薄附加提示表,則代理程序進至步驟710。反之,則代理程序進至步驟712。在步驟710,代理程序把參數(shù)UPDATE_POWERDOWN設(shè)置成1。接著代理程序進至步驟714。在步驟712,代理程序把參數(shù)UPDATE_POWERDOWN設(shè)置成零。接著代理程序進至步驟714。
在步驟714,代理程序確定用戶是否要在規(guī)定時間間隔向電話薄附加提示表。代理程序通過在VR裝置屏幕上向用戶產(chǎn)生消息作出其判定。或者,代理程序可經(jīng)VR裝置的揚聲器以聲音方式詢問用戶。如果用戶想在規(guī)定時間間隔向電話薄附加提示表,則按VR裝置上的第1預(yù)定鍵盤。反之,用戶按VR裝置上的第2預(yù)定鍵盤。
在步驟714,以規(guī)定時間間隔向電話薄附加提示表,代理程序進至步驟716。反之,代理程序進至步驟718。在步驟716,代理程序把參數(shù)UPDATE_TIMER設(shè)置成1。接著代理程序進至步驟720。在步驟718,代理程序把參數(shù)UPDATE_TIMER設(shè)置成零。接著代理程序進至步驟722。在步驟720,代理程序讀取用戶輸入的時間間隔并把它設(shè)置成等于參數(shù)UPDATE_TIMER_VALUE。為了讀取用戶輸入的時間間隔,代理程序首先在VR裝置的屏幕上對用戶產(chǎn)生消息“ENTER TIMEINTERVAL”。用戶通過按壓VR裝置上的適當(dāng)鍵盤作出的響應(yīng)向代理程序規(guī)定了期望的時間間隔。接著代理程序進至步驟722。
在步驟722,代理程序讀取呼叫發(fā)送/接收或電子郵件發(fā)送/接收地址的用戶輸入的最小數(shù),并把用戶輸入的最小數(shù)設(shè)置成等于參照圖5~圖6敘述參數(shù)MIV_THRS的最小門限數(shù)。為了讀取用戶輸入的最小數(shù),代理程序首先在VR裝置的屏幕上對用戶產(chǎn)生消息“ENTER MINIMUM NUMBER OF CALLS”。用戶通過按壓VR裝置上的適當(dāng)鍵盤作出的響應(yīng),為代理程序規(guī)定了發(fā)送或接收的呼叫或電子郵件的最小期望數(shù)。接著,代理程序進至步驟724。在步驟724,代理程序退出算法。
這樣已敘述了語音啟動裝置的新穎和改進的講話用戶接口。本領(lǐng)域的技術(shù)人員理解,可用數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、分立元件門或晶體管邏輯、分立硬件部件,例如寄存器和FIFO、執(zhí)行一組固件指令的處理器、或任何常規(guī)可編程軟件模件和處理器,實現(xiàn)或執(zhí)行這里敘述的實施例有關(guān)的各種邏輯塊和算法步驟。處理器最好是微處理器,但也可是任何常規(guī)處理器、控制器、微控制器或狀態(tài)機。軟件模塊可設(shè)置在RAM存儲器、快閃存儲器、寄存器或其它本領(lǐng)域熟知的任何形式可寫存儲媒體。本領(lǐng)域技術(shù)人員還理解,在上述全文中標注的數(shù)據(jù)、指令、命令、信息、信號、比特、碼元和碼片,最好由電壓、電流、電磁波、磁場或粒子、光場或粒子、或上述的任何組合來表示。
已經(jīng)顯示和敘述了本發(fā)明的較佳實施例。但是,對于本領(lǐng)域技術(shù)人員顯而易見的是,不脫離本發(fā)明的精神和范圍,可對這里敘述的實施例作出各種變換。從而,本發(fā)明不限定為除下述權(quán)利要求外的其它范圍。
權(quán)利要求
1.一種語音啟動裝置,其特征在于包括至少一個構(gòu)成為可使用戶與該語音啟動裝置雙向交換信息的機構(gòu);邏輯部分,耦合到所述至少一個機構(gòu)并構(gòu)成為響應(yīng)用戶限定事件的產(chǎn)生,通過所述至少一個機構(gòu)提示用戶講與所述語音啟動裝置的呼叫歷史中的項關(guān)聯(lián)的話音標記。
2.如權(quán)利要求1所述的裝置,其特征在于,所述邏輯部分包括處理器和包含一系列所述處理器可執(zhí)行的軟件指令的非易失性存儲器。
3.如權(quán)利要求1所述的裝置,其特征在于,所述呼叫歷史包含下述表中的至少一個對所述裝置的呼入頁、從所述裝置呼出的電子郵件消息、呼入至所述裝置的電話呼叫、從所述裝置呼出的電話呼叫。
4.如權(quán)利要求1所述的裝置,其特征在于,還包括構(gòu)成為存儲用戶電話薄的存儲媒體,其中,所述裝置包含構(gòu)成為接收電話呼叫的無線電話;所述用戶限定事件包含從特定電話號碼對所述裝置產(chǎn)生用戶限定數(shù)的電話呼叫;所述項包含所述特定電話號碼,該項存儲在用戶電話薄中。
5.如權(quán)利要求1所述的裝置,其特征在于,還包括構(gòu)成為存儲用戶電話薄的存儲媒體,其中,所述裝置構(gòu)成為接收電子郵件消息;所述用戶限定事件包含從特定電子郵件地址對所述裝置產(chǎn)生用戶限定頁數(shù);所述項包含該特定電子郵件地址,該項存儲在用戶電話薄中。
6.如權(quán)利要求1所述的裝置,其特征在于,還包括構(gòu)成為存儲用戶電話薄的存儲媒體,其中,所述裝置包含構(gòu)成為發(fā)送電話呼叫的無線電話;所述用戶限定事件包含從所述裝置對特定電話號碼產(chǎn)生用戶限定數(shù)的電話呼叫;所述項包含所述特定電話號碼,該項存儲在用戶電話薄中。
7.如權(quán)利要求1所述的裝置,其特征在于,還包括構(gòu)成為存儲用戶電話薄的存儲媒體,其中,所述裝置構(gòu)成為發(fā)送電子郵件消息;所述用戶限定事件包含從所述裝置對特定電子郵件地址產(chǎn)生用戶限定電子郵件消息數(shù);所述項包含該特定電子郵件地址,該項存儲在用戶電話薄中。
8.一種語音啟動裝置,其特征在于包括用于使用戶與所述語音啟動裝置雙向交換信息的裝置;用于響應(yīng)于用戶限定事件的產(chǎn)生,提示用戶講與所述語音啟動裝置呼叫歷史中的項關(guān)聯(lián)的話音標記的裝置。
9.如權(quán)利要求8所述的裝置,其特征在于,所述邏輯部分包括處理器和包含一系列所述處理器可執(zhí)行的軟件指令的非易失性存儲器。
10.如權(quán)利要求8所述的裝置,其特征在于,所述呼叫歷史包含下述表中的至少一個對所述裝置的呼入頁、從所述裝置呼出的電子郵件消息、呼入至所述裝置的電話呼叫、從所述裝置呼出的電話呼叫。
11.如權(quán)利要求8所述的裝置,其特征在于,還包括用于存儲用戶電話薄的裝置,其中,所述裝置包含構(gòu)成為接收電話呼叫的無線電話;所述用戶限定事件包含從特定電話號碼對所述裝置產(chǎn)生用戶限定數(shù)電話呼叫,所述項包含所述特定電話號碼,該項存儲在所述存儲裝置中。
12.如權(quán)利要求8所述的裝置,其特征在于,還包括用于存儲用戶電話薄的裝置,其中,所述裝置構(gòu)成為接收電子郵件消息;所述用戶限定事件包含從特定電子郵件地址對所述裝置產(chǎn)生用戶限定頁數(shù);所述項包含所述特定電子郵件地址,該項存儲在所述存儲裝置中。
13.如權(quán)利要求8所述的裝置,其特征在于,還包括用于存儲用戶電話薄的裝置,其中,所述裝置包含構(gòu)成為發(fā)送電話呼叫的無線電話;所述用戶限定事件包含從所述裝置向特定電話號碼產(chǎn)生用戶限定數(shù)電話呼叫,所述項包含所述特定電話號碼,該項存儲在所述存儲裝置中。
14.如權(quán)利要求8所述的裝置,其特征在于,還包括用于存儲用戶電話薄的裝置,其中,所述裝置構(gòu)成為發(fā)送電子郵件消息;所述用戶限定事件包含從所述裝置向特定電子郵件地址產(chǎn)生用戶限定數(shù)電子郵件消息;所述項包含所述特定電子郵件地址,該項存儲在所述存儲裝置中。
15.一種提示用戶把話音標記輸入電話的方法,其特征在于,包括下述步驟在電話上從特定源接收用戶限定數(shù)消息;在所述接收步驟后提示用戶向電話輸入與所述特定源關(guān)聯(lián)的語音標記。
16.如權(quán)利要求15所述的方法,其特征在于,所述消息包含電話呼叫,所述特定源包含電話號碼。
17.如權(quán)利要求15所述的方法,其特征在于,所述消息包含頁,所述特定源包含電子郵件地址。
18.如權(quán)利要求15所述的方法,其特征在于,還包括從遠處向所述電話發(fā)送電子郵件消息的步驟,該電子郵件消息同時發(fā)送至至少一個其它電子郵件地址。
19.如權(quán)利要求15所述的方法,其特征在于,還包括從遠處向所述電話發(fā)送電子郵件消息的步驟,該電子郵件消息同時拷貝至至少一個其它電子郵件地址。
20.一種提示用戶把話音標記輸入至電話的方法,其特征在于,包括下述步驟在電話上發(fā)送用戶限定數(shù)的消息至特定目的地;在所述發(fā)送步驟后,提示用戶向電話輸入與所述特定目的地關(guān)聯(lián)的話音標記。
21.如權(quán)利要求20所述的方法,其特征在于,所述消息包含電話呼叫,所述特定目的地包含電話號碼。
22.如權(quán)利要求20所述的方法,其特征在于,所述消息包含頁,所述特定目的地包含電子郵件地址。
23.如權(quán)利要求20所述的方法,其特征在于,還包括從遠處向所述電話發(fā)送電子郵件消息的步驟,該電子郵件消息同時發(fā)送至至少一個其它電子郵件地址。
24.如如權(quán)利要求20所述的方法,其特征在于,還包括從遠處向所述電話發(fā)送電子郵件消息的步驟,該電子郵件消息同時拷貝至至少一個其它電子郵件地址。
25.一種提示用戶向電話輸入語音標記的用戶接口,其特征在于包括在電話上從特定源號碼接收用戶限定數(shù)的消息的裝置;在從特定源號碼接收用戶限定數(shù)的消息后,提示用戶向所述電話輸入與所述特定源關(guān)聯(lián)的語音標記的裝置。
26.如權(quán)利要求25所述的用戶接口,其特征在于,所述消息包含電話呼叫,所述特定源包含電話號碼。
27.如權(quán)利要求25所述的用戶接口,其特征在于,所述消息包含頁,所述特定源包含電子郵件地址。
28.一種提示用戶向電話輸入語音標記的用戶接口,其特征在于包括在電話上向特定目的地發(fā)送用戶限定數(shù)的消息的裝置;在向所述特定目的地發(fā)送用戶限定數(shù)的消息后,提示用戶向電話輸入與所述特定目的地關(guān)聯(lián)的語音標記的裝置。
29.如權(quán)利要求28所述的用戶接口,其特征在于,所述消息包含電話呼叫,所述特定目的地包含電話號碼。
30.如權(quán)利要求28所述的用戶接口,其特征在于,所述消息包含頁,所述特定目的地包含電子郵件地址。
全文摘要
本發(fā)明揭示一種語音啟動裝置的講話用戶接口,它包括處理器和該處理器可執(zhí)行且存儲在非易性存儲器中的一系列軟件指令。提示語音啟動裝置的用戶輸入與該語音啟動裝置呼叫歷史中的項關(guān)聯(lián)的語音標記。呼叫歷史包含呼入和呼出電子郵件消息表及呼入和呼出電話呼叫表。從語音啟動裝置向該電話號碼或用該電話號碼從電話向語音啟動裝置發(fā)送用戶選擇數(shù)的電話呼叫、或從語音啟動裝置向電子郵件地址,或從電子郵件地址向語音啟動裝置發(fā)送用戶選擇數(shù)的電子郵件消息后,提示用戶輸入與呼叫歷史中的電話號碼或電子郵件地址關(guān)聯(lián)的語音標記。用戶可通過從計算機向語音啟動裝置發(fā)送電子郵件消息并把附加電子郵件地址包含在電子郵件消息的TO:字段和/或CC:字段中,而用電子郵件地址擴充語言啟動裝置的電話簿。
文檔編號H04M1/23GK1346486SQ00805988
公開日2002年4月24日 申請日期2000年3月30日 優(yōu)先權(quán)日1999年3月31日
發(fā)明者H·加魯達德里, A·P·德佳科 申請人:高通股份有限公司