提供改進(jìn)的語音激活功能的方法和裝置制造方法
【專利摘要】本公開涉及提供改進(jìn)的語音激活功能的方法和裝置。具體公開了—種提供改進(jìn)激活功能的方法、裝置和計算機(jī)程序產(chǎn)品。從用于語音激活操作的姓名的集合提供語法,所述語法包括所述姓名和所述姓名的變形。在所述語法中將所述姓名和所述姓名的優(yōu)選變形相關(guān)聯(lián)。接收所述姓名的優(yōu)選變形并將其用于執(zhí)行任務(wù)。
【專利說明】提供改進(jìn)的語音激活功能的方法和裝置
【技術(shù)領(lǐng)域】
[0001]本公開涉及提供改進(jìn)的語音激活功能的方法和裝置【背景技術(shù)】
[0002]蜂窩電話已經(jīng)變得無處不在。蜂窩電話(也稱為移動電話、便攜電話和手機(jī))是一種在廣闊地理區(qū)域周圍移動時能夠通過無線鏈路撥打和接聽電話的設(shè)備。蜂窩電話通過連接到移動電話運營商提供的蜂窩網(wǎng)絡(luò)、允許接入到公共電話網(wǎng)絡(luò)來實現(xiàn)上述功能。除了電話,現(xiàn)代移動電話還支持各種其他業(yè)務(wù),例如文本消息、多媒體消息服務(wù)(MMS)、電子郵件、因特網(wǎng)接入、短距離無線通信(紅外、藍(lán)牙)、商業(yè)應(yīng)用、游戲和拍照。提供這些和更通用的計算能力的移動電話通常稱為智能手機(jī)。
[0003]蜂窩電話的一種典型用途是在配備有自動語音識別(ASR)的電話上撥打電話。該特征有時稱為語音激活名字撥號(VAND)。任何說出一個或多個詞都可以成為語音標(biāo)簽,并可用于撥叫聯(lián)系人、發(fā)送文本消息或者打開應(yīng)用。此外,越來越多的車輛配備有免持語音標(biāo)簽自動操作,例如使用全球定位系統(tǒng)(GPS)獲得路徑(direction)、撥打集成的移動電話或者選擇播放的歌曲或者音樂家。
[0004]如上闡述的傳統(tǒng)的機(jī)制具有各種缺陷。對于使用語音撥號特征的一般移動電話用戶,用戶以系統(tǒng)無法識別的正常的口頭方式說出一個人的姓名是普遍的。例如,一個人在地址簿或者聯(lián)系人列表中記為William Smith,而更通常地稱他為Bill Smith或者BillySmith。當(dāng)聯(lián)系人列表項以將電子郵件的發(fā)送者列為William Smith的電子郵件的方式查找時也會出現(xiàn)這種情況。用戶可能說“撥叫Billy Smith”而該項不是已知的。相應(yīng)地,用戶可感覺語音撥號沒有正常工作并停止使用語音撥號。一些用戶可能從這些經(jīng)驗中學(xué)習(xí)并正確地說出輸入到聯(lián)系人列表中的姓名,但這不能避免用戶下次以正常方式使用他人的姓名并使得系統(tǒng)再次不能識別該姓名的情況出現(xiàn),這對于用戶是不方便的。相同的概念也適用于其它語音激活功能。用戶可能從GPS設(shè)備請求“到Fenway的路徑”并被提供了兩種選擇,例如,F(xiàn)enway 公園,Boston, Ma 或者 Fenway 花園,Boston MA。
[0005]當(dāng)前描述的用于改進(jìn)語音激活功能的方法和裝置包括特定用戶界面(UI)設(shè)計,其目標(biāo)為個人姓名或者功能的文本形式與其口頭表述之間的區(qū)別。考慮到ASR語法中所有這類口頭表述為語音激活功能的用戶帶來更用戶友好的體驗。對于特定方言(例如,中國話),由于語法輸入和用戶口頭表達(dá)的不一致性,用戶使用語音激活功能時可能具有較差的體驗。例如,對于具有三個字符(或者三個音節(jié))的姓名,人們傾向于在設(shè)備的地址薄中輸入全名,而通常僅叫后兩個字(或兩個音節(jié))的名。因此,條目王大文(WangDaWen)簡單地說成大文(Da Wen)。然而,如果姓名具有兩個字符,人們傾向于叫全名。條目李偉(LiWei)說成LiWei。人們在叫他們的同事、同學(xué)和朋友的姓名時在姓前帶上前綴“老”或者“小”,這是非常普遍的。條目張亞新(Zhang Yaxin)叫為老張(Lao Zhang),或者條目包清風(fēng)(BaoQingfeng)叫為小包(Xiao Bao)。
[0006]在提供改進(jìn)的語音激活功能的方法的特定實施例中,該方法包括從姓名的集合提供語法,所述語法包括姓名和姓名的變形。變形可以包括原姓名的縮減版本,還包括帶有特定前綴的姓名縮減版本。優(yōu)選的姓名變形與所述語法中的姓名相關(guān)聯(lián)。所述方法還包括接收優(yōu)選的姓名變形并使用與該變形關(guān)聯(lián)的姓名執(zhí)行任務(wù)。
[0007]其他實施例包括其上具有提供改進(jìn)語音激活功能的計算機(jī)可讀代碼的計算機(jī)可讀介質(zhì)。計算機(jī)可讀介質(zhì)包括用于從姓名的集合提供語法的指令,所述語法包括姓名和姓名的變形。變形可以包括原姓名的縮減版本,還包括帶有特定前綴的姓名縮減版本。優(yōu)選的姓名變形在語法中與姓名關(guān)聯(lián)。所述方法還包括接收優(yōu)選的姓名變形并使用與該變形相關(guān)聯(lián)的姓名執(zhí)行任務(wù)。
[0008]其他實施例包括被配置為處理如本發(fā)明實施例在此公開的全部方法操作的計算機(jī)化的設(shè)備。在這些實施例中,計算機(jī)化的設(shè)備(例如,蜂窩電話)在連接以下部件的互聯(lián)機(jī)構(gòu)中包括存儲系統(tǒng)、處理器和通信接口。存儲系統(tǒng)編碼有提供如此處所述的改進(jìn)語音激活功能的處理,當(dāng)在處理器上執(zhí)行該處理時(例如當(dāng)運行時),該處理在蜂窩電話中如此處所述地操作以執(zhí)行如此處作為本發(fā)明實施例闡述的所有方法實施例和操作。因此,執(zhí)行或者被編程以執(zhí)行這里描述的過程的任何計算機(jī)化的設(shè)備都是本發(fā)明的實施例。
[0009]這里公開的本發(fā)明實施例的其他布置包括執(zhí)行方法實施例和上述概括并在下文詳細(xì)公開的操作的軟件程序。更具體地,計算機(jī)程序產(chǎn)品是其上編碼有當(dāng)在計算機(jī)化的設(shè)備中執(zhí)行時提供這里描述的改進(jìn)語音激活功能的關(guān)聯(lián)操作的計算機(jī)程序邏輯的計算機(jī)可讀介質(zhì)的實施例。當(dāng)運行在至少一個具有計算系統(tǒng)的處理器上時,計算機(jī)程序邏輯使得處理器執(zhí)行這里本發(fā)明實施例指示的操作(例如方法)。發(fā)明的這種布置通常作為軟件、代碼和/或置于或者編碼在計算機(jī)可讀介質(zhì)上的其他數(shù)據(jù)結(jié)構(gòu)提供,計算機(jī)可讀介質(zhì)諸如是光學(xué)介質(zhì)(例如CD-ROM)、軟盤或者硬盤,或者其它介質(zhì),例如一個或多個ROM或者RAM中的固件或微代碼,或者PROM芯片或者專用集成電路(ASIC)或者一個或多個模塊中的可下載軟件圖像,共享庫等。軟件或者固件或者其他這類配置可以安裝到計算機(jī)化的設(shè)備中以使得計算機(jī)化的設(shè)備中的一個或多個處理器執(zhí)行這里作為發(fā)明實施例闡述的技術(shù)。在計算機(jī)化的設(shè)備的集合中操作的軟件過程,例如在一組數(shù)據(jù)通信設(shè)備或者其他實體中,也能夠提供發(fā)明的系統(tǒng)。發(fā)明的系統(tǒng)能夠在若干數(shù)據(jù)通信設(shè)備的許多軟件過程之間分布,或者所有過程在小范圍的專用電腦上運行,或者僅在一個電腦上運行。
[0010]應(yīng)當(dāng)理解的是,發(fā)明的實施例可也嚴(yán)格地作為軟件程序、軟件和硬件實現(xiàn),或者單獨作為硬件和/或電路實現(xiàn),例如在數(shù)據(jù)通信設(shè)備中。發(fā)明的特征,如這里所述,可以在數(shù)據(jù)通信設(shè)備和/或用于這種設(shè)備的軟件系統(tǒng)中利用,所述數(shù)據(jù)通信設(shè)備是例如NuanceCommunications Inc.制造的數(shù)據(jù)通信設(shè)備。
[0011]本公開中討論的每個不同的特征、技術(shù)、配置等能夠獨立運行或者組合運行。相應(yīng)地,本發(fā)明可以以許多不同方式實現(xiàn)和觀察。并且,這里的
【發(fā)明內(nèi)容】
部分不會詳細(xì)說明本公開或者請求保護(hù)的發(fā)明的每個實施例和/或越來越新穎的方面。替代地,
【發(fā)明內(nèi)容】
部分僅給出不同實施例的初步描述以及相對于傳統(tǒng)技術(shù)的新穎點。對于發(fā)明的額外的細(xì)節(jié)、元素、和/或可能的觀點(變換),讀者應(yīng)當(dāng)關(guān)注下面進(jìn)一步討論的本公開的具體實施例部分和相應(yīng)附圖。
【專利附圖】
【附圖說明】[0012]如附圖所示,從下面發(fā)明的優(yōu)選實施例的更特別描述中前述內(nèi)容是顯而易見的,在附圖中,不同的圖中類似的附圖標(biāo)記指示相同的部分。附圖不一定需要縮放,但重點在于示出發(fā)明的原理。
[0013]圖1描述了根據(jù)本發(fā)明實施例的智能姓名撥號系統(tǒng)的框圖;
[0014]圖2A是示出了來自初始用戶模型的語法的示例的表;
[0015]圖2B是示出了來自根據(jù)本發(fā)明處理的初始用戶模型的語法的表;
[0016]圖3描述了用于根據(jù)本發(fā)明實施例提供智能姓名撥號的方法的特定實施例的流程圖。
【具體實施方式】
[0017]下面給出的實施例給出了使得本領(lǐng)域技術(shù)人員能夠?qū)崿F(xiàn)發(fā)明的必要信息并且示出實施發(fā)明實施例的最佳模式。一旦閱讀下面的描述以及附圖,本領(lǐng)域技術(shù)人員將理解發(fā)明的思想并識別出那些這里沒有特別陳述的這些思想的應(yīng)用。應(yīng)當(dāng)理解的是,這些思想和應(yīng)用都落入本公開和附圖的范疇。
[0018]盡管關(guān)于蜂窩電話上的姓名撥號描述用于提供改進(jìn)語音激活功能的系統(tǒng),描述的思想也適用于其他用途。其他用途包括但不限于:發(fā)送文本消息、請求GPS路徑等?,F(xiàn)在參考圖1,示出提供改進(jìn)語音激活功能的系統(tǒng)10的特定實施例。系統(tǒng)10包括與智能姓名撥號管理器16通信的語音識別元件14。智能姓名撥號管理器與用戶模型18和用戶動作預(yù)測元件20通信。用戶動作預(yù)測元件20向通過向語音識別元件14提供輸入來啟動處理的用戶12提供輸出。
[0019]語音識別元件14接收口語命令作為輸入并且將口語命令轉(zhuǎn)換為文本串。該文本串接著被轉(zhuǎn)發(fā)到智能姓名撥號管理器16,在智能姓名撥號管理器16中對命令進(jìn)行進(jìn)一步處理。
[0020]智能姓名撥號管理器模塊16負(fù)責(zé)根據(jù)用戶輸入來更新用戶模型18。智能姓名撥號管理器模塊16還更新用于語音識別的語法并將用戶模型和用戶輸入發(fā)送到用戶動作預(yù)測模決20。
[0021]用戶模型18用于顧客習(xí)慣和其他信息,包括用戶何時撥叫該姓名,用戶幾次撥叫該姓名,以及使用何種口頭表述來撥叫該姓名。最初,用戶模型將覆蓋所有可能的口頭表述,之后,用戶模型將根據(jù)用戶輸入持續(xù)更新。
[0022]用戶動作預(yù)測模塊20用于根據(jù)輸入作出正確決定。用戶動作預(yù)測模決20將使用用戶輸入的統(tǒng)計信息并獲得響應(yīng)用戶輸入的最佳動作。一系列示例規(guī)則將用于作出決定。
[0023]響應(yīng)生成模塊22將根據(jù)該動作生成對話框或者其他UI界面。對話框包括選擇對話框、撥號對話框和確認(rèn)對話框中的一個或多個。選擇對話框?qū)⑹境銎ヅ湔埱舐?lián)系人的聯(lián)系人列表并將其呈現(xiàn)給用戶(或者以可視形式,或者以音頻形式),使得用戶從呈現(xiàn)的聯(lián)系人列表中選擇期望的聯(lián)系人。撥號對話框?qū)⑹境稣诒缓艚械哪膫€人。確認(rèn)對話框示出呼叫過誰。
[0024]這里描述一個示例,其中智能電話的地址薄僅包含三個條目。應(yīng)當(dāng)理解,這僅是用于闡述目的,并不意味著任何方式的限制。智能手機(jī)上的典型地址薄或者聯(lián)系人列表可包含數(shù)百個或者更多的姓名。[0025]在本示例中,智能手機(jī)的地址薄包括以下三個條目:
[0026]WangDaffen 王大文
[0027]WangLiTao 王力濤
[0028]WangPei 王佩
[0029]初始用戶模型將生成包含這些姓名的變形的語法。在某些方言(例如中國話)中,具有三個或更多個元素的姓名(例如,王大文)被簡單叫為兩個元素(例如,大文)是普遍的。對于具有兩個元素的姓名(例如,李偉)通常叫為全名(例如,李偉)。人們還可稱呼某人為“老”或者“小”并將其加到姓之前。不稱呼某人的全名(例如,張亞欣),而是可將其簡單稱為Lao Zhang (老張)或者包清風(fēng)可以稱為Xiao Bao (小包)。在某人姓名的文本形式和稱呼同一人(或位置)的用戶使用的口頭表述之間存在不同之處。這一部分是由于條目獲取自可使用人們的正式姓名而不是更為通用的正式姓名的變形的電子郵件的聯(lián)系人列表。
[0030]現(xiàn)在參考圖2A,給出三個姓名王大文、王力濤和王佩,通過包含下述元素的初始用戶模型生成語法:
[0031]王大文,老王,小王,大文
[0032]王力濤,老王,小王,力濤;
[0033]王佩,老王,小王
[0034]王大文也稱為老王(老),小王(小)以及大文(三元素姓名的兩元素變形)。類似地,王力濤也稱為老王(老),小王(小)以及力濤(三元素姓名的兩元素變形)。王佩也稱為老王(老),小王(小)和王佩(兩元素全名)。由此,初始語法包括總共12個項。
[0035]在使用時,用戶12可能會說“撥叫老王”。這被語音識別元件14接收并轉(zhuǎn)換成文本。將該文本提供給智能姓名發(fā)號管理器16。智能姓名撥號管理器16將姓名“老王”轉(zhuǎn)發(fā)到用戶模型18中的語法。用戶模型18返回三個可能撥叫的姓名(王大文,王力濤,王佩)。將這三個可能的姓名匹配提供給用戶撥叫預(yù)測元件20,該用戶撥叫預(yù)測元件確定用戶必須選擇三種可能之一。將該信息轉(zhuǎn)發(fā)到響應(yīng)生成元件22,該響應(yīng)生成元件22將向用戶12提供選擇三種可能之一進(jìn)行撥叫的通信。對于智能手機(jī)用戶,當(dāng)用戶說出命令“撥叫老王”時,智能手機(jī)將返回示出三個可能的老王選項的屏幕。用戶可以接著說出期望的姓名(王大文)。
[0036]用戶12將選擇三種可能之一(例如,王大文)并接入呼叫。該用戶選擇進(jìn)一步用于更新用戶模型18,即,當(dāng)用戶提到老王時,用戶想要的是王大文。用戶模型18中的語法被更新以使得王大文也被稱為老王,而王大文的其他變形條目(小王條目和大文條目)則從語法中移除。
[0037]當(dāng)用戶12可能說出“撥叫力濤”時進(jìn)行類似的過程。“撥叫力濤”被語音識別元件14接收并轉(zhuǎn)換成文本。將該文本提供給智能姓名撥號管理器16。智能姓名撥號管理器16將姓名“力濤”轉(zhuǎn)發(fā)用戶模型18中的語法。用戶模型18返回要撥叫的姓名(王力濤)。該姓名被提供給用戶撥叫預(yù)測元件20,該用戶撥叫預(yù)測元件確定用戶想要撥叫王力濤。將該信息轉(zhuǎn)發(fā)到響應(yīng)生成元件22,該響應(yīng)生成元件22將向用戶12提供撥叫王力濤的通信。
[0038]該用戶選擇進(jìn)一步用于更新用戶模型18,S卩,當(dāng)用戶提到力濤時,用戶想要的是王力濤。用模型18中的語法被更新,以使得王力濤也被稱為力濤,而王力濤的其他變形條目(小王條目和老王條目)則從語法中移除。
[0039]對于第三個聯(lián)系人,用戶12可說出“撥叫小王”?!皳芙行⊥酢北徽Z音識別元件14接收并轉(zhuǎn)換成文本。該文本被提供給智能姓名撥號管理器16。智能姓名撥號管理器16將姓名“小王”轉(zhuǎn)發(fā)到用戶模型18中的語法。用戶模型18返回?fù)芙械男彰?王佩)。該姓名被提供給用戶撥叫預(yù)測元件20,該用戶撥叫預(yù)測元件確定用戶想要拔叫王佩。該信息被轉(zhuǎn)發(fā)到響應(yīng)生成元件22,該響應(yīng)生成元件22將向用戶12提供撥叫王佩的通信。
[0040]該用戶選擇進(jìn)一步用于更新用戶模型18,S卩,當(dāng)用戶提到小王時,用戶想要的是王佩。用于更新用戶模型的規(guī)則考慮了多個因素,包括用戶何時撥叫姓名,用戶多少次撥叫該姓名,以及使用哪個口頭表述撥叫姓名。最初,用戶模型將覆蓋所有可能的口頭表述,之后,用戶模型將根據(jù)用戶輸入持續(xù)更新。
[0041]如圖2B所示,用戶模型18中的語法被更新以使得王佩也稱為小王,而王佩的其他變形條目(小王條目和王佩條目)則從語法中移除。地址薄中的語法項變?yōu)?
[0042]王大文,老王
[0043]王力濤,力濤
[0044]王佩,小王
[0045]通過自動移除冗余的初始語法項,全部的語法項從11項變?yōu)?項。如果地址薄或聯(lián)系人列表具有特定大小限制,那么這種方式可能具有其它的優(yōu)點。下次,如果用戶說“撥叫老王”,系統(tǒng)將直接去撥叫王大文。
[0046]上面描述的例子也適用于其他語音激活功能,例如從GPS設(shè)備請求路徑,從音樂播放器請求特定音樂家的音樂,或者請求特定流派的音樂。
[0047]圖3中描述了當(dāng)前公開的方法100的特定實施例的流程圖。矩形元件這里表示“過程框”并表示計算機(jī)軟件指令或者指令組。可選地,過程框表示由諸如數(shù)字信號處理電路或者專用集成電路(ASIC)的功能等效電路執(zhí)行的步驟。流程圖并沒有描述任何特定編程語言的句型。而是,流程圖示出了本領(lǐng)域技術(shù)人員需要制造電路或者生成執(zhí)行根據(jù)本發(fā)明需要的處理的計算機(jī)軟件的功能信息。應(yīng)當(dāng)注意,未示出許多例行程序元素,例如初始化循環(huán)和變量以及使用臨時變量。對于本領(lǐng)域技術(shù)人員來說,除非這里指出,所描述的步驟的特定順序僅是示例性的,并且可以在不脫離本發(fā)明精神的條件下進(jìn)行變化。因此,除非另有說明,下面描述的步驟是無序的,也就是說,如果可能,這些步驟可以按任何方便或期望的順序執(zhí)行。
[0048]現(xiàn)在參考圖3,示出提供語音激活姓名撥號服務(wù)的方法的特定實施例。方法100開始于過程框102,其公開了從語音激活操作中使用的姓名的集合提供語法,語法包括姓名和姓名的變形。如過程框104中所示,名字的變形包括由兩元素姓名和三元素姓名構(gòu)成的組中之一的變形。如過程框106中所示,在特定實施例中,姓名是中國方言。
[0049]例如,智能手機(jī)的地址薄中包含下述三個條目:
[0050]WangDaffen 王大文
[0051]WangLiTao 王力濤
[0052]WangPei 王佩
[0053]給定三個姓名王大文、王力濤和王佩,通過包含下述元素的初始用戶模型生成語法:[0054]王大文,老王,小王,大文
[0055]王力濤,老王,小王,力濤
[0056]王佩,老王,小王
[0057]過程框108記載了在語法中將姓名的一個優(yōu)選變形與該姓名相關(guān)聯(lián)。如過程框110所示,在語法中使姓名的一個優(yōu)選變形與該姓名相關(guān)聯(lián)是基于用戶輸入和用戶歷史。用戶12可以說出“撥叫老王”,并且三種可能撥叫的姓名(王大文、王力濤和王佩)被呈現(xiàn)給用戶?;谟脩魵v史和反饋,將姓名的一個優(yōu)選變形關(guān)聯(lián)到姓名。
[0058]過程框112記載了接收姓名的優(yōu)選變形,并使用與變形相關(guān)聯(lián)的姓名來執(zhí)行任務(wù)。過程框114示出,其中的任務(wù)包括與另一個人或者應(yīng)用通信。如過程框116中所示,使用與變形相關(guān)聯(lián)的姓名來執(zhí)行任務(wù)包括:向用戶提供對話框。如過程框118中進(jìn)一步示出的,對話框選自由選擇對話框、撥叫對話框和確認(rèn)對話框構(gòu)成的組。選擇對話框?qū)⑹境雠c請求的聯(lián)系人相匹配的聯(lián)系人列表,并將其呈現(xiàn)給用戶(或者以可視形式,或者以音頻形式),使得用戶從呈現(xiàn)的聯(lián)系人列表中選擇期望的聯(lián)系人。撥號對話框?qū)⑹境稣诤艚械哪莻€人。確認(rèn)對話框?qū)⑹境龊艚羞^誰。參考前述示例,用戶將從三種可能中選擇一種(例如,王大文)并接入呼叫。
[0059]處理繼續(xù)進(jìn)行到過程框126,其公開了修改語法以使得該姓名僅有一個姓名變形。該用戶選擇進(jìn)一步用于更新用戶模型,在用戶提到小王時,用戶想要呼叫的是王佩。用戶模型18中的語法被更新以使得王佩也稱為小王,而王佩的其他變形條目(小王條目和王佩條目)從語法中移除。這導(dǎo)致節(jié)省語法和聯(lián)系人列表使用的存儲空間,以使得額外的聯(lián)系人能夠被力入到現(xiàn)有聯(lián)系人列表。
[0060]VAND是蜂窩電話上使用的最普通的特征之一。上述提供改進(jìn)語音激活功能的方面和裝置增強(qiáng)了系統(tǒng)性能和用戶體驗,使得設(shè)備使用起來更簡單和高效。雖然關(guān)于蜂窩電話對其進(jìn)行描述,應(yīng)認(rèn)識到其他用途(車載電話呼叫,或者使用全球定位(GPS)系統(tǒng),或者根據(jù)特定音樂家從音樂播放器中請求音樂,或者從音樂播放器中請求特定類型的音樂)也能包含在本發(fā)明中。
[0061 ] 對“一個微處理器”和“一個處理器”,或者“所述微處理器”和“所述處理器”的引用,可理解為包括一個或多個可獨立通信和/或在分布式環(huán)境中可通信的微處理器,并且可被配置為通過有線或無線方式與其他處理器通信,其中,這種一個或多個處理器可被配置為在一個或多個處理器控制的設(shè)備上操作,處理器控制的設(shè)備是類似或者不同的設(shè)備。這種“微處理器”或者“處理器”的術(shù)語的使用也因此被理解為包括中央處理單元、算術(shù)邏輯單元、專用集成電路(ASIC)和/或任務(wù)引擎,這些例子被提供用于示例而非限制。
[0062]進(jìn)一步地,對于存儲器的提及,除非另有說明,可包括一個或多個處理器可讀和可接入存儲元件和/或組件,其可以在處理器控制設(shè)備內(nèi)部,處理器控制設(shè)備外部,和/或可使用各種通信協(xié)議通過有線或無線網(wǎng)絡(luò)接入,并且除非另有說明,可被布置為包含外部和內(nèi)部存儲設(shè)備的組合,其中,這些存儲沒備可以基于應(yīng)用連續(xù)和/或分割。相應(yīng)地,對于數(shù)據(jù)庫的提及可理解為包括一個或多個存儲關(guān)聯(lián),其中這種提及可包括商業(yè)上可用的數(shù)據(jù)庫產(chǎn)品(例如,SQL、Informix、Oracle)以及專有數(shù)據(jù)庫,并且還可以包括用于關(guān)聯(lián)存儲器(例如鏈接、隊列、圖形、樹)的其他結(jié)構(gòu),并且這些結(jié)構(gòu)用于示例而非限制。
[0063]對于網(wǎng)絡(luò)的引用,除非另有說明,可包括一個或多個內(nèi)部網(wǎng)和/或因特網(wǎng),以及虛擬網(wǎng)絡(luò)。根據(jù)以上內(nèi)容,這里對微處理器指令或微處理器可執(zhí)行指令的引用可理解為包括可編程硬件。
[0064]除非另有說明,術(shù)語“基本上”的使用可理解為包含準(zhǔn)確的關(guān)系、條件、布置、朝向、和/或其他特性,并且其偏差,如本領(lǐng)域技術(shù)人員理解的,為這種偏差不實質(zhì)上影響公開的方法和系統(tǒng)的程度。
[0065]遍及本公開全文,使用冠詞“a”或者“an”來修飾名詞可理解為僅為了方便,并且包括一個或多于一個修飾的名詞,除非另有說明。
[0066]被描述和/或在附圖另外示出的元件、組件、模塊和/或部分關(guān)聯(lián)、基于其他物品和/或與其通信,可理解為以直接和/或間接方式關(guān)聯(lián)、基于和/或與其通信,除非另有描述。
[0067]雖然關(guān)于其特定實施例描述了方法和系統(tǒng),但這不是限制性的。顯然許多變形和修改根據(jù)上述教導(dǎo)是顯而易見的。本領(lǐng)域技術(shù)人員可做出細(xì)節(jié)、材料和這里描述和示出的組件布置中的許多另外的變化。
[0068]已經(jīng)描述了本發(fā)明的優(yōu)選實施例,然而對于本領(lǐng)域技術(shù)人員來說顯而易見的是可以使用其他包含這些思想的實施例。此外,作為發(fā)明一部分的軟件可以包含在計算機(jī)程序產(chǎn)品中,所述計算機(jī)程序產(chǎn)品包括計算機(jī)可用介質(zhì)。例如,這類計算機(jī)可用介質(zhì)可包括可讀存儲沒備、例如硬盤驅(qū)動設(shè)備、CD-ROM、DVD-ROM,或者其上存儲有計算機(jī)可讀程序代碼段的計算機(jī)磁盤。計算機(jī)可用介質(zhì)也可以包括通信鏈路,光學(xué)、有線或者無線的,其上承載有程序代碼段作為數(shù)字或者模擬信號。相應(yīng)地,認(rèn)為本發(fā)明不應(yīng)限于描述的實施例,而是應(yīng)當(dāng)僅限于所附權(quán)利要求的精神和范疇。
【權(quán)利要求】
1.一種計算機(jī)實現(xiàn)方法,包括: 根據(jù)計算機(jī)化的用戶模型,從語音激活操作中使用的姓名的集合提供語法,所述語法包括所述姓名和所述姓名的變形; 通過計算機(jī)化的姓名管理器,基于至少一個終端用戶輸入在所述語法中將姓名的優(yōu)選的變形與所述姓名相關(guān)聯(lián); 通過所述計算機(jī)化的姓名管理器,基于所述至少一個終端用戶輸入更新所述計算機(jī)化的用戶模型; 在計算機(jī)化的用戶動作預(yù)測器處接收所述姓名的所述優(yōu)選的變形,并且通過所述計算機(jī)化的用戶動作預(yù)測器至少基于所述姓名的所述優(yōu)選的變形確定要執(zhí)行的任務(wù);以及通過計算機(jī)化的響應(yīng)生成器,使用與所述變形相關(guān)聯(lián)的所述姓名來執(zhí)行所述任務(wù)。
2.如權(quán)利要求1所述的方法,進(jìn)一步包括:通過所述計算機(jī)化的姓名管理器修改所述語法,以使得對于所述姓名存在姓名的一個變形。
3.如權(quán)利要求1所述的方法,其中所述任務(wù)包括與另一個人或應(yīng)用通信。
4.如權(quán)利要求1所述的方法,其中所述姓名的變形包括由兩元素姓名和三元素姓名構(gòu)成的組中的一個的變形。
5.如權(quán)利要求1所述的方法,其中通過所述計算機(jī)化的姓名管理器在語法中將姓名的優(yōu)選的變形與所述姓名相關(guān)聯(lián)是基于所述至少一個終端用戶輸入和終端用戶歷史進(jìn)行的。
6.如權(quán)利要求1所述的方法 ,其中所述姓名是中國方言的姓名。
7.如權(quán)利要求1所述的方法,其中通過所述計算機(jī)化的響應(yīng)生成器使用與所述變形相關(guān)聯(lián)的所述姓名執(zhí)行任務(wù)包括:向所述終端用戶提供對話框。
8.如權(quán)利要求7所述的方法,其中所述對話框選自由撥叫對話框、選擇對話框和確認(rèn)對話框構(gòu)成的組。
9.一種非暫時性計算機(jī)可讀存儲介質(zhì),其上具有提供語音激活操作的計算機(jī)可讀代碼,所述介質(zhì)包括其中計算機(jī)系統(tǒng)執(zhí)行以下操作的指令: 根據(jù)用戶模型,從語音激活操作中使用的姓名的集合提供語法,所述語法包括所述姓名和所述姓名的變形; 基于至少一個終端用戶輸入在所述語法中將姓名的優(yōu)選的變形與所述姓名相關(guān)聯(lián); 基于所述至少一個終端用戶輸入來更新所述用戶模型; 接收所述姓名的優(yōu)選的變形; 至少基于所述姓名的優(yōu)選的變形來確定要執(zhí)行的任務(wù);以及 使用與所述變形關(guān)聯(lián)的所述姓名來執(zhí)行所述任務(wù)。
10.如權(quán)利要求9所述的計算機(jī)可讀存儲介質(zhì),進(jìn)一步包括:用于修改所述語法以使得對于所述姓名存在姓名的一個變形的指令。
11.如權(quán)利要求9所述的計算機(jī)可讀存儲介質(zhì),進(jìn)一步包括:其中所述任務(wù)包括與另一個人或應(yīng)用通信的指令。
12.如權(quán)利要求9所述的計算機(jī)可讀存儲介質(zhì),進(jìn)一步包括:其中所述姓名的變形包括由兩元素姓名和三元素姓名構(gòu)成的組中的一個的變形的指令。
13.如權(quán)利要求9所述的計算機(jī)可讀存儲介質(zhì),進(jìn)一步包括:其中在所述語法中將姓名的優(yōu)選的變形與所述姓名相關(guān)聯(lián)是基于所述至少一個終端用戶輸入和終端用戶歷史進(jìn)行的指令。
14.如權(quán)利要求9所述的計算機(jī)可讀存儲介質(zhì),進(jìn)一步包括:其中所述姓名是中國方言的姓名的指令。
15.如權(quán)利要求9所述的計算機(jī)可讀存儲介質(zhì),進(jìn)一步包括:其中使用與所述變形相關(guān)聯(lián)的所述姓名執(zhí)行任務(wù)包括向所述終端用戶提供對話框的指令。
16.如權(quán)利要求15所述的計算機(jī)可讀存儲介質(zhì),進(jìn)一步包括:其中所述對話框選自由撥叫對話框、選擇對話框和確認(rèn)對話框構(gòu)成的組的指令。
17.一種計算機(jī)系統(tǒng),包括: 存儲器; 處理器: 通信接口:以及 耦合所述存儲器、所述處理器和所述通信接口的互聯(lián)機(jī)構(gòu), 其中所述存儲器被編碼有提供語音激活操作的應(yīng)用,當(dāng)在所述處理器上執(zhí)行時,所述應(yīng)用提供用于處理信息的過程,所述過程使得計算機(jī)系統(tǒng)執(zhí)行以下操作:· 根據(jù)用戶模型,從語音激活操作中使用的姓名的集合提供語法,所述語法包括所述姓名和所述姓名的變形; 基于至少一個終端用戶輸入在所述語法中將姓名的優(yōu)選的變形與所述姓名相關(guān)聯(lián); 基于所述至少一個終端用戶輸入來更新所述用戶模型; 接收所述姓名的優(yōu)選的變形; 至少基于所述姓名的優(yōu)選的變形確定要執(zhí)行的任務(wù);以及 使用與所述變形相關(guān)聯(lián)的所述姓名來執(zhí)行所述任務(wù)。
18.如權(quán)利要求17所述的計算機(jī)系統(tǒng),其中所述處理器包括:用于接收來自所述終端用戶的輸入的話音識別元件、與所述話音識別元件通信的智能姓名撥號管理器、與所述智能姓名撥號管理器通信的所述用戶模型、與所述智能姓名撥號管理器通信的用戶動作預(yù)測模塊、以及與所述用戶動作預(yù)測模塊通信并向所述終端用戶提供輸出的響應(yīng)生成模塊。
19.如權(quán)利要求17所述的計算機(jī)系統(tǒng),其中修改所述語法以使得對于所述姓名存在姓名的一個變形。
20.如權(quán)利要求17所述的計算機(jī)系統(tǒng),其中在所述語法中將姓名的優(yōu)選的變形與所述姓名相關(guān)聯(lián)是基于所述至少一個終端用戶輸入和終端用戶歷史進(jìn)行的。
【文檔編號】G06F19/00GK103428363SQ201310343590
【公開日】2013年12月4日 申請日期:2013年5月8日 優(yōu)先權(quán)日:2012年5月8日
【發(fā)明者】張亞昕, 鮑晴峰 申請人:紐昂斯通訊公司