音識(shí)別。然而,應(yīng)當(dāng)理解,也能夠在例如服務(wù)器的遠(yuǎn)程計(jì)算設(shè)備處完整地或部分地執(zhí)行自動(dòng)話音識(shí)。例如,計(jì)算設(shè)備能夠經(jīng)由網(wǎng)絡(luò)向遠(yuǎn)程服務(wù)器發(fā)送話音輸入和期望語(yǔ)言,并且計(jì)算設(shè)備然后能夠經(jīng)由網(wǎng)絡(luò)從遠(yuǎn)程服務(wù)器接收一個(gè)或更多個(gè)識(shí)別的字符。該技術(shù)也能夠在計(jì)算設(shè)備處輸出一個(gè)或更多個(gè)識(shí)別的字符。
[0036]現(xiàn)在參考圖1,示出了與示例計(jì)算設(shè)備100的用戶交互。雖然示出移動(dòng)電話,但應(yīng)當(dāng)理解,如本文中所使用的術(shù)語(yǔ)“計(jì)算設(shè)備”能夠指包括一個(gè)或更多個(gè)處理器的任何合適的計(jì)算設(shè)備(臺(tái)式計(jì)算機(jī)、膝上型計(jì)算機(jī)、平板計(jì)算機(jī)等)。如所示出的,用戶104能夠與計(jì)算設(shè)備100的觸摸顯示器108交互。觸摸顯示器108能夠被配置成接收來(lái)自用戶104的信息和/或向用戶104輸出信息。雖然在這里示出和描述了觸摸顯示器108,應(yīng)當(dāng)理解也可以實(shí)現(xiàn)被配置成接收和/或輸出信息的其它合適的用戶接口,例如物理鍵盤。觸摸顯示器108能夠輸出用戶接口 112。用戶104能夠觀看用戶接口 112并且能夠關(guān)于用戶接口 112經(jīng)由觸摸顯示器108提供輸入。
[0037]如所示出的,用戶接口 112能夠包括虛擬鍵盤。虛擬鍵盤能夠包括能夠被選擇以啟用自動(dòng)話音識(shí)別的部分116。例如,部分116可以是虛擬鍵盤的按鈕或麥克風(fēng)鍵。用戶104能夠通過關(guān)于觸摸顯示器108在部分116的位置處提供斑點(diǎn)輸入來(lái)選擇用戶接口 112的部分116。如本文中所使用的術(shù)語(yǔ)“斑點(diǎn)輸入”能夠指觸摸顯示器108的位置處的單觸摸輸入。由于用戶104使用手指120,該單觸摸輸入可以被接收為“斑點(diǎn)”而不是單個(gè)點(diǎn)(singlepoint)。相比之下,如本文中所使用的術(shù)語(yǔ)“滑動(dòng)輸入”能夠指觸摸顯示器108處的從斑點(diǎn)輸入的位置到另一位置的滑動(dòng)觸摸輸入。通常,在對(duì)部分116進(jìn)行選擇以啟用自動(dòng)話音識(shí)別之后,用戶104然后能夠提供話音輸入,計(jì)算設(shè)備100能夠經(jīng)由麥克風(fēng)(未示出)接收該話音輸入。
[0038]現(xiàn)在參考圖2,示出了示例計(jì)算設(shè)備100的功能框圖。計(jì)算設(shè)備100能夠包括觸摸顯示器108、麥克風(fēng)200、處理器204、存儲(chǔ)器208、話音識(shí)別控制模塊212以及通信設(shè)備216。應(yīng)當(dāng)理解,如本文中所使用的術(shù)語(yǔ)“處理器”能夠指以并行或分布架構(gòu)運(yùn)行的兩個(gè)或更多個(gè)處理器。處理器204也能夠完整地或部分地執(zhí)行話音識(shí)別控制模塊212。另外,雖然僅示出麥克風(fēng)200,但應(yīng)當(dāng)理解計(jì)算設(shè)備100能夠包括用于捕獲和/或過濾來(lái)自用戶104的話音輸入的其它合適的部件。
[0039]麥克風(fēng)200能夠被配置成接收音頻信息。具體地,麥克風(fēng)200能夠接收來(lái)自用戶104的話音輸入。麥克風(fēng)200能夠是將話音輸入轉(zhuǎn)換成計(jì)算設(shè)備100能夠使用的電信號(hào)的任何合適的聲電麥克風(fēng)(電磁的或動(dòng)態(tài)的麥克風(fēng)、電容麥克風(fēng)或電容傳聲器等)。應(yīng)當(dāng)理解,雖然示出麥克風(fēng)200被集成為計(jì)算設(shè)備100的一部分,但麥克風(fēng)200也能夠是經(jīng)由例如通用串行總線(USB)線纜的合適的通信線纜或經(jīng)由無(wú)線通信信道連接至計(jì)算設(shè)備100的外圍設(shè)備。
[0040]處理器204能夠控制計(jì)算設(shè)備100的操作。處理器204能夠進(jìn)行如下的功能:包括但不限于加載并執(zhí)行計(jì)算設(shè)備100的操作系統(tǒng)、處理接收自觸摸顯示器108的信息和/或控制經(jīng)由觸摸顯示器108的信息輸出、處理經(jīng)由麥克風(fēng)200接收的信息、控制存儲(chǔ)器208處的存儲(chǔ)/檢索操作和/或控制經(jīng)由通信設(shè)備216進(jìn)行的例如與服務(wù)器220的通信。如先前提到的,處理器204也能夠例如經(jīng)由話音識(shí)別控制模塊212來(lái)完整地或部分地執(zhí)行本公開內(nèi)容的技術(shù)。存儲(chǔ)器208能夠是被配置成在計(jì)算設(shè)備100處存儲(chǔ)信息的任何合適的存儲(chǔ)介質(zhì)(閃存、硬盤等)。
[0041]話音識(shí)別控制模塊212能夠控制計(jì)算設(shè)備100的自動(dòng)話音識(shí)別。在啟用了自動(dòng)話音識(shí)別的情況下,話音識(shí)別控制模塊212能夠?qū)⒂甥溈孙L(fēng)200捕獲的話音輸入轉(zhuǎn)換成一個(gè)或更多個(gè)識(shí)別的字符。話音識(shí)別控制模塊212能夠經(jīng)由觸摸顯示器108接收來(lái)自用戶104的控制參數(shù)和/或能夠從存儲(chǔ)器208檢索控制參數(shù)。例如,控制參數(shù)能夠包括用于(在計(jì)算設(shè)備100處或在服務(wù)器220處)進(jìn)行自動(dòng)話音識(shí)別(在下面描述)的期望語(yǔ)言。話音識(shí)別控制模塊212也能夠執(zhí)行本公開內(nèi)容的技術(shù)(在下面詳細(xì)描述)。
[0042]應(yīng)當(dāng)理解,話音識(shí)別控制模塊212也能夠使用通信設(shè)備216獲得來(lái)自服務(wù)器220的一個(gè)或更多個(gè)識(shí)別的字符,服務(wù)器220位于遠(yuǎn)離計(jì)算設(shè)備100的位置,例如在網(wǎng)絡(luò)(未示出)上。通信設(shè)備216能夠包括用于在計(jì)算設(shè)備100和服務(wù)器220之間通信的任何合適的部件。例如,通信設(shè)備216可以包括用于經(jīng)由網(wǎng)絡(luò)(局域網(wǎng)(LAN)、例如因特網(wǎng)的廣域網(wǎng)(WAN)、它們的組合等)來(lái)通信的收發(fā)器。更具體地,服務(wù)器220能夠進(jìn)行使用期望語(yǔ)言的話音輸入的自動(dòng)話音識(shí)別以獲得一個(gè)或更多個(gè)識(shí)別的字符,然后能夠向計(jì)算設(shè)備100提供一個(gè)或更多個(gè)識(shí)別的字符。例如,計(jì)算設(shè)備100能夠向服務(wù)器220發(fā)送話音輸入和期望語(yǔ)言以及進(jìn)行自動(dòng)話音識(shí)別的請(qǐng)求,并且計(jì)算設(shè)備100然后能夠接收一個(gè)或更多個(gè)識(shí)別的字符作為響應(yīng)。
[0043]現(xiàn)在參考圖3,示出了示例話音識(shí)別控制模塊212的功能框圖。話音識(shí)別控制模塊212能夠包括輸入確定模塊300、用戶接口控制模塊304、語(yǔ)言選擇模塊308和話音處理模塊312。如先前提到的,處理器204能夠完整地或部分地執(zhí)行話音識(shí)別控制模塊212和它的子模塊。
[0044]輸入確定模塊300能夠確定例如由用戶104經(jīng)由觸摸顯示器108向計(jì)算設(shè)備100的輸入。輸入確定模塊300能夠先確定是否經(jīng)由觸摸顯示器108接收到了指示向計(jì)算設(shè)備100提供話音輸入的請(qǐng)求的斑點(diǎn)輸入。例如,斑點(diǎn)輸入能夠是在用戶接口 112的部分116(見圖1)處。在已接收到提供話音輸入的請(qǐng)求時(shí),輸入確定模塊300能夠通知用戶接口控制模塊 304。
[0045]在一些實(shí)現(xiàn)方式中,用戶104能夠經(jīng)由觸摸顯示器108提供輸入以設(shè)置用于自動(dòng)話音識(shí)別的各種參數(shù)。這些參數(shù)能夠包括但不限于能夠被選擇的多種語(yǔ)言、與多種語(yǔ)言中的每種語(yǔ)言相關(guān)聯(lián)的滑動(dòng)輸入的距離和/或方向范圍以及彈出窗口出現(xiàn)之前的時(shí)間。(在下面詳細(xì)描述)。然而,可以自動(dòng)地確定這些參數(shù)中的一些參數(shù)。僅作為示例,基于用戶104在計(jì)算設(shè)備100處的過去的計(jì)算行為能夠自動(dòng)地確定能夠被選擇的多種語(yǔ)言。
[0046]根據(jù)實(shí)現(xiàn)方式和各種參數(shù),用戶接口控制模塊304然后可以調(diào)整在觸摸顯示器108處顯示的用戶接口(見圖4A-4B)。僅作為示例,用戶接口控制模塊304可以在觸摸顯示器108處提供彈出窗口以用于用戶104選擇用于自動(dòng)話音識(shí)別的語(yǔ)言。因此,輸入確定模塊300然后能夠確定在觸摸顯示器108處例如從用戶104接收到什么附加輸入。此外,根據(jù)用戶接口控制模塊304提供的配置,附加輸入能夠包括例如在彈出窗口處的跟在斑點(diǎn)輸入之后的滑動(dòng)輸入或附加斑點(diǎn)輸入。輸入確定模塊300然后能夠向語(yǔ)言選擇模塊308通知接收到的附加輸入。
[0047]語(yǔ)言選擇模塊308然后能夠基于接收到的附加輸入選擇要用于自動(dòng)話音識(shí)別的多種語(yǔ)言中的一種語(yǔ)言。在確定哪種語(yǔ)言與附加輸入相關(guān)聯(lián)的過程中,語(yǔ)言選擇模塊308可以與用戶接口控制模塊304通信。語(yǔ)言選擇模塊308然后能夠向話音處理模塊312通知所選擇的語(yǔ)言。話音處理模塊312然后能夠啟用麥克風(fēng)200以接收所請(qǐng)求的話音輸入。例如,話音處理模塊312也能夠經(jīng)由觸摸顯示器108來(lái)向用戶104提供通知以開始接收話音輸入。
[0048]麥克風(fēng)200能夠捕獲例如來(lái)自用戶104的話音輸入,并且將話音輸入傳遞給話音處理模塊312。話音處理模塊312然后能夠基于所選擇的語(yǔ)言進(jìn)行話音輸入的自動(dòng)話音識(shí)別以獲得一個(gè)或更多個(gè)識(shí)別的字符。話音處理模塊312能夠使用任何合適的自動(dòng)話音識(shí)別處理技術(shù)。例如,如先前討論的,在服務(wù)器220執(zhí)行了使用期望語(yǔ)言的話音輸入的自動(dòng)話音識(shí)別以獲得一個(gè)或更多個(gè)識(shí)別的字符的情況下,話音處理模塊312能夠使用通信設(shè)備216從自服務(wù)器220獲得一個(gè)或更多個(gè)識(shí)別的字符。話音處理模塊312然后能夠向觸摸顯示器108輸出一個(gè)或更多個(gè)識(shí)別的字符。例如,用戶104然后能夠在計(jì)算設(shè)備100處使用一個(gè)或更多個(gè)識(shí)別的字符來(lái)執(zhí)行各種任務(wù)(文本消息發(fā)送、發(fā)電子郵件、萬(wàn)維網(wǎng)瀏覽等)。
[0049]現(xiàn)在參考圖4A-4B,示出了示例用戶接口 400和用戶接口 450。例如,用戶接口 400和/或用戶接口 450能夠在觸摸顯示器108處(見圖1)作為用戶接口 112顯示給用戶104。用戶104然后能夠在觸摸顯示器108處關(guān)于用戶接口 400和/或用戶接口 450提供輸入以選擇用于自動(dòng)話音識(shí)別的期望語(yǔ)言。應(yīng)當(dāng)理解,用戶接口 400和用戶接口 450以及它們的對(duì)應(yīng)的語(yǔ)言是用于說(shuō)明性和解釋性目的,并且可以實(shí)現(xiàn)例如關(guān)于不同的虛擬鍵盤配置