專利名稱:移動終端及其菜單控制方法
技術(shù)領(lǐng)域:
本發(fā)明涉及移動終端,以及相應(yīng)的基于語音命令和該移動終端上先前執(zhí)行 的操作在該移動終端上執(zhí)行操作的方法。相關(guān)技術(shù)的描述除基本的通話服務(wù)外,現(xiàn)在移動終端還提供很多附加服務(wù)。例如,用戶 現(xiàn)在可訪問因特網(wǎng)、玩游戲、觀看視頻、聽音樂、捕捉圖像和視頻、記錄音頻 文件等。移動終端現(xiàn)在還提供廣播節(jié)目,使得用戶可觀看電視節(jié)目、體育節(jié) 目、視頻等。因此,移動終端包括復(fù)雜的圖形用戶界面或GUI,用戶可使用它來訪問終 端上的各種功能。例如,用戶可訪問主菜單,然后選擇諸如電子郵件子菜單、 呼叫歷史子菜單、互聯(lián)網(wǎng)接入子菜單、圖片子菜單等多個(gè)子菜單中的一個(gè)。一 旦用戶選擇具體子菜單,移動終端提供用戶可選擇的又一個(gè)子菜單或選項(xiàng)列 表,以執(zhí)行期望功能。然而,將菜單系統(tǒng)形成為樹形圖,以使用戶必需執(zhí)行數(shù)個(gè)中間功能以便于 選擇期望的最終功能。另外,因?yàn)榻K端的尺寸小,所以菜單選項(xiàng)的尺寸也小, 且難以看見。當(dāng)終端包括觸摸屏顯示器時(shí)觸摸具體菜單選項(xiàng)也經(jīng)常導(dǎo)致用戶同 時(shí)觸摸一個(gè)以上的菜單項(xiàng)(因?yàn)椴藛雾?xiàng)密集地顯示在一起)或用戶觸摸差錯(cuò)的菜 單項(xiàng)。發(fā)明內(nèi)容因此,本發(fā)明的一個(gè)目的是解決以上指出的問題及其它問題。 本發(fā)明的另一個(gè)目的是提供一種移動終端,以及相應(yīng)的識別語音指令的含 義并基于所識別的語音指令控制終端的方法。本發(fā)明的又一個(gè)目的是提供一種移動終端,以及相應(yīng)的基于所識別的語音 指令提供一個(gè)或多個(gè)菜單以操作終端的不同功能的方法。為了實(shí)現(xiàn)這些或其它優(yōu)點(diǎn)并根據(jù)本發(fā)明的目的,如本文具體表達(dá)并廣泛描 述的,在一個(gè)方面上,本發(fā)明提供了一種移動終端,包括輸入單元,其被配 置成接收用于激活移動終端上的語音識別功能的輸入;存儲器,其被配置成存儲與移動終端上執(zhí)行的操作有關(guān)的信息;以及控制器,其被配置成在接收到用于激活語音識別功能的輸入時(shí)激活語音識別功能,以基于移動終端上執(zhí)行的至 少一個(gè)先前的操作和包括在語音指令中的語言來確定輸入語音指令的含義,以 及基于移動終端上執(zhí)行的至少一個(gè)先前操作和包括在語音指令中的語言并基 于輸入語音指令的所確定含義匹配與移動終端的操作有關(guān)的信息的概率,來提 供與輸入語音指令的所確定含義有關(guān)的操作。在另一個(gè)方面中,本發(fā)明提供了一種控制移動終端的方法,其包括接收 用于激活移動終端上的語音識別功能的輸入;在接收用于激活語音識別功能的 輸入之后激活語音識別功能;以及基于移動終端上執(zhí)行的至少一個(gè)先前操作和 包括在語音指令中的語言,并基于輸入語音指令的所確定含義匹配與移動終端 的操作有關(guān)的信息的概率,來提供與輸入語音指令的所確定含義有關(guān)的操作。本發(fā)明的適用性的進(jìn)一步的范圍將在下文給出的詳細(xì)描述中變得顯而易 見。然而,應(yīng)當(dāng)理解,詳細(xì)描述和特定例子盡管指示了本發(fā)明的較佳實(shí)施例但 僅作為說明給出,因?yàn)樵诒景l(fā)明的精神和范圍內(nèi)的各種變化和修改對本領(lǐng)域的 技術(shù)人員來說在閱讀詳細(xì)描述之后是顯而易見的。附圖簡要說明從下文給出的詳細(xì)描述和附圖中將更全面地理解本發(fā)明,該詳細(xì)描述和附 圖僅作為例示給出,因此不是對本發(fā)明的限制,在附圖中
圖1是根據(jù)本發(fā)明的實(shí)施例的移動終端的框圖; 圖2是根據(jù)本發(fā)明的實(shí)施例的移動終端的前側(cè)立體圖; 圖3是圖2中所示的移動終端的后側(cè)立體圖;圖4是根據(jù)本發(fā)明的實(shí)施例的可與圖1-3中的移動終端一起操作的無線通 信系統(tǒng)的框圖;圖5是示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的控制移動終端的方法的流程圖;圖6(a)至6(c)是示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于選擇激活移動終端的 語音識別功能的方法的顯示屏的概觀;圖7A是示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的移動終端的語音識別方法的流程圖;圖7B是根據(jù)本發(fā)明的另一個(gè)實(shí)施例的包括基于移動終端的語音識別率顯 示的菜單的顯示屏的概觀;圖7C是示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的移動終端的語音識別方法的顯示 屏的概觀;圖7D是示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的移動終端的語音識別方法的顯示 屏的概觀;圖8是示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的在移動終端的語音識別方法中使用 的數(shù)據(jù)庫系統(tǒng)的框圖;以及圖9是示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的顯示通知用戶移動終端中正在執(zhí)行 語音指令的消息的顯示屏的概觀。
具體實(shí)施方式
下面將詳細(xì)參考本發(fā)明的較佳實(shí)施方式,其示例在附圖中例示。 圖1是根據(jù)本發(fā)明的實(shí)施例的移動終端100的框圖。如圖所示,移動終端 100包括無線通信單元110,該無線通信單元110具有允許在移動終端100與該移動終端所在的無線通信系統(tǒng)或網(wǎng)絡(luò)之間進(jìn)行無線通信的一個(gè)或多個(gè)組件。例如,無線通信單元110包括經(jīng)由廣播頻道從外部廣播管理實(shí)體接收廣播信號和/或廣播關(guān)聯(lián)信息的廣播接收模塊111。廣播頻道可包括衛(wèi)星頻道和地面 頻道。此外,廣播管理實(shí)體通常是指發(fā)送廣播信號和/或廣播關(guān)聯(lián)信息的系統(tǒng)。廣 播關(guān)聯(lián)信息的示例包括與廣播頻道、廣播節(jié)目、廣播服務(wù)提供商等相關(guān)聯(lián)的信息。例如,廣播關(guān)聯(lián)信息可包括數(shù)字多媒體廣播(DMB)的電子節(jié)目指南 (EPG)和手持?jǐn)?shù)字視頻廣播(DVB-H)的電子服務(wù)指南(ESG)。 此外,廣播信號可被實(shí)現(xiàn)為TV廣播信號、無線電廣播信號以及數(shù)據(jù)廣播信號等。廣播信號還可包括與TV或無線電廣播信號組合的廣播信號。廣播接收模塊111還被配置成接收從各種類型廣播系統(tǒng)發(fā)送的廣播信號。例如,這種廣播系統(tǒng)包括地面數(shù)字多媒體廣播(DMB-T)、衛(wèi)星數(shù)字多媒體廣 播(DMB-S)、手持?jǐn)?shù)字視頻廣播(DVB-H)系統(tǒng)、稱為媒體單一前向鏈路 (MediaFLO )的數(shù)據(jù)廣播系統(tǒng)和地面綜合業(yè)務(wù)數(shù)字廣播(ISDB-T)等。接收 多播信號也是有可能的。此外,由廣播接收模塊lll接收的數(shù)據(jù)可被存儲在諸 如存儲器160的合適設(shè)備中。無線通信單元UO還包括移動通信模塊112,它向一個(gè)或多個(gè)網(wǎng)絡(luò)實(shí)體(例 如基站、節(jié)點(diǎn)-B)發(fā)送無線信號或從其接收無線信號。這些信號可表示音頻、 視頻、多媒體、控制信令和數(shù)據(jù)等。還包括的是無線因特網(wǎng)模塊113,它支持移動終端的因特網(wǎng)接入。該模塊 113可內(nèi)置或外置地耦合到終端上。無線通信單元110還包括短距離通信模塊 114,其有助于相對較短距離的通信。實(shí)現(xiàn)該模塊的合適技術(shù)包括例如在網(wǎng)絡(luò) 技術(shù)中通常稱為藍(lán)牙和ZigBee的射頻標(biāo)識(RFID)、紅外數(shù)據(jù)關(guān)聯(lián)(IrDA) 以及超寬帶(UWB),謹(jǐn)此略舉幾例。定位模塊115也被包括在無線通信單元110中,并標(biāo)識或以其它方式獲得 移動終端100的位置。該定位模塊115可用與相關(guān)聯(lián)的衛(wèi)星、網(wǎng)絡(luò)組件及其 組合協(xié)作的全球定位系統(tǒng)(GPS)組件實(shí)現(xiàn)。此外,如圖1所示,移動終端100還包括音頻/視頻(A/V)輸入單元120, 它向移動終端IOO提供音頻或視頻信號。如圖所示,A/V輸入單元120包括 相機(jī)121和話筒122。 相機(jī)121接收并處理靜止圖片或視頻的圖像幀。此外,在便攜式設(shè)備處于諸如電話呼叫模式、記錄模式和語音識別模式之 類的特定模式下時(shí),話筒122接收外部音頻信號。所接收的音頻信號然后被處 理并轉(zhuǎn)換成數(shù)字?jǐn)?shù)據(jù)。同樣,該便攜式設(shè)備,尤其是A/V輸入單元120,通常 包括用于去除在接收外部音頻信號過程中生成的噪聲的混雜噪聲去除算法。 此外,由A/V輸入單元120生成的數(shù)據(jù)可存儲在存儲器160中、由輸出單元 150使用、或者經(jīng)由通信單元110的一個(gè)或多個(gè)模塊發(fā)送。如果需要的話, 可使用兩個(gè)或更多話筒和/或相機(jī)。移動終端IOO還包括用戶輸入單元130,它響應(yīng)于用戶對一個(gè)或多個(gè)關(guān)聯(lián)輸9入設(shè)備的操縱而生成輸入數(shù)據(jù)。這種設(shè)備的示例包括鍵盤、按鍵開關(guān)、觸摸板 (例如靜態(tài)壓力/電容)、轉(zhuǎn)動輪和轉(zhuǎn)動開關(guān)。具體示例是用戶輸入單元130被 配置成與觸摸屏顯示器協(xié)作的觸摸板的終端,這將在以下更詳細(xì)描述。感測單元140也被包括在移動終端100中,并提供對移動終端100的各個(gè) 方面的狀態(tài)測量。例如,感測單元140可檢測移動終端100的開/關(guān)狀態(tài)、移 動終端100的組件(例如顯示器和鍵區(qū))的相對定位、移動終端100或移動終 端100的組件的位置變化、用戶與移動終端IOO接觸與否、移動終端100的取 向或加速/減速等。作為示例,當(dāng)移動終端100是滑蓋型移動終端時(shí),感測單元140可感測移 動終端100的滑動部分是打開還是關(guān)閉。其它示例包括感測單元140感測電源 190是否提供功率、接口單元170和外部設(shè)備之間是否存在耦合或其它連接。此外,接口單元170往往實(shí)現(xiàn)成將移動終端與外部設(shè)備耦合。典型的外部 設(shè)備包括有線/無線頭戴受話機(jī)、外部充電器、電源、用于存儲數(shù)據(jù)(例如音頻、 視頻、圖片等)的存儲設(shè)備、耳機(jī)和話筒等。此外,接口單元170可用有線/ 無線數(shù)據(jù)端口、卡插槽(例如,用于耦合到儲存卡、客戶識別模塊(SIM)卡、 用戶識別模塊(UIM)卡、可移動用戶識別模塊(RUIM)卡等)、音頻輸入/ 輸出端口和視頻輸入/輸出端口 。輸出單元150通常包括支持移動終端100輸出要求的各種組件。移動終 端100還包括顯示器151,它以可視方式顯示與移動終端100相關(guān)聯(lián)的信息。 例如,如果移動終端IOO運(yùn)行于電話呼叫模式,則顯示器151通常提供包括與 呼出、進(jìn)行和終止電話呼叫相關(guān)聯(lián)的信息的用戶界面或圖形用戶界面。作為另 一示例,如果移動終端100處于視頻呼叫模式或照相模式下,則顯示器151可 附加地或替代地顯示與這些模式相關(guān)聯(lián)的圖像。此外,顯示器151較佳地還包括與諸如觸摸板之類的輸入設(shè)備協(xié)同工作的 觸摸屏。該配置允許顯示器151同時(shí)充當(dāng)輸出設(shè)備和輸入設(shè)備。此外,顯示器 151可用包括例如液晶顯示器(LCD)、薄膜晶體管液晶顯示器(TFT-LCD)、 有機(jī)發(fā)光二極管顯示器(OLED)、柔性顯示器和三維顯示器的顯示技術(shù)實(shí)現(xiàn)。移動終端100還可包括一個(gè)或多個(gè)這樣的顯示器。雙顯示器實(shí)施例的示例 是一個(gè)顯示器被配置成內(nèi)部顯示器(當(dāng)終端處于打開位置時(shí)可以查看)以及第二顯示器被配置成外部顯示器(在打開和關(guān)閉位置都可以査看)。圖1還示出具有支持移動終端100的音頻輸出需要的音頻輸出模塊152的 輸出單元150。 音頻輸出模塊152通常用一個(gè)或多個(gè)揚(yáng)聲器、蜂鳴器、其它 音頻產(chǎn)生設(shè)備及其組合來實(shí)現(xiàn)。此外,音頻輸出模塊152可在包括呼叫接收模式、呼叫進(jìn)行模式、記錄模 式、語音識別模式和廣播接收模式在內(nèi)的各種模式中運(yùn)行。在運(yùn)行過程中,音 頻輸出模塊152輸出與特定功能(例如,呼叫接收、消息接收和差錯(cuò))相關(guān)的 音頻。此外,圖中的輸出單元150還具有用于發(fā)出信號或以其它方式標(biāo)識發(fā)生了 與移動終端100相關(guān)聯(lián)的特定事件的警報(bào)器153。 典型事件包括收到呼叫、 收到消息和收到用戶輸入。這種輸出的示例包括向用戶提供觸覺感知(例如振 動)。例如,警報(bào)器153可被配置成響應(yīng)于移動終端100接收到呼叫或消息而 振動。作為另一示例,可由警報(bào)器153響應(yīng)于在移動終端100處收到用戶輸入而 提供振動,因而提供一種觸覺反饋機(jī)制。另外,由輸出單元150的組件提供的 各種輸出可獨(dú)立實(shí)現(xiàn),或者這種輸出可用這些組件的任意組合實(shí)現(xiàn)。此外,存儲器160 —般被用于存儲各種類型的數(shù)據(jù)以支持移動終端100的 處理、控制和存儲需要。這些數(shù)據(jù)的示例包括在移動終端100上操作的應(yīng)用 程序的程序指令、呼叫歷史、聯(lián)系人數(shù)據(jù)、電話簿數(shù)據(jù)、消息、圖片、視頻等。此外,在圖1中示出的存儲器160可用任何類型(或組合)的合適易失性 和非易失性存儲器或存儲設(shè)備來實(shí)現(xiàn),包括隨機(jī)存取存儲器(RAM)、靜態(tài)隨 機(jī)存取存儲器(SRAM)、電可擦可編程只讀存儲器(EEPROM)、可擦可編程 只讀存儲器(EPROM)、可編程只讀存儲器(PROM)、只讀存儲器(ROM)、 磁性存儲器、閃存、磁盤或光盤、卡式存儲器、或其它類似存儲器或數(shù)據(jù)存儲 設(shè)備。終端100還包括控制器180,它通??刂埔苿咏K端100的總體操作。例如, 控制器進(jìn)行與語音呼叫、數(shù)據(jù)通信、即時(shí)消息通信、視頻呼叫、相機(jī)操作和記 錄操作相關(guān)聯(lián)的控制和處理。如圖1所示,控制器180可包括提供多媒體回放 功能的多媒體模塊181。多媒體模塊181可被配置成控制器180的一部分,或者該模塊可被實(shí)現(xiàn)為獨(dú)立組件。
此外,電源190提供便攜式設(shè)備的各個(gè)組件所需的電力。所提供電力可以 是內(nèi)部電力、外部電力或其組合。
接下來,圖2是根據(jù)本發(fā)明的實(shí)施例的移動終端100的前側(cè)視圖。如圖2 所示,移動終端100包括配置成與第二機(jī)身205滑動配合的第一機(jī)身200。圖 1中的用戶輸入單元130可包括諸如功能鍵210之類的第一輸入單元和諸如鍵 區(qū)215之類的第二輸入單元以及諸如側(cè)鍵245之類的第三輸入單元。
功能鍵210與第一機(jī)身200相關(guān)聯(lián),而鍵區(qū)215與第二機(jī)身205相關(guān)聯(lián)。鍵 區(qū)包括使用戶能夠呼出電話、準(zhǔn)備文本或多媒體消息、或以其它方式操作移動 終端100的各種鍵(例如數(shù)字、字符和符號)。
此外,第一機(jī)身200相對于第二機(jī)身205在打開和關(guān)閉位置之間滑動。在 關(guān)閉位置時(shí),第一機(jī)身200以這種方式在第二機(jī)身205上定位鍵區(qū)215基本 上或完全被第一機(jī)身200遮蔽。在打開位置時(shí),用戶訪問鍵區(qū)215以及顯示 器151和功能鍵210成為可能。功能鍵方便用戶輸入諸如開始、停止和滾動的 命令。
此外,移動終端100可在待機(jī)模式(例如,能夠接收呼叫或消息、接收和 響應(yīng)網(wǎng)絡(luò)控制信令)或活動呼叫模式下工作。通常,移動終端100在處于關(guān)閉
位置時(shí)在待機(jī)模式下運(yùn)行,而在打開位置時(shí)在活動模式下運(yùn)行。然而,該模式 配置可按要求或需要更改。
此外,第一機(jī)身200由第一外殼220和第二外殼225形成,而第二機(jī)身205 由第一外殼230和第二外殼235形成。各第一和第二外殼通常由諸如注入成 型塑料之類的適當(dāng)剛性(ridge)材料來形成,或者用諸如不銹鋼(STS)和鈦 (Ti)的金屬材料形成。
如果需要,可在第一和第二機(jī)身200、 205之一或兩者的第一和第二外殼之 間設(shè)置一個(gè)或多個(gè)中間外殼。通常將第一和第二機(jī)身200、 205的大小調(diào)整 成可容納用于支持移動終端100的操作的電子組件。
第一機(jī)身200還包括相機(jī)121和被配置成相對于顯示器151定位的揚(yáng)聲器 的音頻輸出單元152。 相機(jī)121還可以這種方式構(gòu)成它可相對于第一機(jī)身 200選擇性地定位(例如,轉(zhuǎn)動、旋轉(zhuǎn)等)。此外,功能鍵210靠近顯示器151的下側(cè)定位。如上所述,顯示器151 被實(shí)現(xiàn)為LCD或OLED。顯示器151還可被配置成具有響應(yīng)于用戶接觸(例 如,手指、輸入筆等)觸摸屏而生成信號的底層觸摸板的觸摸屏。
第二機(jī)身205還包括與鍵區(qū)215相鄰定位的話筒122和側(cè)鍵245,該側(cè)鍵 245是沿第二機(jī)身205的側(cè)面定位的一類用戶輸入單元。較佳地,側(cè)鍵245 可被配置成熱鍵,使得側(cè)鍵245與移動終端100的特定功能相關(guān)聯(lián)。如圖所 示,接口單元170與側(cè)鍵245相鄰定位,而電池形式的電源190位于第二機(jī)身 205的下部。
圖3是圖2所示移動終端的后側(cè)視圖。如圖3所示,第二機(jī)身205包括 相機(jī)121、以及相關(guān)聯(lián)的閃光燈250和反射鏡255。 閃光燈250結(jié)合第二機(jī) 身205的相機(jī)121操作,反射鏡255用于幫助用戶在自拍模式中定位相機(jī)121。 此外,第二機(jī)身205的相機(jī)121朝向與圖2所示的第一機(jī)身200的相機(jī)121所 朝向的方向相反的方向。
此外,第一和第二機(jī)身的相機(jī)121各自可具有相同或不同的能力。例如, 在一實(shí)施例中,第一機(jī)身200的相機(jī)121以比第二機(jī)身205的相機(jī)121相對較 低的分辨率操作。這一安排在例如其中反向鏈路帶寬能力受到限制的視頻會 議通話期間十分有效。此外,第二機(jī)身205 (圖3)的相機(jī)的相對較高分辨率 對獲取較高質(zhì)量圖片以備后續(xù)使用而言十分有用。
第二機(jī)身205還包括配置成位于第二機(jī)身205上側(cè)的揚(yáng)聲器的音頻輸出模 塊152。第一和第二機(jī)身200、205的音頻輸出模塊還可協(xié)作提供立體聲輸出。 此外,這些音頻輸出模塊的任意一個(gè)或兩者可被配置成充當(dāng)揚(yáng)聲器電話。
終端100還包括廣播信號接收天線260,它位于第二機(jī)身205的上端。天 線260與廣播接收模塊111 (圖1)協(xié)作運(yùn)行。如果需要的話,天線260可 以是固定的,或是配置成縮回第二機(jī)身205中。此外,第一機(jī)身200的背側(cè) 包括與位于第二機(jī)身205前側(cè)的相應(yīng)滑動模塊可滑動地耦合的滑動模塊265。
此外,第一和第二機(jī)身200、 205的各種組件的所示安排可按要求和需要進(jìn) 行更改。通常, 一個(gè)機(jī)身的組件中的一部分或全部能夠可替換地在另一機(jī)身上 實(shí)現(xiàn)。此外,這些組件的位置和相對定位可以定位在不同于代表性附圖所示的 位置上。此外,圖1-3的移動終端100可被配置成在經(jīng)由幀或分組發(fā)送數(shù)據(jù)的通信系 統(tǒng)中操作,包括無線、有線通信系統(tǒng)和基于衛(wèi)星的通信系統(tǒng)。這些通信系統(tǒng)使 用不同的空中接口和/或物理層。
由通信系統(tǒng)使用的這種空中接口的示例包括例如頻分多址(FDMA)、時(shí)分 多址(TDMA)、碼分多址(CDMA)和通用移動電信系統(tǒng)(UMTS)、 UMTS 的長期演進(jìn)(LTE)以及全球移動通信系統(tǒng)(GSM)。僅作為非限制性示例, 進(jìn)一步的描述將涉及CDMA通信系統(tǒng),但是這些教導(dǎo)同樣地適用于其它系統(tǒng) 類型。
接下來,圖4示出具有多個(gè)移動終端100、多個(gè)基站270、多個(gè)基站控制器 (BSC) 275和移動交換中心(MSC) 280的CDMA無線通信系統(tǒng)。 MSC 280配置成與公共交換電話網(wǎng)(PSTN) 290接口,且MSC 280還被 配置成與BSC 275接口。 此外,BSC 275經(jīng)由回程線路耦合到基站270。此 外,回程線路可根據(jù)若干公知接口中的任一種來配置,包括例如E1/T1、 ATM、 IP、 PPP、幀中繼、HDSL、 ADSL、或xDSL。此外,系統(tǒng)可包括兩個(gè)以上的 BSC 275。
每個(gè)基站270還可包括一個(gè)或多個(gè)扇區(qū),每個(gè)扇區(qū)具有全向天線或指向徑 向遠(yuǎn)離基站270的特定方向的天線?;蛘?,每個(gè)扇區(qū)可包括用于分集接收的 兩個(gè)天線。此外,每個(gè)基站270可被配置成支持多個(gè)頻率分配,并且各個(gè)頻率 分配具有特定頻譜(例如,1.25 MHz、 5MHz)。
扇區(qū)和頻率分配的交集被稱為CDMA信道。基站270還可被稱為基站收發(fā) 機(jī)子系統(tǒng)(BTS)。在一些情形中,術(shù)語"基站"可用于通指BSC 275、以及一 個(gè)或多個(gè)基站270。
基站還可表示成"小區(qū)站點(diǎn)(cell site)"?;蛘?,給定基站270的各個(gè)扇區(qū) 可被稱為小區(qū)站點(diǎn)。另外,地面數(shù)字多媒體廣播(DMB)發(fā)射機(jī)295被示為向 工作在該系統(tǒng)中的移動終端100廣播。
此外,移動終端100的廣播接收模塊111 (圖1)通常被配置成接收由DMB 發(fā)射機(jī)295發(fā)射的廣播信號。如上所述,可對其它類型的廣播和多播信令實(shí) 現(xiàn)類似的安排。
圖4還示出了若干全球定位系統(tǒng)(GPS)衛(wèi)星300。這些衛(wèi)星有助于定位一
14部分或者所有移動終端100的位置。在圖4中示出了兩個(gè)衛(wèi)星,但是,可使用 更多或更少的衛(wèi)星來獲取定位信息。
另外,移動終端100的定位模塊115 (圖1)通常被配置成與衛(wèi)星300協(xié)作 以獲得期望的位置信息。然而,或者也可以實(shí)現(xiàn)其它類型的位置檢測技術(shù),比 如可添加到或替代GPS定位技術(shù)的定位技術(shù)。 一部分的或者全部的GPS衛(wèi)星 300可選擇性地或附加地配置成提供衛(wèi)星DMB傳送。
此外,在無線通信系統(tǒng)的典型操作期間,基站270從各個(gè)移動終端100接 收多組反向鏈路信號。移動終端100進(jìn)行呼叫、發(fā)消息、以及其它通信。
另外,在基站270內(nèi)處理由給定基站270接收到的每個(gè)反向鏈路信號,且 所得數(shù)據(jù)被轉(zhuǎn)發(fā)到相關(guān)聯(lián)的BSC 275。 BSC提供呼叫資源分配以及包括基站 270之間的軟切換的移動性管理功能。
此外,BSC 275還將收到的數(shù)據(jù)路由至MSC 280, MSC 280提供附加路由 服務(wù)用于與PSTN 2卯接口 。 類似地,PSTN與MSC 280接口 ,并且MSC 280 與BSC 275接口。 BSC 275還控制基站270,向移動終端100發(fā)送多組前向 鏈路信號。
在以下的描述中,參照各實(shí)施例解釋適用于以上配置的移動終端100的控 制方法。然而,以下的實(shí)施例可單獨(dú)實(shí)現(xiàn)或通過其組合實(shí)現(xiàn)。此外,在以下的 描述中,假設(shè)顯示器151包括觸摸屏。另外,觸摸屏或其屏幕可由附圖標(biāo)記'400' 指示。
圖5是根據(jù)本發(fā)明的實(shí)施例的控制移動終端的方法的框圖。在該描述中還 將參考圖1。如圖所示,控制器180確定何時(shí)激活移動終端的語音識別功能 (SIOI)。當(dāng)語音識別功能被激活時(shí)(SIOI中的是),控制器180接收由用戶輸入 的語音指令(在下文中稱為"語音指令")(S102)。然后,當(dāng)控制器180識別出 語音指令已由用戶輸入(S102中的是)時(shí),控制器180確定所識別語音指令的含 義(S103)。
此外,為了激活本實(shí)施例的語音識別功能,用戶可選擇具體按鈕或觸摸移 動終端中所包括的觸摸屏的具體部分。使用戶物理激活語音識別功能是特別有 利的,因?yàn)橛脩舾芤庾R到他們將要使用語音命令來控制終端。即,因?yàn)橛脩?必需首先執(zhí)行對終端的物理操縱,所以他或她直觀地意識到他們將把語音命令或指令輸入至終端,因此可說得更清楚或更慢從而激活具體功能。
因而,例如,因?yàn)橛脩粽f得更清楚或更慢,所以準(zhǔn)確識別語音指令的概率
增加。即,語音識別功能的激活通過終端上按鈕的物理操縱來執(zhí)行,而不是通
過對終端講話來激活語音識別功能。
此外,控制器180可基于用戶觸摸具體按鈕或觸摸屏的一部分達(dá)多少次、
用戶觸摸具體按鈕或觸摸屏的一部分有多長時(shí)間等來開始或終止語音識別功
能的激活。用戶還可設(shè)置控制器180要如何利用由本發(fā)明提供的適當(dāng)菜單選項(xiàng)
來激活語音識別功能。例如,用戶可選擇終端上的菜單選項(xiàng),包括l)基于語音
激活按鈕被選擇的次數(shù)X設(shè)置語音識別的激活,2)基于語音激活按鈕被選擇的 時(shí)間量X設(shè)置語音識別的激活,3)當(dāng)按鈕X和Y被選擇時(shí)設(shè)置語音識別的激 活等。用戶于是可輸入X和Y的值,以便于可變地設(shè)置控制器180如何確定 語音激活功能被激活。因此,根據(jù)本發(fā)明的實(shí)施例,用戶積極地參與其移動終 端的語音識別功能,這增加了控制器180確定與用戶語音指令相對應(yīng)的正確功 能的概率,這也使得用戶能根據(jù)他或她的需要修改語音激活功能。
控制器180還可在指定的按鈕被觸摸或選擇的同時(shí)維持語音識別功能的激 活狀態(tài),并在指定的按鈕被放開時(shí)停止語音識別功能?;蛘?,控制器180可在 指定按鈕被觸摸或選擇后將語音識別功能的激活維持預(yù)定的時(shí)間段,并在預(yù)定 時(shí)間段結(jié)束時(shí)停止或終止語音識別功能。在又一個(gè)實(shí)施例中,控制器180可將 所接收的語音指令存儲在存儲器160中,同時(shí)將語音識別功能維持為激活狀態(tài)。
此外,控制器180可在語音識別功能被終止后立即確定語音指令的含義, 或可在用戶輸入語音指令時(shí)同時(shí)確定語音指令的含義。此外,為了確定語音指 令的含義,控制器180可分析輸入語音指令中使用的詞、關(guān)鍵詞、句子結(jié)構(gòu)等, 并確定語音指令的內(nèi)容或含義。
此外,控制器180還可在存儲器160的數(shù)據(jù)庫中存儲與設(shè)置在移動終端中 的功能、服務(wù)或菜單有關(guān)的信息,以便于確定語音指令的含義。此外,為了提 高準(zhǔn)確檢測用戶語音指令的概率,可利用學(xué)習(xí)或人工智能法更新數(shù)據(jù)庫中存儲 的信息。先前在移動終端上執(zhí)行的操作還可被存儲在數(shù)據(jù)庫中。例如,用戶可 打開其終端,并且在大多數(shù)時(shí)候在執(zhí)行任何其它操作之前檢査其電子郵件。
因此,控制器180可使用其先前的操作來增加確定用于語音指令的含義的
16概率。用戶在首先打開或開啟其移動終端時(shí)還可輸入相同的語音指令。這些先 前的操作還可與輸入語音指令存儲在一起,并由控制器180用來確定輸入指令 的含義。
因而,終端上執(zhí)行的先前操作包括終端的激活狀態(tài)(例如,在待機(jī)模式期間、 電話呼叫期間、視頻電話呼叫期間、電子郵件會話期間、即時(shí)消息會話期間、 關(guān)閉終端等),還包括先前由用戶輸入的指令。例如,為了聽音樂,用戶可在
先前關(guān)閉終端,然后輸入指令"播放我的音樂"。控制器180然后可利用移動
終端的狀態(tài)(g卩,處于關(guān)閉狀態(tài))來幫助確定用戶輸入的語音指令是什么。
返回到圖5,當(dāng)控制器180利用數(shù)據(jù)庫中的信息確定語音指令的含義時(shí),控 制器180輸出相應(yīng)的結(jié)果值(S104)。 g卩,結(jié)果值可包括用于執(zhí)行與所識別的語 音指令對應(yīng)的功能或用于控制具體元件的控制信號。結(jié)果值還可對應(yīng)于用于顯 示與所識別的指令有關(guān)的一個(gè)或多個(gè)菜單的數(shù)據(jù)信息。
此外,用戶可輸入作為具體菜單的準(zhǔn)確指定的語音指令(例如,圖像捕捉、 語音呼叫、消息傳送等)或利用自然語言(例如,顯示照片、省電等)。同樣,自 然語言指令可以或可以不包括與具體菜單有關(guān)的準(zhǔn)確指定。
此外,自然語言是一般由日常生活中的人使用的話語,它與人工語言(它是 人工創(chuàng)造的)不同,并可利用自然語言處理算法來處理。另外,在圖5中,控 制器180然后確定它是否可識別由用戶輸入的語音指令(S105)。
例如,控制器180可確定它是否能以高于具體閾值(例如80%)的概率識別語 音指令。如果控制器180不能確定滿足具體閾值的語音指令的含義,則控制器 180可執(zhí)行附加的差錯(cuò)處理(S107),然后重復(fù)步驟S103至S105。
然而,如果控制器180可識別滿足具體閾值的語音指令,則控制器180可 有利地顯示滿足具體閾值的多個(gè)菜單(例如,具有高于80%的具體識別率或更 高)(S106)。用戶可在視覺上看到所顯示的菜單,然后選擇所顯示菜單之一。
該特征是特別有利的,因?yàn)橛脩粼俅畏e極地參與到語音識別功能之中。更 具體地,與控制器180不能清楚確定語音指令的含義而向用戶顯示或輸出消息 不同,控制器180有利地輸出準(zhǔn)確概率高于具體閾值(例如80%)的多個(gè)菜單。 例如,如果用戶輸入語音指令"節(jié)省電池",但控制器180只能唯一地確定指 令"節(jié)省"(例如,由于背景噪聲、不良接收等),則控制器180可顯示與關(guān)鍵詞"節(jié)省"有關(guān)的具體菜單或選項(xiàng)。g卩,控制器180可顯示照片菜單、電池菜 單和電子郵件菜單,因?yàn)檫@些菜單各自包括"節(jié)省"功能部件。因此,用戶就 可從多個(gè)所顯示的菜單中選擇適當(dāng)菜單。
此外,如上所述,控制器180可在確定輸入語音指令的含義時(shí)使用終端先 前的操作??刂破?80還可使用終端的物理狀態(tài)來幫助確定輸入語音指令的含 義。例如,在判定輸入語音指令的含義時(shí),控制器180可有利地使用關(guān)于電池 狀態(tài)的信息(例如,低電池狀態(tài))。
此外,作為接收用戶確認(rèn)的類型,可使用消息、語音或菜單的顯示位置或 形式(形狀和大小),且響應(yīng)類型可以是用戶語音、具體按鈕或觸摸輸入。另外, 如上所述,如果輸入語音指令的識別率低于具體閾值,則控制器180可執(zhí)行差 錯(cuò)處理操作(S107)。
另外,在差錯(cuò)處理操作期間,控制器180可從用戶處接收另外的語音指令, 或者如上所討論地,可顯示具有高于一定識別率或概率的多個(gè)菜單。控制器180 還確定高于具體概率的所識別功能或菜單的數(shù)量。如果所識別的具有高于一定 識別率的功能或菜單小于具體數(shù)量(例如,如果僅有一個(gè)功能或一個(gè)菜單),則 控制器180自動執(zhí)行單個(gè)功能或菜單。
接下來,圖6(a)至6(c)是示出根據(jù)本發(fā)明的實(shí)施例的用戶激活移動終端的語 音識別功能的顯示屏。另外,如上所述,本發(fā)明有利地使用戶能基于用戶的物 理操縱確定何時(shí)開始語音激活功能。因而,用戶更清楚其環(huán)境(例如,他是否 在安靜的環(huán)境中講話)、其語音的音調(diào)或音量、他使用的自然語音或其它類型 的語言等。因此,用戶有可能在輸入語音指令時(shí)更加仔細(xì),這導(dǎo)致控制器180 準(zhǔn)確確定語音指令的含義的概率更高。
此外,使用戶能通過觸摸或選擇終端上的按鈕來手動激活語音識別功能的
另一個(gè)優(yōu)點(diǎn)在于降低了電池電量。即,語音識別功能消耗了終端的多個(gè)資源,
且當(dāng)語音識別功能的激活狀態(tài)在待機(jī)狀態(tài)(或空閑狀態(tài))下連續(xù)操作時(shí),終端的 總功率被連續(xù)地消耗。
更具體地,當(dāng)控制器180被配置成經(jīng)由用戶向終端講話(而不是用戶選擇具
體按鈕)來接收用于激活語音識別功能的激活信號時(shí),控制器180必須連續(xù)地
在活動狀態(tài)中操作語音識別功能,并等待用戶開始講話(這將指示語音識別開始)。這種等待用戶語音輸入以開始語音識別功能的連續(xù)操作連續(xù)地減少終端 的可用功率。
因此,為了防止移動終端的功率消耗和資源消耗,控制器180有利地控制
語音識別功能的開始和終止。在一個(gè)例子中,如圖6(a)所示,移動終端的用戶 輸入單元130包括顯示單元151上的軟按鈕350,用戶可觸摸該軟按鈕350來 啟動或停止語音識別功能。另外,軟按鈕可具有按鈕形狀,或可以是具體形狀 的圖標(biāo)。軟按鈕350還可用例如設(shè)置在終端的一側(cè)上的硬按鈕351來替換,如 圖6(a)所示。
在另一個(gè)例子中,如圖6(b)所示,可將顯示單元151的任意部分用于激活 和停用語音識別功能,而不在顯示單元151上顯示按鈕或圖標(biāo)。在又一個(gè)例子 中,如圖6(c)所示,可經(jīng)由移動終端的話筒122輸入具體聲音,以控制語音識 別功能的激活和終止。
更詳細(xì)地,具體聲音可以是具有高于具體聲級的撞擊聲,諸如用戶拍手的 聲音??刂破?80然后利用確定通過話筒122輸入的聲級的算法或電路來檢測 該撞擊聲。即,用于檢測撞擊聲的算法或電路被配置成檢測高于預(yù)先設(shè)定的具 體聲級的聲音,且與語音識別功能相比不消耗移動終端的大量資源或電能。
用戶還可有利地設(shè)置哪些具體的撞擊聲用于激活語音識別功能。例如,用 戶可選擇由本發(fā)明的終端提供的適當(dāng)菜單選項(xiàng),然后拍手兩次或三次以通知控 制器180具體次數(shù)的拍手聲音將用于激活語音識別功能。用戶還可設(shè)置任何其 它的聲音作為用于激活語音識別功能的聲音。
此外,控制器180可以多種模式驅(qū)動語音識別功能。例如,控制器180可
按其中高于具體級別的聲音激活語音識別功能的第一模式和其中接收語音指 令并確定其內(nèi)容或含義的第二模式可分辨地驅(qū)動語音識別功能。目卩,如果高于
具體級別的聲音在第一模式中檢測到,則控制器180執(zhí)行第二模式來激活語音 指令識別功能。
此外,在另一個(gè)實(shí)施例中,控制器180在從用戶處接收肢體信息時(shí)開始激 活語音識別功能。更具體地,肢體信息包括手勢信號或用戶的姿勢??蓪⒏袦y 單元140用于檢測用戶的肢體信息。在另一個(gè)實(shí)施例中,控制器180在利用無 線設(shè)備接收短距離或遙控區(qū)域的無線電信號后開始激活語音識別功能。此外,控制器180可經(jīng)由無線通信單元110接收無線電信號,并通過感測 單元140接收手勢信號或用戶的姿勢。在這些實(shí)施例中,用于接收激活語音識 別功能的信號的無線通信單元110、用戶輸入單元130以及感測單元140可被 統(tǒng)稱為激活信號輸入單元。
此外,如上所述,為了降低移動終端的功耗和資源消耗,控制器180在預(yù) 定時(shí)間段后、在從用戶接收終止信號后等終止或停止語音識別功能。為此目的, 終止信號能以與用于開始激活語音識別功能的方式相同或類似的方式對應(yīng)于 所觸摸或按下的按鈕、觸摸觸摸屏的具體部分、撞擊聲、無線電信號或來自用 戶的肢體信息。
更具體地,控制器180可開始語音識別功能的激活,在具體的時(shí)間段期間 維持語音識別功能的激活狀態(tài),并在具體時(shí)間段結(jié)束時(shí)自動終止語音識別功能 的激活狀態(tài)?;蛘撸刂破?80可在按鈕或觸摸被連續(xù)輸入時(shí)維持語音識別功 能的激活狀態(tài),并在放開輸入時(shí)終止語音識別功能的激活狀態(tài)。在另一個(gè)例子 中,控制器180可在用戶不向終端講話的時(shí)間大于具體時(shí)間段時(shí)終止語音識別 功能。
接下來,圖7A是示出根據(jù)本發(fā)明的另一個(gè)實(shí)施例的語音識別方法的流程 圖。在該描述中還將參考圖l。如圖7A所示,當(dāng)輸入語音識別功能(S201)時(shí), 控制器180在存儲器160中存儲輸入語音指令(S202),并根據(jù)具體語音識別算 法處理語音指令(S203)。
然后,根據(jù)語音識別算法,控制器180將輸入語音指令轉(zhuǎn)換成文本信息, 并將經(jīng)轉(zhuǎn)換的文本信息存儲在存儲器160的任意區(qū)域中(S204)。之后,控制器 180處理文本信息以確定指令的含義。此外,控制器180較佳地在語音指令被 輸入的同時(shí)確定語音指令的含義。
然而,如上所述,控制器180還可在用戶完成語音指令的輸入之后確定語 音指令的含義。例如,如果用戶在預(yù)先設(shè)定的具體時(shí)間段內(nèi)不輸入語音指令, 則控制器180可確定用戶已經(jīng)完成輸入語音指令,然后開始確定語音指令的含 義的過程。
接下來,如圖7A所示,控制器180檢測包括在文本信息中的具體詞或關(guān)鍵 詞,以確定語音指令的含義(S205),并將所檢測的詞或關(guān)鍵詞與關(guān)于移動終端的具體數(shù)據(jù)庫中所存儲的各種功能和菜單的信息進(jìn)行比較(S206)。此外,當(dāng)相
同或類似的詞或關(guān)鍵詞被存儲在數(shù)據(jù)庫中時(shí),語音指令的識別率可由對應(yīng)的詞
或關(guān)鍵詞的數(shù)量來確定(S207)。
此外,用于確定識別率的信息可不限于包括在語音指令中的詞或關(guān)鍵詞的 數(shù)量的信息。即,用于確定識別率的值可針對每一個(gè)關(guān)鍵詞不同地設(shè)定,從而 即使詞或關(guān)鍵詞的數(shù)量很小,識別率也可根據(jù)具有高識別率的關(guān)鍵詞而改變。
同樣,語音識別率是指示所識別的語音指令是否準(zhǔn)確的信息。更具體地, 如果具體菜單的名稱被準(zhǔn)確輸入,則可獲得100%的識別率。然而,如果以自 然語言接收語音指令,則無意義的詞可被包括在語音指令中,且每一個(gè)用戶對 相同的詞讀音不同。所以實(shí)際上難以獲得100%的識別率。
因此,本發(fā)明的實(shí)施例有利地將高于具體值(例如80%)的識別率視為準(zhǔn)確。 因此,如果有幾種含義以類似的識別率確定(S卩,識別率是類似的,但語音指 令可被翻譯成具有各種含義),則控制器180顯示對應(yīng)于高于預(yù)定閾值的識別 率的多個(gè)可執(zhí)行菜單,使得用戶可選擇所顯示菜單之一(S208)。
此外,控制器180還可按優(yōu)先級的順序顯示菜單,且該順序從具有最高識 別率的菜單開始。例如,如圖7B所示,具有最高識別率的菜單圖標(biāo)可顯示在 顯示屏410的中心部分?;蛘撸鐖D7B所示,具有最高識別率的菜單圖標(biāo)可 在顯示屏420上顯示為較大、較暗或突出顯示。所顯示的最高識別率的菜單還 可以閃爍的方式顯示。
此外,為了提高識別率,如果菜單被用戶頻繁選擇,則控制器180可學(xué)習(xí) 并記住選擇的次數(shù),并使用該學(xué)習(xí)到的信息來改變關(guān)于具體菜單的識別率。因 此,識別率可關(guān)于具有類似或相同的發(fā)音或內(nèi)容的語音指令輸入來改變。
接下來,圖7C根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于說明語音識別方法的顯示屏 的概觀。如圖所示,當(dāng)用戶以自然語言輸入語音指令"我想看我的圖片"時(shí), 控制器180從形成語音指令的句子中檢測有意義的詞或關(guān)鍵詞(例如,看、圖 片),并將詞與存儲在移動終端的數(shù)據(jù)庫中的信息進(jìn)行比較。
此外,所檢測的詞或關(guān)鍵詞是否是有意義的詞可通過一部分語音來確定。 或者,可將具體的預(yù)先設(shè)定的關(guān)鍵詞檢測為有意義的詞??刂破?80于是在數(shù) 據(jù)庫中搜索與有意義的詞或關(guān)鍵詞對應(yīng)的信息。此外,數(shù)據(jù)庫可包括與移動終端的各種菜單或功能有關(guān)的多個(gè)關(guān)鍵詞信息。例如,作為與"相冊"對應(yīng)的關(guān)鍵詞信息,除準(zhǔn)確的"相冊"之外,可相應(yīng)地存儲諸如相機(jī)菜單的下級菜單、"照片"、"視頻"、"影集"等多個(gè)關(guān)鍵詞信息。
如圖7C中的顯示屏510所示,當(dāng)沒有關(guān)于與語音指令等同的菜單或功能的信息時(shí),控制器180顯示多個(gè)菜單,每一個(gè)菜單都具有高于具體值的識別率。如以上所討論的,控制器180將具有最高識別率的菜單圖標(biāo)521顯示為比其它所顯示的項(xiàng)大或暗。
此外,圖7C中的顯示屏520示出在只有一個(gè)菜單具有高于具體值的識別率時(shí),控制器180自動執(zhí)行識別率高于具體值的相應(yīng)菜單功能。此外,控制器180可輸出其含義被確定為文本或其它類消息的語音指令,或通過語音消息輸出。
圖7D是根據(jù)本發(fā)明的又一個(gè)實(shí)施例的說明語音識別方法的顯示屏的概觀。在該實(shí)施例中,用戶首先通過觸摸顯示屏610激活語音識別功能,然后以自然語言輸入語音指令"啟用電池省電",如顯示屏620所示??刂破?80然后在形成語音指令的句子中檢測有意義的詞或關(guān)鍵詞(例如,電池、省電),并該詞與存儲在數(shù)據(jù)庫中的信息進(jìn)行比較以確定其含義。
然而,在該實(shí)施例中,因?yàn)闆]有準(zhǔn)確對應(yīng)于語音指令的菜單,所以控制器180顯示與降低電池功耗的功能有關(guān)的多個(gè)菜單(例如,背景圖像、背光、待機(jī)屏幕等),如顯示屏630所示。
此外,如以上所討論的,可根據(jù)高識別率的順序有區(qū)別地顯示或突出顯示多個(gè)菜單的大小、位置、顏色和對比度中的至少一個(gè)。例如,具有高用戶選擇的菜單的識別率可顯示成與其它菜單有區(qū)別。
接下來,圖8是示出根據(jù)本發(fā)明的一個(gè)實(shí)施例的用于語音識別的數(shù)據(jù)庫的框圖。數(shù)據(jù)庫包括所存儲的由控制器180用于確定語音指令的含義的信息。因此,多個(gè)數(shù)據(jù)庫可根據(jù)每一個(gè)信息的特性來配置。此外,根據(jù)每一個(gè)信息的特性配置的每一個(gè)數(shù)據(jù)庫可在控制器180的控制下通過連續(xù)的學(xué)習(xí)過程更新。
此外,數(shù)據(jù)庫的學(xué)習(xí)過程指的是將用戶發(fā)出的語音與相應(yīng)的詞匹配。例如,如果用戶發(fā)音為"十五"但控制器180將該詞識別為"五十",則用戶可將"五十"糾正為"十五",使得控制器180將后來發(fā)出的相同發(fā)音識別為"十五"。
因此,通過該學(xué)習(xí)過程,多個(gè)語音信息可與數(shù)據(jù)庫的每個(gè)信息匹配。例如,數(shù)據(jù)庫可包括第一數(shù)據(jù)庫161,用于存儲語音信息,使通過話筒的用戶語音
輸入能根據(jù)格式、音節(jié)或詞素來識別;第二數(shù)據(jù)庫162,用于存儲信息,使控制器180能基于所識別的語音信息確定語音指令的整體含義;第三數(shù)據(jù)庫163,用于存儲與執(zhí)行移動終端的功能或服務(wù)的菜單有關(guān)的信息;以及第四數(shù)據(jù)庫164,用于存儲要從移動終端輸出的針對用戶關(guān)于所確定語音指令的含義的確認(rèn)的消息或語音消息。
此外,每一個(gè)數(shù)據(jù)庫可存儲語言(發(fā)音)信息或格式、音節(jié)、詞素、詞、關(guān)鍵詞或句子信息。因此,控制器180可通過使用多個(gè)數(shù)據(jù)庫161至164中的至少一個(gè)確定語音識別操作和語音指令的含義,并執(zhí)行與對應(yīng)于語音指令的所確定含義的功能或服務(wù)有關(guān)的菜單。
接下來,圖9是根據(jù)本發(fā)明的一個(gè)實(shí)施例的顯示信息以通知用戶移動終端中正在執(zhí)行所識別的語音指令的顯示屏的概觀。更具體地,當(dāng)控制器180識別語音指令或確定語音指令的含義時(shí),控制器180輸出相應(yīng)的結(jié)果值。結(jié)果值可以是用于執(zhí)行移動終端的具體功能的控制信號,與所識別指令有關(guān)的菜單信息,或在執(zhí)行功能時(shí)輸出的數(shù)據(jù)信息。在圖9中,控制器180輸出信息500,通知用戶所輸入的語音指令正在被識別。
此外,上述的實(shí)施例指的是識別用戶的語音指令。然而,本發(fā)明還適用于用戶在語音指令正在被識別時(shí)執(zhí)行附加的輸入功能。例如,語音識別和觸摸輸入、語音識別和按鈕輸入、或語音識別或觸摸/按鈕輸入可同時(shí)執(zhí)行。
此外,控制器180可防止語音識別功能在具體模式或菜單或具體操作狀態(tài)下執(zhí)行。另外,音頻信息(例如,語音通知或引導(dǎo)信息)或指示語音識別功能正在被應(yīng)用的視頻信息(例如,圖9中的指示符500)可在語音識別模式、菜單或操作狀態(tài)下顯示。同樣,可將正在應(yīng)用語音識別功能的信息通過輸出幫助信息來提供給用戶。
此外,以上各個(gè)實(shí)施例可使用例如計(jì)算機(jī)軟件、硬件、或其某種組合而在計(jì)算機(jī)可讀介質(zhì)中實(shí)現(xiàn)。對于硬件實(shí)現(xiàn),上述實(shí)施例可在一個(gè)或多個(gè)專用集成電路(ASIC)、數(shù)字信號處理器(DSP)、數(shù)字信號處理設(shè)備(DSPD)、可編程邏輯設(shè)備(PLD)、現(xiàn)場可編程門陣列(FPGA)、處理器、控制器、微控制器、微處理器、設(shè)計(jì)成執(zhí)行本文所述功能的其它電子單元、或其選擇性組合內(nèi)實(shí)現(xiàn)。
23對于軟件實(shí)現(xiàn),本文所述的實(shí)施例可通過諸如程序和函數(shù)的獨(dú)立軟件模塊實(shí)現(xiàn),每個(gè)軟件模塊實(shí)現(xiàn)本文所述的功能和操作中的一個(gè)或多個(gè)。軟件代碼可通過以任何合適編程語言編寫的軟件應(yīng)用程序?qū)崿F(xiàn),并且可被存儲在存儲器
(例如,存儲器160)中,而且可由控制器或處理器(例如,控制器180)執(zhí)行。
另外,移動終端100可以以各種不同配置實(shí)現(xiàn)。這些配置的示例包括翻蓋
式、滑蓋型、直板型、旋轉(zhuǎn)型、回轉(zhuǎn)型及其組合。
由于示例性實(shí)施例可按幾種形式實(shí)現(xiàn),而不背離其特性,所以還應(yīng)理解,上述的實(shí)施例不會被上述描述的任何細(xì)節(jié)所限制,除非另外指出,而應(yīng)廣泛地解釋為在所附權(quán)利要求定義的范圍中。因此,落入權(quán)利要求的范圍內(nèi)的各種變化和修改或該范圍的等價(jià)技術(shù)方案因此由所附權(quán)利要求所包含。
權(quán)利要求
1.一種移動終端,包括輸入單元,其被配置成接收輸入以激活所述移動終端上的語音識別功能;存儲器,其被配置成存儲與所述移動終端上執(zhí)行的操作有關(guān)的信息;以及控制器,其被配置成在接收到所述用于激活語音識別功能的輸入時(shí)激活語音識別功能,以基于所述移動終端上執(zhí)行的至少一個(gè)先前的操作和包括在語音指令中的語言來確定所述輸入語音指令的含義,以及基于所述移動終端上執(zhí)行的至少一個(gè)先前操作和包括在所述語音指令中的語言并基于所述輸入語音指令的所確定含義匹配與所述移動終端的操作有關(guān)的信息的概率,來提供與所述輸入語音指令的所確定含義有關(guān)的操作。
2. 如權(quán)利要求l所述的移動終端,其特征在于,所提供的操作不包括 中間操作,使得所提供操作的選擇導(dǎo)致與所選擇的所提供操作對應(yīng)的功能 在不需要選擇所不包括的中間操作的情況下被執(zhí)行。
3. 如權(quán)利要求l所述的移動終端,其特征在于,與所述語音指令的所 確定含義有關(guān)的所提供操作包括具有大于預(yù)定閾值的概率的所有操作。
4. 如權(quán)利要求3所述的移動終端,其特征在于,所述預(yù)定閾值由所述 終端的制造商或所述終端的用戶設(shè)置。
5. 如權(quán)利要求3所述的移動終端,其特征在于,所述預(yù)定閾值基于所 確定數(shù)量的操作自動選擇。
6. '如權(quán)利要求l所述的移動終端,其特征在于,所述控制器還被配置 成基于所述移動終端的操作狀態(tài)確定所述輸入語音指令的含義。
7. 如權(quán)利要求l所述的移動終端,其特征在于,與所述輸入語音指令 的所確定含義有關(guān)的所提供操作包括對應(yīng)于所述輸入語音指令的所確定含 義的至少一個(gè)菜單選項(xiàng)。
8. 如權(quán)利要求7所述的移動終端,其特征在于,所述控制器還被配置成輸出具有高于預(yù)定閾值的概率的對應(yīng)于所述輸入語音指令的所確定含義 的所有菜單選項(xiàng)。
9. 如權(quán)利要求8所述的移動終端,其特征在于,所述控制器還被配置 成將具有最高概率的對應(yīng)于所述輸入語音指令的所確定含義的菜單選項(xiàng)與 其它菜單可分辨地顯示。
10. 如權(quán)利要求9所述的移動終端,其特征在于,所述控制器通過有 差別地控制具有最高概率的菜單選項(xiàng)的大小、顯示位置、顏色、對比度和 突出顯示信息中的至少一個(gè)來可分辨地顯示具有最高概率的對應(yīng)于所述輸 入語音指令的所確定含義的菜單選項(xiàng)。
11. 如權(quán)利要求1所述的移動終端,其特征在于,所述輸入單元包括 以下單元中的至少一個(gè)l)被觸摸以激活所述語音識別功能的觸摸軟按鈕,2) 被按下或操縱以激活所述語音識別功能的硬按鈕,3)包括在所述輸入單元中的 觸摸屏的被觸摸以激活所述語音識別功能的任意位置,4)被輸入以激活所述語 音識別功能的撞擊聲,5)局部區(qū)域無線電信號或遙控區(qū)域無線電信號,以及6) 來自用戶的肢體信息信號。
12. 如權(quán)利要求l所述的移動終端,其特征在于,還包括 第一數(shù)據(jù)庫,配置成存儲由所述控制器用來識別所述語音指令的語音或發(fā)音"(曰息;第二數(shù)據(jù)庫,配置成存儲由所述控制器用來識別所述語音指令的詞、關(guān)鍵詞或句子信息;第三數(shù)據(jù)庫,配置成存儲與所述移動終端的功能或菜單有關(guān)的信息;以及 第四數(shù)據(jù)庫,配置成存儲要被輸出以通知用戶所述控制器試圖確定所識別 語音指令的含義的幫助信息。
13. 如權(quán)利要求l所述的移動終端,其特征在于,所述控制器還被配置成輸出指示所述語音識別功能處于激活狀態(tài)的音頻 或視頻信息。
14. 一種控制移動終端的方法,所述方法包括 接收用于激活所述移動終端的語音識別功能的輸入;在接收所述用于激活語音識別功能的輸入后激活所述語音識別功能;以及基于所述移動終端上執(zhí)行的至少一個(gè)先前操作和包括在語音指令中的 語言,并基于所述輸入語音指令的所確定含義匹配與所述移動終端的操作 有關(guān)的信息的概率,來提供與輸入語音指令的所確定含義有關(guān)的操作。
15. 如權(quán)利要求14所述的方法,其特征在于,所提供操作不包括中間 操作,使得所提供操作的選擇導(dǎo)致與所選擇的所提供操作對應(yīng)的功能在不 需要選擇所不包括的中間操作的情況下被執(zhí)行。
16. 如權(quán)利要求14所述的方法,其特征在于,與所述語音指令的所確 定含義有關(guān)的所提供操作包括具有大于預(yù)定閾值的概率的所有操作。
17. 如權(quán)利要求16所述的方法,其特征在于,所述預(yù)定閾值由所述終 端的制造商或所述終端的用戶設(shè)置。
18. 如權(quán)利要求16所述的方法,其特征在于,所述預(yù)定閾值基于確定 數(shù)量的操作自動選擇。
19. 如權(quán)利要求14所述的方法,其特征在于,還包括 基于所述移動終端上執(zhí)行的至少一個(gè)在前操作和包括在所述語音指令中的語言來確定所述輸入語音指令的含義。
20. 如權(quán)利要求19所述的方法,其特征在于,還包括 基于所述移動終端的操作狀態(tài)確定所述輸入語音指令的含義。
21. 如權(quán)利要求20所述的方法,其特征在于,與所述輸入語音指令的所確定含義有關(guān)的所提供操作包括對應(yīng)于所述輸入語音指令的所確定含義 的至少一個(gè)菜單選項(xiàng)。
22. 如權(quán)利要求21所述的方法,其特征在于,還包括 輸出具有高于預(yù)定閾值的概率的對應(yīng)于所述輸入語音指令的所確定含義的所有菜單選項(xiàng)。
23. 如權(quán)利要求22所述的方法,其特征在于,還包括 將具有最高概率的對應(yīng)于所述輸入語音指令的所確定含義的菜單選項(xiàng)與其它菜單可分辨地顯示。
24. 如權(quán)利要求23所述的方法,其特征在于,所述顯示步驟通過有差 別地控制具有最高概率的菜單選項(xiàng)的大小、顯示位置、顏色、對比度和突 出顯示信息中的至少一個(gè)來可分辨地顯示具有最高概率的對應(yīng)于所述輸入 語音指令的所確定含義的菜單選項(xiàng)。
25. 如權(quán)利要求14所述的方法,其特征在于,所述輸入步驟包括利用 以下中的至少一個(gè)激活語音識別功能l)被觸摸以激活所述語音識別功能的觸 摸軟按鈕,2)被按下或操縱以激活所述語音識別功能的硬按鈕,3)包括在所述 輸入單元中的觸摸屏的被觸摸以激活所述語音識別功能的任意位置,4)被輸入 以激活所述語音識別功能的撞擊聲,5)局部區(qū)域無線電信號或遙控區(qū)域無線電 信號,以及6)來自用戶的肢體信息信號。
26. 如權(quán)利要求14所述的方法,其特征在于,還包括 輸出指示所述語音識別功能處于激活狀態(tài)的音頻或視頻信息。
全文摘要
一種移動終端包括輸入單元,其被配置成接收輸入以激活所述移動終端上的語音識別功能;存儲器,其被配置成存儲與移動終端上執(zhí)行的操作有關(guān)的信息;以及控制器,其被配置成在接收到用于激活語音識別功能的輸入時(shí)激活語音識別功能,以基于移動終端上執(zhí)行的至少一個(gè)先前的操作和包括在語音指令中的語言來確定輸入語音指令的含義,以及基于移動終端上執(zhí)行的至少一個(gè)先前操作和包括在語音指令中的語言并基于輸入語音指令的所確定含義匹配與移動終端的操作有關(guān)的信息的概率,來提供與輸入語音指令的所確定含義有關(guān)的操作。移動終端及其菜單控制方法。
文檔編號H04M1/27GK101557651SQ20081012791
公開日2009年10月14日 申請日期2008年7月2日 優(yōu)先權(quán)日2008年4月8日
發(fā)明者尹種根, 申宗壕, 郭宰到 申請人:Lg電子株式會社