用于登記用戶命令的顯示裝置和方法
【專利說明】用于登記用戶命令的顯示裝置和方法
[0001]交叉申請的相關引用
[0002]本申請要求來自于2 014年11月2 O日在韓國知識產(chǎn)權局遞交的韓國專利申請N0.10-2014-0162654的優(yōu)先權,其公開在此以整體通過參考引入本文。
技術領域
[0003]以下描述涉及用于登記用戶命令的顯示裝置和方法,并更具體涉及用于登記用戶定義的用戶命令的顯示裝置和方法。
【背景技術】
[0004]根據(jù)技術發(fā)展,隨著例如智能電話、智能TV等顯示裝置能夠識別用戶的語音,用戶可以通過所說語音控制顯示裝置的操作或可以具有各種內(nèi)容服務,而無需執(zhí)行單獨的操作。上述語音識別方法基于識別與向顯示裝置預登記的命令相關聯(lián)的所說語音的嵌入式方法。
[0005]然而,存在以下問題:用戶不確切知曉向顯示裝置預登記的命令,并不通過顯示裝置有效地使用語音識別服務。因此,為了在解決上述問題的同時,使得用戶能夠用更有趣和更靈活的方式來使用顯示裝置,已經(jīng)開發(fā)了一種用于登記用戶命令的方法的技術,其中向顯示裝置登記用戶定義的用戶命令。
[0006]然而,根據(jù)相關技術的登記用戶命令的方法關注用于登記用戶簡單定義的用戶命令的方法。也就是說,根據(jù)相關技術的登記用戶命令的方法不考慮對用戶定義的用戶命令的誤識別概率的問題,而是僅關注相應用戶命令的登記。
[0007]在其中通過根據(jù)相關技術的登記用戶命令的方法來登記用戶命令的狀態(tài)中,響應于輸入相應用戶命令的所說語音,可能發(fā)生顯示裝置由于周圍環(huán)境因素而不能準確地識別用戶所說語音的問題。此外,在其中預登記了與相應用戶命令類似的其他命令的狀態(tài)下,響應于輸入相應用戶命令的所說語音,可能發(fā)生以下問題:顯示裝置基于與通過輸入的所說語音的用戶命令相類似的其他命令,執(zhí)行并非用戶意在的控制操作。
【發(fā)明內(nèi)容】
[0008]在以下的描述中將部分地闡述附加方面和/或優(yōu)點,并且附加方面和/或優(yōu)點將部分地從該描述中顯而易見,或可以通過本公開的實踐來獲知。
[0009]本公開的示例實施例克服以上缺點和以上未描述的其他缺點。此外,不要求本公開克服上述缺點,并且本公開的示例實施例可以不解決上述問題中的任何一個。
[0010]本公開提供了一種能夠登記用戶定義的用戶命令中抗誤識別并保證高識別率的用戶命令的顯示裝置。
[0011]根據(jù)本公開的一方面,顯示裝置包括:輸入單元,被配置為接收用戶命令;輸出單元,被配置為輸出用戶命令的登記合適性確定結(jié)果,以及處理器,被配置為生成用戶命令的音標,分析生成的音標以確定用戶命令的登記合適性,并控制所述輸出單元輸出針對用戶命令的登記合適性確定結(jié)果。
[0012]處理器可以分析生成的音標的總數(shù)量和生成的音標中的元音和輔音的連續(xù)配置中的至少一個,以確定用戶命令的登記合適性。
[0013]處理器還分析以下各項的至少一個以確定用戶命令的登記合適性:生成的音標的配置形式、每個單詞的音標的數(shù)量、以及音標是否包括弱音標,以及所述弱音標可以包括由于周圍環(huán)境而降低或丟失頻帶或能量幅度使得其識別率降級的特定發(fā)音的音標。
[0014]響應于確定用戶命令的登記不合適,輸出單元可以顯示引導可登記用戶命令的引導用戶界面(UI),并且響應于確定用戶命令的登記合適,輸出用戶命令的音頻。
[0015]顯示裝置還可以包括存儲單元,其中,響應于在其中輸出用戶命令的音頻的狀態(tài)下輸入用戶命令的所說語音,處理器根據(jù)用戶命令的文本與所說語音的文本之間的相似性,在存儲單元中登記并存儲用戶命令。
[0016]處理器可以確定用戶命令的登記合適性,并且在用戶命令的登記既不屬于合適情況也不屬于不合適情況的情況下,根據(jù)用戶的選擇命令在存儲單元中登記并存儲用戶命令。
[0017]處理器可以測量多個預登記的命令的音標與用戶命令的音標之間的相似性,以根據(jù)測量出的相似性來確定用戶命令的登記合適性。
[0018]處理器可以根據(jù)用戶命令是否與禁用命令相對應來確定用戶命令的登記合適性。
[0019]響應于輸入了用戶命令的所說語音,輸入單元可以從語音識別裝置接收所說語音的一個或更多個文本,以及處理器可以確定用戶在一個或更多個輸出文本中選擇的文本,作為用戶命令的文本。
[0020]用戶命令可以包括用于進入語音識別模式的觸發(fā)命令和用于控制顯示裝置的操作的控制命令中的至少一個。
[0021]根據(jù)本公開的一方面,一種登記用戶命令的方法包括:接收用戶命令;基于預定義的音標集生成用戶命令的音標;通過分析生成的音標來確定用戶命令的登記合適性;以及提供針對用戶命令的登記合適性確定。
[0022]在確定登記合適性時,可以通過分析生成的音標的總數(shù)量和生成的音標中的元音和輔音的連續(xù)配置中的至少一個,來確定用戶命令的登記合適性。
[0023]在確定登記合適性時,還通過分析以下各項的至少一個來確定用戶命令的登記合適性:生成的音標的配置形式、每個單詞的音標的數(shù)量,以及音標是否包括弱音標,以及所述弱音標包括由于周圍環(huán)境而降低或丟失頻帶或能量幅度使得其識別率降級的特定發(fā)音的首標。
[0024]在提供針對用戶命令的登記合適性確定結(jié)果時,可以響應于確定用戶命令的登記不合適,提供引導可登記用戶命令的引導用戶界面(UI),并且可以響應于確定用戶命令的登記合適,輸出用戶命令的音頻。
[0025]該方法還包括:響應于在輸出用戶命令的音頻的狀態(tài)下輸入用戶命令的所說語音,根據(jù)用戶命令的文本與所說語音的文本之間的相似性來登記用戶命令。
[0026]在登記用戶命令時,可以確定用戶命令的登記合適性,并且可以在用戶命令的登記不屬于合適情況也不屬于不合適情況的情況下,根據(jù)用戶的選擇命令來登記用戶命令。
[0027]在確定用戶命令的登記合適性時,可以根據(jù)多個預登記命令的音標與用戶命令的音標之間的相似性來確定用戶命令的登記合適性。
[0028]在確定用戶命令的登記合適性時,可以根據(jù)用戶命令是否與禁用命令相對應,來確定用戶命令的登記合適性。
[0029]在接收用戶命令時,響應于輸入用戶命令的所說語音,可以從語音識別裝置輸入所說語音的一個或更多個文本,并且可以將一個或更多個輸入文本中用戶選擇的文本確定為用戶命令的文本。
[0030]用戶命令可以包括用于進入語音識別模式的觸發(fā)命令和用于控制顯示裝置的操作的控制命令中的至少一個。
[0031]根據(jù)本公開的一方面,提供了一種在與顯示裝置耦合的記錄介質(zhì)中存儲以執(zhí)行以下步驟的計算機程序:接收用戶命令;基于預定義的音標集生成用戶命令的音標;通過分析生成的音標來確定用戶命令的登記合適性;以及提供針對用戶命令的登記合適性確定結(jié)果,其中計算機程序登記用戶命令。
【附圖說明】
[0032]通過參照附圖描述本公開的特定示例實施例,本公開的以上和/或其他方面、將會更加顯而易見,在附圖中:
[0033]圖1是根據(jù)本公開的示例實施例的語音識別系統(tǒng)的框圖;
[0034]圖2是根據(jù)本公開的示例實施例的顯示裝置的框圖;
[0035]圖3是示出根據(jù)本公開的示例實施例的顯示裝置的詳細框圖;
[0036]圖4是示出根據(jù)本公開的實施例的確定合適性的模塊的視圖;
[0037]圖5是根據(jù)本公開的示例實施例的基于通過顯示裝置中的確定登記合適性的模塊計算出的結(jié)果值來確定用戶命令的登記合適性的示意性視圖;
[0038]圖6是根據(jù)本公開的示例實施例的提供顯示裝置中的用戶命令的登記不合適性確定結(jié)果的第一示意性視圖;
[0039]圖7是根據(jù)本公開的示例實施例的提供顯示裝置中的用戶命令的登記不合適性確定結(jié)果的第二示意性視圖;
[0040]圖8是根據(jù)本公開的示例實施例的提供顯示裝置中的用戶命令的登記不合適性確定結(jié)果的第三示意性視圖;
[0041]圖9是根據(jù)本公開的示例實施例的用于確定顯示裝置中的用戶命令的登記合適性的方法的流程圖;以及
[0042]圖10是根據(jù)本公開的示例實施例的顯示裝置中的登記用戶命令的方法的流程圖。
【具體實施方式】
[0043]現(xiàn)在將具體參照實施例,在附圖中示出其示例,其中貫穿本文類似的參考符號指的是類似的元素。以下通過參照附圖解釋本公開來描述這些實施例。
[0044]可以不同地修改本公開的示例實施例。因此,在附圖中示出并在詳細說明中具體描述特定示例實施例。然而,應當理解的是本公開不限于特定示例實施例,還包括不離開本公開的范圍和精神的全部修改、等價和替代。此外,不具體描述熟知的功能或結(jié)構(gòu),原因在于它們將用不必要的細節(jié)使本公開模糊。
[0045]術語“第一”、“第二”等可以用于描述各種組成部分,但是這些組成部分不受術語限制。這些術語僅用于將組成部分彼此區(qū)分開。
[0046]本申請中所使用的術語僅用于描述示例實施例,而不旨在限制本公開的范圍。只要在上下文中單數(shù)表達不區(qū)別地表意,單數(shù)表達還包括復數(shù)含義。在本申請中,術語“包括”和“包含”指示存在說明書中所寫的特征、數(shù)量、步驟、操作、組成部分、元素或其組合,但不排除添加一個或更多個特征、數(shù)量、步驟、操作、組成部分、元素或其組合的存在或可能性。
[0047]在本公開的示例實施例中,“模塊”或“單元”執(zhí)行至少一個功能或操作,并可以用硬件、軟件或硬件和和軟件的組合來實現(xiàn)。此外,除了必須用特定硬件來實現(xiàn)的“模塊”或“單元”以外,可以將多個“模塊”或者多個“單元”集成到至少一個模塊中,并可以用至少一個處理器(未示出)來實現(xiàn)。
[0048]以下,將參照附圖詳細描述本公開。
[0049]圖1是根據(jù)本公開的示例實施例的語音識別系統(tǒng)的框圖。
[0050]如圖1所示,語音識別系統(tǒng)包括顯示裝置100、輸入裝置200和網(wǎng)絡服務器300。
[0051]可以用各種電子裝置(智能電視、智能手機、平板電腦等)來實現(xiàn)顯示裝置100,顯示裝置100是識別用戶所說語音以執(zhí)行用戶意在的操作的裝置。
[0052]輸入裝置200可以是例如遙控器、鍵盤等,輸入裝置200是執(zhí)行與顯示裝置100的數(shù)據(jù)通信以控制顯示裝置100的操作的裝置。
[0053]具體地,在語音識別模式下第一用戶可以說話來操作顯示裝置100。響應于向顯示裝置100輸入上述的用戶