亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

信息處理設備、信息處理方法及程序與流程

文檔序號:11635830閱讀:198來源:國知局
信息處理設備、信息處理方法及程序與流程

本公開內(nèi)容涉及信息處理設備、信息處理方法及程序。



背景技術(shù):

近來已經(jīng)開發(fā)了用于接受由用戶說出的語音作為輸入語音并對該輸入語音進行語音識別以從輸入語音中識別字符串的技術(shù)。然而,在語音識別中很可能出現(xiàn)錯誤。關(guān)于這一點,開發(fā)了以下技術(shù):生成除了從輸入語音識別出的字符串中的一些字符串之外的多個處理單元,將多個處理單元呈現(xiàn)給用戶,并且將用戶從多個處理單元中選擇的處理單元視為要處理的目標(例如,參考專利文獻1)。

引用列表

專利文獻

專利文獻1:jp2008-209717a



技術(shù)實現(xiàn)要素:

技術(shù)問題

因此,希望提供能夠更有效地對從輸入語音中識別出的字符串進行處理的技術(shù)。

問題的解決方案

根據(jù)本公開內(nèi)容,提供了一種信息處理設備,包括:處理單元獲取部,被配置成基于噪聲從通過對第一輸入語音進行語音識別而獲得的第一識別字符串中獲取一個或更多個處理單元;以及處理器,被配置成:當一個或更多個處理單元中的任一個處理單元被選為處理目標時,對處理目標進行處理。

根據(jù)本公開內(nèi)容,提供了一種信息處理方法,該方法包括:基于噪聲從通過對第一輸入語音進行語音識別而獲得的第一識別字符串中獲取一個或更多個處理單元;以及當一個或更多個處理單元中的任一個處理單元被選為處理目標時,對處理目標進行處理。

根據(jù)本公開內(nèi)容,提供了一種用于使計算機作用為信息處理設備的程序,該信息處理設備包括:處理單元獲取部,被配置成基于噪聲從通過對第一輸入語音進行語音識別而獲得的第一識別字符串中獲取一個或更多個處理單元;以及處理器,被配置成當一個或更多個處理單元中的任一個處理單元被選為處理目標時,對處理目標進行處理。

發(fā)明的有益效果

根據(jù)上述本公開內(nèi)容,提供了一種能夠更有效地對從輸入語音中識別出的字符串進行處理的技術(shù)。注意,上述效果不一定是限制性的。連同或替代上述效果,還可以實現(xiàn)在本說明書中描述的任何效果或者通過本說明書能夠領(lǐng)會的其他效果。

附圖說明

圖1是示出根據(jù)本公開內(nèi)容的實施方式的信息處理系統(tǒng)的配置示例的圖。

圖2是示出根據(jù)本實施方式的信息處理系統(tǒng)的功能配置示例的框圖。

圖3a是示出根據(jù)本實施方式的信息處理設備的操作的概況的流程圖。

圖3b是示出根據(jù)本實施方式的信息處理設備的操作的概況的流程圖。

圖4是示出通過顯示控制器顯示在顯示部上的畫面的配置示例的圖。

圖5是示出在用戶正在說話的狀態(tài)下所顯示的畫面的示例的圖。

圖6是示出用戶想要輸入的字符串的示例以及通過語音識別而獲得的識別字符串的示例的圖。

圖7是示出顯示有識別字符串的畫面的示例的圖。

圖8是被示出用于描述基于噪聲音量從識別字符串中獲取一個或更多個處理單元的示例的圖。

圖9是示出處理單元確定操作的示例的流程圖。

圖10是示出處理單元確定操作的示例的流程圖。

圖11是示出預測轉(zhuǎn)換類別數(shù)據(jù)庫的示例的圖。

圖12是示出短語類別數(shù)據(jù)庫的示例的圖。

圖13是示出原始形式類別數(shù)據(jù)庫的示例的圖。

圖14是示出先前校正結(jié)果類別數(shù)據(jù)庫的示例的圖。

圖15是示出相似聲音類別數(shù)據(jù)庫的示例的圖。

圖16是示出相似語義類別數(shù)據(jù)庫的示例的圖。

圖17是示出轉(zhuǎn)換形式類別數(shù)據(jù)庫的示例的圖。

圖18是示出針對每個類別顯示的校正候選字符串的示例的圖。

圖19是示出針對每個類別顯示的校正候選字符串的另一示例的圖。

圖20是示出針對每個類別顯示的校正候選字符串的另一示例的圖。

圖21是示出針對每個類別顯示的校正候選字符串的另一示例的圖。

圖22是示出針對每個類別顯示的校正候選字符串的另一示例的圖。

圖23是示出符號類別數(shù)據(jù)庫的示例的圖。

圖24是示出數(shù)字類別數(shù)據(jù)庫的示例的圖。

圖25是示出字母類別數(shù)據(jù)庫的示例的圖。

圖26是示出表情符號類別數(shù)據(jù)庫的示例的圖。

圖27是示出針對每個類別顯示的附加候選字符串的另一示例的圖。

圖28是示出校正候選字符串獲取操作的示例的流程圖。

圖29是示出校正候選字符串獲取操作的示例的流程圖。

圖30是被示出用于描述對處理目標的長度進行控制的示例的圖。

圖31是示出對處理目標的長度進行控制的操作的示例的流程圖。

圖32是被示出用于描述對處理單元的數(shù)量進行改變的示例的圖。

圖33是被示出用于描述對處理單元的數(shù)量進行改變的另一示例的圖。

圖34是被示出用于描述處理單元的刪除的圖。

圖35是被示出用于描述插入符號位置的選擇的圖。

圖36是被示出用于描述插入符號位置的選擇的圖。

圖37是被示出用于描述插入符號位置的選擇的圖。

圖38是被示出用于描述在選擇了中心區(qū)的情況下的操作的圖。

圖39是被示出用于描述在選擇了左側(cè)區(qū)的情況下的操作的圖。

圖40是被示出用于描述在選擇了右側(cè)區(qū)的情況下的操作的圖。

圖41是示出當選擇處理單元的顯示區(qū)域時的操作的示例的流程圖。

圖42是示出當選擇處理單元的顯示區(qū)域時的操作的示例的流程圖。

圖43是示出顯示部的顯示形式的修改示例的圖。

圖44是示出根據(jù)本實施方式的信息處理系統(tǒng)的硬件配置示例的框圖。

具體實施方式

在下文中,將參照附圖來詳細地描述本公開內(nèi)容的優(yōu)選實施方式。在本說明書和附圖中,對具有基本相同功能和結(jié)構(gòu)的結(jié)構(gòu)要素給予相同的附圖標記,并且省略對這些結(jié)構(gòu)要素的重復說明。

注意,在本說明書和附圖中,對具有基本相同功能和結(jié)構(gòu)的結(jié)構(gòu)要素有時使用相同附圖標記之后的不同字母來區(qū)分彼此。然而,當不需要對具有基本相同功能和結(jié)構(gòu)的結(jié)構(gòu)要素進行特別區(qū)分時,只附上相同的附圖標記。

將按照以下順序進行說明。

1.本公開內(nèi)容的實施方式

1.1.系統(tǒng)配置示例

1.2.功能配置示例

1.3.操作概況

1.4.畫面配置示例

1.5.處理單元的確定

1.6.字符串的呈現(xiàn)

1.7.處理目標的長度的控制

1.8.處理單元的數(shù)量的改變

1.9.處理單元的刪除

1.10.插入符號位置的選擇

1.11.處理單元的顯示區(qū)域

1.12.顯示形式的修改示例

1.13.硬件配置示例

2.結(jié)論

<1.本公開內(nèi)容的實施方式>

[1.1.系統(tǒng)配置示例]

將參照附圖來描述根據(jù)本公開內(nèi)容的實施方式的信息處理系統(tǒng)10的配置示例。圖1是示出了根據(jù)本公開內(nèi)容的實施方式的信息處理系統(tǒng)10的配置示例的圖。如圖1所示,根據(jù)本公開內(nèi)容的實施方式的信息處理系統(tǒng)10被配置成包括圖像輸入部110、操作輸入部115、語音輸入部120以及顯示部130。信息處理系統(tǒng)10能夠?qū)τ脩魎(以下還簡稱為“用戶”)說出的語音進行語音識別。

圖像輸入部110具有輸入圖像的功能。在如圖1所示的示例中,圖像輸入部110包括嵌入在桌子tb1中的兩個攝像機。然而,圖像輸入部110中包括的攝像機的數(shù)量不限于特定的數(shù)量,只要該數(shù)量為一個或更多個即可。在這種情況下,圖像輸入部110中包括的一個或更多個攝像機中的每個攝像機被設置的位置也不限于特定的位置。此外,一個或更多個攝像機可以包括單目攝像機或立體攝像機。

操作輸入部115具有輸入用戶u的操作的功能。在如圖1所示的示例中,操作輸入部115包括從桌子tb1上方的天花板懸掛的一個攝像機。然而,操作輸入部115中包括的攝像機被設置的位置不限于特定的位置。此外,攝像機可以包括單目攝像機或立體攝像機。此外,操作輸入部115可以是除攝像機之外的任何東西,只要它具有輸入用戶u的操作的功能即可,并且例如可以是觸摸板或硬件按鍵。

顯示部130具有在桌子tb1上顯示畫面的功能。在如圖1所示的示例中,顯示部130從桌子tb1上方的天花板懸掛。然而,顯示部130被設置的位置不限于特定的位置。此外,顯示部130通??梢允悄軌?qū)嬅嫱队暗阶雷觮b1上表面的投影儀,但是也可以是其他類型的顯示器,只要它具有顯示畫面的功能即可。

此外,盡管這里主要描述的是桌子tb1的上表面為畫面的顯示表面的情況,但是畫面的顯示表面可以不同于桌子tb1的上表面。畫面的顯示表面的示例可以包括墻、建筑物、地板表面、地面、天花板或其他地方的表面。此外,在顯示部130具有自己的顯示表面的情況下,畫面的顯示表面可以是顯示部130的顯示表面。

語音輸入部120具有輸入語音的功能。在如圖1所示的示例中,語音輸入部120包括總共6個麥克風,即桌子tb1上方的3個麥克風以及存在于桌子tb1的上表面上的3個麥克風。然而,語音輸入部120中包括的麥克風的數(shù)量不限于特定的數(shù)量,只要該數(shù)量為一個或更多個即可。在這種情況下,語音輸入部120中包括的一個或更多個麥克風被設置的位置也不限于特定的位置。然而,如果語音輸入部120包括多個麥克風,則可以基于輸入至多個麥克風中的每個麥克風的語音來估計聲源的方向。此外,如果語音輸入部120包括具有指向性的麥克風,可以基于輸入至指向性麥克風中的語音來估計聲源的方向。

針對根據(jù)本公開內(nèi)容的實施方式的信息處理系統(tǒng)10的配置示例給出了上述說明。

[1.2.功能配置示例]

接下來,將描述根據(jù)本公開內(nèi)容的實施方式的信息處理系統(tǒng)10的功能配置示例。圖2是示出了根據(jù)本公開內(nèi)容的實施方式的信息處理系統(tǒng)10的功能配置示例的框圖。如圖2所示,根據(jù)本公開內(nèi)容的實施方式的信息處理系統(tǒng)10被配置成包括圖像輸入部110、操作輸入部115、語音輸入部120、顯示部130以及信息處理設備140(以下還稱為“控制器”140)。

信息處理設備140對信息處理系統(tǒng)10的每個部件進行控制。在一個示例中,信息處理設備140生成要從顯示部130輸出的信息。此外,在一個示例中,信息處理設備140將圖像輸入部110、操作輸入部115和語音輸入部120中的每個輸入的信息合并到要從顯示部130輸出的信息中。如圖2所示,信息處理設備140被配置成包括輸入圖像獲取部141、輸入語音獲取部142、操作檢測部143、語音識別部144、處理單元獲取部145、處理器146以及顯示控制器147。稍后將描述這些功能塊的每個的細節(jié)。

此外,信息處理設備140可以由例如中央處理單元(cpu)構(gòu)成。在信息處理設備140由諸如cpu的處理設備構(gòu)成的情況下,該處理設備可以由電子電路構(gòu)成。

針對根據(jù)本公開內(nèi)容的實施方式的信息處理系統(tǒng)10的功能配置示例給出了上述說明。

[1.3.操作概況]

接下來,對根據(jù)本公開內(nèi)容的實施方式的信息處理設備140的操作的概況進行描述。圖3a和圖3b是示出了根據(jù)本公開內(nèi)容的實施方式的信息處理設備140的操作的概況的流程圖。如果用戶發(fā)出聲音(s11),則輸入語音獲取部142獲取由聲音輸入部120輸入的語音作為輸入語音(s12)。然后,語音識別部144從輸入語音中獲取噪聲音量(s13)。噪聲可以對應于輸入聲音之中除用戶說出的語音之外的聲音。稍后將對噪聲音量的獲取的細節(jié)進行描述。

接下來,語音識別部144對輸入語音進行語音識別(s14)以從輸入語音中獲得字符串(以下也稱為“識別字符串”)(s15)。語音識別部144使用的語音識別技術(shù)不限于特定的技術(shù),并且可以使用諸如隱馬爾科夫模型的語音識別技術(shù)。此外,在本說明書中,字符串可以由一個字符構(gòu)成。接下來,處理單元獲取部145基于噪聲音量從識別字符串中獲得一個或更多個處理單元(s16)。在一個示例中,在語音識別中出現(xiàn)錯誤的可能性隨著噪聲音量的增加而增加,因此處理單元獲取部145優(yōu)選地增加每一部分的處理單元的長度。這可以減少使用戶選擇處理單元的時間和精力。

另一方面,在一個示例中,在語音識別中出現(xiàn)錯誤的可能性隨著噪聲音量的降低而降低,因此處理單元獲取部145優(yōu)選地減少每一部分的處理單元的長度。這可以減少使用戶輸入語音的時間和精力。在一個示例中,在識別字符串的語言是分開書寫的語言例如英語、法語和德語的情況下,處理單元可以是詞單元或者多個詞的組合。此外,可能存在識別字符串的語言是不分開書寫的語言例如日語、中文和韓語。在這種情況下,處理單元是通過對識別字符串進行語義分析而獲得的語素單元、獨立詞和輔助詞的組合(短語)單元、根據(jù)預定的字符數(shù)量而劃分的字符串單元、或者甚至是作為語音而被輸入的句子單元。

此外,處理單元獲取部145還可以基于識別字符串的上下文從識別字符串中獲取一個或更多個處理單元。在一個示例中,處理單元獲取部145參照提前登記的詞典數(shù)據(jù),并且計算識別字符串中包括的詞與前面的詞和后面的詞的聯(lián)系的容易程度。因此,可以將在意思上被確認為一個組的由一個或更多個詞構(gòu)成的組合劃分為處理單元。接下來,處理器146獲取校正候選字符串(s17)。正如稍后將描述的那樣,存在校正候選字符串的類型的各種類別。

接下來,顯示控制器147通過使顯示部130顯示校正候選字符串來將校正候選字符串呈現(xiàn)給用戶(s18)。在一種情況下,如果獲得了期望的識別字符串(s19中的“是”),則決定該識別字符串(s20)。在另一種情況下,如果沒有獲得期望的識別字符串并且選擇了刪除作為處理類型(s19中的“否(刪除)”),則處理器146刪除處理目標并且返回s18。在該另一種情況下,如果沒有獲得期望的識別字符串并且選擇了校正作為處理類型(s19中的“否(校正)”),則處理器146校正處理目標(s22)。

在校正處理目標時,處理器146進行添加新字符串的處理(s23)或者用字符串來替換處理目標的處理(s24)。關(guān)于這一點,在處理器146通過語音對處理目標進行替換(即,用從語音中識別的字符串來進行替換)的情況下,處理器146在替換了處理目標之后重建識別字符串的處理單元。接下來,在處理器146通過語音來進行校正的情況下(s26中的“是”),處理返回s11,但是在處理器146通過不同于語音的方式進行校正(例如,通過從校正候選字符串中選出的校正字符串來進行校正)的情況下(s26中的“否”),處理返回s15。

針對根據(jù)本公開內(nèi)容的實施方式的信息處理設備140的操作的概況給出了上述說明。

[1.4.畫面配置示例]

接下來,將描述通過顯示控制器147顯示在顯示部130上的畫面的配置示例。圖4是示出通過顯示控制器147顯示在顯示部130上的畫面的配置示例的圖。如圖4所示,畫面g10包括顯示了字符串的字符串顯示欄g11、全部字符串刪除操作對象g12、字符串決定操作對象g13、基于語音的字符串添加開始操作對象g14。此外,如圖4所示,畫面g10包括用于將插入符號位置移動至前面位置的操作對象g15、用于將插入符號位置移動至后面位置的操作對象g16、以及用于刪除處理目標的操作對象g17。

關(guān)于這一點,如圖4所示,如果操作檢測部143檢測到選擇基于語音的字符串添加開始操作對象g14的操作并且通過輸入語音獲取部142獲取了輸入語音,則語音識別部144開始對輸入語音進行語音識別。圖5是示出了在用戶正在說話的狀態(tài)下所顯示的畫面的示例的圖。在如圖5所示的示例中,基于語音的字符串添加開始操作對象g14變?yōu)榛谡Z音的字符串添加結(jié)束操作對象g23。

如果由語音識別部144進行的語音識別開始,則語音識別部144基于輸入語音確定用戶u說出的語音的音量。關(guān)于這一點,確定用戶語音音量的方式不限于特定的方式。在一個示例中,語音識別部144可以估計用戶說出的語音的聲源方向du并且可以將從用戶說出的語音的聲源方向du輸入的音量確定為用戶語音音量。估計用戶說出的語音的聲源方向du的方式也不限于特定的方式。

在一個示例中,語音識別部144可以將幅度超過由語音輸入部120初設的閾值的音量的聲音輸入的到達方向估計為由用戶說出的語音的聲源方向。此外,可能存在多個具有幅度超過閾值的音量的聲音輸入的到達方向。在這種情況下,語音識別部144可以將多個到達方向之中的一個到達方向估計為由用戶說出的語音的聲源方向,該一個到達方向與進行選擇基于語音的字符串添加開始操作對象g14的操作的用戶的手指的方向(例如,從指尖到指根的方向)匹配或相似。可以提前確定相似度的范圍。此外,可以通過對輸入圖像進行分析來獲得手指方向。

此外,在一個示例中,語音識別部144可以將語音輸入部120的具有最高音量的語音輸入的到達方向估計為用戶說出的語音的聲源方向du??商孢x地,語音識別部144可以將與執(zhí)行選擇字符串添加開始操作對象g14的操作的用戶的手指的方向匹配或相似的一個到達方向估計為用戶說出的語音的聲源方向du。在這種情況下,語音識別部144可以將從除了用戶說出的語音的聲源方向之外的方向輸入至語音輸入部120的語音確定為噪聲,并且可以將從除了聲源方向du之外的方向輸入至語音輸入部120的音量確定為噪聲音量。

在用戶說出的語音音量超過了能夠識別語音的音量(以下也稱為“可識別音量”)的情況下,顯示控制器147可以使顯示部130顯示朝著字符串添加結(jié)束操作對象g23移動的第一運動對象mu。這使得用戶可以知道說話是否是以能夠識別出語音的音量進行的。此外,顯示控制器147可以使顯示部130基于用戶說出的語音的聲源方向du來顯示第一運動對象mu。這使得用戶可以可靠地知道用戶自己的語音音量是否超過了能夠識別出語音的音量。

具體地,顯示控制器147可以將第一運動對象mu在與用戶說出的語音的聲源方向du相反的方向上朝著字符串添加結(jié)束操作對象g23移動。盡管如圖5所示的示例假定在用戶附近一個接一個地出現(xiàn)的圓形對象在與用戶說出的語音的聲源方向du相反的方向上移動并且在到達字符串添加結(jié)束操作對象g23時消失,第一運動對象mu的移動不限于該示例。此外,第一運動對象mu的運動目的地可以包括但不限于字符串添加結(jié)束操作對象g23、任何所顯示的對象。

[1.5.處理單元的確定]

以這種方式,通過對輸入語音進行語音識別來獲得識別字符串,但是在針對輸入語音的語音識別中也可能發(fā)生錯誤。圖6是示出了用戶想要輸入的字符串的示例以及通過語音識別而獲得的識別字符串的示例的圖。參照圖6,顯示了“idriveyourcartoairports”作為用戶想要輸入的字符串的示例,并且顯示了“idroveyourcartoairports”作為通過語音識別獲得的字符串的示例。因此,優(yōu)選地可以對通過語音識別獲得的字符串進行一些處理。

圖7是示出顯示有識別字符串的畫面的示例的圖。如圖7所示,顯示控制器147可以使顯示部130顯示識別字符串“idroveyourcartoairports”。在這種情況下,處理單元獲取部145從識別字符串“idroveyourcartoairports”中獲取處理單元u1“idrove”、處理單元u2“yourcar”以及處理單元u3“toairports”。因此,顯示控制器147可以使顯示部130顯示這些處理單元u1至u3。這樣一來,處理器146使用戶從處理單元u1至處理單元u3中選擇一個,并且可以處理用戶所選的處理目標。

此外,如圖7所示,顯示控制器147可以使插入符號位置選擇對象b1顯示在處理單元u1前面的位置處,并且使插入符號位置選擇對象b2顯示在處理單元u1與處理單元u2之間。此外,顯示控制器147可以使插入符號位置選擇對象b3顯示在處理單元u2與處理單元u3之間,以及使插入符號位置選擇對象b4顯示在處理單元u4前面的位置處。然后,顯示控制器147可以將插入符號cl布置在插入符號位置選擇對象b1至b4中的一個處。

圖7示出了通過處理單元獲取部145從識別字符串“idroveyourcartoairports”中得到處理單元u1“idrove”、處理單元u2“yourcar”以及處理單元u3“toairports”的示例。然而,在針對輸入語音的語音識別中出現(xiàn)錯誤的可能性可能根據(jù)噪聲而發(fā)生變化,所以對從輸入語音中識別的字符串進行的處理通過改變處理單元的數(shù)量而變得更有效。因此,處理單元獲取部145可以基于噪聲從識別字符串“idroveyourcartoairports”中獲取一個或多個處理單元。更具體地,處理單元獲取部145可以基于噪聲音量從識別字符串“idroveyourcartoairports”中獲取一個或多個處理單元。

圖8是被示出用于描述基于噪聲音量從識別字符串“idroveyourcartoairports”中獲取一個或多個處理單元的示例的圖。如上所述,隨著噪聲音量增加,在語音識別中發(fā)生錯誤的可能性增加,因此處理單元獲取部145優(yōu)選地減少在圖8中示為“大噪聲音量”的處理單元的數(shù)量。這可以減少使用戶選擇處理單元的時間和精力。另一方面,隨著噪聲音量降低,在語音識別中發(fā)生錯誤的可能性降低,因此處理單元獲取部145優(yōu)選地增加處理單元的數(shù)量,如圖8中的“小噪聲音量”中所示。這可以減少使用戶輸入語音的時間和精力。

接下來,將描述對處理單元進行確定的操作。圖9和圖10是示出處理單元確定操作的示例的流程圖。此外,這些流程圖僅示出了處理單元確定操作的示例,因此該處理單元確定操作不限于這些流程圖中所示的示例。輸入語音獲取部142獲取輸入語音(s101)。接著,語音識別部144從輸入語音中獲取噪聲音量(s102)。然后,語音識別部144對輸入語音進行語音識別以獲取識別字符串(s103)。

接下來,如果噪聲音量低于閾值ta(s104中的“是”),則處理單元獲取部145以一個字符為單位劃分識別字符串(s105)并且進行至s113。另一方面,如果噪聲音量超過閾值ta(s104中的“否”),則處理單元獲取部145進行至s106。接下來,如果噪聲音量低于閾值tb(s106中的“是”),則處理單元獲取部145將識別字符串劃分成有意義的最小單元(s107)并且進行至s113。另一方面,如果噪聲音量超過閾值tb(s106中為“否”),則處理單元獲取部145進行至s108。

接下來,如果噪聲音量低于閾值tc(s108中的“是”),則處理單元獲取部145將識別字符串劃分成通過合并一個或更多個有意義的最小單元而獲得的單元na(s109),并且進行至s113。另一方面,如果噪聲音量超過閾值tc(s108中的“否”),則處理單元獲取部145進行至s110。接下來,如果噪聲音量低于閾值td(s110中的“是”),則處理單元獲取部145將識別字符串劃分成通過合并一個或更多個單元na而獲得的單元nb(s111),并且進行至s113。另一方面,如果噪聲音量超過閾值tb(s110中的“否”),則處理單元獲取部145將整個識別字符串設置為單元nc(s112),并且進行至s113。

接下來,如上所述,處理單元獲取部145將從識別字符串生成的每個單元確定為處理單元(s113)。此外,在上述說明中,在閾值等于噪聲音量的情況下,處理單元獲取部145可以將操作移動至處理分支中的任一分支。如上所述,處理單元獲取部145基于噪聲音量從識別字符串中獲取一個或多個處理單元。當將一個或更多個處理單元選為處理目標時,處理器146可以對所選的處理目標進行處理。該配置使得可以更有效地進行對識別字符串的處理。

[1.6.字符串的呈現(xiàn)]

如上所述,顯示控制器147使顯示部130顯示處理單元u1至u3,并且在處理單元u1至u3中的任一個被選為處理目標時,處理器146可以對所選處理目標進行處理。在一個示例中,可能存在操作檢測部143檢測到選擇基于語音的替換操作對象g25的操作(參見圖18)并且輸入語音獲取部142獲取到再輸入語音的情況。在這種情況下,處理器146可以通過將處理目標替換為通過對再輸入語音進行語音識別而獲得的識別字符串來校正處理目標。

在這種情況下,隨著噪聲音量增加,在對再輸入語音進行語音識別中出現(xiàn)錯誤的可能性增加,因此處理單元獲取部145優(yōu)選地增加語音識別的成功率。關(guān)于這一點,再輸入語音越長,對再輸入語音的語音識別成功的可能性越大。因此,優(yōu)選的是處理單元獲取部145隨著噪聲音量的變大而增加處理單元的長度(優(yōu)選地隨著噪聲音量的變大而減少處理單元的數(shù)量)。另一方面,再輸入語音越長,再輸入該語音需要越多時間和精力。因此,優(yōu)選的是處理單元獲取部145隨著噪聲音量的減小而減小處理單元的長度(優(yōu)選地隨著噪聲音量的減小而增加處理單元的數(shù)量)。

然而,即使通過使用語音識別來嘗試校正在語音識別中發(fā)生錯誤的處理目標,該校正也可能會失敗,這取決于用戶語音的習慣、用戶發(fā)出語音的環(huán)境、語音識別引擎的性能等。因此,當用戶從一個或多個校正候選字符串中選擇校正字符串時,處理器146可以通過將處理目標替換為校正字符串來校正處理目標。更具體地,顯示控制器147優(yōu)選地使顯示部130針對每個類別來顯示一個或多個校正候選字符串。這使得用戶可以在每個類別中搜索一個或多個校正候選字符串。

現(xiàn)在描述用于針對每個類別向用戶提供校正候選字符串的數(shù)據(jù)庫。圖11至圖17是示出用于針對每個類別向用戶提供校正候選字符串的數(shù)據(jù)庫的示例的圖。特別地,圖11是示出預測轉(zhuǎn)換類別數(shù)據(jù)庫的示例的圖。在一個示例中,基于語素或詞而從字典數(shù)據(jù)等中預測的詞語搭配等屬于預測轉(zhuǎn)換類別。圖12是示出短語類別數(shù)據(jù)庫的示例的圖。在一個示例中,在輸入的是英語的情況下,通過給輸入的詞添加介詞而獲得的字符串、包括輸入的詞的習語等屬于短語類別。此外,在一個示例中,在輸入的是日語的情況下,通過形態(tài)分析而獲得的語素添加了后置詞綴的字符串等屬于短語類別。

圖13是示出原始形式類別數(shù)據(jù)庫的示例的圖。在一個示例中,在輸入的是英語的情況下,相對于名詞復數(shù)形式的名詞單數(shù)形式屬于原始形式類別,并且相對于動詞過去形式的動詞原型屬于原始形式類別。此外,在一個示例中,在輸入的是日語的情況下,例如與通過形態(tài)分析而獲得的語素相對應的讀音(平假名或片假名)屬于原始形式類別。

圖14是示出先前校正結(jié)果類別數(shù)據(jù)庫的示例的圖。在一個示例中,對與輸入詞相同的詞預先進行校正的結(jié)果屬于先前校正結(jié)果類別。圖15是示出相似聲音類別數(shù)據(jù)庫的示例的圖。圖16是示出相似語義類別數(shù)據(jù)庫的示例的圖。圖17是示出轉(zhuǎn)換形式類別數(shù)據(jù)庫的示例的圖。在一個示例中,在輸入的是英語的情況下,相對于詞原型的復數(shù)形式、現(xiàn)在進行式、過去式、派生的形容詞、派生的副詞、比較級、最高級等屬于轉(zhuǎn)換形式類別。此外,在一個示例中,在輸入的是日語的情況下,其他中文字符候選等屬于轉(zhuǎn)換形式類別。

圖18是示出針對每個類別顯示的校正候選字符串的示例的圖。如圖18所示,假定用戶進行選擇處理單元u1至u3中的處理單元u1“idrove”作為處理目標的操作以對處理單元u1“idrove”進行校正以讀成“idrive”的情況。在這種情況下,顯示控制器147從每個數(shù)據(jù)庫獲取與處理單元u1“idrove”相對應的校正候選字符串,并且將校正候選字符串顯示在字符串顯示欄g18中。在圖18中,將屬于預測轉(zhuǎn)換類別、短語類別和原始類別中每個類別的校正候選字符串顯示在字符串顯示欄g18中作為與處理單元u1“idrove”相對應的校正候選字符串。

然后,在輸入了選擇以該方式顯示的校正候選字符串中的任一個校正候選字符串的操作的情況下,處理器146可以將處理目標“idrove”替換為所選校正候選字符串。在一個示例中,在輸入了選擇在原始形式類別中顯示的校正候選字符串“idrive”的操作的情況下,處理器146可以將處理目標“idrove”替換為所選校正候選字符串“idrive”。此外,基于對字符串顯示欄g18中校正候選字符串均不符合的類別中的滾動操作對象g19進行選擇的操作,顯示控制器147可以通過滾動來顯示屬于該類別的校正候選字符串。

此外,顯示控制器147可以基于預定操作通過滾動來顯示在字符串顯示欄g18中顯示的類別。圖19是示出針對每個類別而顯示的校正候選字符串的另一示例的圖。參照圖19,滾動在字符串顯示欄g18中顯示的類別,從而在字符串顯示欄g18中顯示屬于先前校正結(jié)果類別的校正候選字符串。在一個示例中,當輸入了選擇在先前校正結(jié)果類別中顯示的校正候選字符串“idrive”的操作時,處理器146可以將處理目標“idrove”替換為所選校正候選字符串“idrive”。

在上述說明中,假定了獲取識別字符串“idroveyourcartoairports”的情況。接下來,假定獲取識別字符串“iliveintokyo”的情況。圖20是示出針對每個類別而顯示的校正候選字符串的另一示例的圖。如圖20所示,假定處理單元獲取部145從識別字符串“iliveintokyo”中獲取處理單元u1“ilive”以及處理單元u2“intokyo”的情況。在這種情況下,如圖20所示,顯示控制器147可以使顯示部130顯示這些處理單元u1和u2。

關(guān)于這一點,假定用戶進行選擇處理單元u1和u2中的處理單元u1“ilive”作為處理目標的操作以對處理單元u1“ilive”進行校正以讀成“ileave”的情況。在這種情況下,顯示控制器147從每個數(shù)據(jù)庫中獲取與處理單元u1“ilive”相對應的校正候選字符串,并且將校正候選字符串顯示在字符串顯示欄g18中。在圖20中,將屬于相似聲音類別以及其他識別結(jié)果類別的每個類別的校正候選字符串顯示在字符串顯示欄g18中,作為與處理單元u1“ilive”相對應的校正候選字符串。

然后,在輸入了選擇以該方式顯示的校正候選字符串中的任一個校正候選字符串的操作的情況下,處理器146可以將處理目標“ilive”替換為所選校正候選字符串。在一個示例中,在輸入了選擇在相似聲音類別中顯示的校正候選字符串“ileave”的操作的情況下,處理器146可以將處理目標“ilive”替換為所選校正候選字符串“ileave”。

上述說明假定了獲取識別字符串“iliveintokyo”的情況。接下來,假定獲取識別字符串“iviewthisascredible”的情況。圖21是示出針對每個類別顯示的校正候選字符串的另一示例的圖。如圖21所示,假定處理單元獲取部145從識別字符串“iviewthisascredible”中獲取處理單元u1“iview”、處理單元u2“this”以及處理單元u3“ascredible”的情況。在這種情況下,如圖21所示,顯示控制器147可以使顯示部130顯示這些處理單元u1至u3。

關(guān)于這一點,假定用戶進行選擇處理單元u1和u2中的處理單元u1“iview”作為處理目標的操作以對處理單元u1“iview”進行校正的情況。在這種情況下,顯示控制器147從每個數(shù)據(jù)庫中獲取與處理單元u1“iview”相對應的校正候選字符串,并且將校正候選字符串顯示在字符串顯示欄g18中。在圖21中,將屬于相似語義類別的校正候選字符串顯示在字符串顯示欄g18中,作為與處理單元u1“iview”相對應的校正候選字符串。

然后,在輸入了選擇以該方式顯示的校正候選字符串中的任一個校正候選字符串的操作的情況下,處理器146可以將處理目標“iview”替換為所選校正候選字符串。在一個示例中,在輸入了選擇在相似語義類別中顯示的校正候選字符串“iconsider”的操作的情況下,處理器146可以將處理目標“ilive”替換為所選校正候選字符串“iconsider”。

上述說明假定了獲取識別字符串“iviewthisascredible”的情況。接下來,假定獲取識別字符串“helpme”的情況。圖22是示出針對每個類別顯示的校正候選字符串的另一示例的圖。如圖22所示,假定處理單元獲取部145從識別字符串“helpme”中獲取處理單元u1“help”以及處理單元u2“me”的情況。在這種情況下,如圖22所示,顯示控制器147可以使顯示部130顯示這些處理單元u1和u2。

關(guān)于這一點,假定用戶進行了選擇處理單元u1“help”作為處理目標的操作的情況。在這種情況下,顯示控制器147從每個數(shù)據(jù)庫中獲取與處理單元u1“help”相對應的校正候選字符串,并且將校正候選字符串顯示在字符串顯示欄g18中。在圖22中,將屬于轉(zhuǎn)換形式類別的校正候選字符串顯示在字符串顯示欄g18中,作為與處理單元u1“help”相對應的校正候選字符串。

然后,在輸入了選擇以該方式顯示的校正候選字符串中的任一個校正候選字符串的操作的情況下,處理器146可以將處理目標“help”替換為所選校正候選字符串。然而,當用戶又認為并不特別需要對識別字符串“helpme”進行校正時,用戶可以進行選擇字符串決定操作對象g13的操作。在檢測到選擇字符串決定操作對象g13的操作的情況下,處理器146可以決定識別字符串“helpme”。

盡管描述的是校正候選字符串的示例,但可以向用戶呈現(xiàn)附加候選字符串。附加候選字符串可以是單個字符例如符號、數(shù)字和字母,或者可以是由單個字符的組合形成的表情符號。取決于語音識別引擎的性能,可能無法輸入這種符號、數(shù)字和字母的字符或者表情符號,或者取決于語音識別引擎的類型,可能難以輸入這種符號、數(shù)字和字母的字符或者表情符號。因此,將這種符號、數(shù)字和字母的字符或者表情符號顯示為附加候選字符串對用戶是有用的。

作為特定處理,在用戶從一個或多個附加候選字符串中選擇附加字符串的情況下,處理器146可以將附加字符串添加至識別字符串??梢詫⒏郊幼址砑又敛迦敕朿l所在的位置。在這種情況下,顯示控制器147可以優(yōu)選地使顯示部130針對每個類別來顯示一個或多個附加候選字符串。這使得用戶可以在每個類別中搜索一個或多個校正候選字符串。

接下來,將描述用于針對每個類別向用戶提供附加候選字符串例如符號、數(shù)字和字母字符或者表情符號的數(shù)據(jù)庫。圖23至圖26是示出用于針對每個類別向用戶提供附加候選字符串的數(shù)據(jù)庫的示例的圖。特別地,圖23是示出符號類別數(shù)據(jù)庫的示例的圖。圖24是示出數(shù)字類別數(shù)據(jù)庫的示例的圖。圖25是示出字母類別數(shù)據(jù)庫的示例的圖。圖26是示出表情符號類別數(shù)據(jù)庫的示例的圖。

圖27是示出針對每個類別顯示的附加候選字符串的另一示例的圖。如圖27所示,示出用戶進行將插入符號位置選擇對象b4選為附加位置的操作以將表情符號添加至插入符號位置選擇對象b4的情況。在這種情況下,顯示控制器147從每個數(shù)據(jù)庫獲取附加候選字符串,并且將附加候選字符串顯示在字符串顯示欄g18中。在圖27中,將屬于數(shù)字、字母和表情符號類別中的每個的附加候選字符串顯示在字符串顯示欄g18中作為附加候選字符串。

然后,在輸入了選擇以該方式顯示的附加候選字符串中的任一個附加候選字符串的操作的情況下,處理器146可以將所選的附加候選字符串添加至插入符號位置選擇對象b4的位置。在一個示例中,在輸入了用于選擇顯示在表情符號類別中的附加候選字符串“(-_-)”的操作的情況下,處理器146可以將所選的附加候選字符串“(-_-)”添加至插入符號位置選擇對象b4。此外,基于對字符串顯示欄g18中附加候選字符串均不符合的類別中的滾動操作對象g19進行選擇的操作,顯示控制器147可以通過滾動來顯示屬于該類別的附加候選字符串。

接下來,將描述獲取校正候選字符串的操作。圖28和圖29是示出了獲取校正候選字符串的操作的示例的流程圖。此外,該流程圖僅示出獲取校正候選字符串的操作的示例,因此獲取校正候選字符串的操作不限于該流程圖所示的示例。處理器146獲取字符串a(chǎn)(處理單元)(s201),然后從字符串a(chǎn)中獲取有意義的最小單元的字符串組b。接下來,處理器146從原始形式類別數(shù)據(jù)庫中獲取與字符串a(chǎn)相對應的原始形式字符串c(s203)。

接下來,處理器146通過將補充字符串d添加至屬于字符串組b的字符串來獲取補充附加字符串e(s204)。在字符串組b是英語的情況下,補充字符串d的示例包括介詞。此外,在字符串組b是日語的情況下,補充字符串d的示例包括后置詞綴。接下來,處理器146從轉(zhuǎn)換形式類別數(shù)據(jù)庫獲取與原始形式字符串c相對應的轉(zhuǎn)換形式字符串f(s205)。接下來,處理器146從預測轉(zhuǎn)換類別數(shù)據(jù)庫獲取與字符串a(chǎn)相對應的預測轉(zhuǎn)換形式字符串g(s206)。

接下來,處理器146從相似聲音類別數(shù)據(jù)庫獲取與字符串組b相對應的相似聲音形式信息h(s207)。接下來,處理器146獲取除字符串a(chǎn)之外的識別結(jié)果作為其他識別結(jié)果j(s208)。接下來,處理器146從先前校正結(jié)果類別數(shù)據(jù)庫獲取與字符串a(chǎn)相對應的先前校正結(jié)果k(s209)。接下來,處理器146從相似語義類別數(shù)據(jù)庫獲取與字符串a(chǎn)相對應的相似語義字符串l(s210)。

可以將如上所述獲取的字符串(例如,原始形式字符串c、補充附加字符串e、轉(zhuǎn)換形式字符串f、預測轉(zhuǎn)換形式字符串g、相似聲音形式信息h、先前校正結(jié)果k、其他識別結(jié)果j、先前校正結(jié)果k和相似語義字符串l)顯示在顯示部130上作為校正候選字符串。此外,獲取相應字符串的順序不限于圖28和圖29所示的流程圖中的順序。

[1.7.處理目標的長度的控制]

如上所述,通過對再輸入語音進行語音識別來校正處理目標。然而,在通過對再輸入語音進行語音識別來校正處理目標的情況下,對加長的處理目標進行校正可以提高校正成功率。因此,在決定通過再輸入語音來校正處理目標的情況下,處理器146可以對處理目標的長度進行控制。在一個示例中,在決定通過再輸入語音來校正處理目標的情況下,處理器146可以使處理目標更長。

圖30是被示出用于描述對處理目標的長度進行控制的示例的圖。參照圖30,處理單元獲取部145從識別字符串“idroveyourcartoairports”中獲取處理單元u1“idrove”、處理單元u2“yourcar”以及處理單元u3“toairports”,并且顯示控制器147使顯示部130顯示這些處理單元u1至u3。關(guān)于這一點,如圖30所示,可能存在進行了選擇基于語音的替換操作對象g24的操作并且將處理單元u2選為處理目標的情況。在這種情況下,處理器146可以將包括處理單元u2、處理單元u2前面的處理單元u1以及處理單元u2后面的處理單元u3的新處理目標設置為處理目標。

此外,以上描述針對下述示例給出:在決定通過再輸入語音來校正處理目標的情況下,通過處理器146將處理目標前面和后面的相鄰處理單元包括進來以使該處理目標變長。然而,對處理目標形成多長沒有特別的限制。此外,顯示控制器147可以對處理目標的長度進行控制,然后可以使顯示部130根據(jù)被控制的處理目標的長度來顯示提示語音輸入的消息,從而使用戶知道處理目標的長度。在如圖30所示的示例中,處理目標被擴展成3個處理單元u1至u3,因此顯示控制器147使得顯示消息“請說出彼此相連的三個處理單元”。

此外,在針對再輸入語音進行的語音識別中出現(xiàn)錯誤的可能性可能隨著噪聲音量而變化。因此,在決定通過再輸入語音來校正處理目標的情況下,處理器146可以基于噪聲音量對處理目標的長度進行控制。更具體地,考慮到在針對再輸入語音的語音識別中出現(xiàn)錯誤的可能性隨著噪聲音量的增加而增加。因此,在決定通過語音來校正處理目標的情況下,處理器146可以隨著噪聲音量的增加使處理目標更長。

此外,在決定通過語音來校正處理目標的情況下,處理器146可以在確定是否按照與處理目標的鄰近度的順序來將詞包括在處理目標中時,根據(jù)語音的一部分來確定是否將詞包括在處理目標中。在一個示例中,通常認為要單獨地而不是同時地處理多個名詞,因此顯示控制器147可以允許將直到第二個名詞之前的單詞包括在處理目標中,但是不將第二個名詞包括在處理目標中。

接下來,將描述對處理目標的長度進行控制的操作。圖31是示出對處理目標的長度進行控制的操作的示例的流程圖。此外,該流程圖僅示出對處理目標的長度進行控制的操作的示例,因此對處理目標的長度進行控制的操作不限于該流程圖所示的示例。處理器146激活與處理目標的選擇相關(guān)聯(lián)的校正交互(s301)。如果未使用噪聲音量(s302中為“否”),則處理器146將操作移動至s307。

另一方面,如果使用了噪聲音量(s303中的“是”),則語音識別部144從輸入語音中獲取噪聲音量(s303)。如果噪聲音量低于閾值ha(s304中的“是”),則處理器146在不將處理單元添加至所選處理目標的情況下結(jié)束操作(s305)。另一方面,如果噪聲音量超過閾值ha(s304中的“否”),則處理器146將操作移動至s306。

接下來,如果噪聲音量超過閾值hb(s306中的“否”),則處理器146將識別字符串中包括的全部處理單元設置為一個新的處理單元(s308)并且結(jié)束操作。另一方面,如果噪聲音量低于閾值hb(s306中的“是”),則處理器146將所選處理目標前面和后面的處理目標添加至所選處理目標以產(chǎn)生一個新的處理單元(s307),然后結(jié)束操作。

[1.8.處理單元的數(shù)量的改變]

針對處理單元的長度隨著噪聲音量的增加而增加的示例(處理單元的數(shù)量隨著噪聲音量的增加而減少的示例)給出了以上描述。然而,可能存在以下情況:在語音識別中沒有錯誤的字符串超過用戶設想地被包括在一個處理單元中。因此,在輸入了預定改變操作的情況下,處理單元獲取部145可以改變要被包括在一個或多個處理單元中的至少一個中的處理單元的數(shù)量。在一個示例中,處理單元獲取部145可以確定要劃分的處理單元并且基于進行預定改變操作的位置來確定處理單元的劃分位置,并且可以在劃分位置處對要劃分的處理單元進行劃分。

圖32是被示出用于描述對處理單元的數(shù)量進行改變的示例的圖。參照圖32,示出了通過處理單元獲取部145來獲取處理單元u0“idroveyourcartoairportseveryday”的示例。在這種情況下,如果用戶想將處理單元u0“idroveyourcartoairportseveryday”劃分成“idroveyourcar”和“toairportseveryday”,可以如圖32所示進行預定改變操作以將其劃分成“idroveyourcar”和“toairportseveryday”。預定改變操作不限于特定的操作,并且可以是例如雙擊或長按。

此外,如圖32所示,可能存在操作檢測部143檢測到預定改變操作的情況。在這種情況下,處理單元獲取部145可以決定將處理目標u0作為要劃分的處理單元,并且可以基于進行預定改變操作的位置來決定劃分位置在“idroveyourcar”和“toairportseveryday”之間。然后,處理單元獲取部145可以通過在劃分位置處對要劃分的處理單元u0進行劃分來獲取處理單元u1“idroveyourcar”和處理單元u2“toairportseveryday”。

此外,作為另一示例,處理單元獲取部145可以基于進行預定改變操作的位置來決定要劃分的處理單元,并且可以將要劃分的處理單元劃分成預定的劃分單元。預定的劃分單元可以是有意義的最小單元。對于識別字符串不是被分開書寫的語言而言,有意義的最小單元可以是語素單元,對于識別字符串是分開書寫的語言而言,有意義的最小單元可以是詞單元。

圖33是被示出用于描述對處理單元的數(shù)量進行改變的另一示例的圖。參照圖33,示出了處理單元獲取部14獲取處理單元u0“idroveyourcartoairportseveryday”的示例。在這種情況下,如圖33所示,當用戶想劃分處理單元u0“idroveyourcartoairportseveryday”時,可以對處理單元u0“idroveyourcartoairportseveryday”進行預定改變操作。預定改變操作不限于特定的操作,并且可以是例如雙擊或長按。

此外,如圖33所示,在操作檢測部143檢測到預定改變操作的情況下,處理單元獲取部145可以基于進行預定改變操作的位置來決定要劃分的處理單元。然后,處理單元獲取部145可以將要劃分的處理單元u0劃分成詞單元,從而獲取處理單元u1“i”、處理單元u2“drove”、處理單元u3“your”、處理單元u4“car”、處理單元u5“to”、處理單元u6“airports”、處理單元u7“every”以及處理單元u8“day”。

[1.9.處理單元的刪除]

盡管針對替換處理目標的示例給出了上述說明,然而刪除處理目標的能力為用戶提供方便。因此,在決定要刪除處理目標的情況下,處理器146可以刪除處理目標。圖34是被示出用于描述處理單元的刪除的圖。在一個示例中,如圖34所示,在處理的單元u3“toairports”被選為處理目標的狀態(tài)下,如果檢測到選擇用于刪除處理目標的操作對象g17的操作,則處理單元146可以刪除處理單元u3“toairports”。

[1.10.插入符號位置的選擇]

在上文中,針對將附加字符串添加至插入符號所在的位置的示例給出了說明。在該示例中,在用戶想添加附加字符串的情況下,需要指定插入符號的位置。在這種情況下,用戶有時通過拖拽操作來嘗試指定插入符號。特別地,習慣于需要進行拖動操作以在畫面上移動對象的終端(例如,智能電話等)的用戶可能會嘗試執(zhí)行拖動操作以指定插入符的位置。

然而,可能存在難以檢測拖拽操作的情況。在一個示例中,在通過用戶的視線來檢測用戶的操作的情況下,需要基于用戶的視線來檢測拖拽操作,這可能會劣化拖拽操作的檢測準確度。此外,在一個示例中,在通過分析圖像來檢測用戶的操作的情況下,需要基于圖像的分析結(jié)果來檢測用戶的拖拽操作,這可能會劣化拖拽操作的檢測準確度。因此,優(yōu)選地通過選擇操作(例如,點擊操作)來指定插入符號位置。

具體地,在選擇了顯示的插入符號位置選擇對象的情況下,顯示控制器147可以將插入符號位置選擇對象所在的位置選為插入符號的位置。圖35是被示出用于描述對插入符號位置進行選擇的圖。在一個示例中,如圖35所示,可能存在在處理單元u3被選為處理目標的狀態(tài)下對插入符號位置選擇對象b4進行選擇操作的情況。在這種情況下,顯示控制器147可以將插入符號位置選擇對象b4的位置選為插入符號cl的位置。

圖36是被示出用于描述對插入符號位置進行選擇的圖。在一個示例中,如圖36所示,可能存在在處理單元u3被選為處理目標的狀態(tài)下對插入符號位置選擇對象b3進行選擇操作的情況。在這種情況下,顯示控制器147可以將插入符號位置選擇對象b4的位置選為插入符號cl的位置。

圖37是被示出用于描述對插入符號位置進行選擇的圖。如圖37所示,可能存在在插入符號cl的位置是位置選擇對象b4的位置的狀態(tài)下對用于將插入符號位置移至前面位置的操作對象g15進行選擇操作的情況。在這種情況下,顯示控制器147可以將在插入位置選擇對象b4前面的插入符號位置選擇對象b3的位置選為插入符號cl的位置。

[1.11.處理單元的顯示區(qū)域]

在上文中,針對通過用戶的選擇操作而被選擇的插入符號位置選擇對象的位置被選為插入符號的位置的示例給出了說明。然而,可能存在難以準確地對插入符號位置選擇對象進行選擇操作的情況。在一個示例中,在通過用戶的視線來檢測用戶的操作的情況下,需要基于用戶的視線來檢測選擇操作,這可能會劣化選擇操作的檢測準確度。此外,在一個示例中,在通過分析圖像來檢測用戶的操作的情況下,需要基于圖像的分析結(jié)果來檢測用戶的選擇操作,這可能會劣化選擇操作的檢測準確度。因此,優(yōu)選地通過點擊操作來指定插入符號位置。

具體地,處理單元的顯示區(qū)域被設置成包括左側(cè)區(qū)、中心區(qū)和右側(cè)區(qū)。優(yōu)選地,左側(cè)區(qū)是位于處理單元的左側(cè)的插入符號位置選擇對象的選擇區(qū),中心區(qū)是處理單元的選擇區(qū),而右側(cè)區(qū)是位于處理單元右側(cè)的插入符號位置選擇對象的選擇區(qū)。將陸續(xù)描述在選擇了中心區(qū)、左側(cè)區(qū)和右側(cè)區(qū)的情況下的操作的示例。

圖38是被示出用于描述在選擇了中心區(qū)r0的情況下的操作的圖。如圖38所示,處理單元u1的顯示區(qū)域包括左側(cè)區(qū)r1、中心區(qū)r0和右側(cè)區(qū)r2。關(guān)于這一點,如圖38所示,在檢測到選擇中心區(qū)r0的操作的情況下,處理器146可以將處理單元u1選為處理目標。此外,左側(cè)區(qū)r1、中心區(qū)r0和右側(cè)區(qū)r2中的每個的長度不限于特定的長度。處理器146可以根據(jù)處理單元u1的長度來控制左側(cè)區(qū)r1和右側(cè)區(qū)r2中的每個的長度。

在一個示例中,在處理單元u1的長度超過閾值的情況下,容易進行對左側(cè)區(qū)r1的選擇操作,其可以與對左側(cè)區(qū)r2的選擇操作相當。因此,在處理單元u1的長度超過閾值的情況下,處理器146可以將左側(cè)區(qū)r1的尺寸和右側(cè)區(qū)r2的尺寸設置成彼此相同。另一方面,在一個示例中,在處理單元u1的長度低于閾值的情況下,可以想到在用戶主導臂側(cè)的區(qū)容易作為要被選擇的區(qū)。因此,在處理單元u1的長度低于閾值的情況下,處理器146可以將左側(cè)區(qū)r1和右側(cè)區(qū)r2中在主導臂相反側(cè)的區(qū)設置成比用戶主導臂一側(cè)的區(qū)更窄。

盡管可以以任何方式來確定用戶的主導臂,在一個示例中,處理器146可以根據(jù)用戶用左手指和右手指中的哪個進行選擇基于語音的字符串添加開始操作對象g14的操作來確定主導臂。在一個示例中,處理器146根據(jù)圖像輸入部110輸入的輸入圖像來確定進行選擇基于語音的字符串添加開始操作對象g14的操作的用戶的手指的形狀。然后,處理器146基于手指的形狀來確定用戶使用的是左手指和右手指中的哪個,從而可以基于確定結(jié)果來確定主導臂。

圖39是被示出用于描述在選擇了左側(cè)區(qū)r1的情況下的操作的圖。如圖39所示,在檢測到選擇左側(cè)區(qū)r1的操作的情況下,處理器146可以將位于處理單元u1左側(cè)的插入符號位置選擇對象b1選為插入符號cl的位置。圖40是被示出用于描述在選擇了右側(cè)區(qū)r2的情況下的操作的圖。如圖40所示,在檢測到選擇右側(cè)區(qū)r2的操作的情況下,處理器146可以將位于處理單元u1右側(cè)的插入符號位置選擇對象b2選為插入符號cl的位置。

接下來,將描述在對處理單元的顯示區(qū)域進行選擇的情況下進行的操作。圖41和圖42是示出在選擇的情況下進行的操作的示例的流程圖。此外,這些流程圖僅示出在對處理單元的顯示區(qū)域進行選擇的情況下進行的操作的示例,因此在對處理單元的顯示區(qū)域進行選擇的情況下進行的操作不限于這些流程圖中所示的示例。處理器146將flg設置為假(false)(s401),并且獲取處理單元的長度(s402)。接下來,如果處理單元的長度低于閾值za(s403中的“否”),處理器146將左側(cè)區(qū)r1和右側(cè)區(qū)r2設置成相同尺寸(s404),并且將這兩個區(qū)之間的區(qū)設置為中心區(qū)r0。另一方面,如果處理單元的長度超過閾值za(s403中的“是”),則處理器146將左側(cè)區(qū)r1設置成比右側(cè)區(qū)r2大的尺寸(s405),將這兩個區(qū)之間的區(qū)設置為中心區(qū)r0,并且將flg設置為真(true)(s406)。

接下來,處理器146獲取用戶交互信息(s407),并且獲取交互的左手或右手信息(s408)。如果交互是用用戶的右手進行的(s409中的“是”),則處理器146將操作移動至s412。另一方面,如果交互是用用戶的左手進行的(s409中的“否”)并且flg被設置為假(false)(s410中的“否”),則處理器146將操作移動至s412。如果交互是用用戶的左手進行的(s409中的“否”)并且flg被設置為真(true)(s410中的“是”),則處理器146將右側(cè)區(qū)r2設置成比左側(cè)區(qū)r1更大的尺寸,并且將這兩個區(qū)之間的區(qū)設置為中心區(qū)r0(s411)。

接下來,處理器146獲取交互位置(s412)。如果交互位置在中心區(qū)r0中(s413中的“是”),則處理器146將該處理單元選為處理目標(s414),并且結(jié)束操作。另一方面,如果交互位置在左側(cè)區(qū)r1中(s413中為“否”,然后s415中為“是”),則顯示控制器147將插入符號移動至處理單元的左側(cè)并且結(jié)束操作。

如果交互位置在右側(cè)區(qū)r2中(s413中為“否”,并且s415中為“否”,然后s417中為“是”),則顯示控制部147將插入符號移動至處理單元的右側(cè),然后結(jié)束操作。如果交互位置不在中心區(qū)r0、左側(cè)區(qū)r1和右側(cè)區(qū)r2中的任一個中(s413中為“否”,并且s415中為“否”,然后s417中為“否”),則處理器146結(jié)束操作。

[1.12.顯示形式的修改示例]

針對顯示部130是能夠?qū)嬅嫱队暗阶雷觮b1上表面的投影儀的示例給出了以上描述。然而,顯示部130的顯示形式不限于該示例。圖43是示出了顯示部130的顯示形式的修改示例的圖。如圖43所示,在信息處理系統(tǒng)10是移動終端的情況下,顯示部130可以被設置在移動終端中。移動終端的類型不限于特定的類型,可以是平板電腦終端、智能電話或蜂窩電話。

[1.13.硬件配置示例]

接著,將參照圖44描述根據(jù)本公開內(nèi)容的實施方式的信息處理系統(tǒng)10的硬件配置。圖44是示出根據(jù)本公開內(nèi)容的實施方式的信息處理系統(tǒng)10的硬件配置示例的框圖。

如圖44所示,信息處理系統(tǒng)10包括中央處理單元(cpu)901、只讀存儲器(rom)903以及隨機存取存儲器(ram)905。此外,信息處理系統(tǒng)10可以包括主機總線907、橋接器909、外部總線911、接口913、輸入設備915、輸出設備917、存儲設備919、驅(qū)動器921、連接端口923和通信設備925。在必要時,信息處理系統(tǒng)10還可以包括圖像拍攝設備933和傳感器935。連同或替代cpu901,信息處理系統(tǒng)10可以具有被稱為數(shù)字信號處理器(dsp)或?qū)S眉呻娐?asic)的處理電路。

cpu901用作運算處理單元和控制設備,并且根據(jù)記錄在rom903、ram905、存儲設備919或可移除記錄介質(zhì)927中的各種程序來控制信息處理系統(tǒng)10的總體操作或其一部分。rom903存儲例如由cpu901使用的程序和操作參數(shù)。ram905臨時存儲例如在cpu901的運行中使用的程序和在執(zhí)行程序時適當改變的參數(shù)。cpu901、rom903和ram905經(jīng)由由諸如cpu總線之類的內(nèi)部總線構(gòu)成的主機總線907彼此連接。此外,主機總線907經(jīng)由橋接器909連接至諸如外圍部件互連(pci)/接口總線之類的外部總線911。

輸入設備915是例如由用戶操作的設備例如鼠標、鍵盤、觸摸板、按鈕、開關(guān)和操作桿。輸入設備915可以包括用于檢測用戶聲音的麥克風。輸入設備915可以是例如使用紅外線或其他無線電波的遠程控制設備,或者可以是符合信息處理系統(tǒng)10的操作的諸如蜂窩電話之類的外部連接設備929。輸入設備915包括基于用戶輸入的信息來生成輸入信號并將該輸入信號輸出至cpu901的輸入控制電路。用戶將各種數(shù)據(jù)輸入至信息處理系統(tǒng)10并且通過操作輸入設備915來指示信息處理系統(tǒng)10進行處理操作。此外,稍后將進行描述的圖像拍攝設備933通過對用戶的手或手指等的移動進行拍攝還可以作用為輸入設備。在這種情況下,可以根據(jù)手的移動或手指的取向來確定定點位置。

輸出設備917由能夠視覺地或聽覺地將獲取的信息通知給用戶的設備構(gòu)成。輸出設備917可以是諸如液晶顯示器(lcd)、等離子顯示板(pdp)、有機電致發(fā)光(el)顯示器和投影儀之類的顯示設備,全息顯示設備,諸如揚聲器、頭戴式耳機之類的音頻輸出設備以及打印機設備等。輸出設備917將通過信息處理系統(tǒng)10的處理而獲得的結(jié)果輸出為諸如文本或圖像之類的視頻或者將其輸出為諸如語音或聲音之類的音頻。此外,輸出設備917可以包括例如用于照亮周圍的燈。

存儲設備919是被配置為信息處理系統(tǒng)10的存儲部的示例的數(shù)據(jù)存儲設備。例如,存儲設備919由諸如硬盤驅(qū)動器(hdd)的磁存儲設備、半導體存儲設備、光學存儲設備、和磁光存儲設備構(gòu)成。存儲設備919存儲由cpu901執(zhí)行的程序、各種數(shù)據(jù)、從外部獲得的各種類型的數(shù)據(jù)等。

驅(qū)動器921是用于諸如磁盤、光盤、磁光盤、和半導體存儲器之類的可移除記錄介質(zhì)927的讀寫器,并且合并在信息處理系統(tǒng)10中或者從外部附接到信息處理系統(tǒng)10。驅(qū)動器921讀取記錄在附接的可移除記錄介質(zhì)927中的信息,并將該信息輸出至ram905。此外,驅(qū)動器921還向附接的可移除記錄介質(zhì)927寫入。

連接端口923是用于直接將設備連接至信息處理系統(tǒng)10的端口。連接端口923可以是例如通用串行總線(usb)端口、ieee1394端口、或小型計算機系統(tǒng)接口(scsi)端口。此外,連接端口923可以是例如rs-232c端口、光學音頻終端或高清晰度多媒體接口(hdmi,注冊商標)端口。外部連接設備929連接至連接端口923,從而可以在信息處理系統(tǒng)10與外部連接設備929之間交換各種類型的數(shù)據(jù)。

通信設備925是例如由通信設備等構(gòu)成的通信接口,用于連接至通信網(wǎng)絡931。通信設備925可以是例如用于有線或無線局域網(wǎng)(lan)、藍牙(注冊商標)或無線usb(wusb)的通信卡。此外,通信設備925可以是例如用于光學通信的路由器、用于非對稱數(shù)字用戶線路(adsl)的路由器或用于各種通信的調(diào)制解調(diào)器。通信設備925例如使用因特網(wǎng)或其他通信設備使用諸如tcp/ip之類的預定協(xié)議來發(fā)送和接收信號等。此外,連接至通信設備925的通信網(wǎng)絡931是通過有線或無線連接的網(wǎng)絡,并且例如是因特網(wǎng)、家庭lan、紅外通信、無線電波通信、衛(wèi)星通信等。

圖像拍攝設備933通過使用諸如電荷耦合器件(ccd)或互補金屬氧化物半導體(cmos)之類的圖像傳感器以及用于對圖像傳感器上的對象圖像的成像進行控制的諸如透鏡之類的各種構(gòu)件來拍攝真實空間并生成拍攝的圖像。圖像拍攝設備933可以拍攝靜態(tài)圖像或運動圖像。

傳感器935是例如各種傳感器,例如加速度計、陀螺儀傳感器、地磁傳感器、光電傳感器和聲音傳感器。傳感器935獲取有關(guān)信息處理系統(tǒng)10本身的狀態(tài)的信息,例如信息處理系統(tǒng)10的殼體的姿態(tài)、以及關(guān)于信息處理系統(tǒng)10的周圍環(huán)境的信息例如信息處理系統(tǒng)10周圍的亮度或噪聲。傳感器935還可以包括接收全球定位系統(tǒng)(gps)信號并且測量設備的維度、經(jīng)度和海拔高度的gps傳感器。

針對信息處理系統(tǒng)10的硬件配置的示例給出了以上說明??梢允褂猛ㄓ脴?gòu)件來配置或者可以使用專用于每個部件的功能的硬件來配置上述部件中的每個部件??梢愿鶕?jù)實施時的技術(shù)水平來適當改變這種配置。

<2.結(jié)論>

如上所述,根據(jù)本公開內(nèi)容的實施方式,提供了包括處理單元獲取部145和處理器146的信息處理設備140。處理單元獲取部145基于噪聲音量從通過對第一輸入語音進行語音識別而獲得的第一識別字符串中獲取一個或更多個處理單元。處理器146在一個或更多個處理單元中的任一個處理單元被選為處理目標的情況下對處理目標進行處理。該配置使得可以更有效地處理從輸入語音中識別的字符串。

以上參照附圖描述了本公開內(nèi)容的優(yōu)選實施方式,然而本公開內(nèi)容不限于上述示例。本領(lǐng)域技術(shù)人員可以在所附權(quán)利要求的范圍內(nèi)獲得各種改變和修改,并且應當理解,它們將自然地落入本公開內(nèi)容的技術(shù)范圍內(nèi)。

針對顯示部130的顯示形式的修改示例給出了上述說明,但是顯示部130的顯示形式不限于上述示例。顯示部130可以是例如設置在除了頭戴式顯示器之外的可穿戴終端(例如手表或眼鏡)中的顯示器。此外,顯示部130可以是例如設置在車載導航系統(tǒng)中的顯示器。此外,顯示部130可以是例如在醫(yī)療保健領(lǐng)域使用的顯示器。

針對處理單元獲取部145基于噪聲音量從識別字符串中獲取一個或更多個處理單元的示例給出了以上說明。然而,還可以使用其他噪聲信息來替代噪聲音量。在一個示例中,處理單元獲取部145可以基于噪聲聲壓從識別字符串中獲得一個或更多個處理單元。在這種情況下,處理單元獲取部145可以隨著噪聲聲壓的增加而減少處理單元的數(shù)量。此外,在一個示例中,處理單元獲取部145可以基于噪聲的聲壓級來從識別字符串中獲得一個或多個處理單元。在這種情況下,處理單元獲取部145可以隨著噪聲的聲壓級的增加而減少處理單元的數(shù)量。

可替選地,處理單元獲取部145可以基于噪聲頻率從識別字符串中獲得一個或多個處理單元。

此外,可以產(chǎn)生用于使合并在計算機中的諸如cpu、rom和ram之類的硬件執(zhí)行與上述信息處理系統(tǒng)10的功能等同的功能的程序。此外,還可以提供記錄有該程序的計算機可讀記錄介質(zhì)。

此外,顯示控制器147生成用于將顯示內(nèi)容顯示在顯示部130上的顯示控制信息并且將生成的顯示控制信息輸出至顯示部130,從而可以控制顯示部130使得顯示部130對顯示內(nèi)容進行顯示??梢愿鶕?jù)系統(tǒng)配置適當?shù)馗淖冿@示控制信息的內(nèi)容。

具體地,用于實現(xiàn)信息處理設備140的程序可以是例如網(wǎng)絡應用。在這種情況下,可以使用諸如超文本標記語言(html)、標準通用標記語言(sgml)和可擴展標記語言(xml)之類的標記語言來生成顯示控制信息。

每個部件的位置不限于特定的位置,只要進行上述信息處理系統(tǒng)10的操作即可。在一個特定的示例中,可以將圖像輸入部110、操作輸入部115、語音輸入部120、顯示部130和信息處理設備140設置在經(jīng)由網(wǎng)絡連接的不同設備中。在這種情況下,信息處理設備140對應于例如諸如網(wǎng)絡服務器或云服務器之類的服務器,而圖像輸入部110、操作輸入部115、語音輸入部120以及顯示部130可以對應于經(jīng)由網(wǎng)絡連接至服務器的客戶端。

此外,在本說明書中描述的效果僅是說明性和示例性的效果,不是限制性的。換言之,連同或替代上述效果,根據(jù)本公開內(nèi)容的技術(shù)可以實現(xiàn)根據(jù)本說明書的描述對本領(lǐng)域技術(shù)人員而言明顯的其他效果。

此外,本技術(shù)也可配置如下。

(1)

一種信息處理設備,包括:

處理單元獲取部,被配置成基于噪聲從通過對第一輸入語音進行語音識別而獲得的第一識別字符串中獲取一個或更多個處理單元;以及

處理器,被配置成當所述一個或更多個處理單元中的任一個處理單元被選為處理目標時,對所述處理目標進行處理。

(2)

根據(jù)(1)所述的信息處理設備,

其中,所述處理單元獲取部基于噪聲音量從所述第一識別字符串中獲取所述一個或更多個處理單元。

(3)

根據(jù)(2)所述的信息處理設備,

其中,所述處理單元獲取部隨著所述噪聲音量的增加而減少所述處理單元的數(shù)量。

(4)

根據(jù)(1)至(3)中任一項所述的信息處理設備,還包括:

顯示控制器,被配置成對顯示部進行控制使得所述顯示部顯示所述一個或更多個處理單元。

(5)

根據(jù)(4)所述的信息處理設備,

其中,當從一個或更多個校正候選字符串中選擇了校正字符串時,所述處理器通過將所述處理目標替換為所述校正字符串來校正所述處理目標。

(6)

根據(jù)(5)所述的信息處理設備,

其中,所述顯示控制器使所述顯示部針對每個類別來顯示所述一個或更多個校正候選字符串。

(7)

根據(jù)(4)所述的信息處理設備,

其中,當從一個或更多個附加候選字符串中選擇了附加字符串時,所述處理器將所述附加字符串添加至插入符號所在的位置。

(8)

根據(jù)(7)所述的信息處理設備,

其中,所述顯示控制器使所述顯示部針對每個類別來顯示所述一個或更多個附加候選字符串。

(9)

根據(jù)(1)至(8)中任一項所述的信息處理設備,

其中,當輸入了預定改變操作時,所述處理單元獲取部改變所述一個或更多個處理單元中的至少任一個處理單元中包括的處理單元的數(shù)量。

(10)

根據(jù)(1)至(9)中任一項所述的信息處理設備,

其中,當輸入了第二輸入語音時,所述處理器通過將所述處理目標替換為第二識別字符串來校正所述處理目標,其中所述第二識別字符串是通過對所述第二輸入語音進行語音識別而獲得的。

(11)

根據(jù)(4)所述的信息處理設備,

其中,在選擇了插入符號位置選擇對象時,所述顯示控制器將所述插入符號位置選擇對象所在的位置選為插入符號的位置。

(12)

根據(jù)(11)所述的信息處理設備,

其中,所述處理單元的顯示區(qū)域包括左側(cè)區(qū)、中心區(qū)和右側(cè)區(qū),

其中,所述左側(cè)區(qū)是用于選擇位于所述處理單元左側(cè)的所述插入符號位置選擇對象的區(qū),所述中心區(qū)是用于選擇所述處理單元的區(qū),并且所述右側(cè)區(qū)是用于選擇位于所述處理單元右側(cè)的所述插入符號位置選擇對象的區(qū)。

(13)

根據(jù)(12)所述的信息處理設備,

其中,所述處理器根據(jù)所述處理單元的長度來控制所述左側(cè)區(qū)和所述右側(cè)區(qū)中的每個的長度。

(14)

根據(jù)(1)至(13)中任一項所述的信息處理設備,

其中,當決定要刪除所述處理目標時,所述處理器刪除所述處理目標。(15)

根據(jù)(4)所述的信息處理設備,

其中,當決定要通過語音來校正所述處理目標時,所述處理器控制所述處理目標的長度。

(16)

根據(jù)(15)所述的信息處理設備,

其中,當決定要通過語音來校正所述處理目標時,所述處理器基于噪聲音量來控制所述處理目標的長度。

(17)

根據(jù)(16)所述的信息處理設備,

其中,當決定要通過語音來校正所述處理目標時,所述處理器隨著噪聲音量的增加而增加所述處理目標的長度。

(18)

根據(jù)(16)所述的信息處理設備,

其中,在對所述處理目標的長度進行控制之后,所述顯示控制器根據(jù)所述處理目標的經(jīng)控制的長度來使所述顯示部顯示提示語音輸入的消息。(19)

根據(jù)(15)所述的信息處理設備,

其中,當決定要通過語音來校正所述處理目標時,所述處理器根據(jù)所述處理目標前面和后面的位置中的至少一個位置處存在的詞的語音的一部分來確定是否要將所述詞包括在所述處理目標中。

(20)

根據(jù)(1)所述的信息處理設備,

其中,所述處理單元獲取部基于噪聲的聲壓從所述第一識別字符串中獲取所述一個或更多個處理單元。

(21)

根據(jù)(1)所述的信息處理設備,

其中,所述處理單元獲取部基于噪聲的聲壓級從所述第一識別字符串中獲取所述一個或更多個處理單元。

(22)

一種信息處理方法,所述方法包括:

基于噪聲從通過對第一輸入語音進行語音識別而獲得的第一識別字符串中獲取一個或更多個處理單元;以及

當所述一個或更多個處理單元中的任一個處理單元被選為處理目標時,對所述處理目標進行處理。

(23)

一種用于使計算機作用為信息處理設備的程序,所述信息處理設備包括:

處理單元獲取部,被配置成基于噪聲從通過對第一輸入語音進行語音識別而獲得的第一識別字符串中獲取一個或更多個處理單元;以及

處理器,被配置成當所述一個或更多個處理單元中的任一個處理單元被選為處理目標時,對所述處理目標進行處理。

附圖標記列表

10信息處理系統(tǒng)

110圖像輸入部

115操作輸入部

120語音輸入部

130顯示部

140信息處理設備(控制器)

141輸入圖像獲取部

142輸入聲音獲取部

143操作檢測部

144語音識別部

145處理單元獲取部

146處理器

147顯示控制器

b1-b4插入符號位置選擇對象

cl插入符號

ro中心區(qū)

r1左側(cè)區(qū)

r2右側(cè)區(qū)

u0-u8處理單元

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1