專利名稱:整合語(yǔ)音與手寫輸入的識(shí)別方法及其系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種識(shí)別方法及其系統(tǒng),特別是涉及一種整合語(yǔ)音與手寫輸入的識(shí)別方法及其系統(tǒng)。
背景技術(shù):
目前人機(jī)間的通訊方式,不外乎是以鍵盤、鼠標(biāo)、手寫、語(yǔ)音、影像等方式來進(jìn)行,其中特別是以手寫與語(yǔ)音輸入的方式,由于與人類彼此間所慣用的溝通方式相同,因此廣為產(chǎn)學(xué)界所致力開發(fā)研究,然而因?yàn)槠渥R(shí)別率、輸入速度無法有效提高,故其成果并未完全獲致商業(yè)上的成功。
語(yǔ)音與手寫輸入識(shí)別的技術(shù)發(fā)展上,其相關(guān)技術(shù)已見諸于各類技術(shù)文件中,例如以語(yǔ)音識(shí)別而言,美國(guó)第5,692,097號(hào)專利披露了一種在語(yǔ)音中識(shí)別出字符的方法、美國(guó)第5,129,000號(hào)專利則揭示了一種利用音節(jié)(syllable)進(jìn)行語(yǔ)音識(shí)別的方法,或者如臺(tái)灣第283744號(hào)專利揭示了一種智能型國(guó)語(yǔ)語(yǔ)音輸入方法等等。另一方面,手寫識(shí)別則如美國(guó)第6,226,403號(hào)專利揭示了一種利用輸入筆劃的多寡來進(jìn)行字符識(shí)別的方法,或者如美國(guó)專利第6,275,611號(hào)專利揭示了一種將使用者輸入的字符分解、分類成許多子結(jié)構(gòu)后加以識(shí)別的方法,足見語(yǔ)音與手寫輸入的識(shí)別技術(shù)皆已逐漸成熟。
然而,雖然上述各專利技術(shù)皆致力于算法的改進(jìn)、手寫/語(yǔ)音輸入的特徾(feature)擷取,或是改進(jìn)語(yǔ)音或手寫模型的建立準(zhǔn)則等等,然其識(shí)別率的提高依然相當(dāng)有限,故有人提出整合手寫與語(yǔ)音輸入的訊息以提高識(shí)別率的概念。
其中,美國(guó)專利第6,285,785號(hào)專利披露了一種整合語(yǔ)音與手寫輸入的信息的訊息識(shí)別方法,以下將其全文并入本案作為參考數(shù)據(jù),它所采用的方法是針對(duì)每一字符(word)給予不同的語(yǔ)音或手寫權(quán)重(α,β),例如某一字符以語(yǔ)音輸入的方式較易被正確地識(shí)別出來,因此其語(yǔ)音的權(quán)重α較高而手寫的權(quán)重β較低,而若某一字符以手寫輸入方式較易被正確地識(shí)別,其手寫權(quán)重β自然較語(yǔ)音權(quán)重α為高。
接著,當(dāng)使用者欲進(jìn)行輸入訊息的識(shí)別時(shí),藉由語(yǔ)音輸入與手寫輸入來分別取得二個(gè)包含有許多可能的候選字的字列(list),并依權(quán)重(α,β)來將此二字列合并成為一新的字列,再由其中決定出一相似度最高的字符,因此能夠有效地提高識(shí)別率。
然而,雖然上述方法在識(shí)別率的提高上確能達(dá)到其效果,卻依然存在有許多待解決的問題。首先,由于此種識(shí)別方法需要對(duì)于每一字符進(jìn)行完整的語(yǔ)音與手寫輸入,故其識(shí)別流程過于繁復(fù)而不甚實(shí)用。其次,特別是針對(duì)中文、韓文或日文等東方語(yǔ)系的語(yǔ)言來說,除了因?yàn)樽址墓P劃較富于變化而不利于進(jìn)行完整的手寫輸入外,由于其一字一音的特性,使得同一字符會(huì)具有不同的讀音,或者是同一讀音存在有許多的同音字,皆使得上述整合式的語(yǔ)音與手寫輸入識(shí)別方法不甚適用。
發(fā)明內(nèi)容
因此,本發(fā)明的目的,是提供一種適用于一字一音式的語(yǔ)系并能有效地整合語(yǔ)音、手寫輸入以有效提高識(shí)別率的識(shí)別方法及其系統(tǒng)。
在一較佳實(shí)施例中,本發(fā)明整合語(yǔ)音與手寫輸入的識(shí)別系統(tǒng)包含有一語(yǔ)音輸入裝置、一手寫輸入裝置、一語(yǔ)音相似度估計(jì)器,以及一手寫相似度估計(jì)器。
該語(yǔ)音輸入裝置用來接收一具有至少一字符的語(yǔ)音輸入,并能將該語(yǔ)音輸入轉(zhuǎn)換為一第一信號(hào)。該手寫輸入裝置,用于接收一描繪有該字符之一特征的手寫輸入,并能將該手寫輸入轉(zhuǎn)換為一第二信號(hào)。語(yǔ)音相似度估計(jì)器則能依據(jù)該第一信號(hào)產(chǎn)生一字列,該字列具有多個(gè)與該字符相對(duì)應(yīng)的識(shí)別字符。手寫相似度估計(jì)器則是用于依據(jù)該第二信號(hào),自該字列中取出與該字符最相符合的識(shí)別字符。其中,該字符的特征是構(gòu)成該字符之一部首。
依據(jù)上述架構(gòu),本發(fā)明整合語(yǔ)音與手寫輸入的識(shí)別方法的步驟是先接收一具有一字符的語(yǔ)音輸入,并識(shí)別該語(yǔ)音輸入而產(chǎn)生一字列,該字列具有多個(gè)與該字符相對(duì)應(yīng)的識(shí)別字符,接著再接收一描繪該字符之一特征的手寫輸入,最后依據(jù)該特征,由該字符列中擷取與該字符最相符合的識(shí)別字符。
因此,利用語(yǔ)音與手寫輸入的互補(bǔ)特性,特別是以一字符的完整語(yǔ)音輸入搭配其部分筆劃的手寫輸入,由于提供了較為足夠的信息來進(jìn)行識(shí)別,因此能夠有效地提升識(shí)別率。
圖1是示意圖,說明本發(fā)明整合語(yǔ)音與手寫輸入的識(shí)別系統(tǒng);圖2是一流程圖,說明本發(fā)明整合語(yǔ)音與手寫輸入的識(shí)別方法的步驟;圖3是一流程圖,說明本發(fā)明整合語(yǔ)音與手寫輸入的識(shí)別方法的步驟;圖4是一示意圖,說明一語(yǔ)音數(shù)據(jù)庫(kù)中以同音字所建置出的字列;圖5是一示意圖,說明以手寫輸入來描繪出「縫」字的部首;圖6是一示意圖,說明以手寫輸入來描繪出「縫」字的部分筆劃;圖7是一示意圖,說明以手寫輸入來描繪出「奮」字的部首;以及圖8是一示意圖,說明以手寫輸入來描繪出「炮」字的部首。
附圖標(biāo)記說明1 第一輸入裝置2 第二輸入裝置3 語(yǔ)音模型訓(xùn)練器4 手寫模型訓(xùn)練器5 第一特征擷取器6 第二特征擷取器7 第一相似度估計(jì)器8 第二相似度估計(jì)器
30 語(yǔ)音數(shù)據(jù)庫(kù)40 手寫數(shù)據(jù)庫(kù)50 顯示器21~27步驟201~206 步驟具體實(shí)施方式
本發(fā)明之前述以及其它技術(shù)內(nèi)容、特點(diǎn)與優(yōu)點(diǎn),在以下配合參考圖式之一較佳實(shí)施例的詳細(xì)說明中,將可清楚的明白。
在進(jìn)行詳細(xì)說明之前,要先說明的是,本發(fā)明特別是適用于一字一音式的語(yǔ)言,例如繁體中文、簡(jiǎn)體中文、韓文、日文等等,而在本實(shí)施例中,是以繁體中文來作說明,但不應(yīng)以此作為本實(shí)施例的限制。
參閱圖1,本發(fā)明整合語(yǔ)音與手寫輸入的識(shí)別系統(tǒng)的較佳實(shí)施例包含一第一輸入裝置1、第二輸入裝置2、一語(yǔ)音模型訓(xùn)練器3、一手寫模型訓(xùn)練器4、一第一特征擷取器5、一第二特征擷取器6、一第一相似度估計(jì)器7,以及一第二相似度估計(jì)器8。
第一輸入裝置1是指語(yǔ)音輸入裝置,例如一麥克風(fēng)或換能器(transducer),以及一與麥克風(fēng)相連接的模擬/數(shù)字轉(zhuǎn)換器(ADC)(圖未示),因此能夠接收使用者的語(yǔ)音輸入并將其轉(zhuǎn)換為數(shù)字式之一第一信號(hào)S1。當(dāng)然,對(duì)于使用者的語(yǔ)音信號(hào)輸入,能夠設(shè)定以不同的頻率進(jìn)行取樣或者利用例如快速付里葉轉(zhuǎn)換(FFT)來對(duì)輸入信號(hào)進(jìn)行處理,以便于后續(xù)的識(shí)別步驟進(jìn)行。
第二輸入裝置2是指手寫輸入裝置,例如一觸控板或手寫板等等,能夠供使用者以觸控筆(stylus)或親手書寫,當(dāng)然,此第二輸入裝置2亦具有一模擬/數(shù)字轉(zhuǎn)換器(圖未示),能夠?qū)⑹褂谜咚鶗鴮?、描繪的筆劃、形狀加以取樣、轉(zhuǎn)換為一第二信號(hào)S2,以利后續(xù)的識(shí)別步驟進(jìn)行。
特別要說明的是,第二信號(hào)S2并非皆指一字符的完整手寫輸入,由于一般手寫輸入裝置的設(shè)計(jì)是在一定的時(shí)距內(nèi)供使用者進(jìn)行輸入,若使用者沒有持續(xù)進(jìn)行手寫的動(dòng)作則視為輸入完畢,故此處所指的第二信號(hào)S2乃是使用者在一定的時(shí)距內(nèi)所描繪的圖形、筆劃,而此筆劃可能僅表示一個(gè)字符的部分筆劃、部首,或是其全體。
語(yǔ)音模型訓(xùn)練器3是依據(jù)隱藏式馬可夫模型(hidden Markov model)技術(shù)來識(shí)別使用者藉由第一輸入裝置1所發(fā)出的第一信號(hào)S1,并藉此來建立出個(gè)人的語(yǔ)音模型。而關(guān)于隱藏式馬可夫模型技術(shù)的進(jìn)一步說明,已披露于例如前述的美國(guó)第6,285,785號(hào)專利,或如臺(tái)灣第308666號(hào)專利中,在此不另加以贅述。
同理,手寫模型訓(xùn)練器4是接收使用者藉由第二輸入裝置2所發(fā)出的第二信號(hào)S2,并藉此來建立出個(gè)人的手寫模型。而關(guān)于手寫模型的建立方法,是利用所謂的模式識(shí)別(pattern recognition)技術(shù)來進(jìn)行,此一技術(shù)亦已披露于例如美國(guó)第5,982,929號(hào)專利中,在此不另加以贅述。
此外,本發(fā)明還包含一語(yǔ)音數(shù)據(jù)庫(kù)30與一手寫數(shù)據(jù)庫(kù)40。語(yǔ)音數(shù)據(jù)庫(kù)30中儲(chǔ)存有多個(gè)語(yǔ)音模型、相關(guān)的中文字/詞庫(kù),以及中文文法規(guī)則等數(shù)據(jù)。而手寫數(shù)據(jù)庫(kù)40中則是儲(chǔ)存有多個(gè)手寫模型、相關(guān)的中文字/詞庫(kù),以及中文文法規(guī)則等數(shù)據(jù)庫(kù)。必需說明的是,為了便于下述識(shí)別步驟的進(jìn)行,語(yǔ)音數(shù)據(jù)庫(kù)30中的數(shù)據(jù),是如圖4所示(由上而下分別為ㄈㄥ,ㄈㄥ ㄈㄥ ㄈㄥ ),依據(jù)同一讀音以及使用的頻率來決定,換言之,每一字列皆是由許多同一讀音的識(shí)別字符所構(gòu)成,而在字列中越左邊的識(shí)別字符代表在一般情況下使用頻率越高。另一方面,手寫數(shù)據(jù)庫(kù)40中的數(shù)據(jù),是依據(jù)字符的筆劃多寡,以及部首的筆劃依序排列,而關(guān)于依據(jù)字符的部首、筆劃來建立相關(guān)數(shù)據(jù)庫(kù)的方法亦已披露于例如美國(guó)第6,539,113號(hào)專利中,在此不另贅述。
因此,圖1虛線箭頭所示乃是本發(fā)明在訓(xùn)練模式下所進(jìn)行的數(shù)據(jù)流向,當(dāng)使用者利用第一、第二輸入裝置1、2來進(jìn)行輸入后,語(yǔ)音模型訓(xùn)練器3以及手寫模型訓(xùn)練器4就能夠由依據(jù)第一、第二信號(hào)S1、S2,以及利用語(yǔ)音、手寫數(shù)據(jù)庫(kù)40中的數(shù)據(jù)建立出個(gè)人的語(yǔ)音與手寫模型,并將其分別儲(chǔ)存在語(yǔ)音、手寫數(shù)據(jù)庫(kù)30、40中,以加速識(shí)別步驟的進(jìn)行與識(shí)別率的提升。
第一特征擷取器5與第一輸入裝置1相連接,故第一特征擷取器5能夠接收第一信號(hào)S1,并由第一信號(hào)S1取出第一輸入的特征(向量)V1,此特征向量V1的取出例如在頻域中取出一定范圍內(nèi)的振幅變化,藉此以得到分屬不同頻率的多個(gè)特征向量V1。同理,第二特征擷取器6是與第二輸入裝置2相連接,并能夠取出第二信號(hào)S2的特征,并產(chǎn)生多個(gè)特征向量V2。
第一相似度估計(jì)器7與語(yǔ)音數(shù)據(jù)庫(kù)30以及第一特征擷取器5相連接。第二相似度估計(jì)器8則與手寫數(shù)據(jù)庫(kù)40以及第二特征擷取器6相連接。第一相似度估計(jì)器7能夠依據(jù)語(yǔ)音數(shù)據(jù)庫(kù)30中的語(yǔ)音模型,并依據(jù)第一信號(hào)S1自語(yǔ)音數(shù)據(jù)庫(kù)30中擷取出可能的字列或字符。而由于語(yǔ)音模型的建立,因此可以有效地摒棄不相似的資料,以進(jìn)一步減少第一相似度估計(jì)器7在語(yǔ)音數(shù)據(jù)庫(kù)30中搜尋的時(shí)間。
同理,第二相似度估計(jì)器8依據(jù)手寫數(shù)據(jù)庫(kù)40中的手寫模型,并依據(jù)第二信號(hào)自手寫數(shù)據(jù)庫(kù)40中指定可能的字列或字符。除此之外,第一、第二相似度估計(jì)器7、8相互連接,因此例如第一相似度估計(jì)器7依據(jù)使用者的語(yǔ)音輸入,自語(yǔ)音數(shù)據(jù)庫(kù)30中指定一字列時(shí),第二相似度估計(jì)器8亦能夠依據(jù)其手寫輸入,自第一相似度估計(jì)器7所指定的字列中再指定一個(gè)相符合的識(shí)別字符。
最后,經(jīng)由第一或第二相似度估計(jì)器7、8所指定的識(shí)別字符,最后會(huì)輸出到應(yīng)用程序中,例如Microsoft word,并顯示在顯示器50上。當(dāng)然,上述除了第一、第二輸入裝置1、2以外,其余構(gòu)件的功能是以計(jì)算機(jī)程序碼的方式加以編寫,并供計(jì)算機(jī)執(zhí)行后即能產(chǎn)生上述的功能,而語(yǔ)音、手寫數(shù)據(jù)庫(kù)30、40中的數(shù)據(jù)則是事先加以整理、內(nèi)建,故能供使用者所使用。
因此,藉由上述的架構(gòu)并配合圖2所示,本發(fā)明整合語(yǔ)音與手寫輸入的識(shí)別方法是如步驟21、22所示,首先先接收一第一輸入,也就是利用第一輸入裝置1來接收使用者的語(yǔ)音輸入并加以轉(zhuǎn)換為第一信號(hào)S1,例如說使用者欲輸入一「縫」字,而以語(yǔ)音輸入「ㄈㄥ 」后,藉由第一特征擷取器5以及第一相似度估計(jì)器7的作用,即能夠針對(duì)第一輸入加以辨別,并自語(yǔ)音數(shù)據(jù)庫(kù)30中擷取相對(duì)應(yīng)的數(shù)據(jù),以產(chǎn)生出符合第一輸入的字列,因此所取出的字列應(yīng)如圖3的字列所示,依其使用頻率依序包含有「逢、縫、馮、夆、沨……」等字。
接著,如步驟23所示,可以依據(jù)人為設(shè)定或者程序的默認(rèn)值來指定一預(yù)定時(shí)距,例如2秒,并檢測(cè)在此預(yù)定時(shí)距內(nèi)是否有表示該字符的第二輸入存在。
若在此時(shí)距內(nèi),使用者利用第二輸入裝置2輸入有表示「縫」字符的「特征」,則如步驟24所示,是自字列中取出與第二輸入相對(duì)應(yīng)之一識(shí)別字符。特別要說明的是,使用者輸入此字符的「特征」,在本實(shí)施例中,是表示此字符的部首,因此,如圖5所示,使用者可以輸入「縫」的部首「纟」。
由于第一相似度估計(jì)器7已取出「ㄈㄥ 」音的字列,而此時(shí)再利用第二相似度估計(jì)器8以模式識(shí)別技術(shù),自「ㄈㄥ 」音字列中搜尋此字列中有與「纟」相類似的形狀、部首的識(shí)別字符,因此,可以得知有「纟」字旁的「縫」最符合于第二輸入的限制,所以輸出「縫」字,并如步驟25所示,于顯示器50上顯示出符合第一、第二輸入的識(shí)別字符「縫」。當(dāng)然,為了表示「縫」字的特征,使用者亦可以僅描繪出一部分的筆劃,例如圖6中所示的「幺」,或是表示此識(shí)別字符與其它同音的識(shí)別字符的相異處,亦可供進(jìn)行模式識(shí)別而擷取出「縫」的識(shí)別字符。
同理,另一個(gè)例子是例如使用者欲輸入一「奮」字,則先以語(yǔ)音輸入「ㄈㄣ 」后,即產(chǎn)生包含有識(shí)別字符「份、忿、奮、憤、分、糞、僨、瀵……」等的字列,接著使用者僅需以手寫輸入「奮」的部首「大」,如圖7所示,則以模式識(shí)別技術(shù)即能由該字列中取出「奮」字。
或者例如使用者欲輸入一「炮」字時(shí),能先以語(yǔ)音輸入「ㄆ幺 」,則其相對(duì)應(yīng)的字列依其使用頻率應(yīng)依序包含有「泡、炮、炮、皰、奅、麭、……」等識(shí)別字符,則當(dāng)使用者如圖8所示以手寫輸入一部首「火」時(shí),第二相似度估計(jì)器8自然會(huì)取出包含有「火」部首的「炮」字,當(dāng)然,若此時(shí)使用者是以手寫輸入一部首「大」,則會(huì)相對(duì)應(yīng)地取出「奅」字。凡此種種,其例不勝枚舉,本發(fā)明的識(shí)別方法有效地利用了中文字的特性,故使用者僅需以語(yǔ)音輸入加上手寫輸入部份筆劃或部首即可以達(dá)到快速輸入與高識(shí)別率的目的。
另一方面,如步驟26、27所示,若無第二輸入存在,則僅是一單純的語(yǔ)音識(shí)別而已,因此會(huì)依據(jù)使用者所輸入的語(yǔ)音「ㄈㄥ 」,并依據(jù)使用上的頻率,自「ㄈㄥ 」音的字列中取出最常使用的識(shí)別字符,即「逢」字。當(dāng)然,在僅有語(yǔ)音輸入的情形下,其識(shí)別率并無法提高,除非使用者所欲輸入的字符恰好等于使用頻率最高的識(shí)別字符。
此外,參閱圖3,本發(fā)明亦可如步驟201~203所示,當(dāng)使用者輸入「ㄈㄥ 」音后,直接在顯示器50上顯示最常使用的識(shí)別字符「逢」,若使用者發(fā)現(xiàn)「逢」并非其欲輸入的「縫」字,則可在一定時(shí)距內(nèi)再施以第二輸入(纟字旁),則如步驟204、205所示,本發(fā)明會(huì)依據(jù)第二輸入自字列中取出識(shí)別字符「縫」,并如步驟206所示,以「縫」來置換先前的「逢」字,因此校正了原先識(shí)別錯(cuò)誤的字符。
由于中文字特性的緣故,故往往相同讀音的眾多字符中,其各個(gè)字符在書寫上的混淆度卻不高,例如「逢、縫、馮、夆、沨……」,其部首以及筆順皆相去甚遠(yuǎn)。因此利用語(yǔ)音與手寫輸入的互補(bǔ)特性,使得使用者在念出讀音后,再輔以該字的部首或部分筆劃,即能夠有效地提高字符的識(shí)別率,并且不需要使用者將筆劃繁多的中文字體書寫完畢,因此能夠加快輸入與識(shí)別的效率,確實(shí)實(shí)現(xiàn)本發(fā)明的目的。
如上所述,僅為本發(fā)明的較佳實(shí)施例而已,而不能以此限定本發(fā)明實(shí)施的范圍,凡依本發(fā)明權(quán)利要求及說明書內(nèi)容所作的簡(jiǎn)單的等效變化與修飾,皆應(yīng)仍屬本發(fā)明專利涵蓋的范圍內(nèi)。
權(quán)利要求
1.一種整合語(yǔ)音與手寫輸入的識(shí)別方法,其特征在于包含下列步驟A)接收一具有一字符的語(yǔ)音輸入;B)識(shí)別該語(yǔ)音輸入而產(chǎn)生一字列,該字列具有多個(gè)與該字符相對(duì)應(yīng)的識(shí)別字符;C)接收一描繪該字符之一特征的手寫輸入;以及D)依據(jù)該特征,由該字符列中擷取與該字符最相符合的識(shí)別字符。
2.如權(quán)利要求1所述的識(shí)別方法,其中,該步驟D)中,該手寫輸入是描繪出構(gòu)成該字符之一部分筆劃。
3.如權(quán)利要求2所述的識(shí)別方法,其中,該一部分筆劃是該字符的部首。
4.如權(quán)利要求1所述的識(shí)別方法,還包含一于該步驟B)與該步驟C)之間,顯示一該字列中最常使用的識(shí)別字符的步驟E)。
5.如權(quán)利要求4所述的識(shí)別方法,還包含一于該步驟D)之后,顯示與該字符最相符合的識(shí)別字符以置換與該最常使用的識(shí)別字符的步驟F)。
6.一種整合語(yǔ)音與手寫輸入的識(shí)別方法,其特征在于包含下列步驟接收表示有一字符之一第一輸入;識(shí)別該第一輸入,并產(chǎn)生一字列,該字列具有多個(gè)與該字符相對(duì)應(yīng)的識(shí)別字符;檢測(cè)在一預(yù)定時(shí)距內(nèi)是否有一表示有該字符的第二輸入;以及當(dāng)該第二輸入存在時(shí),依據(jù)該第二信號(hào)由該字列中擷取與該字符相符合的識(shí)別字符,其中,該第一輸入是一語(yǔ)音輸入與一手寫輸入其中之一,該第二輸入是該語(yǔ)音輸入與該手寫輸入其中另一。
7.如權(quán)利要求6所述的識(shí)別方法,還包含一接收該第一輸入后,將該第一輸入轉(zhuǎn)換為一第一信號(hào)的步驟,以及一接收該第二輸入后,將該第二輸入轉(zhuǎn)換為一第二信號(hào)的步驟。
8.如權(quán)利要求7所述的識(shí)別方法,還包含一由該第一信號(hào)中擷取該第一輸入的特征的步驟,以及一由該第二信號(hào)中擷取該第二輸入的特征的步驟。
9.如權(quán)利要求6所述的識(shí)別方法,還包含一當(dāng)該第二輸入不存在時(shí),由該字列中擷取一最常使用的識(shí)別字符的步驟。
10.如權(quán)利要求9所述的識(shí)別方法,還包含一顯示該最常使用的識(shí)別字符的步驟。
11.如權(quán)利要求6所述的識(shí)別方法,還包含一顯示與該字符相符合的識(shí)別字符的步驟。
12.一種整合語(yǔ)音與手寫輸入的識(shí)別系統(tǒng),其特征在于包含一語(yǔ)音輸入裝置,用于接收一具有一字符的語(yǔ)音輸入,并能將該語(yǔ)音輸入轉(zhuǎn)換為一第一信號(hào);一手寫輸入裝置,用于接收一描繪有該字符之一特征的手寫輸入,并能將該手寫輸入轉(zhuǎn)換為一第二信號(hào);一語(yǔ)音相似度估計(jì)器,用于依據(jù)該第一信號(hào)產(chǎn)生一字列,該字列具有多個(gè)與該字符相對(duì)應(yīng)的識(shí)別字符;以及一手寫相似度估計(jì)器,用于依據(jù)該第二信號(hào),自該字列中取出與該字符最相符合的識(shí)別字符。
13.如權(quán)利要求12所述的識(shí)別系統(tǒng),其中,該字符的特征是構(gòu)成該字符的一部首。
14.如權(quán)利要求12所述的識(shí)別系統(tǒng),還包含一儲(chǔ)存有多個(gè)語(yǔ)音模型的語(yǔ)音數(shù)據(jù)庫(kù),該等語(yǔ)音模型是供該語(yǔ)音相似度估計(jì)器對(duì)該第一信號(hào)進(jìn)行比對(duì),進(jìn)而產(chǎn)生該字列。
15.如權(quán)利要求12所述的識(shí)別系統(tǒng),還包含一語(yǔ)音特征擷取器,是用于自該第一信號(hào)中擷取出該語(yǔ)音輸入的特征,并將該特征傳送至該語(yǔ)音相似度估計(jì)器上。
16.如權(quán)利要求12所述的識(shí)別系統(tǒng),還包含一儲(chǔ)存有多個(gè)手寫模型的手寫數(shù)據(jù)庫(kù),該等手寫模型是供該手寫相似度估計(jì)器依據(jù)該第二信號(hào)自該字列中進(jìn)行比對(duì),進(jìn)而擷取與該字符最相符合的識(shí)別字符。
17.一種整合語(yǔ)音與手寫輸入的識(shí)別系統(tǒng),其特征在于包含一第一輸入裝置,用于接收一表示有一字符的第一輸入,并能將該第一輸入轉(zhuǎn)換為一第一信號(hào);一第二輸入裝置,用于接收表示有該字符的第二輸入,并能將該第一輸入轉(zhuǎn)換為一第二信號(hào);一第一相似度估計(jì)器,用于依據(jù)該第一信號(hào)產(chǎn)生一字列,該字列具有多個(gè)字符相對(duì)應(yīng)的識(shí)別字符;以及一第二相似度估計(jì)器,用于依據(jù)該第二信號(hào),自該字符列中取出與該字符最相符合的識(shí)別字符,其中,該第一輸入是一語(yǔ)音輸入與一手寫輸入其中之一,該第二輸入是該語(yǔ)音輸入與該手寫輸入其中另一。
18.如權(quán)利要求17所述的識(shí)別系統(tǒng),還包含一儲(chǔ)存有多個(gè)語(yǔ)音模型的語(yǔ)音數(shù)據(jù)庫(kù),以及一儲(chǔ)存有多個(gè)手寫模型的手寫數(shù)據(jù)庫(kù),該等數(shù)據(jù)庫(kù)其中之一是能供該第一相似度估計(jì)器對(duì)該第一信號(hào)進(jìn)行比對(duì),進(jìn)而產(chǎn)生該字列,該等數(shù)據(jù)庫(kù)其中另一則是供該第二相似度估計(jì)器對(duì)該第二信號(hào)進(jìn)行比對(duì),進(jìn)而由該字列中取出與該字符最相符合的識(shí)別字符。
19.如權(quán)利要求17所述的識(shí)別系統(tǒng),還包含一第一特征擷取器,以及一第二特征擷取器,該第一特征擷取器是能夠由該第一信號(hào)取出該第一輸入的特征,并將該第一輸入的特征傳送至該第一相似度估計(jì)器上,該第二特征擷取器則是能由該第二信號(hào)取出該第二輸入的特征,并將該第二輸入的特征傳送至該第二相似度估計(jì)器上。
20.一種計(jì)算機(jī)可讀取的記錄媒體,其特征在于包含多個(gè)能供一計(jì)算機(jī)執(zhí)行以進(jìn)行下述步驟的計(jì)算機(jī)程序碼接收一具有一字符的語(yǔ)音輸入;識(shí)別該語(yǔ)音輸入而產(chǎn)生一字列,該字列具有多個(gè)與該字符相對(duì)應(yīng)的識(shí)別字符;接收一描繪該字符之一特征的手寫輸入;以及依據(jù)該特征,由該字符列中擷取與該字符最相符合的識(shí)別字符。
21.如權(quán)利要求20所述的記錄媒體,其中,該字符的特征是構(gòu)成該字符之一部首。
22一種計(jì)算機(jī)可讀取的記錄媒體,包含多個(gè)供一計(jì)算機(jī)執(zhí)行以進(jìn)行如權(quán)利要求6所述的步驟的計(jì)算機(jī)程序碼。
全文摘要
一種整合語(yǔ)音與手寫輸入的識(shí)別方法,是先接收一具有一字符的語(yǔ)音輸入后,識(shí)別該語(yǔ)音輸入而產(chǎn)生一字列,且該字列具有多個(gè)與該字符相對(duì)應(yīng)的識(shí)別字符,接著并接收一描繪該字符之一特征的手寫輸入,最后依據(jù)該特征由該字符列中擷取與該字符最相符合的識(shí)別字符,因此可以有效地整合語(yǔ)音與手寫輸入,并藉此提高識(shí)別率。
文檔編號(hào)G10L15/00GK1549244SQ0312393
公開日2004年11月24日 申請(qǐng)日期2003年5月22日 優(yōu)先權(quán)日2003年5月22日
發(fā)明者黃昭世 申請(qǐng)人:宏碁股份有限公司, 宏 股份有限公司