一種中文語音輸入法及語句定位與糾錯(cuò)方法
【技術(shù)領(lǐng)域】:
[0001 ] 本發(fā)明應(yīng)用于臺(tái)式電腦、筆記本電腦、手機(jī)、平板電腦及其他語音輸入的平臺(tái)。
【背景技術(shù)】:
[0002] 隨著語音輸入技術(shù)的飛速發(fā)展以及在手機(jī)上的普及應(yīng)用,人們對(duì)于打字技術(shù),越 來越青睞和追求【君子動(dòng)口不動(dòng)手】的境界。目前的語音輸入法技術(shù)基本上是語音輸入系統(tǒng) 在獲取人的語音后,對(duì)語音信號(hào)直接進(jìn)行解碼得到文字,然后反饋給用戶。這種語音解碼的 輸入模式,其語音分析結(jié)果受制于語音速度,停頓時(shí)間,因而導(dǎo)致識(shí)別率差,準(zhǔn)確率不高。而 且,語音輸入解析后得到的文字,是直接進(jìn)入文檔中,發(fā)生文字識(shí)別錯(cuò)誤時(shí),修改費(fèi)時(shí)費(fèi)力。
[0003] 本發(fā)明通過采用將用戶口音矯正為普通話標(biāo)準(zhǔn)音,再轉(zhuǎn)換為鍵盤漢語拼音,其語 音分析結(jié)果相當(dāng)于漢語拼音打字,它不受語音速度和停頓時(shí)間的影響,再加上利用系統(tǒng)拼 音字詞庫、語料庫和云輸入技術(shù),大大的提高了語音識(shí)別的準(zhǔn)確率;同時(shí),本發(fā)明采用輸入 法界面,語音輸入轉(zhuǎn)換的文字不是直接上屏幕文檔而是緩存在輸入法界面的語句行中,并 且對(duì)語句漢字采用數(shù)字標(biāo)序定位,大大的方便了語音識(shí)別錯(cuò)誤的修改。
【發(fā)明內(nèi)容】
:
[0004] -種中文語音輸入法及語句定位與糾錯(cuò)方法,其特征是:將人類語言同步轉(zhuǎn)化成 鍵盤語言(即將語音輸入同步轉(zhuǎn)換為拼音輸入)并同步識(shí)別出漢字緩存在輸入法界面語句 行,并對(duì)語句行漢字及拼音音節(jié)用數(shù)字序標(biāo)定位并糾正錯(cuò)誤,語音輸入流程包括語音過濾、 語音矯正、語言轉(zhuǎn)換,漢字識(shí)別、序標(biāo)定位、漢字糾錯(cuò)等過程,其中:
[0005] 語音過濾過程的功能是:將由話筒傳輸過來的語音(包括周圍環(huán)境噪音和雜音), 通過設(shè)置聲音的振幅、頻率、波長、聲響、音調(diào)、音色等各種技術(shù)參數(shù)的閾值,過濾各種噪音 及雜音甄別出當(dāng)前行為人的語音(即實(shí)施中文輸入行為者的口音)。
[0006] 語音矯正過程的功能是:將行為人的非標(biāo)準(zhǔn)普通話語音(即行為人的口音)同步 校正為系統(tǒng)預(yù)置的標(biāo)準(zhǔn)普通話語音。
[0007] 語言轉(zhuǎn)換過程的功能是:將人類語言同步轉(zhuǎn)換為鍵盤語言,即將人的標(biāo)準(zhǔn)普通話 語音流同步轉(zhuǎn)換為鍵盤漢語拼音音節(jié)序列。
[0008] 漢字識(shí)別過程的功能是:同步對(duì)照漢語拼音識(shí)別出漢字并輸出到輸入法界面語句 行。
[0009] 序標(biāo)定位過程的功能是:在語句行的漢字及音節(jié)正下方用數(shù)字序標(biāo)定位標(biāo)序。 [0010] 漢字糾錯(cuò)過程的功能是:應(yīng)用序標(biāo)定位功能,糾正語音輸入中識(shí)別錯(cuò)誤的漢字。 [0011] 使用語音輸入法,先要開啟語音輸入法界面,界面由語句行和候選漢字版面組成。
[0012] 語句行是長條框,分文本行與拼音行,文本行緩存語句漢字,拼音行緩存語句拼音 音節(jié)序列,語音輸入識(shí)別轉(zhuǎn)換而來的漢字不是直接上屏幕而是先緩存顯示在輸入法界面的 語句行中,語句行可顯示20個(gè)漢字,當(dāng)語句超過20個(gè)漢字時(shí),前面的漢字會(huì)自動(dòng)頂入屏幕。 按【空格】或【回車】鍵,可把語句行文字輸上屏幕。 CN 105117034 A 兄明 2/3 頁
[0013] 在語句行中緩存顯示的漢字,系統(tǒng)會(huì)用數(shù)字在漢字正下方定位標(biāo)序,前10個(gè)漢 字以數(shù)字①、②、③、④、⑤、⑥、⑦、⑧、⑨、◎的排序方式定位標(biāo)序,后10個(gè)漢字以數(shù)字〇、 θ、Θ、?、β、Θ、β、Θ、Φ、Θ的排序方式定位標(biāo)序;(本方案,在具體的軟件輸入法 中,前10個(gè)數(shù)字序標(biāo)也可以用綠色1234567890來標(biāo)識(shí),后10個(gè)數(shù)字序標(biāo)也可采用紅色 1234567890 來標(biāo)識(shí))。
[0014] 語句行中的漢語拼音,用音節(jié)分隔符【·】自然分割,一個(gè)音節(jié)對(duì)應(yīng)于一個(gè)漢字, 一個(gè)漢字對(duì)應(yīng)于一個(gè)音節(jié),系統(tǒng)在對(duì)漢字定位標(biāo)序的同時(shí)也用相同序標(biāo)對(duì)拼音音節(jié)定位標(biāo) 序。
[0015] 候選漢字版面為分欄式方形框,位于語句行上面,顯示當(dāng)前語音的候選字詞。
[0016] 語音輸入,難免會(huì)發(fā)生兩種錯(cuò)誤:一種是口語語音矯正為普通話標(biāo)準(zhǔn)音時(shí)發(fā)生錯(cuò) 誤,從而導(dǎo)致轉(zhuǎn)換的漢語拼音錯(cuò)誤,識(shí)別的漢字錯(cuò)誤;一種是普通話標(biāo)準(zhǔn)音轉(zhuǎn)換成漢語拼音 時(shí)發(fā)生同音字錯(cuò)誤。當(dāng)語音輸入發(fā)生漢字識(shí)別錯(cuò)誤時(shí),可采用下列方法修改:
[0017] 方法一,語句移位修改:按錯(cuò)誤字前面字的序標(biāo)號(hào),讓錯(cuò)誤字前面的所有正確字上 屏幕,剩余的漢字重新定位標(biāo)序,同時(shí),光標(biāo)反白定位在錯(cuò)誤字上,選取正確候選字替代錯(cuò) 誤字,或者重新輸入正確的語音。
[0018] 序標(biāo)為①、②、③、④、⑤、⑥、⑦、⑧、⑨、◎的漢字,直接按鍵盤上的數(shù)字鍵上屏幕; 序標(biāo)為0、?、?、0、Θ、Θ、β、?、?、Θ的漢字,按【〇+數(shù)字】上屏幕。
[0019] 方法二,光標(biāo)定位修改:移動(dòng)光標(biāo),定位到錯(cuò)誤字處修改,當(dāng)光標(biāo)定位漢字時(shí),漢字 會(huì)反白顯示。
[0020] 方法三,序標(biāo)定位修改:序標(biāo)為①、②、③、④、⑤、⑥、⑦、⑧、⑨、◎的漢字,按 【Ctrl+數(shù)字】,一鍵快速定位到錯(cuò)誤字處;序標(biāo)為〇、?、β、?、β、Θ、β、?、Θ、Θ 的漢字,按【Alt+數(shù)字】,一鍵快速定位到錯(cuò)誤字處。
[0021] 采用光標(biāo)定位修改和序標(biāo)定位修改,光標(biāo)在定位和反白漢字的同時(shí)也定位和反白 漢字對(duì)應(yīng)的拼音音節(jié)。
[0022] 本方案用來給漢字及音節(jié)定位標(biāo)序的序標(biāo),不限定于①、②、③、④、⑤、⑥、⑦、⑧、 ⑨、◎、0、β、Θ、?、θ、Θ、β、θ、?、Θ序列,可以采用其他數(shù)字形式、字母或者符 號(hào)組合標(biāo)序,也可以同時(shí)采用1、2、3、4、5、6、7、8、9、0以前后組不同的顏色區(qū)分來標(biāo)序;序 標(biāo)的位置,不限定于漢字及音節(jié)的正下方,也可以在正上方,或是上標(biāo)或下標(biāo)。
【附圖說明】
[0023] 圖1:語音輸入流程圖。
[0024] 圖2 :語音輸入過程輸入法界面示意圖。
[0025] 圖3 :語句修改--語句移位。
[0026] 圖4 :語句修改--光標(biāo)定位或序標(biāo)定位。
【具體實(shí)施方式】:
[0027] 要使用語音輸入,必須先開啟語音輸入法,顯示輸入法界面。按【空格】或【回車】 鍵,可把語句行文字輸上屏幕文檔。
[0028] 當(dāng)用戶對(duì)著話筒說【語音輸入