專利名稱:計算機軟件的編程方法
技術(shù)領(lǐng)域:
本發(fā)明涉及辦公設(shè)備中的計算機,特別是計算機鍵盤及語音軟件。
背景技術(shù):
已有技術(shù)的計算機對于不能盲打(操作時不看鍵盤)的人來說,視線要在鍵盤和屏幕之間頻繁的更換,這樣一方面是眼睛容易疲勞另一方面也費時間,還有一個問題,在輸入時有時輸錯了當時也不知道,在輸入較長的數(shù)字時,有時輸完以后需要核對一遍,以上輸入方面的這兩個問題主要是占用時間和眼睛容易疲勞。另一個問題是屏幕輻射對人體有一定的危害。再一個問題是語音的認讀不易理解。
發(fā)明內(nèi)容
為了解決上述問題,本發(fā)明的目的是提供一種視線可以不在鍵盤和屏幕之間頻繁的更換的鍵盤,和輸入與較對同時進行的方法,及便于聽懂的語音軟件。
為了達到上述目的,本發(fā)明是這樣實現(xiàn)的,在鍵盤上設(shè)置一個小屏幕,顯示在大屏幕上的內(nèi)容同時顯示在小屏幕上,因為所擊的鍵與小屏幕同在一個視野之內(nèi),所以視線可以不在鍵盤和屏幕之間頻繁的更換了;在屏幕上出現(xiàn)圖像的同時,發(fā)音系統(tǒng)同時也發(fā)出相同內(nèi)容的提示音;還有一個把連續(xù)錄音切分成單音的軟件系統(tǒng)。
這樣既視線可以不在鍵盤和屏幕之間頻繁的更換,又可以邊輸入邊校對,同時提示音也容易聽懂了。
圖1是已有技術(shù)的計算機語音系統(tǒng),讀的一個短語的時間分布情況示意圖。
圖2是朗誦或口語時,讀的與圖一同一個短語的時間分布情況示意圖。
圖3是有小屏幕的計算機鍵盤的俯視圖。
具體實施例方式
如圖1至圖3所示,現(xiàn)在的計算機的輸入基本是這樣的,鍵盤的信號傳入中央處理器,中央處理器將處理過的信息再傳入顯示器,操作者根據(jù)顯示的正誤而決定取舍,由此看來輸入過程中顯示器的作用僅僅在于辨正誤以定取舍上,計算機的鍵盤8橫向共有六列,從空格鍵往上數(shù)第五列與第六列之間,有一個橫向分格檔9,將該分格檔加寬至12毫米左右(以能滿足需要為度),在該分格檔上設(shè)置一個長形的液晶屏幕,長形液晶屏幕的右端在輸入漢字時是五個備選字屏幕11,備選字的左邊是15個已確定字的屏幕10,備選字屏幕11與已確定字的屏幕10之間有一個分界線12,每增加一個新確定的字,已確定的15個字就依次向左移一個字位,新確定的這個字總是在15個字的最右端,將中央處理器發(fā)送到顯示器的信號,同時發(fā)送到在分格檔上設(shè)置的長形液晶屏幕上,因為長形的液晶屏幕就在所擊的鍵的視野之內(nèi)。所以隨時可以辨正誤以定取舍,而視線不用在鍵盤和屏幕之間頻繁的更換,這樣一方面解決了眼睛容易疲勞的問題,另一方面也節(jié)省了時間,還有在漢字輸入中,雖然有時一個字要輸好幾個字母,但是有時只輸了一個字母在備選框中就出現(xiàn)目的字,因為長形的液晶屏幕就在所擊的鍵的視野之內(nèi),所以隨時可以發(fā)現(xiàn)備選框中出現(xiàn)的目的字,立刻就可以確認,省去了以后的字母輸入,因此而節(jié)省時間提高效率。如果把分格檔上設(shè)置的長形液晶屏幕上右端的五個備選字框,每一個字框都做成一個獨立的鍵或觸摸屏,每一個字框鍵由左至右1、2、3、4、或5都和鍵盤第五列的1、2、3、4、或5相并聯(lián),在輸入中文時直擊備選字框中,所選中的字就可以了,這樣就更快捷了,又根據(jù)在輸入過程中顯示器的作用僅僅在于辨正誤以定取舍,而現(xiàn)在在分格檔上設(shè)置的長形液晶屏幕完全能勝任這個任務(wù),所以在輸入時可以關(guān)掉顯示器以減少輻射。
在當前的輸入法中,預(yù)期的使用者都是熟練掌握鍵盤指法,并僅僅輸入現(xiàn)代漢語的用戶。在這種情況下,指法不熟練的人和想輸入古漢語的使用者感到輸入法有極大的不方便。下面的技術(shù)采用科學(xué)的統(tǒng)計方法,并重點在確認文字的方式上進行了改良。
本方法采用基于語用統(tǒng)計的智能輸入為內(nèi)核,其原理是主要利用語用統(tǒng)計的數(shù)據(jù)來消化同音字、詞,以及化解歧義分詞。在學(xué)科分類中屬于運籌學(xué)范疇。使用概率統(tǒng)計運籌決策的方案很多,本方法通過統(tǒng)計字字相關(guān)的同現(xiàn)概率矩陣來完成漢語語用統(tǒng)計庫結(jié)構(gòu),這個矩陣的大小是固定不變的,只與字符集的大小有關(guān)。在使用中,要求用戶在使用之前盡量提供已有的輸入材料,或者相關(guān)的資料,以提前訓(xùn)練字庫,避免了常規(guī)方法在開始階段,判誤率高的問題,為不熟練的使用者節(jié)省時間。通過搜索大量語料,系統(tǒng)給出了一個N×N的同現(xiàn)概率矩陣。該設(shè)計根據(jù)分詞后的輸入語句查找知識庫,用句法、詞法、語義和自定義的規(guī)則作為制約對文章進行解析推理,當存在同音詞時,采用最優(yōu)評價法來確定最佳選擇作為轉(zhuǎn)換結(jié)果。同音詞的評價值,需要考慮詞性、同現(xiàn)概率、近期使用狀況等因素。具有最優(yōu)評價值的選擇即為轉(zhuǎn)換結(jié)果。當具有最優(yōu)評價值的第一選擇并非目標選擇時,人工修正被記錄,作為下次轉(zhuǎn)換時修改計算評價值因素的依據(jù),也就是自學(xué)習(xí)功能。本方法的另一優(yōu)勢在于降低鍵選率,當輸入不熟練時或者輸入古文時,用戶不會進行連續(xù)輸入。這樣,本方法最多允許用戶輸入兩個未確定漢字(輸入窗口為兩個漢字)。在輸入確認上,系統(tǒng)同步輸出輸入漢字的讀音,比如輸入“han”,系統(tǒng)會朗讀“漢字、寒冷”等一系列以“han”開頭的字。如果用戶聽到的和想輸入的字相同,直接點擊小鍵盤區(qū)的任何鍵。系統(tǒng)便停止朗讀,此時用戶可以調(diào)整輸入的字,方法是將鍵盤劃分為兩個區(qū)域,左區(qū)域和右區(qū)域,區(qū)域的劃分以鍵盤輸入法的左右手輸入?yún)^(qū)域劃分。用戶如想調(diào)整為上一個朗讀的字,便用左手的任意兩個手指同時敲擊左區(qū)域,無論敲擊到哪兩個左區(qū)域的鍵都可以。同理,選定下一個的時候,用右手同樣操作。這樣,大大簡化了選字的難度。如果在設(shè)定的時間之內(nèi),用戶沒有進行左右區(qū)域的雙鍵選定,該漢字就算選定,輸入窗口繼續(xù)向前移動。
還有一個最重要的問題就是計算機讀出的音不易聽懂,本發(fā)明用一種連續(xù)錄音單個切分的方法,及語言環(huán)境識別等,向正常的朗誦和口語靠攏,如圖所示,圖1是計算機讀的一段短語,圖2是用口語較慢速度讀的同一段短語,從圖1與圖2所用的時間來看相差不多,圖1所用的時間1,不包括最后的句號,圖2所用的時間與圖1同,它包括了最后的句號,究其計算機讀出的音不易聽懂的原因,第一個原因是現(xiàn)在計算機讀出的音它的時間間隔是一樣的2,并且是兩字之間有一個很小的無音的時間4,而我們在朗讀、口語時語音的間隔是不一樣的5,第二個原因是計算機它把逗號句號等都視作無有不占時間3第三個原因是它只讀標準音,不單是不讀出語氣而且也不讀輕音和兒化音,這就是計算機讀出的音不符合我們的習(xí)慣,因為計算機讀出的音與我們的習(xí)慣相去甚遠,所以我們就很難聽懂,要想讓人便于聽懂,就必須向人的口語靠攏。我們的口語和朗誦如圖2所示每一個字不但所占的時間不同,而且大多數(shù)的字是連在一起的6,也就是只有口舌形狀的變化,而聲帶的振動始終并沒停頓,由于要表現(xiàn)悲歡怒憂所以它就得有抑揚頓挫,以前的錄音都是一個字一個字的錄的,每一個字聲帶是振動一次停一次,所以無論怎么讀他也是一個一個的,怎么也連不到一起,因為不符合習(xí)慣所以就很難聽懂,本發(fā)明改變這種錄法,用一種新的方法,在口語方面在連續(xù)劇的錄音中選取老年男、女,青年男、女,兒童、小孩各一名,如果要計算機讀出感情來,那就要再選擇一些富有感情色彩的錄音,把重復(fù)的地方去掉以后,再按圖2每個字所占的時間的之間進行切分的方法,把每一個字都切成一個小單元,并且是逗號、句號都占一個字音的時間7,當用的時候再把他們組合起來,就靠近一般的口語了;朗誦方面也是一樣把中央臺的錄音選擇一男一女,按以上辦理就可,按照以上的方法辦理后,還得借助例如紫光一類的語言環(huán)境識別軟件,對語言環(huán)境進行分析,按照分析的結(jié)果去組合句子,這樣組合出來的效果可能就更靠近人的自然口語和朗誦了。
還有幾個配合連續(xù)錄音單個切分的方法,向自然口語和朗誦靠攏地方法,就是對多音字、輕音子、兒化音字、頁面認讀的處理,從以上可以看出辨正誤以定取舍的任務(wù)完全是用視覺來完成的,總之無論是屏幕圖像還是輸出的紙件都是以視覺去感知,而視覺有一個局限性就是它只能是擇一的,也就是看原件的同時不能看新件,要想核對文件,視線就必須在原件與新件之間往復(fù),本發(fā)明將提供一種聽覺感知系統(tǒng),根據(jù)經(jīng)驗一個人看原件另一個人讀新件,這樣的校對速度大于一個人的兩倍,也就是1+1>2的現(xiàn)象,這說明了聽覺在這方面的作用,本發(fā)明意在使計算機輸出便于聽懂的聽覺信號,使我們的聽覺也參與進來以提高工作效率,本發(fā)明是這樣實現(xiàn)的刻槽錄放音是人類地第一次錄放音,磁帶錄放音從錄放音的角度來說沒有改變,但是從技術(shù)角度來說它是一個嶄新的技術(shù)領(lǐng)域,本技術(shù)是把音素輸入計算機使它認讀所有的字,包括漢語拼音的字母,例如A就讀作“啊”,漢字共有音節(jié)420多個,音節(jié)又分陰平、陽平、上聲、去聲、輕聲聲調(diào),每個音節(jié)中可能有一至五個聲調(diào),不過以上輕聲音調(diào)中不包括在特定環(huán)境中的輕聲例如“爸爸”二字的第二個爸字和第一個爸字一樣收在去聲音中,而不是收在輕聲音中,雖然在注釋中提到“爸爸”二字在連讀時第二個爸字讀輕聲,但是在音序中并沒有它的位置,按下邊闡述的依音序給音素代碼的方法第二個“爸”字是得不到輕聲音序代碼的,所以在本方案中還得加一些輕聲音素代碼,本方案是在1979年版《辭?!返臐h語拼音索引的基礎(chǔ)上,再增加輕聲、兒化音的,共有音素1240多個,也就是說無論是多少字多少書都可以用這1240個音素讀出來,既使是新字也能讀出來,因為漢字是造字不造音,你只要造出字來就必有名稱,名稱就是音素,這樣只要把音素輸入計算機它就可以讀所有的計算機文件,這就好象五筆字形輸入法的五筆字形能輸入所有的字,并且可以反復(fù)使用而用之不竭一樣,又和四角號碼的10個號碼一樣能代表所有的字,不過五筆字形和四角號碼都有不確定的時候,而音素認讀就沒有這個問題,1240個音素可用漢語拼音的順序的序號來作為該音素的代號碼,也就是每一個音素有一個唯一的代號碼,但是這個音素可代表若干個相同音、調(diào)的不同的字,以上是按1979年版《辭?!返臐h語拼音索引的順序,與自然數(shù)的順序相結(jié)合的方法,另一種方法是以常用音素在先,不常用音素在后的方法把所有的音素排成隊,再與自然數(shù)的順序相結(jié)合的方法。
對多音字,輕音字、兒化音字的處理方法是,在多音字方面把一個多音字的幾個音進行比校,按常用的音在前不常用的音在后的原則進行排隊,第一常用的音不作標記,第二個音在該字的左上方加一個點,第三個音在該字的正上方加一個點,第四個音在該字的右上方加一個點,第五個音在該字的左上方和右上方各加一個點,第六個音在該字的左上方、右上方和正上方各加一個點共三個點,如果該文件是用拼音輸入的,計算機會根據(jù)這個多音字的輸入音去認讀,再按常用的音在前不常用的音在后的原則進行排隊的次第,進行標記在文件里,在讀該文件時,計算機會根據(jù)這個多音字的標記讀它的相應(yīng)的音;輕音字方面作為稱謂的“爸”“哥”又沒有其它函意的字,在它們重疊時第二個字讀輕音是恒定的,所以可以給重疊的第二個字一個音素代碼,也可以把作為稱謂的“爸”“哥”等沒有其它函意的字,輸入計算機當計算機讀到這些字重疊時就自動把重疊的第二個字讀作輕聲,其它的重疊字是否讀輕音要因語言環(huán)境而定,一般的情況下名詞、動詞重疊時第二個字是輕音,形容詞重疊時第二個字不讀輕音,例如“麗麗漸漸胖了”第二個麗字是輕音,第二個漸字不是輕音,這就要讓計算機識別語言環(huán)境,對名詞、動詞重疊時的第二個字讀輕音,對形容詞重疊時的第二個字不讀輕音,不過這個例子并不絕對恒定,或者是在輸入時就給輕音字做上標記,計算機見到標記就讀輕音;兒化音方面兒化音完全是依語境而定一般的,名詞后邊有兒是兒化音,動詞后邊的兒不是兒化音,例如“花兒的錢買紅花兒”中的第一個花字是動詞它后邊地兒不讀作兒化音,第二個花字是名詞所以讀作兒化音,把兒化音的語境輸給計算機使計算機根據(jù)語境讀出兒化音來,也可以在輸入文字時給兒化音的字輸上標記。
如果文件在輸入時沒有做多音字、輕音字、兒化音字的處理,計算機在讀的時候,讀多音字的不作標記的第一常用音,遇有輕聲和兒化音的字的時候,除了有特定組合的已經(jīng)給出了音素代碼的,讀該音素代碼的音以外,其它的都讀該字的標準音,如果打算讓計算機把該文件的多音字、輕音字、兒化音都讀出來,就得做一下預(yù)處理,可目覽可聽讀也可以聽讀和目覽同時進行,當發(fā)現(xiàn)應(yīng)該校正的多音字時,就輸入你認為正確的拼音,計算機會給該字做出相應(yīng)的標記,以后計算機就會按新輸入的拼音認讀,當發(fā)現(xiàn)該讀輕音或兒化音的字的時候,就給該字標上相應(yīng)的標記,以后計算機就會按新的標記讀出輕音或兒化音,不過輕音、多音或兒化音在輸入時就可方便的標注或是應(yīng)該標注。
以上是文字方面的認讀,接下來是頁面情況的認讀,頁面情況包括字體、字號、布局、標點符號,在字體方面讓計算機可以認讀所有的字體例如仿宋、楷書、粗體等,字號方面讓計算機可以認讀所有的字號,例如三號、七號、八號等,在布局方面讓計算機可以認讀頁面的情況例如標題的位置、空格、空行等,在標點符號方面讓計算機可以認讀所有的標點符號,例如逗號、句號、括號、書名號等,有一點與眾不同的讀法是,對“(、“、《”等原來就讀作括號、引號、書名號現(xiàn)在在它的前邊加一個“前”字,讀作前括號、前引號、前書名號,與此相對應(yīng)的就讀作后括號、后引號、后書名號,凡是前后對稱的符號在讀的時候均把前、后的位置讀出來,遇到逗號、句號、頓號、問號、感嘆號均做停頓。
另外在語音輸入中辨認是最大的問題造成不確定性,而本技術(shù)的語音輸出就象出紙件一樣的確切可靠。以上是語音系統(tǒng)軟件的編寫方案。
下邊談軟件的使用,在輸入文字方面;鍵盤連著語音系統(tǒng),每擊一次鍵在屏幕上出現(xiàn)圖像的同時也發(fā)出相應(yīng)的聲音,例如在漢語拼音輸入中擊A鍵時,在屏幕上出現(xiàn)圖像的同時也發(fā)出相應(yīng)的“啊”的聲音,在屏幕上出現(xiàn)目的字的圖像的同時也發(fā)出目的字相應(yīng)的讀音,以隨時校正輸入的錯誤,這個方法對專業(yè)熟手來說沒什么意義,而對老人、生手是非常有用的,不過,在輸入數(shù)字時這個方法對盲打高手也是有用的,例如在輸入身份證號、賬號時,眼看到原件的數(shù)字時手就擊出,也就是我們通常所說的眼到手就到,雖然看與擊是有先后的但是我們在感知上分不出來,在屏幕上出現(xiàn)該數(shù)字的圖像的同時也發(fā)出該數(shù)字相應(yīng)的聲音,這樣在輸入的同時也做了校對;在校對全文和聽讀及聽覺瀏覽方在讀文件時本軟件可讀出三個層次,第一個層次是讀沒有經(jīng)過本方案“多音字、輕音字、兒化音字”處理的文件,對多音字讀它的最常用音,對輕音字讀它的標準音,對兒化音字讀它的標準音,遇到逗號、句號、頓號、問號、感嘆號均做停頓,第二個層次是讀經(jīng)過本方案“多音字、輕音字、兒化音字”軟件處理的文件,它將把多音字、輕音字、兒化音全讀出來,遇到逗號、句號、頓號、問號、感嘆號均做停頓,第三個層次是專為校對文件設(shè)計的,它是在第二個層次的基礎(chǔ)上再加上把頁面的情況都讀出來,也就是見什么讀什么,例如見到“,”號,就讀做“逗號”見到“。”號就讀做“句號”見到“(”號就讀做“前括號”見到空格、另起行、標題的位置等都讀出來。
根據(jù)以上的功能在茶、酌、踱、臥時均可聽計算機讀文件,用聽覺上網(wǎng)瀏覽,再就是在聽計算機讀文件,用聽覺上網(wǎng)瀏覽時,均可把顯示器關(guān)掉。
權(quán)利要求
1.一種計算機軟件的編程方法,其特征是用一種連續(xù)錄音單個切分的方法。
2.如權(quán)利要求一所述的計算機軟件的編程方法,其特征是把一個多音字的幾個音進行比校,按常用的音在前不常用的音在后的原則進行排隊,第一常用的音不作標記,第二個音在該字的左上方加一個點,第三個音在該字的正上方加一個點,第四個音在該字的右上方加一個點,第五個音在該字的左上方和右上方各加一個點。
3.如權(quán)利要求一所述的計算機軟件的編程方法,其特征是作為稱謂的“爸”“哥”又沒有其它函意的字,在它們重疊時第二個字讀輕音是恒定的,所以可以給重疊的第二個字一個音素代碼,也可以把作為稱謂的“爸”“哥”等沒有其它函意的字,輸入計算機當計算機讀到這些字重疊時就自動把重疊的第二個字讀作輕聲,其它的重疊字是否讀輕音要因語言環(huán)境而定,一般的情況下名詞、動詞重疊時第二個字是輕音,形容詞重疊時第二個字不讀輕音,把要讀輕音的語境輸給計算機使計算機根據(jù)語境讀出輕音來。
4.如權(quán)利要求一所述的計算機軟件的編程方法,其特征是兒化音完全是依語境而定一般的,名詞后邊有兒是兒化音,動詞后邊的兒不是兒化音,把要讀兒化音的語境輸給計算機使計算機根據(jù)語境讀出兒化音來,也可以再輸入文字。
全文摘要
本發(fā)明涉及辦公設(shè)備中的計算機,特別是計算機鍵盤及語音軟件。本發(fā)明用一種連續(xù)錄音單個切分的方法及語言環(huán)境識別等,向正常的朗誦和口語靠攏。究其計算機讀出的音不易聽懂的原因,第一個原因是現(xiàn)在計算機讀出的音它的時間間隔是一樣的,并且是兩字之間有一個很小的無音的時間,而我們在朗讀、口語時語音的間隔是不一樣的,第二個原因是計算機它把逗號句號等都視作無有不占時間,而本方法向正常的朗誦和口語靠攏了一步。
文檔編號G06F3/023GK1670669SQ20031011783
公開日2005年9月21日 申請日期2003年12月22日 優(yōu)先權(quán)日2003年12月22日
發(fā)明者婁光 申請人:婁光