專利名稱:語音輸入記事本的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于“個人數(shù)字助理”(Personal Digital Assistant),既通常所說的電子記事本,簡稱“PDA”。
目前,PDA產(chǎn)品可劃分為兩大類以國產(chǎn)“文曲星”及香港“電譯通”為首的低檔PDA,其特點(diǎn)是用鍵盤輸入,采用拼音或五筆等編碼方案,轉(zhuǎn)換成國標(biāo)漢字,進(jìn)行存儲或查詢。其特點(diǎn)是結(jié)構(gòu)簡單,內(nèi)存消耗少,CPU要求低。因而價格很低。但是因?yàn)殒I盤小,操作不便。加上顯示區(qū)小,拼音的候選字多,拼音輸入有困難。而且不少人不會五筆或拼音輸入法,無法使用。
還有以臺灣快譯通、好譯通,香港名人為代表的高檔PDA,采用手寫輸入,有很多特殊功能,如紅外線接口、數(shù)字錄音、BP機(jī)接收等。因?yàn)橐M(jìn)行手寫輸入,這些產(chǎn)品都配有較大的液晶顯示器,壓力式觸摸屏,128K以上的RAM,及1到4兆的ROM。同時對CPU的要求也很高,處理能力都達(dá)到或超過286-16的水平。因此它們的價格都很高。手寫識別的輸入方法更人性化,但對CUP處理能力及存儲空間要求很高,例如慧筆的系統(tǒng)需求是奔騰75以上,8兆內(nèi)存。因?yàn)镻DA處理能力的限制,寫字過程還是不太方便,要求工整書寫,并且其手寫輸入的識別率、適應(yīng)能力以及速度,都比PC版的識別軟件還差很多。很多人覺得并不方便。
本發(fā)明的目的在于所設(shè)計的PDA具有以下特點(diǎn)1.名片功能中的“姓名”輸入時,讀出姓名,用語音識別模塊分析并提取語音的特征,存儲到存儲器的識別區(qū)內(nèi)。同時用壓縮模塊將語音壓縮,存儲到存儲器的錄音區(qū)內(nèi)。
2.檢索時,用語音識別模塊提取所讀姓名的聲音特征,并與存儲器中的特征比較,找到相應(yīng)的條目。
3.輸入數(shù)字及英文,采用特定人小詞匯量語音識別,用語音識別模塊將所讀數(shù)字、字母的語音的特征值與事先提取的特征值比較,識別出相應(yīng)的數(shù)字或字母。
4.查閱內(nèi)容時,將存儲器錄音區(qū)內(nèi)姓名、地址的語音解壓縮并播放。而非通常的顯示漢字。
5.查閱內(nèi)容時,電話號碼除顯示字符外,還可用語音朗讀出來。本發(fā)明的目的通過以下方式實(shí)現(xiàn)如圖一所示,麥克風(fēng)與放大濾波器連接;放大濾波器與高精度A/D轉(zhuǎn)換器連接;A/D轉(zhuǎn)換器同時與語音識別器及語音壓縮元件連接;語音識別器通過數(shù)據(jù)總線及控制信號線與主控微處理器相連。語音壓縮器通過數(shù)據(jù)總線及控制信號線與主控微處理器相連。微處理器與存儲器連接。
該電路的作用是將語音輸入的模擬信號,轉(zhuǎn)換為數(shù)字碼流,語音識別器的特征提取模塊從語音數(shù)據(jù)中提取語音特征,并通過數(shù)據(jù)總線傳給微處理器。語音壓縮器將語音數(shù)據(jù)壓縮后,也通過數(shù)據(jù)總線傳給微處理器。處理器得到語音數(shù)據(jù)及語音特征后,將它們分別存入存儲器的不同區(qū)域中供識別及回放使用。
微處理器還與解壓縮元件連接,解壓縮元件與D/A轉(zhuǎn)換器連接,D/A轉(zhuǎn)換器與放大器連接,放大器與揚(yáng)聲器連接。
該電路的作用是將壓縮后的語音數(shù)據(jù)還原并播放。
微處理器還通過數(shù)據(jù)總線及控制信號線與語音識別器的識別模塊相連。語音識別器又與存儲器直接相連。
該電路的作用是微處理器將語音特征傳給語音識別器的語音識別模塊,語音識別器用存儲器中的特征值與該值比較。并將結(jié)果傳給微處理器。
本發(fā)明的外觀如圖2所示本記事本可握在掌中,單手操作。并裝有麥克風(fēng),設(shè)置確認(rèn)鍵,取消鍵,旋鈕、顯示屏及揚(yáng)聲器。
本發(fā)明與已有的PDA相比,具有以下優(yōu)點(diǎn)語音記事本不需要將語音轉(zhuǎn)換成文字,對系統(tǒng)要求低,沒有誤識問題。十個數(shù)字采用語音識別輸入,因詞匯量小,識別率很高,速度快。采用特定人學(xué)習(xí)的方法,沒有口音、語言的限制。因此語音輸入是目前最方便的輸入方法。所有輸入及查詢、閱讀過程都通過語音實(shí)現(xiàn),所有操作都有語音提示,盲人或視力不好的人也可輕松應(yīng)用,而且技術(shù)成熟,價格接近低檔PDA。
圖1為語音輸入記事本系統(tǒng)2為語音輸入記事本外觀圖1-線路輸出插孔;2-確認(rèn)鍵;3-取消鍵;4-揚(yáng)聲器;5-顯示屏;6-旋鈕;7-麥克風(fēng)。
圖3為語音檢索流程4為語音輸入流程5為數(shù)字的語音輸入流程6為語音輸出流程圖實(shí)施例本發(fā)明可使用2節(jié)3A電池,能使用30天以上。產(chǎn)品外觀如圖2所示,外殼為流線型,美觀大方,小巧而易操作。正面的顯示采用16*80點(diǎn)陣式LCD,并有16個比較醒目的圖標(biāo)。
在產(chǎn)品的左右兩側(cè)分別裝有旋鈕和確認(rèn)、取消鍵,上端為線路輸出孔和麥克風(fēng),下端設(shè)有揚(yáng)聲器。
調(diào)節(jié)旋鈕向上轉(zhuǎn)為增量,向下為減量,可方便地選擇數(shù)字0-9,字母A-Z及各菜單選項(xiàng)。
確認(rèn)/取消鍵外觀長條型,內(nèi)部上下兩端各有一個開關(guān)。該鍵按上部確認(rèn),按下部為取消。
本記事本的記錄內(nèi)容可記錄200條名片或30分鐘語音。名片增加后,錄音時間會縮短。
每個名片有最多2秒的人名錄音及最多5秒個人信息錄音。最多5個電話號碼電話1、電話2、傳真、宅電、BP。
數(shù)字錄音,可分為多段,共計最多30分鐘,每段都可設(shè)定播放時間,到時自動開始播放,作為約會/行程提醒。
線路輸出及麥克風(fēng)接口
使用該接口,用戶可以連接自己的耳機(jī)和麥克風(fēng)。也可以通過線路輸出將錄音轉(zhuǎn)錄到計算機(jī)進(jìn)行語音識別。功能及操作本記事本的工作過程如下(如圖1所示)語音輸入麥克風(fēng)輸入的模擬語音信號,進(jìn)入放大濾波器成為模擬電信號,再通過A/D轉(zhuǎn)換器轉(zhuǎn)換為數(shù)字碼流,同時傳給語音識別器和語音壓縮器。語音識別器的特征提取模塊從語音數(shù)據(jù)中提取語音特征,并通過數(shù)據(jù)總線傳給微處理器。語音壓縮器將語音數(shù)據(jù)壓縮后,也通過數(shù)據(jù)總線傳給微處理器。處理器得到語音數(shù)據(jù)及語音特征后,將它們分別存入存儲器的不同區(qū)域中。
檢索時,處理器將語音特征傳給語音識別器的語音識別模塊,語音識別器用存儲器中的特征值與該值比較。并將結(jié)果傳給微處理器。
語音輸出如圖6所示,處理器從存儲器中取出壓縮語音數(shù)據(jù),傳給語音解壓縮器,解壓縮器將解壓縮后的數(shù)據(jù)流輸出給D/A轉(zhuǎn)換器,轉(zhuǎn)換為模擬信號,通過放大濾波器放大后,由揚(yáng)聲器輸出。
1.主選單開機(jī)后首先進(jìn)入主菜單,轉(zhuǎn)動旋鈕,光標(biāo)在“檢索名片”、“翻閱名片”、“查閱錄音”、“輸入名片”、“錄音”,“系統(tǒng)設(shè)定”,“內(nèi)存狀況”、“時間設(shè)定”、“語音訓(xùn)練”、“游戲”等選項(xiàng)間切換,點(diǎn)陣LCD上顯示各功能的圖標(biāo)。光標(biāo)隨著選擇鈕移動,停住1秒后,用語音讀出該功能名稱。按確認(rèn)鍵進(jìn)入功能,按“取消”返回上一級菜單。
2.名片輸入進(jìn)入“名片輸入”功能,光標(biāo)在“姓名輸入”、“個人信息”、“姓名拼音輸入”,“電話輸入”之間移動。
1)姓名輸入過程如圖3所示。
先將光標(biāo)移到“姓名”上,一秒無動作,則語音提示“請讀出姓名”,按住“確認(rèn)”,微處理器初始化A/D轉(zhuǎn)換器,語音壓縮器及語音識別器。然后開始錄音,確認(rèn)鍵松開后結(jié)束,超過2秒,超時報警。重復(fù)錄制則覆蓋上一次的內(nèi)容。麥克風(fēng)采集的聲音信號,經(jīng)過放大、濾波,用A/D轉(zhuǎn)換器對語音信號進(jìn)行A/D轉(zhuǎn)換。語音識別器提取語音特征,并通過控制芯片將特征數(shù)據(jù)存入存儲器。同時,語音壓縮器將數(shù)據(jù)壓縮,通過控制芯片存入存儲器。
2)個人信息輸入先將光標(biāo)移到“個人信息”上,一秒無動作,則語音提示“個人信息”,按住“確認(rèn)”開始錄音,松手后結(jié)束,超過5秒,超時報警。重復(fù)錄制會覆蓋上一次內(nèi)容。錄音過程中,只將語音數(shù)字化后壓縮存儲,而不用識別器提取語音特征。
3)電話號碼輸入可用旋鈕或語音輸入,語音輸入過程如圖5所示。
用選擇鈕將光標(biāo)移到電話1、電話2、宅電、傳真、BP中的任一個,按“確認(rèn)”進(jìn)入。轉(zhuǎn)動選擇鈕可在語音輸入、數(shù)字0-9,空格,回刪結(jié)束間選擇。顯示數(shù)字0-9時,按“確認(rèn)”輸入并進(jìn)入下一個數(shù)字,選“回刪”則刪除上一個數(shù)字,按住回刪2秒則全部清除。其中,語音輸入、回刪為圖標(biāo),選中語音輸入時,按住“確認(rèn)”,念一個數(shù)字,松開后識別,微處理器先初始化A/D及識別元件,麥克風(fēng)采集的聲音信號,經(jīng)過放大、濾波,用A/D轉(zhuǎn)換器對語音信號進(jìn)行A/D轉(zhuǎn)換。識別模塊提取語音特征,并與存儲器中0-9的語音特征進(jìn)行比較,并將結(jié)果傳給微處理器。微處理器控制顯示屏,顯示相應(yīng)的數(shù)字0-9,然后自動進(jìn)入下一個。按“取消”鍵則存儲并回到上一級選項(xiàng)。
4)按“取消”鍵,提示是否存儲,用戶選擇后退回主菜單。
3.名片檢索有翻閱及語音檢索兩種方式。
1)語音檢索檢索過程如圖4所示。
主菜單下選名片檢索,用LCD及語音提示使用者開始錄音。使用者按住“確認(rèn)”鍵同時讀出人名然后松開。微處理器控制A/D、語音識別器開始工作。麥克風(fēng)采集的聲音信號,經(jīng)過放大、濾波,用A/D轉(zhuǎn)換器對語音信號進(jìn)行A/D轉(zhuǎn)換。識別模塊提取語音特征,并與存儲器中存儲的姓名的語音特征進(jìn)行比較,并將結(jié)果傳給微處理器。微處理器根據(jù)結(jié)果,顯示相應(yīng)的記錄信息。同時順序讀出人名、地址、電話。按“確認(rèn)”停止并進(jìn)入編輯狀態(tài)。在有多個讀音相近的候選時,若旋轉(zhuǎn)旋鈕,則可在各候選名片間切換,顯示器顯示序號及第一個電話號碼。停住1秒,則順序讀出人名、個人信息和電話。按“確認(rèn)”停止并進(jìn)入編輯狀態(tài)。“取消”退回主菜單。
進(jìn)入后,用旋鈕可使光標(biāo)在人名、備注、電話及“刪除名片”圖標(biāo)間移動,移到人名、地址時,停一秒后可讀出。
按“確認(rèn)”進(jìn)入相應(yīng)選項(xiàng),進(jìn)行修改,“取消”退回上一級。
4.數(shù)字錄音1)錄音選擇錄音功能,按住確認(rèn)鍵,開始錄音。
錄音后詢問是否定時播出,選“是”則繼續(xù)要求設(shè)定時間。到時會播出。
2)檢索只能順序查看。查看時顯示錄音時間,長度及回放時間設(shè)定。
停住1秒后開始播放。按“確認(rèn)”進(jìn)入后,可修改定時播放時間或刪除。
5.系統(tǒng)設(shè)置可設(shè)置識別參數(shù)、音量及語音提示開啟或關(guān)閉。
各操作均有漢字或圖形及語音提示,其中語音提示可以關(guān)閉。
6. 0-9數(shù)字的學(xué)習(xí)每個數(shù)字讀兩遍,對語音進(jìn)行采集并數(shù)字化后,用識別器提取特征并保存在存儲器中。學(xué)習(xí)成功后就可用語音輸入數(shù)字了。
權(quán)利要求
1.一種由麥克風(fēng),放大濾波器、A/D轉(zhuǎn)換器、D/A轉(zhuǎn)換器、語音識別器、語音壓縮器、語音解壓縮器、數(shù)據(jù)總線、控制信號線、主控微處理器、放大器、揚(yáng)聲器、存儲器、按鍵、旋鈕、顯示屏構(gòu)成的語音輸入記事本,其特征在于麥克風(fēng)與放大濾波器連接;放大濾波器與高精度A/D轉(zhuǎn)換器連接;A/D轉(zhuǎn)換器同時與語音識別器及語音壓縮元件連接;語音識別器通過數(shù)據(jù)總線及控制信號線與主控微處理器相連,語音壓縮器通過數(shù)據(jù)總線及控制信號線與主控微處理器相連;微處理器與存儲器連接;微處理器還與語音解壓縮元件連接,語音解壓縮元件與D/A轉(zhuǎn)換器連接,D/A轉(zhuǎn)換器與放大器連接,放大器與揚(yáng)聲器連接;微處理器還通過數(shù)據(jù)總線及控制信號線與語音識別器的識別模塊相連,語音識別器又與存儲器直接相連。
2.按照權(quán)利要求1所述的語音輸入記事本,其特征在于記事本的外殼裝有麥克風(fēng),設(shè)置確認(rèn)鍵,取消鍵,旋鈕、顯示屏及揚(yáng)聲器。
全文摘要
語音輸入記事本屬于“個人數(shù)字助理”(PersonalDigital Assistant),既通常所說的電子記事本,簡稱“PDA”。本發(fā)明是一種基于語音的PDA產(chǎn)品。它可將普通PDA“名片”功能中的“姓名”,用語音的方式記錄下來。查詢時,只要說出人名,即可顯示相應(yīng)的電話號碼,并用語音讀出人名及單位/地址信息。其中,電話號碼也可用語音輸入。它還可以分段存貯30分鐘數(shù)字錄音,并可在預(yù)定的時間播放出來。可以用語音方式完成與傳統(tǒng)PDA“行程”、“記事”相同的功能。
文檔編號G06F17/28GK1247347SQ9811769
公開日2000年3月15日 申請日期1998年9月9日 優(yōu)先權(quán)日1998年9月9日
發(fā)明者劉迎建, 馬梁 申請人:北京中自漢王科技公司