隨身攜帶式創(chuàng)建個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)的裝置制造方法
【專利摘要】本發(fā)明涉及語(yǔ)音轉(zhuǎn)化為文字領(lǐng)域的裝置,特別是一種隨身攜帶式創(chuàng)建個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字的數(shù)據(jù)庫(kù)創(chuàng)建器。本發(fā)明的目的是提供一種可以定時(shí)或隨時(shí)隨地采集一個(gè)人的個(gè)性化語(yǔ)音,并創(chuàng)建完成這個(gè)人個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)的裝置。它包括語(yǔ)音采集部分耳朵支架、語(yǔ)音采集頭、語(yǔ)音采集開關(guān)、機(jī)殼、控制電路集成主板、芯片組、微處理器、存儲(chǔ)器、顯示面板、手寫輸入文字或軟健盤輸入文字的屏幕、操作按鈕、喇叭、插孔、插槽、電池與電池槽。本發(fā)明的目的是這樣實(shí)現(xiàn)的:當(dāng)數(shù)據(jù)庫(kù)創(chuàng)建器復(fù)讀出語(yǔ)音單元時(shí),由發(fā)音者用手在手寫輸入文字或軟健盤輸入文字的屏幕上輸入自己認(rèn)為的與此語(yǔ)音單元相對(duì)應(yīng)的文字。本發(fā)明將任何一個(gè)人的個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)建成后,數(shù)據(jù)庫(kù)安裝到其它系統(tǒng)配合其它系統(tǒng)使用,以實(shí)現(xiàn)這個(gè)人的個(gè)性化語(yǔ)音精準(zhǔn)無誤地轉(zhuǎn)化為文本文字的功能。
【專利說明】隨身攜帶式創(chuàng)建個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)的裝置
【技術(shù)領(lǐng)域】
[0001]在本發(fā)明涉及一種創(chuàng)建數(shù)據(jù)庫(kù)的裝置,具體為一種隨身攜帶式創(chuàng)建個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字的數(shù)據(jù)庫(kù)創(chuàng)建器。
【背景技術(shù)】
[0002]近二十多年來,與語(yǔ)音輸入相關(guān)的軟硬件不斷被設(shè)計(jì)和創(chuàng)造出來,應(yīng)用范圍極其廣泛,但存在著對(duì)發(fā)音者的要求較高,沒有經(jīng)過特殊訓(xùn)練的普通大眾,其發(fā)音大都不標(biāo)準(zhǔn),轉(zhuǎn)化后的文本文字不能準(zhǔn)確地表達(dá)語(yǔ)音的語(yǔ)意,這就是這類軟硬件不能在社會(huì)上普及的主要原因,文本文字不能準(zhǔn)確無誤地表達(dá)發(fā)音者的真實(shí)意思,成為限制這一行業(yè)發(fā)展的瓶頸。根據(jù)數(shù)據(jù)粗略統(tǒng)計(jì):(I)在中國(guó)有159件與語(yǔ)音輸入相關(guān)的授權(quán)發(fā)明專利,從95年開始有專利授權(quán),以后逐年上升,到2005年達(dá)到最高授權(quán)量,為25件,但由于語(yǔ)音轉(zhuǎn)化為文本文字的準(zhǔn)確率問題無法解決,這類專利在中國(guó)和國(guó)外一樣開始逐年下降,到2010年僅有I件。中國(guó)大陸在這方面的技術(shù)成果比較落后,在中國(guó)大陸授權(quán)的這類發(fā)明專利的前8名分別是:國(guó)際商業(yè)機(jī)器公司9件,臺(tái)達(dá)電子工業(yè)股份有限公司8件,松下電器產(chǎn)業(yè)株式會(huì)社7件,微軟公司7件,株式會(huì)社建伍5件,索尼公司5件,日本電氣株式會(huì)社5件,三星電子株式會(huì)社4件,沒有一家中國(guó)大陸的公司。(2)在中國(guó)有1609件與語(yǔ)音及通話相關(guān)的授權(quán)發(fā)明專利,從94年開始有7件專利授權(quán),以后逐年上升,到2006年達(dá)到最高授權(quán)量,為205件,但由于語(yǔ)音轉(zhuǎn)化為文本文字的準(zhǔn)確率問題無法解決,這類專利在中國(guó)和國(guó)外一樣開始逐年下降,到2011年僅有8件。在中國(guó)大陸授權(quán)的這類發(fā)明專利的前8名分別是:微軟公司86件,松下電器產(chǎn)業(yè)株式會(huì)社84件,國(guó)際商業(yè)機(jī)器公司78件,華為技術(shù)有限公司45件,摩托羅拉公司39件,索尼株式會(huì)社32件,索尼公司31件,中國(guó)科學(xué)院聲學(xué)研究院29件。從以上數(shù)據(jù)顯示出兩個(gè)信息:第一,語(yǔ)音、語(yǔ)音輸入方面的技術(shù),在2005年、2006年達(dá)到了高潮,但由于語(yǔ)音轉(zhuǎn)化為文本文字的準(zhǔn)確率問題無法解決,原來的技術(shù)路線遇到了這個(gè)行業(yè)的技術(shù)瓶頸,以原來的技術(shù)路線無法在使這個(gè)行業(yè)向前發(fā)展,于是從2005年、2006年開始這方面的專利申報(bào)、授權(quán)一年比一年下降,導(dǎo)致語(yǔ)音代替雙手的革命,至今還沒有普及;第二,中國(guó)在這方面的技術(shù)成果比較溥弱。為了使這個(gè)行業(yè)繼續(xù)向前發(fā)展,我們必須開創(chuàng)另一條技術(shù)路線,來突破這個(gè)行業(yè)的發(fā)展瓶頸。
[0003]為什么現(xiàn)有的這類語(yǔ)音輸入系統(tǒng)不能準(zhǔn)確無誤地表達(dá)發(fā)音者的真實(shí)意思呢?因?yàn)槿澜邕@類語(yǔ)音軟硬件的設(shè)計(jì)者都走進(jìn)了一個(gè)誤區(qū):認(rèn)為人發(fā)出的聲波(語(yǔ)音)本身具有含義,是信息的載體,于是采取“分析語(yǔ)音提取參數(shù)”、“語(yǔ)音識(shí)別技術(shù)來確定語(yǔ)義”、“語(yǔ)言解碼”、“語(yǔ)音信息拾取”、“生成輸入特征向量”、“確定最佳匹配的單詞模型”等等方法,來尋找出語(yǔ)音與語(yǔ)義之間的規(guī)律,使音頻音波轉(zhuǎn)化為文本文字,其實(shí)聲波(語(yǔ)音)本身沒有含義,是人類賦予了它含義。為什么現(xiàn)有的這類系統(tǒng)也可以表達(dá)發(fā)音者的意思呢?是系統(tǒng)設(shè)計(jì)者采用了本國(guó)語(yǔ)言、本地語(yǔ)系所共認(rèn)的語(yǔ)音所賦予的含義,尋找到了本國(guó)語(yǔ)言、本地語(yǔ)系的語(yǔ)音與語(yǔ)義之間對(duì)應(yīng)關(guān)系的規(guī)律,然而這種規(guī)律是大眾化、標(biāo)準(zhǔn)化的,而大部分人的語(yǔ)音所表達(dá)的意思卻是個(gè)性化的、不標(biāo)準(zhǔn)的。所以這類系統(tǒng)總是要求發(fā)音者要發(fā)出標(biāo)準(zhǔn)的語(yǔ)音、訓(xùn)練使用者來適應(yīng)系統(tǒng)、訓(xùn)練系統(tǒng)來適應(yīng)發(fā)音者。
[0004]系統(tǒng)對(duì)語(yǔ)音進(jìn)行分析,提取參數(shù),確定語(yǔ)意,轉(zhuǎn)化成文本文字。這個(gè)技術(shù)的難度是相當(dāng)大的,難度之一:數(shù)據(jù)庫(kù)龐大,但依然不能囊括全球所有人的個(gè)性化語(yǔ)音;難度之二:復(fù)雜的分析程序和過程,但依然不能準(zhǔn)確無誤地分析出發(fā)音者的語(yǔ)音所要表達(dá)的意思。
[0005]譬如:IBM ViaVoice語(yǔ)音識(shí)別系統(tǒng)(語(yǔ)音輸入語(yǔ)音控制)發(fā)明出來后,向全世界宣布這是一場(chǎng)解放雙手的革命,然而十多年過去了,人們普遍還在用雙手輸入信息和操控硬件。微軟的語(yǔ)音輸入系統(tǒng),讀音要非常標(biāo)準(zhǔn),電腦才能識(shí)別,即使在這種情況下,錯(cuò)誤率還是很高。漢王手寫板的語(yǔ)音變文字功能,因發(fā)音者的普通話不標(biāo)準(zhǔn),還是不如用手來書寫方便省事。打字員用語(yǔ)音打字,這個(gè)技術(shù)在90年代已經(jīng)出現(xiàn),但是需要打字員說出標(biāo)準(zhǔn)的語(yǔ)音,但大多數(shù)人說話并不標(biāo)準(zhǔn),所以至今只是極少數(shù)人使用,大多數(shù)人還依然用雙手來打字。為了解決這個(gè)技術(shù)難點(diǎn),當(dāng)前日本發(fā)明的最新語(yǔ)音輸入技術(shù),將聲波先轉(zhuǎn)化為電磁波,然后用電磁波和聲波原型相對(duì)照,并提出最合適的單詞,雖然加入了電磁波,準(zhǔn)確性有所提高,但還是沒有解決根本性問題,他們自稱正確率在85%,而且只適合日語(yǔ)。蘋果新iPad的語(yǔ)音輸入文字功能,為了避免數(shù)據(jù)庫(kù)龐雜和準(zhǔn)確性不高的難度,目前只支持英、法、德、日四個(gè)語(yǔ)種,同樣需要發(fā)音者的發(fā)音要標(biāo)準(zhǔn)。Mac系列的產(chǎn)品需要搭配網(wǎng)絡(luò)才可使用。美國(guó)國(guó)防部高級(jí)研究計(jì)劃局(DARPA ) 2012年投入大量資金對(duì)“泛用語(yǔ)言翻譯計(jì)劃”進(jìn)行技術(shù)研發(fā),如果美國(guó)的這個(gè)科技項(xiàng)目攻關(guān)成功,就可以實(shí)現(xiàn)讓美國(guó)士兵們聽懂外國(guó)民眾的語(yǔ)言,美國(guó)士兵的話實(shí)時(shí)翻譯成外語(yǔ),在一些特殊情況下,國(guó)家與國(guó)家之間要員無需翻譯人員在場(chǎng)就可以交流,從而減少知情人數(shù),降低泄密機(jī)率。美國(guó)的這項(xiàng)科技項(xiàng)目攻關(guān)成功后便可實(shí)現(xiàn)完全不了解彼此語(yǔ)言的人與之間的面對(duì)面流暢交流。
[0006]錄音機(jī)、復(fù)讀機(jī)只是將聲音存貯了起來,并沒有來確定聲音所要表達(dá)的意思。計(jì)算機(jī)、手機(jī)等具有語(yǔ)音轉(zhuǎn)化為文本文字的功能,可以確定聲音所要表達(dá)的意思,但它們安裝的軟件系統(tǒng)采取的技術(shù)路線是:“分析語(yǔ)音提取參數(shù)”、“語(yǔ)音識(shí)別來確定語(yǔ)義”、“語(yǔ)言解碼”、“語(yǔ)音信息拾取”等等方法,使音頻音波轉(zhuǎn)化為文本文字,這條技術(shù)路線想要準(zhǔn)確無誤地確定所有人發(fā)出的聲音的意思,是絕對(duì)做不到的。
[0007]隨著社會(huì)的發(fā)展,地球越來越象個(gè)地球村,一個(gè)人與其他非同一語(yǔ)種、同一語(yǔ)系的人在現(xiàn)實(shí)世界上的交流越來越頻繁;隨著計(jì)算機(jī)網(wǎng)絡(luò)世界和手機(jī)網(wǎng)絡(luò)世界的發(fā)展,一個(gè)人與其他非同一語(yǔ)種、同一語(yǔ)系的人如同近在咫尺,在網(wǎng)絡(luò)世界上的交流越來越頻繁;隨著物聯(lián)網(wǎng)的發(fā)展、軟件程序的發(fā)展,一個(gè)人同機(jī)器、物品等非生命物的交流、互動(dòng)越來越頻繁,雖然可以用指體與其交流,但通過語(yǔ)音交流更方便簡(jiǎn)單。通過以上所述,人類迫切需要?jiǎng)?chuàng)建完成一個(gè)人說話的聲音和這些聲音所表達(dá)的意思精確無誤相對(duì)應(yīng)的數(shù)據(jù)庫(kù),這個(gè)數(shù)據(jù)庫(kù)是這個(gè)人專屬的、個(gè)性化的、只適合于他自己、不斷完善、終身使用、可以在不同系統(tǒng)中使用的數(shù)據(jù)庫(kù),同時(shí)人類迫切需要發(fā)明出創(chuàng)建這樣一個(gè)數(shù)據(jù)庫(kù)的電子器具。
【發(fā)明內(nèi)容】
[0008]在本發(fā)明的目的:解決語(yǔ)音輸入系統(tǒng)中文本文字不能準(zhǔn)確無誤地表達(dá)發(fā)音者所要表達(dá)的意思的不足,由發(fā)音者和系統(tǒng)共同完成任何一個(gè)人的個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)的建設(shè)。本系統(tǒng)由軟件和硬件共同組成,軟件為個(gè)性化語(yǔ)音采集及語(yǔ)義確定程序,硬件為個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)創(chuàng)建器。[0009]本發(fā)明的原理:文字就是符號(hào),本身沒有含義,只有被一個(gè)人、一群人、整個(gè)人類賦予含義后,才成為了含義的載體,被賦予了含義的文字,就變成了信息。語(yǔ)音就是聲波,同樣,本身也沒有含義,只有被一個(gè)人、一群人、整個(gè)人類賦予含義后,才成為了含義的載體,被賦予了含義的聲波,就變成了信息,將沒有含義的符號(hào)與沒有含義的聲波賦予相同含義,這時(shí)這個(gè)符號(hào)與這個(gè)聲波就表達(dá)出了相同的信息。從而實(shí)現(xiàn)相同信息下的符號(hào)(文字)與聲波(語(yǔ)音)精準(zhǔn)的轉(zhuǎn)化。但是信息概念具有很強(qiáng)的主觀特征,所以,這賦予符號(hào)與聲波相同信息的人,必須是一個(gè)人,如果在兩個(gè)人以上,就會(huì)產(chǎn)生誤差,甚至毫無相同之處。一個(gè)人將他所有的語(yǔ)音(聲波)與一組一組的數(shù)據(jù)(符號(hào))賦予一一對(duì)應(yīng)的相同含義,建立他自己個(gè)性化的語(yǔ)音對(duì)應(yīng)語(yǔ)義數(shù)據(jù)庫(kù),那么他的語(yǔ)音,將變?yōu)槲谋疚淖中问降臄?shù)據(jù),由處理器進(jìn)行處理運(yùn)算,因這些數(shù)據(jù)都是被他賦予了含義的信息,所以,帶有處理器的硬件(譬如計(jì)算機(jī)、手機(jī))所處理運(yùn)算的數(shù)據(jù)就是他的語(yǔ)音要表達(dá)的信息。
[0010]本發(fā)明的思路:將物質(zhì)層面的硬件、波層面的語(yǔ)音、意識(shí)層面的語(yǔ)義、軟件層面的程序編碼有機(jī)地組合起來,也就是說,將電子器具、發(fā)音者的聲音、發(fā)音者的意念、軟件設(shè)計(jì)者的程序有機(jī)結(jié)合起來,以實(shí)現(xiàn)發(fā)音者的語(yǔ)音和語(yǔ)義的精準(zhǔn)轉(zhuǎn)化。為達(dá)到這個(gè)目的創(chuàng)造出一種器具,這個(gè)器具通過軟件、硬件、發(fā)音者共同完成發(fā)音者自己的個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字的個(gè)性化數(shù)據(jù)庫(kù)的建設(shè)。這個(gè)數(shù)據(jù)庫(kù)建成后,應(yīng)用到其他各種軟硬件中,使其他軟硬件能準(zhǔn)確無誤地通過語(yǔ)音來表達(dá)、執(zhí)行發(fā)音者的意圖,處理發(fā)音者發(fā)出的信息。
[0011]本發(fā)明的技術(shù)路線:傳統(tǒng)語(yǔ)音輸入采取的都是“語(yǔ)音識(shí)別技術(shù)”,本發(fā)明開創(chuàng)了另一條與原來的技術(shù)完全不同的技術(shù)路線:“語(yǔ)音確定語(yǔ)義技術(shù)”。
[0012]本發(fā)明公開的硬件部分:數(shù)據(jù)庫(kù)創(chuàng)建器,到目前為止在全世界還沒有這樣的器具和技術(shù)。這個(gè)數(shù)據(jù)庫(kù)創(chuàng)建器的作用可以簡(jiǎn)述如下:無論這個(gè)人是哪個(gè)國(guó)家的人,說哪一種語(yǔ)言,說哪一種方言,甚止口齒不清,本發(fā)明公開的數(shù)據(jù)庫(kù)創(chuàng)建器,都可以將他的個(gè)性化的語(yǔ)音采集進(jìn)去,以各個(gè)語(yǔ)音單元的形式一一復(fù)讀出來,再由發(fā)音者用手將每個(gè)語(yǔ)音單元的意思用文本文字的形式輸入進(jìn)數(shù)據(jù)庫(kù)創(chuàng)建器,數(shù)據(jù)庫(kù)創(chuàng)建器通過發(fā)音者的專業(yè)性操作或隨意性操作,經(jīng)過一次或多次操作,數(shù)據(jù)庫(kù)創(chuàng)建器初步完成這個(gè)人的個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)的建設(shè)。建成后的這個(gè)人的個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù),下載到U盤或電腦中保存起來,以備專用的各種實(shí)用的器具或系統(tǒng)使用。數(shù)據(jù)庫(kù)創(chuàng)建器里面的數(shù)據(jù)庫(kù)刪除清空后,以備下一個(gè)人再使用。
[0013]本發(fā)明的硬件部分為個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)創(chuàng)建器,其結(jié)構(gòu)與工作方法為:
一種個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)創(chuàng)建器,它包括:語(yǔ)音采集部分耳朵支架、語(yǔ)音采集頭、語(yǔ)音采集開關(guān)、機(jī)殼、控制電路集成主板、芯片組、微處理器、存儲(chǔ)器、顯示面板、手寫輸入文字或軟健盤輸入文字的屏幕、操作按鈕、發(fā)音喇叭、插孔、插槽、電池與電池槽。
[0014]語(yǔ)音采集部分的耳朵支架(I)掛在耳朵上,觸頭(2)伸向嘴邊,由連線(4)插入數(shù)據(jù)庫(kù)創(chuàng)建器主機(jī)的聲音輸入插孔(5),連線上安裝有開關(guān)(3)。
[0015]一組聲音進(jìn)入數(shù)據(jù)庫(kù)創(chuàng)建器后,由系統(tǒng)分解成各個(gè)語(yǔ)音單元,存儲(chǔ)在存儲(chǔ)器中,如果再有一組聲音進(jìn)入數(shù)據(jù)庫(kù)創(chuàng)建器后,由系統(tǒng)分析成各個(gè)語(yǔ)音單元,新的語(yǔ)音單元存儲(chǔ)在存儲(chǔ)器中,重復(fù)的語(yǔ)音單元不再存儲(chǔ)。
[0016]發(fā)音者按數(shù)據(jù)庫(kù)創(chuàng)建器上的復(fù)讀按鈕(9),數(shù)據(jù)庫(kù)創(chuàng)建器以發(fā)音者的原聲音將語(yǔ)音單元復(fù)讀出,發(fā)音者在顯示屏(7)上用手輸入自己認(rèn)為的此語(yǔ)音單元所表達(dá)的文字。發(fā)音者再次按數(shù)據(jù)庫(kù)創(chuàng)建器上的復(fù)讀按鈕(9),數(shù)據(jù)庫(kù)創(chuàng)建器復(fù)讀出下一個(gè)語(yǔ)音單元,以此類推,不斷地由發(fā)音者與系統(tǒng)確定存儲(chǔ)在數(shù)據(jù)庫(kù)創(chuàng)建器中的語(yǔ)音單元與文字的對(duì)應(yīng)關(guān)系。
[0017]發(fā)音者按數(shù)據(jù)庫(kù)創(chuàng)建器上的數(shù)據(jù)顯示按鈕(10),數(shù)據(jù)庫(kù)創(chuàng)建器復(fù)讀出語(yǔ)音單元,并在顯示屏上(7)顯示出與此語(yǔ)音相對(duì)應(yīng)的文字,如果發(fā)音者認(rèn)為正確,可再按數(shù)據(jù)顯示按鈕(10),數(shù)據(jù)庫(kù)創(chuàng)建器復(fù)讀出下一個(gè)語(yǔ)音單元顯示出下一組文字,如果發(fā)音者認(rèn)為顯示的文字不能正確表達(dá)這個(gè)語(yǔ)音的意思,可在顯示屏(7)上進(jìn)行修改,如果發(fā)音者認(rèn)為這個(gè)語(yǔ)音單元不能代表自己的個(gè)性化語(yǔ)音(如噪音太大,或發(fā)音者掩飾了自己的個(gè)性化語(yǔ)音),則可刪除這個(gè)語(yǔ)音單元。
[0018]數(shù)據(jù)庫(kù)創(chuàng)建器集中時(shí)間工作或平時(shí)隨意工作一段時(shí)間后,數(shù)據(jù)庫(kù)創(chuàng)建器里采集的語(yǔ)音單元和輸入的文字越來越多,采集的語(yǔ)音單元越來越接近于這個(gè)人所能發(fā)出的所有語(yǔ)音單元,也就是說系統(tǒng)和發(fā)音者共同創(chuàng)建的個(gè)性化語(yǔ)音對(duì)應(yīng)標(biāo)準(zhǔn)文本文字?jǐn)?shù)據(jù)庫(kù)幾乎完成了這個(gè)人所能發(fā)出的所有語(yǔ)音單元與文本文字的對(duì)應(yīng)關(guān)系。將U盤、電腦、手機(jī)、萬(wàn)話機(jī)(一種聽進(jìn)自己的個(gè)性化語(yǔ)音復(fù)讀出不同語(yǔ)種不同方言的電子器具)、普話機(jī)(一種聽進(jìn)自己的個(gè)性化語(yǔ)音復(fù)讀出標(biāo)準(zhǔn)普通話的電子器具)、仿真機(jī)器人、智能玩具、礦下機(jī)器(因采取有線無線傳送信息比較困難,用人的指體也不方便,可采用語(yǔ)音來操作控制)、語(yǔ)音操控汽車等等機(jī)器及器具與本數(shù)據(jù)庫(kù)創(chuàng)建器的USB (6)接口相連接,按保存按鈕(11),這個(gè)人的個(gè)性化語(yǔ)音對(duì)應(yīng)標(biāo)準(zhǔn)文本文字?jǐn)?shù)據(jù)庫(kù)將保存到這些機(jī)器及器具中,以備將來使用或直接配合其它系統(tǒng)使用,完成語(yǔ)音精確轉(zhuǎn)化為文本文字的功效。
[0019]按刪除按鈕(13),本數(shù)據(jù)庫(kù)創(chuàng)建器將清空里面所有的語(yǔ)音單元和文字,本數(shù)據(jù)庫(kù)創(chuàng)建器可移交給另一個(gè)人,再為另一個(gè)人創(chuàng)建他的個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)。
[0020]本發(fā)明的有益效果
真正實(shí)現(xiàn)解放雙手的革命。當(dāng)語(yǔ)音轉(zhuǎn)化為文本文字的系統(tǒng)被發(fā)明出來后,人們就夢(mèng)想著用說話來替代雙手,但由于只有極少數(shù)人能說出標(biāo)準(zhǔn)的語(yǔ)音,又因?yàn)殡p手可以精準(zhǔn)地表達(dá)一個(gè)人的意思,而語(yǔ)音卻做不到精準(zhǔn),所以這個(gè)夢(mèng)想至今還沒有實(shí)現(xiàn)。本發(fā)明通過發(fā)音者自己用手確定了語(yǔ)音與語(yǔ)義的精準(zhǔn)對(duì)應(yīng)關(guān)系,創(chuàng)建了這種對(duì)應(yīng)關(guān)系的數(shù)據(jù)庫(kù),從而解決了這一技術(shù)難題,使各行各業(yè)將發(fā)生解放雙手的革命成為現(xiàn)實(shí),人們不僅僅可以用手來勞動(dòng),也可以用嘴來勞動(dòng),“動(dòng)嘴不動(dòng)手”這個(gè)詞從“不實(shí)干”的含義變?yōu)椤案咧腔矍筛伞钡暮x。
[0021]實(shí)現(xiàn)人與人之間的無礙溝通?!妒ソ?jīng).舊約.創(chuàng)世記》第11章宣稱,原來天下的人都講一種語(yǔ)言亞當(dāng)語(yǔ),大家聯(lián)合起來興建希望能通往天堂的高塔,高高的塔頂沖入云霄,為了阻止人類的計(jì)劃,上帝讓人類說不同的語(yǔ)言,使人類相互之間不能溝通,互相猜疑、互相不配合,計(jì)劃因此失敗。這個(gè)故事給我們清楚地指出:語(yǔ)言不同,是全世界處于混亂狀態(tài)的重要原因之一,也是限止人類繼續(xù)發(fā)展的瓶頸。本發(fā)明將有效地解決這一現(xiàn)狀。
[0022]不糾正、不限止、不訓(xùn)練發(fā)音者的語(yǔ)音。傳統(tǒng)的語(yǔ)音轉(zhuǎn)化為文字的系統(tǒng),是程序員根據(jù)本國(guó)語(yǔ)言的標(biāo)準(zhǔn)語(yǔ)音編寫的程序,當(dāng)發(fā)音者說出不標(biāo)準(zhǔn)的語(yǔ)音時(shí),就會(huì)出現(xiàn)錯(cuò)誤,所以對(duì)發(fā)音者的語(yǔ)音標(biāo)準(zhǔn)度要求很高。本發(fā)明是針對(duì)每個(gè)人的個(gè)性化語(yǔ)音編寫的程序,對(duì)發(fā)音者的語(yǔ)音沒有要求,無需對(duì)發(fā)音者進(jìn)行訓(xùn)練,也無需對(duì)系統(tǒng)進(jìn)行訓(xùn)練,正確率在99.9%。
[0023]傳統(tǒng)的語(yǔ)音系統(tǒng)因?yàn)槭敲鎸?duì)一個(gè)語(yǔ)種或多個(gè)語(yǔ)種,所建數(shù)據(jù)庫(kù)非常龐大,對(duì)硬件的要求高,傳送速度慢,因手持器具的芯片的處理能力太弱,所以一般都采取將系統(tǒng)和數(shù)據(jù)庫(kù)存放在遠(yuǎn)程服務(wù)器內(nèi)。本發(fā)明是針對(duì)一個(gè)人的語(yǔ)音,所建數(shù)據(jù)庫(kù)相對(duì)很小,系統(tǒng)程序小,對(duì)硬件的要求低,傳送速度快,數(shù)據(jù)庫(kù)可以直接存放在手持硬件中。
[0024]在硬件方面,過去都是采取了在硬件上設(shè)置這方面的功能,如手機(jī)、電腦等,本發(fā)明是專門為建設(shè)語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)設(shè)計(jì)的器具,除此之外沒有其他功能,而且可以重復(fù)使用,所建數(shù)據(jù)庫(kù)可獨(dú)立出來、下載保存,需要時(shí)再安裝到不同的系統(tǒng)中使用,靈活方便。
[0025]在適應(yīng)性方面,本數(shù)據(jù)庫(kù)建成后,系統(tǒng)設(shè)計(jì)有程序轉(zhuǎn)化功能,可以將本數(shù)據(jù)庫(kù)的計(jì)算機(jī)語(yǔ)言轉(zhuǎn)化成各種常用的程序語(yǔ)言,以便適應(yīng)不同系統(tǒng)的需要。
[0026]本發(fā)明的數(shù)據(jù)庫(kù)創(chuàng)建器創(chuàng)建的個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù),有什么用處呢?現(xiàn)舉例說明:
第一類,使互聯(lián)網(wǎng)更加人性化。
[0027]例一:網(wǎng)站無人智能接聽回復(fù)電話系統(tǒng)。因?yàn)檫@個(gè)系統(tǒng)中安裝了網(wǎng)站上各個(gè)會(huì)員的個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù),所以會(huì)員打來的電話可以精準(zhǔn)地轉(zhuǎn)變?yōu)槲淖?,使網(wǎng)站可以全天24小時(shí)即時(shí)無人工回復(fù)會(huì)員打來的電話。
[0028]例二:語(yǔ)音鼠標(biāo)。在電腦中安裝一套系統(tǒng),這套系統(tǒng)事先安裝上使用者的個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù),所以使用者的語(yǔ)音可以精準(zhǔn)地轉(zhuǎn)變?yōu)槲淖?,就可以用語(yǔ)音信息對(duì)電腦進(jìn)行操作。
[0029]第二類,人與人面對(duì)面無礙交流。
[0030]例一:普話機(jī)。專門為普話機(jī)設(shè)計(jì)一套軟件程序,買回普話機(jī)后,這個(gè)人可以將自己的個(gè)性話語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)安裝進(jìn)普話機(jī),就可以實(shí)現(xiàn)這個(gè)人用他的個(gè)性話語(yǔ)音(譬如廣東話)對(duì)著普話機(jī)說話,普話機(jī)復(fù)讀出標(biāo)準(zhǔn)的普通話。
[0031]例二:萬(wàn)話機(jī)。專門為萬(wàn)話機(jī)設(shè)計(jì)一套軟件程序,買回萬(wàn)話機(jī)后,這個(gè)人可以將自己的個(gè)性話語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)安裝進(jìn)萬(wàn)話機(jī),就可以實(shí)現(xiàn)這個(gè)人用他的個(gè)性話語(yǔ)音(譬如四川話)對(duì)著普話機(jī)說話,萬(wàn)話機(jī)復(fù)讀出各國(guó)語(yǔ)言各種方言,如標(biāo)準(zhǔn)的英語(yǔ)。
[0032]例三:智能麥克風(fēng)。一種安裝了使用者個(gè)性化對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)的麥克風(fēng)及相關(guān)程序,這種麥克風(fēng)聽進(jìn)自己的個(gè)性化語(yǔ)音,可以播放出各種標(biāo)準(zhǔn)語(yǔ)音的麥克風(fēng)。
[0033]例四:智能麥克風(fēng)耳機(jī)系統(tǒng)。麥克風(fēng)的軟件程序里安裝了演講者的個(gè)性化對(duì)應(yīng)文本文字?jǐn)?shù)據(jù),而聽眾所帶的耳機(jī)與其為一個(gè)整體系統(tǒng),可以實(shí)現(xiàn):一個(gè)人在臺(tái)上講話,臺(tái)下各國(guó)的聽眾將耳機(jī)選擇到本國(guó)語(yǔ)音,即可聽到同步的演講者的演說。
[0034]第三類,通話。
[0035]例:不同語(yǔ)種人與之間進(jìn)行手機(jī)通話的程序系統(tǒng)。為手機(jī)專門設(shè)計(jì)一套系統(tǒng),當(dāng)手機(jī)購(gòu)買回來后,安裝上這個(gè)手機(jī)主人的個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù),如果對(duì)方的手機(jī)也有這套系統(tǒng),也安裝了個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù),那么,就可以實(shí)現(xiàn)不同語(yǔ)種人與人之間的手機(jī)無語(yǔ)言障礙通話。
[0036]第四類,收集思維。
[0037]例:思維收集器。專門為思維收集器設(shè)計(jì)一套軟件程序,買回思維收集器后這個(gè)人可以將自己的個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)安裝進(jìn)思維收集器,這個(gè)人無論躺在床上,還是坐在飛機(jī)上,有什么好的想法、科技靈感、設(shè)計(jì)方案、小說故事等等時(shí),馬上掏出思維收集器,將思維說出,以文本文字的形式保存進(jìn)思維收集器。[0038]第五類,人與機(jī)器的交流、互動(dòng)。
[0039]例一:語(yǔ)音智能汽車。為汽車設(shè)計(jì)一套軟件系統(tǒng),當(dāng)汽車購(gòu)回后安裝上駕駛者的個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)后,此數(shù)據(jù)庫(kù)是通過手指確定了發(fā)音者意思的,雖然駕駛者是通過語(yǔ)音來駕駛汽車,實(shí)質(zhì)上是用手指在駕駛,所以,這個(gè)人的聲音如同他的手一樣可以準(zhǔn)確地表達(dá)出指令,以實(shí)現(xiàn)語(yǔ)音對(duì)汽車的精確操作。
[0040]例二:用語(yǔ)音操控的礦下機(jī)器。深礦下的機(jī)器,人用指體操控不方便,用無線和有線傳送信息控制指令比較困難,安裝上個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)和相關(guān)程序后,可以通過語(yǔ)音進(jìn)行操作。
[0041]第六類,智能機(jī)器人。
[0042]為例:知己智能機(jī)器人。為機(jī)器人設(shè)計(jì)的系統(tǒng)中,可以安裝進(jìn)某個(gè)人的個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù),使這個(gè)智能機(jī)器人與這個(gè)人達(dá)到無礙溝通、交流,而且只能讓這個(gè)人正常使用,其他人不能正常使用,甚至無法使用。
[0043]【專利附圖】
【附圖說明】
圖1為本技術(shù)路線的系統(tǒng)流程框圖 圖2為本發(fā)明的結(jié)構(gòu)和工作方法示意圖。
[0044]在圖2中,(I)是耳朵固定支架,(2)是語(yǔ)首米集觸頭,(3)是語(yǔ)首米集開關(guān),(4)是連線,(5)是聲音進(jìn)入播孔,(6)是USB接口,(7)是顯示面板和手寫輸入文字或軟鍵盤輸入文字屏幕,(8)是喇叭,(9)是語(yǔ)音單元復(fù)讀按鈕,(10)是數(shù)據(jù)顯示按鈕,(11)是數(shù)據(jù)庫(kù)下載保存按鈕,(12)是電源開關(guān),(13)是數(shù)據(jù)庫(kù)刪除按鈕。
【具體實(shí)施方式】
[0045]以下用實(shí)施例結(jié)合附圖對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說明:
原來的語(yǔ)音輸入法,都是采取的“語(yǔ)音識(shí)別技術(shù)”,這條技術(shù)路線已經(jīng)研究了近三十年,但無法解決將所有人發(fā)出的語(yǔ)音都能準(zhǔn)確性地轉(zhuǎn)化為文本文字,這并不是技術(shù)本身的問題,假如全世界人都能說出標(biāo)準(zhǔn)的語(yǔ)音,那么可以說這方面的技術(shù)沒有問題了,但是能說出標(biāo)準(zhǔn)語(yǔ)音的人太少了。針對(duì)這個(gè)現(xiàn)象,我們重新設(shè)計(jì)出一條技術(shù)路線:“語(yǔ)音確定語(yǔ)義技術(shù)”,這條技術(shù)路線改變了由軟件程序獨(dú)自完成語(yǔ)音轉(zhuǎn)化為文字的工作,而是由軟件程序和發(fā)音者首先完成他的個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)的建設(shè),再將這個(gè)數(shù)據(jù)庫(kù)應(yīng)用到各種與語(yǔ)音相關(guān)的系統(tǒng)中。其本質(zhì)原理在于:人們歷來的操作,都是用手指,因?yàn)槭种改軠?zhǔn)確無誤表達(dá)人的意思,所以首先要讓人的手指參與進(jìn)去建立一個(gè)人特有的語(yǔ)音對(duì)應(yīng)語(yǔ)義數(shù)據(jù)庫(kù),當(dāng)這個(gè)數(shù)據(jù)庫(kù)應(yīng)用到其他系統(tǒng)中時(shí),雖然當(dāng)時(shí)這個(gè)人的手指沒有發(fā)揮作用,其實(shí)質(zhì)這個(gè)人的手指在發(fā)揮著作用,這就是這條技術(shù)路線能實(shí)現(xiàn)讓每個(gè)人的語(yǔ)音輸入達(dá)到精準(zhǔn)效果的原因所在。
[0046]如圖1所示,本系統(tǒng)軟件部分主要包括語(yǔ)音采集模塊、個(gè)性化語(yǔ)音單元模塊、個(gè)性化語(yǔ)音數(shù)據(jù)庫(kù)、個(gè)性化語(yǔ)義數(shù)據(jù)庫(kù)、個(gè)性化語(yǔ)音對(duì)應(yīng)語(yǔ)義數(shù)據(jù)庫(kù)、語(yǔ)義規(guī)范模塊和個(gè)性化語(yǔ)音對(duì)應(yīng)標(biāo)準(zhǔn)語(yǔ)義數(shù)據(jù)庫(kù)。語(yǔ)音采集模塊采集發(fā)音者說話時(shí)發(fā)音器官發(fā)出的語(yǔ)音,語(yǔ)音特征包括:音高、音強(qiáng)、音質(zhì)、音色、音頻、音長(zhǎng)、音速、聲波、聲調(diào)。個(gè)性化語(yǔ)音單元模塊對(duì)語(yǔ)音采集模塊采集到的語(yǔ)音進(jìn)行分類整理,以單音節(jié)、雙音節(jié)、多音節(jié)為單位建立語(yǔ)音單元。個(gè)性化語(yǔ)音數(shù)據(jù)庫(kù),以語(yǔ)音單元為基本單位建立個(gè)性化語(yǔ)音數(shù)據(jù)庫(kù)。個(gè)性化語(yǔ)義數(shù)據(jù)庫(kù),由發(fā)音者以文本文字定義個(gè)性化語(yǔ)音數(shù)據(jù)庫(kù)中的各語(yǔ)音單元。個(gè)性化語(yǔ)音對(duì)應(yīng)語(yǔ)義數(shù)據(jù)庫(kù),將個(gè)性化語(yǔ)音數(shù)據(jù)庫(kù)的語(yǔ)音單元與個(gè)性化語(yǔ)義數(shù)據(jù)庫(kù)的文本文字—對(duì)應(yīng),建立個(gè)性化語(yǔ)音對(duì)應(yīng)語(yǔ)義數(shù)據(jù)庫(kù)。語(yǔ)義規(guī)范模塊,對(duì)個(gè)性化語(yǔ)音對(duì)應(yīng)語(yǔ)義數(shù)據(jù)庫(kù)進(jìn)行分析規(guī)范,將個(gè)性化語(yǔ)音對(duì)應(yīng)語(yǔ)義數(shù)據(jù)庫(kù)中的文本文字,規(guī)范為本國(guó)語(yǔ)言本地語(yǔ)系的標(biāo)準(zhǔn)文本文字。個(gè)性化語(yǔ)音對(duì)應(yīng)標(biāo)準(zhǔn)語(yǔ)義數(shù)據(jù)庫(kù),經(jīng)語(yǔ)義規(guī)范模塊將發(fā)音者的語(yǔ)音與標(biāo)準(zhǔn)語(yǔ)義對(duì)應(yīng),建立個(gè)性化語(yǔ)音對(duì)應(yīng)標(biāo)準(zhǔn)語(yǔ)義數(shù)據(jù)庫(kù)。
[0047]如圖2所示,本系統(tǒng)的硬件為個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)創(chuàng)建器,數(shù)據(jù)庫(kù)創(chuàng)建器的語(yǔ)音采集部分安置在某個(gè)人的頭部,語(yǔ)音采集觸頭伸向嘴邊,數(shù)據(jù)庫(kù)創(chuàng)建器將自動(dòng)采集這個(gè)人定時(shí)或平時(shí)發(fā)出的個(gè)性化聲波、聲調(diào)、音頻、音質(zhì)、速度等(語(yǔ)音),經(jīng)過整理后,以單音節(jié)、雙音節(jié)、多音節(jié)為單位,創(chuàng)建這個(gè)人的語(yǔ)音單元,用這些語(yǔ)音單元建立這個(gè)人的個(gè)性化語(yǔ)音數(shù)據(jù)庫(kù),系統(tǒng)再將整理后的語(yǔ)音單元一一復(fù)讀出,由發(fā)音者用手指確定各個(gè)語(yǔ)音單元所要表達(dá)的意義,發(fā)音者通過觸摸顯示屏將各種語(yǔ)音的語(yǔ)義以文本文字的形式輸入系統(tǒng),建立這個(gè)人的個(gè)性化語(yǔ)義數(shù)據(jù)庫(kù)。語(yǔ)音數(shù)據(jù)庫(kù)和語(yǔ)義數(shù)據(jù)庫(kù)建立起對(duì)應(yīng)關(guān)系,語(yǔ)音數(shù)據(jù)庫(kù)有什么信息,語(yǔ)義數(shù)據(jù)庫(kù)中就對(duì)應(yīng)過來什么信息,形成一一對(duì)應(yīng)。
[0048]系統(tǒng)帶有語(yǔ)匯分析功能、語(yǔ)法分析功能、習(xí)慣用語(yǔ)分析功能,對(duì)這個(gè)人的個(gè)性化語(yǔ)義(文本文字)數(shù)據(jù)庫(kù)進(jìn)行整體評(píng)估分析、特性評(píng)估分析,找到與本國(guó)語(yǔ)言本地語(yǔ)系標(biāo)準(zhǔn)的語(yǔ)匯、標(biāo)準(zhǔn)的語(yǔ)法、標(biāo)準(zhǔn)的習(xí)慣的對(duì)應(yīng)關(guān)系,規(guī)范數(shù)據(jù)庫(kù)里的文本文字,將這個(gè)人的個(gè)性化語(yǔ)義升級(jí)為這個(gè)人的標(biāo)準(zhǔn)語(yǔ)義。從而使文本文字既能準(zhǔn)確無誤地反應(yīng)出發(fā)音者的語(yǔ)義,又能符合本國(guó)語(yǔ)言本地語(yǔ)系文本文字的大眾化標(biāo)準(zhǔn)化。
[0049]當(dāng)系統(tǒng)的個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)創(chuàng)建器采集到新的聲波(語(yǔ)音)時(shí),便增加到個(gè)性化聲波(語(yǔ)音)數(shù)據(jù)庫(kù),不斷豐富數(shù)據(jù)庫(kù)內(nèi)容。由發(fā)音者選定時(shí)間對(duì)新增加的語(yǔ)音單元進(jìn)行確定語(yǔ)義的操作。經(jīng)過一段時(shí)間的使用,本系統(tǒng)完成了這個(gè)人大部分的語(yǔ)音對(duì)應(yīng)標(biāo)準(zhǔn)語(yǔ)義數(shù)據(jù)庫(kù)的建設(shè),本發(fā)明的數(shù)據(jù)庫(kù)可以做為他的個(gè)性化語(yǔ)音語(yǔ)義程序模塊,并可轉(zhuǎn)換成各種程序語(yǔ)言,存蓄起來終生使用,隨時(shí)隨地安裝到其他相適應(yīng)的各種軟硬件上去,與其它程序相配合,廣泛應(yīng)用。隨著時(shí)間越來越久,系統(tǒng)幾乎可以將這個(gè)人的所有語(yǔ)音全部采集進(jìn)他的個(gè)性化語(yǔ)音數(shù)據(jù)庫(kù),更加熟習(xí)地掌握他的語(yǔ)匯范疇、語(yǔ)法特點(diǎn)、習(xí)慣用語(yǔ),建立健全他的個(gè)性化語(yǔ)音對(duì)應(yīng)標(biāo)準(zhǔn)語(yǔ)義庫(kù)。
[0050]如圖1所示,本技術(shù)的方法包括如下步驟:
步驟A,發(fā)音者發(fā)出語(yǔ)音;
步驟B,語(yǔ)音采集模塊采集發(fā)音者說話時(shí)發(fā)音器官發(fā)出的語(yǔ)音,語(yǔ)音特征包括:音高、音強(qiáng)、音質(zhì)、音色、音頻、音長(zhǎng)、音速、聲波、聲調(diào);
步驟C,對(duì)語(yǔ)音采集模塊采集到的語(yǔ)音進(jìn)行分類整理,以單音節(jié)、雙音節(jié)、多音節(jié)為單位建立個(gè)性化語(yǔ)音單元集合;
步驟D,以語(yǔ)音單元為基本單位建立個(gè)性化語(yǔ)音數(shù)據(jù)庫(kù);語(yǔ)音數(shù)據(jù)庫(kù)在接收到新的語(yǔ)音單元時(shí),與語(yǔ)音數(shù)據(jù)庫(kù)的語(yǔ)音單元進(jìn)行對(duì)比,如不相同,則存入語(yǔ)音數(shù)據(jù)庫(kù);
步驟E,由發(fā)音者以文本文字定義個(gè)性化語(yǔ)音數(shù)據(jù)庫(kù)中的各個(gè)語(yǔ)音單元,建立個(gè)性化語(yǔ)義數(shù)據(jù)庫(kù);具體步驟為:
O由聲音設(shè)備將語(yǔ)音單兀以原發(fā)音者的語(yǔ)音 復(fù)讀出來;
2)發(fā)音者將語(yǔ)音單元以自己認(rèn)為的語(yǔ)義,用文本文字的形式輸入系統(tǒng); 3)建立發(fā)音者的語(yǔ)義數(shù)據(jù)庫(kù);
步驟F,將個(gè)性化語(yǔ)音數(shù)據(jù)庫(kù)的語(yǔ)音單元與個(gè)性化語(yǔ)義數(shù)據(jù)庫(kù)的文本文字一一對(duì)應(yīng),建立個(gè)性化語(yǔ)音對(duì)應(yīng)語(yǔ)義數(shù)據(jù)庫(kù);
步驟G,由語(yǔ)義規(guī)范模塊對(duì)個(gè)性化語(yǔ)音對(duì)應(yīng)語(yǔ)義數(shù)據(jù)庫(kù)進(jìn)行分析規(guī)范:語(yǔ)匯分析、語(yǔ)法分析和習(xí)慣用語(yǔ)分析;將個(gè)性化語(yǔ)音對(duì)應(yīng)語(yǔ)義數(shù)據(jù)庫(kù)的文本文字,根據(jù)本國(guó)語(yǔ)言本地語(yǔ)系標(biāo)準(zhǔn)的字、詞、句、語(yǔ)法、習(xí)慣規(guī)范為標(biāo)準(zhǔn)化大眾化的文本文字;
步驟H,經(jīng)語(yǔ)義規(guī)范模塊將發(fā)音者的語(yǔ)音與標(biāo)準(zhǔn)語(yǔ)義對(duì)應(yīng),建立個(gè)性化語(yǔ)音對(duì)應(yīng)標(biāo)準(zhǔn)語(yǔ)義數(shù)據(jù)庫(kù)。
[0051]如圖2所示,本發(fā)明的硬件的結(jié)構(gòu)和工作方式如下:
一種個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)創(chuàng)建器,它包括:語(yǔ)音采集部分耳朵支架、語(yǔ)音采集頭、語(yǔ)音采集開關(guān)、機(jī)殼、控制電路集成主板、芯片組、微處理器、存儲(chǔ)器、顯示面板、手寫輸入文字或軟健盤輸入文字的屏幕、操作按鈕、喇叭、插孔、插槽、電池與電池槽。
[0052]語(yǔ)音采集部分的耳朵支架掛在耳朵上,(2)觸頭伸向嘴邊,由(4)連線插入數(shù)據(jù)庫(kù)創(chuàng)建器主機(jī)的(5)聲音輸入插孔,連線上安裝有(3)開關(guān)。
[0053]一組聲音進(jìn)入數(shù)據(jù)庫(kù)創(chuàng)建器后,由系統(tǒng)分解成語(yǔ)音單元,存儲(chǔ)在存儲(chǔ)器中,再有一組聲音進(jìn)入數(shù)據(jù)庫(kù)創(chuàng)建器后,由系統(tǒng)分析成語(yǔ)音單元,新的語(yǔ)音單元存儲(chǔ)在存儲(chǔ)器中,重復(fù)的語(yǔ)音單元不再存儲(chǔ)。
[0054]發(fā)音者按數(shù)據(jù)庫(kù)創(chuàng)建器上的(9)復(fù)讀按鈕,數(shù)據(jù)庫(kù)創(chuàng)建器以保持發(fā)音者的聲音將語(yǔ)音單元復(fù)讀出,發(fā)音者在(7)顯示屏上用手指輸入自己認(rèn)為的與此語(yǔ)音單元相對(duì)應(yīng)的文字。發(fā)音者再次按數(shù)據(jù)庫(kù)創(chuàng)建器上的(9 )復(fù)讀按鈕,數(shù)據(jù)庫(kù)創(chuàng)建器復(fù)讀出下一個(gè)語(yǔ)音單元,以此類推,不斷地由發(fā)音者與系統(tǒng)確定存儲(chǔ)在數(shù)據(jù)庫(kù)創(chuàng)建器中的語(yǔ)音單元與文字的對(duì)應(yīng)關(guān)系O
[0055]發(fā)音者按數(shù)據(jù)庫(kù)創(chuàng)建器上的(10)數(shù)據(jù)顯示按鈕,數(shù)據(jù)庫(kù)創(chuàng)建器復(fù)讀出語(yǔ)音單元,并在(7)顯示屏上顯示出與此語(yǔ)音相對(duì)應(yīng)的文字,如果發(fā)音者認(rèn)為正確,可再按一次(10)數(shù)據(jù)顯示按鈕,數(shù)據(jù)庫(kù)創(chuàng)建器復(fù)讀出下一個(gè)語(yǔ)音單元顯示出下一個(gè)文字,如果發(fā)音者認(rèn)為顯示的文字不能正確表達(dá)這個(gè)語(yǔ)音的意思,可在(7)顯示屏上進(jìn)行修改,如果發(fā)音者認(rèn)為這個(gè)語(yǔ)音單元不是自己的個(gè)性化語(yǔ)音(如噪音太大,或發(fā)音者掩飾了自己的個(gè)性化語(yǔ)音),刪除這個(gè)語(yǔ)音單元。
[0056]數(shù)據(jù)庫(kù)創(chuàng)建器集中時(shí)間工作或平時(shí)隨意工作一段時(shí)間后,數(shù)據(jù)庫(kù)創(chuàng)建器里采集的語(yǔ)音單元和輸入的文字越來越多,采集的語(yǔ)音單元越來越接近于這個(gè)人所能發(fā)出的所有語(yǔ)音單元,也就是說系統(tǒng)和發(fā)音者共同創(chuàng)建的個(gè)性化語(yǔ)音對(duì)應(yīng)標(biāo)準(zhǔn)文本文字?jǐn)?shù)據(jù)庫(kù)幾乎完成了這個(gè)人所能發(fā)出的所有語(yǔ)音單元與文本文字的對(duì)應(yīng)關(guān)系。將U盤、電腦、手機(jī)、萬(wàn)話機(jī)、普話機(jī)等等機(jī)具與本數(shù)據(jù)庫(kù)存創(chuàng)建器的(6) USB接口相連接,按(11)保存按鈕,這個(gè)人的個(gè)性化語(yǔ)音對(duì)應(yīng)標(biāo)準(zhǔn)文本文字?jǐn)?shù)據(jù)庫(kù)以各種程序語(yǔ)言形式保存到這些機(jī)具中,以備將來使用。
[0057]按(13)刪除按鈕,本數(shù)據(jù)庫(kù)創(chuàng)建器將清空里面所有的語(yǔ)音單元和文字,本數(shù)據(jù)庫(kù)創(chuàng)建器,可移交給另一個(gè)人,再為另一個(gè)人創(chuàng)建他的個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)。
【權(quán)利要求】
1.一種隨身攜帶式創(chuàng)建個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)的裝置,包括:語(yǔ)音采集部分耳朵支架、語(yǔ)音采集頭、語(yǔ)音采集開關(guān)、機(jī)殼、控制電路集成主板、芯片組、微處理器、存儲(chǔ)器、顯示面板、手寫輸入文字或軟健盤輸入文字的屏幕、操作按鈕、喇叭、插孔、插槽、電池與電池槽。
2.按權(quán)利要求1所述一種隨身攜帶式創(chuàng)建個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)的裝置,其特征在于,本發(fā)明裝置安裝有個(gè)性化語(yǔ)音采集與語(yǔ)義確定系統(tǒng)軟件。
3.按權(quán)利要求1所述,其特征在于,一種隨身攜帶式創(chuàng)建個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)的裝置,語(yǔ)音采集部分的耳朵支架(I)掛在耳朵上,語(yǔ)音采集頭(2)伸向嘴邊,連線(4)將語(yǔ)音采集部分與主裝置連接。
4.按權(quán)利要求1所述一種隨身攜帶式創(chuàng)建個(gè)性化語(yǔ)音對(duì)應(yīng)文本文字?jǐn)?shù)據(jù)庫(kù)的裝置,其特征在于,用手指按一下復(fù)讀按鈕(9),數(shù)據(jù)庫(kù)創(chuàng)建器就復(fù)讀出一個(gè)語(yǔ)音單元,發(fā)音者用手在手寫輸入文字或軟健盤輸入文字的屏幕(7)上輸入文字,復(fù)讀的語(yǔ)音單元與手輸入的文字建立對(duì)應(yīng)關(guān)系。
【文檔編號(hào)】G06F17/30GK103455530SQ201210412819
【公開日】2013年12月18日 申請(qǐng)日期:2012年10月25日 優(yōu)先權(quán)日:2012年10月25日
【發(fā)明者】楊京廣, 張永忠, 李樹成, 陳培基, 劉軍 申請(qǐng)人:河南省佰騰電子科技有限公司