專利名稱:網上搜索書源的方法及其系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及網絡書源的搜索,特別涉及使用語音進行網絡書源搜索的技術。
背景技術:
語音識別技術,也被稱為自動語音識別(Automatic Speech Recognition,簡稱 “ASR”),其目標是將人類的語音中的詞匯內容轉換為計算機可讀的輸入,例如按鍵、二進制 編碼或者字符序列等。語音識別技術已被應用于各種領域,如語音撥號、語音導航、室內設備控制、語音 文檔檢索、簡單的聽寫數據錄入等。目前的語音操作方案,是內置了語音識別引擎,把設備中內置的漢字全部提取參 數建立模型。當用戶輸入語音時,再把用戶語音提取參數建立模型,然后和內置已建好的語 音模型進行匹配,匹配成功后執(zhí)行相應的命令。電子書閱讀器是一種用于閱讀電子書的手持設備。有些電子書閱讀器配置有無線 通信模塊,可以連接到互聯(lián)網。而互聯(lián)網上有專門提供電子書下載的站點,站點里有大量的 電子書,又稱為書源,書源通常可以提供檢索功能。用戶可以通過閱讀器連接到書源的網絡 服務器,通過關鍵詞搜索所需的電子書,再下載到閱讀器查看。上述語音操作方案應用于網上書源的搜索時存在問題,書源中電子書的信息不在 手持設備端,無法針對書名進行提取參數和建模,從而無法在手持設備端利用語音搜索網 上書源。
發(fā)明內容
本發(fā)明的目的在于提供一種網上搜索書源的方法及其系統(tǒng),可以通過在閱讀器上 輸入語音搜索網上的書源。為解決上述技術問題,本發(fā)明的實施方式提供了一種網上搜索書源的方法,包括 以下步驟電子書閱讀器記錄用戶輸入的語音信號;閱讀器的語音識別引擎與網絡服務器的語音識別引擎進行協(xié)作處理,根據所記錄 的語音信號建立用戶語音模型;網絡服務器的語音識別引擎將用戶語音模型與預先設置的電子書書名的語音模 型相匹配,得到搜索結果。本發(fā)明的實施方式還提供了一種網上搜索書源的方法,包括以下步驟電子書閱讀器記錄用戶輸入的語音信號;閱讀器將所記錄的語音信號發(fā)送到網絡服務器;網絡服務器的語音識別引擎根據所收到的語音建立用戶語音模型,將該用戶語音 模型與預先設置的電子書書名的語音模型相匹配,得到搜索結果。本發(fā)明的實施方式還提供了一種網上搜索書源的系統(tǒng),包括電子書閱讀器和網絡服務器;閱讀器進一步包括語音輸入模塊,用于記錄用戶輸入的語音信號;語音識別引擎模塊,用于進行語音識別處理;通信模塊,用于和網絡服務器通信;網絡服務器進一步包括語音識別引擎模塊,用于進行語音識別處理;通信模塊,用于和閱讀器通信;閱讀器的語音識別引擎與網絡服務器的語音識別引擎進行協(xié)作處理,根據語音輸 入模塊記錄的語音信號建立用戶語音模型;網絡服務器的語音識別引擎將用戶語音模型與 預先設置的電子書書名的語音模型相匹配,得到搜索結果。本發(fā)明的實施方式還提供了一種網上搜索書源的系統(tǒng),包括電子書閱讀器和網絡 服務器;閱讀器進一步包括語音輸入模塊,用于記錄用戶輸入的語音信號;通信模塊,用于將語音輸入模塊所記錄的語音信號發(fā)送到網絡服務器;網絡服務器進一步包括通信模塊,用于接收來自閱讀器的用戶語音;語音識別引擎模塊,用于根據通信模塊收到的語音信號建立用戶語音模型,將該 用戶語音模型與預先設置的電子書書名的語音模型相匹配,得到搜索結果。本發(fā)明實施方式與現有技術相比,主要區(qū)別及其效果在于在閱讀器和網絡服務器上各設置一個語音識別引擎,以協(xié)作的方式建立用戶語音 模型,再在網絡服務器上與庫中電子書書名的語音模型進行匹配,從而實現以語音搜索網 上書源的功能。閱讀器記錄用戶語音,發(fā)給網絡服務器進行語音識別,可以減少閱讀器的處理負 擔,閱讀器不必配置語音識別引擎,充分利用服務器的強大處理能力,得到較好的語音識別 結果和搜索結果。進一步地,在閱讀器進行語音識別的前置處理,可以去除非語音信號,減少了要傳 給網絡服務器的數據量,加快了整個搜索過程。進一步地,在閱讀器側進行聲學特征參數提取,將所得的聲學特征參數傳給網絡 服務器建模,可以進一步減少要傳輸的數據量,加快整個搜索過程。進一步地,在閱讀器側建立用戶語音模型,將模型參數傳給網絡服務器,可以進一 步減少要傳輸的數據量。進一步地,根據閱讀器與網絡服務器連接的有效帶寬,決定閱讀器要傳給網絡服 務器的數據類型,以及相應的語音識別工作量分配,可以充分適應當前網絡環(huán)境和服務器 的運算能力,在整體上較快地得到搜索結果。
圖1是本發(fā)明第一實施方式中網上搜索書源的方法流程示意圖2是本發(fā)明第二實施方式中網上搜索書源的方法流程示意圖;圖3是本發(fā)明第三實施方式中網上搜索書源的方法流程示意圖;圖4是本發(fā)明第四實施方式中網上搜索書源的方法流程示意圖;圖5是本發(fā)明第六實施方式中網上搜索書源的系統(tǒng)結構示意圖;圖6是本發(fā)明第七實施方式中網上搜索書源的系統(tǒng)結構示意圖。
具體實施例方式在以下的敘述中,為了使讀者更好地理解本申請而提出了許多技術細節(jié)。但是,本 領域的普通技術人員可以理解,即使沒有這些技術細節(jié)和基于以下各實施方式的種種變化 和修改,也可以實現本申請各權利要求所要求保護的技術方案。為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面將結合附圖對本發(fā)明的實施 方式作進一步地詳細描述。本發(fā)明第一實施方式涉及一種網上搜索書源的方法,其流程如圖1所示。在步驟101中,電子書閱讀器記錄用戶輸入的語音信號。本發(fā)明各實施方式中所稱的閱讀器可以是各式各樣的,一種典型閱讀器的顯示 屏使用電子墨水技術,其主要功能是閱讀電子書。此外,其它具有電子書閱讀功能的手 持終端設備也屬于本發(fā)明所稱的閱讀器,例如手機、個人數字助理(Personal Digital Assistant,簡稱“PDA” )、上網本等等。此后進入步驟102,閱讀器將所記錄的語音信號發(fā)送到網絡服務器。閱讀器與網絡服務器之間可以通過無線網絡連接,例如無線保真(Wireless Fidelity,簡稱“WiFi”),寬帶碼分多址(Wideband Code DivisionMultiple Access,簡 稱 “WCDMA”)、通用分組無線業(yè)務(General Packet Radio Service,簡稱 “GPRS”)、時分 同步石馬分多址(Time Division Synchronous Code Division Multiple Access,簡禾爾 “TD-SCDMA”)、微波接入全球互通(Worldwide Interoperability for Microwave Access, 簡稱“WiMAX”)等;也可以通過有線網絡連接,如非對稱數字用戶線(Asymmetric Digital Subscriber Line,簡稱 “ADSL”)、光纖到戶(Fiber To The Home,簡稱 “FTTH,,)等。此后進入步驟103,網絡服務器的語音識別引擎根據所收到的語音建立用戶語音 模型此后進入步驟104,網絡服務器的語音識別引擎將該用戶語音模型與預先設置的 電子書書名的語音模型相匹配,得到搜索結果。此后進入步驟105,網絡服務器將搜索結果發(fā)送到閱讀器。此后進入步驟106,閱讀器顯示搜索結果。此后進入步驟107,閱讀器根據用戶的輸入選擇搜索結果中的一本電子書并下載。閱讀器記錄用戶語音,發(fā)給網絡服務器進行語音識別,可以減少閱讀器的處理負 擔,閱讀器不必配置語音識別引擎,充分利用服務器的強大處理能力,得到較好的語音識別 結果和搜索結果。本發(fā)明第二實施方式涉及一種網上搜索書源的方法。第二實施方式在第一實施方式的基礎上進行了改進,改進之處在于,在閱讀器一 側也配置了語音識別引擎,該語音識別引擎與網絡服務器的語音識別引擎協(xié)作處理,共同完成語音識別的工作。第二實施方式的流程圖如圖2所示。在步驟201中,電子書閱讀器記錄用戶輸入的語音信號。此后進入步驟202,閱讀器的語音識別引擎對語音信號進行前置處理,該前置處理 中至少包括端點檢測和語音增強。前置處理可以包括預濾波、采樣和量化、加窗、端點檢測、語音增強等過程。端點 檢測是指在語音信號中將語音和非語音信號時段區(qū)分開來,準確地確定出語音信號的起始 點。經過端點檢測后,后續(xù)處理就可以只對語音信號進行,這對提高模型的精確度和識別正 確率有重要作用。語音增強的主要任務就是消除環(huán)境噪聲對語音的影響??梢圆捎镁S納濾 波的方法,該方法在噪聲較大的情況下效果好于其它濾波器。此后進入步驟203,閱讀器將經前置處理的語音信號發(fā)送到網絡服務器。此后進入步驟204,網絡服務器的語音識別引擎根據來自閱讀器的語音信號建立 用戶語音模型。此后進入步驟205,網絡服務器的語音識別引擎將用戶語音模型與預先設置的電 子書書名的語音模型相匹配,得到搜索結果。本發(fā)明的各實施方式中,搜索結果可以只是最接近的一個電子書書名,也可以是 多個最接近的電子書書名組成的列表,還可以在用戶語音模型與書名語音模型差別較大時 將空列表作為搜索結果。電子書書名的語音模型可以由網絡服務器的語音識別引擎預先生成。網絡服務器 上存有大量電子書書名的語音模型,形成一個模型庫,用戶語音模型與庫中的各語音模型 進行匹配。本發(fā)明各實施方式中所稱的模型可以由聲學模型和語言模型兩部分組成,分別對 應于語音到音節(jié)概率的計算和音節(jié)到字概率的計算。此后進入步驟206,網絡服務器將搜索結果發(fā)送到閱讀器。此后進入步驟207,閱讀器顯示搜索結果。此后進入步驟208,閱讀器根據用戶的輸入選擇搜索結果中的一本電子書,并從網 絡服務器下載該電子書。在閱讀器和網絡服務器上各設置一個語音識別引擎,以協(xié)作的方式建立用戶語音 模型,再在網絡服務器上與庫中電子書書名的語音模型進行匹配,可以實現以語音搜索網 上書源的功能。在閱讀器進行語音識別的前置處理,可以去除非語音信號,減少了要傳給網絡的 數據量,加快了整個搜索過程。本發(fā)明第三實施方式涉及一種網上搜索書源的方法。第三實施方式在第二實施方式的基礎上進行了改進,主要改進之處在于在閱讀 器側進行用戶聲學特征參數提取,將所得的聲學特征參數傳給網絡服務器建模,可以進一 步減少要傳輸的數據量,加快整個搜索過程。第三實施方式的流程圖如圖3所示。在步驟301中,電子書閱讀器記錄用戶輸入的語音信號。此后進入步驟302,閱讀器的語音識別引擎對語音信號進行前置處理和聲學特征參數提取。聲學特征的提取與選擇是語音識別的一個重要環(huán)節(jié)。聲學特征的提取既是一個信 息大幅度壓縮的過程,也是一個信號解卷過程,目的是使模式劃分器能更好地劃分。由于語音信號的時變特性,特征提取必須在一小段語音信號上進行,也即進行短 時分析。這一段被認為是平穩(wěn)的分析區(qū)間稱之為幀,幀與幀之間的偏移通常取幀長的1/2 或1/3。通常要對信號進行預加重以提升高頻,對信號加窗以避免短時語音段邊緣的影響。此后進入步驟303,閱讀器將所提取的聲學特征參數發(fā)送到網絡服務器。此后進入步驟304,網絡服務器的語音識別引擎根據聲學特征參數建立用戶語音 模型。此后的步驟305-308與步驟205-208類似,此處不再贅述。本發(fā)明第四實施方式涉及一種網上搜索書源的方法。第四實施方式在第三實施方式的基礎上進行了改進,主要改進之處在于在閱讀 器側建立用戶語音模型,將模型參數傳給網絡服務器,可以進一步減少要傳輸的數據量。第四實施方式的流程圖如圖4所示。在步驟401中,電子書閱讀器記錄用戶輸入的語音信號。此后進入步驟402,閱讀器的語音識別引擎對語音信號進行前置處理、聲學特征參 數提取。此后進入步驟403,閱讀器的語音識別引擎進一步建立用戶語音模型。此后進入步驟404,閱讀器將用戶語音模型的參數發(fā)送給網絡服務器。此后的步驟405-408與步驟205-208類似,此處不再贅述。本發(fā)明第五實施方式涉及一種網上搜索書源的方法。第五實施方式在第四實施方式的基礎上進行了改進,主要改進之處在于根據閱 讀器與網絡服務器連接的有效帶寬,決定閱讀器要傳給網絡服務器的數據類型,以及相應 的語音識別工作量分配,可以充分適應當前網絡環(huán)境和服務器的運算能力,在整體上較快 地得到搜索結果??梢岳斫猓行挷⒉皇墙尤霂?,也不是瞬時帶寬,而是閱讀器與網絡服務器 之間最近一段時間的實際平均帶寬。閱讀器采用不同的接入方式,以及網絡環(huán)境變化,都會 對有效帶寬產生較大的影響。具體的流程如下首先,電子書閱讀器記錄用戶輸入的語音信號。此后,判斷閱讀器與網絡服務器連接的有效帶寬與各預置門限的大小關系。如果有效帶寬超過第一預置門限,則執(zhí)行步驟202至208,也就是第二實施方式的 方案。這個方案對閱讀器的處理能力要求較少,但數據傳輸量較大,因為有效帶寬大,所以 較適合這個方案。如果有效帶寬在第一預置門限和第二預置門限之間,則執(zhí)行步驟302至308,也就 是第三實施方式的方案。這個方案對閱讀器處理能力的要求適中,數據傳輸量也適中。其 中第一預置門限大于第二預置門限。如果有效帶寬低于第二預置門限,則執(zhí)行步驟402至408,也就是第四實施方式的 方案。這個方案對閱讀器處理能力的要求較高,但數據傳輸量較小,因為有效帶寬小,所以較適合這個方案。在第五實施方式的基礎上還可以進一步修改,當有效帶寬大于第三預置門限時 (第三預置門限大于第一預置門限),可以執(zhí)行步驟102至107,也就是第一實施方式的方案。本發(fā)明的各方法實施方式均可以以軟件、硬件、固件等方式實現。不管本發(fā)明是 以軟件、硬件、還是固件方式實現,指令代碼都可以存儲在任何類型的計算機可訪問的存儲 器中(例如永久的或者可修改的,易失性的或者非易失性的,固態(tài)的或者非固態(tài)的,固定的 或者可更換的介質等等)。同樣,存儲器可以例如是可編程陣列邏輯(Programmable Array Logic,簡稱“PAL”)、隨機存取存儲器(Random Access Memory,簡稱“RAM”)、可編程只讀存 儲器(Programmable Read Only Memory,簡稱 “PROM”)、只讀存儲器(Read-Only Memory, 簡稱“ROM”)、電可擦除可編程只讀存儲器(Electrically Erasable Programmable ROM,簡 稱“EEPR0M”)、磁盤、光盤、數字通用光盤(Digital Versatile Disc,簡稱“DVD”)等等。本發(fā)明第六實施方式涉及一種網上搜索書源的系統(tǒng)。該網上搜索書源的系統(tǒng)包括 電子書閱讀器和網絡服務器。本實施方式的系統(tǒng)結構如圖5所示。閱讀器進一步包括語音輸入模塊,用于記錄用戶輸入的語音信號。本發(fā)明各實施方式中的語音輸入 模塊可以由麥克風、模數轉換器(Analog Digital Converter,簡稱“ADC”)、存貯器件(如 內存、閃存等)等部件組成,麥克風將檢測到的聲波轉換成模擬電信號,經ADC轉成數字信 號,再保存在存貯器件中。通信模塊,用于和網絡服務器通信,將語音輸入模塊所記錄的語音信號發(fā)送到網 絡服務器,從網絡服務器下載的電子書。顯示模塊,用于顯示電子書的內容。優(yōu)選地,顯示模塊可以包括一塊使用電子墨水 技術的顯示屏。處理模塊,用于對通信模塊從網絡服務器下載的電子書進行解析,并控制顯示模 塊進行顯示。網絡服務器進一步包括通信模塊,用于和閱讀器進行通信,接收來自閱讀器的用戶語音,將搜索結果和電 子書內容發(fā)送到閱讀器。語音識別引擎模塊,用于根據通信模塊收到的語音信號建立用戶語音模型,將該 用戶語音模型與預先設置的電子書書名的語音模型相匹配,得到搜索結果。第一實施方式是與本實施方式相對應的方法實施方式,本實施方式可與第一實施 方式互相配合實施。第一實施方式中提到的相關技術細節(jié)在本實施方式中依然有效,為了 減少重復,這里不再贅述。相應地,本實施方式中提到的相關技術細節(jié)也可應用在第一實施 方式中。本發(fā)明第七實施方式涉及一種網上搜索書源的系統(tǒng)。本實施方式的系統(tǒng)結構如圖 6所示。該系統(tǒng)包括電子書閱讀器和網絡服務器。閱讀器進一步包括語音輸入模塊,用于記錄用戶輸入的語音信號。語音識別引擎模塊,用于進行語音識別處理。
通信模塊,用于和網絡服務器通信。顯示模塊,用于顯示電子書的內容。優(yōu)選地,顯示模塊可以包括一塊使用電子墨水 技術的顯示屏。處理模塊,用于對通信模塊從網絡服務器下載的電子書進行解析,并控制顯示模 塊進行顯示。網絡服務器進一步包括語音識別弓I擎模塊,用于進行語音識別處理。通信模塊,用于和閱讀器通信。閱讀器的語音識別引擎與網絡服務器的語音識別引擎進行協(xié)作處理,根據語音輸 入模塊記錄的語音信號建立用戶語音模型。網絡服務器的語音識別引擎將用戶語音模型與 預先設置的電子書書名的語音模型相匹配,得到搜索結果,再傳給閱讀器,由用戶使用閱讀 器在搜索結果中選擇要下載的電子書,并進行下載。閱讀器的語音識別引擎還用于對用戶的操作命令語音進行語音識別,如果匹配到 相應的操作命令,執(zhí)行該操作命令。這些命令可以是各式各樣的,例如“前翻”、“后翻”、“確 認”、“取消”等等。第二至第五實施方式是與本實施方式相對應的方法實施方式,本實施方式可與第 二至第五實施方式互相配合實施。第二至第五實施方式中提到的相關技術細節(jié)在本實施方 式中依然有效,為了減少重復,這里不再贅述。相應地,本實施方式中提到的相關技術細節(jié) 也可應用在第二至第五實施方式中。需要說明的是,本發(fā)明各設備實施方式中提到的各模塊都是邏輯模塊,在物理上, 一個邏輯模塊可以是一個物理模塊,也可以是一個物理模塊的一部分,還可以以多個物理 模塊的組合實現,這些邏輯模塊本身的物理實現方式并不是最重要的,這些邏輯模塊所實 現的功能的組合是才解決本發(fā)明所提出的技術問題的關鍵。此外,為了突出本發(fā)明的創(chuàng)新 部分,本發(fā)明上述各設備實施方式并沒有將與解決本發(fā)明所提出的技術問題關系不太密切 的模塊弓I入,這并不表明上述設備實施方式并不存在其它的模塊。雖然通過參照本發(fā)明的某些優(yōu)選實施方式,已經對本發(fā)明進行了圖示和描述,但 本領域的普通技術人員應該明白,可以在形式上和細節(jié)上對其作各種改變,而不偏離本發(fā) 明的精神和范圍。
權利要求
一種網上搜索書源的方法,其特征在于,包括以下步驟電子書閱讀器記錄用戶輸入的語音信號;所述閱讀器的語音識別引擎與網絡服務器的語音識別引擎進行協(xié)作處理,根據所記錄的語音信號建立用戶語音模型;所述網絡服務器的語音識別引擎將所述用戶語音模型與預先設置的電子書書名的語音模型相匹配,得到搜索結果。
2.根據權利要求1所述的網上搜索書源的方法,其特征在于,所述協(xié)作處理的步驟包 括以下子步驟所述閱讀器的語音識別引擎對所述語音信號進行前置處理,該前置處理中至少包括端 點檢測和語音增強;所述閱讀器將經所述前置處理的語音信號發(fā)送到所述網絡服務器; 所述網絡服務器的語音識別引擎根據來自所述閱讀器的語音信號建立用戶語音模型。
3.根據權利要求1所述的網上搜索書源的方法,其特征在于,所述協(xié)作處理的步驟包 括以下子步驟所述閱讀器的語音識別引擎對所述語音信號進行前置處理和聲學特征參數提?。凰鲩喿x器將所提取的聲學特征參數發(fā)送到所述網絡服務器;所述網絡服務器的語音識別引擎根據所述聲學特征參數建立用戶語音模型。
4.根據權利要求1所述的網上搜索書源的方法,其特征在于,所述協(xié)作處理的步驟包 括以下子步驟所述閱讀器的語音識別引擎對所述語音信號進行前置處理、聲學特征參數提取、并建 立用戶語音模型;所述閱讀器將所述用戶語音模型的參數發(fā)送給所述網絡服務器。
5.根據權利要求1所述的網上搜索書源的方法,其特征在于,所述協(xié)作處理的步驟包 括以下子步驟如果所述閱讀器與所述網絡服務器連接的有效帶寬超過第一預置門限,則所述閱讀器 的語音識別引擎對所述語音信號進行前置處理,并將經處理的語音信號發(fā)送到所述網絡服 務器建立用戶語音模型;如果所述閱讀器與所述網絡服務器連接的有效帶寬在第一預置門限和第二預置門限 之間,則所述閱讀器的語音識別引擎對所述語音信號進行前置處理和聲學特征參數提取, 將所提取的聲學特征參數發(fā)送到所述網絡服務器建立用戶語音模型;如果所述閱讀器與所述網絡服務器連接的有效帶寬低于第二預置門限,則所述閱讀器 的語音識別引擎根據所述語音信號建立用戶語音模型后,將該用戶語音模型的參數發(fā)送給 所述網絡服務器;其中第一預置門限大于第二預置門限。
6.根據權利要求1至5中任一項所述的網上搜索書源的方法,其特征在于,在得到搜索 結果之后還包括以下步驟所述網絡服務器將所述搜索結果發(fā)送到所述閱讀器;所述閱讀器顯示所述搜索結果,根據用戶的輸入選擇搜索結果中的一本電子書,并從 所述網絡服務器下載該電子書。
7.—種網上搜索書源的方法,其特征在于,包括以下步驟 電子書閱讀器記錄用戶輸入的語音信號;所述閱讀器將所記錄的語音信號發(fā)送到網絡服務器;所述網絡服務器的語音識別引擎根據所收到的語音建立用戶語音模型,將該用戶語音 模型與預先設置的電子書書名的語音模型相匹配,得到搜索結果。
8.—種網上搜索書源的系統(tǒng),其特征在于,包括電子書閱讀器和網絡服務器; 所述閱讀器進一步包括語音輸入模塊,用于記錄用戶輸入的語音信號; 語音識別引擎模塊,用于進行語音識別處理; 通信模塊,用于和所述網絡服務器通信; 所述網絡服務器進一步包括 語音識別引擎模塊,用于進行語音識別處理; 通信模塊,用于和所述閱讀器通信;所述閱讀器的語音識別引擎與網絡服務器的語音識別引擎進行協(xié)作處理,根據所述語 音輸入模塊記錄的語音信號建立用戶語音模型;所述網絡服務器的語音識別引擎將所述用 戶語音模型與預先設置的電子書書名的語音模型相匹配,得到搜索結果。
9.根據權利要求8所述的網上搜索書源的系統(tǒng),其特征在于,所述閱讀器的語音識別 引擎還用于對用戶的操作命令語音進行語音識別,如果匹配到相應的操作命令,執(zhí)行該操 作命令。
10.一種網上搜索書源的系統(tǒng),其特征在于,包括電子書閱讀器和網絡服務器; 所述閱讀器進一步包括語音輸入模塊,用于記錄用戶輸入的語音信號;通信模塊,用于將所述語音輸入模塊所記錄的語音信號發(fā)送到所述網絡服務器;所述網絡服務器進一步包括通信模塊,用于接收來自所述閱讀器的用戶語音;語音識別引擎模塊,用于根據所述通信模塊收到的語音信號建立用戶語音模型,將該 用戶語音模型與預先設置的電子書書名的語音模型相匹配,得到搜索結果。
全文摘要
本發(fā)明涉及網絡書源的搜索,公開了一種網上搜索書源的方法及其系統(tǒng)。本發(fā)明中,在閱讀器和網絡服務器上各設置一個語音識別引擎,以協(xié)作的方式建立用戶語音模型,再在網絡服務器上與庫中電子書書名的語音模型進行匹配,可以實現以語音搜索網上書源的功能。也可以由閱讀器將記錄的用戶語音發(fā)給網絡服務器,由網絡服務器進行語音識別和搜索。
文檔編號G10L15/28GK101894108SQ20091005727
公開日2010年11月24日 申請日期2009年5月19日 優(yōu)先權日2009年5月19日
發(fā)明者馮威, 葉立飛, 張棟, 范黎明 申請人:上海易狄歐電子科技有限公司