專利名稱:語音設(shè)備、語音控制程序以及語音控制方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語音設(shè)備、一種語音控制程序、以及一種語音控制方法。更具體 地,本發(fā)明涉及一種具有話音合成功能的語音設(shè)備、以及一種在該語音設(shè)備中執(zhí)行的語音 控制程序和語音控制方法。
背景技術(shù):
近來出現(xiàn)了一種具備話音合成功能的導(dǎo)航設(shè)備。話音合成功能是將文本轉(zhuǎn)換成話 音或語音的功能,被稱作TTS(文本至語音)。同時,還存在兩種說出數(shù)值字符串的方法一 種方法是將數(shù)值說成各個單獨的數(shù)字,另一種方法是將數(shù)值說成整體數(shù)字(full number) 0 在使導(dǎo)航設(shè)備說出數(shù)值字符串的情況下,關(guān)鍵是使其用哪種方法說出該數(shù)值。例如,優(yōu)選地 將電話號碼說成各個單獨的數(shù)字,而優(yōu)選地將距離說成整體數(shù)字。日本專利申請待審公開 No. 09-006379公開了一種話音規(guī)則合成設(shè)備,該設(shè)備確定是否存在指示了包含數(shù)值的字符 串表示電話號碼的表達(dá),如果存在,則該設(shè)備執(zhí)行話音合成,使得逐一說出數(shù)值的各個單獨 數(shù)字。利用該傳統(tǒng)話音規(guī)則合成設(shè)備,導(dǎo)航設(shè)備僅將電話號碼說成單獨的數(shù)字,而將其 他數(shù)值字符串(例如,地址、道路編號等)全部都說成整體數(shù)字。得到的話音輸出對于駕駛 員而言很難理解。[專利文獻(xiàn)1]日本專利申請待審公開No.09-006379。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題為解決上述問題,實現(xiàn)了本發(fā)明,本發(fā)明的目的是提供一種能夠以用戶容易理解 的方式來說出數(shù)值的語音設(shè)備。本發(fā)明的另一目的是提供一種允許以用戶容易理解的方式說出數(shù)值的語音控制 程序。本發(fā)明的另一目的是提供一種允許以用于容易理解的方式說出數(shù)信的語音控制 方法。解決問題的手段為了實現(xiàn)上述目的,根據(jù)本發(fā)明的一個方面,一種語音設(shè)備,包括語音裝置,用 于在給定字符串包括由多個數(shù)字組成的數(shù)值的情況下,用第一語音方法或第二語音方法說 出數(shù)值,在第一語音方法中,逐一朗讀數(shù)值的各個單獨數(shù)字,在第二語音方法中,將數(shù)值作 為整體數(shù)字朗讀;關(guān)聯(lián)裝置,用于將字符串的類型與第一語音方法或第二語音方法相關(guān)聯(lián); 處理執(zhí)行裝置,用于執(zhí)行預(yù)定處理,以輸出數(shù)據(jù);以及語音控制裝置,用于基于所輸出的數(shù) 據(jù)產(chǎn)生字符串,并且使語音裝置用第一和第二語音方法中與輸出數(shù)據(jù)的類型相關(guān)聯(lián)的那個 語音方法說出所產(chǎn)生的字符串。根據(jù)該方面,字符串的類型與第一語音方法或第二語音方法相關(guān)聯(lián)。字符串是基
4于在執(zhí)行預(yù)定處理時輸出的數(shù)據(jù)而產(chǎn)生的,并且用與輸出數(shù)據(jù)的類型相關(guān)聯(lián)的語音方法來 說出所述字符串。這樣,使用針對數(shù)據(jù)的類型而預(yù)定的語音方法來說出字符串。因此可以 提供能夠以用戶容易理解的方式說出數(shù)值的語音設(shè)備。優(yōu)選地,語音設(shè)備還包括話音獲取裝置用于獲取話音;話音識別裝置,用于識 別所獲取的話音,以輸出字符串;以及語音方法區(qū)別裝置,用于在輸出字符串包括數(shù)值的情 況下,區(qū)別第一和第二語音方法中的一個;其中,處理執(zhí)行裝置執(zhí)行基于正被輸出的字符串 的處理,并且關(guān)聯(lián)裝置包括登記裝置,用于將正被輸出的字符串的類型與語音方法區(qū)別 裝置的區(qū)別結(jié)果相關(guān)聯(lián),其中所述字符串的類型是基于處理執(zhí)行裝置所執(zhí)行的處理而確定 的。根據(jù)該方面,在通過識別所獲取的語音而輸出的字符串包括數(shù)值的情況下,區(qū)別 第一或第二語音方法,并且將根據(jù)所述基于正被輸出的字符串的處理而確定的字符串的類 型與所區(qū)別的語音方法相關(guān)聯(lián)。這允許用與輸入話音的語音方法相同的語音方法來說出與 輸入話音中所包括的類型相同的類型的字符串。根據(jù)本發(fā)明的另一方面,一種語音設(shè)備,包括語音裝置,用于在給定字符串包括 由多個數(shù)字組成的數(shù)值的情況下,用第一語音方法或第二語音方法來說出數(shù)值,在第一語 音方法中,逐一朗讀數(shù)值的各個單獨數(shù)字,在第二語音方法中,將數(shù)值作為整體數(shù)字朗讀; 確定裝置,用于基于字符串中包括的數(shù)值中數(shù)字的個數(shù)來確定第一和第二語音方法中的一 個;以及語音控制裝置,用于使語音裝置用所確定的第一和第二語音方法中的一個來說出 數(shù)值。根據(jù)該方面,在字符串包括由多個數(shù)字組成的數(shù)值的情況下,基于字符串中包括 的數(shù)值中數(shù)字的個數(shù),來確定第一和第二語音方法中的一個,并且使用確定的語音方法來 說出字符串。語音方法是根據(jù)數(shù)值中數(shù)字的個數(shù)來確定的。因此,可以提供能夠以用戶容 易理解的方式來說出數(shù)值的語音設(shè)備。根據(jù)本發(fā)明的另一方面,一種語音控制程序,使計算機(jī)執(zhí)行以下步驟將第一語音 方法或第二語音方法與字符串的類型相關(guān)聯(lián),在第一語音方法中,將由多個數(shù)字組成的數(shù) 值作為各個單獨數(shù)字朗讀,在第二語音方法中,將由多個數(shù)字組成的數(shù)值作為整體數(shù)字朗 讀;通過執(zhí)行預(yù)定處理輸出數(shù)據(jù);基于輸出的數(shù)據(jù)產(chǎn)生字符串;以及用第一和第二語音方 法中與輸出的數(shù)據(jù)的類型相關(guān)聯(lián)的一個語音方法來說出所產(chǎn)生的字符串。根據(jù)該方面,可以提供允許以用戶容易理解的方式說出數(shù)值的語音控制程序。根據(jù)本發(fā)明的又一方面,一種語音控制程序,使計算機(jī)執(zhí)行以下步驟用第一語音 方法說出由多個數(shù)字組成的數(shù)值,在第一語音方法中,逐一朗讀數(shù)值的各個單獨數(shù)字;用第 二語音方法說出由多個數(shù)字組成的數(shù)值,在第二語音方法中,將數(shù)值作為整體數(shù)字朗讀;基 于字符串中包括的數(shù)值中數(shù)字的個數(shù),來確定第一和第二語音方法中的一個;在給定字符 串包括由多個數(shù)字組成的數(shù)值的情況下,使得用所確定的第一和第二語音方法中的一個來 說出字符串。根據(jù)本發(fā)明的另一方面,一種語音控制方法,包括以下步驟將第一語音方法或第 二語音方法與字符串的類型相關(guān)聯(lián),在第一語音方法中,將由多個數(shù)字組成的數(shù)值作為各 個單獨數(shù)字朗讀,在第二語音方法中,將由多個數(shù)字組成的數(shù)值作為整體數(shù)字朗讀;通過執(zhí) 行預(yù)定處理來輸出數(shù)據(jù);基于輸出的數(shù)據(jù)產(chǎn)生字符串;以及用第一和第二語音方法中與輸出數(shù)據(jù)的類型相關(guān)聯(lián)的一個語音方法來說出所產(chǎn)生的字符串。根據(jù)該方面,可以提供允許以用戶容易理解的方式說出數(shù)值的語音控制方法。根據(jù)本發(fā)明的又一方面,一種語音控制方法,包括以下步驟用第一語音方法說出 由多個數(shù)字組成的數(shù)值,在第一語音方法中,逐一朗讀數(shù)值的各個單獨數(shù)字;用第二語音方 法說出由多個數(shù)字組成的數(shù)值,在第二語音方法中,將數(shù)值作為整體數(shù)字朗讀;基于字符串 中包括的數(shù)值中數(shù)字的個數(shù),來確定第一和第二語音方法中的一個;以及在給定字符串包 括由多個數(shù)字組成的數(shù)值的情況下,使得用確定的第一和第二語音方法中的一個,來說出 字符串。
圖1是示出了根據(jù)本發(fā)明實施例的示例導(dǎo)航設(shè)備的硬件配置的框圖。圖2是示出了包括在示例導(dǎo)航設(shè)備中的CPU的功能的功能框圖。圖3A示出了用戶定義表的示例。圖3B示出了關(guān)聯(lián)表的示例。圖3C示出了地域表的示例。圖3D示出了數(shù)字個數(shù)表的示例。圖4是示出了示例語音控制處理流程的流程圖。圖5是示出了示例關(guān)聯(lián)表更新處理流程的流程圖。附圖標(biāo)記的說明1 導(dǎo)航設(shè)備;11 =CPU ;13 :GPS接收機(jī);15 陀螺儀;17 車速傳感器;19 存儲器I/ F ; 19A 存儲卡;21 串行通信I/F ;23 顯示控制部;25 =LCD ;27 觸摸屏;29 麥克風(fēng);31 揚聲器;33 =ROM ;35 =RAM ;37 =EEPROM ;39 操作鍵;51 語音控制部;53 處理執(zhí)行部;55 話音合成部;57 話音輸出部;59 位置獲取部;61 字符串產(chǎn)生部;63 語音方法確定部; 71 話音獲取部;73 話音識別部;75 語音方法區(qū)別部;77 登記部;81 用戶定義表;83 關(guān)聯(lián)表;85 地域表;以及87 數(shù)字個數(shù)表。
具體實施例方式現(xiàn)在參照附圖描述本發(fā)明的實施例。在以下描述中,類似的參考符號表示具有類 似名稱和功能的類似的元件,并因此不重復(fù)這些類似元件的詳細(xì)描述。圖1是作為示例示出了根據(jù)本發(fā)明實施例的導(dǎo)航設(shè)備的硬件配置的框圖。參照圖 1,導(dǎo)航設(shè)備1包括中央處理單元(CPU) 11,負(fù)責(zé)導(dǎo)航設(shè)備1的總體控制;GPS接收機(jī)13 ; 陀螺儀15 ;車速傳感器17 ;存儲器接口(I/F) 19 ;串行通信I/F 21 ;顯示控制部23 ;液晶顯 示器(IXD)25 ;觸摸屏27 ;麥克風(fēng)29 ;揚聲器31 ;只讀存儲器(ROM) 33,用于存儲要由CPU 11執(zhí)行的程序等;隨機(jī)存取存儲器(RAM) 35,用作針對CPU 11的工作區(qū);電可擦除可編程 ROM(EEPROM) 37,以非易失性方式存儲數(shù)據(jù);以及操作鍵39。GPS接收機(jī)13接收來自全球定位系統(tǒng)(GPS)的GPS衛(wèi)星的無線電波,以測量地圖 上的當(dāng)前位置。GPS接收機(jī)13向CPU 11輸出所測量的位置。陀螺儀15檢測安裝了導(dǎo)航設(shè)備1的車輛的方位,并向CPU 11輸出檢測到的方位。 車速傳感器17檢測安裝了導(dǎo)航設(shè)備的車輛的速度,并且向CPU 11輸出檢測到的速度。應(yīng)
6注意,車速傳感器17可以被安裝在車輛上,在這種情況下,CPU 11接收來自安裝在車輛上 的車速傳感器17的車速。顯示控制部23控制IXD 25,以使IXD 25顯示圖像。IXD 25是薄膜晶體管(TFT) 類型的,并且受顯示控制部23的控制,來顯示從顯示控制部23輸出的圖像。應(yīng)注意,可以 用有機(jī)電致發(fā)光(EL)顯示器來代替IXD 25。觸摸屏27由透明組件組成,并被設(shè)置在IXD 25的顯示表示上。觸摸屏27檢測IXD 25的顯示表面上由用戶用手指或其他類似物所指定的位置,并且向CPU 11輸出檢測到的 位置。CPU 11在IXD 25上顯示各種按鈕,并且根據(jù)與觸摸屏所檢測到的指定位置的結(jié)合, 來接受各種操作。由CPU 11在IXD 25上顯示的操作屏幕包括用于操作導(dǎo)航設(shè)備1的操作 屏幕。操作鍵39是按鈕開關(guān),其包括用于開啟/關(guān)閉主電源的電源鍵。存儲器I/F 19是與可拆卸的存儲卡19A —起安裝的。CPU 11讀取在存儲卡19A 中存儲的地圖數(shù)據(jù),并且在IXD 25上顯示地像,在該地像上標(biāo)記了從GPS接收機(jī) 13輸入的當(dāng)前位置以及由陀螺儀15檢測到的方位。此外,基于分別從車速傳感器17和陀 螺儀15輸入的車速和方位,CPU 11在LCD 25上顯示其上的標(biāo)記的位置隨著車輛的移動而 移動的地像。盡管這里認(rèn)為要由CPU 11執(zhí)行的程序存儲在ROM 33中,但是程序也可以存儲在 存儲卡19A中,并且可以從存儲卡19A中被讀出以由CPU 11來執(zhí)行。用于存儲程序的記錄 介質(zhì)不限于存儲卡19A。記錄介質(zhì)可以是軟盤、盒式磁帶、光盤(壓縮盤-ROM(CD-ROM)、磁 光盤(M0)、迷你盤(MD)、數(shù)字萬能盤(DVD))、IC卡(包括存儲卡)、光卡、或半導(dǎo)體存儲器 (例如,掩模 ROM、EPROM、EEPROM 等)。備選地,可以從連接至串行通信I/F 21的計算機(jī)中讀取要由CPUll執(zhí)行的程序。 如這里所使用的,“程序”不僅包括由CPU 11直接可執(zhí)行的程序,而且還包括源程序、壓縮程 序、加密程序、以及其他。圖2是作為示例示出了包括在導(dǎo)航設(shè)備中的CPU 11的功能的功能框圖。參照圖 2, CPU 11包括執(zhí)行處理的處理執(zhí)行部53 ;合成話音的話音合成部55 ;控制話音合成部55 的語音控制部51 ;輸出合成后的話音的話音輸出部57 ;獲取當(dāng)前位置的位置獲取部59 ;獲 取話音的話音獲取部71 ;識別所獲取的話音以輸出文本的話音識別部73 ;基于輸出文本對 語音方法進(jìn)行區(qū)別的語音方法區(qū)別部75 ;以及登記區(qū)別后的語音方法的登記部77。處理執(zhí)行部53執(zhí)行導(dǎo)航處理。具體地,處理執(zhí)行部53執(zhí)行支持路線導(dǎo)向以便駕 駛員駕駛車輛的處理、朗讀在EEPROM 37中存儲的地圖信息的處理等等。支持路線導(dǎo)向的 處理包括例如搜索從當(dāng)前位置到目的地的路線并將搜索到的路線顯示在地圖上的處理、以 及顯示行駛方向直到車輛到達(dá)目的地的處理。處理執(zhí)行部53輸出所執(zhí)行的處理的結(jié)果。該結(jié)果由數(shù)據(jù)本身和數(shù)據(jù)的類型的集 合組成。類型包括地址、電話號碼、道路信息以及距離。例如,在輸出EEPROM 37中存儲的 設(shè)施信息的情況下,處理執(zhí)行部53輸出設(shè)施的地址的和類型“地址”的集合,并且還輸出設(shè) 施的電話號碼和類型“電話號碼”的集合。在輸出當(dāng)前位置的情況下,處理執(zhí)行部53輸出 類型“地址”和當(dāng)前位置的地址的集合。在輸出搜索到的路線的情況下,處理執(zhí)行部53輸 出類型“道路信息”和指示路線中包括的道路的道路名稱的集合。位置獲取部59基于GPS接收機(jī)13從衛(wèi)星接收的信號,來獲取當(dāng)前位置。位置獲取部59向語音控制部51輸出所獲取的當(dāng)前位置。當(dāng)前位置包括例如緯度和經(jīng)度。盡管位 置獲取部59可以根據(jù)GPS接收機(jī)13從衛(wèi)星接收到的信號來計算緯度和經(jīng)度,但是也可以 提供連接至諸如互聯(lián)網(wǎng)之類的網(wǎng)絡(luò)的無線電通信電路,在這種情況下,可以將從GPS接收 機(jī)13輸出的信號傳輸至連接至互聯(lián)網(wǎng)的服務(wù)器,并且可以接收到從服務(wù)器返回的緯度和經(jīng)度。語音控制部51包括字符串產(chǎn)生部61和語音方法確定部63。字符串產(chǎn)生部61 基于從處理執(zhí)行部53輸入的數(shù)據(jù),來產(chǎn)生字符串,并且向話音合成部55輸出所產(chǎn)生的字 符串。例如,在從處理執(zhí)行部53輸入指示了當(dāng)前位置的地址和類型“地址”的集合的情 況下,產(chǎn)生字符串“當(dāng)前位置在00(城鎮(zhèn)名稱)的XX(門牌號)附近”。在從處理執(zhí)行部 35輸入設(shè)施的電話號碼以及類型“電話號碼”的集合的情況下,產(chǎn)生字符串“電話號碼是
xx-xxxx-xxxx”。語音方法確定部63基于從處理執(zhí)行部53輸入的類型,來確定語音方法,并且向話 音合成部55輸出所確定的語音方法。具體地,語音方法確定部63參照存儲在EEPROM 37中 的參考表,來確定參考表中對應(yīng)于從處理執(zhí)行部53輸入的類型而定義的語音方法。參考表 包括用戶定義表81、關(guān)聯(lián)表83、地域表85、以及數(shù)字個數(shù)表87?,F(xiàn)在描述用戶定義表81、 關(guān)聯(lián)表83、地域表85、以及數(shù)字個數(shù)表87。圖3A到3D示出了參考表的示例。圖3A示出了用戶定義表的示例,圖3B示出了關(guān) 聯(lián)表的示例,圖3C示出了地域表的示例,以及圖3D示出了數(shù)字個數(shù)表的示例。參照圖3A, 用戶定義表81包括由導(dǎo)航設(shè)備1的用戶已經(jīng)預(yù)先設(shè)定的用戶定義記錄。用戶定義記錄包 括“類型”和“語音方法”字段。例如,針對類型“郵政編碼”定義了語音方法“ 1 ”,針對類型 “地址”定義了語音方法“2”。語音方法“1”是指將數(shù)值作為各個單獨的數(shù)字來朗讀的語音 方法。語音方法“2”是指將數(shù)值作為整體數(shù)字來朗讀的語音方法。在圖3A所示的用戶定 義表中,針對類型“郵政編碼”,設(shè)定了將數(shù)值作為各個單獨數(shù)字來朗讀的語音方法,并且針 對類型“地址”設(shè)定了將數(shù)值作為整體數(shù)字來朗讀的語音方法。參照圖3B,關(guān)聯(lián)表包括將類型與語音方法相關(guān)聯(lián)的關(guān)聯(lián)記錄。關(guān)聯(lián)記錄包括“類 型”和“語音方法”字段。如稍后所描述的,當(dāng)用戶將話音數(shù)據(jù)輸入到導(dǎo)航設(shè)備1中時,產(chǎn)生 關(guān)聯(lián)記錄,并且將該關(guān)聯(lián)記錄添加至關(guān)聯(lián)表。例如,將語音方法“1”與類型“電話號碼”相關(guān) 聯(lián),并且將語音方法“2”與類型“距離”相關(guān)聯(lián)。此外,在關(guān)聯(lián)記錄中,將“局域受限(locally restricted) ”與字符串的類型相關(guān)聯(lián),對于該字符串類型,其語音方法是局域受限的。更具 體地,將“局域受限”的語音方法與類型“道路信息”相關(guān)聯(lián)。這允許將語音方法的地域差 異反映到針對類型“道路信息”的語音方法。參照圖3C,地域表85包括地域記錄,在地域記錄中,針對局域受限的類型,將地域 和語音方法彼此相關(guān)聯(lián)。這里圖3B所示的關(guān)聯(lián)表83定義了類型“道路信息”是局域受限 的。因此,在地域表85中,定義了在特定地域中要用于說出道路信息的語音方法。地域記 錄包括“地域”和“語音方法”字段。例如,語音方法“ 1 ”與地域“A”相關(guān)聯(lián),語音方法“2” 與地域“B”相關(guān)聯(lián),無方法與“其他”地域相關(guān)聯(lián)。參照圖3D,數(shù)字個數(shù)表87包括數(shù)字個數(shù)記錄,將數(shù)字個數(shù)與語音方法相關(guān)聯(lián)。數(shù) 字個數(shù)記錄包括“數(shù)字的個數(shù)”和“語音方法”字段。例如,語音方法“1”與“三個或三個以 上”的數(shù)字個數(shù)相關(guān)聯(lián),語音方法“2”與“小于三個”的數(shù)字個數(shù)相關(guān)聯(lián)。因此,具有三個或三個以上數(shù)字的數(shù)值與將數(shù)值作為各個單獨數(shù)字朗讀的語音方法相關(guān)聯(lián),而具有小于三個 數(shù)字的數(shù)值與將數(shù)值作為整體數(shù)字朗讀的語音方法相關(guān)聯(lián)。返回圖2,語音方法確定部63確定在用戶定義表中是否已經(jīng)定義了與從處理執(zhí)行 部53輸入的類型相對應(yīng)的語音方法。如果在用戶定義表中已經(jīng)定義了該語音方法,則語音 方法確定部63確定語音方法為所定義的語音方法。在用戶定義表81中沒有定義與從處理 執(zhí)行部53輸入的類型相對應(yīng)的語音方法的情況下,語音方法確定部63確定在關(guān)聯(lián)表83中 是否已經(jīng)定義了該語音方法。如果在關(guān)聯(lián)表83中已經(jīng)定義了從處理執(zhí)行部53輸入的類型, 則語音方法確定部63確定該語音方法為所定義的語音方法。在從處理執(zhí)行部53輸入的類 型是“道路信息”的情況下,語音方法確定部63參照地域表85。在這種情況下,語音方法確 定部63基于從位置獲取部59輸入的當(dāng)前位置,確定包括當(dāng)前位置的地域。然后,語音方法確定部63確定語音方法為與地域表中確定的地域相關(guān)聯(lián)的那個 語音方法。在地域表85不包括任何包括所確定的地域的地域記錄的情況下,語音方法確定 部63不確定語音方法。在參照地域表85未確定語音方法的情況下,語音方法確定部63參 照數(shù)字個數(shù)表87。語音方法確定部63確定語音方法為數(shù)字個數(shù)表中與字符串所表達(dá)的數(shù) 值中數(shù)字的個數(shù)相關(guān)聯(lián)的那個語音方法。當(dāng)數(shù)值具有三個或更多個數(shù)字時,語音方法確定 部63確定語音方法為逐一朗讀各個單獨數(shù)字的語音方法,而當(dāng)數(shù)值具有小于三個數(shù)字時, 語音方法確定部63確定語音方法為將數(shù)值作為整體數(shù)字朗讀的語音方法。語音方法確定 部63向話音合成部55輸出所確定的語音方法。話音合成部15根據(jù)從字符串產(chǎn)生部61輸入的字符串,來合成話音,并向話音輸出 部57輸出話音數(shù)據(jù)。在從字符串產(chǎn)生部61輸入的字符串包括數(shù)值的情況下,話音合成部 55根據(jù)從語音方法確定部63輸入的語音方法,來合成話音。話音輸出部57向揚聲器31輸出從話音合成部55輸入的話音數(shù)據(jù)。結(jié)果,從揚聲 器31輸出由話音合成部55合成的話音數(shù)據(jù)。話音獲取部71與麥克風(fēng)29相連接,并獲取麥克風(fēng)29所收集和輸出的話音數(shù)據(jù)。 話音獲取部71向話音識別部73輸出所獲取的話音數(shù)據(jù)。話音識別部73分析輸入的話音 數(shù)據(jù),并將話音數(shù)據(jù)轉(zhuǎn)換成字符串。話音識別部73向處理執(zhí)行部53和語音方法區(qū)別部75 輸出從話音數(shù)據(jù)獲取的字符串。在處理執(zhí)行部53中,輸入的字符串用于執(zhí)行處理。例如,在字符串指示了命令的情況下,處理執(zhí)行部53根據(jù)該命令執(zhí)行處理。在處 理執(zhí)行部53執(zhí)行登記數(shù)據(jù)的處理的情況下,處理執(zhí)行部53將輸入字符串添加至在登記目 的地處的數(shù)據(jù),以進(jìn)行存儲。此時,用戶可以通過經(jīng)由麥克風(fēng)29輸入作為話音的命令或者 通過使用操作鍵39,來指定登記目的地。處理執(zhí)行部53向登記部77輸出根據(jù)正被執(zhí)行的 處理而確定的類型。例如,在處理執(zhí)行部53執(zhí)行設(shè)置目的地的處理的情況下,作為目的地 而輸入的字符串應(yīng)當(dāng)是地址。因此,處理執(zhí)行部53輸出“地址”作為類型。在目的地由道 路信息表達(dá)的情況下,處理執(zhí)行部53輸出“道路信息”作為類型。在處理執(zhí)行部53執(zhí)行登 記設(shè)施信息的處理的情況下,可以輸入設(shè)施名稱、地址、以及電話號碼。當(dāng)輸入地址時,處理 執(zhí)行部53輸出類型“地址”,并且當(dāng)輸入電話號碼時,輸出類型“電話號碼”。登記部77產(chǎn)生關(guān)聯(lián)記錄,在關(guān)聯(lián)記錄中從處理執(zhí)行部53輸入的類型與從語音方 法區(qū)別部75輸入的語音方法相關(guān)聯(lián),并且登記部77將所產(chǎn)生的記錄添加至關(guān)聯(lián)表以進(jìn)行 存儲。這樣,當(dāng)導(dǎo)航設(shè)備1的用戶執(zhí)行執(zhí)行向?qū)Ш皆O(shè)備1輸入話音命令或數(shù)據(jù)的操作時,產(chǎn)生新的關(guān)聯(lián)記錄并被存儲在關(guān)聯(lián)表83中。即使用戶沒有新產(chǎn)生用戶定義表81,也將關(guān)聯(lián)記 錄存儲在關(guān)聯(lián)表83中。例如,這消除了要求用戶對操作鍵39進(jìn)行操作以便產(chǎn)生用戶定義 表81的需要。圖4是作為示例示出了語音控制處理的流程的流程圖。當(dāng)CPU 11執(zhí)行語音控制程 序時,語音控制處理由CPU 11執(zhí)行。參照圖4,CPU 11確定是否已經(jīng)出現(xiàn)了要作為話音輸 出的數(shù)據(jù)(步驟S01)。在出現(xiàn)這樣的數(shù)據(jù)之前,CPU 11處于待機(jī)模式(步驟SOl中的否), 并且一旦出現(xiàn)了數(shù)據(jù),處理前進(jìn)至步驟S02。在步驟S02中,CPU 11基于出現(xiàn)的數(shù)據(jù)產(chǎn)生要 作為話音輸出的字符串。然后,CPU 11確定所產(chǎn)生的字符串是否包括數(shù)值(步驟S03)。如 果字符串包括數(shù)值,則處理前進(jìn)至步驟S04 ;否則,處理前進(jìn)至步驟S17。在步驟S04中,獲取數(shù)據(jù)的類型。與在步驟SOl中出現(xiàn)的數(shù)據(jù)一起,基于產(chǎn)生數(shù)據(jù) 的處理,獲取該數(shù)據(jù)的類型。具體地,當(dāng)處理用于輸出地址時,獲取類型“地址”,并且當(dāng)處理 用于輸出電話號碼時,獲取類型“電話號碼”。當(dāng)處理用于輸出道路信息時,獲取類型“道路 信息”,并且當(dāng)處理用于輸出距離時,獲取類型“距離”。在接下來的步驟S05中,參照在EEPROM 37中存儲的用戶定義表81。確定用戶定 義表81中的用戶定義記錄是否包括在“類型”字段中設(shè)定有在步驟S04中獲取的類型的用 戶定義記錄(步驟S06)。如果存在這樣的用戶定義記錄,處理前進(jìn)至步驟S07;否則,處理 前進(jìn)至步驟S08。在步驟S07中,根據(jù)包括在步驟S04中獲取的類型在內(nèi)的用戶定義記錄, 獲取與該類型相關(guān)聯(lián)的語音方法,并且將所獲取的語音方法設(shè)定為用于說出字符串的語音 方法。處理然后前進(jìn)至步驟S 17。在步驟S 17中,用所設(shè)定的語音方法說出字符串。用用 戶所定義的語音方法來說出與用戶定義的類型相對應(yīng)的數(shù)值,從而可以以用戶容易理解的 方式來說出數(shù)值。另一方面,在步驟S08中,參照存儲在EEPROM 37中的關(guān)聯(lián)表83。具體地,從包括 在關(guān)聯(lián)表83中的關(guān)聯(lián)記錄中提取在“類型”字段中設(shè)定有在步驟S04中獲取的類型的關(guān)聯(lián) 記錄。然后確定語音方法是否是局域受限的(步驟S09)。確定在所提取的關(guān)聯(lián)記錄中“語 音方法”字段中是否已經(jīng)設(shè)置了 “局域受限”。如果已經(jīng)設(shè)置了 “局域受限”,則處理前進(jìn)至 步驟Sll ;否則處理前進(jìn)至S10。在步驟SlO中,將在步驟S08中所提取的關(guān)聯(lián)記錄中的“語音方法”字段中設(shè)置的 語音方法設(shè)置為用于說出字符串的語音方法,并且處理前進(jìn)至步驟S17。在步驟S17中,用 設(shè)置的語音方法來說出字符串。如后續(xù)所述,當(dāng)用戶將語音輸入到導(dǎo)航設(shè)備1中時,基于用 戶所使用的語音方法來產(chǎn)生在關(guān)聯(lián)表83中包括的關(guān)聯(lián)記錄。相應(yīng)地,可以用與在說出字符 串時用戶所使用的語音方法相同的語音方法來說出字符串。這確保了以用戶容易理解的方 式來說出字符串。在步驟Sll中,獲取當(dāng)前位置,并獲取當(dāng)前位置所屬的地域。然后,參照存儲在 EEPROM 37中的地域表85 (步驟S12)。確定語音方法是否已經(jīng)與步驟Sll中所獲取的地域 相關(guān)聯(lián)(步驟S13)。具體地,確定地域表85中的地域記錄是否包括包含在步驟Sll中所獲 取的地域的地域記錄。如果存在這樣的地域記錄,則確定語音方法已被關(guān)聯(lián),并且處理前進(jìn) 至步驟S14 ;否則,處理前進(jìn)至步驟S15。在步驟S14中,將與地域相關(guān)聯(lián)的語音方法設(shè)定為 用于說出字符串的語音方法,并且處理前進(jìn)至步驟S17。在步驟S17中,用設(shè)定的語音方法 來說出字符串。包括在地域表85中的地域記錄定義了對于該地域特定的語音方法,使得以
10根據(jù)當(dāng)前位置所屬的地域的方式來說出數(shù)值。這允許用戶知道對于該地域特定的唯一讀取 方式。在步驟S15中,參照存儲在EEPROM 37中的數(shù)字個數(shù)表87。從包括在數(shù)字個數(shù)表 87中的數(shù)字個數(shù)記錄中,提取已經(jīng)在“數(shù)字的個數(shù)”字段中設(shè)定了包括在步驟S02中產(chǎn)生的 字符串中的數(shù)值的數(shù)字個數(shù)的數(shù)字個數(shù)記錄,并且獲取在所提取的數(shù)字個數(shù)記錄中“語音 方法”字段中設(shè)置的語音方法。將與數(shù)字的個數(shù)相關(guān)聯(lián)的語音方法設(shè)置為用于說出字符串 的語音方法(步驟S16),并且處理前進(jìn)至步驟S17。在步驟S17中,用設(shè)置的語音方法說出 字符串。在包括在數(shù)字個數(shù)表87中的數(shù)字個數(shù)記錄中,具有三個或更多個數(shù)字的數(shù)值與將 該數(shù)值作為各個單獨數(shù)字朗讀的語音方法相關(guān)聯(lián),而具有小于三個數(shù)字的數(shù)值與將該數(shù)值 作為整體數(shù)字朗讀的語音方法相關(guān)聯(lián)。相應(yīng)地,將具有三個或多個數(shù)字的數(shù)值作為各個單 獨數(shù)字朗讀,而將具有小于三個數(shù)字的數(shù)值作為整體數(shù)字朗讀。相應(yīng)地,將具有三個或多個 數(shù)字的數(shù)值作為各個單獨的數(shù)字來朗讀,而將具有小于三個數(shù)字的數(shù)值作為整體數(shù)字來朗 讀。這確保了以用戶容易理解的方式來說出數(shù)值。當(dāng)在步驟S17中完成了語音時,處理前進(jìn)至步驟S18。在步驟S18中,確定是否已 經(jīng)接受了結(jié)束指令。如果已經(jīng)接受了結(jié)束指令,則終止語音控制處理;否則,處理返回至步 驟 SOl。圖5是作為示例示出了關(guān)聯(lián)表更新處理的流程的流程圖。當(dāng)CPUll執(zhí)行語音控制 程序時,關(guān)聯(lián)表更新處理由CPU 11來執(zhí)行。參照圖5,CPU 11確定是否已經(jīng)輸入了話音數(shù) 據(jù)。在輸入話音數(shù)據(jù)之前,CPU 11處于待機(jī)狀態(tài)(S21中的否),并且一旦輸入了話音數(shù)據(jù), 處理就前進(jìn)至步驟S22。在步驟S22,對輸入的話音數(shù)據(jù)進(jìn)行話音識別,以便將輸入的話音數(shù)據(jù)轉(zhuǎn)換成作為 文本數(shù)據(jù)的字符串。在隨后的步驟S23中,區(qū)別語音方法。例如,不管話音數(shù)據(jù)輸入是“一 零零”還是“一百”,都將其轉(zhuǎn)換成字符串“100”。然而,根據(jù)話音數(shù)據(jù)“一零零”,區(qū)別出將數(shù) 值作為各個單獨數(shù)字說出的語音方法,而根據(jù)話音數(shù)據(jù)“一百”,區(qū)別處將數(shù)值作為整體數(shù) 字說出的語音方法。在步驟S24中,基于根據(jù)在步驟S22中語音識別的字符串而執(zhí)行的處理,獲取與該 字符串相對應(yīng)的類型。例如,在要執(zhí)行將字符串作為“地址”存儲的處理的情況下,獲取類 型“地址”。當(dāng)要執(zhí)行將字符串作為電話號碼存儲的處理時,獲取類型“電話號碼”。當(dāng)要執(zhí) 行將字符串作為道路信息存儲的處理時,獲取類型“道路信息”。當(dāng)要執(zhí)行將字符串作為兩 個點之間的距離存儲的處理時,獲取類型“距離”。在步驟S25中,產(chǎn)生其中在步驟S24中獲取的類型與步驟S23中區(qū)別的語音方法 相關(guān)聯(lián)的關(guān)聯(lián)記錄。附加地,將所產(chǎn)生的關(guān)聯(lián)紀(jì)錄存儲在EEPROM 37中存儲的關(guān)聯(lián)表83中 (步驟S26)。在用戶輸入用于數(shù)據(jù)登記的話音時,與話音輸入的字符串的類型相關(guān)聯(lián)地,將用 戶用于說出字符串的語音方法進(jìn)行存儲。這允許與用戶已經(jīng)使用的語音方法相同的語音方 法來說出與用戶所說的字符串相同類型的字符串。因此,可以以用戶容易理解的方式來說 出字符串。如上所述,根據(jù)本發(fā)明的導(dǎo)航設(shè)備1預(yù)先將用戶定義表81、關(guān)聯(lián)表83、以及地域表 85存儲在EEPROM 37中?;趶奶幚韴?zhí)行部53在執(zhí)行處理時輸出的數(shù)據(jù)和該數(shù)據(jù)的類型的集合,產(chǎn)生要作為話音輸出的字符串。并且用與用戶定義表81、關(guān)聯(lián)表83、或地域表85 中的數(shù)據(jù)的類型相關(guān)聯(lián)的語音方法,來說出所產(chǎn)生的字符串。因此,用針對數(shù)據(jù)類型而預(yù)定 的語音方法來說出字符串,從而可以以用戶容易理解的方式來說出數(shù)值。在用戶輸入數(shù)據(jù)作為用于數(shù)據(jù)登記或其他目的的話音的情況下,識別話音,并且 區(qū)別出該話音的語音方法。然后產(chǎn)生關(guān)聯(lián)記錄,在該關(guān)聯(lián)記錄中,將根據(jù)要基于所識別的字 符串執(zhí)行的處理而確定的類型與所區(qū)別的語音方法相關(guān)聯(lián),并且附加地將所產(chǎn)生的關(guān)聯(lián)記 錄存儲在關(guān)聯(lián)表83中。因此,可以用與用戶所使用的語音方法相同的語音方法,來說出與 用戶說出的字符串類型相同的字符串。盡管在上述實施例中描述了導(dǎo)航設(shè)備1作為語音設(shè)備的示例,但是語音設(shè)備可以 是具有話音合成功能的任何設(shè)備,可以是移動電話、諸如個人數(shù)字助理(PDA)等移動通信 終端、或個人計算機(jī)。此外,本發(fā)明當(dāng)然可以被理解為用于使導(dǎo)航設(shè)備1執(zhí)行圖4或5所示的處理的語 音控制方法,或者用于使計算機(jī)執(zhí)行語音控制方法的語音控制節(jié)目。應(yīng)理解,這里公開的實施例是示意性的,并且在每個方面是非限制性的。本發(fā)明的 范圍由權(quán)利要求項目來限定,而不是由上述說明書來限定,并且意在包括范圍內(nèi)的以及與 權(quán)利要求項目意義等同的任何修改。附錄(1)根據(jù)權(quán)利要求1所述的語音設(shè)備,其中,所述處理執(zhí)行裝置執(zhí)行導(dǎo)航處理。
權(quán)利要求
一種語音設(shè)備,包括語音裝置,用于在給定字符串包括由多個數(shù)字組成的數(shù)值的情況下,用第一語音方法或第二語音方法說出所述數(shù)值,在所述第一語音方法中,逐一朗讀所述數(shù)值的各個單獨數(shù)字,在所述第二語音方法中,將所述數(shù)值作為整體數(shù)字朗讀;關(guān)聯(lián)裝置,用于將字符串的類型與所述第一語音方法或所述第二語音方法相關(guān)聯(lián);處理執(zhí)行裝置,用于執(zhí)行預(yù)定處理,以輸出數(shù)據(jù);以及語音控制裝置,用于基于所輸出的數(shù)據(jù)產(chǎn)生字符串,并且使所述語音裝置用第一和第二語音方法中與所輸出的數(shù)據(jù)的類型相關(guān)聯(lián)的一個語音方法說出所產(chǎn)生的字符串。
2.根據(jù)權(quán)利要求1所述的語音設(shè)備,還包括 話音獲取裝置,用于獲取話音;話音識別裝置,用于識別獲取的話音,以輸出字符串;以及語音方法區(qū)別裝置,用于在輸出的字符串包括數(shù)值的情況下,區(qū)別第一和第二語音方 法中的一個;其中,所述處理執(zhí)行裝置執(zhí)行基于正被輸出的所述字符串的處理,以及 所述關(guān)聯(lián)裝置包括登記裝置,用于將基于所述處理執(zhí)行裝置所執(zhí)行的處理而確定的 所述字符串的類型與所述語音方法區(qū)別裝置的區(qū)別結(jié)果相關(guān)聯(lián)。
3.根據(jù)權(quán)利要求1所述的語音設(shè)備,其中,所述處理執(zhí)行裝置執(zhí)行導(dǎo)航處理。
4.一種語音設(shè)備,包括語音裝置,用于在給定字符串包括由多個數(shù)字組成的數(shù)值的情況下,用第一語音方法 或第二語音方法來說出數(shù)值,在所述第一語音方法中,逐一朗讀所述數(shù)值的各個單獨數(shù)字, 在所述第二語音方法中,將所述數(shù)值作為整體數(shù)字朗讀;確定裝置,用于基于字符串中包括的數(shù)值中數(shù)字的個數(shù),來確定第一和第二語音方法 中的一個;以及語音控制裝置,用于使所述語音裝置用所確定的第一和第二語音方法中的一個來說出 所述數(shù)值。
5.一種存儲有語音控制程序的計算機(jī)可讀記錄介質(zhì),所述程序使計算機(jī)執(zhí)行以下步驟將第一語音方法或第二語音方法與字符串的類型相關(guān)聯(lián),在所述第一語音方法中,將 由多個數(shù)字組成的數(shù)值作為各個單獨數(shù)字朗讀,在第二語音方法中,將由多個數(shù)字組成的 數(shù)值作為整體數(shù)字朗讀;通過執(zhí)行預(yù)定處理,輸出數(shù)據(jù); 基于輸出的數(shù)據(jù)產(chǎn)生字符串;以及用第一和第二語音方法中與輸出的數(shù)據(jù)的類型相關(guān)聯(lián)的一個語音方法來說出產(chǎn)生的 字符串。
6.根據(jù)權(quán)利要求5所述的存儲有語音控制程序的計算機(jī)可讀記錄介質(zhì),其中,所述程 序使計算機(jī)還執(zhí)行以下步驟獲取話音;識別獲取的話音,以輸出字符串;以及在輸出的字符串包括數(shù)值的情況下,區(qū)別第一和第二語音方法中的一個;其中,所述輸出數(shù)據(jù)的步驟包括步驟執(zhí)行基于正被輸出的所述字符串的處理,以及 所述關(guān)聯(lián)的步驟包括步驟將基于在所述輸出數(shù)據(jù)的步驟中執(zhí)行的處理而確定的所述 字符串的類型與在所述區(qū)別的步驟中的區(qū)別結(jié)果相關(guān)聯(lián)。
7.根據(jù)權(quán)利要求5所述的存儲有語音控制程序的計算機(jī)可讀記錄介質(zhì),其中,所述輸 出數(shù)據(jù)的步驟包括執(zhí)行導(dǎo)航處理的步驟。
8.一種存儲有語音控制程序的計算機(jī)可讀記錄介質(zhì),所述程序使計算機(jī)執(zhí)行以下步驟用第一語音方法說出由多個數(shù)字組成的數(shù)值,在第一語音方法中,逐一朗讀所述數(shù)值 的各個單獨數(shù)字;用第二語音方法說出由多個數(shù)字組成的數(shù)值,在第二語音方法中,將所述數(shù)值作為整 體數(shù)字朗讀;基于字符串中包括的數(shù)值中數(shù)字的個數(shù),來確定第一和第二語音方法中的一個;以及 在給定字符串包括由多個數(shù)字組成的數(shù)值的情況下,使得用所確定的第一和第二語音 方法中的一個來說出所述字符串。
9.一種語音控制方法,包括如下步驟將第一語音方法或第二語音方法與字符串的類型相關(guān)聯(lián),在所述第一語音方法中,將 由多個數(shù)字組成的數(shù)值作為各個單獨數(shù)字朗讀,在所述第二語音方法中,將由多個數(shù)字組 成的數(shù)值作為整體數(shù)字朗讀;通過執(zhí)行預(yù)定處理來輸出數(shù)據(jù); 基于輸出的數(shù)據(jù)產(chǎn)生字符串;以及用第一和第二語音方法中與所輸出的數(shù)據(jù)的類型相關(guān)聯(lián)的一個語音方法來說出產(chǎn)生 的字符串。
10.根據(jù)權(quán)利要求9所述的語音控制方法,使計算機(jī)還執(zhí)行以下步驟獲取話音;識別獲取的話音,以輸出字符串;以及在輸出的字符串包括數(shù)值的情況下,區(qū)別第一和第二語音方法中的一個; 其中,所述輸出數(shù)據(jù)的步驟包括步驟執(zhí)行基于正被輸出的所述字符串的處理,以及 所述關(guān)聯(lián)的步驟包括步驟將基于在所述輸出數(shù)據(jù)的步驟中執(zhí)行的處理而確定的所述 字符串的類型與所述區(qū)別的步驟中的區(qū)別結(jié)果相關(guān)聯(lián)。
11.根據(jù)權(quán)利要求9所述的語音控制方法,其中,所述輸出數(shù)據(jù)的步驟包括執(zhí)行導(dǎo)航處 理的步驟。
12.—種語音控制方法,包括以下步驟用第一語音方法說出由多個數(shù)字組成的數(shù)值,在所述第一語音方法中,逐一朗讀所述 數(shù)值的各個單獨數(shù)字;用第二語音方法說出由多個數(shù)字組成的數(shù)值,在所述第二語音方法中,將所述數(shù)值作 為整體數(shù)字朗讀;基于字符串中包括的數(shù)值中數(shù)字的個數(shù),來確定第一和第二語音方法中的一個;以及 在給定字符串包括由多個數(shù)字組成的數(shù)值的情況下,使得用確定的第一和第二語音方 法中的一個,來說出所述字符串。
全文摘要
為了以用戶容易理解的方式說出數(shù)值,一種語音設(shè)備包括話音合成部55,在給定字符串包括由多個數(shù)字組成的數(shù)值的情況下,用第一語音方法或第二語音方法說出數(shù)值,在第一語音方法中,逐一朗讀數(shù)值的各個單獨數(shù)字,在第二語音方法中,將數(shù)值作為整體數(shù)字朗讀;用戶定義表81、地域表84和數(shù)字個數(shù)表87,將字符串的類型與第一語音方法或第二語音方法相關(guān)聯(lián);處理執(zhí)行部53,執(zhí)行處理,以輸出數(shù)據(jù);以及語音控制部51,基于所輸出數(shù)據(jù)產(chǎn)生字符串,并且使話音合成部55用第一和第二語音方法中的與所輸出數(shù)據(jù)的類型相關(guān)聯(lián)的語音說出所產(chǎn)生的字符串。
文檔編號G10L13/08GK101981613SQ20098011085
公開日2011年2月23日 申請日期2009年2月4日 優(yōu)先權(quán)日2008年3月31日
發(fā)明者大谷欣也, 廣瀨直樹 申請人:三洋電機(jī)株式會社