本發(fā)明涉及用于向終端裝置的用戶提供信息的技術。
背景技術:
已提出各種技術來充當為展覽設施(比如美術館和博物館)中的訪客進行的導覽。例如,專利文獻1公開了一種個人導覽系統(tǒng),其包括由訪客攜帶的便攜式再現單元。在便攜式再現單元中預先存儲有音頻講解,并且該便攜式再現單元響應于從展覽品附近的發(fā)送裝置發(fā)送的一條相應代碼信息而再現各講解。類似地,專利文獻2公開了一種導覽方法,其中,從預先存儲在由展覽設施中的訪客攜帶的便攜式收發(fā)單元中的各條展覽品數據(例如,關于展覽品的說明圖像和語音)中,選擇與從位于各展覽品附近的固定式收發(fā)裝置發(fā)送的識別信號相對應的一條展覽品數據,并根據所選擇的該條數據再現關于展覽品的說明圖像和語音。
現有技術文獻
專利文獻
專利文獻1:日本專利申請公開No.H02-190888
專利文獻2:日本專利申請公開No.2002-259612
技術實現要素:
本發(fā)明解決的技術問題
在專利文獻1和2公開的技術中,選擇性地再現預先存儲在由用戶攜帶的便攜式終端裝置(專利文獻1中的再現單元或專利文獻2中的便攜式收發(fā)單元)中的信息。因此,這些技術的缺點在于要求終端裝置具有大存儲容量。在以上描述中,給出諸如美術館和博物館之類的展覽設施作為示例。但是,在向用戶提供各種信息的任何場合中(比如,在例如火車或公交車等的交通系統(tǒng)中的語音導覽的情況下)都會存在與上述關于存儲容量的問題相類似的問題。鑒于所述問題,本發(fā)明的目的在于使得能夠向用戶提供各種信息,同時還使得與現有技術相比終端裝置的所需存儲容量減小。
解決問題的手段
為了解決所述問題,根據本發(fā)明的信息管理系統(tǒng)包括:音頻信號獲取裝置,其構造為獲取表示用于再現的聲音的音頻信號;相關信息獲取裝置,其構造為獲取與所述用于再現的聲音有關的一條相關信息;關聯管理裝置,其構造為將所述相關信息獲取裝置針對所述用于再現的聲音獲取的所述一條相關信息與一旦發(fā)射與所述音頻信號對應的所述用于再現的聲音就通知給終端裝置的一條識別信息相關聯;和信息提供裝置,其構造為從所述終端裝置接收包括通知給所述終端裝置的所述一條識別信息的信息請求,并向所述終端裝置發(fā)送通過所述關聯管理裝置而與所述一條識別信息相關聯的所述一條相關信息。在上述構造中,將一旦發(fā)射用于再現的聲音就通知給終端裝置的識別信息和與用于再現的聲音有關的相關信息彼此關聯,并且將與通知給終端裝置的識別信息相對應的相關信息提供給終端裝置。因此,與專利文獻1和2中公開的技術相比,優(yōu)點在于,可以減小終端裝置用于存儲相關信息的所需存儲容量。
在本發(fā)明的優(yōu)選模式中,所述信息管理系統(tǒng)還包括:信號處理裝置,其構造為產生音頻信號,該音頻信號包括所述音頻信號獲取裝置獲取的音頻信號和包括所述一條識別信息的調制的信號。在上述模式中,由于產生了在其中包括了用于再現的聲音的音頻信號和包括用于再現的聲音的所述一條識別信息的調制的信號的音頻信號,因此一旦發(fā)射與所產生的音頻信號相對應的聲音,就可以向所述終端裝置通知所述一條識別信息。因此,優(yōu)點在于,通過使用利用能夠發(fā)射和接收聲音的部件的簡單構造就可以發(fā)送和接收識別信息。
在本發(fā)明的優(yōu)選模式中,信號處理裝置將包括各條識別信息的各個調制的信號添加至各再現部分,所述各再現部分是通過所述音頻信號獲取裝置獲取的音頻信號的時間軸分開部分,其中,各調制的信號中的各條識別信息在各再現部分之間彼此不同。關聯管理裝置將所述相關信息獲取裝置針對每個再現部分獲取的一條相關信息與對應于該再現部分的一條識別信息相關聯。在上述模式中,用于再現的聲音被分為各再現部分,并且在每個再現部分中包括具有不同識別信息的調制的信號。此外,對于每個再現部分,所述一條識別信息與相應一條相關信息相關聯。通過該構造,可以結合發(fā)射用于再現的聲音的進程來改變發(fā)送至終端裝置的一條相關信息。
在本發(fā)明的優(yōu)選模式中,所述音頻信號獲取裝置通過語音合成產生指示了所述用于再現的聲音的音頻信號,所述用于再現的聲音是與來自用戶的指令相符合的字符串的發(fā)音聲(spoken rendition)。在上述模式中,由于通過語音合成來產生指示了用于再現的聲音的音頻信號,因此,優(yōu)點在于,無需預先記錄用于再現的聲音。在本發(fā)明的優(yōu)選模式中,相關信息獲取裝置通過指示了所述用于再現的聲音的發(fā)音內容的字符串的機器翻譯來產生指示了所述用于再現的聲音的翻譯的一條相關信息。因此,優(yōu)點在于,無需預先準備與用于再現的聲音的語言不同的語言的相關信息??梢噪S意選擇音頻信號獲取裝置獲取音頻信號的方式以及相關信息獲取裝置獲取相關信息的方式。例如,可以采用音頻信號獲取裝置從輸出音頻信號的信號供應裝置獲取用于再現的聲音的音頻信號的構造。替代性地或額外地,可以采用相關信息獲取裝置獲取指示了與用于再現的聲音有關的圖像的相關信息。
在本發(fā)明的優(yōu)選模式中,相關信息獲取裝置通過指示了所述用于再現的聲音的發(fā)音內容的字符串的機器翻譯來產生指示了所述用于再現的聲音的翻譯的字符串,并且進一步通過語音合成產生指示了指示所述翻譯的字符串的發(fā)音聲的音頻信號作為所述一條相關信息,該音頻信號從而指示了所述用于再現的聲音的翻譯。在上述模式中,通過機器翻譯產生指示了用于再現的聲音的翻譯的字符串,并且通過語音合成產生作為指示了所述翻譯的字符串的發(fā)音聲且指示了用于再現的聲音的音頻信號作為所述相關信息。因此,并行于第一語言的用于再現的聲音的發(fā)射,終端裝置對與用于再現的聲音的原始語言(第一語言)不同的第二語言的用于再現的聲音進行再現。因此,優(yōu)點在于,即使終端裝置的用戶無法理解第一語言的用于再現的聲音,該用戶通過聆聽第二語言的用于再現的聲音也能夠理解再現的內容。
在本發(fā)明的優(yōu)選模式中,相關信息獲取裝置獲取與所述用于再現的聲音相關的圖像作為所述一條相關信息。在該構造中,獲取與用于再現的聲音有關的圖像作為相關信息。因此,優(yōu)點在于,無需在終端裝置中預先存儲與用于再現的聲音有關的圖像。當在終端裝置上存儲數據大小較大的圖像數據時,該終端裝置的大量存儲容量被占用。在本發(fā)明中,可以極大減小終端裝置存儲與用于再現的聲音的有關的圖像所需的存儲容量。
在本發(fā)明的優(yōu)選模式中,音頻信號獲取裝置獲取指示了所述用于再現的聲音的音頻信號,該音頻信號從信號供應裝置供應,并且相關信息獲取裝置通過語音識別、根據從所述信號供應裝置供應的音頻信號產生指示了所述用于再現的聲音的發(fā)音內容的字符串作為所述一條相關信息。在上述構造中,根據從信號供應裝置供應且指示了用于再現的聲音的音頻信號來產生指示了所述用于再現的聲音的發(fā)音內容的字符串。因此,優(yōu)點在于,信息管理系統(tǒng)不需要管理員來單獨指定該字符串作為指定字符串。此外,連同用于再現的聲音的發(fā)射,在顯示裝置上顯示用于再現的聲音的字符串。因此,優(yōu)點在于,即使當用戶使用未配備有單獨獲取和存儲指示了用于再現的聲音的發(fā)音內容的字符串的裝置時、在錯過所發(fā)射的用于再現的聲音時或者在用戶具有聆聽用于再現的聲音的困難(例如,弱聽力人士)的情況下,用戶也能夠在他/她的終端裝置上查看用于再現的聲音的內容。此外,可以由此減小終端裝置用于存儲指示了用于再現的聲音的發(fā)音內容的字符串的所需存儲容量。
在本發(fā)明的優(yōu)選模式中,音頻信號獲取裝置可以獲取指示了所述用于再現的聲音的音頻信號,該音頻信號從信號供應裝置供應,并且所述相關信息獲取裝置可以通過語音識別、根據從所述信號供應裝置供應的音頻信號產生指示了所述用于再現的聲音的發(fā)音內容的字符串,并且通過所產生的字符串的機器翻譯,可以產生指示了所述用于再現的聲音的翻譯的所述一條相關信息。在該情況下,通過對指示了用于再現的聲音的發(fā)音內容的字符串進行機器翻譯來產生相關信息。因此,進一步的優(yōu)點在于,無需預先準備與用于再現的聲音的語言不同的語言的相關信息。
在本發(fā)明的優(yōu)選模式中,音頻信號獲取裝置獲取指示了所述用于再現的聲音的音頻信號,該音頻信號從信號供應裝置供應。相關信息獲取裝置通過語音識別、根據從所述信號供應裝置供應的音頻信號產生指示了所述用于再現的聲音的發(fā)音內容的字符串,并且通過所產生的字符串的機器翻譯,產生指示了所述用于再現的聲音的翻譯的字符串,并且還通過語音合成產生指示了指示所述翻譯的字符串的發(fā)音聲的音頻信號作為所述一條相關信息,該音頻信號從而指示了所述用于再現的聲音的翻譯。在上述模式中,并行于用于再現的聲音的發(fā)射,通過終端裝置以與用于再現的聲音的第一語言不同的第二語言來再現用于再現的聲音。因此,優(yōu)點在于,即使終端裝置的用戶無法理解第一語言的用于再現的聲音,該用戶通過聆聽第二語言的用于再現的聲音也將能夠理解再現的內容。
在本發(fā)明的優(yōu)選模式中,音頻信號獲取裝置獲取指示了所述用于再現的聲音的音頻信號,該音頻信號從信號供應裝置供應。相關信息獲取裝置通過語音識別、根據從所述信號供應裝置供應的音頻信號產生指示了所述用于再現的聲音的發(fā)音內容的字符串,并且獲取指示了所述用于再現的聲音的翻譯并通過輸入裝置上執(zhí)行的操作而被指定為所產生的字符串的翻譯的字符串,作為所述一條相關信息。在該模式中,獲取指示了第一語言的字符串的管理員人工翻譯的結果的字符串作為相關信息。因此,與通過機器翻譯產生指示了用于再現的聲音的翻譯的字符串的情況相比,可以獲取具有更高質量的導覽語音V的第二語言書面翻譯。
在本發(fā)明的優(yōu)選模式中,音頻信號獲取裝置獲取指示了所述用于再現的聲音的音頻信號,該音頻信號從信號供應裝置供應。相關信息獲取裝置通過語音識別、根據從所述信號供應裝置供應的音頻信號產生指示了所述用于再現的聲音的發(fā)音內容的字符串,并且通過所產生的字符串的機器翻譯,產生指示了所述用于再現的聲音的翻譯的字符串,并且獲取指示了所述用于再現的聲音的翻譯并已經通過輸入裝置上執(zhí)行的操作而編輯了的字符串,作為所述一條相關信息。在該模式中,獲取管理員對指示了通過機器翻譯產生的翻譯的字符串進行編輯而產生的字符串,作為相關信息。因此,優(yōu)點在于,與僅通過機器翻譯產生指示了用于再現的聲音的翻譯的字符串的模式相比,獲取了更高質量的書面翻譯。此外,進一步的優(yōu)點在于,與僅通過人工翻譯的方式獲取書面翻譯的情況相比,可以減少管理員所需的工作量,并且可以更快速地獲取相關信息。
在本發(fā)明的優(yōu)選模式中,音頻信號獲取裝置獲取指示了所述用于再現的聲音的音頻信號,該音頻信號從信號供應裝置供應。相關信息獲取裝置獲取與從所述信號供應裝置供應的音頻信號有關的內容,作為所述一條相關信息。在該模式中,獲取與指示了用于再現的聲音的音頻信號有關的內容作為相關信息。因此,可以利用簡單構造向終端裝置的用戶導覽與用于再現的聲音有關的各種信息(例如,關于從用于再現的聲音衍生的服務的信息)。
本發(fā)明表征為用于根據上述每個模式的信息管理系統(tǒng)的操作的方法(信息管理方法)。本發(fā)明還表征為使得計算機執(zhí)行包括在根據上述每個模式的信息管理系統(tǒng)中的功能的程序并且表征為存儲有所述程序的計算機可讀存儲介質。即,在本發(fā)明的信息管理方法的一個模式中,所述方法包括:獲取表示用于再現的聲音的音頻信號;獲取與所述用于再現的聲音有關的一條相關信息;將針對所述用于再現的聲音獲取的所述一條相關信息與一旦發(fā)射與所述音頻信號對應的所述用于再現的聲音就通知給終端裝置的一條識別信息相關聯,并且將所述一條相關信息和所述一條識別信息存儲在存儲裝置中;和從所述終端裝置接收包括通知給所述終端裝置的所述一條識別信息的信息請求,并向所述終端裝置發(fā)送與所述一條識別信息相關聯并存儲在所述存儲裝置中的所述一條相關信息。在本發(fā)明的程序的一個模式中,所述程序使得計算機執(zhí)行:音頻信號獲取處理,其獲取表示用于再現的聲音的音頻信號;相關信息獲取處理,其獲取與所述用于再現的聲音有關的一條相關信息;關聯管理處理,其將相關信息獲取處理中針對所述用于再現的聲音獲取的所述一條相關信息與一旦發(fā)射與所述音頻信號對應的所述用于再現的聲音就通知給終端裝置的一條識別信息相關聯;和信息提供處理,其從所述終端裝置接收包括通知給所述終端裝置的所述一條識別信息的信息請求,并向所述終端裝置發(fā)送在所述關聯管理處理中與所述一條識別信息相關聯的所述一條相關信息。在根據每個模式的所述信息管理方法、所述程序或存儲有所述程序的計算機可讀存儲介質中,可以實現與根據上述模式中的每一個的信息管理系統(tǒng)的有利效果相類似的有利效果。
附圖說明
圖1是示出根據本發(fā)明的第一實施例的通信系統(tǒng)的構造的示圖。
圖2是示出信息管理系統(tǒng)的構造的示圖。
圖3是示出音頻信號獲取器和相關信息獲取器的構造的示圖。
圖4是示出信號處理器的構造的示圖。
圖5是示出信號處理器的操作的示圖。
圖6是示出信息管理系統(tǒng)的操作的流程圖。
圖7是示出聲音發(fā)射系統(tǒng)的構造的示圖。
圖8是示出終端裝置的構造的示圖。
圖9是示出獲取相關信息時終端裝置的操作的示圖。
圖10是示出音頻信號獲取器和相關信息獲取器的修改例(模式1)的構造的示圖。
圖11是示出音頻信號獲取器和相關信息獲取器的修改例(模式2)的構造的示圖。
圖12是示出音頻信號獲取器和相關信息獲取器的修改例(模式3)的構造的示圖。
圖13是示出音頻信號獲取器和相關信息獲取器的修改例(模式4)的構造的示圖。
圖14是示出音頻信號獲取器和相關信息獲取器的修改例(模式5)的構造的示圖。
圖15是示出音頻信號獲取器和相關信息獲取器的修改例(模式6)的構造的示圖。
圖16是示出音頻信號獲取器和相關信息獲取器的修改例(模式7)的構造的示圖。
圖17是示出音頻信號獲取器和相關信息獲取器的修改例(模式7)的進一步修改的構造的示圖。
圖18是示出音頻信號獲取器和相關信息獲取器的修改例(模式7)的進一步修改的構造的示圖。
圖19是示出音頻信號獲取器和相關信息獲取器的修改例(模式7)的進一步修改的構造的示圖。
圖20是示出音頻信號獲取器和相關信息獲取器的修改例(模式8)的構造的示圖。
圖21是示出音頻信號獲取器和相關信息獲取器的修改例(模式8)的進一步修改的構造的示圖。
圖22是示出音頻信號獲取器和相關信息獲取器的修改例(模式8)的進一步修改的構造的示圖。
圖23是示出根據第二實施例的信號處理器的操作的示圖。
圖24是示出根據第三實施例的信息提供器的操作的示圖。
圖25示出了根據一個修改例的相關信息的顯示示例。
圖26是示出根據一個修改例的通信系統(tǒng)的構造的示圖。
具體實施方式
第一實施例
圖1是示出根據本發(fā)明的第一實施例的通信系統(tǒng)100的構造的示圖。如圖1的示例中所示,第一實施例的通信系統(tǒng)100包括信息提供系統(tǒng)10和終端裝置12。信息提供系統(tǒng)10是計算機系統(tǒng),其向終端裝置12提供各種信息。終端裝置12是便攜式信息處理裝置,比如移動電話或智能電話。在以下描述中,假設終端裝置12的用戶出現在展示比如藝術品和文獻之類的展覽品的比如美術館或博物館之類的設施(下文稱作“展覽設施”)M中,并且假設從信息提供系統(tǒng)10向終端裝置12提供與各展覽品有關的信息。在圖1中,為了簡要示出了單個終端裝置12。但是,在現實中,信息提供系統(tǒng)10可以向多個終端裝置12中的每一個提供信息。
如圖1的示例中所示,第一實施例的信息提供系統(tǒng)10包括信息管理系統(tǒng)14和聲音發(fā)射系統(tǒng)16。聲音發(fā)射系統(tǒng)16安裝在展覽設施M中,用于設施中的語音導覽。具體地,如圖1的示例中所示,第一實施例的聲音發(fā)射系統(tǒng)16發(fā)射特定語言(下文稱作“第一語言”)的用于為用戶導覽的語音(下文稱作“導覽語音V”),并向終端裝置12通知預先分配給導覽語音V的識別信息D。例如,導覽語音V是提供展覽品的說明的聲音,或者是提供展覽設施M的音頻導覽的聲音。通過無線信息通信將導覽語音V的識別信息D通知給終端裝置12。在第一實施例中,描述了其中通過聲音通信(其中聲音(聲波),即,空氣的振動,被用作傳輸介質)從聲音發(fā)射系統(tǒng)16向終端裝置12通知識別信息D的示例。即,識別信息D作為聲音與導覽語音V一起從聲音發(fā)射系統(tǒng)16發(fā)射。
信息管理系統(tǒng)14是計算機系統(tǒng),其管理提供至終端裝置12的信息。終端裝置12能夠經由通信網絡18(包括移動通信網絡、互聯網等)與信息管理系統(tǒng)14進行通信。如圖1的示例中所示,終端裝置12向信息管理系統(tǒng)14發(fā)送信息請求R,該信息請求R包括聲音發(fā)射系統(tǒng)16所通知的識別信息D。信息管理系統(tǒng)14向請求源終端裝置12發(fā)送相關信息Q,該相關信息Q與經由通信網絡18接收到的信息請求R中所指定的識別信息D相對應。相關信息Q是與導覽語音V有關的信息。在第一實施例中,終端裝置12被提供有指示翻譯的相關信息Q,在該翻譯中,作為第一語言的導覽語音V發(fā)音的導覽已經被翻譯成另一語言(下文稱作“第二語言”)。因此,能夠理解第一語言的用戶將能夠通過聆聽導覽語音V理解用于展覽設施M的導覽,而能夠理解第二語言的用戶將能夠通過參考相關信息Q理解用于展覽設施M的導覽。以下提供關于以上簡要描述的通信系統(tǒng)100的各元件的具體構造和功能的細節(jié)。
信息管理系統(tǒng)14
圖2是示出信息管理系統(tǒng)14的構造的示圖。如圖2的示例中所示,第一實施例的信息管理系統(tǒng)14包括控制裝置142、存儲裝置144、輸入裝置146和顯示裝置148。存儲裝置144存儲由控制裝置142使用的各種數據,并且還存儲由控制裝置142執(zhí)行的程序。任何公知存儲介質(例如半導體存儲介質或磁存儲介質)或不同類型存儲介質的組合可用于存儲裝置144。輸入裝置146是操作信息管理系統(tǒng)14的管理員操作來向信息管理系統(tǒng)14提供各種指令的操作設備。輸入裝置146包括例如管理員可操作的操作單元。例如,通過適當地操作輸入裝置146,管理員可以提供關于包含展覽設施M中的各展覽品的導覽的字符串(下文稱作“指定字符串ST”)的指令。顯示裝置148是在控制裝置142的控制下顯示各種信息(比如語音識別的結果和機器翻譯的結果)的裝置(例如,液晶顯示面板)。這里,可以采用輸入裝置146和顯示裝置148一體形成的觸摸面板。
如圖2的示例中所示,控制裝置142可以為中央處理單元(CPU),并且通過與存儲裝置144中存儲的程序進行協(xié)作來實現信息管理系統(tǒng)14的功能。即,通過執(zhí)行存儲在存儲裝置144中的程序,控制裝置142實現各種功能(音頻信號獲取器22、相關信息獲取器24、識別信息設置器26、信號處理器32、關聯管理器34和信息提供器36)以管理要提供至終端裝置12的信息??梢圆捎闷渲锌刂蒲b置142的各功能在多個裝置中分布的構造。額外地或替代性地,可以采用使得控制裝置142的部分功能由專用電子電路執(zhí)行的構造。
音頻信號獲取器22獲取表示導覽語音V的音頻信號SG。如圖3的示例中所示,第一實施例的音頻信號獲取器22通過語音合成產生表示導覽語音V的時間波形的音頻信號SG,導覽語音V是第一語言的、由管理員經由輸入裝置146的操作而指定的指定字符串ST的發(fā)音聲。任何公知技術可用于音頻信號獲取器22所執(zhí)行的語音合成。例如,音頻信號獲取器22可以通過例如單元拼接型語音合成(其通過從預先準備的語音單元(音素或音素鏈)中按照時間順序對與指定字符串ST中的字符相對應的語音單元進行拼接來產生音頻信號SG)或通過基于統(tǒng)計模型的語音合成(其通過利用統(tǒng)計模型(比如隱馬可夫模型(HMM))產生對應于指定字符串ST的音頻信號SG)來產生音頻信號SG。在本實施例中,由于通過語音合成來產生指示導覽語音V的音頻信號SG,因此可以獲得無需提前記錄導覽語音V的優(yōu)點。
圖2中的相關信息獲取器24產生與導覽語音V有關的相關信息Q。如圖3的示例中所示,通過對第一語言的、管理員指定的指定字符串ST進行機器翻譯(自動翻譯),第一實施例的相關信息獲取器24產生表示展覽設施M的導覽的第二語言的字符串(下文稱作“翻譯的字符串CT”)。任何公知技術可以用于對指定字符串ST進行機器翻譯。相關信息獲取器24可以通過利用例如基于規(guī)則的機器翻譯(其中基于對指定字符串ST進行語法分析的結果和語言規(guī)則來轉換詞匯順序和各詞匯)或通過統(tǒng)計機器翻譯(其中利用表示了語言的統(tǒng)計學趨勢的統(tǒng)計模型(翻譯模型和語言模型)來將指定字符串ST翻譯為第二語言)來產生相關信息Q。在本實施例中,由于通過對指示導覽語音V的發(fā)音內容的字符串進行機器翻譯(即,通過對指定字符串ST進行機器翻譯)來產生相關信息Q,因此,獲得了無需預先準備與導覽語音V的語言不同的語言的相關信息Q的優(yōu)點。
圖2的識別信息設置器26對將與導覽語音V的再現一起從聲音發(fā)射系統(tǒng)16通知給終端裝置12的識別信息D進行分配。識別信息D包括用于識別導覽語音V的唯一碼,并且被分配給每個導覽語音V。例如,識別信息設置器26將通過公知技術產生的一系列隨機數字作為識別信息D分配給導覽語音V,使得所述一系列隨機數字不會與針對不同導覽語音V的另一系列隨機數字重疊。
信號處理器32通過將識別信息設置器26分配的識別信息D與導覽語音V的音頻信號SG進行合成來產生音頻信號S。任何公知技術(例如,音頻水印)可以用于識別信息D與音頻信號SG的合成。例如,優(yōu)選地使用WO 2010/016589中描述的技術。具體地,如圖4的示例中所示,信號處理器32包括解調處理器322和混合處理器324。通過利用擴頻碼對識別信息D順序地執(zhí)行擴頻調制并通過利用特定頻率的載波執(zhí)行頻率變換,解調處理器322產生包括作為該特定頻帶的聲音分量的識別信息D的音頻信號(下文稱作“調制的信號”)SD。調制的信號SD的頻帶是其中聲音發(fā)射系統(tǒng)16可以發(fā)射聲音并且其中終端裝置12可以接收聲音的頻帶,并且處于比正常環(huán)境中用戶可聽到的聲音(比如語音或樂音)的頻帶(例如,可聽頻帶中的16kHz或更低)更高的頻帶范圍(例如,18kHz或更高且20kHz或更低)內。解調處理器322產生調制的信號SD的方式不限于上述示例(擴頻調制)。例如,可以通過將特定頻率的載波(例如正弦波)與識別信息D進行頻率調制來產生指定頻帶(例如,18kHz或更高且20kHz或更低)中的調制的信號SD。
圖4中的混合處理器324通過將音頻信號獲取器22獲取的音頻信號SG與解調處理器322產生的調制的信號SD疊加(通常是相加)來產生音頻信號S。從以上描述中可以理解,音頻信號S包括導覽語音V的聲音分量(音頻信號SG)和包括導覽語音V的識別信息D的聲音分量(調制的信號SD)。
圖5是描述導覽語音V的音頻信號SG與包括識別信息D的調制的信號SD之間的時間關系的示圖。如圖5的示例中所示,包括導覽語音V的識別信息D的調制的信號SD被多次地重復添加至導覽語音V的音頻信號SG中的沿時間軸的不同部分。即,導覽語音V的識別信息D的聲音分量沿時間軸在導覽語音V中的多個點處混合。這里,調制的信號SD可以按照連續(xù)方式沿時間軸彼此連接。
第一實施例的信號處理器32以特定格式(例如,WAV格式或MP3格式)將音頻信號S作為音頻文件存儲在存儲裝置144中。通過重復該處理多次,對于具有不同導覽內容的導覽語音V(針對不同展覽品來提供導覽的導覽語音V)中的每一個,在存儲裝置144中存儲音頻信號S,其包括:導覽語音V的聲音分量(音頻信號SG)和包括導覽語音V的識別信息D的聲音分量(調制的信號SD)。
圖2的關聯管理器34將通過識別信息設置器26分配給每個導覽語音V的識別信息D與通過相關信息獲取器24針對導覽語音V而獲取的相關信息Q相關聯,并且將識別信息D與相關信息Q存儲在存儲裝置144中。因此,如圖2的示例中所示,針對相應導覽語音V的每條識別信息D,在存儲裝置144中存儲一條相關信息Q。從以上描述中將理解到,針對展覽設施M中發(fā)射的每個導覽語音V,產生音頻信號S和一條相關信息Q。換言之,各自對應于共同的導覽語音V的音頻信號SG(音頻信號S)和一條相關信息Q通過對應的一條識別信息D而彼此相關聯。雖然圖2中示出了在存儲裝置144中存儲各音頻信號S和各條相關信息Q的示例構造,但是各音頻信號S和各條相關信息Q可以存儲在分離的存儲介質中。替代性地,可以采用其中將連接至信息管理系統(tǒng)14并能夠與信息管理系統(tǒng)14交換數據的至少一個外部裝置用作存儲各音頻信號S和各條相關信息Q的存儲裝置的構造。
圖2中的信息提供器36從終端裝置12接收包括一條識別信息D的信息請求R,并且從存儲在存儲裝置144中的多條相關信息Q中選擇與信息請求R中指定的所述一條識別信息D相對應的一條相關信息Q,以將所選擇的該條相關信息Q發(fā)送至請求源終端裝置12。稍后描述向終端裝置12發(fā)送相關信息Q。
圖6是信息管理系統(tǒng)14產生音頻信號S和相關信息Q的處理(下文稱作“信息產生處理”)的流程圖。例如,圖6中示出的信息產生處理在管理員對輸入裝置146進行操作之后(具體地,在管理員對指定字符串ST進行指定之后)啟動。在啟動信息產生處理之后,控制裝置142(音頻信號獲取器22和相關信息獲取器24)獲取與指定字符串ST對應的導覽語音V的音頻信號SG和與該導覽語音V有關的相關信息Q(SA1)??刂蒲b置142(識別信息設置器26)為導覽語音V分配識別信息D(SA2)??刂蒲b置142(信號處理器32)產生音頻信號S,并且將所產生的音頻信號S存儲在存儲裝置144中(SA3),在該音頻信號S中,包括導覽語音V的識別信息D的調制的信號SD疊加在導覽語音V的音頻信號SG上。控制裝置142(關聯管理器34)將針對導覽語音V的相關信息Q與識別信息D相關聯,并且將它們存儲在存儲裝置144中(SA4)。
在如上作為示例描述的信息產生處理中由信息管理系統(tǒng)14產生的音頻信號S(音頻文件)被傳輸至圖1中所示的聲音發(fā)射系統(tǒng)16。傳輸音頻信號S的方式可以自由選擇。例如,音頻信號S可以經由通信網絡18從信息管理系統(tǒng)14傳輸至聲音發(fā)射系統(tǒng)16,或者音頻信號S可以經由便攜式存儲介質(比如半導體存儲介質)從信息管理系統(tǒng)14傳輸至聲音發(fā)射系統(tǒng)16。
聲音發(fā)射系統(tǒng)16
圖7是聲音發(fā)射系統(tǒng)16的構造示圖。如圖7的示例中所示,第一實施例的聲音發(fā)射系統(tǒng)16包括控制裝置162、存儲裝置164和聲音發(fā)射裝置166。存儲裝置164是公知的存儲介質,比如半導體存儲介質或磁存儲介質,或者是不同類型存儲介質的組合。在存儲裝置164中,存儲有從信息管理系統(tǒng)14傳輸的各音頻信號S。
控制裝置162控制聲音發(fā)射系統(tǒng)16中的各元件。第一實施例的控制裝置162為聲音發(fā)射裝置166提供存儲裝置164中存儲的音頻信號S。聲音發(fā)射裝置166各自放置在展覽設施M的不同展覽品中的對應一個的附近。放置在展覽品附近的聲音發(fā)射裝置166被提供有與該展覽品的導覽語音V相對應的音頻信號S。每個聲音發(fā)射裝置166是根據從控制裝置162提供的音頻信號S發(fā)射聲音的音頻裝置。為了簡要起見省略了將音頻信號S從數字格式轉換為模擬格式的D/A轉換器的圖示。
如上參照圖4和圖5所述,音頻信號S包括表示導覽語音V的音頻信號SG和包括導覽語音V的識別信息D的調制的信號SD。因此,與一個展覽品相對應的聲音發(fā)射裝置166發(fā)射表示該展覽品的導覽語音V的聲音。如圖5的示例中所示,針對識別信息D的調制的信號SD被多次地重復添加至音頻信號SG。因此,導覽語音V的識別信息D的聲音與導覽語音V的再現相并行地多次重復發(fā)射。聲音發(fā)射裝置166附近(展覽品附近)的用戶聽到針對該展覽品的導覽語音V,并且通過聲音通信向用戶的終端裝置12通知導覽語音V的識別信息D。如上所述,因為與用戶在正常環(huán)境下能夠聽到的聲音的頻帶相比,包括識別信息D的調制的信號SD的頻帶處于更高的音高范圍(例如,18kHz或更高且20kHz或更低),所以識別信息D的聲音幾乎無法被用戶聽到。因此,可以利用聲音通信將識別信息D發(fā)送至終端裝置12,而不會妨礙用戶聆聽導覽語音V。
終端裝置12
圖8是示出終端裝置12的構造的示圖。在圖8中,還示出了聲音發(fā)射系統(tǒng)16的聲音發(fā)射裝置166中的一個。如圖8的示例中所述,第一實施例的終端裝置12包括控制裝置50、存儲裝置52、通信裝置54、聲音接收裝置56和輸出裝置58。存儲裝置52存儲由控制裝置50使用的數據,并且還存儲由控制裝置50執(zhí)行的程序。任何公知存儲介質(比如半導體存儲介質或磁存儲介質)或不同類型存儲介質的組合可用作存儲裝置52。
聲音接收裝置56是接收環(huán)境聲音的音頻裝置(麥克風),并且用于終端裝置12之間的語音呼叫,或者在錄制視頻期間用于記錄聲音。如圖8的示例中所示,第一實施例的聲音接收裝置56接收從展覽設施M的聲音發(fā)射裝置166發(fā)射的聲音,并產生表示所接收的聲音的時間波形的音頻信號(下文稱作“接收的音頻信號”)X。因此,接收的音頻信號X包括導覽語音V的聲音分量(音頻信號SG)和導覽語音V的識別信息D的聲音分量(調制的信號SD)。為了簡要起見,省略了將聲音接收裝置56產生的接收的音頻信號X從模擬格式轉換為數字格式的A/D轉換器的圖示。
控制裝置50控制終端裝置12中的各元件。例如,第一實施例的控制裝置50是CPU并且通過執(zhí)行存儲在存儲裝置52中的程序來用作信息提取器51。信息提取器51通過對聲音接收裝置56所產生的接收的音頻信號X進行解調來提取導覽語音V的識別信息D。具體地,信息提取器51通過利用例如高通濾波器從接收的音頻信號X中選擇處于高音高范圍且包括識別信息D的頻帶(18kHz或更高且20kHz或更低)中的頻帶分量。隨后,信息提取器51通過使所選擇的頻帶分量通過匹配濾波器來提取識別信息D,在該匹配濾波器中使用在識別信息D的擴頻調制時使用的擴頻碼作為系數。
通信裝置54是經由通信網絡18與信息提供系統(tǒng)10進行通信的通信設備??梢匀我膺x擇通信裝置54和通信網絡18之間的通信方案。通常,使用與聲音發(fā)射裝置16向終端裝置12通知識別信息D所使用的聲音通信不同的無線通信方案(例如,利用無線電波或紅外線作為傳輸介質的信息通信)。如圖8的示例中所示,第一實施例的通信裝置54包括發(fā)射器542和獲取器544。發(fā)射器542向信息管理系統(tǒng)14發(fā)送信息請求R,該信息請求R包括信息提取器51從接收的音頻信號X中提取的識別信息D。獲取器544獲取響應于信息請求R而從信息管理系統(tǒng)14發(fā)送的相關信息Q。如上參照圖5所述的那樣,識別信息D的調制的信號SD被多次地重復添加至導覽語音V的音頻信號SG。因此,雖然對于信息提取器51而言可以在多個時間點處多次重復地每次提取單條識別信息D,但是只有在信息提取器51首次提取新的識別信息D時才執(zhí)行信息請求R的發(fā)送和相應的相關信息Q的接收。如上述示例中所述,在第一實施例中,重復多次地發(fā)送單條識別信息D。因此,可以獲得這樣的優(yōu)點:例如,即使由于周圍噪聲干擾而導致終端裝置12獲取識別信息D失敗,終端裝置12也能夠再次獲取識別信息D。
圖8的輸出裝置58輸出獲取器544從信息管理系統(tǒng)14獲取到的相關信息Q。在第一實施例中,采用以第二語言顯示相關信息Q所指示的翻譯的字符串CT的顯示裝置作為輸出裝置58。即,并行于通過聲音發(fā)射系統(tǒng)16的聲音發(fā)射裝置166進行的第一語言的導覽語音V的再現,在終端裝置12上顯示(呈現)第二語言的翻譯的字符串CT。因此,即使終端裝置12的用戶無法理解第一語言,該用戶通過查看第二語言的翻譯的字符串CT也將能夠理解關于展覽品的導覽。
圖9是示出終端裝置12的用于獲取相關信息Q的操作的示圖。如上所述,從聲音發(fā)射系統(tǒng)16的聲音發(fā)射裝置166的每一個處,與導覽語音V的再現并行地重復發(fā)射識別信息D的聲音。當終端裝置12的用戶移動到從聲音發(fā)射裝置166發(fā)射的聲音的范圍內時,即,當移動到靠近展覽品時,終端裝置12的聲音接收裝置56產生接收的音頻信號X,其包括導覽語音V的聲音分量和相應一條識別信息D的聲音分量(SB1)??刂蒲b置50(信息提取器51)通過對接收的音頻信號X進行解調來提取該條識別信息D(SB2),并且通信裝置54的發(fā)射器542向信息管理系統(tǒng)14發(fā)送包括該條識別信息D的信息請求R(SB3)。
信息管理系統(tǒng)14的信息提供器36從通信網絡18接收終端裝置12所發(fā)送的信息請求R。隨后,信息提供器36從存儲在存儲裝置144中的多條相關信息Q中選擇與信息請求R中指定的那條識別信息D相對應的那條相關信息Q(SB4),并且將所選擇的這條相關信息Q發(fā)送至請求源終端裝置12(SB5)。終端裝置12的獲取器544從信息管理系統(tǒng)14獲取該條相關信息Q(SB6),并且輸出裝置58輸出該條相關信息Q(SB7)。從以上描述中可以理解,在終端裝置12并行于導覽語音的再現而接收從聲音發(fā)射系統(tǒng)16的聲音發(fā)射裝置166發(fā)射的識別信息D的聲音之后,即,在終端裝置12在來自聲音發(fā)射裝置166的聲波到達終端裝置12的范圍內移動之后,執(zhí)行包括識別信息D的信息請求R的發(fā)送(SB3)和與識別信息D對應的相關信息Q的獲取(SB6)。
如上所述,在第一實施例中,發(fā)射對應于音頻信號S的聲音,音頻信號S包括導覽語音的音頻信號SG和包括導覽語音的識別信息D的調制的信號SD。即,通過利用了與導覽語音一起發(fā)射的聲音的聲音通信來向終端裝置12通知識別信息D。因此,獲得了這樣的優(yōu)點:用于語音呼叫和記錄聲音的聲音接收裝置56可以被用于獲取識別信息D,因此,無需專用于識別信息D的無線通信的通信設備。此外,獲得了這樣的優(yōu)點:在聲音發(fā)射系統(tǒng)16中,無需專用于識別信息D的發(fā)送的通信設備,并且用于語音導覽的現有聲音發(fā)射裝置166可以被用于向終端裝置12通知識別信息D。此外,根據其中通過聲音通信來向終端裝置12傳達識別信息D的構造,優(yōu)點在于可以毫無困難地控制識別信息D的聲音的到達范圍,并且可以向多個終端裝置12統(tǒng)一通知識別信息D。
在第一實施例中,通過信息管理系統(tǒng)14將一旦發(fā)射導覽語音V就向終端裝置12通知的一條識別信息D和與該導覽語音V有關的一條相關信息Q彼此關聯,并且在多條相關信息Q中,將與通知給終端裝置12的該條識別信息D相對應的該條相關信息Q提供給終端裝置12。因此,終端裝置12的存儲裝置52無需預先存儲多條相關信息Q。根據上述構造,與專利文獻1和2中的技術相比,獲得了終端裝置12存儲相關信息Q所需的存儲容量可以極大減小的優(yōu)點。在每個終端裝置12中存儲了多條相關信息Q的構造中,當一條相關信息Q需要更新時,該條相關信息Q需要分別在每個終端裝置12中更新。在第一實施例中,多條相關信息Q存儲在信息管理系統(tǒng)15的存儲裝置144中并被選擇性地提供給終端裝置12。因此,通過更新存儲在存儲裝置144中的相關信息Q,可以向每個終端裝置12提供更新后的相關信息Q。因此,獲得了無需針對每個終端裝置12分別更新相關信息Q的優(yōu)點。
在第一實施例中,導覽語音V的識別信息D被與該導覽語音的再現一起通知給終端裝置12。因此,與識別信息D相對應的相關信息Q可以并行于導覽語音V的再現而在終端裝置1上輸出。例如,與在導覽語音的再現之后輸出相關信息Q的構造相比,可以獲得用戶能夠容易地辨識導覽語音V和相關信息Q之間的關聯性的優(yōu)點。
例如,日本專利申請公開第2011-109629號(下文稱作“現有技術1”)公開了一種自動再現語音導覽系統(tǒng),其利用放置在美術館或博物館中的展覽品附近的發(fā)送裝置和用戶攜帶的便攜式接收器。發(fā)送裝置通過無線電波或紅外線間歇性地將展覽品唯一的識別碼發(fā)送到其周圍環(huán)境。便攜式接收器從預先存儲在其存儲介質中的各導覽語音中再現與從發(fā)送裝置接收的識別碼相對應的導覽語音。根據現有技術1,在便攜式接收器在(展覽品附近的)一個范圍(在該范圍中來自發(fā)送裝置的無線電波或紅外線到達便攜式接收器)內移動并接收到識別碼之后,對描述該范圍內的展覽品的導覽語音進行再現。
但是,在現有技術1中,因為通過無線電波或紅外線來發(fā)送每個展覽品的識別碼,因此需要將發(fā)送或接收無線電波或紅外線的專用通信設備附加至每個發(fā)送裝置和每個便攜式接收器。在第一實施例中,發(fā)射對應于音頻信號S的聲音,音頻信號S包括導覽語音V的音頻信號SG和包括導覽語音V的識別信息D的調制的信號SD。即,通過利用了與導覽語音V一起發(fā)射的聲音的聲音通信來向終端裝置12通知識別信息D。因此,獲得了這樣的優(yōu)點:用于語音呼叫和記錄聲音的聲音接收裝置56可以被用于獲取識別信息D,因此,無需專用于識別信息D的無線通信的通信設備。此外,獲得了這樣的優(yōu)點:在聲音發(fā)射系統(tǒng)16中,無需專用于識別信息D的發(fā)送的通信設備,并且用于語音導覽的現有聲音發(fā)射裝置166可以被用于向終端裝置12通知識別信息D。換言之,可以通過利用發(fā)射和接收聲音的部件、通過簡單構造來發(fā)射和接收識別信息D。此外,根據通過聲音通信來向終端裝置12傳達識別信息D的構造,優(yōu)點在于可以毫無困難地控制識別信息D的聲音的到達范圍,并且可以向多個終端裝置12統(tǒng)一通知識別信息D。
例如,日本專利申請公開第2000-207170號(下文稱作“現有技術2”)公開了一種信息處理裝置,其以不會干擾對與將要再現的音頻信號對應的聲音的聆聽的方式,向該音頻信號添加附加信息,以產生輸出音頻信號。在利用該信息處理裝置的播報系統(tǒng)(announcement system)中,當經由揚聲器向用戶發(fā)送作為語音導覽的信息時,服務器向該信息添加與該語音導覽有關的信息(例如,翻譯)作為附加信息。例如,通過擴頻技術,將附加信息疊加到音頻信號上。
在上述使用聲波(其為空氣的振動)作為傳輸介質的聲音通信中,發(fā)送速度和發(fā)送容量與使用例如無線電波作為傳輸介質的無線通信相比而言較低。在現有技術2中,通過聲音通信發(fā)送附加信息(即,相關信息)。在第一實施例中,通過聲音通信發(fā)送識別信息D。因此,第一實施例的構造具有這樣的優(yōu)點:通過聲音通信發(fā)送的數據量減小,這是因為發(fā)送了其數據大小比相關信息更小的識別信息D。由于聲音通信中通信容量較小,因此采用現有技術2方案可以發(fā)送的附加信息實際上限于具有小的數據大小的信息。在第一實施例中,通過聲音通信發(fā)送識別信息,并且通過信息管理系統(tǒng)14分發(fā)與該識別信息相對應的相關信息。因此,還可以向用戶呈現具有大的數據大小的各種相關信息(例如,聲音或圖像)。
第一實施例的各修改例
在第一實施例中,利用由信息管理系統(tǒng)14的管理員指定的指定字符串ST、通過語音合成來產生音頻信號SG,并且通過對指定字符串ST進行機器翻譯來產生相關信息Q。獲取(通常地,產生)音頻信號SG和相關信息Q的方式不限于這些示例。下面描述獲取音頻信號SG和相關信息Q的其他方式的示例。關于以下描述的每種模式中獲取音頻信號SG和相關信息Q的處理,可以視情況改變執(zhí)行用以獲取(或產生)音頻信號SG的處理和用于獲取(或產生)相關信息Q的處理的順序。
修改模式1
在圖10的示例中示出的模式1中,信息管理系統(tǒng)14的音頻信號獲取器22以與第一實施例中采用的方式類似的方式,根據指定字符串ST、通過語音合成來產生導覽語音V的音頻信號SG。相關信息獲取器24獲取管理員指定的指定字符串ST作為相關信息Q。即,相關信息Q是表示第一語言的導覽語音V的發(fā)音內容的字符串,第一語音還用于導覽語音V。在上述構造中,并行于由聲音發(fā)射系統(tǒng)16進行的導覽語音V的再現,在顯示裝置12上顯示導覽語音V的發(fā)音內容的字符串。因此,獲得了例如弱聽力人士(聽力障礙人士)能夠查看導覽語音V的內容的優(yōu)點。
在根據本實施例的該模式的信息產生處理(圖6)中,可以理解,獲取與指定字符串ST對應的導覽語音V的音頻信號SG和與該導覽語音V有關的相關信息Q的步驟(SA1)包括:通過語音合成產生與指定字符串ST對應的導覽語音V的音頻信號SG;以及獲取指定字符串ST作為相關信息Q。
修改模式2
在圖11的示例中示出的模式2中,信息管理系統(tǒng)14的音頻信號獲取器22以與第一實施例中采用的方式類似的方式,根據第一語言的指定字符串ST、通過語音合成來產生導覽語音V的音頻信號SG。信息管理系統(tǒng)14的管理員通過適當地操作輸入裝置146來指定第二語言的表示導覽語音V的字符串(翻譯的字符串CT)。相關信息獲取器24獲取第二語言的、由管理員指定的翻譯的字符串CT作為相關信息Q。在如上參照的圖3中示出的構造中,當機器翻譯準確性較低時無法產生適當的翻譯的字符串CT。在圖11的示例中示出的模式2中,對指定字符串ST的機器翻譯(圖3)是不必需的。因此,獲得了這樣的優(yōu)點:可以準備例如通過人工翻譯(人類翻譯)產生且準確地以第二語言表示導覽語音V的相關信息Q。
在該模式中,可以理解,信息產生處理(圖6)的步驟SA1包括:通過語音合成產生與指定字符串ST對應的導覽語音V的音頻信號SG;和獲取指定的翻譯的字符串CT(即,獲取根據從導覽語音V的發(fā)音內容到第二語言的翻譯導出的字符串)作為相關信息Q。
修改模式3
在圖12的示例中示出的模式3中,信息管理系統(tǒng)14的音頻信號獲取器22以與第一實施例中采用的方式類似的方式,根據指定字符串ST、通過語音合成來產生導覽語音V的音頻信號SG。相關信息獲取器24通過對第一語言的指定字符串ST進行機器翻譯來產生第二語言的翻譯的字符串CT,并且根據翻譯的字符串CT、通過語音合成產生第二語言的導覽語音V的音頻信號作為相關信息Q。終端裝置12的輸出裝置58包括聲音發(fā)射裝置(比如揚聲器或耳機),其用于發(fā)射與從信息管理系統(tǒng)14提供的相關信息Q所指示的音頻信號相對應的聲音(第二語言的導覽語音V)。即,并行于聲音發(fā)射系統(tǒng)16進行的第一語言的導覽語音V的再現,通過終端裝置12再現第二語言的導覽語音。因此,即使當終端裝置12的用戶無法理解第一語言時,該用戶通過聆聽第二語言的導覽語音V也將能夠理解關于展覽品的導覽。
在該模式中,可以理解,信息產生處理(圖6)的步驟SA1包括:通過語音合成產生與指定字符串ST對應的導覽語音V的音頻信號SG;通過對所指定的指定字符串ST進行機器翻譯(即,對表示導覽語音V的發(fā)音內容的字符串進行機器翻譯)來產生表示導覽語音V的翻譯的翻譯的字符串CT;和通過語音合成產生作為翻譯的字符串CT的發(fā)音聲且指示導覽語音V的音頻信號(即,產生指示口聲(vocal sound)的音頻信號,所述口聲是根據從導覽語音V的發(fā)音內容到第二語言的翻譯導出的字符串的發(fā)音聲)。
修改模式4
在圖13的示例中示出的模式4中,信息管理系統(tǒng)14的音頻信號獲取器22從信號供應裝置200獲取導覽語音V的音頻信號SG。信號供應裝置200可以為接收其附近聲音并產生音頻信號SG的聲音接收裝置;或者其可以為從便攜式存儲介質或內置存儲介質獲取音頻信號SG并輸出該信號的再現裝置;或者其可以為從通信網絡18接收音頻信號SG并輸出該信號的通信裝置。相關信息獲取器24獲取管理員指定的指定字符串ST作為相關信息Q,如在上述模式1或模式2中那樣。因此,聲音發(fā)射裝置166發(fā)射與信號供應裝置200所產生的音頻信號SG相對應的導覽語音V,并且在終端裝置12上顯示符合來自管理員的指令的指定字符串ST。相關信息獲取器24可以從聲音供應裝置200獲取音頻信號(例如,第二語言的導覽語音V的音頻信號)作為相關信息Q。
在該模式中,可以理解,信息產生處理(圖6)的步驟SA1包括:從信號供應裝置200獲取導覽語音V的音頻信號SG;以及獲取所指定的指定字符串ST(即,獲取表示導覽語音V的發(fā)音內容的字符串)作為相關信息Q。
修改模式5
在圖14的示例中所示的模式5中,信息管理系統(tǒng)14的音頻信號獲取器22以與第一實施例中采用的方式類似的方式,根據指定字符串ST、通過語音合成來產生導覽語音V的音頻信號SG。相關信息獲取器24獲取與導覽語音V有關的圖像IMG(靜態(tài)或動態(tài))作為相關信息Q。因此,并行于與指定字符串ST對應的第一語言導覽語音V的再現,在終端裝置12上與顯示導覽語音V有關的圖像IMG。在該模式中,因為獲取與導覽語音V有關的圖像IMG作為相關信息Q,因此具有無需在終端裝置12中預先存儲圖像IMG的優(yōu)點。當在終端裝置12中存儲具有大的數據大小的圖像數據時,占用了終端裝置12的大量存儲容量。根據本模式,可以極大地減小終端裝置12存儲與導覽語音V有關的圖像IMG所需的存儲容量。
在該模式中,可以理解,信息產生處理(圖6)的步驟SA1包括:通過語音合成產生與指定字符串ST對應的導覽語音V的音頻信號SG;以及獲取與導覽語音V有關的圖像IMG作為相關信息Q。
修改模式6
在圖15的示例中示出的模式6中,與圖13中示出的模式(模式4)類似,信息管理系統(tǒng)14的音頻信號獲取器22從信號供應裝置200獲取導覽語音V的音頻信號SG。相關信息獲取器24通過對從信號供應裝置200提供的音頻信號SG進行語音識別來產生表示導覽語音V的發(fā)音內容的字符串作為相關信息Q。對于對音頻信號SG進行的語音識別,可以使用任何公知技術,比如利用諸如HMM之類的音頻模型或表示語言約束的語言模型的識別技術。從上述描述中將理解,在模式6中,并行于通過聲音發(fā)射系統(tǒng)16進行的導覽語音V的再現,在終端裝置12上顯示導覽語音V的發(fā)音內容的字符串,如上述模式1(圖10)中那樣。因此,獲得了這樣的優(yōu)點:即使在用戶使用未配備有單獨獲取和存儲表示導覽語音V的發(fā)音內容的字符串的裝置的終端裝置12時、在錯過所發(fā)射的導覽語音V時或者在用戶具有收聽導覽語音V的困難(即,弱聽力人士)的情況下,用戶也能夠查看導覽語音V的內容。終端裝置12用于存儲表示導覽語音V的發(fā)音內容的字符串所需的存儲容量減小。信息管理系統(tǒng)14的相關信息獲取器24根據從信號供應裝置200供應的指示導覽語音V的音頻信號SG、通過語音識別來產生表示導覽語音V的發(fā)音內容的字符串。因此,獲得了這樣的優(yōu)點:信息管理系統(tǒng)14無需管理員來單獨指定這些字符串作為指定字符串ST。
在該模式中,可以理解,信息產生處理(圖6)的步驟SA1包括:獲取導覽語音V的音頻信號SG,該音頻信號SG供應自信號供應裝置200;以及通過對供應自信號供應裝置200的音頻信號SG進行語音識別來產生表示導覽語音V的發(fā)音內容的字符串作為相關信息Q。
修改模式7
在圖16的示例中示出的模式7中,信息管理系統(tǒng)14的音頻信號獲取器22以與模式6中采用的方式類似的方式,從信號供應裝置200獲取第一語言的導覽語音V的音頻信號SG。與模式6一樣,相關信息獲取器24通過對音頻信號SG進行語音識別產生導覽語音V的字符串,并且通過對該字符串進行機器翻譯來產生第二語言的表示導覽語音V的翻譯的字符串CT作為相關信息Q??梢允褂萌魏喂夹g來進行機器翻譯。換言之,在模式7中,并行于通過聲音發(fā)射系統(tǒng)進行的第一語言的導覽語音V的再現,在終端裝置12上顯示翻譯的字符串CT,其展示了導覽語音V的第二語言翻譯。因此,無需管理員在信息管理系統(tǒng)14中單獨指定該字符串作為指定字符串CT,此外,通過對表示導覽語音V的發(fā)音內容的字符串進行機器翻譯來產生相關信息Q。因此,獲得了這樣的優(yōu)點:無需預先準備與導覽語音V的語言不同的語言的相關信息Q。
在該模式中,可以理解,信息產生處理(圖6)的步驟SA1包括:獲取導覽語音V的音頻信號SG,音頻信號SG供應自信號供應裝置200;通過對供應自信號供應裝置200的音頻信號SG進行語音識別來產生表示導覽語音V的發(fā)音內容的字符串;以及通過對所產生的字符串進行機器翻譯來產生表示導覽語音V的翻譯的相關信息Q(即,產生根據從導覽語音V的發(fā)音內容到第二語言的翻譯導出的字符串作為相關信息Q)。
如圖17的示例中所示,可以根據通過機器翻譯產生的翻譯的字符串CT、通過語音合成來產生第二語言導覽語音V的音頻信號作為相關信息Q。并行于導覽語音V的發(fā)射,在終端裝置12上再現第二語言導覽語音V,第二語言不同于作為導覽語音V的原始語言的第一語言。因此,獲得了這樣的優(yōu)點:即使在終端裝置12的用戶無法理解第一語言的導覽語音V時,用戶通過聆聽第二語言的導覽語音V也能夠理解再現內容。
在這種情況下,可以理解,圖6的步驟SA1包括:獲取導覽語音V的音頻信號SG,音頻信號SG供應自信號供應裝置200;通過對供應自信號供應裝置200的音頻信號SG進行語音識別來產生表示導覽語音V的發(fā)音內容的字符串;通過對所產生的字符串進行機器翻譯來產生表示導覽語音V的翻譯的翻譯的字符串CT;以及通過語音合成產生表示作為翻譯的字符串CT的發(fā)音聲的口聲的音頻信號。
在一個構造(即,圖18所示的示例構造)中,當在顯示裝置148上查看通過對音頻信號SG進行語音識別而產生的第一語言字符串之后,管理員OP通過適當地操作輸入裝置146給出與導覽語音V的書面的第二語言翻譯有關的指令(即,示出由管理員OP他自己/她自己進行的翻譯的字符串),相關信息獲取器24獲取管理員指定的第二語言的翻譯的字符串CT作為相關信息Q。在該模式中,相關信息獲取器24獲取表示管理員OP執(zhí)行對第一語言字符串的人工翻譯的結果的翻譯的字符串CT作為相關信息Q。因此,與通過機器翻譯產生翻譯的字符串CT的情況相比,可以獲取導覽語音V的書面的第二語言翻譯,該翻譯具有更高的質量。
在該情況下,可以理解,圖6中的步驟SA1包括:獲取導覽語音V的音頻信號SG,音頻信號SG供應自信號供應裝置200;以及獲取表示導覽語音V的翻譯的字符串作為相關信息Q,該字符串通過在輸入裝置146上針對表示導覽語音V的發(fā)音內容的字符串執(zhí)行操作而指定,并且該字符串通過對供應自信號供應裝置200的音頻信號進行語音識別而產生(即,獲取根據從導覽語音V的發(fā)音內容到第二語言的翻譯導出的字符串)。
如圖19的示例中所示,在如圖16的模式7中那樣通過機器翻譯產生第二語言的翻譯的字符串CT顯示在顯示裝置148上之后,相關信息獲取器24可以獲取管理員OP通過操作輸入裝置146對翻譯的字符串CT進行編輯(通常地,修訂)的結果作為相關信息Q。在該模式中,獲取管理員OP對通過機器翻譯產生的第二語言的翻譯的字符串CT進行編輯而產生的內容作為相關信息Q。因此,獲得了這樣的優(yōu)點:與僅通過機器翻譯來產生表示導覽語音V的翻譯的字符串的模式相比,可以獲取更高質量的書面翻譯。還具有這樣的優(yōu)點:與獲取通過僅人工翻譯的書面翻譯的情況相比,可以減少管理員OP所需的工作量并且可以更快地獲取相關信息Q。
在該情況下,可以理解,圖6中的步驟SA1包括:獲取導覽語音V的音頻信號SG,音頻信號SG供應自信號供應裝置200;產生表示導覽語音V的發(fā)音內容的字符串,該導覽語音V的發(fā)音內容通過對供應自信號供應裝置200的音頻信號SG進行語音識別而產生;通過對所產生的字符串進行機器翻譯來產生表示導覽語音V的翻譯的翻譯的字符串CT;以及獲取表示導覽語音V的翻譯的字符串作為相關信息Q,該字符串已經通過對輸入裝置146進行操作而被編輯(即,獲取根據從導覽語音V的發(fā)音內容到第二語言的翻譯導出的字符串)。
因此,根據從導覽語音V的發(fā)音內容到第二語言的翻譯導出的字符串被理解為包括例如:所指定的翻譯的字符串CT(模式2(圖11));通過機器翻譯產生的翻譯的字符串CT(模式3(圖12、圖16和圖17));通過人工翻譯產生的翻譯的字符串(模式7(圖18));以及對通過機器翻譯產生的翻譯的字符串CT進行編輯而產生的字符串,所述編輯通過對輸入裝置146執(zhí)行操作來進行(模式7(圖19))。
修改模式8
在圖20的示例中所示的模式8中,信息管理系統(tǒng)14的相關信息獲取器24通過對音頻信號SG進行自動內容識別(ACR)來獲取與音頻信號SG有關的內容或內容信息(例如,內容的名稱)作為相關信息Q??梢噪S意使用任何適當技術來進行自動內容識別。例如,相關信息獲取器24分析音頻信號SG的特征(例如,MFCC、基頻等),并且從預先準備的內容中搜索和獲取與音頻信號SG的特征相對應的內容作為相關信息Q。對音頻信號SG的特征進行分析和核對的指紋技術或將信息嵌入音頻信號SG的可聽頻帶或非可聽頻帶中的水印技術可以應用至圖20中的自動內容識別。在該模式中,由于使用自動內容識別來獲取相關信息Q,因此通過簡單構造,終端裝置12的用戶可以被導向與導覽語音V有關的各種信息(例如,與從導覽語音V衍生的服務有關的信息)。
在該模式的信息產生處理(圖6)中,步驟SA1被理解為包括:獲取導覽語音V的音頻信號SG,音頻信號SG供應自信號供應裝置200;以及獲取與供應自信號供應裝置200的音頻信號SG有關的內容作為相關信息Q。
相關信息獲取器24可以選擇性地執(zhí)行語音識別和自動內容識別以獲取相關信息Q(圖21)。例如,根據音頻信號SG所表示的導覽語音V的類型來選擇語音識別或自動內容識別。具體地,當音頻信號SG的聲音是人類發(fā)出的口聲(語音)時,相關信息獲取器24通過對音頻信號SG進行語音識別來產生相關信息Q。當音頻信號SG的聲音是音樂(例如,歌聲、演奏樂器的聲音等)時,相關信息獲取器24通過對音頻信號SG進行自動內容識別來獲取相關信息Q。相關信息獲取器24可以同時使用語音識別和自動內容識別(圖22)。例如,設想這樣一種構造:相關信息獲取器24通過對根據對音頻信號SG的語音識別產生的字符串進行自動內容識別來獲取相關信息Q;或者,相關信息獲取器24獲取對自動內容識別所識別的內容進行語音識別而產生的字符串作為相關信息Q。
在模式6至模式8中,在使用聲音接收裝置(其接收從聲源(例如,揚聲器)發(fā)射的導覽語音V以產生音頻信號SG)或通信裝置(其從通信網絡18接收通過聲音接收裝置產生的音頻信號SG)作為信號供應裝置200的構造中,可以與聲源發(fā)射導覽語音V并行地且與聲音發(fā)射系統(tǒng)16再現導覽語音V并行地向終端裝置12實時地提供相關信息Q。在模式6至模式8中,假設了從信號供應裝置200供應音頻信號SG。但是,可以通過各種語音合成技術中的任一技術來產生導覽語音V的音頻信號SG,并且可以通過對這些音頻信號SG進行語音識別來產生相關信息Q。
其他修改
音頻信號獲取器22獲取音頻信號SG的方式以及相關信息獲取器24獲取相關信息Q的方式不限于上述示例。例如,通過對第一語言的指定字符串ST進行機器翻譯,相關信息獲取器24可以產生第二語言的翻譯的字符串CT作為相關信息Q。通過根據機器翻譯所產生的翻譯的字符串CT進行語音合成,音頻信號獲取器22可以產生第二語言的導覽語音V的音頻信號SG。
如從上述示例中將理解的,音頻信號獲取器22被理解為獲取導覽語音V的音頻信號SG的元件。音頻信號獲取器22的構思包括:通過音頻處理(比如語音合成)產生音頻信號SG的元件,以及從外部裝置(比如圖13中的信號供應裝置200)獲取音頻信號SG的元件。類似地,相關信息獲取器24被理解為獲取與導覽語音V有關的相關信息Q的元件。相關信息獲取器24的構思包括:通過信息處理(比如語音識別、機器翻譯、或語音合成、或這些處理中的至少兩項的組合)產生相關信息Q的元件;從外部裝置獲取相關信息Q(比如字符串(指定字符串ST或翻譯的字符串CT)或與導覽語音V有關的圖像)的元件;或者這兩種元件的組合。
第二實施例
現在將如下描述本發(fā)明的第二實施例。在以下作為示例描述的模式的每一個中,對于其操作或功能類似于第一實施例的那些元件的元件,使用與第一實施例中相同的參考標記,并且視情況省略其詳細描述。
圖23是描述第二實施例中的信息管理系統(tǒng)14的信號處理器32中的產生音頻信號S的處理的示圖。如圖23的示例中所示,沿時間軸具有不同位置的各部分T(下文稱作“再現部分”)被分配給音頻信號獲取器22所獲取的導覽語音V的音頻信號SG。具體地,根據導覽語音V的內容(其目的或目標)將音頻信號SG劃分為各再現部分T(T1、T2等)。例如,當導覽語音V包括具有要對其提供導覽的不同目標的場景時,根據場景將音頻信號SG劃分為各再現部分T。通常根據管理員對輸入裝置146執(zhí)行的操作來指定再現部分T的起點和終點(相鄰的再現部分T之間的邊界)。替代性地或額外地,音頻信號S中的靜音部分可以用作對再現部分T進行限定的邊界??梢噪S意設置沿時間軸的相鄰部分之間的間隔。雖然在圖23中為了描述目的各再現部分T的時間長度相等,但是各再現部分T的時間長度可以彼此不同。
第二實施例的識別信息設置器26將不同的多條識別信息D(D1、D2等)分配給音頻信號SG的各再現部分T。信號處理器32將識別信息設置器26分配的不同的多條識別信息D添加至音頻信號SG的各再現部分T。換言之,如圖23的示例中所示,信號處理器32通過重復地向音頻信號SG的每個再現部分T添加識別信息設置器26已分配給該再現部分T的那條識別信息D的調制的信號SD來產生音頻信號S。即,在導覽語音V的再現部分T的多個時間點處,該再現部分T的一條識別信息D的聲音分量被重復地混合。與第一實施例一樣,通過信號處理器32產生的音頻信號S被傳輸至聲音發(fā)射系統(tǒng)16。
第二實施例的相關信息獲取器24針對音頻信號SG的每個再現部分T獲取一條相關信息Q。例如,相關信息獲取器24通過根據導覽語音V的再現部分T對指定字符串ST進行劃分并且針對每個再現部分T執(zhí)行機器翻譯,來針對每個再現部分產生表示第二語言的翻譯的字符串CT的一條相關信息Q。關聯管理器34針對導覽語音V的每個再現部分T將識別信息設置器26分配的一條識別信息D與相關信息獲取器24獲取的那條相關信息Q相關聯。即,關聯管理器34將識別信息設置器26針對每個再現部分T分配的一條識別信息D與相關信息獲取器24針對該再現部分T獲取的一條相關信息Q相關聯,并將它們存儲在存儲裝置144中。
與第一實施例一樣,聲音發(fā)射系統(tǒng)16的聲音發(fā)射裝置166發(fā)射與從信息管理系統(tǒng)14傳輸的音頻信號S相對應的聲音。并行于與音頻信號SG對應的導覽語音V的再現,重復地發(fā)射針對音頻信號SG的每個再現部分T的一條識別信息D的聲音,各再現部分T之間的各條識別信息D彼此不同。因此,每當導覽語音V的再現點從一個再現部分T改變?yōu)橄乱辉佻F部分T時,就改變向終端裝置12通知的那條識別信息D。終端裝置12的信息提取器51從接收的音頻信號X中順序地提取導覽語音V的各再現部分T的各條識別信息D。對于(針對每個再現部分T的)一條相關信息D的每次提取,通過發(fā)射器542發(fā)射指定該條相關信息D的信息請求R,并通過獲取器544獲取與信息請求R相對應的一條相關信息Q。因此,輸出裝置58輸出的各條相關信息Q隨著導覽語音V的再現進程而順序地改變。具體地,在導覽語音V的一個再現部分T已經開始之后(在從一個再現部分T過渡到下一個再現部分T之后),通過輸出裝置58輸出的內容(一條相關信息Q)改變。
第二實施例實現了與第一實施例的有利效果相類似的有利效果。在第二實施例中,對于作為導覽語音V的時間軸分開部分的各再現部分T的每一個,分配一條識別信息D并且該條識別信息D與相應一條相關信息Q彼此關聯。因此,可以結合導覽語音V的再現進程改變呈現給終端裝置12的用戶的相關信息Q。
第三實施例
圖24是描述本發(fā)明的第三實施例中的操作的示圖。如圖24的示例中所示,第三實施例的信息管理系統(tǒng)14的存儲裝置144針對音頻信號SG所表示的導覽語音V的每條識別信息D存儲多(N)條相關信息Q(Q1、Q2等)。具體地,N條相關信息Q均與導覽語音V的一條識別信息D相關聯并且對N條相關信息Q進行存儲,該N條相關信息Q以除第一語言外的不同語言表示各自均表示最初為第一語言的導覽語音V的字符串的發(fā)音聲的口聲。準備不同語言的N條相關信息Q的方式可以隨意選擇。比如,如上參照的圖12的示例中那樣,可以首先通過對第一語言的指定字符串ST進行機器翻譯來產生不同語言的N條翻譯的字符串CT。利用根據所產生的翻譯的字符串CT的語音合成,隨后可以產生N種語言的表示導覽語音V的N條相關信息Q。替代性地,如上參照的圖17的示例中那樣,可以通過對導覽語音V的音頻信號SG進行語音識別來產生導覽語音V的字符串,音頻信號SG從信號供應裝置200提供。隨后,通過對所產生的字符串進行機器翻譯,可以產生不同語言的N條翻譯的字符串CT。利用根據所產生的翻譯的字符串CT的語音合成,隨后可以產生N種語言的表示導覽語音V的N條相關信息Q
在信息提取器51從接收的音頻信號X(其根據通過聲音發(fā)射系統(tǒng)16發(fā)射并隨后被接收的聲音導出)中提取了識別信息D之后,終端裝置12的發(fā)射器542向信息管理系統(tǒng)14發(fā)送包括識別信息D和語言信息L的信息請求R(SB3)。語言信息L是指定終端裝置12中使用的語言的信息。可以隨意選擇獲取語言信息L的方式。例如,可以使用發(fā)射器542通過參照終端裝置12的操作系統(tǒng)(OS)中的語言設定來產生語言信息L的構造。在這種情況下,獲得了用戶無需指定語言的優(yōu)點。替代性地,可以使用產生表示終端裝置12的用戶按照他/她的意愿指定的語言的語言信息L的構造。
在從終端裝置12接收到信息請求R之后,信息管理系統(tǒng)14的信息提供器36從各自與信息請求R中指定的一條識別信息D相關聯并且存儲在存儲裝置144中的N條相關信息Q中,選擇信息請求R中指定的語言信息L所指示的語言的一條相關信息Q(SB4),并且將該條相關信息Q發(fā)送至請求源終端裝置12(SB5)。終端裝置12的獲取器544獲取信息管理系統(tǒng)14所發(fā)送的該條相關信息Q(SB6),并且輸出裝置58(聲音發(fā)射裝置166)發(fā)射該條相關信息Q所指示的導覽語音V以呈現給用戶(SB7)。從以上描述中可以理解,并行于第一語言的導覽語音V的再現,從終端裝置12的輸出裝置58輸出語言信息L所指定的語言的導覽語音V,指定的語言為N種語言之一且不同于第一語言。因此,例如,與在導覽語音V的再現之后輸出相關信息Q的構造相比,獲得了用戶易于辨別導覽語音V與相關信息Q之間的關聯性的優(yōu)點。
第三實施例實現了與第一實施例的那些有利效果相類似的有利效果。此外,在第三實施例中,由于將不同語言的N條相關信息Q中的一條選擇性地提供給終端裝置12,獲得了可以向使用他們各自語言的各種用戶中的每一個提供該用戶可理解的語言的一條相關信息Q的優(yōu)點。在以上描述中,給出了各條相關信息Q表示不同語言的語音的示例。替代性地,可以使用各條相關信息Q表示字符串(翻譯的字符串CT)(其因而表示不同語言的導覽語音V)的構造。在這種情況下,可以隨意選擇產生各條相關信息Q的方式。如圖16中示出的示例中那樣,可以通過對第一語言的字符串進行機器翻譯產生N種不同語言的N條翻譯的字符串作為N條相關信息Q,所述字符串通過對供應自信號供應裝置的導覽語音V的音頻信號SG進行語音識別而產生。在相關信息Q表示字符串的構造中,終端裝置12的輸出裝置58(顯示裝置)顯示該字符串,從而將相關信息Q呈現給用戶。在這種情況下,不同于圖16中的示例所示的產生方法,可以使用圖11(用于獲取輸入的翻譯的字符串CT的構造)、圖18(用于獲取指示通過管理員OP他自己/她自己執(zhí)行的翻譯的字符串的構造)、或圖19(用于獲取根據管理員OP編輯機器翻譯所產生的翻譯的字符串CT而產生的字符串的構造)中所示的產生(獲取)方法。第二實施例的構造可以應用至第三實施例。
修改例
以上作為示例給出的模式中的每一個可以用各種方式進行修改。下面描述一些示例修改例??梢砸暻闆r組合從以下示例中隨意選擇的至少兩種模式,只要它們彼此不會沖突即可。
(1)在上述模式中,示出了一種構造的示例,其中每當接收一條識別信息D的聲音時(每當用戶移動到展覽品附近時),終端裝置12就獲取與該條識別信息D相對應的一條相關信息Q。替代性地,關聯管理器34可以將與展覽設施M中的不同展覽品對應的多條相關信息Q與僅一條識別信息D相關聯,并且當終端裝置12接收到從聲音發(fā)射系統(tǒng)16的聲音發(fā)射裝置166發(fā)射的該條識別信息D的聲音時,終端裝置12可以從信息提供器36統(tǒng)一地獲取與該條識別信息D相對應的所述多條相關信息Q。例如,當終端裝置12的用戶進入特定展覽設施M時或者當用戶在展覽設施M中首次獲取到一條識別信息D時,終端裝置12可以統(tǒng)一地獲取與展覽設施M中的各展覽品有關的多條相關信息Q。
在專利文獻1和2的技術中,選擇性地再現在用戶攜帶的終端裝置(專利文獻1中的再現單元或專利文獻2中的便攜式收發(fā)裝置)中預先存儲的多條相關信息。因此,存在這樣的問題:當需要更新信息時,需要在每個終端裝置中分別更新信息。在根據修改例的當前模式的構造中,向終端裝置12提供信息管理系統(tǒng)14的存儲裝置144中存儲的相關信息Q。因此,通過更新存儲在存儲裝置144中的相關信息Q,可以將更新后的相關信息Q提供給每個終端裝置12。因此,獲得了無需針對每個終端裝置12分別更新相關信息Q的優(yōu)點。
(2)相關信息Q的內容不限于上述模式中示出的示例。例如,信息提供器36可以向終端裝置12提供聲音、圖像和字符串(它們被示出為上述模式中的相關信息Q的示例)之中的至少兩者的組合,作為相關信息Q。替代性地或額外地,例如,信息提供器36可以向終端裝置12提供指示與導覽語音V有關的信息(例如,上述示例中示出的相關信息Q)的位置的鏈接信息(例如,URL),作為相關信息Q。
(3)在第二實施例中,如參照圖23描述的那樣,示出了其中與導覽語音V的不同再現部分T相對應的多條識別信息D(D1、D2、D3等)中的每一條在相應再現部分T中重復地多次發(fā)送至終端裝置12的示例構造。在該構造中,例如,在終端裝置12獲取到在接近再現部分T1的結尾的點處發(fā)送的識別信息D1和在接近下一再現部分T1的開頭的點處發(fā)送的識別信息D2的情況下,存在終端裝置12將在與識別信息D1對應的相關信息Q被再現的中途獲取到與識別信息D2對應的相關信息Q的可能性。在這種情形下,優(yōu)選的是,終端裝置12中途(獲取到與識別信息D2對應的相關信息Q的點處)停止再現與識別信息D1對應的相關信息Q,并且隨后開始再現與識別信息D2對應的相關信息Q。替代性地,可以僅在相應再現部分T的開頭(即,上半段)期間向終端裝置12發(fā)送各條識別信息D,以使得在與不同的各條識別信息D對應的多條相關信息Q之間,通過終端裝置12進行的所述多條相關信息Q的再現的時間段不會彼此重疊。
在如上述示例中那樣終端裝置12在再現與識別信息D1對應的相關信息Q的中途獲取到識別信息D2的相關信息Q的情況下,可以使用這樣的構造:終端裝置12在完成識別信息D1的相關信息Q的再現之后開始再現識別信息D2的相關信息Q。替代性地,在終端裝置12在再現與識別信息D1對應的相關信息Q的中途獲取到識別信息D2的相關信息Q的情況下,用戶所執(zhí)行的操作可以作為觸發(fā)器以使得終端裝置12開始再現識別信息D2的相關信息Q,從而使得識別信息D1的相關信息的再現在中途停止。例如,在獲取到與識別信息D2對應的相關信息Q之后顯示“下一個”按鈕,并且在用戶操作該按鈕之后,終端裝置12開始再現識別信息D2的相關信息Q。
(4)可以隨意選擇輸出(例如,顯示)相關信息Q的方式。例如,在終端裝置12包括例如獲取圖像(靜態(tài)和/或動態(tài))的圖像獲取裝置(圖中未示出)的構造中,可以對圖像獲取裝置獲取的圖像和相關信息Q所指示的圖像(例如,靜態(tài)圖像、動態(tài)圖像、字符串等)進行合成并將其顯示在輸出裝置58的顯示裝置上。
例如,如圖25所示,設想了這樣的情況:在諸如博物館之類的展覽設施M中展示機器人300作為展覽品,機器人300帶有發(fā)射各種用于再現的聲音(比如導覽語音)的聲音發(fā)射功能。信息管理系統(tǒng)14的存儲裝置144存儲音頻信號S,該音頻信號S包括用于再現的聲音的音頻信號SG和識別信息D的調制的信號SD。表示用于再現的聲音的發(fā)音內容的字符串形式的相關信息Q與識別信息D相關聯并且存儲在存儲裝置144中。如圖25的示例中所示,終端裝置12的控制裝置50實時地使通過圖像獲取裝置獲取的機器人300的圖像G(通常為動態(tài)圖像)與作為供應自信息管理系統(tǒng)14的相關信息Q的字符串一起顯示(覆蓋顯示)在輸出裝置58的顯示裝置上。
在相關信息Q單獨顯示在顯示裝置上的構造中,用戶將需要在顯示裝置上顯示的圖像(相關信息Q)與作為實際展覽品的機器人300之間頻繁切換他/她的關注點。在參照圖25描述的構造中,在單個顯示畫面上一起顯示圖像G和相關信息Q。因此,具有用戶無需在顯示裝置與機器人300之間頻繁切換他/她的關注點的優(yōu)點。尤其是,在連同圖像G顯示用于再現的聲音的字符串的構造中,例如,可以實現弱聽力人士能夠容易地查看機器人300的移動和用于再現的聲音的內容的額外優(yōu)點。
(5)在上述模式中,信息提供系統(tǒng)10被用作展覽設施M中的導覽。使用信息提供系統(tǒng)10的情形不限于上述示例。例如,可以使用信息提供系統(tǒng)10來提供交通系統(tǒng)(比如火車或公交車)中的語音導覽。具體地,比如火車或者公交車之類的車輛配備有聲音發(fā)射系統(tǒng)16,并且通過信息管理系統(tǒng)14產生音頻信號S并隨后傳輸至聲音發(fā)射系統(tǒng)16,音頻信號S根據導覽語音V(其提供關于車輛??奎c(比如火車站或公交站)的導覽)的音頻信號SG產生,并且添加有識別信息D。當車輛移動到??奎c附近時,與該停靠點對應的音頻信號S被提供給聲音發(fā)射系統(tǒng)16的聲音發(fā)射裝置166,從而將對車輛到達停靠點進行播報的導覽語音V連同識別信息D一起發(fā)射。車輛中的終端裝置12從輸出裝置58輸出相關信息Q,響應于包括識別信息D的信息請求R而從信息管理系統(tǒng)14提供相關信息Q??梢詼蕚錇橄嚓P信息Q的信息的示例包括:表示最初是第一語言的導覽語音V的第二語言翻譯的語音,如上述模式中描述的那樣;以及指示與??奎c周圍的關注區(qū)域有關的旅游信息的語音或圖像(靜態(tài)或動態(tài))。
(6)上述模式提供了這樣的示例構造:各自包括用于再現的聲音的音頻信號SG和一條識別信息D的調制的信號SD的各音頻信號S以及針對每條識別信息D的一條相應相關信息Q被存儲在存儲裝置144中。在該構造中,均對應于共同導覽語音V的音頻信號S和相關信息Q通過對應的識別信息D彼此關聯。可以視情況采用將音頻信號SG與相關信息Q彼此關聯的具體方法。例如,可以設想這樣的構造,其中針對相關信息Q的提供,將指定了位置和時間或者位置的范圍和時間的范圍的輔助信息與該相關信息Q相關聯,并存儲在存儲裝置144中。輔助信息可以指定例如要再現相應音頻信號SG的位置和時間。終端裝置12向信息管理系統(tǒng)14發(fā)送包括時間和位置檢測裝置(比如全球定位系統(tǒng)(GPS))檢測到的終端裝置12的位置信息的信息請求R。信息管理系統(tǒng)14的信息提供器36從存儲在存儲裝置144中的多條相關信息Q中選擇與分別接近信息請求R中指定的時間和位置信息的時間和位置中的每一個相對應的一條相關信息Q(SB4),并且隨后將該條所選的相關信息Q發(fā)送至請求源終端裝置12(SB5)。在該構造中,在無需識別信息D的情況下,可以如上述模式中那樣向終端裝置12提供與音頻信號SG對應的相關信息Q。
(7)在上述模式中,從聲音發(fā)射裝置166中發(fā)射包括導覽語音V的音頻信號SG和識別信息D的調制的信號SD的音頻信號S的聲音。一旦發(fā)射導覽語音V就向終端裝置12通知識別信息D的方式不限于上述示例。例如,可以根據從導覽語音V的接收的聲音導出的接收的音頻信號X的特征(實質上音頻信號SG的特征)來對識別信息D進行識別。更具體地,如圖26中示出的示例那樣,將匹配器15添加至與上述模式中的信息提供系統(tǒng)類似的信息提供系統(tǒng)10。例如,通過能夠經由通信網絡18與終端裝置12進行通信的服務器來實現匹配器15。匹配器15具有搜索表TBL,在該搜索表TBL中各條辨識信息W(W1、W2等)(其表示從聲音發(fā)射系統(tǒng)16的聲音發(fā)射裝置166發(fā)射的導覽語音V的音頻信號SG的特征)與導覽語音V的各條識別信息D(D1、D2等)彼此相關聯。
在圖26示出的構造中,聲音發(fā)射系統(tǒng)16的聲音發(fā)射裝置166發(fā)射由音頻信號SG表示的導覽語音V,但是不發(fā)射識別信息D的聲音分量。終端裝置12的控制裝置50將導覽語音V的接收的音頻信號X存儲在存儲裝置52中,接收的音頻信號X根據聲音接收裝置56所接收的聲音導出,在特定長度時間(例如,幾秒)之后,通信裝置54的發(fā)射器542將接收的音頻信號X發(fā)送至匹配器15。即,終端裝置12參照匹配器15來尋求聲音接收裝置56所接收的導覽語音V的識別信息D。
匹配器15分析經由通信網絡18從終端裝置12接收到的接收的音頻信號X的特征,并從搜索表TBL搜索具有與所分析的特征類似或匹配的特征的一條辨識信息W??梢噪S意選擇對辨識信息W進行搜索的方式。例如,優(yōu)選使用自動內容識別技術。匹配器15獲取與從搜索表TBL搜索到的一條辨識信息W對應的一條識別信息D,并且將獲取到的信息發(fā)送至終端裝置12。因此,從聲音發(fā)射裝置166發(fā)射的導覽語音V的識別信息D被通知給終端裝置12。終端裝置12從信息管理系統(tǒng)14獲取與從匹配器15通知的該條識別信息D對應的一條相關信息Q的操作類似于上述模式中描述的方式。
雖然以上描述中給出表示音頻信號SG的特征的辨識信息W作為示例,但是辨識信息W的內容可以視情況改變。例如,可以將音頻信號SG自身(例如,波形數據)記錄在搜索表TBL中作為一條辨識信息W。匹配器15從搜索表TBL搜索具有與接收自終端裝置12的接收的音頻信號X類似或匹配的波形的一條辨識信息W。匹配器15可以包括在信息管理系統(tǒng)14中或終端裝置12中。
在上述模式的與導覽語音V的發(fā)射并行地通過聲音通信向終端裝置12通知識別信息D的構造中,需要提供能夠再現調制的信號SD(包括識別信息D在內)的頻帶(例如,18kHz或更高且20kHz或更低)的聲音發(fā)射裝置166。在圖26示出的構造中,存在這樣的優(yōu)點:不論聲音發(fā)射裝置166可再現的頻帶如何,都可以向終端裝置12通知識別信息D。因此,圖26的構造優(yōu)選用于使用無法再現高音高的可聽頻帶的常規(guī)聲音發(fā)射裝置166的情形。在通過聲音通信向終端裝置12通知識別信息D的構造中,存在這樣的優(yōu)點:終端裝置12無需向匹配器15發(fā)送接收的音頻信號X,從而減小了通信量,并且無需使用利用接收的音頻信號X搜索識別信息D的匹配器15。
(8)可以通過使用單獨裝置或通過物理地彼此分開的多個裝置(服務器)來形成上述模式中描述的信息管理系統(tǒng)14。例如,可以采用將上述模式中的信息管理系統(tǒng)14分布于包括識別信息設置器26的第一服務器和包括不同于識別信息設置器26的元件的第二服務器的構造,第一服務器和第二服務器經由例如通信網絡18來彼此進行通信。從以上描述中將顯而易見的是,本發(fā)明的信息提供系統(tǒng)10涵蓋單獨裝置和裝置的集合這兩者。此外,可以由單個裝置形成包括信息管理系統(tǒng)14和聲音發(fā)射系統(tǒng)16的整個信息提供系統(tǒng)10。
(9)雖然在上述模式中用于提供展覽設施M中的導覽的導覽語音V的再現被示出為示例,但是聲音發(fā)射系統(tǒng)16的聲音發(fā)射裝置166可以發(fā)射的聲音的類型不限于導覽語音V。例如,上述模式可以用于再現各種聲音,比如音樂。從以上描述中還將顯而易見的是,上述模式中的音頻信號SG可以統(tǒng)一地表示為指示待再現的聲音(用于再現的聲音)的信號。
(10)在上述模式中,示出了這樣的構造,其中聲音發(fā)射系統(tǒng)16的聲音發(fā)射裝置166發(fā)射與音頻信號S對應的聲音,每個音頻信號S包括表示導覽語音V的音頻信號SG和包括識別信息D的調制的信號SD。但是,可以省略導覽語音V(用于再現的聲音)的再現。具體地,信息管理系統(tǒng)14的信號處理器32可以將包括識別信息設置器26分配的識別信息D的調制的信號SD作為音頻信號S(音頻文件)傳輸至聲音發(fā)射系統(tǒng)16。聲音發(fā)射系統(tǒng)16通過將音頻信號S提供至聲音發(fā)射裝置166來發(fā)射識別信息D的聲音。終端裝置12從接收的音頻信號X(其通過聲音接收裝置56接收從聲音發(fā)射系統(tǒng)16發(fā)射的聲音而產生)中提取識別信息D。隨后,終端裝置12從信息管理系統(tǒng)14的信息提供器36獲取與識別信息D對應的相關信息Q。從以上描述中將顯而易見的是,聲音接收裝置56統(tǒng)一地表示為通過接收根據各音頻信號S(其包括各自包括識別信息D的各調制的信號SD)發(fā)射的聲音來產生接收的音頻信號X的元件。但是,并沒有對音頻信號S是否包括導覽語音V的音頻信號SG進行規(guī)定。
(11)在上述模式中,使用聲音通信來向終端裝置12通知識別信息D。用于向終端裝置12通知識別信息D的通信方案不限于上述示例。例如,利用紅外線或無線電波的無線通信(例如,近場通信)可用于向終端裝置12通知識別信息D。
(12)產生導覽語音的音頻信號SG的方式或產生相關信息Q的方式不限于上述模式中給出的示例(圖3、圖10至圖22)。關于第三實施例,音頻信號獲取器22、相關信息獲取器24、識別信息設置器26、信號處理器32和關聯管理器34均非必要元件,只要信息管理系統(tǒng)14包括信息提供器36和存儲裝置144即可。因此,可以采用其中單獨裝置包括這些元件并且使得存儲裝置144存儲音頻信號S和相關信息Q的構造。
(13)在上述模式中,信息管理系統(tǒng)、聲音發(fā)射系統(tǒng)和終端裝置均可以通過控制裝置及協(xié)作程序或通過使用專用電路來實現。根據本發(fā)明的程序可以以存儲有程序的計算機可讀存儲介質的形式來提供,并且可安裝在計算機中。例如,存儲介質可以為非暫時性存儲介質,其代表示例為光存儲介質(光盤),比如CD-ROM。這種存儲介質的示例還可以包括任何類型的公知存儲介質,比如磁存儲介質或半導體存儲介質。根據本發(fā)明的程序可以通過通信網絡分發(fā)并且可安裝在計算機中。
附圖標記
100…通信系統(tǒng);10…信息提供系統(tǒng);12…終端裝置;14…信息管理系統(tǒng);142…控制裝置;144…存儲裝置;146…輸入裝置;148…顯示裝置;16…聲音發(fā)射系統(tǒng);162…控制裝置;164…存儲裝置;166…聲音發(fā)射裝置;18…通信網絡;22…音頻信號獲取器;24…相關信息獲取器;26…識別信息設置器;32…信號處理器;322…解調處理器;324…混合處理器;34…關聯管理器;36…信息提供器;50…控制裝置;51…信息提取器;52…存儲裝置;54…通信裝置;542…發(fā)射器;544…獲取器;56…聲音接收裝置;58…輸出裝置;200…信號供應裝置。