專利名稱:業(yè)務服務器裝置、業(yè)務提供方法、業(yè)務提供程序的制作方法
技術領域:
本發(fā)明涉及通過通信來提供業(yè)務的業(yè)務服務器裝置、業(yè)務提供方法、業(yè)務提供程序,尤其涉及在電話機的通話中提供通話以外的業(yè)務的業(yè)務服務器裝置、業(yè)務提供方法、業(yè)務提供程序。
背景技術:
目前,將說話者使用任意的語言所說的內(nèi)容自動翻譯為其它語言的翻譯機或翻譯系統(tǒng)已實用化?,F(xiàn)有的翻譯機等包括被稱為單人應用型或見面會話型的翻譯機和被稱為遠程會話型的翻譯機。圖13(a)是例示單人應用的翻譯機的圖。在圖13(a)中,例如,說話者利用日語將“二 Θ本ti P < 6 T +力?”以聲音的方式輸入到翻譯機。于是,通過翻譯機的翻譯功能對 該日語的聲音進行英譯,輸出“How much is this book ”的合成聲音。單人應用的翻譯機可作為日英詞典使用,或者用于在通過使會面中的其它人員聽到合成聲音來將說話者自己的意思傳遞給其它人員。例如非專利文獻I記載了這樣的現(xiàn)有翻譯機。圖13(b)是例示遠程會話型的翻譯機的圖。圖13(b)所示的翻譯機具備電話機的聲音通信功能和翻譯功能。在圖13(b)中,例如,作為說話者的日本人利用母語即日語向翻譯機聲音輸入“3名T予約&御願^ i +”。然后,通過翻譯機的翻譯功能對該日語的聲音進行英譯,輸出“Please make a reservation for 3 people”的合成聲音。遠程會話型的翻譯機可在說話者利用母語進行會話的同時向無法理解其母語的其它人員傳達自己的意思。例如非專利文獻2記載了這樣的現(xiàn)有翻譯機。此外,作為遠程會話型的翻譯機,還包括記載于專利文獻I中的發(fā)明。專利文獻I記載的電話系統(tǒng)統(tǒng)不僅能夠翻譯電話的內(nèi)容并發(fā)送給通話對方,還能夠?qū)⒄f話者的通話聲音發(fā)送給通話對方。因此,專利文獻I記載的發(fā)明能夠給用戶仿佛經(jīng)由口譯與通話對方進行會話的感覺。現(xiàn)有技術文獻專利文獻專利文獻1:日本專利第3741025號公報非專利文獻非專利文獻1:andro nav1、[online] >^iTranslator for Android 20 力國語C対応L·亡高機能翻訳7 7° V ”、[2011年5月13日檢索]、互聯(lián)網(wǎng)<URL:http:// andronav1. com/2010/09/40880>非專利文獻2 iplatform. org、[online]、七力" 7 才 >[2011 年5 月 13 日檢索]、互聯(lián)網(wǎng)〈URL http // www.1platform. org/>
發(fā)明內(nèi)容
發(fā)明所要解決的問題
但是,在所使用的語言相互不同的兩者進行會話的情況下,一般是由口譯者翻譯兩者的語言。無論在采用上述非專利文獻1、非專利文獻2中的哪一個的情況下都無法實現(xiàn)像口譯者翻譯兩者的語言那樣具有如見面對話的現(xiàn)場感的業(yè)務。另外,上述專利文獻I記載的發(fā)明還可以將說話者的通話聲音發(fā)送至通話對方。但是,在專利文獻I記載的發(fā)明中,當把翻譯通話內(nèi)容后的數(shù)據(jù)與說話者的聲音一起發(fā)送時,要啟動專用的應用程序。在這樣的專利文獻I記載的發(fā)明中,為了實施發(fā)明需要開發(fā)新的應用程序,從而具有在此開發(fā)的過程中產(chǎn)生時間或人工、費用成本的問題。本發(fā)明是鑒于以上的問題而完成的,其目的是提供如下這樣的業(yè)務服務器裝置、業(yè)務提供方法、業(yè)務提供程序,即能夠?qū)崿F(xiàn)雖然處于遠程位置但具有見面對話的現(xiàn)場感的業(yè)務,而且不需要開發(fā)新的專用的應用程序。
解決問題的手段為了解決以上的課題,本發(fā)明一方式的業(yè)務服務器裝置(例如圖2所示的業(yè)務服務器裝置200)與利用聲音相互進行聲音通信的多個聲音通信終端裝置(例如圖2所示的去電通信終端裝置241a、來電通信終端裝置241b)連接,提供基于其它任務的業(yè)務,該其它任務是與在該聲音通信終端裝置之間進行的聲音通信所涉及的應用程序不同的應用程序執(zhí)行的作業(yè),其特征在于,該業(yè)務服務器裝置包括指示受理部(例如圖2所示的業(yè)務啟動部250),其受理在聲音通信之間執(zhí)行上述其它任務的指示;錄音部(例如圖2所示的電話/呼叫控制使能器201),其在多個上述聲音通信終端裝置間的聲音通信中對說話者的通話聲音進行錄音;任務執(zhí)行部(例如圖2所示的聲音識別使能器203、文本翻譯使能器204、聲音合成使能器202),其在上述指示受理部受理了上述指示時,根據(jù)上述錄音部所錄的上述通話聲音來執(zhí)行上述其它任務;任務數(shù)據(jù)提供部(例如圖2所示的通信控制部224),其向正在進行聲音通信的多個所述聲音通信終端裝置分別提供任務數(shù)據(jù),該任務數(shù)據(jù)包含通過所述任務執(zhí)行部執(zhí)行所述其它任務而獲得的文本數(shù)據(jù)和通過所述任務執(zhí)行部執(zhí)行所述其它任務而獲得的聲音數(shù)據(jù),所述任務執(zhí)行部將所述通話聲音轉換為文本而生成文本數(shù)據(jù),將該文本數(shù)據(jù)翻譯為其它語言而生成翻譯文本數(shù)據(jù),將該翻譯文本數(shù)據(jù)轉換為聲音而生成聲音數(shù)據(jù),所述任務數(shù)據(jù)提供部將所述文本數(shù)據(jù)、所述翻譯文本數(shù)據(jù)以及所述聲音數(shù)據(jù)與所述通話聲音一起作為所述任務數(shù)據(jù)分別提供給正在進行聲音通信的多個所述聲音通信終端裝置。另外,本發(fā)明一方式的業(yè)務服務器裝置(例如圖10所示的業(yè)務服務器裝置900)與利用聲音相互進行聲音通信的多個聲音通信終端裝置(例如圖10所示的去電通信終端裝置241a、來電通信終端裝置241b)連接,提供基于其它任務的業(yè)務,該其它任務是與在該聲音通信終端裝置之間進行的聲音通信所涉及的應用程序不同的應用程序執(zhí)行的作業(yè),其特征在于,該業(yè)務服務器裝置包括指示受理部(例如圖10所示的業(yè)務啟動部250),其受理在上述聲音通信之間執(zhí)行上述其它任務的指示;錄音部(例如圖10所示的電話/呼叫控制使能器201),其在多個上述聲音通信終端裝置間的通信中對說話者的通話聲音進行錄音;任務執(zhí)行部(例如圖10所示的聲音識別使能器203、信息管理使能器214、圖像影像合成/編輯使能器215),其在所述指示受理部受理了所述指示時,根據(jù)所述錄音部所錄的所述通話聲音執(zhí)行所述其它任務;以及任務數(shù)據(jù)提供部(例如圖10所示的通信控制部224),其向正在進行聲音通信的多個上述聲音通信終端裝置分別提供表示由上述任務執(zhí)行部執(zhí)行上述其它任務的結果的任務數(shù)據(jù),所述任務執(zhí)行部根據(jù)所述通話聲音判定由所述聲音通信終端裝置的用戶作出的指示,按照該指示提取預先登記的信息,使用提取的信息生成包含文本以及圖像中的至少一方的任務數(shù)據(jù),所述任務數(shù)據(jù)提供部將包含所述文本以及所述圖像中的至少一方的所述任務數(shù)據(jù)與所述通話聲音一起分別提供給正在進行聲音通信的多個所述聲音通信終端裝置。另外,本發(fā)明一方式的業(yè)務服務器裝置在上述的發(fā)明中還可以包括訂正指示受理部,其受理發(fā)送到所述聲音通信終端裝置的所述任務數(shù)據(jù)的訂正指示;以及學習部(例如圖2、圖10所示的學習部280),其根據(jù)所述訂正指示受理部受理的訂正指示,對生成所述任務數(shù)據(jù)時使用的數(shù)據(jù)進行加權。另外,本發(fā)明一方式的業(yè)務服務器裝置在上述的發(fā)明中,所述任務執(zhí)行部在判定為由用戶作出的指示是該用戶的日程調(diào)整時,提取預先登記的與所述用戶相關的行動和與進行該行動的日期時刻相關的日程信息,使用所提取的日程信息,提取多個所述聲音通信終端裝置的用戶的沒有登記行動的共同日期時刻。另外,本發(fā)明一方式的業(yè)務服務器裝置在上述的發(fā)明中,所述任務數(shù)據(jù)提供部向文本通信終端裝置發(fā)送所述任務數(shù)據(jù)中的所述文本數(shù)據(jù)而取代所述聲音通信終端裝置,該文本通信終端裝置與該聲音通信終端裝置對應、且能夠進行基于文本的通信。另外,本發(fā)明一方式的業(yè)務提供方法是業(yè)務服務器裝置的業(yè)務提供方法,該業(yè)務服務器裝置與利用聲音相互進行通信的多個聲音通信終端裝置連接,提供基于其它任務的業(yè)務,該其它任務是與在該聲音通信終端裝置之間進行的聲音通信所涉及的應用程序不同的應用程序執(zhí)行的作業(yè),該業(yè)務提供方法的特征在于,包括以下步驟指示受理步驟,受理在聲音通信之間執(zhí)行所述其它任務的指示;錄音步驟,在多個所述聲音通信終端裝置之間的聲音通信中對說話者的通話聲音進行錄音;任務執(zhí)行步驟,在所述指示受理步驟中受理了所述指示的情況下,根據(jù)在所述錄音步驟中所錄的所述通話聲音,將所述通話聲音轉換為文本而生成文本數(shù)據(jù),將該文本數(shù)據(jù)翻譯為其它語言而生成翻譯文本數(shù)據(jù),將該翻譯文本數(shù)據(jù)轉換為聲音而生成聲音數(shù)據(jù);以及任務數(shù)據(jù)提供步驟,將所述文本數(shù)據(jù)、所述翻譯文本數(shù)據(jù)和所述聲音數(shù)據(jù)作為任務數(shù)據(jù)與所述通話聲音一起分別提供給正在進行聲音通信的多個所述聲音通信終端裝置。本發(fā)明一方式的業(yè)務提供方法是業(yè)務服務器裝置的業(yè)務提供方法,該業(yè)務服務器裝置與利用聲音相互進行聲音通信的多個聲音通信終端裝置連接,提供基于其它任務的業(yè)務,該其它任務是與在該聲音通信終端裝置之間進行的聲音通信所涉及的應用程序不同的應用程序執(zhí)行的作業(yè),該業(yè)務提供方法的特征在于,包括以下步驟指示受理步驟,受理在聲音通信之間執(zhí)行所述其它任務的指示;錄音步驟,在多個所述聲音通信終端裝置之間的聲音通信中對說話者的通話聲音進行錄音;任務執(zhí)行步驟,在所述指示受理步驟中受理了所述指示的情況下,根據(jù)在所述錄音步驟中所錄的所述通話聲音判定由所述聲音通信終端裝置的用戶作出的指示,按照該指示提取預先登記的信息,使用所提取的信息來生成包含文本以及圖像中的至少一方的任務數(shù)據(jù);以及任務數(shù)據(jù)提供步驟,將包含文本以及圖像中的至少一方的所述任務數(shù)據(jù)與所述通話聲音一起分別提供給正在進行聲音通信的多個所述聲音通信終端裝置。本發(fā)明一方式的業(yè)務提供程序是在業(yè)務服務器裝置中執(zhí)行的業(yè)務提供程序,該業(yè)務服務器裝置與利用聲音相互進行聲音通信的多個聲音通信終端裝置連接,提供基于其它任務的業(yè)務,該其它任務是與在該聲音通信終端裝置之間進行的聲音通信所涉及的應用程序不同的應用程序執(zhí)行的作業(yè),該業(yè)務提供程序的特征在于,使計算機實現(xiàn)以下功能指示受理功能,受理在聲音通信之間執(zhí)行所述其它任務的指示;錄音功能,在多個所述聲音通信終端裝置之間的聲音通信中對說話者的通話聲音進行錄音;任務執(zhí)行功能,在利用所述指示受理功能受理了所述指示時,根據(jù)在所述錄音功能中所錄的所述通話聲音,對所述通話聲音進行文本轉換而生成文本數(shù)據(jù),將該文本數(shù)據(jù)翻譯為其它語言而生成翻譯文本數(shù)據(jù),將該翻譯文本數(shù)據(jù)轉換為聲音而生成聲音數(shù)據(jù);以及任務數(shù)據(jù)提供功能,將所述文本數(shù)據(jù)、所述翻譯文本數(shù)據(jù)和所述聲音數(shù)據(jù)作為任務數(shù)據(jù)與所述通話聲音一起分別提供給正在進行聲音通信的多個所述聲音通信終端裝置。本發(fā)明一方式的業(yè)務提供程序是在業(yè)務服務器裝置中執(zhí)行的業(yè)務提供程序,該業(yè)務服務器裝置與利用聲音相互進行聲音通信的多個聲音通信終端裝置連接,提供基于其它任務的業(yè)務,該其它任務是與在該聲音通信終端裝置之間進行的聲音通信所涉及的應用程序不同的應用程序執(zhí)行的作業(yè),該業(yè)務提供程序的特征在于,使計算機實現(xiàn)以下功能指示受理功能,受理在聲音通信之間執(zhí)行所述其它任務的指示;錄音功能,在多個所述聲音通信 終端裝置之間的聲音通信中對說話者的通話聲音進行錄音;任務執(zhí)行功能,在利用所述指示受理功能受理了所述指示時,根據(jù)在所述錄音功能中所錄的所述通話聲音判定由所述聲音通信終端裝置的用戶作出的指示,按照該指示提取預先登記的信息,使用所提取的信息生成包含文本以及圖像中的至少一方的任務數(shù)據(jù);以及任務數(shù)據(jù)提供功能,將包含文本以及圖像中的至少一方的所述任務數(shù)據(jù)與所述通話聲音一起分別提供給正在進行聲音通信的多個所述聲音通信終端裝置。發(fā)明的效果根據(jù)上述方式的本發(fā)明,利用與聲音通信所涉及的應用程序不同的應用程序來執(zhí)行任務,所以可使用現(xiàn)有的聲音所涉及的應用程序和執(zhí)行任務的應用程序,將說話者的通話聲音與任務的執(zhí)行結果一起發(fā)送到通話對方。這種方式的本發(fā)明可一邊利用現(xiàn)有的應用程序一邊提供雖然處于遠程位置但仍具有如見面會話的現(xiàn)場感的通話業(yè)務。
圖1是用于說明作為本發(fā)明實施方式I的前提的業(yè)務概要的圖。圖2是示出本發(fā)明實施方式I的業(yè)務服務器裝置的一結構例的框圖。圖3是用于說明圖2所示的學習部的功能框圖。圖4是用于說明利用圖2所示的業(yè)務服務器裝置進行的處理的步驟的圖。圖5是用于具體地說明連接圖2、圖4所示的業(yè)務服務器裝置與去電通信終端裝置、來電通信終端裝置的CS網(wǎng)、PS網(wǎng)的圖。圖6是用于具體地說明連接圖2、圖4所示的業(yè)務服務器裝置與去電通信終端裝置、來電通信終端裝置的PS網(wǎng)的圖。圖7是用于說明利用實施方式I的業(yè)務服務器裝置實現(xiàn)的業(yè)務提供方法的圖。圖8是用于說明實施方式I的業(yè)務提供方法的流程圖。圖9是用于說明實施方式2的日程管理應用的概要的圖。
圖10是示出實施方式2的業(yè)務服務器裝置的圖。圖11是例示了實施方式2的任務數(shù)據(jù)的圖。圖12是用于說明實施方式2的業(yè)務提供方法的流程圖。圖13(a)是用于說明普通的翻譯機的結構的圖,圖13(b)是用于說明普通的翻譯系統(tǒng)的結構的圖。
具體實施例方式以下,參照附圖來說明本發(fā)明的業(yè)務服務器裝置、業(yè)務提供方法、業(yè)務提供程序的實施方式1、實施方式2。在以下參照的各個圖中,對與其它圖同樣的結構標注同樣的標號進行表示,并省略一部分說明。
(實施方式I)[通信管理]圖1是用于說明作為實施方式I的前提的業(yè)務概要的圖。該業(yè)務是為了支援具有通話功能的通信終端裝置進行的會話(以下,稱為通話)并實現(xiàn)如直接見面進行會話那樣的交流而開發(fā)的。以下,將作為實施方式I的前提的業(yè)務稱為CC(通信管理)業(yè)務。如圖1所示,CC業(yè)務是向與網(wǎng)絡N連接的通信終端裝置Cl c5提供的業(yè)務。作為通信終端裝置Cl c5,可使用具有通話功能的電話機、與網(wǎng)絡N連接并能利用分組通信來收發(fā)文本的通信終端裝置或能收發(fā)通話聲音和文本雙方的通信終端裝置(例如智能手機等)中的任意一個。另外,通信終端裝置Cl c5可以具有不僅能夠收發(fā)文本還收發(fā)靜態(tài)圖像、動態(tài)圖像、音樂的功能。在實施方式I中,假定與網(wǎng)絡N連接的通信終端裝置Cl c5中的至少I個裝置的用戶與其它至少I個裝置的用戶之間進行聲音通話的情況。并且,使用電話機進行通話的用戶在此通話中可啟動其它任務而執(zhí)行任務。通話中的電話機或與該電話機對應的其它通信終端裝置可接收通過執(zhí)行該啟動的任務而獲得的信息。為了實現(xiàn)實施方式1,在利用電話機的通話中,需要提供基于與通話不同的任務的業(yè)務的業(yè)務服務器裝置。用于實現(xiàn)實施方式I的業(yè)務服務器裝置執(zhí)行以下任務通話內(nèi)容的翻譯、翻譯后的通話內(nèi)容的合成聲音化、在通話聲音中插入合成聲音而得到的數(shù)據(jù)(以下,還稱為任務數(shù)據(jù))的生成、翻譯后的通話內(nèi)容的文本化、以及使任務數(shù)據(jù)與文本化后的數(shù)據(jù)(以下,還稱為文本數(shù)據(jù))聯(lián)動地發(fā)送至通話中的電話機等。以下,更具體地說明用于實現(xiàn)實施方式I的業(yè)務服務器裝置。[業(yè)務服務器裝置]⑴功能圖2是示出實施方式I的業(yè)務服務器裝置的一結構例的框圖。圖2的業(yè)務服務器裝置200構成為可與包含多個使能器的使能器組261進行通信。此外,使能器是用于使計算機工作的驅(qū)動軟件,是指按照各個目的而設計的軟件(應用程序)。使能器組261含有電話功能用的使能器組205和為了實現(xiàn)實施方式I特有的功能即翻譯功能而附加的使能器組206。使能器組205包含會話聯(lián)動使能器218、數(shù)據(jù)保留使能器207、設備管理控制使能器208、在線使能器209、電話簿使能器210、SNS (SocialNetworking Service :社交網(wǎng)絡業(yè)務)使能器211、位置信息檢測使能器262、電話/呼叫控制使能器201、消息發(fā)送使能器212等。另外,使能器組206包含點數(shù)管理使能器219、社區(qū)管理使能器213、管理與應用程序?qū)念A定信息的信息管理使能器214、聲音合成使能器202、圖像影像合成/編輯使能器215、字體轉換使能器216、聲音識別使能器203、圖像影像識別使能器217、文本翻譯使能器204等。此外,電話功能用的使能器組205是聲音的通信所涉及的使能器的集合。另外,使能器組206是與聲音的通信所涉及的應用程序不同的使能器的集合。即,在本說明書中,使能器組205所包含的使能器是利用聲音的通信所涉及的應用程序執(zhí)行的任務,使能器組206所包含的使能器是其它任務,該其它任務是與聲音通信所涉及的應用程序執(zhí)行的任務不同的由應用程序執(zhí)行的作業(yè)。使能器組261所包含的使能器組205以及206構成用于在網(wǎng)絡側提供業(yè)務的環(huán)境、所謂的業(yè)務使能器網(wǎng)絡(以下,稱為SEN)2。SEN2可與多個互聯(lián)網(wǎng)播放器P聯(lián)動地提供各種業(yè)務,該多個互聯(lián)網(wǎng)播放器P可提供包含翻譯業(yè)務在內(nèi)的多個業(yè)務。在實施方式I中,業(yè)務服務器裝置200為了執(zhí)行翻譯的任務而取得使能器組205的電話/呼叫控制使能器201,保存到業(yè)務應用部。另外,業(yè)務服務器裝置200從使能器組206向業(yè)務應用部保存聲音合成使能器202、聲音識別使能器203、文本翻譯使能器204。另夕卜,如上所述,在實施方式I中,全部業(yè)務應用部都包含業(yè)務啟動部250。結果,在實施方式I中,業(yè)務應用部成為提供翻譯的業(yè)務的業(yè)務應用部225。業(yè)務服務器裝置200可選擇性地取得執(zhí)行與業(yè)務種類對應的任務而所需的使能器。業(yè)務服務器裝置200取得的使能器作為后述的業(yè)務應用(業(yè)務應用軟件)部按照每個業(yè)務保存到業(yè)務服務器裝置200。根據(jù)這樣的結構,實施方式I的業(yè)務服務器裝置200可組合現(xiàn)有的使能器來構建業(yè)務所需的應用程序。因此,根據(jù)實施方式1,不需要新開發(fā)專用的應用程序,從而不會產(chǎn)生應用程序的開發(fā)所需的時間以及成本。此外,根據(jù)實施方式1,還可以使用具有使用記錄的現(xiàn)有的應用程序來提供業(yè)務,所以能夠提供與開發(fā)新的應用程序相比可靠性高的業(yè)務。在實施方式I中,去電通信終端裝置241a、來電通信終端裝置241b —邊相互通話一邊利用業(yè)務服務器裝置200來接受業(yè)務的提供。業(yè)務服務器裝置200在向去電通信終端裝置241a、來電通信終端裝置241b提供業(yè)務的情況下執(zhí)行任務。實施方式I中的去電通信終端裝置241a以及來電通信終端裝置241b例如是同時具有電話機的功能和可收發(fā)文本、靜態(tài)圖像、動態(tài)圖像等的功能的便攜電話機。業(yè)務服務器裝置200除了具備具有與業(yè)務對應的使能器的業(yè)務應用部之外,還具備作為電話機的控制通話的現(xiàn)有結構。作為控制通話的結構包括保存與CC業(yè)務的參加者(即接受CC業(yè)務的提供的用戶,以下簡稱為“用戶”)相關的數(shù)據(jù)的參加者簡檔蓄積部221、認證并許可CC業(yè)務提供的請求的認證許可部222、進行與通話繳納的費用相關的處理的計費處理部223、控制通話或分組通信的通信控制部224。通信控制部224還具備作為向去電通信終端裝置241a、來電通信終端裝置241b分別提供任務數(shù)據(jù)的提供部的功能。在參加者簡檔蓄積部221中與用戶的姓名及所使用電話機的電話號碼一起預先登記有用戶所使用的語言的種類。另外,在參加者簡檔蓄積部221中登記了電話機的數(shù)據(jù)通信會話中包含的MSISDN(Mobile Subscriber ISDN Number :在電話機的SIM卡中登記的電話號碼)作為確定電話機的信息。此外,為了使上述平板PC或相框等裝置與電話機對應,只要將這些裝置的識別符與相應的電話機的電話號碼對應地登記到參加者簡檔蓄積部221中即可。另外,通信控制部224向去電通信終端裝置241a、來電通信終端裝置241b提供在業(yè)務服務器裝置200中生成的任務數(shù)據(jù)。此外,實施方式I的業(yè)務服務器裝置200具備學習部280。關于學習部280,在后面進行說明。業(yè)務服務器裝置200可具備多個業(yè)務應用部225、226、227。另外,在實施方式I中,還可以將多個業(yè)務應用部225、226、227作為例如可存儲多個使能器的存儲區(qū)域。在這樣的情況下,根據(jù)存儲的使能器,存儲區(qū)域可以是業(yè)務應用部225、226、227中的任意一個。另外,在作為實施方式I的業(yè)務應用部的存儲區(qū)域中,存儲有業(yè)務啟動部250。該業(yè)務啟動部250例如具有如下這樣的功能為了接收從去電通信終端裝置241a經(jīng)由IP網(wǎng)絡230發(fā)送的指示來提供業(yè)務,啟動使能器。
在實施方式I中,當用戶操作了去電通信終端裝置241a時,業(yè)務啟動部250啟動業(yè)務應用部225所保存的使能器。當啟動該業(yè)務應用部225所保存的使能器后,開始執(zhí)行任務。所啟動的電話/呼叫控制使能器201在去電通信終端裝置241a、來電通信終端裝置241b之間的通信中,對說話者的聲音(以下,稱為通話聲音)進行錄音。此外,也可以對電話/呼叫控制使能器201所具備的公知的留言電話的錄音進行控制,使用留言電話的通話聲音錄音功能來進行通話聲音的錄音。聲音識別使能器203根據(jù)所錄的聲音來生成文本數(shù)據(jù)。聲音識別使能器203例如根據(jù)形態(tài)元素分析來分析所錄的聲音,將該聲音轉換為文本數(shù)據(jù)。文本翻譯使能器204通過將聲音識別使能器203所生成的文本數(shù)據(jù)翻譯為來電通信終端裝置241b的用戶所使用的語言,生成翻譯文本數(shù)據(jù)。聲音合成使能器202通過將文本翻譯使能器204生成的翻譯文本數(shù)據(jù)轉換為利用聲音表示的聲音,來生成用于借助合成聲音來朗讀的聲音數(shù)據(jù)。在實施方式I中,聲音合成使能器202所生成的聲音數(shù)據(jù)與通話聲音一起被提供給去電通信終端裝置241a、來電通信終端裝置241b。另外,在實施方式I中,還向去電通信終端裝置241a、來電通信終端裝置241b提供聲音識別使能器203所生成的文本數(shù)據(jù)和文本翻譯使能器204所生成的翻譯文本數(shù)據(jù)。在實施方式I中,還將聲音數(shù)據(jù)、文本數(shù)據(jù)以及翻譯文本數(shù)據(jù)一并稱為任務數(shù)據(jù)。如以上那樣,在聲音識別使能器203、文本翻譯使能器204、聲音合成使能器202通過業(yè)務啟動部250受理了任務執(zhí)行的指示時,根據(jù)電話/呼叫控制使能器201所錄的聲音來執(zhí)行任務,并通過執(zhí)行任務來生成任務數(shù)據(jù)。該任務數(shù)據(jù)被提供給去電通信終端裝置241a以及來電通信終端裝置241b。在以上這樣構成的實施方式I的業(yè)務服務器裝置中,業(yè)務啟動部250作為指示受理部發(fā)揮作用。另外,電話/呼叫控制使能器201作為錄音部發(fā)揮作用,聲音識別使能器203、文本翻譯使能器204、聲音合成使能器202作為任務執(zhí)行部以及任務數(shù)據(jù)生成部發(fā)揮作用。此外,在實施方式I中,也可以不是在去電通信終端裝置241a、來電通信終端裝置241b指示提供業(yè)務之后業(yè)務啟動部250立即啟動各個使能器,而是從參加者簡檔蓄積部221中取得預先登記的參加者信息。并且,在參加者信息中包含確定去電通信終端裝置241a、來電通信終端裝置241b中的至少一個的信息的情況下,接受去電通信終端裝置241a、來電通信終端裝置241b的指示。另外,在實施方式I中,當指示提供業(yè)務時,可將業(yè)務啟動部250的啟動條件設定為,便攜電話機在本機的電話號碼中附加預先設定的特定號碼等信息而進行去電。在這樣設定了啟動條件的情況下,當去電通信終端裝置241a、來電通信終端裝置241b中的至少一方使用附加有預先設定的信息的電話號碼進行呼叫時,業(yè)務啟動部250接受去電通信終端裝置241a、來電通信終端裝置241b的指示。此外,實施方式I不限于業(yè)務啟動部250根據(jù)利用去電通信終端裝置241a、來電通信終端裝置241b的操作而輸出的信號來啟動各個使能器的情況。例如,也可以在輸入了電話/呼叫控制使能器201所錄的通話聲音的情況下,業(yè)務啟動部250啟動各個使能器,開始執(zhí)行任務。在這樣構成業(yè)務啟動部250的情況下,預先設定可確定應用程序的語言例如“翻譯開始”等語言。然后,僅在對聲音識別使能器203所錄的通話聲音進行形態(tài)元素分析的結果為在通話聲音中包含預先設定的語言的情況下,業(yè)務啟動部250啟動各個使能器來 執(zhí)行任務。在上述實施方式I中,去電通信終端裝置241a、來電通信終端裝置241b不限于可發(fā)送文本的便攜電話機。在去電通信終端裝置241a、來電通信終端裝置241b是僅具有通話功能的電話機的情況下,也可以根據(jù)來自僅具有通話功能的電話機的請求,向與該電話機預先對應的平板PC242a、242b或相框243a、243b發(fā)送任務的執(zhí)行結果。(ii)學習部圖3是用于說明圖2所示的學習部280的功能框圖。圖2n所示的學習部280具備加權部313。圖2所示的聲音識別使能器203構成為可訪問數(shù)據(jù)庫(以下,稱為DB)311。DB311可處于業(yè)務服務器裝置的內(nèi)部,或者可經(jīng)由網(wǎng)絡等與業(yè)務服務器裝置連接。在實施方式I中,在DB311內(nèi)預先登記有多個文本,聲音識別使能器203訪問DB311,取得與進行形態(tài)元素分析后的通話聲音對應的文本。然后,使用所取得的文本將通話聲音轉換為文本,生成文本數(shù)據(jù)。將文本數(shù)據(jù)作為任務數(shù)據(jù)之一發(fā)送到去電通信終端裝置241a、來電通信終端裝置241b。在去電通信終端裝置中,用戶可通過確認文本數(shù)據(jù)來容易地檢測通話聲音的誤識別以及與其相伴的誤譯。當存在誤識別以及誤譯時,在實施方式I中,用戶對顯示在去電通信終端裝置的顯示畫面上的文本數(shù)據(jù)進行編輯示出應訂正的位置,提供給業(yè)務服務器裝置200,指示訂正文本數(shù)據(jù)。這樣的訂正的指示可使用能夠收發(fā)文本或圖像的便攜電話機的現(xiàn)有結構容易地實現(xiàn)。當從去電通信終端裝置241a發(fā)送指示訂正的訂正指示信號后,訂正指示信號到達聲音識別使能器203。聲音識別使能器203向加權部313通知從去電通信終端裝置發(fā)送了訂正指示信號的情況和由訂正指示信號指示的訂正位置。加權部313訪問DB311,對于與被指示了訂正的文本對應的通話聲音,以降低賦予給該文本的權重的方式進行變更。然后,在聲音識別使能器203下次將通話聲音與DB311對照時,使被賦予的權重較大的文本優(yōu)先地與通話聲音進行匹配。這樣,能夠在更短時間內(nèi)提取與通話聲音對應的可能性更高的文本。
圖4是用于說明由圖2所示的業(yè)務服務器裝置進行的處理的順序的圖。在圖2所示的業(yè)務應用部225中,利用圖2所示的電話/呼叫控制使能器201來執(zhí)行通話聲音的錄音(步驟S311)。通話聲音的錄音是以從沒有錄音的狀態(tài)(以下,還稱為無錄音狀態(tài))到下一無錄音狀態(tài)之間發(fā)出的通話聲音為I個單位進行的。接著,由聲音識別使能器203對聲音進行形態(tài)元素分析,從而進行分析。按照作為I個單位錄制的通話聲音進行分析。然后,根據(jù)分析結果將通話聲音轉換為文本數(shù)據(jù)(步驟S312)。接著,在業(yè)務應用部225中,利用文本翻譯使能器204將在步驟S312中轉換的文本數(shù)據(jù)翻譯為由來電通信終端裝置241b的用戶預先登記在參加者簡檔蓄積部221內(nèi)的語言的翻譯文本數(shù)據(jù)(步驟S313)。將翻譯后的翻譯文本數(shù)據(jù)轉換為合成聲音,成為聲音數(shù)據(jù)(步驟S314)。進而,在通話聲音中插入聲音數(shù)據(jù)(步驟S315)。這里,所謂“在通話聲音中插入聲音數(shù)據(jù)”是決定與通話聲音對應地發(fā)送聲音數(shù)據(jù)的時刻。通過這樣決定聲音數(shù)據(jù)的發(fā)送時刻,可如平常那樣經(jīng)由CS(Circuit Switched)網(wǎng)向去電通信終端裝置241a、來電通信終端裝置241b發(fā)送通話聲音。另外,雖然聲音數(shù)據(jù)也經(jīng)由CS網(wǎng)利用數(shù)據(jù)通信會話發(fā)送到去電通信終端裝置241a、來電通信終端裝置241b,但還可以經(jīng)由PS(Packet Switched)網(wǎng)進行發(fā)送。但是,在實施方式I中,通過經(jīng)由CS網(wǎng)進行發(fā)送,可實時地發(fā)送聲音數(shù)據(jù)。此外,利用PS網(wǎng)發(fā)送翻譯通話聲音而進行文本化的文本數(shù)據(jù)。此外,在圖4中,對CS網(wǎng)和PS網(wǎng)標注標號320而示出。此外,實施方式I不限于利用CS網(wǎng)發(fā)送通話聲音的情況,也可以經(jīng)由PS網(wǎng)向去電通信終端裝置241a、來電通信終端裝置241b發(fā)送通話聲音。在實施方式I中,如上所述將從無錄音狀態(tài)到下一無錄音狀態(tài)之間發(fā)出的通信聲音作為I個單位進行錄音、識別、翻譯,生成任務數(shù)據(jù),每次都發(fā)送到去電通信終端裝置241a、來電通信終端裝置241b,由此能夠取得通話聲音與任務數(shù)據(jù)的同步,發(fā)送到去電通信終端裝置241a、來電通信終端裝置241b。在實施方式I中,為了避免通話的不適感,如平常那樣,實時地向通信對象的去電通信終端裝置241a、來電通信終端裝置241b發(fā)送通話聲音。因此,通過在通話聲音中插入聲音數(shù)據(jù),用戶有時會重疊地聽到基于聲音數(shù)據(jù)的聲音和通話聲音。但是,在經(jīng)由口譯者進行會話的情況下,一般可認為在口譯者發(fā)話的期間,人處于抑制自己發(fā)話的傾向。因此,不易產(chǎn)生基于聲音數(shù)據(jù)的聲音與通話聲音重疊而給會話帶來障礙的情況。在實施方式I中,去電通信終端裝置241a、來電通信終端裝置241b雙方訪問業(yè)務應用部225,取得文本數(shù)據(jù)、翻譯文本數(shù)據(jù)以及聲音數(shù)據(jù)。這樣,經(jīng)由業(yè)務應用部225連接去電通信終端裝置241a與來電通信終端裝置241b的方式被稱為橋式連接。另外,圖1所示的業(yè)務服務器裝置200可利用公知的方法來識別去電通信終端裝置241a的電話線路和來電通信終端裝置241b的電話線路。因此,可區(qū)別去電通信終端裝置241a的上行線路ul、下行線路dl、來電通信終端裝置241b的上行線路u2、下行線路d2,可適當翻譯用戶的發(fā)話并發(fā)送至通話對方。根據(jù)以上說明的實施方式1,可將通話聲音、合成聲音的聲音數(shù)據(jù)、文本數(shù)據(jù)、翻譯文本數(shù)據(jù)提供給去電通信終端裝置241a、來電通信終端裝置241b。因此,用戶能夠容易地知道在業(yè)務服務器裝置200中怎樣識別了自己發(fā)話的內(nèi)容,如果存在誤譯等,則能夠迅速進行訂正等處理。另外,因為用戶能聽到通話對方的通話聲音和將其翻譯后的聲音數(shù)據(jù),所以可實現(xiàn)好像在他們之間經(jīng)由口譯者進行會話的具有現(xiàn)場感的會話。(iii)CS 網(wǎng)以及 PS 網(wǎng)圖5是用于具體說明連接圖2、圖4所示的業(yè)務服務器裝置200與去電通信終端裝置241a、來電通信終端裝置241b的CS網(wǎng)404、PS網(wǎng)405的圖。對于與圖5中的圖2、圖4所不的結構同樣的結構,標注相同的標號而不出,省略其說明的一部分。去電通信終端裝置241a向MPN(媒體處理節(jié)點)408發(fā)出呼叫。該呼叫信號到達CS網(wǎng)404、現(xiàn)有的電話系統(tǒng)裝置401。現(xiàn)有的電話系 統(tǒng)裝置401例如是指CSN(認證裝置、用于實現(xiàn)切換的歸屬代理、DHCP業(yè)務器等)、ASN(無線基站等)。在現(xiàn)有的電話系統(tǒng)裝置401中對呼叫執(zhí)行非計費處理或?qū)S锰柎a路由的處理。非計費處理是使得不進行一般通話所需的計費處理的處理。另外,專用號碼路由是在向預定的電話號碼(專用號碼)進行呼叫時將通信路徑變更為進行與原來的處理不同的處理的通信路徑。接著,呼叫信號從現(xiàn)有的電話系統(tǒng)裝置401到達實施方式I的業(yè)務服務器裝置200。業(yè)務服務器裝置200具備控制圖1所示的電話機通信的通信控制部224、參加者簡檔蓄積部221、認證許可部222、計費處理部223,所以利用這樣的結構進行來自其它網(wǎng)絡的業(yè)務限制、或聲音與畫面的聯(lián)動(聲音數(shù)據(jù)與文本數(shù)據(jù)等的聯(lián)動)處理。可如下這樣地實現(xiàn)聲音數(shù)據(jù)與文本數(shù)據(jù)以及翻譯文本數(shù)據(jù)的聯(lián)動。S卩,在可接收本業(yè)務的提供的電話機成為通話狀態(tài)時,業(yè)務服務器裝置200的通信控制部224開始監(jiān)視包含與電話機通話所涉及的信號包含的MSISDN —致的MSISDN的數(shù)據(jù)通信會話的執(zhí)行。并且,在進行了與通話所涉及的信號包含的MSISDN —致的數(shù)據(jù)會話時,判斷為應該在CC業(yè)務中使該通話與數(shù)據(jù)會話聯(lián)動。在將通話聲音、聲音數(shù)據(jù)、文本數(shù)據(jù)以及翻譯文本數(shù)據(jù)發(fā)送到I個通信終端裝置時,利用CS網(wǎng)實時地發(fā)送通話聲音和聲音數(shù)據(jù)。但是,也可以利用PS網(wǎng)發(fā)送聲音數(shù)據(jù),根據(jù)上述結構,可取得利用CS網(wǎng)404發(fā)送的通話聲音與利用PS網(wǎng)405發(fā)送的任務數(shù)據(jù)之間的聯(lián)動。另外,如上所述,在實施方式I中,與聲音數(shù)據(jù)同樣地經(jīng)由PS網(wǎng)405發(fā)送通話聲音。圖6示出經(jīng)由PS網(wǎng)405與聲音數(shù)據(jù)等一起發(fā)送通話聲音的結構。另外,在實施方式I中,如上所述,在圖2所示的參加者簡檔蓄積部221內(nèi),使僅具有通話功能的電話機與可發(fā)送文本等的通信終端裝置對應地登記。在這樣的情況下,也可以在通信控制部224以電話機的電話號碼進行呼叫時,向所登記的通信終端裝置的地址發(fā)送能夠取得任務數(shù)據(jù)的URL。另外,在MPN408中,利用電話/呼叫控制使能器201對與呼叫對應的通話聲音進行錄音,傳遞到業(yè)務服務器裝置200。在業(yè)務服務器裝置200中,應用部225根據(jù)所錄的通話聲音生成聲音數(shù)據(jù)和文本數(shù)據(jù)以及翻譯文本數(shù)據(jù)。雖然經(jīng)由CS網(wǎng)向來電通信終端裝置241b實時地發(fā)送聲音數(shù)據(jù),但也可以利用PS網(wǎng)進行發(fā)送。另外,從現(xiàn)有的網(wǎng)絡系統(tǒng)裝置402 (網(wǎng)關等)或xGSN(x-GPRSSupport Node) /EPC (Evolved Packet Core)經(jīng)由 PS 網(wǎng) 405 向來電通信終端裝置 241b 發(fā)送文本數(shù)據(jù)以及翻譯文本數(shù)據(jù)。(iv)業(yè)務提供方法
圖7是用于說明利用實施方式I的業(yè)務服務器裝置200實現(xiàn)的業(yè)務提供方法的圖。在圖7中,利用虛線表示使用HTTP (Hypertext Transfer Protocol :超文本傳送協(xié)議)的數(shù)據(jù)通信,利用實線表示基于電話機的通話。在去電通信終端裝置241a中,用戶例如啟動用于實現(xiàn)實施方式I的業(yè)務提供方法的應用程序,并且輸入對象的電話號碼(步驟S501)。通過這樣的處理,從去電通信終端裝置241a向業(yè)務服務器裝置發(fā)送去電通信終端裝置241a的地址。然后,在業(yè)務服務器裝置200中,以滿足了其它必需要件為條件,受理在通信(通話)之間執(zhí)行任務的指示,開始翻譯業(yè)務(步驟S502)。業(yè)務服務器裝置200建立與去電通信終端裝置241a、來電通信終端裝置241b之間的通話線路(步驟S503)。然后,業(yè)務服務器裝置200對從去電通信終端裝置241a的線路發(fā)送的通話聲音進行錄音(步驟S504),并且發(fā)送到來電通信終端裝置241b的線路(步驟S505)。
當成為沒有從去電通信終端裝置241a的線路發(fā)送通話聲音的無錄音狀態(tài)時,業(yè)務服務器裝置200暫時結束從去電通信終端裝置241a的線路發(fā)送的通話聲音的錄音(步驟S506)。然后,圖2、圖4所示的聲音識別使能器203、文本翻譯使能器204、聲音合成使能器202對所錄的通話聲音進行文本化、翻譯、合成聲音的合成(步驟S507),生成聲音數(shù)據(jù)、文本數(shù)據(jù)以及翻譯文本數(shù)據(jù)。然后,實施方式I的業(yè)務服務器裝置200向去電通信終端裝置241a、241b雙方發(fā)送聲音數(shù)據(jù),并且還向去電通信終端裝置241a、來電通信終端裝置241b雙方發(fā)送文本數(shù)據(jù)以及翻譯文本數(shù)據(jù)(步驟S508 511)。接著,當來電通信終端裝置241b的用戶發(fā)話時,業(yè)務服務器裝置200對從來電通信終端裝置241b的電話線路發(fā)送的用戶的通話聲音執(zhí)行以上的動作。此外,當在兩個用戶中的一方發(fā)話的期間另一方也發(fā)話時,在實施方式I中,針對錄制通話聲音時的用戶的通話聲音執(zhí)行以上的處理,對于另一個用戶發(fā)話的內(nèi)容不作為處理的對象。圖8是用于說明在實施方式I的業(yè)務服務器裝置中進行的實施方式I的業(yè)務提供方法的流程圖。業(yè)務啟動部判斷是否從去電通信終端裝置指示了執(zhí)行與翻譯相關的應用程序(步驟S701)。業(yè)務啟動部在判斷為已指示執(zhí)行應用程序時(步驟S701 :是),啟動業(yè)務應用部的各個使能器。此外,業(yè)務啟動部在判斷為沒有這樣的指示時(步驟S701 :否)進行等待直至出現(xiàn)執(zhí)行應用程序的指示為止。由業(yè)務啟動部啟動的電話/呼叫控制使能器對通話聲音進行錄音(步驟S702)。電話/呼叫控制使能器判斷在通話聲音的錄音中是否成為無音狀態(tài)(步驟S703)。并且,電話/呼叫控制使能器在判斷為是無音狀態(tài)時(步驟S703 :是),暫時結束通話聲音的錄音(步驟S704)。聲音識別使能器對由電話/呼叫控制使能器錄制的通話聲音進行形態(tài)元素分析(步驟S705),將其分析結果與圖3所示的DB311對照(步驟S706)。然后,提取與通話聲音符合的文本進行組合,生成文本數(shù)據(jù)(步驟S707)。文本識別部204將文本數(shù)據(jù)翻譯為其它語言而生成翻譯文本數(shù)據(jù)(步驟S708)。聲音合成使能器將翻譯文本數(shù)據(jù)轉換為合成聲音而生成聲音數(shù)據(jù)(步驟S709)。將文本數(shù)據(jù)、翻譯文本數(shù)據(jù)以及聲音數(shù)據(jù)作為任務數(shù)據(jù)發(fā)送到去電通信終端裝置以及來電通信終端裝置(步驟S710)。
聲音識別使能器根據(jù)是否發(fā)送了訂正指示信號,判斷是否用戶訂正了文本數(shù)據(jù)(步驟S711)。在訂正了文本數(shù)據(jù)的情況下(步驟S711 :是),聲音識別使能器將與所訂正的文本對應的通話聲音再次和DB進行對照并轉換為其它文本。然后,使用其它文本生成文本數(shù)據(jù)。文本翻譯使能器、聲音合成使能器根據(jù)再次生成的文本數(shù)據(jù)來再次生成翻譯文本數(shù)據(jù)或聲音數(shù)據(jù)(步驟S706 711)。另一方面,在由聲音識別使能器判斷為沒有輸入訂正指示信號時(步驟S711 是),圖2所示的學習部280變更賦予給存儲在DB中的文本數(shù)據(jù)的權重。即,學習部280以降低本次訂正的文本的權重的方式進行變更,在DB中反映變更后的內(nèi)容。在以上處理之后,業(yè)務啟動部判斷是否由用戶指示了結束業(yè)務(步驟S713)。業(yè)務啟動部在判斷為用戶沒有指示結束業(yè)務時(步驟S713 :否),使電話/呼叫控制部繼續(xù)進行通話聲音的錄音。另一方面, 業(yè)務啟動部在判斷為用戶已指示結束業(yè)務時(步驟S713 :是),根據(jù)指示,使業(yè)務結束。此外,實施方式I不限于以上說明的結構。即,在上述實施方式I中,是以兩個用戶之間的通話為對象來執(zhí)行翻譯所涉及的CC業(yè)務。但是,實施方式I不限于將兩人之間的通話作為對象的情況,還可適用于3人以上進行通話的會議電話等。[業(yè)務提供程序]在以上說明的業(yè)務服務器裝置中,執(zhí)行這樣的業(yè)務提供程序在可利用聲音進行通信的聲音通信終端裝置之間的聲音通信中,提供基于與聲音通信不同的其它任務的業(yè)務。該業(yè)務提供程序使計算機實現(xiàn)以下功能指示受理功能,受理在聲音通信之間執(zhí)行其它任務的指示;錄音功能,在多個所述聲音通信終端裝置之間的聲音通信中對說話者的通話聲音進行錄音;任務執(zhí)行功能,在利用所述指示受理功能受理了所述指示時,根據(jù)在所述錄音功能中所錄的所述通話聲音,對所述通話聲音進行文本轉換而生成文本數(shù)據(jù),將該文本數(shù)據(jù)翻譯為其它語言而生成翻譯文本數(shù)據(jù),將該翻譯文本數(shù)據(jù)轉換為聲音而生成聲音數(shù)據(jù);以及任務數(shù)據(jù)提供功能,將所述文本數(shù)據(jù)、所述翻譯文本數(shù)據(jù)和所述聲音數(shù)據(jù)作為所述任務數(shù)據(jù)與所述通話聲音一起分別提供給正在進行聲音通信的多個所述聲音通信終端裝置。(實施方式2)接著,說明本發(fā)明的實施方式2。實施方式2是在調(diào)整用戶的日程的應用程序中應用本發(fā)明的業(yè)務服務器裝置、業(yè)務控制方法、業(yè)務控制程序。[日程管理應用]圖9是用于說明實施方式2所提供的調(diào)整日程的應用程序(以下,稱為日程管理應用)的概要的圖。在圖8所示的例子中,業(yè)務服務器裝置在去電通信終端裝置241a、來電通信終端裝置241b的通信中,提供與基于聲音的通信不同的日程管理任務的業(yè)務。在這樣的例子中,去電通信終端裝置241a的用戶為了在通話之間執(zhí)行日程管理任務,而操作去電通信終端裝置241a等,對業(yè)務服務器裝置進行指示。當業(yè)務服務器裝置受理指示后,在去電通信中,對去電通信終端裝置241a、來電通信終端裝置241b的用戶的通話聲音進行錄
曰 在圖9所示的例子中,業(yè)務服務器裝置從去電通信終端裝置241a、來電通信終端裝置241b的電話線路取得通話聲音并分別進行錄音。圖2所示的聲音識別部對所錄的通話聲音進行形態(tài)元素分析等,檢測在通話聲音中包含表示“日程調(diào)整”的聲音的情況。因為在通話聲音中包含“日程調(diào)整”,所以判斷為已指示執(zhí)行如下的任務提取去電通信終端裝置241a、來電通信終端裝置241b的用戶的日程都空閑的日期時刻以及其時間段。通過進行這樣的指示,在實施方式2中,業(yè)務服務器裝置取得在去電通信終端裝置241a、來電通信終端裝置241b中登記的用戶的日程數(shù)據(jù)。此外,日程數(shù)據(jù)是由用戶自己在去電通信終端裝置241a、來電通信終端裝置241b中登記的數(shù)據(jù),是包含與用戶相關的行動和與進行該行動的日期時刻相關的信息的數(shù)據(jù)。并且,在實施方式2的業(yè)務服務器裝置中,從取得的日程數(shù)據(jù)中提取沒有登記用戶行動的去電通信終端裝置241a、來電通信終端裝置241b共同的日期以及其時間段(日期時刻)。將提取的日期時刻作為包含文本數(shù)據(jù)的圖像數(shù)據(jù)發(fā)送到去電通信終端裝置241a、來電通信終端裝置241b雙方。 [業(yè)務服務器裝置]⑴功能圖10是示出實施方式2的業(yè)務服務器裝置900的圖。實施方式2的業(yè)務服務器裝置900與實施方式I的業(yè)務服務器裝置200的不同之處僅在于業(yè)務應用部的結構。S卩,在實施方式2的業(yè)務服務器裝置900中,從使能器組261取得的電話/呼叫控制使能器201、聲音識別使能器203、信息管理使能器214、圖像影像合成/編輯使能器215構建了業(yè)務應用部226。并且,信息管理使能器214取得在去電通信終端裝置241a、來電通信終端裝置241b中登記的用戶的日程數(shù)據(jù)。信息管理使能器214從取得的日程數(shù)據(jù)中提取沒有登記去電通信終端裝置241a、來電通信終端裝置241b的用戶預定的日期以及其時間段。將由信息管理使能器214提取的信息傳遞到圖像影像合成/編輯使能器215。圖像影像合成/編輯使能器215根據(jù)該信息來生成包含文本以及圖像中的至少I個的任務數(shù)據(jù)。圖11是例示實施方式2的任務數(shù)據(jù)的圖。任務數(shù)據(jù)被發(fā)送到去電通信終端裝置241a、來電通信終端裝置241b雙方。根據(jù)這樣的結構,能夠向去電通信終端裝置241a、來電通信終端裝置241b的用戶提供具有與直接見面而進行日程調(diào)整同樣的現(xiàn)場感的通信。另外,還能夠取得可容易且無錯誤地調(diào)整日程的效果。(ii)業(yè)務提供方法圖12是用于說明在實施方式2的業(yè)務服務器裝置中進行的業(yè)務提供方法的流程圖。業(yè)務啟動部判斷是否從去電通信終端裝置指示了執(zhí)行與日程管理相關的應用程序(步驟S1101)。業(yè)務啟動部在判斷為已指示執(zhí)行應用程序的情況下(步驟SllOl :是),啟動業(yè)務應用部的各個使能器。此外,業(yè)務啟動部在判斷為沒有指示執(zhí)行應用程序業(yè)務器的情況下(步驟SllOl :否)進行等待直至出現(xiàn)這樣的指示為止。在由業(yè)務啟動部啟動了各個使能器的情況下,所啟動的電話/呼叫控制使能器對通話聲音進行錄音(步驟S1102)。電話/呼叫控制使能器在通話聲音的錄音中判斷是否為無音狀態(tài)(步驟S1103)。電話/呼叫控制使能器在判斷為是無音狀態(tài)的情況下(步驟S1103:是),暫時結束通話聲音的錄音(步驟S1104)。聲音識別使能器對電話/呼叫控制使能器所錄的通話聲音進行形態(tài)元素分析(步驟S1105),當在通話聲音中含有表示“日程調(diào)整”的語句時,檢測已指示日程調(diào)整的情況。信息管理使能器訪問數(shù)據(jù)庫,從數(shù)據(jù)庫內(nèi)取得與通話中的各個用戶的日程相關的信息(步驟S1106)。這樣的實施方式2的數(shù)據(jù)庫是預先登記了用戶的日程的數(shù)據(jù)庫。優(yōu)選的是,日程是以便攜電話機的應用程序所設定的預定形式登記的。另外,實施方式2的數(shù)據(jù)庫也可以處于參加者簡檔蓄積部中。圖像影像合成/編輯使能器使用所提取的日程來生成例如圖11所示的包含文本以及圖像的任務數(shù)據(jù)(步驟S1107)。利用圖10所示的通信控制部224將由圖像影像合成/編輯使能器生成的任務數(shù)據(jù)發(fā)送到去電通信終端裝置以及來電通信終端裝置(步驟S1108)。在實施方式2中,去電通信終端裝置的用戶可確認自己指示的內(nèi)容與任務數(shù)據(jù)是否一致。在確認的結果是任務數(shù)據(jù)與自己期望的內(nèi)容不同時,去電通信終端裝置的用戶進行這樣的操作從通信終端裝置向業(yè)務服務器裝置900指示訂正。利用該操作來發(fā)送訂正指示信號。此外,任務數(shù)據(jù)與期望的內(nèi)容不同例如是指,雖然用戶說出“下月的日程”,但是提示了 6月的日程的情況等。聲音識別使能器根據(jù)是否發(fā)送了訂正指示信號,判斷用戶是否訂正了任務數(shù)據(jù)(步驟S1109)。在用戶訂正了任務數(shù)據(jù)的情況下(步驟S1109:是),聲音識別使能器將與訂正的任務數(shù)據(jù)對應的通話聲音再次與DB進行對照并轉換為其它文本。然后,使用作為再次對照的結果而提取的其它文本生成文本數(shù)據(jù)。文本翻譯使能器、聲音合成使能器根據(jù)再次提取的文本數(shù)據(jù),再次生成任務數(shù)據(jù)(步驟S1106 1109)。另一方面,當判斷為沒有輸入訂正指示信號時(步驟SlllO :是),圖10所示的學習部280變更賦予給在DB中存儲的文本數(shù)據(jù)的權重。即,學習部以降低與本次訂正的位置相關的文本的權重的方式進行變更,在DB中反映變更后的內(nèi)容。以上的處理之后,業(yè)務啟動部判斷用戶是否指示了結束業(yè)務(步驟S1111)。當業(yè)務啟動部判斷為沒有業(yè)務結束的指示時(步驟Sllll :否),使電話/呼叫控制部繼續(xù)通話聲音的錄音。另外,業(yè)務啟動部在判斷為已進行業(yè)務結束的指示時(步驟Sllll :是),根據(jù)指示使業(yè)務結束。[業(yè)務提供程序]在以上說明的業(yè)務服務器裝置中,執(zhí)行這樣的業(yè)務提供程序在可利用聲音進行通信的聲音通信終端裝置之間的聲音通信中,提供基于與聲音通信不同的其它任務的業(yè)務。該業(yè)務提供程序使計算機實現(xiàn)以下功能指示受理功能,受理在聲音通信之間執(zhí)行其它任務的指示;錄音功能,在多個上述聲音通信終端裝置之間的通信中對說話者的通話聲音進行錄音;任務執(zhí)行功能,在由上述指示受理功能受理了上述指示時,根據(jù)在上述錄音功能中錄制的上述通話聲音,判定上述聲音通信終端裝置的用戶作出的指示,根據(jù)該指示提取預先登記的信息,使用所提取的信息來生成包含文本以及圖像中的至少一方的任務數(shù)據(jù);以及任務數(shù)據(jù)提供功能,將包含文本以及圖像中的至少一方的上述任務數(shù)據(jù)與上述通話聲音一起分別提供給正在進行聲音通信的多個上述聲音通信終端裝置。此外,在實施方式2中,執(zhí)行以兩個用戶之間的通話為對象進行日程調(diào)整的CC業(yè)務。但是,實施方式2不限于以兩人之間的通話為對象的情況,還可以適用于3人以上進行通話的會議電話等。另外,本發(fā)明的范圍不限于圖示并記載的例示的實施方式,還包含能實現(xiàn)與本發(fā)明的目的等同效果的全部實施方式。此外,本發(fā)明的范圍不限于權利要求所劃分的發(fā)明特征的組合,還能夠由所有的公開的各個特征中的特定特征的所有期望組合來劃分。工業(yè)上的可利用性本發(fā)明可提供適于支援使用智能手機等的通信的業(yè)務提供裝置、業(yè)務提供方法以及業(yè)務提供程序。標號說明200、900業(yè)務服務器裝置201電話/呼叫控制使能器202聲音合成使能器 203聲音識別使能器204文本翻譯使能器205、206、261 使能器組208設備管理控制使能器209在線使能器210電話簿使能器211 SNS 使能器212消息發(fā)送使能器213社區(qū)管理使能器214信息管理使能器215圖像影像/合成編輯使能器216字體轉換使能器217圖像影像識別使能器218會話聯(lián)動使能器219點數(shù)管理使能器221參加者簡檔蓄積部222認證許可部223計費處理部224通信控制部225、226、227 業(yè)務應用部230 網(wǎng)絡280 學習部241a去電通信終端裝置241b來電通信終端裝置
權利要求
1.一種業(yè)務服務器裝置,其與利用聲音相互進行聲音通信的多個聲音通信終端裝置連接,提供基于其它任務的業(yè)務,該其它任務是與在該聲音通信終端裝置之間進行的聲音通信所涉及的應用程序執(zhí)行的任務不同的由應用程序執(zhí)行的作業(yè),其特征在于,該業(yè)務服務器裝置包括指示受理部,其受理在聲音通信之間執(zhí)行所述其它任務的指示;錄音部,其在多個所述聲音通信終端裝置之間的聲音通信中對說話者的通話聲音進行錄音;任務執(zhí)行部,其在所述指示受理部受理了所述指示時,根據(jù)所述錄音部所錄的所述通話聲音執(zhí)行所述其它任務;以及任務數(shù)據(jù)提供部,其向正在進行聲音通信的多個所述聲音通信終端裝置分別提供任務數(shù)據(jù),該任務數(shù)據(jù)包含通過所述任務執(zhí)行部執(zhí)行所述其它任務而獲得的文本數(shù)據(jù)和通過所述任務執(zhí)行部執(zhí)行所述其它任務而獲得的聲音數(shù)據(jù),所述任務執(zhí)行部將所述通話聲音轉換為文本而生成文本數(shù)據(jù),將該文本數(shù)據(jù)翻譯為其它語言而生成翻譯文本數(shù)據(jù),將該翻譯文本數(shù)據(jù)轉換為聲音而生成聲音數(shù)據(jù),所述任務數(shù)據(jù)提供部將所述文本數(shù)據(jù)、所述翻譯文本數(shù)據(jù)以及所述聲音數(shù)據(jù)與所述通話聲音一起作為所述任務數(shù)據(jù)分別提供給正在進行聲音通信的多個所述聲音通信終端裝置。
2.—種業(yè)務服務器裝置,其與利用聲音相互進行聲音通信的多個聲音通信終端裝置連接,提供基于其它任務的業(yè)務,該其它任務是與在該聲音通信終端裝置之間進行的聲音通信所涉及的應用程序不同的應用程序執(zhí)行的作業(yè),其特征在于,該業(yè)務服務器裝置包括指示受理部,其受理在聲音通信之間執(zhí)行所述其它任務的指示;錄音部,其在多個所述聲音通信終端裝置之間的聲音通信中對說話者的通話聲音進行錄音;任務執(zhí)行部,其在所述指示受理部受理了所述指示時,根據(jù)所述錄音部所錄的所述通話聲音執(zhí)行所述其它任務;以及任務數(shù)據(jù)提供部,其向正在進行聲音通信的多個所述聲音通信終端裝置分別提供通過所述任務執(zhí)行部執(zhí)行所述其它任務而獲得的任務數(shù)據(jù),所述任務執(zhí)行部根據(jù)所述通話聲音判定由所述聲音通信終端裝置的用戶作出的指示, 按照該指示提取預先登記的信息,使用提取的信息生成包含文本以及圖像中的至少一方的任務數(shù)據(jù),所述任務數(shù)據(jù)提供部將包含所述文本以及所述圖像中的至少一方的所述任務數(shù)據(jù)與所述通話聲音一起分別提供給正在進行聲音通信的多個所述聲音通信終端裝置。
3.根據(jù)權利要求1或2所述的業(yè)務服務器裝置,其特征在于,該業(yè)務服務器裝置還包括訂正指示受理部,其受理發(fā)送到所述聲音通信終端裝置的所述任務數(shù)據(jù)的訂正指示;以及學習部,其根據(jù)所述訂正指示受理部受理的訂正指示,對生成所述任務數(shù)據(jù)時使用的數(shù)據(jù)進行加權。
4.根據(jù)權利要求2所述的業(yè)務服務器裝置,其特征在于,所述任務執(zhí)行部在判定為由用戶作出的指示是該用戶的日程調(diào)整時,提取預先登記的與所述用戶相關的行動和與進行該行動的日期時刻相關的日程信息,使用所提取的日程信息,提取多個所述聲音通信終端裝置的用戶的沒有登記行動的共同日期時刻。
5.根據(jù)權利要求1或2所述的業(yè)務服務器裝置,其特征在于,所述任務數(shù)據(jù)提供部向文本通信終端裝置發(fā)送所述任務數(shù)據(jù)中的所述文本數(shù)據(jù)而取代所述聲音通信終端裝置,該文本通信終端裝置與該聲音通信終端裝置對應、且能夠進行基于文本的通信。
6.一種業(yè)務服務器裝置的業(yè)務提供方法,該業(yè)務服務器裝置與利用聲音相互進行通信的多個聲音通信終端裝置連接,提供基于其它任務的業(yè)務,該其它任務是與在該聲音通信終端裝置之間進行的聲音通信所涉及的應用程序不同的應用程序執(zhí)行的作業(yè),該業(yè)務提供方法的特征在于,包括以下步驟指示受理步驟,受理在聲音通信之間執(zhí)行所述其它任務的指示;錄音步驟,在多個所述聲音通信終端裝置之間的聲音通信中對說話者的通話聲音進行錄音;任務執(zhí)行步驟,在所述指示受理步驟中受理了所述指示的情況下,根據(jù)在所述錄音步驟中所錄的所述通話聲音,將所述通話聲音轉換為文本而生成文本數(shù)據(jù),將該文本數(shù)據(jù)翻譯為其它語言而生成翻譯文本數(shù)據(jù),將該翻譯文本數(shù)據(jù)轉換為聲音而生成聲音數(shù)據(jù);以及任務數(shù)據(jù)提供步驟,將所述文本數(shù)據(jù)、所述翻譯文本數(shù)據(jù)和所述聲音數(shù)據(jù)作為任務數(shù)據(jù)與所述通話聲音一起分別提供給正在進行聲音通信的多個所述聲音通信終端裝置。
7.—種業(yè)務服務器裝置的業(yè)務提供方法,該業(yè)務服務器裝置與利用聲音相互進行聲音通信的多個聲音通信終端裝置連接,提供基于其它任務的業(yè)務,該其它任務是與在該聲音通信終端裝置之間進行的聲音通信所涉及的應用程序不同的應用程序執(zhí)行的作業(yè),該業(yè)務提供方法的特征在于,包括以下步驟指示受理步驟,受理在聲音通信之間執(zhí)行所述其它任務的指示;錄音步驟,在多個所述聲音通信終端裝置之間的聲音通信中對說話者的通話聲音進行錄音;任務執(zhí)行步驟,在所述指示受理步驟中受理了所述指示的情況下,根據(jù)在所述錄音步驟中所錄的所述通話聲音判定由所述聲音通信終端裝置的用戶作出的指示,按照該指示提取預先登記的信息,使用所提取的信息來生成包含文本以及圖像中的至少一方的任務數(shù)據(jù);以及任務數(shù)據(jù)提供步驟,將包含文本以及圖像中的至少一方的所述任務數(shù)據(jù)與所述通話聲音一起分別提供給正在進行聲音通信的多個所述聲音通信終端裝置。
8.—種在業(yè)務服務器裝置中執(zhí)行的業(yè)務提供程序,該業(yè)務服務器裝置與利用聲音相互進行聲音通信的多個聲音通信終端裝置連接,提供基于其它任務的業(yè)務,該其它任務是與在該聲音通信終端裝置之間進行的聲音通信所涉及的應用程序不同的應用程序執(zhí)行的作業(yè),該業(yè)務提供程序的特征在于,使計算機實現(xiàn)以下功能指示受理功能,受理在聲音通信之間執(zhí)行所述其它任務的指示;錄音功能,在多個所述聲音通信終端裝置之間的聲音通信中對說話者的通話聲音進行錄音;任務執(zhí)行功能,在利用所述指示受理功能受理了所述指示時,根據(jù)在所述錄音功能中所錄的所述通話聲音,對所述通話聲音進行文本轉換而生成文本數(shù)據(jù),將該文本數(shù)據(jù)翻譯為其它語言而生成翻譯文本數(shù)據(jù),將該翻譯文本數(shù)據(jù)轉換為聲音而生成聲音數(shù)據(jù);以及任務數(shù)據(jù)提供功能,將所述文本數(shù)據(jù)、所述翻譯文本數(shù)據(jù)和所述聲音數(shù)據(jù)作為任務數(shù)據(jù)與所述通話聲音一起分別提供給正在進行聲音通信的多個所述聲音通信終端裝置。
9.一種在業(yè)務服務器裝置中執(zhí)行的業(yè)務提供程序,該業(yè)務服務器裝置與利用聲音相互進行聲音通信的多個聲音通信終端裝置連接,提供基于其它任務的業(yè)務,該其它任務是與在該聲音通信終端裝置之間進行的聲音通信所涉及的應用程序不同的應用程序執(zhí)行的作業(yè),該業(yè)務提供程序的特征在于,使計算機實現(xiàn)以下功能指示受理功能,受理在聲音通信之間執(zhí)行所述其它任務的指示;錄音功能,在多個所述聲音通信終端裝置之間的聲音通信中對說話者的通話聲音進行錄音;任務執(zhí)行功能,在利用所述指示受理功能受理了所述指示時,根據(jù)在所述錄音功能中所錄的所述通話聲音判定由所述聲音通信終端裝置的用戶作出的指示,按照該指示提取預先登記的信息,使用所提取的信息生成包含文本以及圖像中的至少一方的任務數(shù)據(jù);以及任務數(shù)據(jù)提供功能,將包含文本以及圖像中的至少一方的所述任務數(shù)據(jù)與所述通話聲音一起分別提供給正在進行聲音通信的多個所述聲音通信終端裝置。
全文摘要
提供可使用現(xiàn)有的應用程序來實現(xiàn)見面對話這樣的業(yè)務的業(yè)務服務器裝置。業(yè)務服務器裝置由以下的部件來構建業(yè)務啟動部,其受理在通信之間執(zhí)行任務的指示;電話/呼叫控制部,其在聲音通信終端裝置之間的通信中對說話者的通話聲音進行錄音;在受理了指示的情況下根據(jù)所錄的通話聲音來執(zhí)行任務的聲音識別使能器、文本翻譯使能器、聲音合成使能器;和通信控制使能器,其向聲音通信終端裝置提供通過執(zhí)行任務而獲得的任務數(shù)據(jù),使任務數(shù)據(jù)成為將通話聲音轉換為文本而得的文本數(shù)據(jù)、將文本數(shù)據(jù)翻譯為其它語言而得的翻譯文本數(shù)據(jù)、將翻譯文本數(shù)據(jù)轉換為聲音而得的聲音數(shù)據(jù)。
文檔編號H04M3/493GK103026697SQ201280002148
公開日2013年4月3日 申請日期2012年5月24日 優(yōu)先權日2011年5月24日
發(fā)明者那須和德, 柴田精司, 阿久澤真理, 內(nèi)山健 申請人:株式會社Ntt都科摩