輸出語音消息的方法和裝置與流程

文檔序號：11434052閱讀：260來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

本公開涉及信息技術(shù)領(lǐng)域，尤其涉及輸出語音消息的方法和裝置。

背景技術(shù)：

隨著語音識別技術(shù)的出現(xiàn)并逐漸成熟，語音助手應(yīng)運而生，越來越多的用戶選擇在終端上安裝語音助手應(yīng)用程序客戶端。

一方面用戶可以通過語音助手應(yīng)用程序客戶端發(fā)送語音信息向終端下達(dá)指令，使終端進(jìn)行處理，另一方面終端可以通過語音助手應(yīng)用程序客戶端向用戶告知相關(guān)消息。

然而相關(guān)技術(shù)中，語音助手應(yīng)用程序客戶端輸出的語音消息都是千篇一律的，不同的用戶聽到的語音消息的語音語調(diào)等都是相同的，缺乏趣味性和親切感，用戶的使用感受差。

技術(shù)實現(xiàn)要素：

為克服相關(guān)技術(shù)中存在的問題，本公開提供一種輸出語音消息的方法和裝置。

根據(jù)本公開實施例的第一方面，提供一種輸出語音消息的方法，應(yīng)用于服務(wù)器，包括：

根據(jù)用戶歷史發(fā)送的語音消息，獲取所述用戶的語音特征；

根據(jù)所述語音特征對待輸出的消息內(nèi)容進(jìn)行語音合成，得到具有所述語音特征的語音消息；

輸出所述語音消息。

可選地，所述根據(jù)用戶歷史發(fā)送的語音消息，獲取所述用戶的語音特征，包括：

將所述歷史發(fā)送的語音消息保存為所述語音特征；

所述根據(jù)所述語音特征對待輸出的消息內(nèi)容進(jìn)行語音合成，得到具有所述語音特征的語音消息，包括：

當(dāng)所述待輸出的消息內(nèi)容包括與所述歷史發(fā)送的語音消息相匹配的內(nèi)容時，利用所述歷史發(fā)送的語音消息的語音特征進(jìn)行語音合成。

可選地，所述根據(jù)用戶歷史發(fā)送的語音消息，獲取所述用戶的語音特征，包括：

從所述歷史發(fā)送的語音消息中獲取包括所述用戶的習(xí)慣用語的語音特征；

所述根據(jù)所述語音特征對待輸出的消息內(nèi)容進(jìn)行語音合成，得到具有所述語音特征的語音消息，包括：

當(dāng)所述待輸出的消息內(nèi)容包括相匹配的習(xí)慣用語時，利用包括所述用戶的習(xí)慣用語的語音特征進(jìn)行語音合成。

可選地，所述方法還包括：

確定所述用戶當(dāng)前所處的場景；

根據(jù)所述用戶當(dāng)前所處的場景，確定所述待輸出的消息內(nèi)容。

可選地，所述根據(jù)用戶歷史發(fā)送的語音消息，獲取所述用戶的語音特征，包括：

確定所述用戶發(fā)送所述歷史發(fā)送的語音消息時的場景；

獲取與所述用戶發(fā)送所述歷史發(fā)送的語音消息時的場景對應(yīng)的語音特征。

可選地，所述根據(jù)所述語音特征對待輸出的消息內(nèi)容進(jìn)行語音合成，得到具有所述語音特征的語音消息，包括：

確定所述用戶當(dāng)前所處的場景；

確定與所述用戶當(dāng)前所處的場景對應(yīng)的語音特征；

對所述待輸出的消息內(nèi)容進(jìn)行語音合成，得到具有與所述用戶當(dāng)前所處的場景對應(yīng)的語音特征的語音消息。

根據(jù)本公開實施例的第二方面，提供一種輸出語音消息的裝置，應(yīng)用于服務(wù)器，包括：

獲取模塊，用于根據(jù)用戶歷史發(fā)送的語音消息，獲取所述用戶的語音特征；

合成模塊，用于根據(jù)所述語音特征對待輸出的消息內(nèi)容進(jìn)行語音合成，得到具有所述語音特征的語音消息；

輸出模塊，用于輸出所述語音消息。

可選地，所述獲取模塊包括：

保存子模塊，用于將所述歷史發(fā)送的語音消息保存為所述語音特征；

所述合成模塊包括：

第一合成子模塊，用于當(dāng)所述待輸出的消息內(nèi)容包括與所述歷史發(fā)送的語音消息相匹配的內(nèi)容時，利用所述歷史發(fā)送的語音消息的語音特征進(jìn)行語音合成。

可選地，所述獲取模塊包括：

第一獲取子模塊，用于從所述歷史發(fā)送的語音消息中獲取包括所述用戶的習(xí)慣用語的語音特征；

所述合成模塊包括：

第二合成子模塊，用于當(dāng)所述待輸出的消息內(nèi)容包括相匹配的習(xí)慣用語時，利用包括所述用戶的習(xí)慣用語的語音特征進(jìn)行語音合成。

可選地，所述裝置還包括：

第一確定模塊，用于確定所述用戶當(dāng)前所處的場景；

第二確定模塊，用于根據(jù)所述用戶當(dāng)前所處的場景，確定所述待輸出的消息內(nèi)容。

可選地，所述獲取模塊包括：

第一確定子模塊，用于確定所述用戶發(fā)送所述歷史發(fā)送的語音消息時的場景；

第二獲取子模塊，用于獲取與所述用戶發(fā)送所述歷史發(fā)送的語音消息時的場景對應(yīng)的語音特征。

可選地，所述合成模塊包括：

第二確定子模塊，用于確定所述用戶當(dāng)前所處的場景，以及確定與所述用戶當(dāng)前所處的場景對應(yīng)的語音特征；

第三合成子模塊，用于對所述待輸出的消息內(nèi)容進(jìn)行語音合成，得到具有與所述用戶當(dāng)前所處的場景對應(yīng)的語音特征的語音消息。

根據(jù)本公開實施例的第三方面，提供一種輸出語音消息的裝置，應(yīng)用于服務(wù)器，包括：處理器；用于存儲處理器可執(zhí)行指令的存儲器；其中，所述處理器被配置為：

根據(jù)用戶歷史發(fā)送的語音消息，獲取所述用戶的語音特征；

根據(jù)所述語音特征對待輸出的消息內(nèi)容進(jìn)行語音合成，得到具有所述語音特征的語音消息；

輸出所述語音消息。

本公開的實施例提供的技術(shù)方案可以包括以下有益效果：語音助手的遠(yuǎn)端服務(wù)器從用戶歷史發(fā)送的語音消息中獲取用戶的語音特征，并根據(jù)用戶的語音特征合成語音消息，發(fā)送給語音助手應(yīng)用程序客戶端。增加了語音助手的趣味性和親切感，提高用戶的使用感受。

應(yīng)當(dāng)理解的是，以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的，并不能限制本公開。

附圖說明

此處的附圖被并入說明書中并構(gòu)成本說明書的一部分，示出了符合本公開的實施例，并與說明書一起用于解釋本公開的原理。

圖1是根據(jù)一示例性實施例示出的一種輸出語音消息的方法的流程圖。

圖2是根據(jù)一示例性實施例示出的一種輸出語音消息的方法的另一流程圖。

圖3是根據(jù)一示例性實施例示出的一種輸出語音消息的方法的另一流程圖。

圖4是根據(jù)一示例性實施例示出的一種輸出語音消息的方法的另一流程圖。

圖5是根據(jù)一示例性實施例示出的一種輸出語音消息的方法的另一流程圖。

圖6是根據(jù)一示例性實施例示出的一種輸出語音消息的方法的另一流程圖。

圖7是根據(jù)一示例性實施例示出的一種輸出語音消息的裝置的框圖。

圖8是根據(jù)一示例性實施例示出的一種輸出語音消息的裝置的另一框圖。

圖9是根據(jù)一示例性實施例示出的一種輸出語音消息的裝置的另一框圖。

圖10是根據(jù)一示例性實施例示出的一種輸出語音消息的裝置的另一框圖。

圖11是根據(jù)一示例性實施例示出的一種輸出語音消息的裝置中的獲取模塊的框圖。

圖12是根據(jù)一示例性實施例示出的一種輸出語音消息的裝置中的合成模塊的框圖。

圖13是根據(jù)一示例性實施例示出的一種輸出語音消息的裝置1300的框圖。

具體實施方式

這里將詳細(xì)地對示例性實施例進(jìn)行說明，其示例表示在附圖中。下面的描述涉及附圖時，除非另有表示，不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實施例中所描述的實施方式并不代表與本公開相一致的所有實施方式。相反，它們僅是與如所附權(quán)利要求書中所詳述的、本公開的一些方面相一致的裝置和方法的例子。

隨著手機(jī)的發(fā)展，手機(jī)的功能越來越豐富強大。在語音識別技術(shù)出現(xiàn)并逐漸成熟之后，語音助手應(yīng)用應(yīng)運而生，而且得到了廣泛的推廣，目前很多手機(jī)上都安裝有語音助手應(yīng)用程序客戶端。一方面，用戶可以通過終端安裝的語音助手應(yīng)用程序客戶端向語音助手的遠(yuǎn)端服務(wù)器發(fā)送語音消息的指令，語音助手的遠(yuǎn)端服務(wù)器在對語音消息進(jìn)行識別之后，將識別出的結(jié)果輸出給語音助手應(yīng)用程序客戶端，再由語音助手應(yīng)用程序客戶端向終端下達(dá)指令，比如，用戶可以通過語音助手控制終端開啟拍照功能，用戶可以通過語音助手控制終端播放歌曲；另一方面，終端可以將消息內(nèi)容通過安裝在終端的語音助手應(yīng)用程序客戶端發(fā)送給語音助手的遠(yuǎn)端服務(wù)器，語音助手服務(wù)器再將消息內(nèi)容合成為相關(guān)的語音消息發(fā)送給語音助手應(yīng)用程序客戶端，通過語音助手應(yīng)用程序客戶端向用戶告知相關(guān)的語音消息，比如，向用戶進(jìn)行問好，向用戶播報當(dāng)天日期，向用戶語音播報當(dāng)前的天氣情況等，給用戶提供更多的智能化的服務(wù)，給用戶帶來很多方便。

然而，用戶在使用語音助手的時候，不同的用戶聽到的語音助手的語音消息的語音特征都是相同的，不能根據(jù)用戶的實際狀況進(jìn)行個性化定制，使得用戶的使用語音助手的時候缺乏趣味性和親切感，用戶的使用感受較差。

為解決以上問題，本公開提供了輸出語音消息的方法和裝置，下面分別進(jìn)行說明。請參考圖1，圖1是根據(jù)一示例性實施例示出的一種輸出語音消息的方法的流程圖，如圖1所述，該方法包括步驟s11、步驟s12以及步驟s13。在對圖1所示的方法做出的說明中，如未特別說明，“服務(wù)器”指與語音助手相關(guān)聯(lián)的遠(yuǎn)端服務(wù)器。下面依次對各個步驟進(jìn)行說明。

在步驟s11中，根據(jù)用戶歷史發(fā)送的語音消息，獲取所述用戶的語音特征。

用戶的使用語音助手的時候，會通過語音助手應(yīng)用程序客戶端向服務(wù)器發(fā)送語音消息，這樣，服務(wù)器在接收到語音消息之后對用戶歷史發(fā)送的語音消息進(jìn)行分析及統(tǒng)計，確定出用戶的語音特征，將語音特征保存在數(shù)據(jù)庫中。本公開中，語音特征包括用戶的語音、語調(diào)、語速、音色、音量、習(xí)慣用語等特征。比如，服務(wù)器根據(jù)用戶歷史發(fā)送的語音消息確定出用戶的語音特征為：語速為每分鐘130字；音量較大；語調(diào)輕快；習(xí)慣用語包括例如“曉得”、“撒子”、“哦”等四川口音。

在步驟s12中，根據(jù)所述語音特征對待輸出的消息內(nèi)容進(jìn)行語音合成，得到具有所述語音特征的語音消息；

在步驟s13中，輸出所述語音消息。

本公開中，在獲取到用戶的語音特征之后，當(dāng)需要語音助手應(yīng)用程序客戶端輸出語音消息的時候，服務(wù)器從數(shù)據(jù)庫中調(diào)用出用戶的語音特征，并根據(jù)待輸出的消息內(nèi)容，進(jìn)行語音合成，合成語音特征與用戶的語音特征相同的語音消息，并將語音消息輸出給安裝在終端的語音助手應(yīng)用程序客戶端，這樣語音助手應(yīng)用程序客戶端就能將具有用戶語音特征的語音消息輸出給用戶，提高用戶的使用感受，增加語音助手的親切感和趣味性。

可選地，請參考圖2，圖2是根據(jù)一示例性實施例示出的一種輸出語音消息的方法的另一流程圖。如圖2所示，該方法包括步驟s201、步驟s202、以及以上所述的步驟s13。

在步驟s201中，將所述歷史發(fā)送的語音消息保存為所述語音特征；

在步驟s202中，當(dāng)所述待輸出的消息內(nèi)容包括與所述歷史發(fā)送的語音消息相匹配的內(nèi)容時，利用所述歷史發(fā)送的語音消息的語音特征進(jìn)行語音合成。

本公開中，由于服務(wù)器在獲取用戶語音特征的時候，需要對全部的歷史發(fā)送的語音消息進(jìn)行分析及統(tǒng)計，工作量較大，而且當(dāng)接收到用戶新發(fā)送的語音消息的時候，需要重新進(jìn)行分析、統(tǒng)計，進(jìn)一步提高了服務(wù)器的工作負(fù)荷；并且獲取到的語音特征與用戶歷史發(fā)送的語音信息的語音特征并不是一一對應(yīng)的，一些歷史發(fā)送的語音消息的語音特征可能與統(tǒng)計出的語音特征并不相同。當(dāng)服務(wù)器以分析及統(tǒng)計出的語音特征合成語音消息時，如果服務(wù)器輸出的語音消息的內(nèi)容包括這些歷史語音消息的內(nèi)容時，則與這些歷史采集的語音消息原本的語音特征不匹配，降低用戶的使用感受。

所以，本公開中，服務(wù)器可以針對用戶歷史發(fā)送的每條語音消息進(jìn)行分析，獲取與該條歷史發(fā)送的語音消息相對應(yīng)的語音特征，并保存在數(shù)據(jù)庫中。當(dāng)需要語音助手應(yīng)用程序客戶端向用戶輸出語音消息的時候，服務(wù)器獲取到待輸出的消息內(nèi)容，以及保存在數(shù)據(jù)庫中的歷史發(fā)送的語音消息的內(nèi)容。檢測待輸出的消息內(nèi)容是否包括歷史發(fā)送的語音消息的內(nèi)容，如果包括，則可以直接從數(shù)據(jù)庫中獲取到該條歷史發(fā)送的語音消息的語音特征，并利用相應(yīng)的語音特征進(jìn)行語音合成。

通過本實施例的方法，可以針對每條歷史發(fā)送的語音消息進(jìn)行分析，并獲取相對應(yīng)的語音特征，如果歷史發(fā)送的語音消息的內(nèi)容包含在待輸出的消息內(nèi)容中，則直接利用歷史發(fā)送的語音消息的語音特征進(jìn)行語音合成，更加符合用戶的語音特征，提高用戶的使用感受，減小服務(wù)器的工作負(fù)荷。

可選地，請參考圖3，圖3是根據(jù)一示例性實施例示出的一種輸出語音消息的方法的另一流程圖。如圖3所示，該方法包括步驟s301、步驟s302、以及以上所述的步驟s13。

在步驟s301中，從所述歷史發(fā)送的語音消息中獲取包括所述用戶的習(xí)慣用語的語音特征；

在步驟s302中，當(dāng)所述待輸出的消息內(nèi)容包括相匹配的習(xí)慣用語時，利用包括所述用戶的習(xí)慣用語的語音特征進(jìn)行語音合成。

不同的用戶說話的言辭習(xí)慣不同，在說話的時候的所攜帶的習(xí)慣用語也會不同，比如，有的用戶會在習(xí)慣在一句話的結(jié)尾加個“哦”，再比如有的用戶會習(xí)慣說“早上”而不習(xí)慣說“早晨”。本公開中，可以對用戶歷史發(fā)送的語音消息進(jìn)行分析及統(tǒng)計，獲取到用戶的習(xí)慣用語，并檢測待輸出的消息內(nèi)容是否包括用戶的習(xí)慣用語，如果包括，則可以利用用戶的習(xí)慣用語進(jìn)行語音合成。

示例地，服務(wù)器對于接收到的用戶發(fā)送的歷史消息進(jìn)行分析統(tǒng)計，確定出用戶的習(xí)慣用語包括“早上好”，“啥”，“咱們”，“呦”。當(dāng)服務(wù)器確定出待輸出消息的內(nèi)容時，服務(wù)器會將待輸出消息的內(nèi)容與已存儲的習(xí)慣用語進(jìn)行比較，查看待輸出的消息內(nèi)容是否包括相匹配的習(xí)慣用語，如果待輸出的消息內(nèi)容是向用戶問候早上好，則表明待輸出的消息內(nèi)容包括用戶的習(xí)慣用語“早上好”和“呦”，則可以根據(jù)“早上好”和“呦”的習(xí)慣用語合成“早上好呦”的語音消息。

通過本實施例的方法，可以從歷史發(fā)送的語音消息中獲取到用戶的習(xí)慣用語，并利用用戶的習(xí)慣用戶合成語音消息，使得輸出的語音消息更符合用戶的用語習(xí)慣，提升用戶的使用感受。

用戶在使用終端的時候會發(fā)生場景變化的情況，而用戶并未發(fā)現(xiàn)這些場景變化，這樣可能會對用戶帶來不便，比如用戶所在的地區(qū)溫度較低，但是用戶未能及時獲取到溫度信息；又比如，用戶所在的地區(qū)出現(xiàn)惡劣天氣，但是用戶未能及時獲取到天氣變化信息，導(dǎo)致用戶受到惡劣天氣的侵害，諸如此類，給用戶帶來很多的不便。為解決以上問題，本公開中在向用戶發(fā)送語音消息的時候，可以先確定用戶當(dāng)前所處的場景，再根據(jù)場景確定出待輸出的消息內(nèi)容。

可選地，請參考圖4，圖4是根據(jù)一示例性實施例示出的一種輸出語音消息的方法的另一流程圖。如圖4所示，該方法包括步驟s401、步驟s402、以及以上所述的步驟s11、s12和s13。

在步驟s401中，確定所述用戶當(dāng)前所處的場景；

在步驟s402中，根據(jù)所述用戶當(dāng)前所處的場景，確定所述待輸出的消息內(nèi)容。

首先，服務(wù)器可以先確定出用戶當(dāng)前所處的場景。本公開中，場景包括用戶當(dāng)前所處的位置、用戶當(dāng)前所處位置的溫度、濕度、天氣等以及用戶當(dāng)前使用終端時的時間等。比如，服務(wù)器可以根據(jù)終端設(shè)置的定位模塊確定出用戶當(dāng)前所處的位置；服務(wù)器可以接入網(wǎng)絡(luò)，從網(wǎng)絡(luò)上獲取用戶當(dāng)前所處位置的溫度、濕度、天氣等；用戶在使用終端時，服務(wù)器可以獲取用戶當(dāng)前使用終端時的時間。

然后，服務(wù)器根據(jù)已經(jīng)確定出的場景，確定出與場景相匹配的待輸出的消息內(nèi)容。比如，服務(wù)器檢測到用戶在凌晨兩點在使用終端，則這時可以輸出語音消息提醒用戶早點休息，不要工作到太晚；又比如，服務(wù)器檢測到用戶所在的城市正在下雪，則可以輸出語音消息提醒用戶及時添加衣物，并提醒用戶在戶外行走時注意防滑。

通過本實施例的方法，可以根據(jù)用戶當(dāng)前所處的場景向用戶輸出語音消息，使得語音助手更加人性化，進(jìn)一步提高了用戶的使用感受。

可選地，請參考圖5，圖5是根據(jù)一示例性實施例示出的一種輸出語音消息的方法的另一流程圖。如圖5所示，該方法包括步驟s501、步驟s502。

在步驟s501中，確定所述用戶發(fā)送所述歷史發(fā)送的語音消息時的場景；

在步驟s502中，獲取與所述用戶發(fā)送所述歷史發(fā)送的語音消息時的場景對應(yīng)的語音特征。

用戶在發(fā)送語音消息的時候，所處的場景不同，則相對應(yīng)的語音特征也會不同，比如，在晚上時用戶發(fā)送的語音消息的語調(diào)會比較慵懶，在早上時用戶發(fā)送的語音消息的語調(diào)會比較輕快；又比如，用戶在辦公室會用普通話發(fā)送語音消息，在家時會用四川話發(fā)送語音消息。如果服務(wù)器發(fā)送的語音消息的語音特征與用戶所處的場景不匹配，比如，在早上時輸出語調(diào)較慵懶的語音消息，或者服務(wù)器在用戶位于辦公室時輸出四川口音的語音消息，則會令用戶感到不適，降低用戶的使用感受。

所以本公開的實施例中，可以對語音特征按照場景進(jìn)行分類，服務(wù)器首先確定出用戶歷史發(fā)送的語音消息時的場景，再獲取該場景下的語音特征。這樣服務(wù)器在合成語音消息時，就可以根據(jù)用戶當(dāng)前的場景確定出與當(dāng)前場景對應(yīng)的語音特征，合成語音消息。

通過本實施例的方法，可以根據(jù)用戶歷史發(fā)送語音消息時的場景，對語音特征進(jìn)行分類，使得服務(wù)器在輸出語音消息時，更加符合用戶的實際使用狀況，提高用戶使用感受。

可選地，請參考圖6，圖6是根據(jù)一示例性實施例示出的一種輸出語音消息的方法的另一流程圖。如圖6所示，該方法包括步驟s601、步驟s602和步驟s603。

在步驟s601中，確定所述用戶當(dāng)前所處的場景；

在步驟s602中，確定與所述用戶當(dāng)前所處的場景對應(yīng)的語音特征；

在步驟s603中，對所述待輸出的消息內(nèi)容進(jìn)行語音合成，得到具有與所述用戶當(dāng)前所處的場景對應(yīng)的語音特征的語音消息。

本公開中，在合成語音消息時，可以先確定出用戶的當(dāng)前所處的場景，并確定出與當(dāng)前所處的場景對應(yīng)的語音特征，利用與用戶當(dāng)前所處的場景相匹配的語音特征合成語音消息。示例地，服務(wù)器在向用戶輸出語音消息時，首先檢測用戶當(dāng)前所處的場景，如果檢測到用戶當(dāng)前使用手機(jī)助手時的時間為早上，則在數(shù)據(jù)庫中，獲取與早上相對應(yīng)的語音特征，若用戶在早上的語調(diào)較輕快，則服務(wù)器可以按照較輕快的語調(diào)合成語音消息，并輸出。

通過本公開提供的方法，可以使得服務(wù)器合成的語音消息更加符合用戶的實際使用情況，提高用戶使用感受。

本公開還提供一種輸出語音消息的裝置，該裝置用于執(zhí)行前述輸出語音消息的方法，可配置于服務(wù)器中。請參考圖7，圖7是根據(jù)一示例性實施例示出的一種輸出語音消息的裝置的框圖。如圖7所示，該裝置10包括獲取模塊11、合成模塊12和輸出模塊13。

獲取模塊11，用于根據(jù)用戶歷史發(fā)送的語音消息，獲取所述用戶的語音特征；

合成模塊12，用于根據(jù)所述語音特征對待輸出的消息內(nèi)容進(jìn)行語音合成，得到具有所述語音特征的語音消息；

輸出模塊13，用于輸出所述語音消息。

可選地，請參考圖8，圖8是根據(jù)一示例性實施例示出的一種輸出語音消息的裝置的另一框圖。如圖8所示，該裝置10包括獲取模塊11、合成模塊12和輸出模塊13，其中，所述獲取模塊11包括：

保存子模塊111，用于將所述歷史發(fā)送的語音消息保存為所述語音特征；

所述合成模塊12包括：

第一合成子模塊121，用于當(dāng)所述待輸出的消息內(nèi)容包括與所述歷史發(fā)送的語音消息相匹配的內(nèi)容時，利用所述歷史發(fā)送的語音消息的語音特征進(jìn)行語音合成。

可選地，請參考圖9，圖9是根據(jù)一示例性實施例示出的一種輸出語音消息的裝置的另一框圖。如圖9所示，該裝置10包括獲取模塊11、合成模塊12和輸出模塊13，其中，所述獲取模塊11包括：

第一獲取子模塊112，用于從所述歷史發(fā)送的語音消息中獲取包括所述用戶的習(xí)慣用語的語音特征；

所述合成模塊12包括：

第二合成子模塊122，用于當(dāng)所述待輸出的消息內(nèi)容包括相匹配的習(xí)慣用語時，利用包括所述用戶的習(xí)慣用語的語音特征進(jìn)行語音合成。

可選地，請參考圖10，圖10是根據(jù)一示例性實施例示出的一種輸出語音消息的裝置的另一框圖。如圖10所示，所述裝置10還包括：

第一確定模塊14，用于確定所述用戶當(dāng)前所處的場景；

第二確定模塊15，用于根據(jù)所述用戶當(dāng)前所處的場景，確定所述待輸出的消息內(nèi)容。

可選地，請參考圖11，圖11是根據(jù)一示例性實施例示出的一種輸出語音消息的裝置中的獲取模塊的框圖。如圖11所示，所述獲取模塊11包括：

第一確定子模塊113，用于確定所述用戶發(fā)送所述歷史發(fā)送的語音消息時的場景；

第二獲取子模塊114，用于獲取與所述用戶發(fā)送所述歷史發(fā)送的語音消息時的場景對應(yīng)的語音特征。

可選地，請參考圖12，圖12是根據(jù)一示例性實施例示出的一種輸出語音消息的裝置中的合成模塊的框圖。如圖12所示，所述合成模塊12包括：

第二確定子模塊123，用于確定所述用戶當(dāng)前所處的場景，以及確定與所述用戶當(dāng)前所處的場景對應(yīng)的語音特征；

第三合成子模塊124，用于對所述待輸出的消息內(nèi)容進(jìn)行語音合成，得到具有與所述用戶當(dāng)前所處的場景對應(yīng)的語音特征的語音消息。

圖13是根據(jù)一示例性實施例示出的一種輸出語音消息的裝置1300的框圖。例如，裝置1300可以被提供為一服務(wù)器。參照圖13，裝置1300包括處理組件1322，其進(jìn)一步包括一個或多個處理器，以及由存儲器1332所代表的存儲器資源，用于存儲可由處理組件1322的執(zhí)行的指令，例如應(yīng)用程序。存儲器1332中存儲的應(yīng)用程序可以包括一個或一個以上的每一個對應(yīng)于一組指令的模塊。此外，處理組件1322被配置為執(zhí)行指令，以執(zhí)行上述輸出語音消息的方法。

裝置1300還可以包括一個電源組件1326被配置為執(zhí)行裝置1300的電源管理，一個有線或無線網(wǎng)絡(luò)接口1350被配置為將裝置1300連接到網(wǎng)絡(luò)，和一個輸入輸出(i/o)接口1358。裝置1300可以操作基于存儲在存儲器1332的操作系統(tǒng)，例如windowsservertm，macosxtm，unixtm,linuxtm，freebsdtm或類似。

本領(lǐng)域技術(shù)人員在考慮說明書及實踐本公開后，將容易想到本公開的其它實施方案。本申請旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化，這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本技術(shù)領(lǐng)域中的公知常識或慣用技術(shù)手段。說明書和實施例僅被視為示例性的，本公開的真正范圍和精神由下面的權(quán)利要求指出。

應(yīng)當(dāng)理解的是，本公開并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu)，并且可以在不脫離其范圍進(jìn)行各種修改和改變。本公開的范圍僅由所附的權(quán)利要求來限制。

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁1 2