所屬的技術(shù)人員能夠理解,本公開的各個(gè)方面可以實(shí)現(xiàn)為系統(tǒng)、方法或程序產(chǎn)品。因此,本公開的各個(gè)方面可以具體實(shí)現(xiàn)為以下形式,即:完全的硬件實(shí)施方式、完全的軟件實(shí)施方式(包括固件、微代碼等),或硬件和軟件方面結(jié)合的實(shí)施方式,這里可以統(tǒng)稱為“電路”、“模塊”或“系統(tǒng)”。本公開實(shí)施例提供了一種電子設(shè)備,示例性地,該電子設(shè)備包括:處理器與存儲(chǔ)器。該存儲(chǔ)器可以用于存儲(chǔ)處理器的可執(zhí)行指令。其中,處理器配置為經(jīng)由執(zhí)行上述可執(zhí)行指令來本公開實(shí)施例提供的數(shù)字人播報(bào)方法。下面參照?qǐng)D6來描述根據(jù)本公開的這種實(shí)施方式的電子設(shè)備600。圖6顯示的電子設(shè)備600僅僅是一個(gè)示例,不應(yīng)對(duì)本公開實(shí)施例的功能和使用范圍帶來任何限制。如圖6所示,電子設(shè)備600以通用計(jì)算設(shè)備的形式表現(xiàn)。電子設(shè)備600的組件可以包括但不限于:至少一個(gè)處理單元610、至少一個(gè)存儲(chǔ)單元620、連接不同系統(tǒng)組件(包括存儲(chǔ)單元620和處理單元610)的總線630。其中,該存儲(chǔ)單元存儲(chǔ)有程序代碼,該程序代碼可以被該處理單元610執(zhí)行,使得該處理單元610執(zhí)行本說明書上述“示例性方法”部分中描述的根據(jù)本公開各種示例性實(shí)施方式的步驟。例如,該處理單元610可以執(zhí)行上述方法實(shí)施例的如下步驟:響應(yīng)于在數(shù)字人播報(bào)過程中接收到打斷請(qǐng)求,確定當(dāng)前的待播報(bào)數(shù)據(jù),該待播報(bào)數(shù)據(jù)包括從當(dāng)前進(jìn)度幀起始的至少一幀待播報(bào)的音視頻流;按時(shí)間順序?qū)υ摯?bào)數(shù)據(jù)進(jìn)行遍歷,確定該待播報(bào)數(shù)據(jù)中滿足平滑結(jié)束條件的結(jié)束幀,該平滑結(jié)束條件包括當(dāng)數(shù)字人播報(bào)至該結(jié)束幀時(shí)處于自然停頓;根據(jù)從該當(dāng)前進(jìn)度幀至該結(jié)束幀部分的待播報(bào)數(shù)據(jù),確定播報(bào)替換數(shù)據(jù);對(duì)該播報(bào)替換數(shù)據(jù)進(jìn)行數(shù)字人播報(bào)。存儲(chǔ)單元620可以包括易失性存儲(chǔ)單元形式的可讀介質(zhì),例如隨機(jī)存取存儲(chǔ)單元(ram)6201和/或高速緩存存儲(chǔ)單元6202,還可以進(jìn)一步包括只讀存儲(chǔ)單元(rom)6203。存儲(chǔ)單元620還可以包括具有一組(至少一個(gè))程序模塊6205的程序/實(shí)用工具6204,這樣的程序模塊6205包括但不限于:操作系統(tǒng)、一個(gè)或者多個(gè)應(yīng)用程序、其它程序模塊以及程序數(shù)據(jù),這些示例中的每一個(gè)或某種組合中可能包括網(wǎng)絡(luò)環(huán)境的實(shí)現(xiàn)。總線630可以為表示幾類總線結(jié)構(gòu)中的一種或多種,包括存儲(chǔ)單元總線或者存儲(chǔ)單元控制器、外圍總線、圖形加速端口、處理單元或者使用多種總線結(jié)構(gòu)中的任意總線結(jié)構(gòu)的局域總線。電子設(shè)備600也可以與一個(gè)或多個(gè)外部設(shè)備640(例如鍵盤、指向設(shè)備、藍(lán)牙設(shè)備等)通信,還可與一個(gè)或者多個(gè)使得用戶能與該電子設(shè)備600交互的設(shè)備通信,和/或與使得該電子設(shè)備600能與一個(gè)或多個(gè)其它計(jì)算設(shè)備進(jìn)行通信的任何設(shè)備(例如路由器、調(diào)制解調(diào)器等等)通信。這種通信可以通過輸入/輸出(i/o)接口650進(jìn)行。并且,電子設(shè)備600還可以通過網(wǎng)絡(luò)適配器660與一個(gè)或者多個(gè)網(wǎng)絡(luò)(例如局域網(wǎng)(lan),廣域網(wǎng)(wan)和/或公共網(wǎng)絡(luò),例如因特網(wǎng))通信。如圖所示,網(wǎng)絡(luò)適配器660通過總線630與電子設(shè)備600的其它模塊通信。應(yīng)當(dāng)明白,盡管圖中未示出,可以結(jié)合電子設(shè)備600使用其它硬件和/或軟件模塊,包括但不限于:微代碼、設(shè)備驅(qū)動(dòng)器、冗余處理單元、外部磁盤驅(qū)動(dòng)陣列、raid系統(tǒng)、磁帶驅(qū)動(dòng)器以及數(shù)據(jù)備份存儲(chǔ)系統(tǒng)等。通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員易于理解,這里描述的示例實(shí)施方式可以通過軟件實(shí)現(xiàn),也可以通過軟件結(jié)合必要的硬件的方式來實(shí)現(xiàn)。因此,根據(jù)本公開實(shí)施方式的技術(shù)方案可以以軟件產(chǎn)品的形式體現(xiàn)出來,該軟件產(chǎn)品可以存儲(chǔ)在一個(gè)非易失性存儲(chǔ)介質(zhì)(可以是cd-rom,u盤,移動(dòng)硬盤等)中或網(wǎng)絡(luò)上,包括若干指令以使得一臺(tái)計(jì)算設(shè)備(可以是個(gè)人計(jì)算機(jī)、服務(wù)器、終端裝置、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行根據(jù)本公開實(shí)施方式的方法。特別地,根據(jù)本公開的實(shí)施例,上文參考流程圖描述的過程可以被實(shí)現(xiàn)為計(jì)算機(jī)程序產(chǎn)品,該計(jì)算機(jī)程序產(chǎn)品包括:計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述數(shù)字人播報(bào)方法。在本公開的示例性實(shí)施例中,還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,計(jì)算機(jī)程序被處理器執(zhí)行時(shí)可以實(shí)現(xiàn)本公開實(shí)施例提供的數(shù)字人播報(bào)方法。該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是可讀信號(hào)介質(zhì)或者可讀存儲(chǔ)介質(zhì)。圖7示出本公開實(shí)施例中一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)示意圖,如圖7所示,該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)700上存儲(chǔ)有能夠?qū)崿F(xiàn)本公開上述方法的程序產(chǎn)品。在一些可能的實(shí)施方式中,本公開的各個(gè)方面還可以實(shí)現(xiàn)為一種程序產(chǎn)品的形式,其包括程序代碼,當(dāng)該程序產(chǎn)品在終端設(shè)備上運(yùn)行時(shí),該程序代碼用于使該終端設(shè)備執(zhí)行本說明書上述“示例性方法”部分中描述的根據(jù)本公開各種示例性實(shí)施方式的步驟。本公開中的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子可以包括但不限于:具有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式計(jì)算機(jī)磁盤、硬盤、隨機(jī)訪問存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、可擦式可編程只讀存儲(chǔ)器(eprom或閃存)、光纖、便攜式緊湊磁盤只讀存儲(chǔ)器(cd-rom)、光存儲(chǔ)器件、磁存儲(chǔ)器件、或者上述的任意合適的組合。在本公開中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號(hào),其中承載了可讀程序代碼。這種傳播的數(shù)據(jù)信號(hào)可以采用多種形式,包括但不限于電磁信號(hào)、光信號(hào)或上述的任意合適的組合??勺x信號(hào)介質(zhì)還可以是可讀存儲(chǔ)介質(zhì)以外的任何可讀介質(zhì),該可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序??蛇x地,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括但不限于無線、有線、光纜、rf等等,或者上述的任意合適的組合。在具體實(shí)施時(shí),可以以一種或多種程序設(shè)計(jì)語言的任意組合來編寫用于執(zhí)行本公開操作的程序代碼,該程序設(shè)計(jì)語言包括面向?qū)ο蟮某绦蛟O(shè)計(jì)語言—諸如java、c++等,還包括常規(guī)的過程式程序設(shè)計(jì)語言—諸如“c”語言或類似的程序設(shè)計(jì)語言。程序代碼可以完全地在用戶計(jì)算設(shè)備上執(zhí)行、部分地在用戶設(shè)備上執(zhí)行、作為一個(gè)獨(dú)立的軟件包執(zhí)行、部分在用戶計(jì)算設(shè)備上部分在遠(yuǎn)程計(jì)算設(shè)備上執(zhí)行、或者完全在遠(yuǎn)程計(jì)算設(shè)備或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計(jì)算設(shè)備的情形中,遠(yuǎn)程計(jì)算設(shè)備可以通過任意種類的網(wǎng)絡(luò),包括局域網(wǎng)(lan)或廣域網(wǎng)(wan),連接到用戶計(jì)算設(shè)備,或者,可以連接到外部計(jì)算設(shè)備(例如利用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng)連接)。應(yīng)當(dāng)注意,盡管在上文詳細(xì)描述中提及了用于動(dòng)作執(zhí)行的設(shè)備的若干模塊或者單元,但是這種劃分并非強(qiáng)制性的。實(shí)際上,根據(jù)本公開的實(shí)施方式,上文描述的兩個(gè)或更多模塊或者單元的特征和功能可以在一個(gè)模塊或者單元中具體化。反之,上文描述的一個(gè)模塊或者單元的特征和功能可以進(jìn)一步劃分為由多個(gè)模塊或者單元來具體化。此外,盡管在附圖中以特定順序描述了本公開中方法的各個(gè)步驟,但是,這并非要求或者暗示必須按照該特定順序來執(zhí)行這些步驟,或是必須執(zhí)行全部所示的步驟才能實(shí)現(xiàn)期望的結(jié)果。附加的或備選的,可以省略某些步驟,將多個(gè)步驟合并為一個(gè)步驟執(zhí)行,以及/或者將一個(gè)步驟分解為多個(gè)步驟執(zhí)行等。通過以上實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員易于理解,這里描述的示例實(shí)施方式可以通過軟件實(shí)現(xiàn),也可以通過軟件結(jié)合必要的硬件的方式來實(shí)現(xiàn)。因此,根據(jù)本公開實(shí)施方式的技術(shù)方案可以以軟件產(chǎn)品的形式體現(xiàn)出來,該軟件產(chǎn)品可以存儲(chǔ)在一個(gè)非易失性存儲(chǔ)介質(zhì)(可以是cd-rom,u盤,移動(dòng)硬盤等)中或網(wǎng)絡(luò)上,包括若干指令以使得一臺(tái)計(jì)算設(shè)備(可以是個(gè)人計(jì)算機(jī)、服務(wù)器、移動(dòng)終端、或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行根據(jù)本公開實(shí)施方式的方法。本領(lǐng)域技術(shù)人員在考慮說明書及實(shí)踐這里公開的發(fā)明后,將容易想到本公開的其它實(shí)施方案。本公開旨在涵蓋本公開的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本公開的一般性原理并包括本公開未公開的本中的公知常識(shí)或慣用技術(shù)手段。說明書和實(shí)施例僅被視為示例性的,本公開的真正范圍由所附的權(quán)利要求指出。
背景技術(shù):
1、數(shù)字人技術(shù)是一種集機(jī)器學(xué)習(xí)、自然語言處理、語音合成等多種技術(shù)于一體的綜合性技術(shù),旨在創(chuàng)造出身臨其境、高度逼真且具有人類特征與交互能力的虛擬人物。隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,數(shù)字人正在逐步應(yīng)用到日常生活的各個(gè)方面。
2、在相關(guān)技術(shù)中,可以將數(shù)字人作為虛擬主播或新聞播報(bào)員,來播報(bào)語音信息。但是,當(dāng)用戶進(jìn)行播報(bào)暫?;蛲顺霾?bào)的操作時(shí),相關(guān)技術(shù)提供的數(shù)字人播報(bào)方法則會(huì)直接打斷數(shù)字人播報(bào)及動(dòng)作,打斷效果生硬,聲音有明顯斷點(diǎn),且數(shù)字人畫面跳幀明顯。
3、需要說明的是,在上述背景技術(shù)部分公開的信息僅用于加強(qiáng)對(duì)本公開的背景的理解,因此可以包括不構(gòu)成對(duì)本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技術(shù)的信息。
技術(shù)實(shí)現(xiàn)思路
1、本公開提供一種數(shù)字人播報(bào)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),至少在一定程度上克服相關(guān)技術(shù)直接對(duì)數(shù)字人播報(bào)及動(dòng)作進(jìn)行打斷而造成的打斷效果生硬,聲音有明顯斷點(diǎn),且數(shù)字人畫面跳幀明顯的問題。
2、本公開的其他特性和優(yōu)點(diǎn)將通過下面的詳細(xì)描述變得顯然,或部分地通過本公開的實(shí)踐而習(xí)得。
3、根據(jù)本公開的一個(gè)方面,提供了一種數(shù)字人播報(bào),包括:響應(yīng)于在數(shù)字人播報(bào)過程中接收到打斷請(qǐng)求,確定當(dāng)前的待播報(bào)數(shù)據(jù),該待播報(bào)數(shù)據(jù)包括從當(dāng)前進(jìn)度幀起始的至少一幀待播報(bào)的音視頻流;按時(shí)間順序?qū)υ摯?bào)數(shù)據(jù)進(jìn)行遍歷,確定該待播報(bào)數(shù)據(jù)中滿足平滑結(jié)束條件的結(jié)束幀,該平滑結(jié)束條件包括當(dāng)數(shù)字人播報(bào)至該結(jié)束幀時(shí)處于自然停頓;根據(jù)從該當(dāng)前進(jìn)度幀至該結(jié)束幀部分的待播報(bào)數(shù)據(jù),確定播報(bào)替換數(shù)據(jù);對(duì)該播報(bào)替換數(shù)據(jù)進(jìn)行數(shù)字人播報(bào)。
4、在一些示例性實(shí)施例中,響應(yīng)于在數(shù)字人播報(bào)過程中接收到打斷請(qǐng)求,確定當(dāng)前的待播報(bào)數(shù)據(jù)之前,還包括:獲取音頻信息與音素信息;根據(jù)該音素信息生成數(shù)字人唇形參數(shù);對(duì)該數(shù)字人唇形參數(shù)進(jìn)行渲染,得到多幀數(shù)字人唇部圖像;向該播報(bào)端發(fā)送音視頻流以進(jìn)行數(shù)字人播報(bào),該音視頻流包括多幀數(shù)字人唇部圖像以及與該多幀數(shù)字人唇部圖像對(duì)應(yīng)的音頻數(shù)據(jù)。
5、在一些示例性實(shí)施例中,待播報(bào)數(shù)據(jù)還包括該至少一幀待播報(bào)的音視頻流對(duì)應(yīng)的動(dòng)作幀信息,該獲取音頻信息與音素信息之后,還包括:獲取動(dòng)作信息;根據(jù)該動(dòng)作信息對(duì)數(shù)字人播報(bào)動(dòng)作進(jìn)行編排得到多幀動(dòng)作幀信息,其中,任一編排的動(dòng)作由一個(gè)動(dòng)作幀信息或連續(xù)的多個(gè)動(dòng)作幀信息組成,該動(dòng)作包括表情動(dòng)作、肢體動(dòng)作中的至少一種;
6、該向該播報(bào)端發(fā)送音視頻流以進(jìn)行數(shù)字人播報(bào),包括:向該播報(bào)端發(fā)送音視頻流與該動(dòng)作幀信息以進(jìn)行數(shù)字人播報(bào)。
7、在一些示例性實(shí)施例中,當(dāng)該待播報(bào)數(shù)據(jù)還包括該至少一幀待播報(bào)的音視頻流對(duì)應(yīng)的動(dòng)作幀信息時(shí),該平滑結(jié)束條件還包括當(dāng)數(shù)字人播報(bào)至該結(jié)束幀時(shí)未執(zhí)行動(dòng)作或執(zhí)行目標(biāo)動(dòng)作的結(jié)尾。
8、在一些示例性實(shí)施例中,根據(jù)從該當(dāng)前進(jìn)度幀至該結(jié)束幀部分的待播報(bào)數(shù)據(jù),確定播報(bào)替換數(shù)據(jù),包括:若當(dāng)數(shù)字人播報(bào)至該結(jié)束幀時(shí)未執(zhí)行動(dòng)作,則將該當(dāng)前進(jìn)度幀至該結(jié)束幀部分的待播報(bào)數(shù)據(jù),作為該播報(bào)替換數(shù)據(jù)。
9、在一些示例性實(shí)施例中,根據(jù)從該當(dāng)前進(jìn)度幀至該結(jié)束幀部分的待播報(bào)數(shù)據(jù),確定播報(bào)替換數(shù)據(jù),包括:若當(dāng)數(shù)字人播報(bào)至該結(jié)束幀時(shí)執(zhí)行目標(biāo)動(dòng)作的結(jié)尾,則獲取該當(dāng)前進(jìn)度幀至該結(jié)束幀部分的待播報(bào)數(shù)據(jù);在該當(dāng)前進(jìn)度幀至該結(jié)束幀部分的待播報(bào)數(shù)據(jù)的末尾,添加該目標(biāo)動(dòng)作結(jié)尾尚未執(zhí)行的動(dòng)作幀信息與靜音狀態(tài)的音視頻流,以得到該播報(bào)替換數(shù)據(jù),其中,該靜音狀態(tài)的音視頻流的時(shí)間長度與該尚未執(zhí)行的動(dòng)作幀信息的時(shí)間長度相同。
10、在一些示例性實(shí)施例中,響應(yīng)于在數(shù)字人播報(bào)過程中接收到打斷請(qǐng)求,確定當(dāng)前的待播報(bào)數(shù)據(jù),包括:響應(yīng)于在數(shù)字人播報(bào)過程中接收到打斷請(qǐng)求,判斷該數(shù)字人播報(bào)過程是否支持打斷;若支持打斷,則確定當(dāng)前的待播報(bào)數(shù)據(jù)。
11、根據(jù)本公開的另一個(gè)方面,還提供了一種數(shù)字人播報(bào)裝置,包括:
12、待播報(bào)數(shù)據(jù)確定模塊,用于響應(yīng)于在數(shù)字人播報(bào)過程中接收到打斷請(qǐng)求,確定當(dāng)前的待播報(bào)數(shù)據(jù),該待播報(bào)數(shù)據(jù)包括從當(dāng)前進(jìn)度幀起始的至少一幀待播報(bào)的音視頻流;
13、結(jié)束幀確定模塊,用于按時(shí)間順序?qū)υ摯?bào)數(shù)據(jù)進(jìn)行遍歷,確定該待播報(bào)數(shù)據(jù)中滿足平滑結(jié)束條件的結(jié)束幀,該平滑結(jié)束條件包括當(dāng)數(shù)字人播報(bào)至該結(jié)束幀時(shí)處于自然停頓;
14、播報(bào)替換數(shù)據(jù)確定模塊,用于根據(jù)從該當(dāng)前進(jìn)度幀至該結(jié)束幀部分的待播報(bào)數(shù)據(jù),確定播報(bào)替換數(shù)據(jù);
15、播報(bào)替換數(shù)據(jù)發(fā)送模塊,用于對(duì)該播報(bào)替換數(shù)據(jù)進(jìn)行數(shù)字人播報(bào)。
16、在一些示例性實(shí)施例中,本公開實(shí)施例提供的數(shù)字人播報(bào)裝置,還包括:信息獲取模塊,用于獲取音頻信息與音素信息;參數(shù)生成模塊,用于根據(jù)該音素信息生成數(shù)字人唇形參數(shù);圖像渲染模塊,用于對(duì)該數(shù)字人唇形參數(shù)進(jìn)行渲染,得到多幀數(shù)字人唇部圖像;音視頻流發(fā)送模塊,用于向該播報(bào)端發(fā)送音視頻流以進(jìn)行數(shù)字人播報(bào),該音視頻流包括多幀數(shù)字人唇部圖像以及與該多幀數(shù)字人唇部圖像對(duì)應(yīng)的音頻數(shù)據(jù)。
17、在一些示例性實(shí)施例中,該信息獲取模塊,還用于獲取動(dòng)作信息;本公開實(shí)施例提供的數(shù)字人播報(bào)裝置,還包括:動(dòng)作幀信息確定模塊,用于根據(jù)該動(dòng)作信息對(duì)數(shù)字人播報(bào)動(dòng)作進(jìn)行編排得到多幀動(dòng)作幀信息,其中,任一編排的動(dòng)作由一個(gè)動(dòng)作幀信息或連續(xù)的多個(gè)動(dòng)作幀信息組成,該動(dòng)作包括表情動(dòng)作、肢體動(dòng)作中的至少一種;音視頻流發(fā)送模塊,用于向該播報(bào)端發(fā)送音視頻流與該動(dòng)作幀信息以進(jìn)行數(shù)字人播報(bào)。
18、在一些示例性實(shí)施例中,當(dāng)該待播報(bào)數(shù)據(jù)還包括該至少一幀待播報(bào)的音視頻流對(duì)應(yīng)的動(dòng)作幀信息時(shí),該平滑結(jié)束條件還包括當(dāng)數(shù)字人播報(bào)至該結(jié)束幀時(shí)未執(zhí)行動(dòng)作或執(zhí)行目標(biāo)動(dòng)作的結(jié)尾。
19、在一些示例性實(shí)施例中,播報(bào)替換數(shù)據(jù)確定模塊,用于若當(dāng)數(shù)字人播報(bào)至該結(jié)束幀時(shí)未執(zhí)行動(dòng)作,則將該當(dāng)前進(jìn)度幀至該結(jié)束幀部分的待播報(bào)數(shù)據(jù),作為該播報(bào)替換數(shù)據(jù)。
20、在一些示例性實(shí)施例中,播報(bào)替換數(shù)據(jù)確定模塊,用于若當(dāng)數(shù)字人播報(bào)至該結(jié)束幀時(shí)執(zhí)行目標(biāo)動(dòng)作的結(jié)尾,則獲取該當(dāng)前進(jìn)度幀至該結(jié)束幀部分的待播報(bào)數(shù)據(jù);在該當(dāng)前進(jìn)度幀至該結(jié)束幀部分的待播報(bào)數(shù)據(jù)的末尾,添加該目標(biāo)動(dòng)作結(jié)尾尚未執(zhí)行的動(dòng)作幀信息與靜音狀態(tài)的音視頻流,以得到該播報(bào)替換數(shù)據(jù),其中,該靜音狀態(tài)的音視頻流的時(shí)間長度與該尚未執(zhí)行的動(dòng)作幀信息的時(shí)間長度相同。
21、在一些示例性實(shí)施例中,待播報(bào)數(shù)據(jù)確定模塊,用于響應(yīng)于在數(shù)字人播報(bào)過程中接收到打斷請(qǐng)求,判斷該數(shù)字人播報(bào)過程是否支持打斷;若支持打斷,則確定當(dāng)前的待播報(bào)數(shù)據(jù)。
22、根據(jù)本公開的另一個(gè)方面,還提供了一種電子設(shè)備,該電子設(shè)備包括:處理器;以及存儲(chǔ)器,用于存儲(chǔ)該處理器的可執(zhí)行指令;其中,該處理器配置為經(jīng)由執(zhí)行該可執(zhí)行指令來執(zhí)行上述任意一項(xiàng)的數(shù)字人播報(bào)方法。
23、根據(jù)本公開的另一個(gè)方面,還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述任意一項(xiàng)的數(shù)字人播報(bào)方法。
24、根據(jù)本公開的另一個(gè)方面,提供了一種計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)程序,該計(jì)算機(jī)程序產(chǎn)品或計(jì)算機(jī)程序包括計(jì)算機(jī)指令,該計(jì)算機(jī)指令存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中。電子設(shè)備的處理器從計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)讀取該計(jì)算機(jī)指令,處理器執(zhí)行該計(jì)算機(jī)指令,使得該電子設(shè)備執(zhí)行本公開任一實(shí)施例中的各種可選方式中提供的數(shù)字人播報(bào)方法。
25、本公開實(shí)施例中提供的技術(shù)方案,在需要對(duì)數(shù)字人播報(bào)進(jìn)行打斷時(shí),可以在待播報(bào)數(shù)據(jù)中遍歷找到滿足平滑結(jié)束條件的結(jié)束幀,并根據(jù)該結(jié)束幀來確定播報(bào)替換數(shù)據(jù),從而實(shí)現(xiàn)平滑打斷,避免出現(xiàn)聲音的明顯斷點(diǎn)以及人畫面跳幀等問題。
26、應(yīng)當(dāng)理解的是,以上的一般描述和后文的細(xì)節(jié)描述僅是示例性和解釋性的,并不能限制本公開。