專利名稱:演唱打分系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及人工智能技術(shù),特別涉及一種演唱打分系統(tǒng)。
背景技術(shù):
演唱打分是一種實(shí)時(shí)對(duì)用戶的個(gè)人演唱進(jìn)行即時(shí)反饋的技術(shù),可以對(duì)演唱者的演 唱準(zhǔn)確度進(jìn)行評(píng)估,在互動(dòng)娛樂平臺(tái)上利用演唱打分系統(tǒng)提供演唱打分功能,可以給用戶 帶來很好的體驗(yàn),具有很高的娛樂性,用戶可以進(jìn)行飚歌、多人I3K等娛樂。由于聲音具有相當(dāng)?shù)牟环€(wěn)定性,難以直接用單一聲學(xué)模型進(jìn)行精確評(píng)估,常規(guī)的 演唱打分系統(tǒng),聲學(xué)模型中通常僅包括音準(zhǔn)、音色等因素,而不包括咬字因素,僅根據(jù)音準(zhǔn)、 音色進(jìn)行打分。常規(guī)的演唱打分系統(tǒng),當(dāng)演唱者的音準(zhǔn)、音色并無太大區(qū)別,即便演唱者的 演唱內(nèi)容和實(shí)際歌詞內(nèi)容不一致,具體打分仍然會(huì)無太大差別,具體打分無法體現(xiàn)演唱者 對(duì)歌詞咬字的準(zhǔn)確度。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題是提供一種演唱打分系統(tǒng),能夠?qū)ρ莩吒柙~咬字的準(zhǔn) 確度進(jìn)行打分。為解決上述技術(shù)問題,本發(fā)明的演唱打分系統(tǒng),包括演唱聲音采集模塊、演唱聲音 標(biāo)準(zhǔn)模型模塊、演唱聲音參考模型模塊、通用語音識(shí)別打分模塊、咬字得分模塊、得分規(guī)整 模塊、顯示器;所述演唱聲音采集模塊采集輸出演唱聲音信號(hào)到所述語音識(shí)別打分模塊;所述演唱聲音標(biāo)準(zhǔn)模型模塊,包括演唱聲音標(biāo)準(zhǔn)模型;所述演唱聲音參考模型模 塊包括演唱聲音參考模型;所述通用語音識(shí)別打分模塊,將演唱聲音采集模塊采集傳來的演唱聲音信號(hào),分 別與所述演唱聲音標(biāo)準(zhǔn)模型、演唱聲音參考模型進(jìn)行匹配,輸出對(duì)應(yīng)的演唱聲音標(biāo)準(zhǔn)聲學(xué) 得分信號(hào)及演唱聲音參考聲學(xué)得分信號(hào)到所述咬字得分模塊;所述咬字得分模塊,根據(jù)所述演唱聲音標(biāo)準(zhǔn)聲學(xué)得分信號(hào)及演唱聲音參考聲學(xué)得 分信號(hào),得到演唱咬字得分,輸出咬字得分信號(hào)到所述得分規(guī)整模塊;所述得分規(guī)整模塊,根據(jù)分?jǐn)?shù)轉(zhuǎn)換模型,將所述咬字得分信號(hào)中的演唱咬字得分 轉(zhuǎn)換為相應(yīng)的演唱咬字分值輸出到顯示器。所述演唱聲音標(biāo)準(zhǔn)聲學(xué)得分信號(hào)中包括有演唱者演唱的歌詞中各個(gè)字的標(biāo)準(zhǔn)聲 學(xué)得分;所述演唱聲音參考聲學(xué)得分信號(hào)中包括有該首歌詞中各個(gè)字的參考聲學(xué)得分;所述咬字得分模塊,將所述演唱聲音標(biāo)準(zhǔn)聲學(xué)得分信號(hào)中的演唱者演唱的歌詞中 各個(gè)字的標(biāo)準(zhǔn)聲學(xué)得分,分別同所述演唱聲音參考聲學(xué)得分信號(hào)中的該首歌詞中各個(gè)字的 參考聲學(xué)得分相減,得到該首歌詞中各個(gè)字的聲學(xué)得分差,并將該首歌詞中各個(gè)字的聲學(xué) 得分差取算術(shù)平均后得到該演唱咬字得分,輸出咬字得分信號(hào)到所述得分規(guī)整模塊。
本發(fā)明的演唱打分系統(tǒng),設(shè)置有演唱聲音標(biāo)準(zhǔn)模型模塊,演唱聲音參考模型模塊, 演唱聲音標(biāo)準(zhǔn)模型模塊包括演唱聲音標(biāo)準(zhǔn)模型,演唱聲音參考模型模塊包括演唱聲音參考 模型,利用通用語音識(shí)別打分模塊,將演唱聲音采集模塊采集傳來的演唱聲音信號(hào),分別與 所述演唱聲音標(biāo)準(zhǔn)模型、演唱聲音參考模型進(jìn)行匹配,輸出對(duì)應(yīng)的演唱聲音標(biāo)準(zhǔn)聲學(xué)得分 信號(hào)及演唱聲音參考聲學(xué)得分信號(hào)到咬字得分模塊,咬字得分模塊根據(jù)所述演唱聲音標(biāo) 準(zhǔn)、參考聲學(xué)得分結(jié)果,得到該演唱的咬字得分,從而能對(duì)演唱者歌詞咬字的準(zhǔn)確度進(jìn)行高 精確度的咬字打分評(píng)測,可以克服用單一聲學(xué)模型進(jìn)行打分帶來的精度不足的問題。
下面結(jié)合附圖和具體實(shí)施方式
對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說明。圖1是本發(fā)明的演唱打分系統(tǒng)一實(shí)施方式示意圖。
具體實(shí)施例方式本發(fā)明的演唱打分系統(tǒng)一實(shí)施方式如圖1所示,包括演唱聲音采集模塊、演唱聲 音標(biāo)準(zhǔn)模型模塊、演唱聲音參考模型模塊、通用語音識(shí)別打分模塊、咬字得分模塊、得分規(guī) 整模塊、顯示器;所述演唱聲音采集模塊采集輸出演唱聲音信號(hào)到所述語音識(shí)別打分模塊;所述演唱聲音標(biāo)準(zhǔn)模型模塊,包括演唱聲音標(biāo)準(zhǔn)模型,通過采集多個(gè)發(fā)音咬字準(zhǔn) 確的歌唱聲音數(shù)據(jù),對(duì)這批數(shù)據(jù)進(jìn)行訓(xùn)練,得到咬字準(zhǔn)確的語音識(shí)別模型,該咬字準(zhǔn)確的語 音識(shí)別模型作為演唱聲音標(biāo)準(zhǔn)模型;所述演唱聲音參考模型模塊包括演唱聲音參考模型, 通過采集多個(gè)帶有咬字不準(zhǔn)或者與歌詞不匹配的歌唱聲音數(shù)據(jù),對(duì)這批數(shù)據(jù)進(jìn)行訓(xùn)練,得 到咬字不準(zhǔn)確的語音識(shí)別模型,該咬字不準(zhǔn)確的語音識(shí)別模型作為演唱聲音參考模型;演 唱聲音標(biāo)準(zhǔn)及參考模型的充分訓(xùn)練要求對(duì)性別、目標(biāo)客戶年齡段、各種口音的完整覆蓋;所述通用語音識(shí)別打分模塊,將演唱聲音采集模塊采集傳來的演唱聲音信號(hào),分 別與所述演唱聲音標(biāo)準(zhǔn)模型、演唱聲音參考模型進(jìn)行匹配,輸出對(duì)應(yīng)的演唱聲音標(biāo)準(zhǔn)聲學(xué) 得分信號(hào)及演唱聲音參考聲學(xué)得分信號(hào)到所述咬字得分模塊;所述演唱聲音標(biāo)準(zhǔn)聲學(xué)得分 信號(hào)中包括有演唱者演唱的歌詞中各個(gè)字的標(biāo)準(zhǔn)聲學(xué)得分,所述演唱聲音參考聲學(xué)得分信 號(hào)中包括有該首歌詞中各個(gè)字的參考聲學(xué)得分;所述咬字得分模塊,將所述演唱聲音標(biāo)準(zhǔn)聲學(xué)得分信號(hào)中的演唱者演唱的歌詞中 各個(gè)字的標(biāo)準(zhǔn)聲學(xué)得分,分別同所述演唱聲音參考聲學(xué)得分信號(hào)中的該首歌詞中各個(gè)字的 參考聲學(xué)得分相減,得到該首歌詞中各個(gè)字的聲學(xué)得分差,并將該首歌詞中各個(gè)字的聲學(xué) 得分差取算術(shù)平均后得到該演唱咬字得分,輸出咬字得分信號(hào)到所述得分規(guī)整模塊。所述得分規(guī)整模塊,根據(jù)分?jǐn)?shù)轉(zhuǎn)換模型,將所述咬字得分信號(hào)中的演唱咬字得分 轉(zhuǎn)換為相應(yīng)的演唱咬字分值輸出到顯示器;所述分?jǐn)?shù)轉(zhuǎn)換模型,是通過收集多個(gè)演唱咬字 得分打分?jǐn)?shù)據(jù)并和實(shí)際人工打分結(jié)果進(jìn)行對(duì)照后確定,所述咬字得分信號(hào)中的演唱咬字得 分結(jié)果經(jīng)過轉(zhuǎn)換后,就得到了實(shí)際在顯示器上顯示的演唱咬字打分值。一實(shí)施例如下。演唱者A要唱“東方紅”時(shí),基本沒出錯(cuò),通用語音識(shí)別打分模塊根據(jù)歌詞演唱 聲音標(biāo)準(zhǔn)模型得到的該首歌詞中各個(gè)字的演唱聲音標(biāo)準(zhǔn)聲學(xué)得分,分別為(5834,5736,8249),根據(jù)歌詞演唱聲音參考模型得到的該首歌詞中各個(gè)字的演唱聲音參考聲學(xué)得分,分 別為(觀74,2873,討73),所述咬字得分模塊,將標(biāo)準(zhǔn)聲學(xué)得分(5834,5736,8249)同參考 聲學(xué)得分0874,觀73,547 中的各個(gè)字的得分分別對(duì)應(yīng)相減,得到演唱的該首歌詞中各 個(gè)字的聲學(xué)得分差(四60,2863,2776),并將演唱的該首歌詞中各個(gè)字的聲學(xué)得分差取算 術(shù)平均后得到該首歌詞的演唱咬字得分觀66,所述得分規(guī)整模塊,根據(jù)分?jǐn)?shù)轉(zhuǎn)換模型,將 觀66映射轉(zhuǎn)換為咬字分值90顯示在顯示器上;而演唱者B將“紅”唱錯(cuò)了,通用語音識(shí)別打 分模塊根據(jù)歌詞演唱聲音標(biāo)準(zhǔn)模型得到的該首歌詞中各個(gè)字的演唱聲音標(biāo)準(zhǔn)聲學(xué)得分,分 別為(48 ,5230,5235),根據(jù)歌詞演唱聲音參考模型得到的該首歌詞中各個(gè)字的演唱聲 音參考聲學(xué)得分,分別為(1827,2341,71 ),所述咬字得分模塊,將標(biāo)準(zhǔn)聲學(xué)得分0824, 5230,5235)同參考聲學(xué)得分(1827,2341,7129)中的各個(gè)字的得分分別對(duì)應(yīng)相減,得到演 唱的該首歌詞中各個(gè)字的聲學(xué)得分差0997,2889, -1894),并將演唱的該首歌詞中各個(gè)字 的聲學(xué)得分差取算術(shù)平均后得到該首歌詞的演唱咬字得分1331,所述得分規(guī)整模塊,根據(jù) 分?jǐn)?shù)轉(zhuǎn)換模型,將1331映射轉(zhuǎn)換為咬字分值66顯示在顯示器上。 本發(fā)明的演唱打分系統(tǒng),設(shè)置有演唱聲音標(biāo)準(zhǔn)模型模塊,演唱聲音參考模型模塊, 演唱聲音標(biāo)準(zhǔn)模型模塊包括演唱聲音標(biāo)準(zhǔn)模型,演唱聲音參考模型模塊包括演唱聲音參考 模型,利用通用語音識(shí)別打分模塊,將演唱聲音采集模塊采集傳來的演唱聲音信號(hào),分別與 所述演唱聲音標(biāo)準(zhǔn)模型、演唱聲音參考模型進(jìn)行匹配,輸出對(duì)應(yīng)的演唱聲音標(biāo)準(zhǔn)聲學(xué)得分 信號(hào)及演唱聲音參考聲學(xué)得分信號(hào)到咬字得分模塊,咬字得分模塊根據(jù)所述演唱聲音標(biāo) 準(zhǔn)、參考聲學(xué)得分結(jié)果,得到該演唱的咬字得分,從而能對(duì)演唱者歌詞咬字的準(zhǔn)確度進(jìn)行高 精確度的咬字打分評(píng)測,可以克服用單一聲學(xué)模型進(jìn)行打分帶來的精度不足的問題。
權(quán)利要求
1.一種演唱打分系統(tǒng),其特征在于,包括演唱聲音采集模塊、演唱聲音標(biāo)準(zhǔn)模型模塊、 演唱聲音參考模型模塊、通用語音識(shí)別打分模塊、咬字得分模塊、得分規(guī)整模塊、顯示器;所述演唱聲音采集模塊采集輸出演唱聲音信號(hào)到所述語音識(shí)別打分模塊;所述演唱聲音標(biāo)準(zhǔn)模型模塊,包括演唱聲音標(biāo)準(zhǔn)模型;所述演唱聲音參考模型模塊包 括演唱聲音參考模型;所述通用語音識(shí)別打分模塊,將演唱聲音采集模塊采集傳來的演唱聲音信號(hào),分別與 所述演唱聲音標(biāo)準(zhǔn)模型、演唱聲音參考模型進(jìn)行匹配,輸出對(duì)應(yīng)的演唱聲音標(biāo)準(zhǔn)聲學(xué)得分 信號(hào)及演唱聲音參考聲學(xué)得分信號(hào)到所述咬字得分模塊;所述咬字得分模塊,根據(jù)所述演唱聲音標(biāo)準(zhǔn)聲學(xué)得分信號(hào)及演唱聲音參考聲學(xué)得分信 號(hào),得到演唱咬字得分,輸出咬字得分信號(hào)到所述得分規(guī)整模塊;所述得分規(guī)整模塊,根據(jù)分?jǐn)?shù)轉(zhuǎn)換模型,將所述咬字得分信號(hào)中的演唱咬字得分轉(zhuǎn)換 為相應(yīng)的演唱咬字分值輸出到顯示器。
2.根據(jù)權(quán)利要求1所述的演唱打分系統(tǒng),其特征在于,所述演唱聲音標(biāo)準(zhǔn)聲學(xué)得分信 號(hào)中包括有演唱者演唱的歌詞中各個(gè)字的標(biāo)準(zhǔn)聲學(xué)得分;所述演唱聲音參考聲學(xué)得分信號(hào)中包括有該首歌詞中各個(gè)字的參考聲學(xué)得分;所述咬字得分模塊,將所述演唱聲音標(biāo)準(zhǔn)聲學(xué)得分信號(hào)中的演唱者演唱的歌詞中各個(gè) 字的標(biāo)準(zhǔn)聲學(xué)得分,分別同所述演唱聲音參考聲學(xué)得分信號(hào)中的該首歌詞中各個(gè)字的參考 聲學(xué)得分相減,得到該首歌詞中各個(gè)字的聲學(xué)得分差,并將該首歌詞中各個(gè)字的聲學(xué)得分 差取算術(shù)平均后得到該演唱咬字得分,輸出咬字得分信號(hào)到所述得分規(guī)整模塊。
3.根據(jù)權(quán)利要求1所述的演唱打分系統(tǒng),其特征在于,所述分?jǐn)?shù)轉(zhuǎn)換模型,是通過收集 多個(gè)演唱咬字得分打分?jǐn)?shù)據(jù)并和實(shí)際人工打分結(jié)果進(jìn)行對(duì)照后確定。
4.根據(jù)權(quán)利要求1所述的演唱打分系統(tǒng),其特征在于,通過采集多個(gè)發(fā)音咬字準(zhǔn)確的 歌唱聲音數(shù)據(jù),對(duì)這批數(shù)據(jù)進(jìn)行訓(xùn)練,得到咬字準(zhǔn)確的語音識(shí)別模型,該咬字準(zhǔn)確的語音識(shí) 別模型作為演唱聲音標(biāo)準(zhǔn)模型。
5.根據(jù)權(quán)利要求1所述的演唱打分系統(tǒng),其特征在于,通過采集多個(gè)帶有咬字不準(zhǔn)或 者與歌詞不匹配的歌唱聲音數(shù)據(jù),對(duì)這批數(shù)據(jù)進(jìn)行訓(xùn)練,得到咬字不準(zhǔn)確的語音識(shí)別模型, 該咬字不準(zhǔn)確的語音識(shí)別模型作為演唱聲音參考模型。
全文摘要
本發(fā)明公開了一種演唱打分系統(tǒng),包括演唱聲音采集模塊、演唱聲音標(biāo)準(zhǔn)模型模塊、演唱聲音參考模型模塊、通用語音識(shí)別打分模塊、咬字得分模塊、得分規(guī)整模塊、顯示器;演唱聲音標(biāo)準(zhǔn)模型模塊包括演唱聲音標(biāo)準(zhǔn)模型,演唱聲音參考模型模塊包括演唱聲音參考模型,利用通用語音識(shí)別打分模塊,將演唱聲音采集模塊采集傳來的演唱聲音信號(hào),分別與所述演唱聲音標(biāo)準(zhǔn)模型、演唱聲音參考模型進(jìn)行匹配,輸出對(duì)應(yīng)的演唱聲音標(biāo)準(zhǔn)聲學(xué)得分信號(hào)及演唱聲音參考聲學(xué)得分信號(hào)到咬字得分模塊,咬字得分模塊根據(jù)所述演唱聲音標(biāo)準(zhǔn)、參考聲學(xué)得分結(jié)果,得到該演唱的咬字得分,從而能對(duì)演唱者歌詞咬字的準(zhǔn)確度進(jìn)行高精確度的咬字打分評(píng)測。
文檔編號(hào)G10L15/06GK102103857SQ20091020201
公開日2011年6月22日 申請日期2009年12月21日 優(yōu)先權(quán)日2009年12月21日
發(fā)明者蔡洪濱, 黃偉 申請人:盛大計(jì)算機(jī)(上海)有限公司