一種基于聲紋注冊的增強現(xiàn)實方法及裝置與流程

文檔序號：12475974閱讀：來源：國知局

技術(shù)特征：

1.一種基于聲紋注冊的增強現(xiàn)實方法，其特征在于，所述方法包括下述步驟：

獲取拾音裝置采集的現(xiàn)場使用者語音數(shù)據(jù)，并從所述使用者語音數(shù)據(jù)中提取使用者聲紋特征信息；

將所述用者聲紋特征信息與預先保存的管理者聲紋特征信息進行匹配，判斷所述使用者是否為終端設(shè)備管理者；

當所述使用者為終端設(shè)備管理者時，將所述使用者語音數(shù)據(jù)與聲音數(shù)據(jù)庫中的預設(shè)語音數(shù)據(jù)進行匹配，匹配成功時獲取與所述預設(shè)語音數(shù)據(jù)對應的情景信息；

將所述情景信息通過增強現(xiàn)實技術(shù)進行展示；

所述情景信息包括文字、圖片、語音、視頻中任一種或多種組合。

2.根據(jù)權(quán)利要求1所述的基于聲紋注冊的增強現(xiàn)實方法，其特征在于，將所述使用者語音數(shù)據(jù)與聲音數(shù)據(jù)庫中的預設(shè)語音數(shù)據(jù)進行匹配包括下述步驟：

獲取使用者語音數(shù)據(jù)中的喚醒詞；

將所述喚醒詞與聲音數(shù)據(jù)庫中的預設(shè)喚醒詞進行匹配；

匹配成功則對所述喚醒詞之后的使用者語音數(shù)據(jù)與聲音數(shù)據(jù)庫中的預設(shè)語音數(shù)據(jù)進行匹配；

當所述使用者語音數(shù)據(jù)與所述預設(shè)語音數(shù)據(jù)匹配成功時，獲取與所述預設(shè)語音數(shù)據(jù)對應的情景信息；

所述喚醒詞為預設(shè)于聲音數(shù)據(jù)庫中的固定詞語。

3.根據(jù)權(quán)利要求2所述的基于聲紋注冊的增強現(xiàn)實方法，其特征在于，對所述喚醒詞之后的使用者語音數(shù)據(jù)與聲音數(shù)據(jù)庫中的預設(shè)語音數(shù)據(jù)進行匹配包括下述步驟：

依次獲取使用者語音數(shù)據(jù)中單個字的波形圖；

將所述單個字的波形圖和預存于聲音數(shù)據(jù)庫中語音數(shù)據(jù)的單字波形圖的橫軸縱軸歸一化，得到含有多個直方的兩個直方圖；

計算所述兩個直方圖中的所有對應直方的均方誤差，并進行匹配判斷；

當所述均方誤差小于預設(shè)的閾值，則認定兩個字匹配；

重復上述步驟，直到所述使用者語音數(shù)據(jù)中最后一個字也匹配；

所述均方誤差公式為：

其中Dn為使用者語音數(shù)據(jù)單個字直方圖中的單個直方值，

dn為預存于聲音數(shù)據(jù)庫中語音數(shù)據(jù)單字直方圖中的單個直方值，

n為直方個數(shù)。

4.根據(jù)權(quán)利要求1所述的基于聲紋注冊的增強現(xiàn)實方法，其特征在于，所述聲紋特征信息提取采用線性預側(cè)系數(shù)或者梅爾頻率倒譜系數(shù)方式提取。

5.一種基于聲紋注冊的增強現(xiàn)實裝置，其特征在于，所述裝置包括：

聲紋特征獲取模塊，用于獲取拾音裝置采集的現(xiàn)場使用者語音數(shù)據(jù)，并從所述使用者語音數(shù)據(jù)中提取使用者聲紋特征信息；

聲紋特征匹配模塊，用于將所述用者聲紋特征信息與預先保存的管理者聲紋特征信息進行匹配，判斷所述使用者是否為終端設(shè)備管理者；

語音匹配與情景獲取模塊，用于當所述使用者為終端設(shè)備管理者時，將所述使用者語音數(shù)據(jù)與聲音數(shù)據(jù)庫中的預設(shè)語音數(shù)據(jù)進行匹配，匹配成功時獲取與所述預設(shè)語音數(shù)據(jù)對應的情景信息；

展示模塊，用于將所述情景信息通過增強現(xiàn)實技術(shù)進行展示；

所述情景信息包括文字、圖片、語音、視頻中任一種或多種組合。

6.根據(jù)權(quán)利要求5所述的基于聲紋注冊的增強現(xiàn)實裝置，其特征在于，所述語音匹配與場景獲取模塊包括：

喚醒詞獲取模塊，用于獲取使用者語音數(shù)據(jù)中的喚醒詞；

喚醒詞匹配模塊，用于將所述喚醒詞與聲音數(shù)據(jù)庫中的預設(shè)喚醒詞進行匹配；

語音匹配模塊，用于當匹配成功時則對所述喚醒詞之后的使用者語音數(shù)據(jù)與聲音數(shù)據(jù)庫中的預設(shè)語音數(shù)據(jù)進行匹配；

語音情景信息獲取模塊，用于當所述使用者語音數(shù)據(jù)與所述預設(shè)語音數(shù)據(jù)匹配成功時，獲取與所述預設(shè)語音數(shù)據(jù)對應的情景信息；

所述喚醒詞為預設(shè)于聲音數(shù)據(jù)庫中的固定詞語。

7.根據(jù)權(quán)利要求6所述的基于聲紋注冊的增強現(xiàn)實裝置，其特征在于，所述語音匹配模板包括：

波形圖獲取模塊，用于依次獲取使用者語音數(shù)據(jù)中單個字的波形圖；

直方圖生成模塊，用于將所述單個字的波形圖和預存于聲音數(shù)據(jù)庫中語音數(shù)據(jù)的單字波形圖的橫軸縱軸歸一化，得到含有多個直方的兩個直方圖；

均方誤差生成模塊，用于計算所述兩個直方圖中的所有對應直方的均方誤差，并進行匹配判斷；

匹配判斷模塊，用于當所述均方誤差小于預設(shè)的閾值，則認定兩個字匹配；

循環(huán)模塊，用于重復上述步驟，直到所述使用者語音數(shù)據(jù)中最后一個字也匹配；

所述均方誤差公式為：

其中Dn為使用者語音數(shù)據(jù)單個字直方圖中的單個直方值，

dn為預存于聲音數(shù)據(jù)庫中語音數(shù)據(jù)單字直方圖中的單個直方值，

n為直方個數(shù)。

8.根據(jù)權(quán)利要求5所述的基于聲紋注冊的增強現(xiàn)實裝置，其特征在于，所述聲紋特征信息提取采用線性預側(cè)系數(shù)或者梅爾頻率倒譜系數(shù)方式提取。

完整全部詳細技術(shù)資料下載

當前第2頁1 2 3

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

聲紋識別技術(shù)相關(guān)技術(shù)

科大訊飛聲紋識別相關(guān)技術(shù)

聲紋解鎖相關(guān)技術(shù)

聲紋識別相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于聲紋注冊的增強現(xiàn)實方法及裝置與流程