亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

語音識別設(shè)備和方法與流程

文檔序號:12598528閱讀:來源:國知局

技術(shù)特征:

1.一種語音識別設(shè)備,包括:

預(yù)測器,被配置為基于之前已被搜索的單詞序列預(yù)測跟隨之前已被搜索的單詞序列的單詞的詞類;

解碼器,被配置為搜索與語音信號對應(yīng)的候選單詞,使用已被搜索的候選單詞擴(kuò)展之前已被搜索的單詞序列,并基于預(yù)測的詞類調(diào)整擴(kuò)展的單詞序列的概率值。

2.如權(quán)利要求1所述的語音識別設(shè)備,其中,詞類為實(shí)體名或詞性;

實(shí)體名為人名、位置名、組織名、日期、時間、書名、電影名、音樂名或TV節(jié)目名。

3.如權(quán)利要求1所述的語音識別設(shè)備,其中,預(yù)測器還被配置為:使用詞類預(yù)測模型預(yù)測跟隨之前已被搜索的單詞序列的單詞的詞類。

4.如權(quán)利要求3所述的語音識別設(shè)備,其中,詞類預(yù)測模型基于詞典和語法以規(guī)則集的形式被構(gòu)造,或者使用命名的實(shí)體識別方案和詞性標(biāo)注方案中的任何一個或兩者通過機(jī)器學(xué)習(xí)被構(gòu)造。

5.如權(quán)利要求3所述的語音識別設(shè)備,其中,詞類預(yù)測模型為基于遞歸神經(jīng)網(wǎng)絡(luò)(RNN)的模型。

6.如權(quán)利要求1所述的語音識別設(shè)備,其中,解碼器還被配置為:使用以加權(quán)有限狀態(tài)轉(zhuǎn)換器(WFST)的形式在數(shù)據(jù)結(jié)構(gòu)中構(gòu)造的發(fā)音詞典和語言模型來搜索候選單詞。

7.如權(quán)利要求1所述的語音識別設(shè)備,其中,解碼器還被配置為:從未來的搜索目標(biāo)排除已被搜索的候選單詞之中的不屬于預(yù)測的詞類的候選單詞。

8.如權(quán)利要求1所述的語音識別設(shè)備,其中,解碼器還被配置為:在已被搜索的候選單詞之中增加屬于預(yù)測的詞類的候選單詞的概率值。

9.如權(quán)利要求1所述的語音識別設(shè)備,其中,解碼器還被配置為:在已被搜索的候選單詞之中增加屬于預(yù)測的詞類的并包括在個性化的語言模型中的候選單詞的概率值。

10.如權(quán)利要求1所述的語音識別設(shè)備,其中,預(yù)測器還被配置為:預(yù)測跟隨之前已被搜索的單詞序列的單詞的詞類概率分布;

解碼器還被配置為:通過用每一候選單詞的概率值乘以該候選單詞所屬的詞類的預(yù)測的概率值,調(diào)整每一候選單詞的概率值。

11.一種語音識別方法,包括:

基于之前已被搜索的單詞序列預(yù)測跟隨之前已被搜索的單詞序列的單詞的詞類;

搜索與語音信號對應(yīng)的候選單詞;

使用已被搜索的候選單詞擴(kuò)展之前已被搜索的單詞序列;

基于預(yù)測的詞類調(diào)整擴(kuò)展的單詞序列的概率值。

12.如權(quán)利要求11所述的語音識別方法,其中,詞類為實(shí)體名或詞性;

實(shí)體名為人名、位置名、組織名、日期、時間、書名、電影名、音樂名或TV節(jié)目名。

13.如權(quán)利要求11所述的語音識別方法,其中,所述預(yù)測詞類的步驟包括:使用詞類預(yù)測模型預(yù)測跟隨之前已被搜索的單詞序列的單詞的詞類。

14.如權(quán)利要求13所述的語音識別方法,其中,詞類預(yù)測模型基于詞典和語法以規(guī)則集的形式被構(gòu)造,或者使用命名的實(shí)體識別方案和詞性標(biāo)注方案的任何一個或兩者通過機(jī)器學(xué)習(xí)被構(gòu)造。

15.如權(quán)利要求13所述的語音識別方法,其中,詞類預(yù)測模型為基于遞歸神經(jīng)網(wǎng)絡(luò)(RNN)的模型。

16.如權(quán)利要求11所述的語音識別方法,其中,所述搜索候選單詞的步驟包括:使用以加權(quán)有限狀態(tài)轉(zhuǎn)換器(WFST)的形式在數(shù)據(jù)結(jié)構(gòu)中構(gòu)造的發(fā)音詞典和語言模型搜索候選單詞。

17.如權(quán)利要求11所述的語音識別方法,還包括:從未來的搜索目標(biāo)排除已被搜索的候選單詞之中的不屬于預(yù)測的詞類的候選單詞。

18.如權(quán)利要求11所述的語音識別方法,其中,所述調(diào)整擴(kuò)展的單詞序列的概率值的步驟包括:在已被搜索的候選單詞之中增加屬于預(yù)測的詞類的候選單詞的概率值。

19.如權(quán)利要求11所述的語音識別方法,其中,所述調(diào)整擴(kuò)展的單詞序列的概率值的步驟包括:在已被搜索的候選單詞之中增加屬于預(yù)測的詞類的并包括在個性化的語言模型中的候選單詞的概率值。

20.如權(quán)利要求11所述的語音識別方法,其中,所述預(yù)測詞類的步驟包括:預(yù)測跟隨之前已被搜索的單詞序列的單詞的詞類概率分布;

所述調(diào)整擴(kuò)展的單詞序列的概率值的步驟包括:通過用每一候選單詞的概率值乘以該候選單詞所屬的詞類的預(yù)測的概率值,調(diào)整每一候選單詞的概率值。

21.一種詞類預(yù)測模型生成設(shè)備,包括:

訓(xùn)練數(shù)據(jù)采集器,被配置為采集包括多個單詞序列和與各個單詞序列對應(yīng)的類序列的訓(xùn)練數(shù)據(jù);

模型生成器,被配置為通過基于采集的訓(xùn)練數(shù)據(jù)的學(xué)習(xí)生成詞類預(yù)測模型。

22.如權(quán)利要求21所述的詞類預(yù)測模型生成設(shè)備,其中,類序列的每一類為實(shí)體名或詞性;

實(shí)體名為人名、位置名、組織名、日期、時間、書名、電影名、音樂名或TV節(jié)目名。

23.如權(quán)利要求21所述的詞類預(yù)測模型生成設(shè)備,其中,模型生成器還被配置為:基于采集的訓(xùn)練數(shù)據(jù)訓(xùn)練遞歸神經(jīng)網(wǎng)絡(luò)(RNN)以生成詞類預(yù)測模型。

24.如權(quán)利要求23所述的詞類預(yù)測模型生成設(shè)備,其中,模型生成器還被配置為:使用作為輸入的單詞和作為目標(biāo)的跟隨所述單詞的單詞的詞類來訓(xùn)練RNN。

25.一種詞類預(yù)測模型生成方法,包括:

采集包括多個單詞序列和與各個單詞序列對應(yīng)的類序列的訓(xùn)練數(shù)據(jù);

通過基于采集的訓(xùn)練數(shù)據(jù)的學(xué)習(xí)生成詞類預(yù)測模型。

26.如權(quán)利要求25所述的詞類預(yù)測模型生成方法,其中,類序列的每個類為實(shí)體名或詞性;

實(shí)體名為人名、位置名、組織名、日期、時間、書名、電影名、音樂名或TV節(jié)目名。

27.如權(quán)利要求25所述的詞類預(yù)測模型生成方法,其中,所述生成詞類預(yù)測模型的步驟包括:基于采集的訓(xùn)練數(shù)據(jù)訓(xùn)練遞歸神經(jīng)網(wǎng)絡(luò)(RNN)以生成詞類預(yù)測模型。

28.如權(quán)利要求27所述的詞類預(yù)測模型生成方法,其中,所述訓(xùn)練RNN的步驟包括:使用作為輸入的單詞和作為目標(biāo)的跟隨所述單詞的單詞的詞類來訓(xùn)練RNN。

29.一種語音識別設(shè)備,包括:

預(yù)測器,被配置為基于之前已被搜索的單詞序列預(yù)測跟隨之前已被搜索的單詞序列的單詞的詞類;

解碼器,被配置為基于預(yù)測的詞類將單詞添加到之前已被搜索的單詞序列。

30.如權(quán)利要求29所述的語音識別設(shè)備,其中,預(yù)測器還被配置為:基于之前已被搜索的單詞序列預(yù)測多個詞類的各自的概率;

解碼器還被配置為:基于所述多個詞類的預(yù)測的概率將單詞添加到之前已被搜索的單詞序列。

31.如權(quán)利要求30所述的語音識別設(shè)備,其中,解碼器還被配置為:將屬于在所述多個詞類之中具有最高概率的詞類的單詞添加到之前已被搜索的單詞序列。

32.如權(quán)利要求30所述的語音識別設(shè)備,其中,解碼器還被配置為:搜索與語音信號對應(yīng)的多個候選單詞,并基于所述多個候選單詞的各自的概率和所述多個詞類的預(yù)測的概率確定是否將所述多個候選單詞中的一個候選單詞添加到之前已被搜索的單詞序列。

33.如權(quán)利要求29所述的語音識別設(shè)備,其中,解碼器還被配置為:搜索與語音信號對應(yīng)的候選單詞,并基于預(yù)測的詞類確定是否將候選單詞添加到之前已被搜索的單詞序列。

當(dāng)前第2頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1