亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種錄音文件索引的裝置及方法_4

文檔序號(hào):9887828閱讀:來源:國(guó)知局
]文本保存單元30,用于將語音識(shí)別文本及其對(duì)應(yīng)于時(shí)間軸中的時(shí)間對(duì)應(yīng)保存為文本文件。
[0115]本實(shí)施例的錄音文件索引的裝置,通過在錄制錄音文件時(shí)對(duì)錄音進(jìn)行語音識(shí)別,將錄音文件中的時(shí)間軸映射到語音識(shí)別文件中,將語音識(shí)別文件及其對(duì)應(yīng)于時(shí)間軸中的時(shí)間對(duì)應(yīng)保存,建立文本和時(shí)間軸之間的關(guān)聯(lián),通過文本實(shí)現(xiàn)對(duì)錄音文件的索引,實(shí)現(xiàn)了對(duì)錄音文件中內(nèi)容的快速查看和切換,提高了對(duì)錄音文件的瀏覽的效率。
[0116]請(qǐng)參考圖6,其是本發(fā)明的一種錄音文件索引的裝置第二實(shí)施例的結(jié)構(gòu)方框圖,如圖所示,該裝置,包括:
[0117]文件生成單元10,用于開啟錄音和語音識(shí)別,獲取錄音文件和對(duì)應(yīng)的語音識(shí)別文本;
[0118]時(shí)間映射單元20,用于將錄音文件的時(shí)間軸映射到語音識(shí)別文本中;
[0119]文本保存單元30,用于將語音識(shí)別文本及其對(duì)應(yīng)于時(shí)間軸中的時(shí)間對(duì)應(yīng)保存為文本文件。
[0120]其中,文件生成單元10,包括:
[0121]第一計(jì)時(shí)模塊11,用于開啟錄音,同時(shí)開啟計(jì)時(shí)器用于記錄錄音過程中整句音頻數(shù)據(jù)的起始時(shí)間和整句結(jié)束時(shí)間;
[0122]第二計(jì)時(shí)模塊12,用于將整句音頻數(shù)據(jù)發(fā)送到語音識(shí)別服務(wù)器進(jìn)行語音識(shí)別,并記錄整句音頻數(shù)據(jù)的發(fā)送時(shí)間和對(duì)應(yīng)的語音識(shí)別文本的接收時(shí)間;
[0123]時(shí)間映射單元20,包括:
[0124]時(shí)間修正模塊21,用于根據(jù)發(fā)送時(shí)間和接收時(shí)間的時(shí)間差對(duì)整句結(jié)束時(shí)間進(jìn)行修正,得到整句音頻數(shù)據(jù)的結(jié)束時(shí)間;
[0125]時(shí)間標(biāo)記模塊22,用于根據(jù)起始時(shí)間和結(jié)束時(shí)間對(duì)整句音頻數(shù)據(jù)對(duì)應(yīng)的語音識(shí)別文本的起始時(shí)間點(diǎn)和結(jié)尾時(shí)間點(diǎn)進(jìn)行標(biāo)記。
[0126]其中,時(shí)間標(biāo)記模塊22,包括:
[0127]字符統(tǒng)計(jì)子模塊221,用于統(tǒng)計(jì)整句音頻數(shù)據(jù)對(duì)應(yīng)的語音識(shí)別文本中的字符;
[0128]時(shí)長(zhǎng)計(jì)算子模塊222,用于根據(jù)起始時(shí)間和結(jié)束時(shí)間計(jì)算出語音識(shí)別文本中每個(gè)字符的平均時(shí)長(zhǎng);
[0129]字符標(biāo)記子模塊223,用于根據(jù)平均時(shí)長(zhǎng)對(duì)每個(gè)字符進(jìn)行時(shí)間軸標(biāo)記,其中語音識(shí)別文本中的第一個(gè)字符標(biāo)記起始時(shí)間點(diǎn),最后一個(gè)字符標(biāo)記為結(jié)尾時(shí)間點(diǎn)。
[0130]其中,所述裝置,還包括:
[0131]文件播放單元40,用于播放錄音文件時(shí),顯示文本文件中記錄的語音識(shí)別文本,并突出顯示錄音文件的時(shí)間軸當(dāng)前對(duì)應(yīng)的語音識(shí)別文本。
[0132]其中,所述裝置,還包括:
[0133]索引切換單元50,用于當(dāng)顯示的語音識(shí)別文本檢測(cè)到索引指令時(shí),將錄音文件切換到索引指令指向的語音識(shí)別文本對(duì)應(yīng)的時(shí)間。
[0134]本實(shí)施例的錄音文件索引的裝置,通過在錄制錄音文件時(shí)對(duì)錄音進(jìn)行語音識(shí)別,將錄音文件中的時(shí)間軸映射到語音識(shí)別文件中,將語音識(shí)別文件及其對(duì)應(yīng)于時(shí)間軸中的時(shí)間對(duì)應(yīng)保存,建立文本和時(shí)間軸之間的關(guān)聯(lián),通過文本實(shí)現(xiàn)對(duì)錄音文件的索引,實(shí)現(xiàn)了對(duì)錄音文件中內(nèi)容的快速查看和切換,提高了對(duì)錄音文件的瀏覽的效率。逐字建立的索引使得索引的結(jié)構(gòu)更加細(xì)致,后續(xù)對(duì)索引的響應(yīng)進(jìn)一步完善了錄音文件的播放和控制過程,實(shí)現(xiàn)了錄音文件中的高效快速查找。
[0135]上述實(shí)施例提供的錄音文件索引的裝置與錄音文件索引的方法實(shí)施例屬于同一構(gòu)思,其具體實(shí)現(xiàn)過程詳見方法實(shí)施例,且方法實(shí)施例中的技術(shù)特征在裝置實(shí)施例中均對(duì)應(yīng)適用,這里不再贅述。
[0136]需要說明的是,在本文中,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者裝置不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者裝置所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括該要素的過程、方法、物品或者裝置中還存在另外的相同要素。
[0137]上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
[0138]通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到上述實(shí)施例方法可借助軟件加必需的通用硬件平臺(tái)的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實(shí)施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)(如ROM/RAM、磁碟、光盤)中,包括若干指令用以使得一臺(tái)終端設(shè)備(可以是手機(jī),計(jì)算機(jī),月艮務(wù)器,空調(diào)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。
[0139]出于解釋的目的,前面的描述使用了特定的術(shù)語,以提供對(duì)本發(fā)明的透徹理解。然而,對(duì)本領(lǐng)域的技術(shù)人員來說顯而易見的是,為了實(shí)踐本發(fā)明并不需要具體的細(xì)節(jié)。本發(fā)明的具體實(shí)施例的前述描述是為了圖示和說明的目的而呈現(xiàn)。它們并不意在詳盡的或?qū)⒈景l(fā)明限于所公開的準(zhǔn)確形式。鑒于上面的教義,許多修改和變化是可能的。為了最好地解釋本發(fā)明的原理及其實(shí)際應(yīng)用而示出并描述了這些實(shí)施例,從而使本領(lǐng)域的其他技術(shù)人員能夠最好地利用本發(fā)明和具有適于預(yù)期的特定使用的各種修改的各種實(shí)施例。意在本發(fā)明的范圍由隨后的權(quán)利要求和其等同物來限定。
【主權(quán)項(xiàng)】
1.一種錄音文件索引的裝置,其特征在于,包括: 文件生成單元,用于開啟錄音和語音識(shí)別,獲取錄音文件和對(duì)應(yīng)的語音識(shí)別文本; 時(shí)間映射單元,用于將所述錄音文件的時(shí)間軸映射到所述語音識(shí)別文本中; 文本保存單元,用于將語音識(shí)別文本及其對(duì)應(yīng)于時(shí)間軸中的時(shí)間對(duì)應(yīng)保存為文本文件。2.根據(jù)權(quán)利要求1所述的裝置,其特征在于,所述文件生成單元,包括: 第一計(jì)時(shí)模塊,用于開啟錄音,同時(shí)開啟計(jì)時(shí)器用于記錄錄音過程中整句音頻數(shù)據(jù)的起始時(shí)間和整句結(jié)束時(shí)間; 第二計(jì)時(shí)模塊,用于將所述整句音頻數(shù)據(jù)發(fā)送到語音識(shí)別服務(wù)器進(jìn)行語音識(shí)別,并記錄所述整句音頻數(shù)據(jù)的發(fā)送時(shí)間和對(duì)應(yīng)的語音識(shí)別文本的接收時(shí)間; 所述時(shí)間映射單元,包括: 時(shí)間修正模塊,用于根據(jù)所述發(fā)送時(shí)間和接收時(shí)間的時(shí)間差對(duì)所述整句結(jié)束時(shí)間進(jìn)行修正,得到所述整句音頻數(shù)據(jù)的結(jié)束時(shí)間; 時(shí)間標(biāo)記模塊,用于根據(jù)所述起始時(shí)間和結(jié)束時(shí)間對(duì)所述整句音頻數(shù)據(jù)對(duì)應(yīng)的語音識(shí)別文本的起始時(shí)間點(diǎn)和結(jié)尾時(shí)間點(diǎn)進(jìn)行標(biāo)記。3.根據(jù)權(quán)利要求2所述的裝置,其特征在于,所述時(shí)間標(biāo)記模塊,包括: 字符統(tǒng)計(jì)子模塊,用于統(tǒng)計(jì)所述整句音頻數(shù)據(jù)對(duì)應(yīng)的語音識(shí)別文本中的字符; 時(shí)長(zhǎng)計(jì)算子模塊,用于根據(jù)所述起始時(shí)間和結(jié)束時(shí)間計(jì)算出所述語音識(shí)別文本中每個(gè)字符的平均時(shí)長(zhǎng); 字符標(biāo)記子模塊,用于根據(jù)所述平均時(shí)長(zhǎng)對(duì)每個(gè)字符進(jìn)行時(shí)間軸標(biāo)記,其中所述語音識(shí)別文本中的第一個(gè)字符標(biāo)記起始時(shí)間點(diǎn),最后一個(gè)字符標(biāo)記為結(jié)尾時(shí)間點(diǎn)。4.根據(jù)權(quán)利要求1所述的裝置,其特征在于,所述裝置,還包括: 文件播放單元,用于播放所述錄音文件時(shí),顯示所述文本文件中記錄的語音識(shí)別文本,并突出顯示所述錄音文件的時(shí)間軸當(dāng)前對(duì)應(yīng)的語音識(shí)別文本。5.根據(jù)權(quán)利要求4所述的裝置,其特征在于,所述裝置,還包括: 索引切換單元,用于當(dāng)顯示的語音識(shí)別文本檢測(cè)到索引指令時(shí),將所述錄音文件切換到所述索引指令指向的語音識(shí)別文本對(duì)應(yīng)的時(shí)間。6.一種錄音文件索引的方法,其特征在于,包括: 開啟錄音和語音識(shí)別,獲取錄音文件和對(duì)應(yīng)的語音識(shí)別文本; 將所述錄音文件的時(shí)間軸映射到所述語音識(shí)別文本中; 將語音識(shí)別文本及其對(duì)應(yīng)于時(shí)間軸中的時(shí)間對(duì)應(yīng)保存為文本文件。7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述開啟錄音和語音識(shí)別,獲取錄音文件和對(duì)應(yīng)的語音識(shí)別文本,包括: 開啟錄音,同時(shí)開啟計(jì)時(shí)器用于記錄錄音過程中整句音頻數(shù)據(jù)的起始時(shí)間和整句結(jié)束時(shí)間; 將所述整句音頻數(shù)據(jù)發(fā)送到語音識(shí)別服務(wù)器進(jìn)行語音識(shí)別,并記錄所述整句音頻數(shù)據(jù)的發(fā)送時(shí)間和對(duì)應(yīng)的語音識(shí)別文本的接收時(shí)間; 所述將所述錄音文件的時(shí)間軸映射到所述語音識(shí)別文本中,包括: 根據(jù)所述發(fā)送時(shí)間和接收時(shí)間的時(shí)間差對(duì)所述整句結(jié)束時(shí)間進(jìn)行修正,得到所述整句音頻數(shù)據(jù)的結(jié)束時(shí)間; 根據(jù)所述起始時(shí)間和結(jié)束時(shí)間對(duì)所述整句音頻數(shù)據(jù)對(duì)應(yīng)的語音識(shí)別文本的起始時(shí)間點(diǎn)和結(jié)尾時(shí)間點(diǎn)進(jìn)行標(biāo)記。8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述根據(jù)所述起始時(shí)間和結(jié)束時(shí)間對(duì)所述整句音頻數(shù)據(jù)對(duì)應(yīng)的語音識(shí)別文本的起始時(shí)間點(diǎn)和結(jié)尾時(shí)間點(diǎn)進(jìn)行標(biāo)記,包括: 統(tǒng)計(jì)所述整句音頻數(shù)據(jù)對(duì)應(yīng)的語音識(shí)別文本中的字符; 根據(jù)所述起始時(shí)間和結(jié)束時(shí)間計(jì)算出所述語音識(shí)別文本中每個(gè)字符的平均時(shí)長(zhǎng); 根據(jù)所述平均時(shí)長(zhǎng)對(duì)每個(gè)字符進(jìn)行時(shí)間軸標(biāo)記,其中所述語音識(shí)別文本中的第一個(gè)字符標(biāo)記起始時(shí)間點(diǎn),最后一個(gè)字符標(biāo)記為結(jié)尾時(shí)間點(diǎn)。9.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述將語音識(shí)別文本及其對(duì)應(yīng)于時(shí)間軸中的時(shí)間對(duì)應(yīng)保存為文本文件之后,還包括: 播放所述錄音文件時(shí),顯示所述文本文件中記錄的語音識(shí)別文本,并突出顯示所述錄音文件的時(shí)間軸當(dāng)前對(duì)應(yīng)的語音識(shí)別文本。10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述播放所述錄音文件時(shí),顯示所述文本文件中記錄的語音識(shí)別文本,并突出顯示所述錄音文件的時(shí)間軸當(dāng)前對(duì)應(yīng)的語音識(shí)別文本之后,還包括: 當(dāng)顯示的語音識(shí)別文本檢測(cè)到索引指令時(shí),將所述錄音文件切換到所述索引指令指向的語音識(shí)別文本對(duì)應(yīng)的時(shí)間。
【專利摘要】本發(fā)明公開了一種錄音文件索引的裝置及方法。該錄音文件索引的方法,包括:開啟錄音和語音識(shí)別,獲取錄音文件和對(duì)應(yīng)的語音識(shí)別文本;將所述錄音文件的時(shí)間軸映射到所述語音識(shí)別文本中;將語音識(shí)別文本及其對(duì)應(yīng)于時(shí)間軸中的時(shí)間對(duì)應(yīng)保存為文本文件。通過在錄制錄音文件時(shí)對(duì)錄音進(jìn)行語音識(shí)別,將錄音文件中的時(shí)間軸映射到語音識(shí)別文件中,將語音識(shí)別文件及其對(duì)應(yīng)于時(shí)間軸中的時(shí)間對(duì)應(yīng)保存,建立文本和時(shí)間軸之間的關(guān)聯(lián),通過文本實(shí)現(xiàn)對(duì)錄音文件的索引,實(shí)現(xiàn)了對(duì)錄音文件中內(nèi)容的快速查看和切換,提高了對(duì)錄音文件的瀏覽的效率。
【IPC分類】G06F17/30
【公開號(hào)】CN105653729
【申請(qǐng)?zhí)枴?br>【發(fā)明人】申世安
【申請(qǐng)人】努比亞技術(shù)有限公司
【公開日】2016年6月8日
【申請(qǐng)日】2016年1月28日
當(dāng)前第4頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1