亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種錄音文件索引的裝置及方法

文檔序號:9887828閱讀:561來源:國知局
一種錄音文件索引的裝置及方法
【技術(shù)領域】
[0001]本發(fā)明涉及多媒體技術(shù)領域,尤其涉及一種錄音文件索引的裝置及方法。
【背景技術(shù)】
[0002]現(xiàn)在的移動終端已經(jīng)可以很方便的進行錄音工作,但涉及到時間較長的錄音操作時,回放查看錄音文件時,仍然需要使用滑條對有用的內(nèi)容以預覽的方式進行內(nèi)容的檢索,無法直接調(diào)整播放想要播放的內(nèi)容,需要多次才能找到想要查看的內(nèi)容,錄音文件缺乏有效的索引方式導致錄音文件的瀏覽效率會很低。

【發(fā)明內(nèi)容】

[0003]本發(fā)明的主要目的在于提出一種錄音文件索引的裝置及方法,旨在實現(xiàn)對錄音文件的快速索引。
[0004]為實現(xiàn)上述目的,本發(fā)明提出一種錄音文件索引的裝置,包括:
[0005]文件生成單元,用于開啟錄音和語音識別,獲取錄音文件和對應的語音識別文本;
[0006]時間映射單元,用于將所述錄音文件的時間軸映射到所述語音識別文本中;
[0007]文本保存單元,用于將語音識別文本及其對應于時間軸中的時間對應保存為文本文件。
[0008]其中,所述文件生成單元,包括:
[0009]第一計時模塊,用于開啟錄音,同時開啟計時器用于記錄錄音過程中整句音頻數(shù)據(jù)的起始時間和整句結(jié)束時間;
[0010]第二計時模塊,用于將所述整句音頻數(shù)據(jù)發(fā)送到語音識別服務器進行語音識別,并記錄所述整句音頻數(shù)據(jù)的發(fā)送時間和對應的語音識別文本的接收時間;
[0011]所述時間映射單元,包括:
[0012]時間修正模塊,用于根據(jù)所述發(fā)送時間和接收時間的時間差對所述整句結(jié)束時間進行修正,得到所述整句音頻數(shù)據(jù)的結(jié)束時間;
[0013]時間標記模塊,用于根據(jù)所述起始時間和結(jié)束時間對所述整句音頻數(shù)據(jù)對應的語音識別文本的起始時間點和結(jié)尾時間點進行標記。
[0014]其中,所述時間標記模塊,包括:
[0015]字符統(tǒng)計子模塊,用于統(tǒng)計所述整句音頻數(shù)據(jù)對應的語音識別文本中的字符;
[0016]時長計算子模塊,用于根據(jù)所述起始時間和結(jié)束時間計算出所述語音識別文本中每個字符的平均時長;
[0017]字符標記子模塊,用于根據(jù)所述平均時長對每個字符進行時間軸標記,其中所述語音識別文本中的第一個字符標記起始時間點,最后一個字符標記為結(jié)尾時間點。
[0018]其中,所述裝置,還包括:
[0019]文件播放單元,用于播放所述錄音文件時,顯示所述文本文件中記錄的語音識別文本,并突出顯示所述錄音文件的時間軸當前對應的語音識別文本。
[0020]其中,所述裝置,還包括:
[0021]索引切換單元,用于當顯示的語音識別文本檢測到索引指令時,將所述錄音文件切換到所述索引指令指向的語音識別文本對應的時間。
[0022]另外,為實現(xiàn)上述目的,本發(fā)明還提出了一種錄音文件索引的方法,包括:
[0023]開啟錄音和語音識別,獲取錄音文件和對應的語音識別文本;
[0024]將所述錄音文件的時間軸映射到所述語音識別文本中;
[0025]將語音識別文本及其對應于時間軸中的時間對應保存為文本文件。
[0026]其中,所述開啟錄音和語音識別,獲取錄音文件和對應的語音識別文本,包括:
[0027]開啟錄音,同時開啟計時器用于記錄錄音過程中整句音頻數(shù)據(jù)的起始時間和整句結(jié)束時間;
[0028]將所述整句音頻數(shù)據(jù)發(fā)送到語音識別服務器進行語音識別,并記錄所述整句音頻數(shù)據(jù)的發(fā)送時間和對應的語音識別文本的接收時間;
[0029]所述將所述錄音文件的時間軸映射到所述語音識別文本中,包括:
[0030]根據(jù)所述發(fā)送時間和接收時間的時間差對所述整句結(jié)束時間進行修正,得到所述整句音頻數(shù)據(jù)的結(jié)束時間;
[0031]根據(jù)所述起始時間和結(jié)束時間對所述整句音頻數(shù)據(jù)對應的語音識別文本的起始時間點和結(jié)尾時間點進行標記。
[0032]其中,所述根據(jù)所述起始時間和結(jié)束時間對所述整句音頻數(shù)據(jù)對應的語音識別文本的起始時間點和結(jié)尾時間點進行標記,包括:
[0033]統(tǒng)計所述整句音頻數(shù)據(jù)對應的語音識別文本中的字符;
[0034]根據(jù)所述起始時間和結(jié)束時間計算出所述語音識別文本中每個字符的平均時長;
[0035]根據(jù)所述平均時長對每個字符進行時間軸標記,其中所述語音識別文本中的第一個字符標記起始時間點,最后一個字符標記為結(jié)尾時間點。
[0036]其中,所述將語音識別文本及其對應于時間軸中的時間對應保存為文本文件之后,還包括:
[0037]播放所述錄音文件時,顯示所述文本文件中記錄的語音識別文本,并突出顯示所述錄音文件的時間軸當前對應的語音識別文本。
[0038]其中,所述播放所述錄音文件時,顯示所述文本文件中記錄的語音識別文本,并突出顯示所述錄音文件的時間軸當前對應的語音識別文本之后,還包括:
[0039]當顯示的語音識別文本檢測到索引指令時,將所述錄音文件切換到所述索引指令指向的語音識別文本對應的時間。
[0040]本發(fā)明所提出的錄音文件索引的裝置及方法,通過在錄制錄音文件時對錄音進行語音識別,將錄音文件中的時間軸映射到語音識別文件中,將語音識別文件及其對應于時間軸中的時間對應保存,建立文本和時間軸之間的關(guān)聯(lián),通過文本實現(xiàn)對錄音文件的索引,實現(xiàn)了對錄音文件中內(nèi)容的快速查看和切換,提高了對錄音文件的瀏覽的效率。
【附圖說明】
[0041 ]圖1為實現(xiàn)本發(fā)明各個實施例一個可選的移動終端的硬件結(jié)構(gòu)示意圖;
[0042]圖2為如圖1所示的移動終端的無線通信系統(tǒng)示意圖;
[0043]圖3為本發(fā)明的一種錄音文件索引的方法第一實施例的方法流程圖;
[0044]圖4為本發(fā)明的一種錄音文件索引的方法第二實施例的方法流程圖;
[0045]圖5為本發(fā)明的一種錄音文件索引的裝置第一實施例的結(jié)構(gòu)方框圖;
[0046]圖6為本發(fā)明的一種錄音文件索引的裝置第二實施例的結(jié)構(gòu)方框圖。
[0047]本發(fā)明目的的實現(xiàn)、功能特點及優(yōu)點將結(jié)合實施例,參照附圖做進一步說明。
【具體實施方式】
[0048]應當理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
[0049]現(xiàn)在將參考附圖描述實現(xiàn)本發(fā)明各個實施例的移動終端。在后續(xù)的描述中,使用用于表示元件的諸如“模塊”、“部件”或“單元”的后綴僅為了有利于本發(fā)明的說明,其本身并沒有特定的意義。因此,"模塊"與"部件"可以混合地使用。
[0050]移動終端可以以各種形式來實施。例如,本發(fā)明中描述的終端可以包括諸如移動電話、智能電話、筆記本電腦、數(shù)字廣播接收器、PDA(個人數(shù)字助理)、PAD(平板電腦)、PMP(便攜式多媒體播放器)、導航裝置等等的移動終端以及諸如數(shù)字TV、臺式計算機等等的固定終端。下面,假設終端是移動終端。然而,本領域技術(shù)人員將理解的是,除了特別用于移動目的的元件之外,根據(jù)本發(fā)明的實施方式的構(gòu)造也能夠應用于固定類型的終端。
[0051]圖1為實現(xiàn)本發(fā)明各個實施例一個可選的移動終端的硬件結(jié)構(gòu)示意圖。
[0052]移動終端100可以包括無線通信單元110、A/V(音頻/視頻)輸入單元120、用戶輸入單元130、輸出單元150、存儲器160、接口單元170、控制器180和電源單元190等等。圖1示出了具有各種組件的移動終端,但是應理解的是,并不要求實施所有示出的組件??梢蕴娲貙嵤└嗷蚋俚慕M件。將在下面詳細描述移動終端的元件。
[0053]無線通信單元110通常包括一個或多個組件,其允許移動終端100與無線通信系統(tǒng)或網(wǎng)絡之間的無線電通信。例如,無線通信單元可以包括廣播接收模塊111、移動通信模塊112、無線互聯(lián)網(wǎng)模塊113、短程通信模塊114和位置信息模塊115中的至少一個。
[0054]廣播接收模塊111經(jīng)由廣播信道從外部廣播管理服務器接收廣播信號和/或廣播相關(guān)信息。廣播信道可以包括衛(wèi)星信道和/或地面信道。廣播管理服務器可以是生成并發(fā)送廣播信號和/或廣播相關(guān)信息的服務器或者接收之前生成的廣播信號和/或廣播相關(guān)信息并且將其發(fā)送給終端的服務器。廣播信號可以包括TV廣播信號、無線電廣播信號、數(shù)據(jù)廣播信號等等。而且,廣播信號可以進一步包括與TV或無線電廣播信號組合的廣播信號。廣播相關(guān)信息也可以經(jīng)由移動通信網(wǎng)絡提供,并且在該情況下,廣播相關(guān)信息可以由移動通信模塊112來接收。廣播信號可以以各種形式存在,例如,其可以以數(shù)字多媒體廣播(DMB)的電子節(jié)目指南(EPG)、數(shù)字視頻廣播手持(DVB-H)的電子服務指南(ESG)等等的形式而存在。廣播接收模塊111可以通過使用各種類型的廣播系統(tǒng)接收信號廣播。特別地,廣播接收模塊111可以通過使用諸如多媒體廣播-地面(DMB-T)、數(shù)字多媒體廣播-衛(wèi)星(DMB-S)、數(shù)字視頻廣播-手持(DVB-H),前向鏈路媒體(MediaFLO?)的數(shù)據(jù)廣播系統(tǒng)、地面數(shù)字廣播綜合服務(ISDB-T)等等的數(shù)字廣播系統(tǒng)接收數(shù)字廣播。廣播接收模塊111可以被構(gòu)造為適合提供廣播信號的各種廣播系統(tǒng)以及上述數(shù)字廣播系統(tǒng)。經(jīng)由廣播接收模塊111接收的廣播信號和/或廣播相關(guān)信息可以存儲在存儲器160(或者其它類型的存儲介質(zhì))中。
[0055]移動通信模塊112將無線電信號發(fā)送到基站(例如,接入點、節(jié)點B等等)、外部終端以及服務器中的至少一個和/或從其接收無線電信號。這樣的無線電信號可以包括語音通話信號、視頻通話信號、或者根據(jù)文本和/或多媒體消息發(fā)送和/或接收的各種類型的數(shù)據(jù)。
[0056]無線互聯(lián)網(wǎng)模塊113支持移動終端的無線互聯(lián)網(wǎng)接入。該模塊可以內(nèi)部或外部地耦接到終端。該模塊所涉及的無線互聯(lián)網(wǎng)接入技術(shù)可以包括WLAN(無線LAN)(W1-F
當前第1頁1 2 3 4 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1