專利名稱:即時(shí)通信中聲音信息映射性輸出的方法、終端和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于計(jì)算機(jī)、網(wǎng)絡(luò)技術(shù)領(lǐng)域。
背景技術(shù):
網(wǎng)絡(luò)即時(shí)通信(IM)工具發(fā)展到今天,已成為用戶普遍使用的通訊工具,逐漸成為網(wǎng)絡(luò)用戶日常生活中必不可少的一部分。即時(shí)通信工具不但被使用在網(wǎng)絡(luò)用戶的工作中, 同樣也大量使用在網(wǎng)絡(luò)用戶的業(yè)余生活中,用戶通過網(wǎng)絡(luò)即時(shí)通信工具可以實(shí)現(xiàn)與聯(lián)系人及時(shí)有效的溝通。在目前的使用過程中,當(dāng)用戶想為當(dāng)前聯(lián)系人播放一段聲音片段時(shí),所采用的方式多為發(fā)送聲音文件或發(fā)送聲音文件鏈接,整個(gè)過程都需要用戶對該聲音文件進(jìn)行主動(dòng)檢索,而且當(dāng)用戶希望發(fā)送的是一段聲音的某個(gè)片段時(shí),還需要對該聲音文件做預(yù)先處理,操作過程較為繁瑣,降低了用戶的使用體驗(yàn)。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種即時(shí)通信中聲音信息映射性輸出的方法、終端和系統(tǒng),利用本發(fā)明,用戶可以通過自身哼唱或者播放聲音片段的方式向系統(tǒng)提供音頻片段,系統(tǒng)通過搜索比對,將與用戶提供的聲音片段符合的聲音片段發(fā)送至與用戶進(jìn)行數(shù)據(jù)連接的接收方客戶端。本發(fā)明提供一種即時(shí)通信中聲音信息的映射性輸出的方法,包括如下步驟步驟1,建立用于在即時(shí)通信中映射輸出的映射影音庫;步驟2,針對于即時(shí)通信接收方,通過映射輸出功能的觸發(fā),采集發(fā)送方的聲音信息;步驟3,根據(jù)采集到的用戶聲音信息從映射影音庫中檢索對應(yīng)的映射影音文件;步驟4,將上一步驟中檢索到的映射影音文件發(fā)送至即時(shí)通信接收方客戶端。進(jìn)一步,所述映射影音庫包括下述三者至少其一,用戶終端映射影音庫,存儲(chǔ)在用戶即時(shí)通信工具所在的客戶端中;系統(tǒng)服務(wù)器映射影音庫,存儲(chǔ)在所述即時(shí)通信工具所對應(yīng)的系統(tǒng)服務(wù)器中;網(wǎng)絡(luò)搜索數(shù)據(jù)端映射影音庫,存儲(chǔ)在能夠向網(wǎng)絡(luò)搜索提供音頻數(shù)據(jù)的網(wǎng)絡(luò)第三方。進(jìn)一步,對應(yīng)著所述的系統(tǒng)服務(wù)器映射影音庫,建立有和用戶的即時(shí)通信識(shí)別號(hào)相對應(yīng)的個(gè)性影音數(shù)據(jù)映射列表。進(jìn)一步,所述的針對于特定即時(shí)通信識(shí)別號(hào)的個(gè)性影音數(shù)據(jù)映射列表,包括有分別對應(yīng)著該用戶即時(shí)通信聯(lián)系人的聯(lián)系人個(gè)性映射列表。進(jìn)一步,所述聲音信息為用戶發(fā)出或以播放聲音的方式向即時(shí)通信發(fā)送方客戶端提供的聲音片段。進(jìn)一步,所述映射輸出功能觸發(fā)方式包括下述三者至少其一,
方式一,通過即時(shí)通信交互界面中的映射功能控件進(jìn)行觸發(fā),該即時(shí)通信交互界面和用戶所選擇的即時(shí)通信接收方相對應(yīng);方式二,在即時(shí)通信主面板的聯(lián)系人列表中,針對于所選擇的聯(lián)系人對象,進(jìn)行映射功能觸發(fā);方式三,當(dāng)本地客戶端處于錄音狀態(tài)時(shí),采用特定的語音信息觸發(fā)。進(jìn)一步,上述映射輸出功能觸發(fā)方式三主要包括如下步驟,步驟a,開啟本地客戶端的錄音功能;步驟b,采集來自于用戶的聲音信息;步驟c,識(shí)別用戶的聲音信息,判斷是否包括有聯(lián)系人標(biāo)識(shí);步驟d,觸發(fā)針對于前述聯(lián)系人標(biāo)識(shí)所對應(yīng)聯(lián)系人的映射輸出功能。進(jìn)一步,針對于所述的步驟2中所采集的發(fā)送方聲音信息,以發(fā)送方的即時(shí)通信識(shí)別號(hào)作為索引信息,以對應(yīng)的音頻數(shù)據(jù)作為被索引信息,將其存儲(chǔ)于本地客戶端、即時(shí)通信系統(tǒng)服務(wù)器和第三方存儲(chǔ)器三者至少其一中。進(jìn)一步,所述映射影音庫中檢索對應(yīng)的映射影音文件方式為以下二者至少其一,方式一,識(shí)別用戶提供的聲音信息,將其轉(zhuǎn)變成對應(yīng)的文字信息,根據(jù)文字信息的匹配性檢索對應(yīng)的映射影音文件;方式二,識(shí)別用戶所提供的聲音信息,獲得該聲音片段的音頻特征信息,將該音頻特征信息作為檢索的關(guān)鍵信息,根據(jù)相符程度進(jìn)行判別,在影音庫中檢索對應(yīng)的映射影音文件。進(jìn)一步,存儲(chǔ)于映射影音庫中的影音文件需預(yù)先經(jīng)過數(shù)字處理,包括如下步驟,步驟bl,識(shí)別影音文件中語音信息對應(yīng)的文字信息;步驟1^2,分析影音文件的音頻特征信息;步驟b3,將影音文件對應(yīng)的文字信息和音頻特征信息同該影音文件建立映射關(guān)系,并將其存儲(chǔ)于映射影音文件庫中。進(jìn)一步,在對映射影音庫中的影音文件進(jìn)行分析對比沒有獲得對應(yīng)的映射影音文件后,采用網(wǎng)絡(luò)抓取的方式,從互聯(lián)網(wǎng)中抓取匹配的映射影音文件及其相關(guān)信息。進(jìn)一步,檢索到對應(yīng)的目標(biāo)影音文件后,從該映射文件中截取同用戶提供的聲音片段對應(yīng)的映射影音文件片段,用于數(shù)據(jù)的發(fā)送操作。進(jìn)一步,檢索出對應(yīng)的映射影音文件后,給發(fā)送方客戶端返回檢索結(jié)果,采集用戶的確認(rèn)信息后,用于數(shù)據(jù)的發(fā)送操作。進(jìn)一步,所述的檢索結(jié)果包括該映射影音文件的名稱、映射影音文件片段時(shí)間長度、格式。進(jìn)一步,在檢索到對應(yīng)的映射影音文件后還包括如下步驟,步驟Cl,分析用戶提供的聲音信息的音頻特征信息;步驟c2,分析映射影音文件的音頻特征信息;步驟c3,根據(jù)用戶提供聲音信息的音頻特征信息,對映射影音文件中相應(yīng)的音頻特征作出對應(yīng)調(diào)整。進(jìn)一步,所述步驟4中將檢索到的映射影音文件發(fā)送至即時(shí)通信接收方客戶端的方式為以下二者至少其一,
方式一,將該映射影音文件包含于即時(shí)通信聊天信息內(nèi),發(fā)送至接收方即時(shí)通信交互界面中,通過用戶點(diǎn)擊觸發(fā)后播放;方式二,預(yù)先建立雙方的語音通話連接,將該映射影音文件直接發(fā)送至接收方客戶端并播放。本發(fā)明提供一種即時(shí)通信中聲音信息的映射性輸出的終端包括即時(shí)通信交互界面,是為用戶提供即時(shí)通信信息交流以及映射性輸出相關(guān)操作的功能平臺(tái);用戶終端映射影音庫,是位于用戶終端,用于存儲(chǔ)用于映射性輸出的影音文件的數(shù)據(jù)庫;聲音采集模塊,是用于采集用戶提供的聲音信息的功能模塊;映射影音檢索模塊,是用于根據(jù)用戶提供的聲音信息,從映射影音庫檢索對應(yīng)的映射影音文件的功能模塊;影音播放模塊,是用于播放接收到的映射影音文件的功能模塊。進(jìn)一步,對應(yīng)著所述的映射影音庫,設(shè)置有發(fā)送方語音篩選單元,它包括,個(gè)性語音特征模塊,是用于存儲(chǔ)用戶個(gè)人音頻特征數(shù)據(jù)的功能模塊;用戶語音識(shí)別模塊,是用于根據(jù)個(gè)性語音特征模塊中的用戶個(gè)人音頻特征數(shù)據(jù), 對比分析采集到的聲音信息,從而篩選出符合用戶個(gè)人音頻特征的音頻數(shù)據(jù)作為采集到的聲音信息的功能模塊。本發(fā)明還提供一種即時(shí)通信中聲音信息的映射性輸出的系統(tǒng),包括用戶操作使用的客戶端以及連接雙方客戶端的服務(wù)器,其中,所述客戶端包括即時(shí)通信交互界面,是為用戶提供即時(shí)通信信息交流以及映射性輸出相關(guān)操作的功能平臺(tái);用戶終端映射影音庫,是位于用戶終端,用于存儲(chǔ)用于映射性輸出的影音文件的數(shù)據(jù)庫;聲音采集模塊,是用于采集用戶提供的聲音信息的功能模塊;映射影音檢索模塊,是用于根據(jù)用戶提供的聲音信息,從映射影音庫檢索對應(yīng)的映射影音文件的功能模塊;影音播放模塊,是用于播放接收到的映射影音文件的功能模塊;所述服務(wù)器包括系統(tǒng)服務(wù)器映射影音庫,是位于系統(tǒng)服務(wù)器,用于存儲(chǔ)用于映射性輸出的影音文件的數(shù)據(jù)庫;服務(wù)器數(shù)據(jù)檢索模塊,是用于根據(jù)用戶提供的聲音信息,從系統(tǒng)服務(wù)器映射影音庫檢索對應(yīng)的映射影音文件的功能模塊;服務(wù)器數(shù)據(jù)處理模塊,是用于處理服務(wù)器與發(fā)送方、接收方客戶端之間數(shù)據(jù)交流的功能模塊。
圖1是本發(fā)明第一實(shí)施例提供的一種即時(shí)通信中聲音信息映射性輸出的方法中用戶向本地客戶端提供聲音片段的界面示意圖。圖2是本發(fā)明第一實(shí)施例提供的一種即時(shí)通信中聲音信息映射性輸出的方法中客戶端反饋用戶檢索結(jié)果的界面示意圖。圖3是本發(fā)明第二實(shí)施例提供的一種即時(shí)通信中聲音信息映射性輸出的方法流程圖。圖4是本發(fā)明第三實(shí)施例提供的一種即時(shí)通信中聲音信息映射性輸出的終端結(jié)構(gòu)圖。圖5是本發(fā)明第四實(shí)施例提供的一種即時(shí)通信中聲音信息映射性輸出的系統(tǒng)結(jié)構(gòu)圖。
具體實(shí)施例方式本發(fā)明的目的在于提供一種即時(shí)通信中聲音信息映射性輸出的方法、終端和系統(tǒng),利用本發(fā)明,用戶可以通過自身哼唱或者播放聲音片段的方式向系統(tǒng)提供音頻片段,系統(tǒng)通過搜索比對,將系統(tǒng)內(nèi)與用戶提供的聲音片段符合的聲音片段發(fā)送至與用戶進(jìn)行數(shù)據(jù)連接的接收方客戶端。下面參照附圖,結(jié)合具體實(shí)施例對本發(fā)明做進(jìn)一步的說明。圖1、圖2為本發(fā)明所述的一種即時(shí)通信中聲音信息映射性輸出方法的說明性示意圖,展示了用戶在使用該方法時(shí)的軟件界面,直觀地表達(dá)出本發(fā)明的發(fā)明目的。舉例說明,用戶Mary想通過即時(shí)通信工具向自己的即時(shí)通信聯(lián)系人Joy發(fā)送名為 XXXXX的歌曲中的其中一段內(nèi)容。如圖1所示,Mary通過點(diǎn)擊自身即時(shí)通信主面板400上對應(yīng)Joy的即時(shí)通信聯(lián)系人圖標(biāo)410,開啟二者間的即時(shí)通信交互界面300。點(diǎn)擊位于即時(shí)通信交互界面300上的映射功能控件310觸發(fā)相應(yīng)的映射輸出功能。映射輸出功能開啟后,Mary只需將想發(fā)送的來自于歌曲XXXXX中的一段內(nèi)容哼唱出來,系統(tǒng)即會(huì)根據(jù)用戶提供的聲音信息,從自身的數(shù)據(jù)庫中檢索比對。圖1中所示的聲音采集控件311用來便于用戶控制系統(tǒng)對自身聲音信息的采集。該控件在用戶觸發(fā)映射輸出功能后顯示于映射功能控件310右側(cè)。如圖2所示,系統(tǒng)通過檢索比對,獲得相應(yīng)的映射輸出聲音文件后,將檢索到的該映射文件的相關(guān)信息“已檢索到映射文件XXXXX,MP3格式,時(shí)長53S。,,返回至二者的交互界面輸出欄320。由于此時(shí)檢索出的文件內(nèi)容即為Mary想要發(fā)送的信息,用戶Mary點(diǎn)擊檢索結(jié)果響應(yīng)控件321 “確定”,即可將該文件發(fā)送至Joy的即時(shí)通信客戶端。若檢索到的內(nèi)容錯(cuò)誤,通過點(diǎn)擊檢索結(jié)果響應(yīng)控件321“重新檢索”,即可啟動(dòng)系統(tǒng)針對用戶提供的聲音信息進(jìn)行重新檢索。圖3為本發(fā)明所述的即時(shí)通信中向自身發(fā)送數(shù)據(jù)的方法流程圖。下面結(jié)合具體步驟,對本發(fā)明做詳細(xì)說明。在步驟SlOl中,建立用于在即時(shí)通信中映射輸出的映射影音庫。為實(shí)現(xiàn)所述的在即時(shí)通信中聲音信息的映射性輸出,首先要建立存儲(chǔ)該映射性輸出的聲音文件的數(shù)據(jù)庫,即映射影音庫。其中,根據(jù)映射影音文件的存儲(chǔ)位置的不同,映射影音庫主要包括如下三個(gè)組成部分
用戶終端映射影音庫,存儲(chǔ)在用戶即時(shí)通信工具所在的客戶端中,這部分影音內(nèi)容主要為用戶自行建立,根據(jù)用戶自己的使用喜好,有選擇的設(shè)定映射影音庫內(nèi)容,是用戶個(gè)人使用的映射影音庫;系統(tǒng)服務(wù)器映射影音庫,存儲(chǔ)在所述即時(shí)通信工具所對應(yīng)的系統(tǒng)服務(wù)器中,這部分影音內(nèi)容主要為系統(tǒng)提供,是系統(tǒng)為廣大用戶提供的一個(gè)公用映射影音庫;網(wǎng)絡(luò)搜索數(shù)據(jù)端映射影音庫,存儲(chǔ)在能夠向網(wǎng)絡(luò)搜索提供音頻數(shù)據(jù)的網(wǎng)絡(luò)第三方,這部分影音庫即指網(wǎng)絡(luò)資源,當(dāng)用戶需要映射的聲音文件無法從前兩個(gè)影音庫中檢索到時(shí),即從網(wǎng)絡(luò)中檢索對應(yīng)的影音文件。在使用時(shí),要采用其中至少其一。另外,在所述的系統(tǒng)服務(wù)器映射影音庫中,建有和用戶的即時(shí)通信識(shí)別號(hào)相對應(yīng)的個(gè)性影音數(shù)據(jù)映射列表,且該數(shù)據(jù)映射列表中,包括有分別對應(yīng)著該用戶即時(shí)通信聯(lián)系人的聯(lián)系人個(gè)性映射列表。舉例說明,用戶Mary根據(jù)自己的喜好,將一部分影音文件上傳至系統(tǒng)服務(wù)器映射影音庫中保存,作為自己個(gè)人使用的影音庫。系統(tǒng)即將這部分影音文件保存在對應(yīng)用戶 Mary的UID的文件夾下。對應(yīng)這部分影音文件建立的影音數(shù)據(jù)映射列表,就是同Mary的 UID號(hào)相對應(yīng)的個(gè)性影音數(shù)據(jù)映射列表。另外,用戶Mary還可以對自己即時(shí)通信聯(lián)系人中的不同聯(lián)系人分別設(shè)置不同的聲音映射關(guān)系,即面對不同的聯(lián)系人,同一聲音信息對應(yīng)不同的映射影音文件,根據(jù)Mary設(shè)置的對應(yīng)關(guān)系生成對應(yīng)Mary的UID的聯(lián)系人個(gè)性映射列表。在步驟S102中,針對于即時(shí)通信接收方,通過映射輸出功能的觸發(fā),采集發(fā)送方
的聲音信息。其中,所述映射輸出功能觸發(fā)方式包括下述三者至少其一,方式一,通過即時(shí)通信交互界面中的映射功能控件進(jìn)行觸發(fā),該即時(shí)通信交互界面和用戶所選擇的即時(shí)通信接收方相對應(yīng)。例如,用戶Mary想要向用戶Joy發(fā)送一段映射性輸出的聲音文件,需要在已經(jīng)預(yù)先建立好相應(yīng)的映射影音庫的情況下,觸發(fā)該映射輸出功能。如圖1中所示,Mary首先打開同Joy進(jìn)行聊天的即時(shí)通信交互界面300,然后點(diǎn)擊位于該即時(shí)通信交互界面300上的映射功能控件310,通過該功能控件310觸發(fā)相應(yīng)的映射輸出功能。方式二,在即時(shí)通信主面板的聯(lián)系人列表中,針對于所選擇的聯(lián)系人對象(Item), 進(jìn)行映射功能觸發(fā)。在本方式中,用戶Mary可以在不需要打開相應(yīng)用戶Joy的即時(shí)通信交互界面300 的情況下,直接在通過位于即時(shí)通信主面板400上的聯(lián)系人圖標(biāo)410,進(jìn)行映射功能觸發(fā)。 操作時(shí),用戶Mary將光標(biāo)移至用戶Joy的聯(lián)系人圖標(biāo)410上,單擊鼠標(biāo)右鍵,從右鍵菜單中選取對應(yīng)的映射功能選項(xiàng),觸發(fā)映射輸出功能的開啟。方式三,當(dāng)本地客戶端處于錄音狀態(tài)時(shí),采用特定的語音信息觸發(fā)。本觸發(fā)方式針對于用戶當(dāng)前電腦已處于錄音開啟狀態(tài)的情況下,根據(jù)采集到的用戶特定的語音信息,觸發(fā)映射輸出功能的開啟。所述特定語音信息指該用戶的即時(shí)通信聯(lián)系人標(biāo)識(shí)。針對本觸發(fā)方式,其觸發(fā)過程主要包括以下幾步
步驟a,開啟本地客戶端的錄音功能;步驟b,采集來自于用戶的聲音信息;步驟c,識(shí)別用戶的聲音信息,判斷是否包括有聯(lián)系人標(biāo)識(shí);步驟d,觸發(fā)針對于前述聯(lián)系人標(biāo)識(shí)所對應(yīng)聯(lián)系人的映射功能。舉例說明,當(dāng)用戶Mary當(dāng)前使用的電腦處于錄音開啟狀態(tài)時(shí),若用戶Mary希望觸發(fā)針對用戶Joy的映射性輸出,只需要說出用戶Joy在用戶Mary的即時(shí)通信聯(lián)系人列表中對應(yīng)的聯(lián)系人標(biāo)識(shí)Joy,系統(tǒng)通過識(shí)別用戶的聲音信息,判斷出“Joy”這個(gè)信息有相應(yīng)的聯(lián)系人標(biāo)識(shí),即開啟針對用戶Joy的映射輸出功能。其中,所述發(fā)送方提供的用于尋找映射輸出聲音文件的聲音信息有以下兩種提供方式方式一,通過用戶自身發(fā)出聲音的方式向即時(shí)通信發(fā)送方客戶端提供的聲音片段。例如用戶可以哼唱一段旋律,或者朗誦一段文字內(nèi)容。方式二,通過用戶利用其它裝置播放聲音的方式向即時(shí)通信發(fā)送方客戶端提供的聲音片段。例如,用戶可以利用樂器彈奏旋律,或者利用具有外放功能的音頻播放裝置播放一段聲音片段。另外,對于在本步驟中所采集到的發(fā)送方的聲音信息,以發(fā)送方的即時(shí)通信識(shí)別號(hào)作為索引信息,以對應(yīng)的音頻數(shù)據(jù)作為被索引信息,存儲(chǔ)于本地客戶端、即時(shí)通信系統(tǒng)服務(wù)器和第三方存儲(chǔ)器三者至少其一中。所存儲(chǔ)的發(fā)送方聲音信息可以用于在以后的聲音信息的對比識(shí)別時(shí),便于系統(tǒng)更準(zhǔn)確地識(shí)別出用戶的聲音,從而提高系統(tǒng)檢索對應(yīng)映射文件的效率。在步驟S103中,根據(jù)采集到的用戶聲音信息從映射影音庫中檢索對應(yīng)的映射影音文件。在本步驟中,主要采用匹配檢索算法檢索對應(yīng)的映射影音文件。通過檢索內(nèi)容的匹配性來確定檢索結(jié)果。根據(jù)檢索時(shí)關(guān)鍵內(nèi)容的不同類型,所述映射影音庫中檢索對應(yīng)的映射影音文件方式分為以下兩種方式一,檢索關(guān)鍵內(nèi)容為該聲音信息的文字信息。首先,通過語音識(shí)別技術(shù),分析用戶提供的聲音信息,將其轉(zhuǎn)變成對應(yīng)的文字信息,根據(jù)文字信息的匹配性檢索對應(yīng)的映射影音文件。這種檢索方式適應(yīng)于用戶提供的聲音片段包含文字內(nèi)容的情況,例如歌詞。方式二,檢索關(guān)鍵內(nèi)容為該聲音信息的音頻特征信息。識(shí)別用戶所提供的聲音信息,獲得該聲音片段的音頻特征信息,作為檢索的關(guān)鍵信息,根據(jù)相符程度進(jìn)行判別,在影音庫中檢索對應(yīng)的映射影音文件。其中,所述的音頻特征信息是指該段聲音信息的音樂節(jié)拍和音符信息等音頻數(shù)據(jù)信息。這種檢索方式適應(yīng)于用戶提供純音樂旋律的聲音片段的情況。在用戶提供的聲音信息既包括文字內(nèi)容,也包括音樂旋律時(shí),例如,用戶哼唱一句歌詞時(shí),可以任意選擇上述檢索方式其中之一。當(dāng)然,也可同時(shí)選擇兩種檢索方式,交叉比對,這樣可以更加準(zhǔn)確的檢索到映射影音文件。對應(yīng)上述的檢索方式,在建立映射影音庫時(shí),需要將映射影音庫中的影音文件預(yù)先經(jīng)過數(shù)字處理,預(yù)處理為包括相應(yīng)文字信息和音頻特征信息的影音文件,主要步驟如下
步驟bl,識(shí)別影音文件中語音信息對應(yīng)的文字信息;步驟132,分析影音文件的音頻特征信息;步驟b3,將影音文件對應(yīng)的文字信息和音頻特征信息同該影音文件建立映射關(guān)系,并將其存儲(chǔ)于映射影音文件庫中。這樣,在提取到用戶提供的聲音信息的檢索關(guān)鍵內(nèi)容后,即可根據(jù)該關(guān)鍵內(nèi)容同映射影音庫中影音文件對應(yīng)的關(guān)鍵內(nèi)容進(jìn)行比對,根據(jù)相符程度進(jìn)行判別選擇。在檢索時(shí),優(yōu)先從本地電腦上的用戶終端映射影音庫中檢索比對。若檢索失敗,再從系統(tǒng)服務(wù)器映射影音庫中檢索比對。若仍未獲得符合要求的映射影音文件,則采用web 網(wǎng)絡(luò)抓取的方式,從互聯(lián)網(wǎng)中抓取匹配的映射影音文件及其相關(guān)信息,即從網(wǎng)絡(luò)搜索數(shù)據(jù)端映射影音庫中檢索比對。通過在上述多個(gè)影音庫中的檢索,在檢索到對應(yīng)的映射影音文件后,從該映射文件中截取同用戶提供的聲音片段對應(yīng)的映射影音文件片段,用于數(shù)據(jù)的發(fā)送操作。例如用戶提供的聲音文件為一首歌的一句歌詞,系統(tǒng)在通過匹配檢索的方式檢索到這首歌后,再從這首歌中截取用戶所提供的這句歌詞所對應(yīng)的這一部分歌曲片段。最后發(fā)送至接收方客戶端的即是截取后的歌曲片段。另外,在檢索到對應(yīng)的映射影音文件后,還可以根據(jù)用戶提供的聲音信息的音頻特征,對映射影音文件中相應(yīng)的音頻特征作出對應(yīng)調(diào)整,將調(diào)整后的映射影音文件用于數(shù)據(jù)的發(fā)送操作。這樣可以更好的提高用戶體驗(yàn),使得發(fā)送的影音文件變得更加個(gè)性化,增加用戶使用的樂趣。在步驟S104中,用戶判別檢索到的對應(yīng)映射影音文件是否符合要求。若經(jīng)用戶判別為是,則轉(zhuǎn)入步驟S105 ;若經(jīng)用戶判定為否,則返回步驟S103 ;重新檢索對應(yīng)的映射影音文件。其中,在經(jīng)上一步檢索出對應(yīng)的映射影音文件后,給發(fā)送方客戶端返回檢索結(jié)果, 其中所述的檢索結(jié)果包括該映射影音文件的名稱、映射影音文件片段時(shí)間長度和格式。在經(jīng)過用戶確認(rèn)后,該檢索到的映射影音文件即用于數(shù)據(jù)的發(fā)送操作。如圖2所示,在檢索到對應(yīng)的映射影音文件后,在用戶Mary與用戶Joy的即時(shí)通信交互界面300的交互界面輸出欄320中,系統(tǒng)給用戶Mary返回一個(gè)檢索結(jié)果,檢索結(jié)果顯示出了該段映射影音文件名稱、時(shí)間長度和格式。用戶Mary通過點(diǎn)擊檢索結(jié)果響應(yīng)控件 321——“確定”和“重新檢索”,來對該文件是否符合要求做出響應(yīng)。符合用戶Mary要求的映射影音文件片段即用于發(fā)送至用戶Joy的即時(shí)通信終端。在步驟S105中,將經(jīng)上一步驟確定的映射影音文件發(fā)送至即時(shí)通信接收方客戶端。其中,將經(jīng)上一步驟確定的映射影音文件發(fā)送至即時(shí)通信接收方客戶端的方式為以下二者至少其一,方式一,將該映射影音文件包含于即時(shí)通信聊天信息內(nèi),發(fā)送至接收方即時(shí)通信交互界面中,通過用戶點(diǎn)擊觸發(fā)后播放。方式二,預(yù)先建立二者的語音通話連接,將該映射影音文件直接發(fā)送至接收方客戶端并播放。圖4所示為本發(fā)明所述一種即時(shí)通信中聲音信息的映射性輸出終端的結(jié)構(gòu)圖。
用戶終端映射影音庫110,是位于用戶終端,用于存儲(chǔ)用于映射性輸出的影音文件的數(shù)據(jù)庫;聲音采集模塊120,是用于采集用戶提供的聲音信息的功能模塊;映射影音檢索模塊130,是用于根據(jù)用戶提供的聲音信息,從映射影音庫檢索對應(yīng)的映射影音文件的功能模塊;影音播放模塊140,是用于播放接收到的映射影音文件的功能模塊。進(jìn)一步,對應(yīng)著所述的用戶終端映射影音庫,還設(shè)置有發(fā)送方語音篩選單元,它包括,個(gè)性語音特征模塊111,是用于存儲(chǔ)用戶個(gè)人音頻特征數(shù)據(jù)的功能模塊;用戶語音識(shí)別模塊112,是用于根據(jù)個(gè)性語音特征模塊111中的用戶個(gè)人音頻特征數(shù)據(jù),對比分析采集到的聲音信息,從而篩選出符合用戶個(gè)人音頻特征的音頻數(shù)據(jù)作為采集到的聲音信息的功能模塊。圖4中的即時(shí)通信工具中的即時(shí)通信交互界面300,它是為用戶提供即時(shí)通信信息交流以及映射性輸出的相關(guān)操作平臺(tái)。在本實(shí)施例中,用戶想要使用本發(fā)明所述的聲音信息的映射性輸出需要首先建立用戶終端映射影音庫110。實(shí)際應(yīng)用時(shí),聲音采集模塊120采集用戶提供的聲音信息,映射影音檢索模塊130根據(jù)用戶提供的聲音信息,從映射影音庫檢索對應(yīng)的映射影音文件。檢索到的影音文件通過即時(shí)通信聊天工具發(fā)送至接收方客戶端。當(dāng)用戶接收到來自其他用戶發(fā)送的含有映射影音文件的即時(shí)通信消息時(shí),觸發(fā)播放后影音播放模塊140即對該映射影音文件進(jìn)行播放。特別地,針對用戶提供的用戶自己相關(guān)的聲音信息還設(shè)置了針對用戶的發(fā)送方語音篩選功能,用戶預(yù)先通過個(gè)性語音特征模塊111記錄了用戶個(gè)人的音頻特征數(shù)據(jù),當(dāng)聲音采集模塊120采集到用戶提供的聲音信息后,用戶語音識(shí)別模塊112根據(jù)個(gè)性語音特征模塊111記錄的音頻特征信息,篩選出符合用戶個(gè)人音頻特征的音頻數(shù)據(jù)作為采集到的聲
首{曰息。圖5所示為本發(fā)明所述一種即時(shí)通信中聲音信息的映射性輸出系統(tǒng)的結(jié)構(gòu)圖。由圖中可以看出,本發(fā)明所述系統(tǒng)由客戶端100和連接雙方客戶端100的服務(wù)器200兩部分組成。本發(fā)明所述終端,即客戶端100,它包括用戶終端映射影音庫110,是位于用戶終端,用于存儲(chǔ)用于映射性輸出的影音文件的數(shù)據(jù)庫;聲音采集模塊120,是用于采集用戶提供的聲音信息的功能模塊;映射影音檢索模塊130,是用于根據(jù)用戶提供的聲音信息,從映射影音庫檢索對應(yīng)的映射影音文件的功能模塊;影音播放模塊140,是用于播放接收到的映射影音文件的功能模塊。其中,所述服務(wù)器200包括系統(tǒng)服務(wù)器映射影音庫210,是位于系統(tǒng)服務(wù)器,用于存儲(chǔ)用于映射性輸出的影音文件的數(shù)據(jù)庫;服務(wù)器數(shù)據(jù)檢索模塊220,是用于根據(jù)用戶提供的聲音信息,從系統(tǒng)服務(wù)器映射影音庫檢索對應(yīng)的映射影音文件的功能模塊;服務(wù)器數(shù)據(jù)處理模塊230,是用于處理服務(wù)器與發(fā)送方、接收方客戶端之間數(shù)據(jù)交流的功能模塊。圖5中300為即時(shí)通信工具中的即時(shí)通信交互界面,為用戶提供即時(shí)通信信息交流以及映射性輸出的相關(guān)操作平臺(tái)。在本實(shí)施例中,用戶想要使用本發(fā)明所述的聲音信息的映射性輸出需要首先建立用戶終端映射影音庫110。實(shí)際應(yīng)用時(shí),聲音采集模塊120采集用戶提供的聲音信息,映射影音檢索模塊130根據(jù)用戶提供的聲音信息,從映射影音庫檢索對應(yīng)的映射影音文件。若檢索失敗,則通過服務(wù)器數(shù)據(jù)處理模塊230向服務(wù)器200發(fā)送請求,服務(wù)器數(shù)據(jù)檢索模塊 220根據(jù)用戶的請求從系統(tǒng)服務(wù)器映射影音庫210中檢索對應(yīng)的映射影音文件。檢索成功后,通過服務(wù)器數(shù)據(jù)處理模塊230將該映射影音文件發(fā)送至接收方客戶端。接收方接收到該映射影音文件的即時(shí)通信消息后,通過觸發(fā)影音播放模塊140對該映射影音文件進(jìn)行播放。以上是對本發(fā)明的描述而非限定,基于本發(fā)明思想的其它實(shí)施例,均在本發(fā)明的保護(hù)范圍之中。
權(quán)利要求
1.一種即時(shí)通信中聲音信息的映射性輸出的方法,其特征在于所述方法包括如下步驟步驟1,建立用于在即時(shí)通信中映射輸出的映射影音庫;步驟2,針對于即時(shí)通信接收方,通過映射輸出功能的觸發(fā),采集發(fā)送方的聲音信息; 步驟3,根據(jù)采集到的用戶聲音信息從映射影音庫中檢索對應(yīng)的映射影音文件; 步驟4,將上一步驟中檢索到的映射影音文件發(fā)送至即時(shí)通信接收方客戶端。
2.根據(jù)權(quán)利要求1所述的即時(shí)通信中聲音信息的映射性輸出的方法,其特征在于所述映射影音庫包括下述三者至少其一,用戶終端映射影音庫,存儲(chǔ)在用戶即時(shí)通信工具所在的客戶端中; 系統(tǒng)服務(wù)器映射影音庫,存儲(chǔ)在所述即時(shí)通信工具所對應(yīng)的系統(tǒng)服務(wù)器中; 網(wǎng)絡(luò)搜索數(shù)據(jù)端映射影音庫,存儲(chǔ)在能夠向網(wǎng)絡(luò)搜索提供音頻數(shù)據(jù)的網(wǎng)絡(luò)第三方。
3.根據(jù)權(quán)利要求2所述的即時(shí)通信中聲音信息的映射性輸出的方法,其特征在于對應(yīng)著所述的系統(tǒng)服務(wù)器映射影音庫,建立有和用戶的即時(shí)通信識(shí)別號(hào)相對應(yīng)的個(gè)性影音數(shù)據(jù)映射列表。
4.根據(jù)權(quán)利要求3所述的即時(shí)通信中聲音信息的映射性輸出的方法,其特征在于所述的針對于特定即時(shí)通信識(shí)別號(hào)的個(gè)性影音數(shù)據(jù)映射列表,包括有分別對應(yīng)著該用戶即時(shí)通信聯(lián)系人的聯(lián)系人個(gè)性映射列表。
5.根據(jù)權(quán)利要求1所述的即時(shí)通信中聲音信息的映射性輸出的方法,其特征在于所述聲音信息為用戶發(fā)出或以播放聲音的方式,向即時(shí)通信發(fā)送方客戶端提供的聲音片段。
6.根據(jù)權(quán)利要求1所述的即時(shí)通信中聲音信息的映射性輸出的方法,其特征在于所述映射輸出功能觸發(fā)方式包括下述三者至少其一,方式一,通過即時(shí)通信交互界面中的映射功能控件進(jìn)行觸發(fā),該即時(shí)通信交互界面和用戶所選擇的即時(shí)通信接受方相對應(yīng);方式二,在即時(shí)通信主面板的聯(lián)系人列表中,針對于所選擇的聯(lián)系人對象,進(jìn)行映射功能觸發(fā);方式三,當(dāng)本地客戶端處于錄音狀態(tài)時(shí),采用特定的語音信息觸發(fā)。
7.根據(jù)權(quán)利要求6所述的即時(shí)通信中聲音信息的映射性輸出的方法,其特征在于所述映射輸出功能觸發(fā)方式三包括如下步驟,步驟al,開啟本地客戶端的錄音功能;步驟a2,采集來自于用戶的聲音信息;步驟a3,識(shí)別用戶的聲音信息,判斷是否包括有聯(lián)系人標(biāo)識(shí);步驟a4,觸發(fā)針對于前述聯(lián)系人標(biāo)識(shí)所對應(yīng)聯(lián)系人的映射輸出功能。
8.根據(jù)權(quán)利要求1所述的即時(shí)通信中聲音信息的映射性輸出的方法,其特征在于針對于所述的步驟2中所采集的發(fā)送方聲音信息,以發(fā)送方的即時(shí)通信識(shí)別號(hào)作為索引信息,以對應(yīng)的音頻數(shù)據(jù)作為被索引信息,將其存儲(chǔ)于本地客戶端、即時(shí)通信系統(tǒng)服務(wù)器和第三方存儲(chǔ)器三者至少其一中。
9.根據(jù)權(quán)利要求1所述的即時(shí)通信中聲音信息的映射性輸出的方法,其特征在于所述映射影音庫中檢索對應(yīng)的映射影音文件方式為以下二者至少其一,方式一,識(shí)別用戶提供的聲音信息,將其轉(zhuǎn)變成對應(yīng)的文字信息,根據(jù)文字信息的匹配性檢索對應(yīng)的映射影音文件;方式二,識(shí)別用戶所提供的聲音信息,獲得該聲音片段的音頻特征信息,將該音頻特征信息作為檢索的關(guān)鍵信息,根據(jù)相符程度進(jìn)行判別,在影音庫中檢索對應(yīng)的映射影音文件。
10.根據(jù)權(quán)利要求9所述的即時(shí)通信中聲音信息的映射性輸出的方法,其特征在于存儲(chǔ)于映射影音庫中的影音文件需預(yù)先經(jīng)過數(shù)字處理,包括如下步驟,步驟bl,識(shí)別影音文件中語音信息對應(yīng)的文字信息; 步驟1^2,分析影音文件的音頻特征信息;步驟b3,將影音文件對應(yīng)的文字信息和音頻特征信息同該影音文件建立映射關(guān)系,并將其存儲(chǔ)于映射影音文件庫中。
11.根據(jù)權(quán)利要求1所述的即時(shí)通信中聲音信息的映射性輸出的方法,其特征在于在對映射影音庫中的影音文件進(jìn)行分析對比沒有獲得對應(yīng)的映射影音文件后,采用網(wǎng)絡(luò)抓取的方式,從互聯(lián)網(wǎng)中抓取匹配的映射影音文件及其相關(guān)信息。
12.根據(jù)權(quán)利要求1所述的即時(shí)通信中聲音信息的映射性輸出的方法,其特征在于檢索到對應(yīng)的目標(biāo)影音文件后,從該映射文件中截取同用戶提供的聲音片段對應(yīng)的映射影音文件片段,用于數(shù)據(jù)的發(fā)送操作。
13.根據(jù)權(quán)利要求1所述的即時(shí)通信中聲音信息的映射性輸出的方法,其特征在于檢索出對應(yīng)的映射影音文件后,給發(fā)送方客戶端返回檢索結(jié)果,采集用戶的確認(rèn)信息后用于數(shù)據(jù)的發(fā)送操作。
14.根據(jù)權(quán)利要求1所述的即時(shí)通信中聲音信息的映射性輸出的方法,其特征在于所述的檢索結(jié)果包括該映射影音文件的名稱、映射影音文件片段時(shí)間長度、格式。
15.根據(jù)權(quán)利要求1所述的即時(shí)通信中聲音信息的映射性輸出的方法,其特征在于所述步驟3中在檢索對應(yīng)的映射影音文件后還包括如下步驟,步驟cl,分析用戶提供的聲音信息的音頻特征信息; 步驟c2,分析映射影音文件的音頻特征信息;步驟c3,根據(jù)用戶提供聲音信息的音頻特征信息,對映射影音文件中相應(yīng)的音頻特征作出對應(yīng)調(diào)整。
16.根據(jù)權(quán)利要求1所述的即時(shí)通信中聲音信息的映射性輸出的方法,其特征在于所述步驟4中將檢索到的映射影音文件發(fā)送至即時(shí)通信接收方客戶端的方式為以下二者至少其一,方式一,將該映射影音文件包含于即時(shí)通信聊天信息內(nèi),發(fā)送至接收方即時(shí)通信交互界面中,通過用戶點(diǎn)擊觸發(fā)后播放;方式二,預(yù)先建立雙方的語音通話連接,將該映射影音文件直接發(fā)送至接收方客戶端并播放。
17.—種即時(shí)通信中聲音信息的映射性輸出終端,其特征在于該終端包括如下組成部分用戶終端映射影音庫,是位于用戶終端,用于存儲(chǔ)用于映射性輸出的影音文件的數(shù)據(jù)庫;聲音采集模塊,是用于采集用戶提供的聲音信息的功能模塊; 映射影音檢索模塊,是用于根據(jù)用戶提供的聲音信息,從映射影音庫檢索對應(yīng)的映射影音文件的功能模塊;影音播放模塊,是用于播放接收到的映射影音文件的功能模塊。
18.根據(jù)權(quán)利要求17所述的即時(shí)通信中聲音信息的映射性輸出的終端,其特征在于 對應(yīng)著所述的映射影音庫,設(shè)置有發(fā)送方語音篩選單元,它包括,個(gè)性語音特征模塊,是用于存儲(chǔ)用戶個(gè)人音頻特征數(shù)據(jù)的功能模塊; 用戶語音識(shí)別模塊,是用于根據(jù)個(gè)性語音特征模塊中的用戶個(gè)人音頻特征數(shù)據(jù),對比分析采集到的聲音信息,從而篩選出符合用戶個(gè)人音頻特征的音頻數(shù)據(jù)作為采集到的聲音信息的功能模塊。
19.一種即時(shí)通信中聲音信息的映射性輸出系統(tǒng),包括用戶操作使用的客戶端以及連接雙方客戶端的服務(wù)器,其特征在于所述客戶端包括,用戶終端映射影音庫,是位于用戶終端,用于存儲(chǔ)用于映射性輸出的影音文件的數(shù)據(jù)庫;聲音采集模塊,是用于采集用戶提供的聲音信息的功能模塊; 映射影音檢索模塊,是用于根據(jù)用戶提供的聲音信息,從映射影音庫檢索對應(yīng)的映射影音文件的功能模塊;影音播放模塊,是用于播放接收到的映射影音文件的功能模塊; 所述服務(wù)器包括,系統(tǒng)服務(wù)器映射影音庫,是位于系統(tǒng)服務(wù)器,用于存儲(chǔ)用于映射性輸出的影音文件的數(shù)據(jù)庫;服務(wù)器數(shù)據(jù)檢索模塊,是用于根據(jù)用戶提供的聲音信息,從系統(tǒng)服務(wù)器映射影音庫檢索對應(yīng)的映射影音文件的功能模塊;服務(wù)器數(shù)據(jù)處理模塊,是用于處理服務(wù)器與發(fā)送方、接收方客戶端之間數(shù)據(jù)交流的功能模塊。
全文摘要
本發(fā)明提供了一種即時(shí)通信中聲音信息的映射性輸出的方法、終端和系統(tǒng),屬于計(jì)算機(jī)、網(wǎng)絡(luò)技術(shù)領(lǐng)域。即時(shí)通信中聲音信息的映射性輸出的方法包括如下步驟首先,建立用于在即時(shí)通信中映射輸出的映射影音庫;其次,針對于即時(shí)通信接收方,通過映射輸出功能的觸發(fā),采集發(fā)送方的聲音信息;然后,根據(jù)采集到的用戶聲音信息從映射影音庫中檢索對應(yīng)的映射影音文件;最后,將上一步驟中檢索到的映射影音文件發(fā)送至即時(shí)通信接收方客戶端。利用本發(fā)明,用戶可以通過自身哼唱或者播放聲音片段的方式向系統(tǒng)提供音頻片段,系統(tǒng)通過搜索比對,將系統(tǒng)內(nèi)與用戶提供的聲音片段符合的聲音片段發(fā)送至與用戶進(jìn)行數(shù)據(jù)連接的接收方客戶端。
文檔編號(hào)G06F17/30GK102377692SQ201110386949
公開日2012年3月14日 申請日期2011年11月28日 優(yōu)先權(quán)日2011年11月28日
發(fā)明者周鵬, 馬宇塵 申請人:上海量明科技發(fā)展有限公司