多媒體處理方法及多媒體系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種多媒體處理方法及多媒體系統(tǒng),該方法應(yīng)用于電子設(shè)備或多媒體系統(tǒng),該電子設(shè)備或多媒體系統(tǒng)包括語音識(shí)別單元和多媒體匹配單元和多媒體輸出單元,該方法包括:語音輸入單元接收用戶輸入的語音信號(hào);語音識(shí)別單元對(duì)用戶輸入的語音信號(hào)進(jìn)行識(shí)別,得到語音識(shí)別結(jié)果;多媒體匹配單元根據(jù)語音識(shí)別結(jié)果匹配對(duì)應(yīng)的多媒體信息;多媒體輸出單元輸出匹配的多媒體信息。本發(fā)明多媒體處理方法及多媒體系統(tǒng)可根據(jù)輸入的語音輸出個(gè)性化的多媒體內(nèi)容。
【專利說明】多媒體處理方法及多媒體系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及多媒體領(lǐng)域,尤其涉及一種多媒體處理方法及多媒體系統(tǒng)。
【背景技術(shù)】
[0002]近年來,多媒體和娛樂內(nèi)容的可用性和供應(yīng)量已經(jīng)大幅地提高。例如,可用的電視和電臺(tái)頻道的數(shù)目大幅增長,并且因特網(wǎng)的普及也提供了新的多媒體內(nèi)容分發(fā)手段。因此,用戶面臨著不同的來源的越來越多的多媒體內(nèi)容,為了識(shí)別和選擇所期望的內(nèi)容,用戶一般必須處理大量的信息,這會(huì)非常麻煩且不切實(shí)際。
[0003]現(xiàn)有的技術(shù)方案中,往往通過手動(dòng)控制遙控器或手動(dòng)控制按鍵板來控制對(duì)電視機(jī)的操作,從而選擇自己期望收看的多媒體內(nèi)容,但因現(xiàn)有電視節(jié)目是直接推動(dòng)到用戶界面,有時(shí)候,用戶花費(fèi)很長的時(shí)間操作按鍵、瀏覽節(jié)目都沒有找到期望的內(nèi)容,降低了用戶的使用體驗(yàn)。
[0004]另外,隨著消費(fèi)電子市場(chǎng)技術(shù)日益更新,電視功能越來越強(qiáng)大,智能化和人性化程度越來越高。人們對(duì)于人機(jī)交互的要求也越來越高,如果通過良好的人機(jī)交互提供個(gè)性化的多媒體內(nèi)容是個(gè)有待研究和解決技術(shù)問題。
【發(fā)明內(nèi)容】
[0005]本發(fā)明所要解決的技術(shù)問題是提供一種多媒體處理方法及系統(tǒng),以解決現(xiàn)有多媒體系統(tǒng)輸出的多媒體內(nèi)容不具備個(gè)性化的缺陷。
[0006]為了解決上述技術(shù)問題,本發(fā)明提供了一種多媒體處理方法,該方法應(yīng)用于電子設(shè)備或多媒體系統(tǒng),該電子設(shè)備或多媒體系統(tǒng)包括語音識(shí)別單元和多媒體匹配單元和多媒體輸出單元,該方法包括:
[0007]語音輸入單元接收用戶輸入的語音信號(hào);
[0008]語音識(shí)別單元對(duì)用戶輸入的語音信號(hào)進(jìn)行識(shí)別,得到語音識(shí)別結(jié)果;
[0009]多媒體匹配單元根據(jù)語音識(shí)別結(jié)果匹配對(duì)應(yīng)的多媒體信息;
[0010]多媒體輸出單元輸出匹配的多媒體信息。
[0011]為解決以上技術(shù)問題,本發(fā)明還提供了一種多媒體系統(tǒng),所述多媒體系統(tǒng)包括:
[0012]語音輸入單元,用于接收用戶輸入的語音信號(hào);
[0013]語音識(shí)別單元,用于對(duì)用戶輸入的語音信號(hào)進(jìn)行識(shí)別,得到語音識(shí)別結(jié)果;
[0014]多媒體匹配單元,用于根據(jù)語音識(shí)別結(jié)果匹配對(duì)應(yīng)的多媒體信息;
[0015]多媒體輸出單元,用于輸出匹配的多媒體信息。
[0016]與現(xiàn)有技術(shù)相比,本申請(qǐng)多媒體信息處理方法及多媒體系統(tǒng),基于語音識(shí)別結(jié)果向用戶推送個(gè)性化的多媒體節(jié)目,向用戶有針對(duì)性地提供節(jié)目,可方便地實(shí)現(xiàn)節(jié)目分級(jí)管理,尤其是可以達(dá)成不向兒童推送限制級(jí)的成人節(jié)目,可以提升產(chǎn)品競(jìng)爭(zhēng)力。
[0017]本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過在說明書、權(quán)利要求書以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。
【專利附圖】
【附圖說明】
[0018]圖1是本發(fā)明多媒體處理方法實(shí)施例1的示意圖;
[0019]圖2是本發(fā)明多媒體處理方法實(shí)施例2的示意圖;
[0020]圖3是本發(fā)明多媒體系統(tǒng)實(shí)施例1的模塊結(jié)構(gòu)示意圖;
[0021]圖4是本發(fā)明多媒體系統(tǒng)實(shí)施例2的模塊結(jié)構(gòu)示意圖;
[0022]圖5是本發(fā)明多媒體系統(tǒng)實(shí)施例3的模塊結(jié)構(gòu)示意圖。
[0023]附圖用來提供對(duì)本發(fā)明技術(shù)方案的進(jìn)一步理解,并且構(gòu)成說明書的一部分,與本申請(qǐng)的實(shí)施例一起用于解釋本發(fā)明的技術(shù)方案,并不構(gòu)成對(duì)本發(fā)明技術(shù)方案的限制。
【具體實(shí)施方式】
[0024]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明所述技術(shù)方案作進(jìn)一步的詳細(xì)描述,以使本領(lǐng)域的技術(shù)人員可以更好的理解本發(fā)明并能予以實(shí)施,但所舉實(shí)施例不作為對(duì)本發(fā)明的限定。需要說明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。
[0025]實(shí)施例1
[0026]本發(fā)明多媒體處理方法實(shí)施例1,應(yīng)用于多媒體系統(tǒng),該多媒體系統(tǒng)包括用戶端設(shè)備和與用戶端設(shè)備連接的服務(wù)器端設(shè)備,其中,所述用戶端設(shè)備包括用于實(shí)現(xiàn)語音信號(hào)輸入的語音輸入單元和用于實(shí)現(xiàn)多媒體輸出的多媒體輸出單元,而用于實(shí)現(xiàn)語音識(shí)別的語音識(shí)別單元和用于實(shí)現(xiàn)多媒體匹配的多媒體匹配單元,根據(jù)具體設(shè)置,可以在用戶端設(shè)備實(shí)現(xiàn)也可以在服務(wù)器端設(shè)備實(shí)現(xiàn),比如所述語音識(shí)別單元和多媒體匹配單元在服務(wù)器端設(shè)備實(shí)現(xiàn);或,所述語音識(shí)別設(shè)備在用戶端設(shè)備實(shí)現(xiàn),所述多媒體匹配單元在服務(wù)器端設(shè)備實(shí)現(xiàn)。
[0027]可理解地,無論上述各單元在具體的設(shè)備中如何配置,相互之間必然存在連接關(guān)系,以達(dá)成信號(hào)或數(shù)據(jù)的傳送。
[0028]其具有如圖1所示,該方法實(shí)施例1包括:
[0029]步驟101:語音輸入單元接收用戶輸入的非特定內(nèi)容語音;
[0030]所述語音輸入單元通過與其連接的語音輸入設(shè)備比如話筒輸入,該話筒可以是獨(dú)立的話筒或嵌入電子設(shè)備(比如手機(jī)、電腦等)的話筒,其連接方式可以是無線方式(比如藍(lán)牙、wifi)或有線方式。
[0031]本實(shí)施例1中,用戶通過用戶輸入的語音信號(hào)不限定特定內(nèi)容,本實(shí)施例1中對(duì)語音內(nèi)容并不關(guān)心,用戶可以隨意進(jìn)行語音輸入。
[0032]步驟102:語音識(shí)別單元基于預(yù)設(shè)的語音識(shí)別算法對(duì)用戶輸入的語音信號(hào)進(jìn)行識(shí)另IJ,得到語音識(shí)別結(jié)果;
[0033]本實(shí)施例中,語音識(shí)別單元主要對(duì)語音的聲音特征進(jìn)行識(shí)別,可基于預(yù)設(shè)的現(xiàn)有語音識(shí)別算法對(duì)語音的聲音特征進(jìn)行識(shí)別,識(shí)別結(jié)果包括但不限于以下語音特征:性別、口音、年齡、或情感(高興、生氣、悲哀)。
[0034]以上語音特征的識(shí)別具有比較完善的現(xiàn)有技術(shù),比如性別識(shí)別:
[0035]基音頻率是性別識(shí)別最重要的判別依據(jù)。他反映了說話人發(fā)濁音時(shí)的聲帶振動(dòng)頻率。一般而言,男聲的基音頻率分布范圍為O?200Hz,女聲的基音頻率分布范圍為200?500Hz。因此,準(zhǔn)確而可靠地估計(jì)基音周期對(duì)于說話人性別識(shí)別非常重要。判斷說話人的性別可以采用類似說話人識(shí)別的方法,常用的性別識(shí)別方法有VQ算法、HMM算法、支持向量機(jī)方法等。
[0036]步驟103:多媒體匹配單元根據(jù)語音識(shí)別結(jié)果匹配對(duì)應(yīng)的多媒體信息;
[0037]多媒體匹配單元可根據(jù)具體配置的不同在用戶端設(shè)備或服務(wù)器端設(shè)備實(shí)現(xiàn),比如在音視頻節(jié)目提供商的服務(wù)器端實(shí)現(xiàn),由該服務(wù)器端完成多媒體信息的匹配。
[0038]具體地,多媒體匹配單元基于預(yù)置的語音特征與多媒體信息的對(duì)應(yīng)關(guān)系或匹配策略進(jìn)行匹配。
[0039]預(yù)置的語音特征與多媒體信息的對(duì)應(yīng)關(guān)系或策略可以是音視頻節(jié)目提供商基于大量調(diào)查問卷或經(jīng)驗(yàn)生成的各種類型的用戶的喜好信息,比如與兒童對(duì)應(yīng)的多媒體節(jié)目是兒歌類、兒童劇、少兒綜藝和動(dòng)畫片等;與老人對(duì)應(yīng)的多媒體節(jié)目是養(yǎng)生節(jié)目、旅游節(jié)目、家庭倫理劇等;與某一地方口音對(duì)應(yīng)的多媒體節(jié)目是該地方臺(tái)的節(jié)目或具有該地方特色的節(jié)目;與情感表現(xiàn)生氣的青年男女對(duì)應(yīng)的多媒體節(jié)目是現(xiàn)代偶像喜劇等。
[0040]所述多媒體信息是音頻節(jié)目信息、音視頻節(jié)目信息、多媒體節(jié)目類別列表信息或多媒體節(jié)目列表信息。
[0041]音頻節(jié)目信息和音視頻節(jié)目信息都是具體的某個(gè)節(jié)目,其中音頻節(jié)目指以聲音為傳播方式的節(jié)目,比如電臺(tái)廣播的節(jié)目,例如《新聞夜班車》。
[0042]音視頻節(jié)目信息指同時(shí)包括聲音和圖像的節(jié)目,一般由電視臺(tái)錄制或影視公司錄制,包括電視劇、廣告、電影、綜藝節(jié)目等,具體的比如《媳婦的美好宣言》。
[0043]多媒體節(jié)目類別列表信息和多媒體節(jié)目列表信息是以列表的方式給出多個(gè)可供選擇的項(xiàng),其中多媒體節(jié)目類別列表可包括如下內(nèi)容:新聞?lì)?、法律類、情感劇、偶像劇、綜藝類,等,而多媒體節(jié)目列表可包括如下內(nèi)容,比如:《新聞聯(lián)播》、《焦點(diǎn)訪談》、《我愛發(fā)明》、《非常6+1》等。
[0044]步驟104:多媒體輸出單元輸出匹配的多媒體信息。
[0045]該實(shí)施例中,多媒體輸出單元具體可通過用戶的電子設(shè)備的顯示屏和/或揚(yáng)聲器輸出。
[0046]比如用戶端設(shè)備是電視機(jī),語音識(shí)別結(jié)果表明語音輸入者是10歲以下兒童,則輸出(即直接播放)匹配的適合兒童觀看或收聽的兒童節(jié)目,比如動(dòng)畫片《大鬧天宮》,這樣即可有效地防止兒童觀看或收聽到成人類節(jié)目,避免這些不合適的節(jié)目對(duì)兒童的成長帶來不良影響。
[0047]又比如,語音識(shí)別結(jié)果表明語音輸入者是50歲以上的老人,則輸出匹配的適合老年人觀看或收聽的養(yǎng)生節(jié)目。
[0048]或語音識(shí)別結(jié)果表明語音輸入者為男性、年齡20-30、情感表現(xiàn)為生氣,則輸出恐怖片或槍戰(zhàn)片或警匪片的節(jié)目列表。
[0049]綜上,該實(shí)施例1中,多媒體系統(tǒng)可根據(jù)語音識(shí)別結(jié)果主動(dòng)向用戶推送個(gè)性化的節(jié)目或列表,提高了用戶的使用體驗(yàn),也增加了良好的互動(dòng)性。
[0050]實(shí)施例2
[0051]本發(fā)明多媒體處理方法實(shí)施例2,應(yīng)用于電子設(shè)備,該電子設(shè)備包括語音輸入單元、語音識(shí)別單元、多媒體匹配單元和多媒體輸出單元,可認(rèn)為是多媒體系統(tǒng)中各單元均設(shè)置在用戶端設(shè)備的特例,如圖1所示,該方法包括:
[0052]步驟201:語音輸入單元接收用戶輸入的特定內(nèi)容語音;
[0053]所述語音輸入單元通過與其連接的語音輸入設(shè)備比如話筒輸入,該話筒可以是獨(dú)立的話筒或嵌入電子設(shè)備(比如手機(jī)、電腦、遙控器等)的話筒,其連接方式可以是無線方式(比如藍(lán)牙、wifi)或有線方式。
[0054]本實(shí)施例1中,用戶通過用戶輸入的語音信號(hào)具有特定內(nèi)容,實(shí)施例1中對(duì)語音內(nèi)容并不關(guān)心,用戶可以隨意進(jìn)行語音輸入,本實(shí)施例2中,可根據(jù)用戶設(shè)定或系統(tǒng)設(shè)置輸入特定范圍的語音,該語音內(nèi)容可以是開機(jī)指令或節(jié)目搜索關(guān)鍵詞,比如“警匪”或“新聞”。
[0055]步驟202:語音識(shí)別單元基于預(yù)設(shè)的訓(xùn)練樣本對(duì)用戶輸入的語音信號(hào)進(jìn)行識(shí)別,得到語音識(shí)別結(jié)果;
[0056]本實(shí)施例中,語音識(shí)別單元主要對(duì)語音的聲音特征進(jìn)行識(shí)別,可基于預(yù)設(shè)的訓(xùn)練樣本進(jìn)行匹配識(shí)別,具體的訓(xùn)練樣本可以是用于識(shí)別特定人的訓(xùn)練樣本,可以是用于識(shí)別性別、口音、年齡、情感(高興、生氣、悲哀)中的至少一種的非特定的訓(xùn)練樣本。
[0057]比如,電子設(shè)備的某幾個(gè)用戶通過前期的語音訓(xùn)練得到各自的訓(xùn)練樣本,當(dāng)用戶需要觀看或收聽節(jié)目時(shí),輸入語音后,根據(jù)提前得到的訓(xùn)練樣本可以很快識(shí)別該特定用戶。
[0058]綜上,該實(shí)施例2中,語音識(shí)別結(jié)果包括以下至少一個(gè)語音特征:性別、口音、年齡、情感(高興、生氣、悲哀)或特定人信息。
[0059]步驟203:多媒體匹配單元根據(jù)語音識(shí)別結(jié)果匹配對(duì)應(yīng)的多媒體信息;
[0060]具體地,多媒體匹配單元基于預(yù)置的語音特征與多媒體信息的對(duì)應(yīng)關(guān)系或匹配策略進(jìn)行匹配。
[0061]語音特征與多媒體信息的對(duì)應(yīng)關(guān)系是用戶根據(jù)個(gè)人喜好預(yù)先設(shè)置的,當(dāng)語音識(shí)別為某特定用戶時(shí),匹配該用戶預(yù)先根據(jù)個(gè)人喜好設(shè)定的節(jié)目。
[0062]如上所述,所述多媒體信息可以是音頻節(jié)目信息、音視頻節(jié)目信息、多媒體節(jié)目類別列表信息或多媒體節(jié)目列表信息。
[0063]另外,可通過設(shè)定語音特征的優(yōu)先級(jí)來匹配特定的節(jié)目,比如語音識(shí)別結(jié)果表明語音輸入者為兒童,但其輸入的語音內(nèi)容為愛情,若匹配策略設(shè)定年齡特征的優(yōu)先級(jí)高于語音內(nèi)容的優(yōu)先級(jí),則根據(jù)年齡特征匹配相應(yīng)的多媒體節(jié)目,可避免兒童收看到不適合的多媒體節(jié)目。
[0064]步驟204:多媒體輸出單元輸出匹配的多媒體信息。
[0065]該實(shí)施例中,多媒體輸出單元具體可通過用戶的電子設(shè)備的顯示屏和/或揚(yáng)聲器輸出。
[0066]比如用戶端設(shè)備是電視機(jī),語音識(shí)別結(jié)果表明語音輸入者是10歲以下兒童,則輸出匹配的適合兒童觀看或收聽的兒童節(jié)目,比如動(dòng)畫片《大鬧天宮》,這樣即可有效地防止兒童觀看或收聽到成人類節(jié)目,避免這些不合適的節(jié)目對(duì)兒童的成長帶來不良影響。
[0067]又比如,語音識(shí)別結(jié)果表明語音輸入者是50歲以上的老人,則輸出匹配的適合老年人觀看或收聽的養(yǎng)生節(jié)目。
[0068]或語音識(shí)別結(jié)果表明語音輸入者為男性、年齡20-30、情感表現(xiàn)為生氣,則輸出恐怖片或槍戰(zhàn)片或警匪片的節(jié)目列表。
[0069]綜上,該實(shí)施例2中,電子設(shè)備可根據(jù)語音識(shí)別結(jié)果主動(dòng)向用戶推送個(gè)性化的節(jié)目或列表,提高了用戶的使用體驗(yàn),也增加了良好的互動(dòng)性。
[0070]在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行。并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
[0071]為了實(shí)現(xiàn)上述方法,本發(fā)明還提供了一種多媒體系統(tǒng),如圖3所示,所述多媒體系統(tǒng)包括:
[0072]語音輸入單元,用于接收用戶輸入的語音信號(hào);
[0073]所述語音輸入單元通過與其連接的語音輸入設(shè)備輸入語音。
[0074]語音識(shí)別單元,用于對(duì)用戶輸入的語音信號(hào)進(jìn)行識(shí)別,得到語音識(shí)別結(jié)果;
[0075]所述語音識(shí)別單元基于預(yù)定算法或訓(xùn)練樣本識(shí)別語音。
[0076]所述語音識(shí)別結(jié)果包括以下至少一個(gè)語音特征:特定人信息、性別、口音、年齡、情感、語音內(nèi)容。
[0077]多媒體匹配單元,用于根據(jù)語音識(shí)別結(jié)果匹配對(duì)應(yīng)的多媒體信息;
[0078]所述多媒體匹配單元根據(jù)預(yù)置的語音特征與多媒體信息的對(duì)應(yīng)關(guān)系進(jìn)行匹配或根據(jù)預(yù)置的匹配策略進(jìn)行匹配。
[0079]所述多媒體信息包括音頻節(jié)目信息、音視頻節(jié)目信息、多媒體節(jié)目類別列表信息或多媒體節(jié)目列表信息。
[0080]多媒體輸出單元,用于輸出匹配的多媒體信息。
[0081]對(duì)應(yīng)于方法實(shí)施例1,如圖4所示,所述語音輸入單元和多媒體輸出單元在用戶端設(shè)備實(shí)現(xiàn),所述語音識(shí)別單元和多媒體匹配單元在服務(wù)器端設(shè)備實(shí)現(xiàn);或,如托5所示,所述語音輸入設(shè)備、語音識(shí)別設(shè)備和多媒體輸出設(shè)備在用戶端設(shè)備實(shí)現(xiàn),所述多媒體匹配單元在服務(wù)器端設(shè)備實(shí)現(xiàn)。
[0082]對(duì)應(yīng)于方法實(shí)施例2,所述語音輸入單元、語音識(shí)別單元、多媒體輸出單元和多媒體匹配單元均在用戶端設(shè)備實(shí)現(xiàn),相當(dāng)于電子設(shè)備,比如電腦、電視、PDA等。
[0083]本申請(qǐng)多媒體信息處理方法及多媒體系統(tǒng)(電子設(shè)備),基于語音識(shí)別結(jié)果向用戶推送個(gè)性化的多媒體節(jié)目,向用戶有針對(duì)性地提供節(jié)目,可方便地實(shí)現(xiàn)節(jié)目分級(jí)管理,尤其是可以達(dá)成不向兒童推送限制級(jí)的成人節(jié)目,可以提升產(chǎn)品競(jìng)爭(zhēng)力。
[0084]本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本申請(qǐng)實(shí)施例所提供的裝置和/或系統(tǒng)的各組成部分,以及方法中的全部或部分步驟可通過程序來指令相關(guān)硬件完成,所述程序可以存儲(chǔ)于計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,如只讀存儲(chǔ)器、磁盤或光盤等。它們可以集中在單個(gè)的計(jì)算裝置上,或者分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上??蛇x地,它們可以用計(jì)算裝置可執(zhí)行的程序代碼來實(shí)現(xiàn)。從而,可以將它們存儲(chǔ)在存儲(chǔ)裝置中由計(jì)算裝置來執(zhí)行,或者將它們分別制作成各個(gè)集成電路模塊,或者將它們中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來實(shí)現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。
[0085]本發(fā)明實(shí)施例中所描述的各種單元、模塊僅是根據(jù)其功能進(jìn)行劃分的一種示例,可理解地,在系統(tǒng)/裝置/設(shè)備實(shí)現(xiàn)相同功能的情況下,本領(lǐng)域技術(shù)人員可給出一種或多種其他功能劃分方式,在具體應(yīng)用時(shí)可將其中任意一個(gè)或多個(gè)功能模塊采用一個(gè)功能實(shí)體裝置或單元實(shí)現(xiàn),不可否認(rèn)地,以上變換方式均在本申請(qǐng)保護(hù)范圍之內(nèi)。
[0086]雖然本發(fā)明所揭露的實(shí)施方式如上,但所述的內(nèi)容僅為便于理解本發(fā)明而采用的實(shí)施方式,并非用以限定本發(fā)明。任何本發(fā)明所屬領(lǐng)域內(nèi)的技術(shù)人員,在不脫離本發(fā)明所揭露的精神和范圍的前提下,可以在實(shí)施的形式及細(xì)節(jié)上進(jìn)行任何的修改與變化,但本發(fā)明的專利保護(hù)范圍,仍須以所附的權(quán)利要求書所界定的范圍為準(zhǔn)。
【權(quán)利要求】
1.一種多媒體處理方法,其特征在于,該方法應(yīng)用于電子設(shè)備或多媒體系統(tǒng),該電子設(shè)備或多媒體系統(tǒng)包括語音識(shí)別單元和多媒體匹配單元和多媒體輸出單元,該方法包括: 語音輸入單元接收用戶輸入的語音信號(hào); 語音識(shí)別單元對(duì)用戶輸入的語音信號(hào)進(jìn)行識(shí)別,得到語音識(shí)別結(jié)果; 多媒體匹配單元根據(jù)語音識(shí)別結(jié)果匹配對(duì)應(yīng)的多媒體信息; 多媒體輸出單元輸出匹配的多媒體信息。
2.如權(quán)利要求1所述的多媒體處理方法,其特征在于:所述語音輸入單元通過與其連接的語音輸入設(shè)備輸入語音。
3.如權(quán)利要求1所述的多媒體處理方法,其特征在于:所述語音識(shí)別單元基于預(yù)定算法或訓(xùn)練樣本識(shí)別語音。
4.如權(quán)利要求1所述的多媒體處理方法,其特征在于:所述語音識(shí)別結(jié)果包括以下至少一個(gè)語音特征:特定人信息、性別、口音、年齡、情感、語音內(nèi)容。
5.如權(quán)利要求1所述的多媒體處理方法,其特征在于:所述多媒體匹配單元根據(jù)預(yù)置的語音特征與多媒體信息的對(duì)應(yīng)關(guān)系或根據(jù)預(yù)置的匹配策略進(jìn)行匹配。
6.如權(quán)利要求1所述的多媒體處理方法,其特征在于:所述多媒體信息包括音頻節(jié)目信息、音視頻節(jié)目信息、多媒體節(jié)目類別列表信息或多媒體節(jié)目列表信息。
7.一種多媒體系統(tǒng),其特征在于,所述多媒體系統(tǒng)包括: 語音輸入單元,用于接收用戶輸入的語音信號(hào); 語音識(shí)別單元,用于對(duì)用戶輸入的語音信號(hào)進(jìn)行識(shí)別,得到語音識(shí)別結(jié)果; 多媒體匹配單元,用于根據(jù)語音識(shí)別結(jié)果匹配對(duì)應(yīng)的多媒體信息; 多媒體輸出單兀,用于輸出匹配的多媒體信息。
8.如權(quán)利要求7所述的多媒體系統(tǒng),其特征在于:所述語音輸入單元通過與其連接的語音輸入設(shè)備輸入語音。
9.如權(quán)利要求7所述的多媒體系統(tǒng),其特征在于:所述語音識(shí)別單元基于預(yù)定算法或訓(xùn)練樣本識(shí)別語音。
10.如權(quán)利要求7所述的多媒體系統(tǒng),其特征在于:所述語音識(shí)別結(jié)果包括以下至少一個(gè)語音特征:特定人信息、性別、口音、年齡、情感、語音內(nèi)容。
11.如權(quán)利要求7所述的多媒體系統(tǒng),其特征在于:所述多媒體匹配單元根據(jù)預(yù)置的語音特征與多媒體信息的對(duì)應(yīng)關(guān)系進(jìn)行匹配或根據(jù)預(yù)置的匹配策略進(jìn)行匹配。
12.如權(quán)利要求7所述的多媒體系統(tǒng),其特征在于:所述多媒體信息包括音頻節(jié)目信息、音視頻節(jié)目信息、多媒體節(jié)目類別列表信息或多媒體節(jié)目列表信息。
13.如權(quán)利要求7所述的多媒體系統(tǒng),其特征在于:所述語音輸入單元和多媒體輸出單元在用戶端設(shè)備實(shí)現(xiàn),所述語音識(shí)別單元和多媒體匹配單元在服務(wù)器端設(shè)備實(shí)現(xiàn)。
14.如權(quán)利要求7所述的多媒體系統(tǒng),其特征在于:所述語音輸入單元語音識(shí)別單元、多媒體輸出單元和多媒體匹配單元均在用戶端設(shè)備實(shí)現(xiàn)。
【文檔編號(hào)】G06F17/30GK104239328SQ201310241299
【公開日】2014年12月24日 申請(qǐng)日期:2013年6月18日 優(yōu)先權(quán)日:2013年6月18日
【發(fā)明者】陳琳, 王雷, 肖夏 申請(qǐng)人:聯(lián)想(北京)有限公司