本發(fā)明涉及聲控技術(shù)領(lǐng)域,更具體地,涉及一種消息免打擾的權(quán)限控制方法及裝置。
背景技術(shù):
隨著谷歌、蘋果、三星、華為等電子巨頭相繼進(jìn)入可穿戴設(shè)備市場(chǎng),在過(guò)去的幾年當(dāng)中,越來(lái)越多的企業(yè)加入當(dāng)這個(gè)新興行業(yè)當(dāng)中來(lái)??纱┐髟O(shè)備在2015年可謂是大放異彩,吸引了眾多消費(fèi)者的注意。根據(jù)中國(guó)信息通信研究院發(fā)布的《可穿戴設(shè)備研究報(bào)告》顯示,2015年中國(guó)智能可穿戴設(shè)備市場(chǎng)規(guī)模為125.8億元,增速高達(dá)471.8%。而兒童可穿戴設(shè)備作為其中的一個(gè)分支方向,發(fā)展勢(shì)頭非常迅猛。
無(wú)論是在國(guó)內(nèi)還是國(guó)外,早有大量的企業(yè)著手布局兒童可穿戴設(shè)備市場(chǎng)。兒童可穿戴設(shè)備的功能主要涉及兒童安全、兒童健康的定位服務(wù)、健康體征檢測(cè)、通訊交流、教育等方面。但是,目前的可穿戴設(shè)備為了獲得足夠的功能和體驗(yàn),需要用戶不斷的對(duì)產(chǎn)品“服務(wù)”,需要有不少的手動(dòng)操作。主要表現(xiàn)在,一方面:功能模式的切換(上課、睡眠模式等),如果用戶自己忘記了切換,就無(wú)法實(shí)現(xiàn)對(duì)應(yīng)功能。另一方面:如果用戶沒(méi)有及時(shí)準(zhǔn)確的切換到適當(dāng)?shù)墓δ苣J?,就有可能受到外?lái)通知的打擾,例如上課的時(shí)候,家長(zhǎng)來(lái)電,打擾課堂。如何減少用戶在使用產(chǎn)品時(shí)投入的精力和時(shí)間,是目前可穿戴設(shè)備邁向智能化過(guò)程中亟待解決的問(wèn)題。
技術(shù)實(shí)現(xiàn)要素:
鑒于上述問(wèn)題,本發(fā)明提出了一種消息免打擾的權(quán)限控制方法及裝置,能夠根據(jù)環(huán)境自動(dòng)切換功能模式,提高用戶體驗(yàn)。
本發(fā)明實(shí)施例中提供了一種消息免打擾的權(quán)限控制方法,包括:
通過(guò)聲音接收器獲取在預(yù)設(shè)時(shí)長(zhǎng)內(nèi)的環(huán)境音;
根據(jù)所述環(huán)境音的音量大小和聲紋數(shù)量,判斷用戶所處狀態(tài);
當(dāng)所述音量大小低于第一預(yù)設(shè)值,和/或所述聲紋數(shù)量少于閾值時(shí),判斷用戶處于會(huì)議狀態(tài),開(kāi)啟與會(huì)議狀態(tài)相應(yīng)的會(huì)議模式的通信提醒。
優(yōu)選地,所述開(kāi)啟與會(huì)議狀態(tài)相應(yīng)的會(huì)議模式的通信提醒的步驟之后,包括:
當(dāng)接收到短信消息時(shí),通過(guò)振動(dòng)器以振動(dòng)方式提醒用戶。
優(yōu)選地,所述開(kāi)啟與會(huì)議狀態(tài)相應(yīng)的會(huì)議模式的通信提醒的步驟之后,包括:
當(dāng)接收到通話來(lái)電時(shí),通過(guò)振動(dòng)器以振動(dòng)方式提醒用戶。
優(yōu)選地,當(dāng)所述音量大小高于第二預(yù)設(shè)值,且所述聲紋數(shù)量多于所述閾值時(shí),判斷用戶處于戶外狀態(tài),開(kāi)啟與戶外狀態(tài)相應(yīng)的戶外模式的通信提醒。
優(yōu)選地,所述開(kāi)啟與戶外狀態(tài)相應(yīng)的戶外模式的通信提醒的步驟之后,包括:
當(dāng)接收到短信消息時(shí),通過(guò)振動(dòng)器和揚(yáng)聲器以振動(dòng)和響鈴方式提醒用戶。
優(yōu)選地,所述開(kāi)啟與戶外狀態(tài)相應(yīng)的戶外模式的通信提醒的步驟之后,包括:
當(dāng)接收到通話來(lái)電時(shí),通過(guò)振動(dòng)器和揚(yáng)聲器以振動(dòng)和響鈴方式提醒用戶。
優(yōu)選地,所述根據(jù)所述環(huán)境音的音量大小和聲紋數(shù)量,判斷用戶所處狀態(tài)的步驟,包括:
分析所述環(huán)境音中的聲紋,當(dāng)辨別其中一個(gè)聲紋與模型庫(kù)中的特征聲紋相符時(shí),判斷用戶處于忙碌狀態(tài);
將用戶處于忙碌狀態(tài)時(shí)接收到的短信消息或通話來(lái)電,在所述忙碌狀態(tài)解除后再以通知方式提醒用戶。
優(yōu)選地,通過(guò)聲音接收器獲取在預(yù)設(shè)時(shí)長(zhǎng)內(nèi)的環(huán)境音的步驟之前,包括:
采集預(yù)設(shè)說(shuō)話人的聲紋,作為特征聲紋錄入模型庫(kù)。
優(yōu)選地,識(shí)別其中一個(gè)聲紋與模型庫(kù)中的特征聲紋相符的步驟,具體包括:
Sp1,在所述環(huán)境音的聲紋集合中選取一個(gè)測(cè)試聲紋;
Sp2,對(duì)該測(cè)試聲紋采用預(yù)設(shè)算法在模型庫(kù)的特征聲紋碼書(shū)中查找與其距離最近的M個(gè)碼字;
Sp3,對(duì)M個(gè)碼字分別查找其所對(duì)應(yīng)的特征聲紋碼書(shū)ID并對(duì)其所對(duì)應(yīng)的說(shuō)話人Scores[i]進(jìn)行加分,Scores[i]=Scores[i]+1;
重復(fù)所述Sp1至所述Sp3直到所述環(huán)境音的聲紋集合為空;
在Scores[i]中選出得分高于閾值的目標(biāo)說(shuō)話人,辨別該目標(biāo)說(shuō)話人的聲紋與模型庫(kù)中的特征聲紋相符。
優(yōu)選地,所述預(yù)設(shè)算法包括:
針對(duì)模型庫(kù)中N個(gè)目標(biāo)說(shuō)話人的特征聲紋碼書(shū),以及每個(gè)碼書(shū)中存在L個(gè)碼字,構(gòu)建N*L個(gè)碼字的VPT樹(shù);
采用VPT樹(shù)進(jìn)行碼字索引,查找與所述測(cè)試聲紋距離最近的M個(gè)碼字。
相應(yīng)地,本發(fā)明實(shí)施例提供了一種消息免打擾的權(quán)限控制裝置,包括:
聲音接收單元,用于通過(guò)聲音接收器獲取在預(yù)設(shè)時(shí)長(zhǎng)內(nèi)的環(huán)境音;
狀態(tài)判斷單元,用于根據(jù)所述環(huán)境音的音量大小和聲紋數(shù)量,判斷用戶所處狀態(tài);
模式切換單元,用于當(dāng)所述音量大小低于第一預(yù)設(shè)值,和/或所述聲紋數(shù)量少于閾值時(shí),判斷用戶處于會(huì)議狀態(tài),開(kāi)啟與會(huì)議狀態(tài)相應(yīng)的會(huì)議模式的通信提醒。
優(yōu)選地,所述模式切換單元,包括:
第一短信提醒單元,用于當(dāng)接收到短信消息時(shí),通過(guò)振動(dòng)器以振動(dòng)方式提醒用戶。
優(yōu)選地,所述模式切換單元,包括:
第一來(lái)電提醒單元,用于當(dāng)接收到通話來(lái)電時(shí),通過(guò)振動(dòng)器以振動(dòng)方式提醒用戶。
優(yōu)選地,模式切換單元,還用于當(dāng)所述音量大小高于第二預(yù)設(shè)值,且所述聲紋數(shù)量多于所述閾值時(shí),判斷用戶處于戶外狀態(tài),開(kāi)啟與戶外狀態(tài)相應(yīng)的戶外模式的通信提醒。
優(yōu)選地,所述模式切換單元,包括:
第二短信提醒單元,用于當(dāng)接收到短信消息時(shí),通過(guò)振動(dòng)器和揚(yáng)聲器以振動(dòng)和響鈴方式提醒用戶。
優(yōu)選地,所述模式切換單元,包括:
第二來(lái)電提醒單元,用于當(dāng)接收到通話來(lái)電時(shí),通過(guò)振動(dòng)器和揚(yáng)聲器以振動(dòng)和響鈴方式提醒用戶。
優(yōu)選地,所述狀態(tài)判斷單元,包括:
聲紋辨別單元,用于分析所述環(huán)境音中的聲紋,當(dāng)辨別其中一個(gè)聲紋與模型庫(kù)中的特征聲紋相符時(shí),判斷用戶處于忙碌狀態(tài);
延遲通知單元,用于將用戶處于忙碌狀態(tài)時(shí)接收到的短信消息或通話來(lái)電,在所述忙碌狀態(tài)解除后再以通知方式提醒用戶。
優(yōu)選地,包括:
聲紋錄入單元,用于采集預(yù)設(shè)說(shuō)話人的聲紋,作為特征聲紋錄入模型庫(kù)。
優(yōu)選地,所述聲紋辨別單元,具體用于執(zhí)行以下步驟,
Sp1,在所述環(huán)境音的聲紋集合中選取一個(gè)測(cè)試聲紋;
Sp2,對(duì)該測(cè)試聲紋采用預(yù)設(shè)算法在模型庫(kù)的特征聲紋碼書(shū)中查找與其距離最近的M個(gè)碼字;
Sp3,對(duì)M個(gè)碼字分別查找其所對(duì)應(yīng)的特征聲紋碼書(shū)ID并對(duì)其所對(duì)應(yīng)的說(shuō)話人Scores[i]進(jìn)行加分,Scores[i]=Scores[i]+1;
重復(fù)所述Sp1至所述Sp3直到所述環(huán)境音的聲紋集合為空;
在Scores[i]中選出得分高于閾值的目標(biāo)說(shuō)話人,辨別該目標(biāo)說(shuō)話人的聲紋與模型庫(kù)中的特征聲紋相符。
優(yōu)選地,所述聲紋辨別單元,包括:VPT算法單元;
所述VPT算法單元,用于針對(duì)模型庫(kù)中N個(gè)目標(biāo)說(shuō)話人的特征聲紋碼書(shū),以及每個(gè)碼書(shū)中存在L個(gè)碼字,構(gòu)建N*L個(gè)碼字的VPT樹(shù);采用VPT樹(shù)進(jìn)行碼字索引,查找與所述測(cè)試聲紋距離最近的M個(gè)碼字。
相對(duì)于現(xiàn)有技術(shù),本發(fā)明提供的方案,通過(guò)聲音接收器獲取在預(yù)設(shè)時(shí)長(zhǎng)內(nèi)的環(huán)境音,例如通過(guò)聽(tīng)筒獲取一段時(shí)長(zhǎng)的環(huán)境音進(jìn)行分析,根據(jù)所述環(huán)境音的音量大小和聲紋數(shù)量,判斷用戶所處狀態(tài)。當(dāng)所述音量大小低于第一預(yù)設(shè)值,和/或所述聲紋數(shù)量少于閾值時(shí),判斷用戶處于會(huì)議狀態(tài),開(kāi)啟與會(huì)議狀態(tài)相應(yīng)的會(huì)議模式的通信提醒。例如,在睡覺(jué)的時(shí)候,音量低于第一預(yù)設(shè)值,開(kāi)啟與會(huì)議狀態(tài)相應(yīng)的會(huì)議模式的通信提醒,以免打擾睡眠。又例如,在上課的時(shí)候,音量比戶外環(huán)境要低,只有老師和少數(shù)同學(xué)的聲音,聲紋數(shù)量少于閾值,此時(shí),也開(kāi)啟與會(huì)議狀態(tài)相應(yīng)的會(huì)議模式的通信提醒,以免打擾孩子上課。
本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,這些將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。
附圖說(shuō)明
為了更清楚地說(shuō)明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見(jiàn)地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明一種消息免打擾的權(quán)限控制方法的流程圖。
圖2為本發(fā)明一種消息免打擾的權(quán)限控制方法的第一實(shí)施例流程圖。
圖3為本發(fā)明一種消息免打擾的權(quán)限控制方法的第二實(shí)施例流程圖。
圖4為本發(fā)明一種消息免打擾的權(quán)限控制裝置的示意圖。
圖5為本發(fā)明一種消息免打擾的權(quán)限控制裝置的第一實(shí)施例示意圖。
圖6為本發(fā)明一種消息免打擾的權(quán)限控制裝置的第二實(shí)施例示意圖。
具體實(shí)施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述。
在本發(fā)明的說(shuō)明書(shū)和權(quán)利要求書(shū)及上述附圖中的描述的一些流程中,包含了按照特定順序出現(xiàn)的多個(gè)操作,但是應(yīng)該清楚了解,這些操作可以不按照其在本文中出現(xiàn)的順序來(lái)執(zhí)行或并行執(zhí)行,操作的序號(hào)如101、102等,僅僅是用于區(qū)分開(kāi)各個(gè)不同的操作,序號(hào)本身不代表任何的執(zhí)行順序。另外,這些流程可以包括更多或更少的操作,并且這些操作可以按順序執(zhí)行或并行執(zhí)行。需要說(shuō)明的是,本文中的“第一”、“第二”等描述,是用于區(qū)分不同的消息、設(shè)備、模塊等,不代表先后順序,也不限定“第一”和“第二”是不同的類型。
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域技術(shù)人員在沒(méi)有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
圖1為本發(fā)明一種消息免打擾的權(quán)限控制方法的流程圖,包括:
S101:通過(guò)聲音接收器獲取在預(yù)設(shè)時(shí)長(zhǎng)內(nèi)的環(huán)境音;
S102:根據(jù)所述環(huán)境音的音量大小和聲紋數(shù)量,判斷用戶所處狀態(tài);
S103:當(dāng)所述音量大小低于第一預(yù)設(shè)值,和/或所述聲紋數(shù)量少于閾值時(shí),判斷用戶處于會(huì)議狀態(tài),開(kāi)啟與會(huì)議狀態(tài)相應(yīng)的會(huì)議模式的通信提醒。
相對(duì)于現(xiàn)有技術(shù),本發(fā)明提供的方案,通過(guò)聲音接收器獲取在預(yù)設(shè)時(shí)長(zhǎng)內(nèi)的環(huán)境音,例如通過(guò)聽(tīng)筒獲取一段時(shí)長(zhǎng)的環(huán)境音進(jìn)行分析,根據(jù)所述環(huán)境音的音量大小和聲紋數(shù)量,判斷用戶所處狀態(tài)。當(dāng)所述音量大小低于第一預(yù)設(shè)值,和/或所述聲紋數(shù)量少于閾值時(shí),判斷用戶處于會(huì)議狀態(tài),開(kāi)啟與會(huì)議狀態(tài)相應(yīng)的會(huì)議模式的通信提醒。例如,在睡覺(jué)的時(shí)候,音量低于第一預(yù)設(shè)值,開(kāi)啟與會(huì)議狀態(tài)相應(yīng)的會(huì)議模式的通信提醒,以免打擾睡眠。又例如,在上課的時(shí)候,音量比戶外環(huán)境要低,只有老師和少數(shù)同學(xué)的聲音,聲紋數(shù)量少于閾值,此時(shí),也開(kāi)啟與會(huì)議狀態(tài)相應(yīng)的會(huì)議模式的通信提醒,以免打擾孩子上課。
需要補(bǔ)充說(shuō)明的是,本發(fā)明除了能夠應(yīng)用于可穿戴設(shè)備,同樣能夠應(yīng)用于手機(jī)、IPAD等智能終端。
圖2為本發(fā)明一種消息免打擾的權(quán)限控制方法的第一實(shí)施例流程圖。與圖1相比,圖2的第一實(shí)施例還可以實(shí)現(xiàn)戶外模式的切換。
S201:通過(guò)聲音接收器獲取在預(yù)設(shè)時(shí)長(zhǎng)內(nèi)的環(huán)境音;
S202:根據(jù)所述環(huán)境音的音量大小和聲紋數(shù)量,判斷用戶所處狀態(tài);
S203:當(dāng)所述音量大小低于第一預(yù)設(shè)值,和/或所述聲紋數(shù)量少于閾值時(shí),判斷用戶處于會(huì)議狀態(tài),開(kāi)啟與會(huì)議狀態(tài)相應(yīng)的會(huì)議模式的通信提醒。
S204:當(dāng)接收到短信消息時(shí),通過(guò)振動(dòng)器以振動(dòng)方式提醒用戶。
S205:當(dāng)接收到通話來(lái)電時(shí),通過(guò)振動(dòng)器以振動(dòng)方式提醒用戶。
S206:當(dāng)所述音量大小高于第二預(yù)設(shè)值,且所述聲紋數(shù)量多于所述閾值時(shí),判斷用戶處于戶外狀態(tài),開(kāi)啟與戶外狀態(tài)相應(yīng)的戶外模式的通信提醒。
S207:當(dāng)接收到短信消息時(shí),通過(guò)振動(dòng)器和揚(yáng)聲器以振動(dòng)和響鈴方式提醒用戶。
S208:當(dāng)接收到通話來(lái)電時(shí),通過(guò)振動(dòng)器和揚(yáng)聲器以振動(dòng)和響鈴方式提醒用戶。
戶外模式與會(huì)議模式,功能相反。例如,孩子在玩耍的時(shí)候,身邊的游戲機(jī)聲音,同伴嬉戲聲音等等,都會(huì)干擾孩子接聽(tīng)家長(zhǎng)來(lái)電來(lái)信的通知聲。故此,當(dāng)所述音量大小高于第二預(yù)設(shè)值,且所述聲紋數(shù)量多于所述閾值時(shí),判斷用戶處于戶外狀態(tài),開(kāi)啟與戶外狀態(tài)相應(yīng)的戶外模式的通信提醒。在戶外模式下,當(dāng)接收到短信消息時(shí),通過(guò)振動(dòng)器和揚(yáng)聲器以振動(dòng)和響鈴方式提醒用戶。當(dāng)接收到通話來(lái)電時(shí),通過(guò)振動(dòng)器和揚(yáng)聲器以振動(dòng)和響鈴方式提醒用戶。而相反,在會(huì)議模式下,當(dāng)接收到短信消息時(shí),通過(guò)振動(dòng)器以振動(dòng)方式提醒用戶。當(dāng)接收到通話來(lái)電時(shí),通過(guò)振動(dòng)器以振動(dòng)方式提醒用戶。
需要補(bǔ)充說(shuō)明的是,除了戶外模式與會(huì)議模式,還有普通模式,在普通模式下,按照用戶默認(rèn)的來(lái)電鈴聲和/或來(lái)電振動(dòng)告知用戶。
圖3為本發(fā)明一種消息免打擾的權(quán)限控制方法的第二實(shí)施例流程圖。圖3的第二實(shí)施例與圖1、2相比,第二實(shí)施例還構(gòu)建了聲紋的模型庫(kù),通過(guò)檢測(cè)環(huán)境音中是否存在與模型庫(kù)內(nèi)的特征聲紋相匹配的聲紋,判斷用戶是否正在與重要的目標(biāo)人物進(jìn)行交談,如果是,則開(kāi)啟忙碌狀態(tài),避免外界的打擾。
S301:采集預(yù)設(shè)說(shuō)話人的聲紋,作為特征聲紋錄入模型庫(kù)。
S302:通過(guò)聲音接收器獲取在預(yù)設(shè)時(shí)長(zhǎng)內(nèi)的環(huán)境音;
S303:根據(jù)所述環(huán)境音的音量大小和聲紋數(shù)量,判斷用戶所處狀態(tài);
S304:分析所述環(huán)境音中的聲紋,當(dāng)辨別其中一個(gè)聲紋與模型庫(kù)中的特征聲紋相符時(shí),判斷用戶處于忙碌狀態(tài);
S305:將用戶處于忙碌狀態(tài)時(shí)接收到的短信消息或通話來(lái)電,在所述忙碌狀態(tài)解除后再以通知方式提醒用戶。
S306:當(dāng)所述音量大小低于第一預(yù)設(shè)值,和/或所述聲紋數(shù)量少于閾值時(shí),判斷用戶處于會(huì)議狀態(tài),開(kāi)啟與會(huì)議狀態(tài)相應(yīng)的會(huì)議模式的通信提醒。
在第二實(shí)施例當(dāng)中,首先,采集預(yù)設(shè)說(shuō)話人的聲紋,作為特征聲紋錄入模型庫(kù)。例如,可以采集爸爸、媽媽、老師的聲紋,存儲(chǔ)到模型庫(kù)之內(nèi)。通過(guò)聲音接收器獲取在預(yù)設(shè)時(shí)長(zhǎng)內(nèi)的環(huán)境音,根據(jù)所述環(huán)境音的音量大小和聲紋數(shù)量,判斷用戶所處狀態(tài)。以上課環(huán)境為例,環(huán)境音當(dāng)中,主要是老師的聲音,分析所述環(huán)境音中的聲紋,當(dāng)辨別其中一個(gè)聲紋與模型庫(kù)中的特征聲紋相符時(shí),判斷用戶處于忙碌狀態(tài)。通過(guò)與模型庫(kù)中的特征聲紋進(jìn)行比對(duì),能夠準(zhǔn)確的分析出用戶所述狀態(tài),相比于第二實(shí)施例通過(guò)聲紋數(shù)量來(lái)判斷,更為準(zhǔn)確。在忙碌狀態(tài)下,將用戶處于忙碌狀態(tài)時(shí)接收到的短信消息或通話來(lái)電,在所述忙碌狀態(tài)解除后再以通知方式提醒用戶。例如,下課了,老師離開(kāi),環(huán)境音之中只有同學(xué)們的聲音,此時(shí)解除忙碌狀態(tài),短信消息以通知方式提醒用戶,上課期間的來(lái)電也是以通知方式通知用戶,以便用戶回電。當(dāng)所述音量大小低于第一預(yù)設(shè)值,和/或所述聲紋數(shù)量少于閾值時(shí),判斷用戶處于會(huì)議狀態(tài),開(kāi)啟與會(huì)議狀態(tài)相應(yīng)的會(huì)議模式的通信提醒。
優(yōu)選地,識(shí)別其中一個(gè)聲紋與模型庫(kù)中的特征聲紋相符的步驟,具體包括:
Sp1,在所述環(huán)境音的聲紋集合中選取一個(gè)測(cè)試聲紋;
Sp2,對(duì)該測(cè)試聲紋采用預(yù)設(shè)算法在模型庫(kù)的特征聲紋碼書(shū)中查找與其距離最近的M個(gè)碼字;
Sp3,對(duì)M個(gè)碼字分別查找其所對(duì)應(yīng)的特征聲紋碼書(shū)ID并對(duì)其所對(duì)應(yīng)的說(shuō)話人Scores[i]進(jìn)行加分,Scores[i]=Scores[i]+1;
重復(fù)所述Sp1至所述Sp3直到所述環(huán)境音的聲紋集合為空;
在Scores[i]中選出得分高于閾值的目標(biāo)說(shuō)話人,辨別該目標(biāo)說(shuō)話人的聲紋與模型庫(kù)中的特征聲紋相符。
具體地,初始化:T置為測(cè)試特征向量集合;VPT為對(duì)所有目標(biāo)說(shuō)話人碼書(shū)中的碼字進(jìn)行索引所構(gòu)成的VPT樹(shù);Scores[i]為第i個(gè)碼書(shū)所對(duì)應(yīng)的目標(biāo)說(shuō)話人得分,對(duì)所有目標(biāo)說(shuō)話人的得分置0。
在識(shí)別的階段首先對(duì)環(huán)境音的聲紋進(jìn)行特征提取,提取出所述環(huán)境音的聲紋集合。在所述環(huán)境音的聲紋集合中選取一個(gè)測(cè)試聲紋;對(duì)該測(cè)試聲紋采用預(yù)設(shè)算法在模型庫(kù)的特征聲紋碼書(shū)中查找與其距離最近的M個(gè)碼字,并找到每一節(jié)點(diǎn)所對(duì)應(yīng)的碼書(shū)以及該碼書(shū)所對(duì)應(yīng)的目標(biāo)說(shuō)話人,然后給該目標(biāo)說(shuō)話人的評(píng)分增加一分。當(dāng)所述環(huán)境音的聲紋集合中的所有測(cè)試聲紋都測(cè)試完畢后,選取得分最高的K個(gè)目標(biāo)說(shuō)話人,辨別該目標(biāo)說(shuō)話人的聲紋與模型庫(kù)中的特征聲紋相符。
優(yōu)選地,所述預(yù)設(shè)算法包括:VPT樹(shù)搜索算法;
針對(duì)模型庫(kù)中N個(gè)目標(biāo)說(shuō)話人的特征聲紋碼書(shū),以及每個(gè)碼書(shū)中存在L個(gè)碼字,構(gòu)建N*L個(gè)碼字的VPT樹(shù);
采用VPT樹(shù)進(jìn)行碼字索引,查找與所述測(cè)試聲紋距離最近的M個(gè)碼字。
VPT樹(shù)(Vantage Point Tree)是一種度量空間上的索引結(jié)構(gòu),只能采用靜態(tài)的方式進(jìn)行創(chuàng)建,不能進(jìn)行動(dòng)態(tài)的插入和刪除元素。同時(shí)VPT樹(shù)是采用連續(xù)距離的方式進(jìn)行構(gòu)建的,是一種基于距離的二叉平衡樹(shù),因而VPT的搜索時(shí)間復(fù)雜度為O(log n)。由于VPT是度量空間中的索引結(jié)構(gòu),因而只能利用其距離信息,VPT樹(shù)的構(gòu)建的思想也在于如何在高維空間中有效的利用距離信息來(lái)構(gòu)建二叉搜索樹(shù)。VPT樹(shù)的構(gòu)建算法以及搜索算法類似于二叉搜索樹(shù),均較為簡(jiǎn)單。假設(shè)系統(tǒng)中已經(jīng)存在N個(gè)目標(biāo)說(shuō)話人的碼書(shū),每個(gè)碼書(shū)中存在L個(gè)碼字,那么則針對(duì)N*L個(gè)碼字構(gòu)建VPT樹(shù)。在構(gòu)建好的VPT樹(shù)中,所有的碼字均為節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)存儲(chǔ)著碼字所對(duì)應(yīng)的碼書(shū)信息。即針對(duì)每一個(gè)VPT樹(shù)中的節(jié)點(diǎn),該節(jié)點(diǎn)一定為某一碼書(shū)的碼字,且該節(jié)點(diǎn)記錄了該節(jié)點(diǎn)屬于哪一碼書(shū)。這樣就建立了每一節(jié)點(diǎn)與其碼書(shū),以及每一碼書(shū)與相應(yīng)說(shuō)話人之間的對(duì)應(yīng)關(guān)系。
在采用VPT樹(shù)的方式進(jìn)行碼字索引,每個(gè)節(jié)點(diǎn)均為碼書(shū)中的碼字,每個(gè)節(jié)點(diǎn)分別記錄著該碼字的編號(hào)、該碼字屬于哪一個(gè)碼書(shū)以及指向該節(jié)點(diǎn)左孩子和右孩子的指針。
除了VPT樹(shù)搜索算法之外,還可以采用傳統(tǒng)的紅黑樹(shù)及B+樹(shù)搜索算法,兩者之間的區(qū)別主要在于采用VPT樹(shù)的方式可以對(duì)高維的特征向量進(jìn)行搜索。而采用紅黑樹(shù)和B+樹(shù)的形式,只能對(duì)標(biāo)量形式的數(shù)值進(jìn)行搜索。由于在語(yǔ)音信息中抽取的特征參數(shù)為高維的向量,因而選取了VPT樹(shù)的方式進(jìn)行搜索,從而降低搜索的時(shí)間復(fù)雜度。
與傳統(tǒng)的矢量量化方式相比,采用矢量量化需要采用全搜索的方式計(jì)算測(cè)試特征向量與所有碼書(shū)的每一個(gè)碼字之間的距離,系統(tǒng)的計(jì)算復(fù)雜度正比于碼書(shū)的個(gè)數(shù)以及每個(gè)碼書(shū)中碼字的個(gè)數(shù)的乘積,即為O(NL),其中N為目標(biāo)說(shuō)話人的個(gè)數(shù),L為矢量量化的級(jí)數(shù)。而采用VPT方式,系統(tǒng)的計(jì)算復(fù)雜度對(duì)數(shù)正比于碼書(shū)的個(gè)數(shù)與每個(gè)碼書(shū)中碼字的個(gè)數(shù)的乘積,即為O(log NL),因而采用該種方式可以大大的提高系統(tǒng)的識(shí)別速度。
圖4為本發(fā)明一種消息免打擾的權(quán)限控制裝置的示意圖,包括:
聲音接收單元,用于通過(guò)聲音接收器獲取在預(yù)設(shè)時(shí)長(zhǎng)內(nèi)的環(huán)境音;
狀態(tài)判斷單元,用于根據(jù)所述環(huán)境音的音量大小和聲紋數(shù)量,判斷用戶所處狀態(tài);
模式切換單元,用于當(dāng)所述音量大小低于第一預(yù)設(shè)值,和/或所述聲紋數(shù)量少于閾值時(shí),判斷用戶處于會(huì)議狀態(tài),開(kāi)啟與會(huì)議狀態(tài)相應(yīng)的會(huì)議模式的通信提醒。
圖4與圖1相對(duì)應(yīng),圖中各個(gè)單元的運(yùn)行方式與方法中的相同。
圖5為本發(fā)明一種消息免打擾的權(quán)限控制裝置的第一實(shí)施例示意圖。
如圖5所示,所述模式切換單元,包括:
第一短信提醒單元,用于當(dāng)接收到短信消息時(shí),通過(guò)振動(dòng)器以振動(dòng)方式提醒用戶。
第一來(lái)電提醒單元,用于當(dāng)接收到通話來(lái)電時(shí),通過(guò)振動(dòng)器以振動(dòng)方式提醒用戶。
如圖5所示,模式切換單元,還用于當(dāng)所述音量大小高于第二預(yù)設(shè)值,且所述聲紋數(shù)量多于所述閾值時(shí),判斷用戶處于戶外狀態(tài),開(kāi)啟與戶外狀態(tài)相應(yīng)的戶外模式的通信提醒。
如圖5所示,所述模式切換單元,包括:
第二短信提醒單元,用于當(dāng)接收到短信消息時(shí),通過(guò)振動(dòng)器和揚(yáng)聲器以振動(dòng)和響鈴方式提醒用戶。
第二來(lái)電提醒單元,用于當(dāng)接收到通話來(lái)電時(shí),通過(guò)振動(dòng)器和揚(yáng)聲器以振動(dòng)和響鈴方式提醒用戶。
圖5與圖2相對(duì)應(yīng),圖中各個(gè)單元的運(yùn)行方式與方法中的相同。
圖6為本發(fā)明一種消息免打擾的權(quán)限控制裝置的第二實(shí)施例示意圖。
如圖6所示,所述狀態(tài)判斷單元,包括:
聲紋辨別單元,用于分析所述環(huán)境音中的聲紋,當(dāng)辨別其中一個(gè)聲紋與模型庫(kù)中的特征聲紋相符時(shí),判斷用戶處于忙碌狀態(tài);
延遲通知單元,用于將用戶處于忙碌狀態(tài)時(shí)接收到的短信消息或通話來(lái)電,在所述忙碌狀態(tài)解除后再以通知方式提醒用戶。
如圖6所示,包括:
聲紋錄入單元,用于采集預(yù)設(shè)說(shuō)話人的聲紋,作為特征聲紋錄入模型庫(kù)。
圖6與圖3相對(duì)應(yīng),圖中各個(gè)單元的運(yùn)行方式與方法中的相同。
優(yōu)選地,所述聲紋辨別單元,具體用于執(zhí)行以下步驟,
Sp1,在所述環(huán)境音的聲紋集合中選取一個(gè)測(cè)試聲紋;
Sp2,對(duì)該測(cè)試聲紋采用預(yù)設(shè)算法在模型庫(kù)的特征聲紋碼書(shū)中查找與其距離最近的M個(gè)碼字;
Sp3,對(duì)M個(gè)碼字分別查找其所對(duì)應(yīng)的特征聲紋碼書(shū)ID并對(duì)其所對(duì)應(yīng)的說(shuō)話人Scores[i]進(jìn)行加分,Scores[i]=Scores[i]+1;
重復(fù)所述Sp1至所述Sp3直到所述環(huán)境音的聲紋集合為空;
在Scores[i]中選出得分高于閾值的目標(biāo)說(shuō)話人,辨別該目標(biāo)說(shuō)話人的聲紋與模型庫(kù)中的特征聲紋相符。
優(yōu)選地,所述聲紋辨別單元,包括:VPT算法單元;
所述VPT算法單元,用于針對(duì)模型庫(kù)中N個(gè)目標(biāo)說(shuō)話人的特征聲紋碼書(shū),以及每個(gè)碼書(shū)中存在L個(gè)碼字,構(gòu)建N*L個(gè)碼字的VPT樹(shù);采用VPT樹(shù)進(jìn)行碼字索引,查找與所述測(cè)試聲紋距離最近的M個(gè)碼字。
所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡(jiǎn)潔,上述描述的系統(tǒng),裝置和單元的具體工作過(guò)程,可以參考前述方法實(shí)施例中的對(duì)應(yīng)過(guò)程,在此不再贅述。
以上所述實(shí)施例僅表達(dá)了本發(fā)明的幾種實(shí)施方式,其描述較為具體和詳細(xì),但并不能因此而理解為對(duì)本發(fā)明專利范圍的限制。應(yīng)當(dāng)指出的是,對(duì)于本領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干變形和改進(jìn),這些都屬于本發(fā)明的保護(hù)范圍。因此,本發(fā)明專利的保護(hù)范圍應(yīng)以所附權(quán)利要求為準(zhǔn)。