專利名稱:用于確定用戶年齡范圍的方法和裝置的制作方法
用于確定用戶年齡范圍的方法和裝置
背景技術:
服務提供商和設備制造商(例如,無線,蜂窩等)不斷地受到挑戰(zhàn)以通過例如提供引人注目的網(wǎng)絡服務向消費者提供價值和便利。發(fā)展的一方面是根據(jù)用戶特性定制服務、內(nèi)容、通信(例如營銷、廣告)等以使這些服務更有效或與単獨用戶更相關。應當注意到,與用戶相關聯(lián)的多個特性中,年齡是用于將服務作為目標的最重要的區(qū)別特征之一。ー些服務可從知曉用戶的年齡中獲益。例如,將完全匹配的年齡組作為目標的廣告可顯著地提高點擊率(click through rate)。然而,從用戶獲得年齡信息是重要的挑戰(zhàn)。用戶經(jīng)常不情愿提供該信息,因為他們可能認為這太隱私而不能隨意給出,或者用戶可能僅僅厭倦或疲于提供注冊和相關信息。因此,服務提供商和設備制造商面臨在減少或消除任何強加給用戶的數(shù)據(jù)輸入負擔的同時,實現(xiàn)用戶年齡的精確和有效的確定的重大技術挑戰(zhàn)
發(fā)明內(nèi)容
因此,存在精確和自動地確定用戶年齡范圍的方法的需求。根據(jù)ー個實施例,ー種方法,包括至少部分地導致語音數(shù)據(jù)的獲取。所述方法還包括計算第一組概率值,其中每個概率值表示語音數(shù)據(jù)在多個預定義的年齡范圍中的相應的一個的概率,并且所述多個預定義的年齡范圍是壽命的多個片段(segment)。所述方法還包括通過將相關矩陣應用于第一組概率值來獲取第二組概率值,其中相關矩陣將第一組概率值與匹配在整個壽命期間的多個單獨年齡的語音數(shù)據(jù)的概率關聯(lián)。所述方法還包括為所述多個預定義的年齡范圍的每ー個計算對應于在相應的多個預定義的年齡范圍內(nèi)的多個單獨年齡的第二組概率值的概率的總和。所述方法進ー步包括至少部分地基于所計算的概率的總和來確定預定義的年齡范圍以與語音數(shù)據(jù)相關聯(lián)。根據(jù)另ー個實施例,ー種裝置,包括至少ー個處理器,和至少ー個包括計算機程序代碼的存儲器,所述至少一個存儲器和所述計算機程序代碼配置為與所述至少一個處理器至少部分地使裝置至少部分地導致語音數(shù)據(jù)的獲取。還使所述裝置計算第一組概率值,其中所述概率值的每ー個表示所述語音數(shù)據(jù)在多個預定義的年齡范圍中的相應的ー個中的概率,并且所述多個預定義的年齡范圍是壽命的多個片段。還使所述裝置通過將相關矩陣應用于第一組概率值來獲取第二組概率值,其中相關矩陣將第一組概率值與匹配在整個壽命期間的多個單獨年齡的語音數(shù)據(jù)的概率關聯(lián)。還使所述裝置為所述多個預定義的年齡范圍的每ー個,計算對應于在相應的多個預定義的年齡范圍內(nèi)的多個單獨年齡的第二組概率值的概率的總和。進ー步使所述裝置至少部分地基于所計算的所述概率的總和來確定所述預定義的年齡范圍與所述語音數(shù)據(jù)相關聯(lián)。根據(jù)另ー個實施例,攜載ー個或多個指令的ー個或多個序列的計算機可讀存儲介質(zhì),當由一個或多個處理器執(zhí)行時,所述ー個或多個指令至少部分地使裝置至少部分地導致語音數(shù)據(jù)的獲取。還使所述裝置計算第一組概率值,其中所述概率值的每ー個表示所述語音數(shù)據(jù)在多個預定義的年齡范圍中的相應的ー個中的概率,并且所述多個預定義的年齡范圍是壽命的多個片段。還使所述裝置通過將相關矩陣應用于第一組概率值來獲取第二組概率值,其中相關矩陣將第一組概率值與匹配在整個壽命期間的多個單獨年齡的語音數(shù)據(jù)的概率相關聯(lián)。還使所述裝置為所述多個預定義的年齡范圍的每ー個計算在對應于在相應的多個預定義的年齡范圍內(nèi)的所述多個單獨年齡的第二組概率值中的概率的總和。進ー步使所述裝置至少部分地基于所計算的所述概率的總和來確定與所述語音數(shù)據(jù)相關聯(lián)的所述預定義的年齡范圍。根據(jù)另ー個實施例,ー種裝置,包括用于至少部分地導致語音數(shù)據(jù)的獲取的部件。所述裝置還包括用于計算第一組概率值的部件,其中概率值的每ー個表示語音數(shù)據(jù)在多個預定義的年齡范圍的相應的ー個中的概率,并且所述多個預定義的年齡范圍是壽命的多個片段。所述裝置還包括通過將相關矩陣應用于第一組概率值來獲取第二組概率值,其中相關矩陣將第一組概率值與匹配在整個壽命期間的多個單獨年齡的語音數(shù)據(jù)的概率相關聯(lián)。所述裝置還包括為每個預定義的年齡范圍計算在對應于在相應的多個預定義的年齡范圍內(nèi)的多個單獨年齡的第二組概率值中的概率的總和。所述裝置進ー步包括用于至少部分地基于所計算的概率的總和來確定與語音數(shù)據(jù)相關聯(lián)的預定義的年齡范圍的部件。簡單地通過說明多個特定實施例和實現(xiàn),包括所構想用于執(zhí)行本發(fā)明的最佳模 式,本發(fā)明的其它方面、特征以及優(yōu)點從下列詳細說明中顯而易見。在全部不脫離本發(fā)明的精神和范圍的情況下,本發(fā)明還能夠具有其它和不同的實施方式,并且可以在各種明顯方面修改它的許多細節(jié)。因此,在實質(zhì)上將附圖和說明書認為是示意性的,而不是限制性的。
通過示例并且不是通過限制的方式來說明本發(fā)明的實施例,在附圖的圖示中圖I是根據(jù)一個實施例,能夠確定用戶年齡范圍的系統(tǒng)的圖;圖2是根據(jù)一個實施例,年齡估計器組件的圖;圖3是根據(jù)一個實施例,用于確定用戶年齡范圍的過程的流程圖;圖4是根據(jù)一個實施例,訓練用于確定用戶年齡范圍的統(tǒng)計模型和相關矩陣的過程的流程圖;圖5是根據(jù)一個實施例,用于確定用戶年齡是否落入目標范圍的過程的流程圖;圖6A-6B是根據(jù)多個實施例,在圖3的過程中使用的用戶接ロ的圖;圖7是可用于實現(xiàn)本發(fā)明實施例的硬件的圖;圖8是可用于實現(xiàn)本發(fā)明實施例的芯片組的圖;圖9是可用于實現(xiàn)本發(fā)明實施例的移動終端(例如手機)的圖。
具體實施例方式公開了用于確定用戶年齡范圍的方法、裝置和計算機程序的范例。在以下描述中,為了說明的目的,闡述多個具體細節(jié)以提供本發(fā)明的實施例的全面理解。然而,對本領域技術人員顯而易見的,本發(fā)明的實施例可在沒有這些具體細節(jié)或具有等同設置的情況下實現(xiàn)。在其他情形下,以框圖形式示出熟知的結構和設備以避免不必要地模糊本發(fā)明的實施例。圖I是根據(jù)一個實施例,能夠確定用戶年齡范圍的系統(tǒng)的圖。如在先討論的,針對目標用戶或用戶組的應用和服務經(jīng)常依賴于用戶的年齡作為提供有效服務的重要因素。也就是說,不同年齡的用戶可能對不同的服務感興趣。例如,廣告、內(nèi)容和應用等通常為特定的年齡和人口統(tǒng)計學設計。在一個范例中,兒童可能對收聽有關關于星期六早晨的動畫片的服務感興趣,而成年人可能對收聽有關股票市場感興趣。因此,獲知用戶的年齡范圍可能有助于向用戶提供特定服務。進ー步,廣告可以以年齡指定(age-specific)發(fā)送,從而用戶設備不承受對于用戶的年齡范圍的大量無關廣告的重負。另外,一些服務需要用戶處于某個年齡范圍內(nèi)(例如對于關于暴力電影的信息年齡大于10歲)。通過考慮用戶的多個方面可確定用戶的年齡。影響年齡的用戶的ー個方面是用戶的語音。特別地,用戶的語音貫穿用戶的壽命期間改變從而與用戶的年齡緊密相關。例如,兒童的語音可相比青少年的語音具有不同的音調(diào)(pitch),并且老年人的語音可相比年輕的成年人的語音具有不同的一致性(consistency)。所以,分析用戶的語音可導致估計用戶的年齡。進ー步地,可以容易地獲取與用戶的語音相關的數(shù)據(jù)。隨著在語音通信中移動電話的越來越多的使用,可收集大量的用戶語音數(shù)據(jù),因為用戶通常每天花費時間在他們各自的移動電話上。至少因為語音數(shù)據(jù)容易得到,因此需要收集與用戶語音相關的數(shù)據(jù)并且分析這些數(shù)據(jù)。
然而,通過聆聽用戶的語音通常難于精確地確定單獨的精確年齡。因此,從用戶的語音計算用戶的精確年齡也可能是困難的。盡管如此,代替用戶的年齡,可根據(jù)用戶的語音估計用戶的年齡范圍,代替用戶的年齡。用戶年齡的范圍可為服務提供商提供足夠的信息,因為服務提供商經(jīng)常對用戶所屬的年齡范圍感興趣,而不是具體的年齡。盡管不論何時用戶對裝備有麥克風的設備(例如移動電話)講話,可通過獲取用戶的語音容易地收集用戶的語音,這仍然存在技術上的困難和挑戰(zhàn)以產(chǎn)生基于語音數(shù)據(jù)來估計年齡的方法。為了解決這個問題,圖I中的系統(tǒng)100引入獲取用戶的語音數(shù)據(jù)的能力,以分析語音數(shù)據(jù)從而計算用戶的語音在預定義的年齡范圍內(nèi)的概率,以及確定與用戶語音最接近地匹配的預定義的年齡范圍。語音數(shù)據(jù)可由連接到UE 101的傳感器111捕獲并且存儲在連接到UE 101的數(shù)據(jù)存儲器109中。更具體地,系統(tǒng)100使UE 101能夠基于模型計算第一組概率值,所述第一組概率值表示用戶語音在相應的多個預定義的年齡范圍內(nèi)的概率,并且通過將相關矩陣應用于第一組概率值為在整個壽命期間的多個單獨年齡的每一個計算第二組概率值。然后,UE 101計算在相應的多個預定義的年齡范圍內(nèi)的第二組概率值中的概率的總和?;趯诙鄠€預定義的年齡范圍的這些總和,UE 101確定與用戶語音最接近地相關的年齡范圍。例如,可將對應于最高的概率總和的預定義的年齡范圍識別為與語音數(shù)據(jù)相關的范圍。在一個實施例中,目標年齡范圍可由用戶或者服務提供商103指定。例如,目標年齡范圍可由提供目標在特定年齡組的服務(例如服務存儲器113中可用的服務)的服務提供商103指定。然后,UE 101可計算在指定的目標年齡范圍內(nèi)的第二組概率值中的概率的總和。UE 101確定所述總和對于目標年齡范圍是否足夠高。根據(jù)該確定可提供服務。通過范例,用于確定第一組概率值的模型可使用語音訓練(speech training)數(shù)據(jù)建立。語音訓練數(shù)據(jù)可以是為每個預定義的年齡范圍收集的語音樣本,以使當實際的用戶語音與模型一起使用時,可訓練模型以產(chǎn)生精確的概率??蔀槟P褪占總€預定義的年齡范圍的預定數(shù)量的樣本以達到所需的精確度。進ー步地,考慮到來自于語音訓練數(shù)據(jù)的所有限制,也可訓練用于計算第二組概率值的相關矩陣,以使所訓練的相關矩陣的元素指示多個預定義的年齡范圍落入多個單獨年齡內(nèi)的概率。因此,該方法的優(yōu)點在于,通過分析用戶語音數(shù)據(jù),可自動地確定用戶的年齡范圍。經(jīng)訓練的模型和相關矩陣也提高確定用戶年齡范圍的確定的精度。根據(jù)年齡范圍的確定,額外的服務、內(nèi)容、廣告、個性化選擇和建議等可確定目標為與所述用戶有關或?qū)λ鲇脩舾信d趣的用戶。因此,該目標確定減少發(fā)送或提供給用戶的不需要或不相關的信息的數(shù)量。因此,這種方法還可有利地減少與傳輸相關的帶寬、存儲器和計算資源。進ー步地,由于用戶的年齡而不適于用戶的服務或通信可基于用戶的年齡范圍濾除。因此,用于確定用戶年齡范圍的部件是值得期待的。如圖I中所示,系統(tǒng)100包括用戶設備(UE) 101,其具有經(jīng)由通信網(wǎng)絡105到年齡估計器107的連通性。通過示例,系統(tǒng)100的通信網(wǎng)絡105包括一個或多個網(wǎng)絡,例如數(shù)據(jù)網(wǎng)絡(未示出)、無線網(wǎng)絡(未示出)、電話網(wǎng)絡(未示出)或其任意組合。可預期的是,數(shù)據(jù)網(wǎng)絡可以是任何局域網(wǎng)(LAN)、城域網(wǎng)(MAN)、廣域網(wǎng)(WAN)、公共數(shù)據(jù)網(wǎng)(例如因特網(wǎng))、近距
離無線網(wǎng)絡或任何其他適合的分組交換網(wǎng)絡,例如商業(yè)所有、私有分組交換網(wǎng),例如私有電纜或光纖網(wǎng)絡和類似的,或其任意組合。此外,無線網(wǎng)絡例如可以是蜂窩網(wǎng)絡并且可采用各種技術,包括用于全球演進的增強數(shù)據(jù)率(EDGE)、通用分組無線業(yè)務(GPRS)、全球移動通信系統(tǒng)(GSM)、因特網(wǎng)協(xié)議多媒體子系統(tǒng)(IMS)、通用移動電信系統(tǒng)(UMTS)等、以及任意其他適合的無線介質(zhì),例如全球微波互聯(lián)接入(WiMAX)、長期演進(LTE)網(wǎng)絡、碼分多址聯(lián)接(CDMA)、寬帶碼分多址聯(lián)接(WCDMA)、無線保真(WiFi)、無線LAN (WLAN)、藍牙 、因特網(wǎng)協(xié)議(IP)數(shù)據(jù)播送、衛(wèi)星、移動ad-hoc網(wǎng)絡(MANET)和類似的,或其任意組合。UE 101是任意類型的移動終端、固定終端、或便攜式終端,包括移動手機、站、單元、設備、多媒體計算機、多媒體平板、因特網(wǎng)節(jié)點、通信器、臺式計算機、膝上型計算機、個人數(shù)字助理(PDA)、音頻/視頻播放器,數(shù)字相機/數(shù)字攝像機,定位設備,電視接收機,無線廣播接收機,電子書設備,游戲設備,或其任意組合。還可預期的是,UE 101可支持到用戶的任意類型的接ロ(例如“可佩戴”電路等)。通過示例,UE 101和服務提供商103使用已知的、新的或仍在開發(fā)的協(xié)議彼此以及與通信網(wǎng)絡105的其他組件通信。在這種情況下,協(xié)議包括一組規(guī)則,所述規(guī)則定義在通信網(wǎng)絡105內(nèi)的網(wǎng)絡節(jié)點如何基于通過通信鏈路發(fā)送的信息相互交互。所述協(xié)議在每個節(jié)點內(nèi)的不同操作層都是有效的,從產(chǎn)生和接收多種類型的物理信號,到選擇用于傳送這些信號的鏈路,到由那些信號指示的信息格式,到識別在計算機系統(tǒng)上執(zhí)行的哪個軟件應用發(fā)送或接收信息。用于在網(wǎng)絡上交換信息的協(xié)議在概念上不同的層在開放式系統(tǒng)互聯(lián)
(OSI)參考模型中描述。在網(wǎng)絡節(jié)點之間的通信典型地通過交換數(shù)據(jù)的離散分組來實現(xiàn)。每個分組典型地包括(I)與特定協(xié)議相關聯(lián)的報頭信息;和(2)有效載荷信息,其跟隨在報頭信息并且包含可獨立于該特定協(xié)議處理的信息。在一些協(xié)議中,分組包括(3)尾信息,其跟隨有效載荷并且指示有效載荷信息的結尾。報頭包括例如分組的源、其目的地、有效載荷的長度和由協(xié)議使用的其他屬性的信息。通常,用于特定協(xié)議的有效載荷中的數(shù)據(jù)包括與OSI參考模型的不同的、更高層相關聯(lián)的不同協(xié)議的報頭和有效載荷。特定協(xié)議的報頭典型地指示在其有效載荷中包含的下ー協(xié)議的類型。高層協(xié)議認為是封裝在低層協(xié)議中。貫穿多個異構網(wǎng)絡(例如因特網(wǎng))的分組中包括的報頭典型地包括如OSI參考模型所定義的物理(層I)報頭、數(shù)據(jù)鏈路(層2)報頭、網(wǎng)絡間(層3)報頭和傳輸(層4)報頭、和各個應用報頭(層5、層6和層7)。圖2是根據(jù)一個實施例的年齡估計器107的組件的圖。通過示例,年齡估計器包括ー個或多個用于確定用戶年齡范圍的組件。可預期的是這些組件的功能可以組合在ー個或多個組件中或由具有等同功能的其它組件執(zhí)行。在這個實施例中,年齡估計器107包括控制模塊201、輸入模塊203、計算模塊205、呈現(xiàn)模塊207以及通信模塊209??刂颇K201監(jiān)視任務,包括由輸入模塊203、計算模塊205、呈現(xiàn)模塊207以及通信模塊209執(zhí)行的任務。計算模塊205執(zhí)行用于基于語音數(shù)據(jù)確定人的年齡的計算和估計。計算模塊205獲得由傳感器111獲取的語音數(shù)據(jù)并且存儲在數(shù)據(jù)存儲器109中,以及計算語音數(shù)據(jù)屬于每個預定義的年齡范圍的概率。例如,計算模塊205計算第一組概率值,其中概率值的每ー個表示語音數(shù)據(jù)在多個預定義的范圍的相應的ー個中的概率值。多個預定義的年齡范圍是壽命的多個片段,每個片段包括年齡范圍,并且可自動地或由用戶定義。然后,計算模塊205通過將相關矩陣應用于第一組概率值而獲得第二組概率值。相關矩陣將第一組概率值與匹配在整個壽命期間的多個單獨年齡的語音數(shù)據(jù)的概率關聯(lián)。相關矩陣的每個元素可表示多個 預定義的年齡范圍中的一個落入在整個壽命期間的多個單獨年齡中的ー個內(nèi)的概率。進ー步地,計算模塊205為多個預定義的年齡范圍的每個計算在對應于在相應的預定義的年齡內(nèi)的単獨年齡的第二組概率值中的概率的總和。然后,計算模塊205確定預定義的年齡范圍以基于所計算的概率的總和與語音數(shù)據(jù)關聯(lián)。計算模塊205可在計算第一組概率值和/或第二組概率值中使用統(tǒng)計模型,例如高斯混合模型(GMM)、人工神經(jīng)網(wǎng)絡、支持向量模型、決策樹或其組合。從而,可使用ー個或多個包括高斯混合模型(GMM)、人工神經(jīng)網(wǎng)絡、支持向量模型和決策樹的統(tǒng)計模型來計算相關矩陣。輸入模塊203可收集語音數(shù)據(jù)以及其他包括生物識別數(shù)據(jù)和語境信息的數(shù)據(jù)。通信模塊209管理呼入和呼出通信并且可控制在數(shù)據(jù)存儲介質(zhì)109或服務存儲介質(zhì)113中的呼入或呼出語音數(shù)據(jù)。通信模塊209還可收集關于通信方、通信方式、通信時間以及任何其他關于通信的信息,以使這些信息可用作語境信息。呈現(xiàn)模塊207控制用戶接ロ(例如圖形用戶接ロ)的顯示,以表達信息并且允許用戶經(jīng)由接ロ與UE 101交互。進ー步地,呈現(xiàn)模塊207與控制模塊201、輸入模塊203以及通信模塊209交互以顯示任何需要表達的必要信息,例如多個預定義的年齡范圍、所估計的年齡范圍、每個年齡范圍或每個單獨年齡的概率以及關于多個預定義的年齡范圍的資料和細節(jié)。在一個實施例中,輸入模塊203可接收指定目標年齡范圍的輸入?;谠撦斎耄嬎隳K205可計算在對應于在目標年齡范圍內(nèi)的単獨年齡的第二組概率值中的概率的總和。然后,計算模塊205基于所述總和確定語音數(shù)據(jù)是否與具有目標年齡范圍的年齡相關聯(lián)。如果概率值的總和足夠高(例如超過某個最小概率值閾值),語音數(shù)據(jù)可與具有目標年齡范圍的年齡相關聯(lián)。進ー步地,訓練樣本可由傳感器111或服務器(未示出)獲取,以便訓練統(tǒng)計模型和相關矩陣。訓練樣本還可存儲在UE 101的數(shù)據(jù)存儲器109中。計算模塊205通過識別根據(jù)在壽命中的多個預定義的年齡范圍和単獨年齡的訓練樣本的語音數(shù)據(jù)的每ー個來訓練統(tǒng)計模型。然后,計算模塊205用于將語音數(shù)據(jù)與多個預定義的年齡范圍相關,計算概率值的參考組。計算模塊205還通過基于訓練樣本的語音數(shù)據(jù)計算相關矩陣來訓練相關矩陣??蓪E 101連接到存儲介質(zhì)(例如數(shù)據(jù)存儲介質(zhì)109a_109n)以使年齡估計器107可在數(shù)據(jù)存儲介質(zhì)109a-109n中訪問數(shù)據(jù)或存儲數(shù)據(jù)。如果數(shù)據(jù)存儲介質(zhì)109a_109n不是本地的,則可經(jīng)由通信網(wǎng)絡105訪問它們。UE 101還可經(jīng)由通信網(wǎng)絡105連接到服務存儲介質(zhì)113以使年齡估計器107能夠控制在服務存儲介質(zhì)113中的數(shù)據(jù)并且存儲和訪問在服務存儲介質(zhì)113中的數(shù)據(jù)。圖3是根據(jù)一個實施例,用于確定用戶年齡范圍的過程的流程圖。在一個實施例中,年齡估計器107執(zhí)行過程300并且實施于例如圖8所示的包括處理器和存儲器的芯片組中。在步驟301中,年齡估計器107用UE 101獲取語音數(shù)據(jù)。語音數(shù)據(jù)可經(jīng)由UE 101的傳感器111獲取。傳感器111可以是能夠獲取語音數(shù)據(jù)的設備,例如麥克風。所獲取的語音數(shù)據(jù)可存儲在數(shù)據(jù)存儲器109中以使所存儲的語音數(shù)據(jù)稍后可用于計算。例如,語音數(shù)據(jù)的收集可在某個時間周期期間編譯并且存儲在數(shù)據(jù)存儲器109中。進ー步地,可取決于獲取時間將語音數(shù)據(jù)加權。例如,很久以前獲取的語音數(shù)據(jù)對用戶年齡的表示可能沒有 近期獲取的語音數(shù)據(jù)同樣精確的用戶年齡的表示,從而可相應地采用權重。在步驟303中,年齡估計器107計算第一組概率值。在第一組中的概率值的每ー個表示語音數(shù)據(jù)在對應的預定義的年齡范圍中的概率。例如,如果多個年齡范圍包括兒童(0-15歲)、青少年(16-20歲)、青年人(21-30歲)、中年人(31-45歲)、中老年人(46-60歲)以及老年人(60-130歲),年齡估計器107為這六個年齡范圍的每ー個計算概率,其組成第一組概率。在計算出第一組概率之后,在步驟305中,年齡估計器107通過將相關矩陣應用于第一組概率值獲得第二組概率值。將相關矩陣應用于第一組概率值將第一組概率與匹配在整個壽命期間的多個單獨年齡的語音數(shù)據(jù)的概率關聯(lián)。從而,步驟305的結果為具有在整個壽命期間的所有単獨年齡的概率值的第二組概率。例如,如果整個壽命期間定義為0-130歲,則步驟305的結果為具有對應于0-130歲的131個概率值的第二組概率??梢詣?chuàng)建相關矩陣以致相關矩陣的每個元素表示多個預定義的年齡范圍中的一個落入多個單獨范圍中的一個的概率。例如,六個預定義的年齡范圍和0-130歲的壽命的相關矩陣將是6X 131階矩陣,具有表示六個預定義的年齡范圍的6行和表示0-130歲的壽命的131列。然后,計算多個預定義的年齡范圍的每ー個的第二組的概率值的總和(步驟307)。例如,對于0-15歲的年齡范圍,計算來自對應于0-15歲的第二組的16個概率值的總和以找到0-15歲的年齡范圍的概率值。為對應多個年齡范圍所計算的總和為對應多個年齡范圍的最終概率值。因此,如在步驟309中所示,基于這些計算的概率值的總和,年齡估計器107確定多個預定義的年齡范圍以與語音數(shù)據(jù)關聯(lián)。當確定與語音數(shù)據(jù)相關聯(lián)的預定義的年齡范圍后,這個信息可用于更多服務的具體規(guī)定。例如,如果用戶請求服務,提供基于這個年齡范圍的服務到UE 101。進ー步地,如果用戶的年齡范圍不對應服務所需的年齡范圍(例如,對于大于12歲的人的電影服務),則可阻止某些服務提供給用戶。進ー步地,社交網(wǎng)絡服務可基于這個確定的年齡范圍推薦活動或朋友。作為另ー個示例,當提供服務到多個UE IOla-IOln時,可將對應于UElOla-IOln的年齡范圍報告給所述服務的服務提供商。這個報告可示出這項具體的服務流行于某些年齡組。然后基于該報告,服務提供商可以流行年齡組為目標。盡管關于使用語音數(shù)據(jù)來檢測用戶年齡范圍描述了多個的實施例,可預期的是圖3的過程300可使用一個或多個其他類型的生物識別信息代替或與語音數(shù)據(jù)結合來執(zhí)行。通過示例,生物識別信息可包括人的臉或皮膚、生物信號例如腦波和心跳等,其可用于估計用戶的年齡并且經(jīng)由傳感器111收集。進ー步地,可獲得人類組織的光(例如紅外線)反射屬性作為生物識別信息,因為光反射屬性可取決于人類組織的年齡而不同。可替換地,可用其他類型的信息,例如可由UE 101收集的生物識別信息和語境信息,補充在步驟309中的確定。然后,年齡估計器107可在確定預定義的年齡范圍與語音數(shù)據(jù)相關聯(lián)中考慮該額外的信息以及所計算的總和。語境信息也可以是由用戶使用的軟件應用的日志。例如,如果用戶是年輕的游戲玩家,它更類似于動作游戲比益智游戲更吸引用戶。所以對動作類游戲的吸引力可指示較年輕的用戶。語境信息可包括人經(jīng)常光顧的地方,其可由位置定位設備例如全球定位系統(tǒng)設備捕獲。例如,如果人頻繁地光顧夜總會,則年齡估計器可將此與該人是年輕人的可能性相鏈接,并且相應地調(diào)整概率值。進ー步地,過程300可發(fā)生在服務器(未示出)中,而不是在UE 101中。如果過程300發(fā)生在服務器中,則UE 101的用戶的語音數(shù)據(jù)可不由服務器獲取,除非為了隱私的目的用戶同意這種獲取。另外,UE 101還可獲取在UE 101的用戶的聯(lián)系人名單中的其他用戶·的語音數(shù)據(jù),并且按照類似于過程300的過程確定他們的年齡范圍。在這種情況下,UE 101也可需要獲取來自其他用戶的他們的語音數(shù)據(jù)的許可。這個過程的優(yōu)點在于它通過獲取和分析用戶的語音數(shù)據(jù),自動地確定用戶所屬于的年齡范圍。因此,這個過程提供確定用戶年齡范圍的簡單方式并且因此提供基于年齡范圍為目標廣告和推薦的方式。年齡估計器是用于取得這種優(yōu)點的部件。圖4是根據(jù)一個實施例,訓練用于確定用戶年齡范圍的統(tǒng)計模型和相關矩陣的過程的流程圖。在此所描述的方法的實現(xiàn)可包括離線訓練部分和在線識別部分。過程400可以是離線訓練部分,而過程300可以是在線識別部分。在一個實施例中,年齡估計器107執(zhí)行過程400并且例如在如圖8所示的包括處理器和存儲器的芯片組中實現(xiàn)。在步驟401中,年齡估計器107指導UE 101收集語音數(shù)據(jù)訓練樣本。訓練樣本可包括關于對應于每個預定義的范圍和在壽命內(nèi)的多個單獨年齡中的每ー個的語音數(shù)據(jù)。訓練樣本還可包括關于對應于訓練樣本的每個語音數(shù)據(jù)的多個年齡和多個年齡范圍的信息。進ー步地,訓練樣本可從不同的多個年齡和多個年齡范圍的ー組個體收集。訓練樣本在服務器(未示出)中可用于到UE 101的下載。訓練樣本還可由UE 101收集。然后,在步驟403中,根據(jù)多個年齡范圍和多個單獨年齡識別語音數(shù)據(jù)訓練樣本。如步驟405中所示,使用語音數(shù)據(jù)訓練樣本,年齡估計器107計算將語音數(shù)據(jù)與多個預定義的年齡范圍相關的概率值的參考組。然后,在步驟407中,基于語音數(shù)據(jù)訓練樣本計算相關矩陣。在步驟403和405中發(fā)生的離線訓練可通過訓練統(tǒng)計模型(例如使用訓練樣本的高斯混合模型(GMM))來執(zhí)行。除了 GMM,也可使用其他模型,例如人工神經(jīng)網(wǎng)絡,支持向量機(SVM)以及決策樹。可使用語音訓練數(shù)據(jù)為所有預定義的年齡范圍建立GMM。如上面的示例所示,多個預定義的年齡范圍可以是兒童(0-15歲)、青少年(16-20歲)、青年人(21-30歲)、中年人(31-45歲)、中老年人(46-60歲)以及老年人(60-130歲)。為在壽命(0-130歲)中的每個預定義的年齡范圍和每個單獨年齡收集訓練樣本。訓練樣本可以是對應于每個預定義的年齡范圍的人們的語音數(shù)據(jù)。向量 <是來自于預定義的年齡范圍η的樣本j的觀測向量,在其中n e [I…N]。N是多個預定義的年齡范圍的數(shù)量。因此,在該示例中,N是6,因為存在6個不同的預定義的年齡范圍,并且兒童、青少年、青年人、中年人、中老年人以及老年人的多個預定義的年齡范圍具有分別為1,2,3,4,5和6的η個值。每個GMM具有k個組件。則,d維觀測的概率
密度函數(shù)定義如下
權利要求
1.一種方法,包括 至少部分地導致語音數(shù)據(jù)的獲?。? 計算第一組概率值,其中所述概率值的每一個表示所述語音數(shù)據(jù)在多個預定義的年齡范圍中的相應的一個的概率,并且所述多個預定義的年齡范圍是壽命的多個階段; 通過將相關矩陣應用于所述第一組概率值獲得第二組概率值,其中所述相關矩陣將所述第一組概率值與匹配在整個壽命期間的多個單獨年齡的所述語音數(shù)據(jù)的概率相關聯(lián);為所述多個預定義的年齡范圍的每一個,計算對應于在相應的多個預定義的年齡范圍內(nèi)的所述多個單獨年齡的所述第二組概率值中的概率的總和;以及 至少部分地基于所計算的所述概率的總和來確定所述預定義的年齡范圍與所述語音數(shù)據(jù)相關聯(lián)。
2.根據(jù)權利要求I所述的方法,進一步包括 接收指定目標年齡范圍的輸入; 計算對應于在所述目標年齡范圍內(nèi)的所述多個單獨年齡的所述第二組概率值中的概率的另一個總和;以及 至少部分地基于所述另一個總和來確定所述語音數(shù)據(jù)是否與在所述目標年齡范圍內(nèi)的年齡相關聯(lián)。
3.根據(jù)權利要求I和2任一項所述的方法,進一步包括 收集多個語音數(shù)據(jù)訓練樣本; 根據(jù)所述多個預定義的年齡范圍和在壽命中的所述多個單獨年齡,識別所述多個語音數(shù)據(jù)訓練樣本的每一個; 計算用于將所述語音數(shù)據(jù)與所述多個預定義的年齡范圍相關聯(lián)的概率值的參考組;以及 基于所述語音數(shù)據(jù)訓練樣本計算所述相關矩陣。
4.根據(jù)權利要求3所述的方法,進一步包括 經(jīng)由區(qū)分性訓練優(yōu)化所述相關矩陣。
5.根據(jù)權利要求I至4任一項所述的方法,其中使用統(tǒng)計模型執(zhí)行所述第一組概率值、所述第二組概率值或者兩者的計算,所述統(tǒng)計模型包括高斯混合模型、人工神經(jīng)網(wǎng)絡、支持向量模型、決策樹或其任意組合。
6.根據(jù)權利要求I至5任一項所述的方法,其中所述相關矩陣的每一個元素表示所述多個預定義的年齡范圍中的一個落入所述多個單獨年齡中的一個的概率。
7.根據(jù)權利要求I至6任一項所述的方法,進一步包括 至少部分地導致生物識別信息、語境信息或其組合的獲??; 其中所述預定義的年齡范圍與所述語音數(shù)據(jù)相關聯(lián)的確定進一步至少部分地基于所述生物識別信息、所述語境信息或其組合。
8.根據(jù)權利要求I至7任一項所述的方法,進一步包括 基于所確定的預定義的年齡范圍,選擇性地提供廣告、建議、報告、通知、消息、媒體或其任意組合。
9.一種裝置,包括 至少一個處理器;和至少一個包括計算機程序代碼的存儲器, 所述至少一個存儲器和所述計算機程序代碼配置為,與所述至少一個處理器使所述裝置至少執(zhí)行以下 至少部分地導致語音數(shù)據(jù)的獲取; 計算第一組概率值,其中所述概率值的每一個表示所述語音數(shù)據(jù)在多個預定義的年齡范圍中的相應的一個中的概率,并且所述預定義的年齡范圍是壽命的多個片段; 通過將相關矩陣應用于所述第一組概率值來獲得第二組概率值,其中所述相關矩陣將所述第一組概率值與匹配在整個壽命期間的多個單獨年齡的所述語音數(shù)據(jù)的概率相關聯(lián); 為所述多個預定義的年齡范圍中的每一個,計算對應于在相應的所述多個預定義的年齡范圍內(nèi)的所述多個單獨年齡的所述第二組概率值中的概率的總和;以及 至少部分地基于所計算的概率的總和來確定所述預定義的年齡范圍與所述語音數(shù)據(jù)相關聯(lián)。
10.根據(jù)權利要求9所述的裝置,其中進一步至少部分地使所述裝置 接收指定目標年齡范圍的輸入; 計算對應于在所述目標年齡范圍內(nèi)的所述多個單獨年齡的所述第二組概率值中的所述概率的另一個總和;以及 至少部分地基于所述另一個總和,確定所述語音數(shù)據(jù)是否與在所述目標年齡范圍內(nèi)的年齡相關聯(lián)。
11.根據(jù)權利要求9和10中任一項所述的裝置,其中進一步至少部分地使所述裝置 收集多個語音數(shù)據(jù)訓練樣本; 根據(jù)所述多個預定義的年齡范圍和在壽命中的所述多個單獨年齡,識別所述多個語音數(shù)據(jù)訓練樣本的每一個; 計算用于將所述語音數(shù)據(jù)與所述多個預定義的年齡范圍相關聯(lián)的概率值的參考組;以及 基于所述語音數(shù)據(jù)訓練樣本計算所述相關矩陣。
12.根據(jù)權利要求11任一項所述的裝置,其中進一步至少部分地使所述裝置 經(jīng)由區(qū)分性訓練優(yōu)化所述相關矩陣。
13.根據(jù)權利要求9至12任一項所述的裝置,其中使用統(tǒng)計模型來執(zhí)行所述第一組概率值、所述第二組概率值或者兩者的計算,所述統(tǒng)計模型包括高斯混合模型、人工神經(jīng)網(wǎng)絡、支持向量模型、決策樹或其任意組合。
14.根據(jù)權利要求9至13任一項所述的裝置,其中所述相關矩陣的每一個元素表示所述多個預定義的年齡范圍中的一個落入所述多個單獨年齡中的一個的概率。
15.根據(jù)權利要求9至14任一項所述的裝置,其中進一步至少部分地使所述裝置 至少部分地導致生物識別信息、語境信息或其組合的獲取; 其中所述預定義的年齡范圍與所述語音數(shù)據(jù)相關聯(lián)的確定進一步至少部分地基于所述生物識別信息、所述語境信息或其組合。
16.根據(jù)權利要求9至15任一項所述的裝置,其中進一步至少部分地使所述裝置 基于所確定的預定義的年齡范圍,選擇性地提供廣告、建議、報告、通知、消息、媒體或其任意組合。
17.根據(jù)權利要求9至16任一項所述的裝置,其中所述裝置是移動電話,所述移動電話進一步包括 用戶接口電路和用戶接口軟件,配置為通過顯示器的使用方便所述移動電話的至少一些功能的用戶控制并且配置為響應用戶輸入;以及 顯示器和顯示器電路,配置為顯示所述移動電話的用戶接口的至少一部分,所述顯示器和顯示器電路配置為方便所述移動電話的至少一些功能的用戶控制。
18.一種計算機可讀存儲介質(zhì),所述計算機可讀存儲介質(zhì)攜載一個或多個指令的一個或多個序列,當由一個或多個處理器執(zhí)行時,所述一個或多個指令使裝置至少執(zhí)行以下步驟 至少部分地導致語音數(shù)據(jù)的獲?。? 計算第一組概率值,其中所述概率值的每一個表示所述語音數(shù)據(jù)在多個預定義的年齡范圍中的相應的一個的概率,并且所述多個預定義的年齡范圍是壽命的多個片段; 通過將相關矩陣應用于所述第一組概率值獲得第二組概率值,其中所述相關矩陣將所述第一組概率值與匹配在整個壽命期間的多個單獨年齡的所述語音數(shù)據(jù)的概率相關聯(lián); 為所述多個預定義的年齡范圍的每一個,計算對應于在相應的所述多個預定義的年齡范圍內(nèi)的所述多個單獨年齡的所述第二組概率值中的概率的總和;以及 至少部分地基于所計算的所述概率的總和來確定所述預定義的年齡范圍與所述語音數(shù)據(jù)相關聯(lián)。
19.根據(jù)權利要求18所述的計算機可讀存儲介質(zhì),其中至少部分地使所述裝置進一步執(zhí)行 接收指定目標年齡范圍的輸入; 計算對應于在所述目標年齡范圍內(nèi)的所述多個單獨年齡的所述第二組概率值中的所述概率的另一個總和;以及 至少部分地基于所述另一個總和,確定所述語音數(shù)據(jù)是否與在所述目標年齡范圍內(nèi)的年齡相關聯(lián)。
20.根據(jù)權利要求18和19任一項所述的計算機可讀存儲介質(zhì),其中至少部分地使所述裝置進一步執(zhí)行 收集多個語音數(shù)據(jù)訓練樣本; 根據(jù)所述多個預定義的年齡范圍和在壽命中的所述多個單獨年齡,識別所述多個語音數(shù)據(jù)訓練樣本中的每一個; 計算用于將所述語音數(shù)據(jù)與所述多個預定義的年齡范圍相關聯(lián)的概率值的參考組;以及 基于所述語音數(shù)據(jù)訓練樣本計算所述相關矩陣。
21.根據(jù)權利要求20所述的計算機可讀存儲介質(zhì),其中至少部分地使所述裝置進一步執(zhí)行 經(jīng)由區(qū)分性訓練優(yōu)化所述相關矩陣。
22.根據(jù)權利要求18至21任一項所述的計算機可讀存儲介質(zhì),其中使用統(tǒng)計模型來執(zhí)行所述第一組概率值、所述第二組概率值或者兩者的計算,所述統(tǒng)計模型包括高斯混合模型、人工神經(jīng)網(wǎng)絡、支持向量模型、決策樹或其任意組合。
23.根據(jù)權利要求18至22任一項所述的計算機可讀存儲介質(zhì),其中所述相關矩陣的每一個元素表示所述多個預定義的年齡范圍中的一個落入所述多個單獨年齡中的一個的概率。
24.根據(jù)權利要求18至23任一項所述的計算機可讀存儲介質(zhì),其中至少部分地使所述裝置進一步執(zhí)行 至少部分地導致生物識別信息、語境信息或其組合的獲??; 其中所述預定義的年齡范圍與所述語音數(shù)據(jù)相關聯(lián)的確定進一步至少部分地基于所述生物識別信息、所述語境信息或其組合。
25.根據(jù)權利要求18至24任一項所述的計算機可讀存儲介質(zhì),其中至少部分地使所述裝置進一步執(zhí)行 基于所確定的預定義的年齡范圍,選擇性地提供廣告、建議、報告、通知、消息、媒體或其任意組合。
26.一種裝置,包括 用于至少部分地導致語音數(shù)據(jù)的獲取的部件; 用于計算第一組概率值的部件,其中所述概率值的每一個表示所述語音數(shù)據(jù)在多個預定義的年齡范圍中的相應的一個中的概率,并且所述多個預定義的年齡范圍是壽命的多個片段; 用于通過將相關矩陣應用于所述第一組概率值來獲得第二組概率值的部件,其中所述相關矩陣將所述第一組概率值與匹配在整個壽命期間的多個單獨年齡的所述語音數(shù)據(jù)的概率相關聯(lián); 用于為所述多個預定義的年齡范圍中的每一個,計算對應于在相應的所述多個預定義的年齡范圍內(nèi)的所述多個單獨年齡的所述第二組概率值中的概率的總和的部件;以及 用于至少部分地基于所計算的所述概率的總和來確定所述預定義的年齡范圍與所述語音數(shù)據(jù)相關聯(lián)的部件。
27.根據(jù)權利要求26所述的裝置,進一步包括 用于接收指定目標年齡范圍的輸入的部件; 用于計算對應于在所述目標年齡范圍內(nèi)的所述多個單獨年齡的所述第二組概率值中的所述概率的另一個總和的部件;以及 用于至少部分地基于所述另一個總和來確定所述語音數(shù)據(jù)是否與在所述目標年齡范圍內(nèi)的年齡相關聯(lián)的部件。
28.根據(jù)權利要求26和27任一項所述的裝置,進一步包括 用于收集多個語音數(shù)據(jù)訓練樣本的部件; 用于根據(jù)所述多個預定義的年齡范圍和在壽命中的所述多個單獨年齡,識別所述多個語音數(shù)據(jù)訓練樣本中的每一個的部件; 用于計算用于將所述語音數(shù)據(jù)與所述多個預定義的年齡范圍相關聯(lián)的概率值的參考組的部件;以及 用于基于所述語音數(shù)據(jù)訓練樣本計算所述相關矩陣的部件。
29.根據(jù)權利要求28所述的裝置,進一步包括用于經(jīng)由區(qū)分性訓練優(yōu)化所述相關矩陣的部件。
30.根據(jù)權利要求26至29任一項所述的裝置,其中使用統(tǒng)計模型來執(zhí)行所述第一組概率值、所述第二組概率值或者兩者的計算,所述統(tǒng)計模型包括高斯混合模型、人工神經(jīng)網(wǎng)絡、支持向量模型、決策樹或其任意組合。
31.根據(jù)權利要求26至30任一項所述的裝置,其中所述相關矩陣的每一個元素表示所述多個預定義的年齡范圍中的一個落入所述多個單獨年齡中的一個的概率。
32.根據(jù)權利要求26至31任一項所述的裝置,進一步包括 用于至少部分地導致生物識別信息、語境信息或其組合的獲取的部件; 其中所述預定義的年齡范圍與所述語音數(shù)據(jù)相關聯(lián)的確定進一步至少部分地基于所述生物識別信息、所述語境信息或其組合。
33.根據(jù)權利要求26至32任一項所述的裝置,進一步包括 用于基于所確定的預定義的年齡范圍,選擇性地提供廣告、建議、報告、通知、消息、媒體或其任意組合的部件。
34.一種計算機程序產(chǎn)品,包括一個或多個指令的一個或多個序列,當由一個或多個處理器執(zhí)行時,所述一個或多個指令使裝置至少執(zhí)行權利要求I至8任一項所述方法的步驟。
全文摘要
提供一種用于確定用戶年齡范圍的方法。年齡估計器至少部分地導致語音數(shù)據(jù)的獲取。然后,年齡估計器計算第一組概率值,其中概率值的每一個表示語音數(shù)據(jù)在多個預定義的年齡范圍的相應的一個中的概率,并且所述多個預定義的年齡范圍是壽命的多個片段。然后,通過將相關矩陣應用于第一組概率值,年齡估計器獲得第二組概率值,其中相關矩陣將第一組概率值與匹配在整個壽命期間的多個單獨年齡的語音數(shù)據(jù)的概率相關聯(lián)。然后,為多個預定義的年齡范圍的每一個,年齡估計器計算對應于在相應的多個預定義的年齡范圍內(nèi)的多個單獨年齡的第二組概率值中的概率的總和。進一步地,至少部分地基于所計算的概率的總和,年齡估計器確定預定義的年齡范圍與語音數(shù)據(jù)相關聯(lián)。
文檔編號G06Q30/02GK102834842SQ201080065696
公開日2012年12月19日 申請日期2010年3月23日 優(yōu)先權日2010年3月23日
發(fā)明者曹陽, 丁豐, 田繼雷 申請人:諾基亞公司