經(jīng)由聲波紋位置感知的基于區(qū)域的存在確定的制作方法
【專利摘要】可以接收來自接近環(huán)境中的一個或多個麥克風(fēng)的說話者的語音。麥克風(fēng)可以是定向麥克風(fēng)或全向麥克風(fēng)??梢詫φZ音進(jìn)行處理以產(chǎn)生用以確定說話者的身份的話語。說話者的身份可與聲波紋相關(guān)聯(lián)。該身份可與計算系統(tǒng)的用戶證書相關(guān)聯(lián)。這些證書可以唯一識別計算系統(tǒng)內(nèi)的用戶??梢苑治鲈捳Z以建立說話者存在的區(qū)域。該區(qū)域可以是環(huán)境中的有界區(qū)域。可以將該區(qū)域在環(huán)境中進(jìn)行映射以確定說話者的位置。該位置可以是相對位置或絕對位置。
【專利說明】經(jīng)由聲波紋位置感知的基于區(qū)域的存在確定
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及存在確定的領(lǐng)域,更特別地涉及經(jīng)由聲波紋位置感知的基于區(qū)域的存 在確定。
【背景技術(shù)】
[0002] 在大型設(shè)施(例如,工作場所)內(nèi)定位人員對日常業(yè)務(wù)操作而言越來越重要。這 些操作經(jīng)??梢园ńM織會議、爭取資源和協(xié)調(diào)人員活動。例如,高層辦公建筑物(例如, 高層辦公室)經(jīng)常將許多公司部門容納在可以包括分布在許多樓層的幾百名人員的一個 建筑物內(nèi)。在這些大型設(shè)施內(nèi)管理業(yè)務(wù)操作常??赡苁瞧D巨的。也就是說,由于普遍存在 的計算(例如,移動計算機)使得人員能夠在這些大型設(shè)施內(nèi)自由移動,因此確定位置(例 如,存在)可能耗時并且困難。缺乏存在解決方案的設(shè)施往往采用諸如直接聯(lián)系人員以確 定人員位置等的手動協(xié)調(diào)努力。這些手動努力可能使生產(chǎn)率下降,并且頻繁導(dǎo)致嘗試進(jìn)行 業(yè)務(wù)操作的人員受挫。
[0003] 可選地,設(shè)施可以配備有傳統(tǒng)的存在解決方案。這些傳統(tǒng)的存在解決方案頻繁地 依賴于射頻識別(RFID)、超聲波、無線保真(WiFi)、全球定位系統(tǒng)(GPS)和用以確定人員 位置的其它技術(shù)。這些解決方案通常涉及使用必須由人員佩戴的唯一識別標(biāo)簽(例如,授 權(quán)人員、訪客、居民等)以供存在系統(tǒng)確認(rèn)并識別人員的位置。該系統(tǒng)的缺陷經(jīng)常包括標(biāo)簽 相對于個人的關(guān)聯(lián)不精確、在設(shè)施內(nèi)獲取個人的標(biāo)簽的成本、標(biāo)簽的電池壽命有限、丟失標(biāo) 簽、丟失標(biāo)簽的更換費用和標(biāo)簽的不一致使用。這些缺陷可能很快對于在這些大型設(shè)施內(nèi) 采用有價值的存在技術(shù)造成顯著障礙。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明的一個方面可以包括用于經(jīng)由聲波紋位置感知的基于區(qū)域的存在確定系 統(tǒng)、設(shè)備、計算機程序產(chǎn)品和方法。可以接收到來自與環(huán)境中的一個或多個麥克風(fēng)接近的說 話者的語音。麥克風(fēng)可以是定向麥克風(fēng)或全向麥克風(fēng)。說話者可以是人。可以對語音進(jìn)行 處理以產(chǎn)生用以確定說話者的身份的話語。說話者的身份可與聲波紋相關(guān)聯(lián)。該身份可與 計算系統(tǒng)的用戶證書相關(guān)聯(lián)。這些證書可以唯一識別計算系統(tǒng)內(nèi)的用戶。可以分析話語以 建立說話者存在的區(qū)域。該區(qū)域可以是環(huán)境中的有界區(qū)域??梢詫⒃搮^(qū)域在環(huán)境中進(jìn)行映 射以確定說話者的位置。該位置可以是相對位置或絕對位置。
[0005] 本發(fā)明的另一方面可以包括用于經(jīng)由聲波紋位置感知的基于區(qū)域的存在確定方 法、設(shè)備、計算機程序產(chǎn)品和系統(tǒng)。語音引擎可被配置為基于所接收到的語音話語來確定說 話者在環(huán)境中的位置??梢詮慕咏f話者的一個或多個麥克風(fēng)接收到話語。位置可以是環(huán) 境中的一個或多個區(qū)域。話語可匹配至聲波紋。聲波紋可關(guān)聯(lián)至說話者身份。數(shù)據(jù)存儲器 能夠保存與說話者身份相關(guān)聯(lián)的一個或多個聲波紋以及映射。說話者身份可與計算系統(tǒng)的 用戶證書相關(guān)聯(lián)。映射可以使一個或多個區(qū)域與環(huán)境相關(guān)聯(lián)。
【專利附圖】
【附圖說明】
[0006] 圖1是示出根據(jù)這里所公開的創(chuàng)造性布置的實施例的經(jīng)由聲波紋位置感知的基 于區(qū)域的存在確定方案的示意圖。
[0007] 圖2是示出根據(jù)這里所公開的創(chuàng)造性布置的實施例的經(jīng)由聲波紋位置感知的基 于區(qū)域的存在確定方法的示意圖。
[0008] 圖3是示出據(jù)這里所公開的創(chuàng)造性布置的實施例的經(jīng)由聲波紋位置感知的基于 區(qū)域的存在確定系統(tǒng)的示意圖。
【具體實施方式】
[0009] 本公開是經(jīng)由聲波紋位置感知的基于區(qū)域的存在確定所用的解決方案。在該解決 方案中,可以利用分布在整個環(huán)境(例如,設(shè)施)內(nèi)的麥克風(fēng)的陣列來在該設(shè)施內(nèi)建立說話 者(例如,人員)存在。在一個實施例中,可以將麥克風(fēng)放置在設(shè)施的每個房間內(nèi),其中每 個麥克風(fēng)位置可被映射到設(shè)施的區(qū)域。在本實施例中,在麥克風(fēng)檢測到來自說話者的語音 的情況下,可以利用與該說話者相關(guān)聯(lián)的聲波紋來唯一識別并定位區(qū)域內(nèi)的說話者。本公 開可以進(jìn)行聲波紋創(chuàng)建、說話者識別、說話者驗證和存在確定等。在一個實施例中,本公開 可以是沒有追蹤裝置的當(dāng)前實時定位服務(wù)(RTLS)。在本實施例的一個配置中,即使在沒有 對該服務(wù)注冊人員聲波紋的情況下,RTLS也能夠自動對來自人員的語音做出反應(yīng)。
[0010] 所屬【技術(shù)領(lǐng)域】的技術(shù)人員知道,本發(fā)明的各個方面可以實現(xiàn)為系統(tǒng)、方法或計算 機程序產(chǎn)品。因此,本發(fā)明的各個方面可以具體實現(xiàn)為以下形式,即:完全的硬件實施方式、 完全的軟件實施方式(包括固件、駐留軟件、微代碼等),或硬件和軟件方面結(jié)合的實施方 式,這里可以統(tǒng)稱為"電路"、"模塊"或"系統(tǒng)"。此外,在一些實施例中,本發(fā)明的各個方面 還可以實現(xiàn)為在一個或多個計算機可讀介質(zhì)中的計算機程序產(chǎn)品的形式,該計算機可讀介 質(zhì)中包含計算機可讀的程序代碼。
[0011] 可以采用一個或多個計算機可讀介質(zhì)的任意組合。計算機可讀介質(zhì)可以是計算 機可讀信號介質(zhì)或者計算機可讀存儲介質(zhì)。計算機可讀存儲介質(zhì)例如可以是--但不限 于--電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計算 機可讀存儲介質(zhì)的更具體的例子(非窮舉的列表)包括:具有一個或多個導(dǎo)線的電連接、便 攜式計算機盤、硬盤、隨機存取存儲器(RAM)、只讀存儲器(ROM)、可擦式可編程只讀存儲器 (EPROM或閃存)、光纖、便攜式緊湊盤只讀存儲器(CD-ROM)、光存儲器件、磁存儲器件、或者 上述的任意合適的組合。在本文件中,計算機可讀存儲介質(zhì)可以是任何包含或存儲程序的 有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。
[0012] 計算機可讀的信號介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號, 其中承載了計算機可讀的程序代碼。這種傳播的數(shù)據(jù)信號可以采用多種形式,包括一但 不限于一電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質(zhì)還可以是 計算機可讀存儲介質(zhì)以外的任何計算機可讀介質(zhì),該計算機可讀介質(zhì)可以發(fā)送、傳播或者 傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。
[0013] 計算機可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括一但不限 于--無線、有線、光纜、RF等等,或者上述的任意合適的組合??梢砸砸环N或多種程序設(shè) 計語言的任意組合來編寫用于執(zhí)行本發(fā)明操作的計算機程序代碼,所述程序設(shè)計語言包括 面向?qū)ο蟮某绦蛟O(shè)計語目一諸如Java、Smalltalk、C++等,還包括常規(guī)的過程式程序設(shè)計 語言一諸如"C"語言或類似的程序設(shè)計語言。程序代碼可以完全地在用戶計算機上執(zhí)行、 部分地在用戶計算機上執(zhí)行、作為一個獨立的軟件包執(zhí)行、部分在用戶計算機上部分在遠(yuǎn) 程計算機上執(zhí)行、或者完全在遠(yuǎn)程計算機或服務(wù)器上執(zhí)行。在涉及遠(yuǎn)程計算機的情形中,遠(yuǎn) 程計算機可以通過任意種類的網(wǎng)絡(luò)--包括局域網(wǎng)(LAN)或廣域網(wǎng)(WAN) -連接到用戶計 算機,或者,可以連接到外部計算機(例如利用因特網(wǎng)服務(wù)提供商來通過因特網(wǎng)連接)。
[0014] 下面將參照根據(jù)本發(fā)明實施例的方法、裝置(系統(tǒng))和計算機程序產(chǎn)品的流程圖 和/或框圖描述本發(fā)明。應(yīng)當(dāng)理解,流程圖和/或框圖的每個方框以及流程圖和/或框圖 中各方框的組合,都可以由計算機程序指令實現(xiàn)。
[0015] 這些計算機程序指令可以提供給通用計算機、專用計算機或其它可編程數(shù)據(jù)處理 裝置的處理器,從而生產(chǎn)出一種機器,使得這些計算機程序指令在通過計算機或其它可編 程數(shù)據(jù)處理裝置的處理器執(zhí)行時,產(chǎn)生了實現(xiàn)流程圖和/或框圖中的一個或多個方框中規(guī) 定的功能/動作的裝置。
[0016] 也可以把這些計算機程序指令存儲在計算機可讀介質(zhì)中,這些指令使得計算機、 其它可編程數(shù)據(jù)處理裝置、或其他設(shè)備以特定方式工作,從而,存儲在計算機可讀介質(zhì)中的 指令就產(chǎn)生出包括實現(xiàn)流程圖和/或框圖中的一個或多個方框中規(guī)定的功能/動作的指令 的制造品(article of manufacture) 〇
[0017] 也可以將這些計算機程序指令載入計算機、其它可編程數(shù)據(jù)處理設(shè)備或其它裝 置,以使得在該計算機、其它可編程設(shè)備或其它裝置上進(jìn)行一系列操作步驟,從而產(chǎn)生計算 機實現(xiàn)處理,以使得在計算機或其它可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)流程圖和/或 框圖框所指定的功能/行為的處理。
[0018] 圖1是示出根據(jù)這里所公開的創(chuàng)新性布置的實施例的用于通過聲波紋位置感知 來進(jìn)行基于區(qū)域的存在確定的方案100的示意圖??梢栽诜椒?00和/或系統(tǒng)300上下文 中進(jìn)行方案100。在方案100中,聲波紋創(chuàng)建101、說話者驗證130、存在確定160可以是使 能本公開功能的階段。應(yīng)當(dāng)理解,階段101可以獨立進(jìn)行以及/或者可以是存在確定處理 (例如,130,160)的階段從屬處理。應(yīng)當(dāng)理解,階段101、130、160可以同時或順次進(jìn)行。在 聲波紋創(chuàng)建101中,可以使利用麥克風(fēng)116所接收到的語音114與說話者身份124相關(guān)聯(lián) 以建立說話者112的聲波紋126。在說話者驗證130中,可以利用現(xiàn)有的聲波紋126來基于 語音124識別說話者112。在存在確定160中,可以采用映射162來建立與說話者112相關(guān) 聯(lián)的存在信息164。
[0019] 如這里所使用的,環(huán)境105可以是提供人員(例如,說話者112)活動場所的建造 環(huán)境。環(huán)境105可以包括但不限于建筑物、街區(qū)、城市和地理有界區(qū)域等。例如,環(huán)境105可 以是大學(xué)校園。在一個實施例中,可以將環(huán)境105分割成一個或多個區(qū)域(例如,區(qū)域A)。 區(qū)域可以是環(huán)境105的在邏輯和/或物理上分開的部分。
[0020] 房間110可以是環(huán)境105內(nèi)的可區(qū)分空間。房間110可以包括但不限于房間(例 如,房間110)、走廊和公共區(qū)域等。房間110可以包括可以固定的麥克風(fēng)116或可移動麥克 風(fēng)。麥克風(fēng)116可以包括但不限于單個麥克風(fēng)、多個通信鏈接的麥克風(fēng)和多個獨立麥克風(fēng) 等。
[0021] 在一個示例中,麥克風(fēng)116可以是音頻/視頻裝置的組件。例如,麥克風(fēng)116可以 是與安全照相機相關(guān)聯(lián)的麥克風(fēng)。麥克風(fēng)116可以檢測來自接近的說話者112的語音114。 說話者112可以是產(chǎn)生語音114的接近麥克風(fēng)114的個人。語音114是麥克風(fēng)114可以接 收到的通信的有聲形式。語音114可以包括包含但不限于句子、單詞和音節(jié)等的傳統(tǒng)語言 構(gòu)成。也就是說,語音114可以包括孤立的單詞、連接的單詞和連續(xù)語音。語音114可以包 括但不限于一種或多種語言。應(yīng)當(dāng)理解,語音114可以是對準(zhǔn)麥克風(fēng)114的和/或是間接 的(例如,環(huán)境噪聲)。例如,語音114可以包括房間110內(nèi)的與該房間內(nèi)的其它人進(jìn)行通 信的說話者112。
[0022] 麥克風(fēng)116可以將語音114傳送至語音引擎120。引擎120可以將語音114處理 成一個或多個話語122。話語122可以是口語中的語音的一個完整單位。話語122可以與 包括但不限于音調(diào)、語調(diào)和響度等的一個或多個屬性相關(guān)聯(lián)。也就是說,話語122可以是語 音識別處理的人為因素。通過將說話者身份124與話語122相組合,引擎120可以產(chǎn)生聲 波紋126。
[0023] 聲波紋126可以是使語音114(例如,話語)與說話者身份(例如,用戶證書)相 關(guān)聯(lián)的獨特數(shù)據(jù)集。在一個實施例中,聲波紋126可以是語音信號的隨時間改變的頻譜表 示。在本實施例中,可以利用該信號來唯一識別說話者。例如,聲波紋126可以是在計算安 全系統(tǒng)內(nèi)所利用的語音行為生物特征。聲波紋126可以包括但不限于話語122、聲譜圖和用 戶證書等。聲波紋126可以包括單個獨特聲波紋和多個聲波紋等。聲波紋126可以包括但 不限于模板和語音模型(例如,隱馬爾可夫模型(Hidden Markov Model))等。應(yīng)當(dāng)理解, 在聲波紋內(nèi)所存儲的話語可以包括話語屬性(例如,說依賴于說話者的特性)。在一個實施 例中,可以利用與聲波紋126相關(guān)聯(lián)的用戶證書來確定說話者身份。
[0024] 在說話者驗證130中,可以利用先前建立的聲波紋126來驗證說話者112的身份。 在說話者驗證130中,可以對語音114和聲波紋126進(jìn)行驗證132動作。驗證132可以包 括對語音114進(jìn)行解碼、使語音114與聲波紋126相匹配等。在一個示例中,引擎120可以 將語音114的話語屬性與和聲波紋126相關(guān)聯(lián)的話語屬性進(jìn)行比較。應(yīng)當(dāng)理解,驗證132 可以是任意復(fù)雜的并且可以利用一個或多個規(guī)則集和設(shè)置等。也就是說,驗證132可以是 具有魯棒性且可擴展的,從而使得本公開能夠廣泛適用于各種實現(xiàn)。
[0025] 在語音114與聲波紋126相匹配的情況下,可以通過使用與聲波紋126相關(guān)聯(lián)的 用戶證書來確定說話者身份134。在語音114沒有與聲波紋126相匹配的情況下,可以將說 話者身份134設(shè)置為訪客身份。在一個示例中,在手動提供證書的情況下,可以將訪客身份 手動分配給系統(tǒng)(例如,系統(tǒng)300)的注冊過的用戶。在另一示例中,在說話者112與自動 向系統(tǒng)提供證書的裝置互動的情況下,可以將訪客身份自動分配至系統(tǒng)(例如,系統(tǒng)300) 的注冊過的用戶。
[0026] 在存在確定160中,映射162可以使得能夠進(jìn)行基于區(qū)域的說話者112的存在確 定。映射162可以使麥克風(fēng)116(例如,麥克風(fēng)A)與位置(例如,區(qū)域A)相關(guān)聯(lián)。來自說 話者112的語音114可以由麥克風(fēng)116接收到并且可以傳送至引擎120。引擎120可以利 用映射來識別接收到語音114的麥克風(fēng)并且確定說話者位置。例如,可以經(jīng)由可以與區(qū)域 A相關(guān)聯(lián)的唯一裝置標(biāo)識符來識別麥克風(fēng)A。
[0027] 引擎120可以生成存在信息164,存在信息可以是與說話者112位置相關(guān)聯(lián)的數(shù) 據(jù)。存在信息164可以包括但不限于位置166和地圖168等。在一個示例中,信息164可 以包括傳送說話者112的有效性的狀態(tài)指示符。位置166可以是絕對位置和/或相對位 置。例如,在說話者112接近麥克風(fēng)116 (例如,麥克風(fēng)A)、但不在房間110 (例如,區(qū)域A) 內(nèi)的情況下,可以建立相對位置(例如,接近區(qū)域A)。地圖168可以是傳送說話者112在 環(huán)境105中的位置的圖形元件。例如,地圖168可以是指示說話者112在區(qū)域A(例如,房 間110)中的建筑物的平面圖。地圖168可以示出利用本公開可以追蹤的一個或多個說話 者以及適當(dāng)位置。在一個示例中,地圖168可以示出說話者的歷史位置,從而允許視覺追蹤 能力。
[0028] 在一個實施例中,本公開可以使得能夠同時進(jìn)行多個說話者的基于區(qū)域的存在確 定。在另一實施例中,本發(fā)明可以便于進(jìn)行一個或多個說話者的存在追蹤。應(yīng)當(dāng)理解,在方 案100中所述的環(huán)境105配置可以是示例性設(shè)置。本公開可以支持單個區(qū)域內(nèi)的多個麥克 風(fēng)以及各自配備有多個麥克風(fēng)的多個區(qū)域等。
[0029] 這里所呈現(xiàn)的附圖僅是為了例示的目的并且不應(yīng)構(gòu)成在任何方面對本發(fā)明的限 制。應(yīng)當(dāng)理解,只要維持了公開的功能,則階段101、130、160可以是可選的。應(yīng)當(dāng)理解,可 以將說話者身份124手動提供至引擎120。在一個示例中,與計算系統(tǒng)登錄處理互動的說話 者112可以手動輸入身份124。在該示例中,可以驗證用戶證書并且可以確定說話者身份。 應(yīng)當(dāng)理解,盡管方案100描述了基于區(qū)域的存在確定能力,但本公開不限于這方面。此外, 本公開可以擴展至提供針對多個環(huán)境105的存在確定能力。應(yīng)當(dāng)理解,引擎120可以是獨 立于文本的語音處理器,而且可以支持依賴于文本的實現(xiàn)。
[0030] 圖2是示出根據(jù)這里所公開的創(chuàng)新性布置的實施例的、經(jīng)由聲波紋位置感知的基 于區(qū)域的存在確定方法200的示意圖。可以在方案100和/或系統(tǒng)300上下文中進(jìn)行方法 200。在方法200中,可以利用麥克風(fēng)所接收到的語音以驗證說話者身份并且在環(huán)境中定位 說話者。
[0031] 在步驟205中,可以從環(huán)境中的一個或多個麥克風(fēng)接收語音。例如,會議室可以配 備有可以用來從說話者獲得語音的麥克風(fēng)的陣列。在步驟210中,可以分析該語音以確定 適當(dāng)?shù)脑捳Z。分析可以包括但不限于信號處理、語音解碼和標(biāo)準(zhǔn)化等。該分析可以產(chǎn)生可 以包括音位和單詞等的話語。話語可以是諸如詞匯等的數(shù)據(jù)模型。在步驟215中,可以選 擇聲波紋。在步驟220中,可以將話語針對所選擇的聲波紋進(jìn)行匹配并且可以生成匹配分 數(shù)。該匹配分?jǐn)?shù)可以是數(shù)值、模糊邏輯值等。例如,分?jǐn)?shù)可以是諸如百分比等的數(shù)值。在一 個實施例中,匹配分?jǐn)?shù)可以是指示發(fā)生肯定驗證的可能性的置信度值。
[0032] 在步驟225中,可以針對閾值評估分?jǐn)?shù)??梢允謩雍?或自動建立閾值。閾值可 以是數(shù)值、模糊邏輯值等。在一個示例中,閾值可以是可以允許根據(jù)評估觸發(fā)編程性動作的 規(guī)則集。在該示例中,規(guī)則集可以允許基于評估的結(jié)果來建立復(fù)雜邏輯。例如,在分?jǐn)?shù)低于 閾值的情況下,可以將指示在環(huán)境中檢測到訪客的通知傳送至管理員。在評估結(jié)果失敗的 情況下,該方法可以繼續(xù)進(jìn)入步驟230,否則進(jìn)入步驟240。在步驟230中,如果存在要匹配 的更多聲波紋,則方法可以返回至步驟215。應(yīng)當(dāng)理解,方法200可以支持針對說話者的多 個聲波紋。在一個實施例中,在重復(fù)步驟215的情況下,可以選擇與說話者身份相關(guān)聯(lián)的替 代聲波紋并且可以進(jìn)行步驟220?225。在實施例中,可以運行步驟215?225,直到所有 的聲波紋用完或發(fā)生匹配為止。
[0033] 在步驟235中,可以根據(jù)話語來生成訪客聲波紋并且可以分配訪客證書??梢允?用在方案100的聲波紋創(chuàng)建101內(nèi)所述的相似處理來生成訪客聲波紋??梢允謩雍?或自 動分配訪客證書。在步驟240中,可以確定用戶證書??梢曰谝粋€或多個規(guī)則集、設(shè)置等 來確定證書。在一個示例中,可以從認(rèn)證系統(tǒng)自動獲得證書。在步驟245中,可以利用環(huán)境 映射來建立說話者位置。在步驟250中,可以基于說話者位置來可選地進(jìn)行資源權(quán)限評定。 在一個示例中,方法200可以是基于存在的安全系統(tǒng)的處理。在一個示例中,在確定說話者 位置的情況下,可以制定安全行動(例如,授權(quán)對資源的訪問)。例如,在說話者接近與安全 區(qū)域相關(guān)聯(lián)的鎖定的門的情況下,可以利用方法200來自動解鎖該門。在步驟225中,該方 法可以結(jié)束。
[0034] 這里所呈現(xiàn)的附圖僅是為了例示的目的并且不應(yīng)構(gòu)成在任何方面對本發(fā)明的限 制??梢詫崟r或接近實時地進(jìn)行方法200??梢源泻?或并行進(jìn)行方法200內(nèi)的步驟 205?255。一個或多個步驟205?255可以是可選的,只要允許保持方法200的功能。
[0035] 圖3是示出根據(jù)這里所公開的創(chuàng)造性布置的實施例的、用于經(jīng)由聲波紋位置感知 來進(jìn)行基于區(qū)域的存在確定的系統(tǒng)300的示意圖??梢栽诜桨?00和/或方法200上下文 中執(zhí)行系統(tǒng)300。在系統(tǒng)300中,語音引擎320可以允許經(jīng)由語音368來進(jìn)行對說話者366 的實時說話者存在確定。例如,隨著說話者366在區(qū)域362和/或環(huán)境360內(nèi)移動,引擎 320可以利用語音368來快速確定說話者位置。系統(tǒng)300的組件310、350和360可以經(jīng)由 網(wǎng)絡(luò)380通信鏈接。應(yīng)當(dāng)理解,系統(tǒng)300可以有利于統(tǒng)一通信協(xié)作,從而允許從系統(tǒng)300觸 發(fā)傳統(tǒng)和/或?qū)S械慕y(tǒng)一通信行為。例如,基于根據(jù)語音368的說話者366存在確定,可以 將電話呼叫自動轉(zhuǎn)發(fā)至接近說話者366的電話。
[0036] 在一個實施例中,系統(tǒng)300可以是用于在現(xiàn)有的計算設(shè)施中進(jìn)行存在確定的"插 入"解決方案。例如,引擎320可以是存在服務(wù)器應(yīng)用的插件組件。在另一實施例中,系統(tǒng) 300可被配置為與現(xiàn)有存在系統(tǒng)一體化已增強和/或擴展存在系統(tǒng)功能。
[0037] 存在服務(wù)器310可以是能夠接受、存儲和/或分發(fā)存在信息(例如,存在信息343) 的硬件/軟件元件。服務(wù)器310可以包括但不限于語音引擎320、映射330、聲波紋332、數(shù) 據(jù)存儲器340和界面344等。服務(wù)器310可以與存在體、觀察者和服務(wù)等進(jìn)行通信。在一個 實施例中,服務(wù)器310可以是統(tǒng)一通信系統(tǒng)的組件。在該實施例中,服務(wù)器310可以是IBM LOTUS SAMEHME 服務(wù)器。
[0038] 語音引擎320可以是能夠接收語音368、識別說話者366、驗證說話者366和/或 確定說話者366位置的硬件/軟件實體。引擎320可以包括但不限于話語處理器322、驗 證引擎324、定位器326和設(shè)置328等。引擎320可以是聯(lián)網(wǎng)的計算元件、分布式計算元件 等。在一個示例中,引擎320的功能可以是Web服務(wù)的一部分。在另一示例中,引擎320的 功能可以是應(yīng)用編程接口(API)的能力。
[0039] 話語處理器322可以是被配置為處理語音368的硬件/軟件組件。處理器322的 功能可以包括但不限于聲音識別、語音識別、語音編碼、語音記錄、語音重放和標(biāo)準(zhǔn)化(例 如,倒頻譜標(biāo)準(zhǔn)化法)等。處理器322可以包括一個或多個基于統(tǒng)計的語音識別算法。例 如,處理器322可以利用聲學(xué)建模和/或語言建模來處理語音368。應(yīng)當(dāng)理解,處理器322 可以包括傳統(tǒng)和/或?qū)S械恼Z音識別技術(shù)。在一個示例中,可以利用處理器322來創(chuàng)建聲 波紋332。在該示例中,處理器322可以利用傳統(tǒng)和/或?qū)S械募夹g(shù)來處理和/或存儲聲波 紋332。技術(shù)可以包括但不限于頻率估計、隱馬爾可夫模型(HMM)、高斯混合模型、模式匹配 算法、神經(jīng)網(wǎng)絡(luò)、矩陣表示、矢量量化和決策樹等。應(yīng)當(dāng)理解,處理器322可以利用包括但不 限于競爭者模型和世界模型等的"反說話者"技術(shù)。
[0040] 驗證引擎324可以是用于識別和/或驗證說話者366的硬件/軟件元件。引擎 324的功能可以包括目錄服務(wù)350通信、證書354驗證和說話者識別等。引擎324可以進(jìn)行 包括但不限于模板匹配和規(guī)則集評估等的驗證動作。驗證引擎324可以進(jìn)行包括但不限于 目錄352創(chuàng)建(例如,訪客目錄)和證書354創(chuàng)建(例如,登記)等的目錄服務(wù)350輔助動 作。
[0041] 定位器326可以是被配置為基于語音368來進(jìn)行說話者366的存在確定的硬件/ 軟件組件。定位器326的功能可以包括但不限于存在確定、存在追蹤和存在信息分發(fā)等。定 位器326可以用于創(chuàng)建和/或管理表342。定位器326可以響應(yīng)于確定說話者366的位置 已改變來更新表342。在一個示例中,定位器326可以是語音引擎320的可選組件。在該示 例中,定位器326可以是通信鏈接至引擎320的外部存在組件(例如,統(tǒng)一通信存在引擎)。
[0042] 設(shè)置328可以是用于建立系統(tǒng)300和/或服務(wù)器310的行為的一個或多個配置選 項。設(shè)置328可以包括但不限于話語處理器322選項、身份引擎324設(shè)置和定位器326選 項等。可以手動和/或自動配置設(shè)置328。在一個示例中,可以根據(jù)通信鏈接的存在系統(tǒng)來 試探性確定設(shè)置328。在一個示例中,設(shè)置328可以存在于界面344內(nèi)。在該示例中,可以 利用傳統(tǒng)和/或?qū)S玫慕缑鏅C制來管理和/或配置設(shè)置328。
[0043] 映射330可以是將傳感器364(例如,麥克風(fēng))鏈接至環(huán)境360中的區(qū)域362的數(shù) 據(jù)集。可以手動和/或自動建立映射330。在發(fā)生對環(huán)境360、區(qū)域362和/或傳感器364 的改變時,可以動態(tài)地更新映射330。在一個示例中,可以經(jīng)由一個或多個用戶界面來管理 映射330。
[0044] 可以將聲波紋332存儲在服務(wù)器310、引擎320和數(shù)據(jù)存儲器340等中。在一個實 施例中,聲波紋332可使得能夠?qū)崿F(xiàn)多語言支持。在本實施例中,聲波紋332可以包括針對 單個說話者的多語言聲波紋。應(yīng)當(dāng)理解,可以使聲波紋332與一個或多個安全機制相關(guān)聯(lián)。 可以使聲波紋332與說話者特性相關(guān)聯(lián)。
[0045] 數(shù)據(jù)存儲器340可以是能夠保存追蹤表342、映射330、聲波紋332和地圖346等 的硬件/軟件組件。數(shù)據(jù)存儲器340可以是存儲區(qū)域網(wǎng)絡(luò)(SAN)和網(wǎng)絡(luò)附屬存儲(NAS) 等。數(shù)據(jù)存儲器340可以符合關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(RDBMS)和面向?qū)ο髷?shù)據(jù)庫管理系統(tǒng) (OODBMS)等。數(shù)據(jù)存儲器340可以通信地鏈接至一個或多個傳統(tǒng)和/或者專用機制中的 服務(wù)器310。在一個示例中,數(shù)據(jù)庫340可以是結(jié)構(gòu)化查詢語言(SQL)投訴數(shù)據(jù)庫的組件。 在另一示例中,數(shù)據(jù)庫340可以是語音數(shù)據(jù)庫的一部分。
[0046] 追蹤表342可以是用于使得能夠進(jìn)行針對一個或多個說話者366的存在記錄的數(shù) 據(jù)集。表342可以包括但不限于存在信息343、聲波紋信息和證書等。在一個示例中,系統(tǒng) 300可以使得能夠經(jīng)由可以包括與一個或多個說話者366有關(guān)的存在信息的追蹤表342進(jìn) 行存在追蹤。在另一示例中,追蹤表342可以采用說話者366的歷史位置以預(yù)測后續(xù)的說 話者366的位置。應(yīng)當(dāng)理解,表342僅是為了例示的目的而呈現(xiàn)的,并且不應(yīng)構(gòu)成在任何方 面對本發(fā)明的限制。
[0047] 存在信息343可以包括位置信息、定時信息(例如,日期/時間)和環(huán)境地圖等。 可以將存在信息343傳送至系統(tǒng)300內(nèi)的一個或多個組件。在一個不例中,可以將信息343 傳送至統(tǒng)一通信系統(tǒng)的組件。在該示例中,可以將信息343傳遞至存在感知應(yīng)用(例如,即 時通信(Instant Messenger)、會議應(yīng)用等)。
[0048] 界面344可以是允許地圖346的互動和/或呈現(xiàn)的用戶互動組件。界面344可以 在Web瀏覽器應(yīng)用、桌面應(yīng)用程序等的上下文內(nèi)呈現(xiàn)。在一個實施例中,界面344可以是IBM LOTUS SAMEHME應(yīng)用的畫面。界面344的功能可以包括圖形用戶界面(⑶I)、語音用戶界 面(VUI)和混合模式界面等。在一個示例中,界面344可以通信地連接至計算裝置(例如, 客戶端裝置)。
[0049] 地圖346可以是用于向說話者366呈現(xiàn)存在信息的數(shù)據(jù)集。在一個實施例中,可 以根據(jù)請求來動態(tài)地生成地圖346。在另一示例中,地圖346可以是持久性的并且可以在系 統(tǒng)300的運行時持續(xù)更新。在一個實施例中,地圖346可以是允許與同說話者相關(guān)聯(lián)的存 在信息進(jìn)行互動的圖形化互動地圖。
[0050] 目錄服務(wù)器350可以是用于存儲、組織和提供對用戶目錄352內(nèi)的信息的訪問的 硬件/軟件組件。服務(wù)器350可以包括傳統(tǒng)和/或?qū)S械膶崿F(xiàn)。在一個示例中,服務(wù)器350 可以是IBM LOTUS DOMINO服務(wù)器。服務(wù)器350可以包括但不限于用戶目錄352、服務(wù)器350 設(shè)置等。用戶目錄352可以是用于進(jìn)行用戶(例如,說話者366)的認(rèn)證和授權(quán)的數(shù)據(jù)集。 目錄352可以包括但不限于證書354、訪問許可等。證書354可以與用戶配置文件和用戶數(shù) 據(jù)等相關(guān)聯(lián)。
[0051] 傳感器364可以是能夠檢測附近的來自說話者366的語音368的裝置。例如,傳 感器364可以是聲電轉(zhuǎn)換器。傳感器364可以是動態(tài)麥克風(fēng)、壓電麥克風(fēng)和光纖麥克風(fēng)等。 應(yīng)當(dāng)理解,傳感器364可以是有線裝置和/或無線裝置。傳感器364可以包括但不限于固 定傳感器和可動傳感器等。
[0052] 網(wǎng)絡(luò)380可以是連接一個或多個系統(tǒng)300組件的電氣和/或計算機網(wǎng)絡(luò)。網(wǎng)絡(luò)380 可以包括但不限于雙絞線、光纖和同軸電纜等。網(wǎng)絡(luò)380可以包括有線和/或無線組件的 任何組合。網(wǎng)絡(luò)380的拓?fù)淇梢园ǖ幌抻诳偩€、星形和網(wǎng)狀等。網(wǎng)絡(luò)380的類型可以 包括但不限于局域網(wǎng)(LAN)、廣域網(wǎng)(WAN)和VPN等。網(wǎng)絡(luò)380可以包括但不限于因特網(wǎng)、 內(nèi)聯(lián)網(wǎng)和外聯(lián)網(wǎng)等。
[0053] 在一個實施例中,系統(tǒng)300可以調(diào)整各成功驗證之后的聲波紋(例如,說話者模 型)以捕獲說話者的聲音的長期變化。例如,說話者366的聲音可以由于可能影響語音368 的變老而改變。
[0054] 這里所呈現(xiàn)的附圖僅是為了例示目的并且不應(yīng)構(gòu)成在任何方面對本發(fā)明的限制。 系統(tǒng)300可以采用傳統(tǒng)和/或?qū)S械募夹g(shù)。系統(tǒng)300可以利用傳統(tǒng)和/或?qū)S械膮f(xié)議。這 些協(xié)議可以包括但不限于超文本傳輸協(xié)議(HTTP)、傳輸控制協(xié)議(TCP)、因特網(wǎng)協(xié)議(IP)、 輕量級目錄訪問協(xié)議(LDAP)、實時傳輸協(xié)議(RTP)和可擴展消息處理現(xiàn)場協(xié)議(XMPP)等。 系統(tǒng)300可以符合聯(lián)網(wǎng)計算環(huán)境、分布式計算環(huán)境和云計算環(huán)境等。在一個示例中,系統(tǒng) 300的架構(gòu)可以是服務(wù)導(dǎo)向架構(gòu)。
[0055] 應(yīng)當(dāng)理解,系統(tǒng)300的實現(xiàn)細(xì)節(jié)可以基于部署要求和/或限制而改變。例如,系統(tǒng) 300可以用于洲和/或國家公共安全、安全相關(guān)的懲教設(shè)施、自動考勤監(jiān)控、協(xié)助調(diào)查(例 如,確認(rèn)托辭)和執(zhí)法活動(例如,定位肇事者)等。
[0056] 圖1-3中的流程圖和框圖顯示了根據(jù)本發(fā)明的多個實施例的系統(tǒng)、方法和計算機 程序產(chǎn)品的可能實現(xiàn)的體系架構(gòu)、功能和操作。在這點上,流程圖或框圖中的每個方框可以 代表一個模塊、程序段或代碼的一部分,所述模塊、程序段或代碼的一部分包含一個或多個 用于實現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實現(xiàn)中,方框中所 標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個連續(xù)的方框?qū)嶋H上可以 基本并行地執(zhí)行,它們有時也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的 是,框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行 規(guī)定的功能或動作的專用的基于硬件的系統(tǒng)來實現(xiàn),或者可以用專用硬件與計算機指令的 組合來實現(xiàn)。
【權(quán)利要求】
1. 一種基于聲波紋的位置感知方法,包括: 從接近環(huán)境中的多個麥克風(fēng)中的至少一個麥克風(fēng)的說話者接收語音; 處理所述語音以產(chǎn)生用以確定所述說話者的身份的話語,其中所述說話者的身份與聲 波紋相關(guān)聯(lián),其中所述身份與計算系統(tǒng)的用戶證書相關(guān)聯(lián),其中所述用戶證書唯一識別所 述計算系統(tǒng)中的用戶; 分析所述話語以建立所述說話者存在的區(qū)域,其中所述區(qū)域是所述環(huán)境中的有界區(qū) 域;以及 將所述區(qū)域在所述環(huán)境中進(jìn)行映射以確定所述說話者的位置。
2. 根據(jù)權(quán)利要求1所述的方法,其中,所述多個麥克風(fēng)是定向麥克風(fēng)和全向麥克風(fēng)中 的至少一種,其中所述說話者是被授權(quán)訪問所述計算系統(tǒng)的人,其中所述計算系統(tǒng)被雇傭 所述人的實體所擁有,其中所述位置是相對位置和絕對位置中的至少一個。
3. 根據(jù)權(quán)利要求1所述的方法,其中,所述分析包括至少一個三角測量計算,所述三角 測量計算部分基于由所述環(huán)境中的所述語音或環(huán)境噪聲產(chǎn)生的所述有界區(qū)域特有的聲學(xué) 回聲來確定用戶位置。
4. 根據(jù)權(quán)利要求1所述的方法,還包括: 識別聲波紋數(shù)據(jù)庫,其中所述聲波紋數(shù)據(jù)庫包括與說話者相關(guān)聯(lián)的至少一個聲波紋; 以及 使所述說話者的話語與所述聲波紋數(shù)據(jù)庫中的聲波紋相匹配。
5. 根據(jù)權(quán)利要求4所述的方法,其中,在所述匹配無法使所述說話者的話語匹配至所 述聲波紋數(shù)據(jù)庫內(nèi)的聲波紋的情況下,將所述說話者身份建立為所述區(qū)域的訪客,其中由 擁有或租借所述有界區(qū)域的實體授權(quán)在所述區(qū)域內(nèi)的多個人各自存儲用戶特有聲波紋。
6. 根據(jù)權(quán)利要求1所述的方法,還包括: 從與所述說話者身份相關(guān)聯(lián)的計算裝置接收聲波紋,其中所述說話者身份與所述計算 系統(tǒng)的用戶相關(guān)聯(lián); 將所述聲波紋和說話者身份存儲在聲波紋數(shù)據(jù)庫內(nèi); 隨后基于與所述用戶相關(guān)聯(lián)的語音話語來確定所述說話者的身份,其中所述確定使說 話者的身份與所述聲波紋數(shù)據(jù)庫內(nèi)的聲波紋相匹配;以及 經(jīng)由所述語音話語來建立所述說話者的位置。
7. 根據(jù)權(quán)利要求1所述的方法,還包括: 基于隨后的話語來在所述環(huán)境中連續(xù)追蹤與所述說話者相關(guān)聯(lián)的多個位置,其中所述 多個位置是所述環(huán)境中的多個區(qū)域。
8. 根據(jù)權(quán)利要求7所述的方法,還包括: 評估與所述說話者相關(guān)聯(lián)的所述多個位置;以及 基于所述評估來預(yù)測與所述說話者相關(guān)聯(lián)的后續(xù)位置。
9. 根據(jù)權(quán)利要求1所述的方法,其中,所述區(qū)域是房間、建筑物和地理有界區(qū)域中的至 少一個。
10. 根據(jù)權(quán)利要求1所述的方法,使用配備有GPS的裝置來確定地理區(qū)域,其中使用基 于所述聲波紋的針對所述說話者的區(qū)域的映射來補充GPS信號由于無線電頻率干擾而不 可靠的封閉環(huán)境的存在數(shù)據(jù)。
11. 一種基于聲波紋的位置感知系統(tǒng),包括: 語音引擎,被配置為基于所接收到的語音話語來確定說話者在環(huán)境中的位置,其中所 述話語是從接近所述說話者的多個麥克風(fēng)接收到的,其中所述位置是所述環(huán)境中的多個區(qū) 域中的至少一個,其中所述話語與聲波紋相匹配,其中所述聲波紋與說話者身份相關(guān)聯(lián);以 及 數(shù)據(jù)存儲器,其能夠保存與說話者身份相關(guān)聯(lián)的至少一個聲波紋以及映射,其中所述 說話者身份與計算系統(tǒng)的用戶證書相關(guān)聯(lián),其中所述映射使所述多個區(qū)域中的至少一個與 所述環(huán)境相關(guān)聯(lián)。
12. 根據(jù)權(quán)利要求11所述的系統(tǒng),還包括: 話語處理器,其能夠確定與所述環(huán)境中的說話者相關(guān)聯(lián)的話語; 驗證引擎,被配置為基于所述話語來建立所述說話者的身份,其中所述說話者的身份 與聲波紋相關(guān)聯(lián),其中針對所述話語來匹配所述聲波紋;以及 定位器,其能夠識別所述環(huán)境中的所述說話者存在的區(qū)域。
13. 根據(jù)權(quán)利要求11所述的系統(tǒng),其中,所述多個麥克風(fēng)中的每一個與所述環(huán)境中的 所述多個區(qū)域中的每一個相關(guān)聯(lián),其中所述多個麥克風(fēng)是定向麥克風(fēng)和全向麥克風(fēng)中的至 少一種。
14. 根據(jù)權(quán)利要求11所述的系統(tǒng),其中,所述多個區(qū)域中的至少一個是房間、建筑物和 地理有界區(qū)域中的至少一個。
15. 根據(jù)權(quán)利要求11所述的系統(tǒng),其中,所述位置是全球定位系統(tǒng)(GPS)位置和與笛卡 爾坐標(biāo)系相關(guān)聯(lián)的位置中的至少一個。
16. 根據(jù)權(quán)利要求11所述的系統(tǒng),其中,所述定位器被配置為基于多個標(biāo)準(zhǔn)來預(yù)測所 述說話者的位置,其中所述多個標(biāo)準(zhǔn)是多個歷史位置、日期、和時間中的至少一個。
17. 根據(jù)權(quán)利要求11所述的系統(tǒng),還包括: 認(rèn)證組件,其能夠響應(yīng)于確定所述說話者的位置來許可或拒絕對資源的訪問,其中所 述組件與訪問控制系統(tǒng)相關(guān)聯(lián),其中所述訪問控制系統(tǒng)與所述環(huán)境相關(guān)聯(lián)。
18. 根據(jù)權(quán)利要求11所述的系統(tǒng),其中,所述語音引擎被配置為根據(jù)話語自動生成說 話者的聲波紋,其中所述語音引擎能夠使所述聲波紋與說話者身份相匹配,其中所述說話 者身份與和計算系統(tǒng)相關(guān)聯(lián)的用戶證書相關(guān)聯(lián)。
19. 根據(jù)權(quán)利要求11所述的系統(tǒng),其中,在語音引擎無法將所述聲波紋匹配至現(xiàn)有的 用戶身份的情況下,以編程方式將臨時的用戶身份分配至所述聲波紋。
20. -種計算機程序產(chǎn)品,包括其中嵌入有計算機可用程序代碼的計算機可讀存儲介 質(zhì),所述計算機可用程序代碼包括: 存儲在存儲介質(zhì)中的計算機可用程序代碼,在利用處理器來運行所述計算機可用程序 代碼的情況下,所述計算機可用程序代碼可操作以從接近環(huán)境中的多個麥克風(fēng)中的至少一 個的說話者接收話語,其中所述多個麥克風(fēng)是定向麥克風(fēng)和全向麥克風(fēng)中的至少一種,所 述說話者是人員; 存儲在存儲介質(zhì)中的計算機可用程序代碼,在利用處理器來運行所述計算機可用程序 代碼的情況下,所述計算機可用程序代碼可操作以處理所述語音以產(chǎn)生用以確定所述說話 者的身份的話語,其中所述說話者的身份與聲波紋相關(guān)聯(lián),所述身份與計算系統(tǒng)的用戶證 書相關(guān)聯(lián),所述用戶證書唯一識別所述計算系統(tǒng)內(nèi)的用戶; 存儲在存儲介質(zhì)中的計算機可用程序代碼,在利用處理器來運行所述計算機可用程序 代碼的情況下,所述計算機可用程序代碼可操作以分析所述話語以建立所述說話者存在的 區(qū)域,其中所述區(qū)域是所述環(huán)境中的有界區(qū)域;以及 存儲在存儲介質(zhì)中的計算機可用程序代碼,在利用處理器來運行所述計算機可用程序 代碼的情況下,所述計算機可用程序代碼可操作以將所述區(qū)域在所述環(huán)境中進(jìn)行映射以確 定所述說話者的位置,其中所述位置是相對位置和絕對位置中的至少一個。
21. 根據(jù)權(quán)利要求20所述的計算機程序產(chǎn)品,還包括: 存儲在存儲介質(zhì)中的計算機可用程序代碼,在利用處理器來運行所述計算機可用程序 代碼的情況下,所述計算機可用程序代碼可操作以從與所述說話者身份相關(guān)聯(lián)的計算裝置 接收聲波紋,其中所述說話者身份與計算系統(tǒng)的用戶相關(guān)聯(lián); 存儲在存儲介質(zhì)中的計算機可用程序代碼,在利用處理器來運行所述計算機可用程序 代碼的情況下,所述計算機可用程序代碼可操作以將所述聲波紋和說話者身份存儲在聲波 紋數(shù)據(jù)庫內(nèi); 存儲在存儲介質(zhì)中的計算機可用程序代碼,在利用處理器來運行所述計算機可用程序 代碼的情況下,所述計算機可用程序代碼可操作以隨后基于與所述用戶相關(guān)聯(lián)的語音話語 來確定所述說話者的身份,其中所述確定使所述說話者的身份與所述聲波紋數(shù)據(jù)庫內(nèi)的聲 波紋相匹配;以及 存儲在存儲介質(zhì)中的計算機可用程序代碼,在利用處理器來運行所述計算機可用程序 代碼的情況下,所述計算機可用程序代碼可操作以經(jīng)由所述語音話語來建立所述說話者的 位置。
22. -種計算機系統(tǒng),包括: 一個或多個處理器、一個或多個計算機可讀存儲器以及一個或多個計算機可讀的有形 存儲裝置; 程序指令,其存儲在所述一個或多個存儲裝置中的至少一個上,用于經(jīng)由所述一個或 多個存儲器中的至少一個利用一個或多個處理器中的至少一個進(jìn)行處理,以從接近環(huán)境中 的多個麥克風(fēng)中的至少一個的說話者接收語音; 程序指令,其存儲在所述一個或多個存儲裝置中的至少一個上,用于經(jīng)由所述一個或 多個存儲器中的至少一個利用一個或多個處理器中的至少一個進(jìn)行處理,以處理所述語音 以產(chǎn)生用以確定所述說話者的身份的話語,其中所述說話者的身份與聲波紋相關(guān)聯(lián),所述 身份與計算系統(tǒng)的用戶證書相關(guān)聯(lián),其中所述用戶證書唯一識別所述計算系統(tǒng)內(nèi)的用戶; 程序指令,其存儲在所述一個或多個存儲裝置中的至少一個上,用于經(jīng)由所述一個或 多個存儲器中的至少一個利用一個或多個處理器中的至少一個進(jìn)行處理,以分析所述話語 以建立所述說話者存在的區(qū)域,其中所述區(qū)域是所述環(huán)境中的有界區(qū)域;以及 程序指令,其存儲在所述一個或多個存儲裝置中的至少一個上,用于經(jīng)由所述一個或 多個存儲器中的至少一個利用一個或多個處理器中的至少一個進(jìn)行處理,以將所述區(qū)域在 所述環(huán)境中進(jìn)行映射以確定所述說話者的位置。
23. 根據(jù)權(quán)利要求22所述的系統(tǒng),其中,所述環(huán)境中的麥克風(fēng)是不與所述說話者能夠 攜帶的移動裝置相關(guān)聯(lián)的靜止麥克風(fēng)。
24. 根據(jù)權(quán)利要求22所述的系統(tǒng),還包括: 語音處理系統(tǒng)的語音引擎,被配置為確定說話者在所述環(huán)境中的位置;以及 數(shù)據(jù)存儲器,用于保存用于確定所述說話者的身份的至少一個聲波紋。
25. -種計算機程序產(chǎn)品,包括: 一個或多個計算機可讀的有形存儲裝置; 程序指令,其存儲在所述一個或多個存儲裝置中的至少一個上,以從接近環(huán)境中的多 個麥克風(fēng)中的至少一個的說話者接收語音; 程序指令,其存儲在所述一個或多個存儲裝置中的至少一個上,以處理所述語音以產(chǎn) 生用以確定所述說話者的身份的話語,其中所述說話者的身份與聲波紋相關(guān)聯(lián),其中所述 身份與計算系統(tǒng)的用戶證書相關(guān)聯(lián),其中所述用戶證書唯一識別所述計算系統(tǒng)內(nèi)的用戶, 其中通過以下來確定所述身份: I) 識別聲波紋數(shù)據(jù)庫,其中所述聲波紋數(shù)據(jù)庫包括與說話者相關(guān)聯(lián)的至少一個聲波 紋; II) 使所述說話者的話語與所述聲波紋數(shù)據(jù)庫內(nèi)的聲波紋相匹配,其中在所述匹配無 法使所述說話者的話語匹配至所述聲波紋數(shù)據(jù)庫內(nèi)的聲波紋的情況下,將所述說話者身份 建立為所述區(qū)域的訪客; 程序指令,其存儲在所述一個或多個存儲裝置中的至少一個上,以分析所述話語以建 立所述說話者存在的區(qū)域,其中所述區(qū)域是所述環(huán)境中的有界區(qū)域;以及 程序指令,其存儲在所述一個或多個存儲裝置中的至少一個上,以將所述區(qū)域在所述 環(huán)境中進(jìn)行映射以確定所述說話者的位置。
【文檔編號】G10L17/00GK104094132SQ201380007184
【公開日】2014年10月8日 申請日期:2013年1月30日 優(yōu)先權(quán)日:2012年1月30日
【發(fā)明者】S·德拉弗恩塔, G·S·瓊斯, J·S·潘內(nèi)爾 申請人:國際商業(yè)機器公司