防止音頻信息的非預期分發(fā)的方法和系統的制作方法

文檔序號：6543729閱讀：131來源：國知局

防止音頻信息的非預期分發(fā)的方法和系統的制作方法
【專利摘要】本發(fā)明涉及一種防止音頻信息的非預期分發(fā)的方法和系統。防止音頻信息的非預期分發(fā)可以包括：分析麥克風所接收的說話者的語音的音頻數據；由處理器根據所述分析自動判定是否旨在經由所述麥克風將所述說話者的語音分發(fā)給聽眾；以及響應于判定并未旨在經由所述麥克風將所述說話者的語音分發(fā)給所述聽眾，執(zhí)行一個或多個操作。
【專利說明】防止音頻信息的非預期分發(fā)的方法和系統

【技術領域】
[0001] 本申請一般地涉及例如與多媒體系統有關的計算機、計算機設備和應用，更具體地說，涉及防止通過麥克風的未知分發(fā)。

【背景技術】
[0002] 在公共場景中，揚聲器設備通常與麥克風連接，以便放大其語音以在一大群人或大的活動場所中傳輸或分發(fā)。麥克風可以手持、放在講臺上，或者佩帶在衣領上。具有許多已知的情況，其中說話者忘記他們具有放大其語音的麥克風，并且繼續(xù)公開進行私下談話，其中他們的語音繼續(xù)被放大給更廣泛的聽眾。在其它情況下，使用麥克風的最初說話者不再出現，而不知道放大系統的其它說話者來到麥克風處于活動狀態(tài)的講臺或場所。他們可能進行"私下"談話，這些談話無意中被放大給更多的聽眾。這導致可能令人尷尬的處境。所有類型的麥克風以及所有類型的會議(演講或公開演講）都可以出現這些問題。
[0003] 許多會議電話系統和揚聲器電話具有以下能力：定期通報系統在一段延長時間內處于使用中，并且要求用戶通過按下按鈕確認他們繼續(xù)需要使會議電話"公開"。這僅部分有效。第一，它僅在某些時間間隔內發(fā)生，并且在中間時間內，房間中可能具有非預期參與者。例如，設置會議電話的人們可能結束會議，但留在會議室而未正式斷開會議電話。新的一組人可能進入會議室并且可能講話而不知道會議電話"開啟"，并且他們的"離題內容"被傳輸或分發(fā)給可能仍然繼續(xù)會議電話的其它人。第二，在某些情況下，呼叫者無法輕松通過按鍵確認他對繼續(xù)會議電話感興趣還是不感興趣；例如，如果呼叫者雙手忙碌(例如駕駛)。第三，在說話者對繼續(xù)會議電話感興趣的情況下，詢問按下按鈕以繼續(xù)會議電話可以造成打擾和干擾。
[0004] 現有系統可以提供會議電話處于活動狀態(tài)的可視指示，例如通過顯示綠燈?，F有系統還可以同樣為麥克風提供可視指示，例如使用指示麥克風"處于活動狀態(tài)"的紅燈。但是，用戶忽略的這些信號的頻率表明現有解決方案沒有成功為說話者提供他們需要的提 /_J、1 〇

【發(fā)明內容】

[0005] 在一個方面，一種防止音頻信息的非預期分發(fā)的方法可以包括分析麥克風所接收的說話者的語音的音頻數據。所述方法還可以包括根據所述分析自動判定是否旨在經由所述麥克風將所述說話者的語音分發(fā)給聽眾。所述方法可以還包括響應于判定并未旨在經由所述麥克風將所述說話者的語音分發(fā)給所述聽眾，執(zhí)行一個或多個操作。
[0006] 在一個方面，一種用于防止音頻信息的非預期分發(fā)的系統可以包括麥克風和處理器，所述處理器可操作以分析所述麥克風所接收的說話者的語音的音頻數據。所述處理器還可操作以自動判定是否旨在經由所述麥克風將所述說話者的語音分發(fā)給聽眾，以及響應于判定并未旨在經由所述麥克風將所述說話者的語音分發(fā)給所述聽眾，所述處理器還可操作以執(zhí)行一個或多個操作。
[0007] 還可以提供一種存儲指令程序的計算機可讀存儲介質，所述指令程序可由機器執(zhí) 行以便執(zhí)行在此描述的一個或多個方法。
[0008] 下面參考附圖詳細描述不同實施例的進一步特性以及結構和操作。在附圖中，相同的參考標號指示相同或功能類似的元素。

【專利附圖】

【附圖說明】
[0009] 圖1是示出本公開的一個實施例中的系統組件的示意圖；
[0010] 圖2示出本公開的一個實施例中的一種用于防止麥克風的非預期使用的方法；
[0011] 圖3示出本公開的一個實施例中的可以實現智能麥克風系統的一個實例計算機或處理系統的示意圖。

【具體實施方式】
[0012] 在本公開的一個實施例中，可以提供一種系統和方法，其可以防止渾然不知的說話者進行不需要的語音分發(fā)或傳輸。例如，基于例如說話者周圍環(huán)境中的一個或多個條件，可以使麥克風靜音，可以向說話者通知麥克風仍然開啟或者說話者的言論被放大。
[0013] 作為一個實例，說話者可能忘記麥克風開啟并且開始進行私下談話，說話者并未認識到這種私下談話被分發(fā)或傳輸給非定向聽眾。在這些情況下，已知系統都不能自動靜音或者向說話者提醒這些情況。所述系統和方法可以提供多個方面，用于分析有關說話者語音的質量以便判定說話者有意還是無意對著麥克風講話。要檢測的質量可以包括（1)語音諧波(語音質量)，（2 )語音內容(話題變化)，和/或（3 )語音方式(例如，語音中的嗯、哼和嗯啊)。
[0014] 圖1是示出本公開的一個實施例中的系統的組件的示意圖。在一個實施例中，可以提供智能麥克風102,其能夠處理周圍音頻和視頻信息以便理解說話者的意圖以及說話者語音的可能聽眾，然后提供說話者的更有效反饋以便防止他/她/他們無意中使用麥克風或者對著揚聲器電話或會議電話講話。本公開的智能麥克風102可以包括集成電路或硬件處理器104,其被編程以便執(zhí)行在此描述的方法以判定語音是否旨在進入麥克風102。智能麥克風102還可以包括存儲器106,以便例如存儲數據。在另一個方面，智能麥克風102 還可以包括攝像機108和/或一個或多個其它傳感器110。
[0015] 在本公開中提供多種方法，以便例如在會議電話設備或其它類似設備上，使用音頻和/或其它信息檢測說話者并未旨在對著麥克風講話或者通過麥克風分發(fā)。例如，可以檢測說話者音量變化，并且將這種變化用作說話者并未旨在分發(fā)語音的準則。例如，當說話者旨在使其語音成為私下談話時，他們可能以較低語音或者甚至耳語講話。作為另一個實例，可以檢測語音諧波變化，并且將這種變化用作說話者并未旨在分發(fā)語音的指示。例如，當某個人以"公共"語音與私下方式講話時，存在語音質量差異。作為另一個實例，可以檢測個人的語音內容變化，并且將這種變化用作個人并未旨在分發(fā)語音的指示。例如，企業(yè)員工談論公司的策略，并且當他轉向某人"私下"講話時突然改變話題。然而，可以檢測講話方式(例如頻率）的變化。例如，某些說話者當眾說話時可能不流利，使用諸如"哼"和"嗯" 之類的贅詞。當說話者更放松并且私下即興講話時，這些贅詞會消失。當公眾說話者可以推敲和排練并且講話流利時，還可以出現相反的情況。當說話者"脫稿"時，說話者可以具有更多的喚詞困難和贅詞?？梢詸z測語音中這些贅詞的出現，并且在上下文中與其它因素一起使用以便判定是否旨在分發(fā)語音。例如，在較安靜的語音中出現的贅詞可以指示私下談話；在更正式的語音方式和更響亮的語音中檢測的贅詞可以指示旨在分發(fā)語音。
[0016] 例如可以使用攝像機(例如，108)提取可視信息以便評估說話者的環(huán)境是否改變，以及因此他/她是否可能并未旨在對著更多聽眾講話。此類可視信息的實例可以包括但不限于檢測說話者和麥克風之間的距離變化(有時，如果說話者打算私下講話，則他遠離麥克風）；檢測位置變化(例如，具有衣領麥克風的說話者移動到另一個房間）；檢測環(huán)境變化，例如聽眾席中的人們離開，或者新的人們(例如，家庭成員）進入說話者所在的房間；總裁起先在講臺上，現在總裁伏在桌上。
[0017] 還可以通過一個或多個其它傳感器110提取信息。例如，可以使用運動傳感器或紅外線檢測說話者與麥克風的距離或者他們的位置。
[0018] 例如可以在說話者的麥克風上向說話者提供反饋，例如采用以下方式：可視信號 (例如，強)，例如閃光燈；觸覺信號，例如揚聲器振動；音頻信號，例如嗶嗶聲；其它音頻信號，例如當用戶講話時，揚聲器以撫靜音頻或不同諧波回聲，以便他們學習從音頻反饋"感覺"他們的麥克風開啟（例如，采用某些打字員通過聲音了解他們是否點擊正確鍵的方式）；自動使麥克風靜音和/或要求說話者確認說話者旨在繼續(xù)放大其語音。
[0019] 可以經由語音識別和自然語言理解提供反饋。例如，可以使用語音識別和自然語言理解來理解語音內容?？梢酝ㄟ^語音識別轉寫正在被放大的語音。轉寫語音的連續(xù)顯示可以向說話者提示麥克風開啟。
[0020] 其它非語音信息可以提供麥克風或會議電話應該關閉的提示。例如，日歷信息可以指示給定語音或會議電話計劃在特定時間結束，并且可以是向說話者提示他們是否需要繼續(xù)分發(fā)其語音的信號。
[0021] 用于檢測何時應該關閉麥克風或者是否應該用信號通知用戶麥克風/會議電話仍然處于活動狀態(tài)的所有所述方法可以集成，并且用于增加系統正確解釋情況的置信度得分。
[0022] 圖2示出本公開的一個實施例中的一種用于防止音頻信息的非預期分發(fā)的方法。在202,分析麥克風附近的說話者的語音。例如，在放大和/或分發(fā)給聽眾之前，分析通過麥克風接收的說話者的語音。例如，如果麥克風可以檢測到說話者的語音，則說話者的語音可以被視為在麥克風附近。除了分析語音之外，例如使用可以收集可視提示的攝像機，或者使用可以提供有關使用麥克風發(fā)出的語音的其它信息的一個或多個傳感器，可以在204獲得說話者的語音環(huán)境的其它信息。
[0023] 在206,可以使用來自被分析語音的信息以及任何其它額外信息判定說話者是否旨在使語音進入麥克風并被分發(fā)。因此，例如可以分析音頻數據、視頻數據和/或其它傳感器數據以便判定是否旨在使語音進入麥克風。音頻數據的分析可以包括檢測說話者音量、諧波、語音方式的變化和/或話題的突然變化和/或其它提示。可視信息的分析可以包括檢測距離變化、位置變化以及周圍區(qū)域的其它變化。因此，如上所述，例如檢測的說話者音量變化、諧波、語音方式的變化和/或話題的突然變化和/或其它提示可以提供并未旨在使語音進入麥克風的判定。
[0024] 在208,基于并未旨在將語音定向到麥克風(例如，以便通過麥克風分發(fā)或傳輸給聽眾）的判定，可以觸發(fā)一個或多個操作。操作的一個實例是向說話者提供反饋。操作的另一個實例是自動使麥克風靜音或關閉麥克風。所述反饋可以包括可視提示和/或音頻提示。麥克風的一個實例是連接到電話會議系統的麥克風。本公開的方法可以應用于任何其它麥克風。
[0025] 圖3示出本公開的一個實施例中的可以實現智能麥克風系統的一個實例計算機或處理系統的示意圖。計算機系統僅是合適的處理系統的一個實例，并且并非旨在對此處描述的方法實施例的使用范圍或功能帶來任何限制。所示處理系統可以與多種其它通用或專用計算系統環(huán)境或配置一起操作。眾所周知，可以適合于與圖3中所示處理系統一起使用的計算系統、環(huán)境和/或配置可以包括但不限于個人計算機系統、服務器計算機系統、瘦客戶機、厚客戶機、手持或膝上設備、多處理器系統、基于微處理器的系統、機頂盒、可編程消費電子產品、網絡PC、小型計算機系統、大型計算機系統和包括上述任意系統或設備的分布式云計算環(huán)境等。
[0026] 所述計算機系統可以在由計算機系統執(zhí)行的計算機系統可執(zhí)行指令(諸如程序模塊)的一般上下文中描述。通常，程序模塊可以包括執(zhí)行特定的任務或者實現特定的抽象數據類型的例程、程序、目標程序、組件、邏輯、數據結構等。所述計算機系統可以在通過通信網絡鏈接的遠程處理設備執(zhí)行任務的分布式云計算環(huán)境中實現。在分布式云計算環(huán)境中，程序模塊可以位于包括存儲設備的本地和遠程計算機系統存儲介質上。
[0027] 所述計算機系統的組件可以包括但不限于一個或多個處理器或處理單元12、系統存儲器16,以及連接不同系統組件(包括系統存儲器16和處理器12)的總線14。處理器12 可以包括執(zhí)行在此描述的方法的智能麥克風模塊10。模塊10可以編程到處理器12的集成電路，或者從存儲器16、存儲器件18或網絡24加載，或者它們的組合。
[0028] 總線14表示幾類總線結構中的一種或多種，包括存儲器總線或存儲器控制器、夕卜圍總線、圖形加速端口，以及使用多種總線結構中的任意總線結構的處理器或局域總線。舉例來說，這些體系結構包括但不限于工業(yè)標準體系結構（ISA)總線、微通道體系結構（MCA) 總線、增強型ISA (EISA)總線、視頻電子標準協會（VESA)局域總線以及外圍組件互連（PCI) 總線。
[0029] 計算機系統可以包括多種計算機系統可讀介質。這些介質可以是能夠被計算機系統訪問的任意可獲得的介質，并且可以包括易失性和非易失性介質、可移動和不可移動的介質。
[0030] 系統存儲器16可以包括易失性存儲器形式的計算機系統可讀介質，例如隨機存取存儲器（RAM)和/或高速緩沖存儲器等。計算機系統可以還包括其它可移動/不可移動的、易失性/非易失性計算機系統存儲介質。僅作為舉例，存儲系統18可以用于讀寫不可移動的、非易失性磁介質(例如，"硬盤驅動器")。盡管圖3中未示出，可以提供用于對可移動非易失性磁盤(例如，"軟盤"）讀寫的磁盤驅動器，以及對可移動非易失性光盤(例如CD-ROM、 DVD-ROM或其它光介質)讀寫的光盤驅動器。在這些情況下，每個驅動器可以通過一個或多個介質接口與總線14相連。
[0031] 計算機系統還可以與一個或多個外部設備26 (例如鍵盤、指點設備、顯示器28等）通信，還可與一個或多個使得用戶能與計算機系統交互的設備通信，和/或與使得計算機系統能與一個或多個其它計算設備進行通信的任何設備(例如、網卡、調制解調器等）通信。這種通信可以通過輸入/輸出（I/O)接口 20進行。
[0032] 并且，計算機系統可以通過網絡適配器22與一個或多個網絡24 (例如局域網 (LAN)、廣域網（WAN)和/或公共網絡，例如因特網）通信。如圖所示，網絡適配器22通過總線14與計算機系統的其它組件通信。應當理解，盡管圖中未示出，其它硬件和/或軟件組件可以與計算機系統結合使用。實例包括但不限于：微代碼、設備驅動器、冗余處理單元、夕卜部磁盤驅動陣列、RAID系統、磁帶驅動器以及數據備份存儲系統等。
[0033] 所屬【技術領域】的技術人員知道，本發(fā)明的各個方面可以實現為系統、方法或計算機程序產品。因此，本發(fā)明的各個方面可以具體實現為以下形式，即：完全的硬件實施方式、完全的軟件實施方式(包括固件、駐留軟件、微代碼等)，或硬件和軟件方面結合的實施方式，這里可以統稱為"電路"、"模塊"或"系統"。此外，本發(fā)明的各個方面還可以實現為在一個或多個計算機可讀介質中的計算機程序產品的形式，該計算機可讀介質中包含計算機可讀的程序代碼。
[0034] 可以采用一個或多個計算機可讀介質的任意組合。計算機可讀介質可以是計算機可讀信號介質或者計算機可讀存儲介質。計算機可讀存儲介質例如可以是一但不限于一電、磁、光、電磁、紅外線、或半導體的系統、裝置或器件，或者上述的任意合適的組合。計算機可讀存儲介質的更具體的例子(非窮舉的列表）包括：便攜式計算機盤、硬盤、隨機存取存儲器（RAM)、只讀存儲器（ROM)、可擦式可編程只讀存儲器（EPROM或閃存)、便攜式緊湊盤只讀存儲器（CD-ROM)、光存儲器件、磁存儲器件、或者上述的任意合適的組合。在本文件中，計算機可讀存儲介質可以是任何包含或存儲程序的有形介質，該程序可以被指令執(zhí)行系統、裝置或者器件使用或者與其結合使用。
[0035] 計算機可讀的信號介質可以包括例如在基帶中或者作為載波一部分傳播的數據信號，其中承載了計算機可讀的程序代碼。這種傳播的數據信號可以采用多種形式，包括一但不限于一電磁信號、光信號或上述的任意合適的組合。計算機可讀的信號介質可以是計算機可讀存儲介質以外的任何計算機可讀介質，該計算機可讀介質可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統、裝置或者器件使用或者與其結合使用的程序。
[0036] 計算機可讀介質上包含的程序代碼可以用任何適當的介質傳輸，包括一但不限于一無線、有線、光纜、RF等等，或者上述的任意合適的組合。
[0037] 可以以一種或多種程序設計語言的任意組合來編寫用于執(zhí)行本發(fā)明的各個方面的操作的計算機程序代碼，所述程序設計語言包括面向對象的程序設計語言一諸如Java、 Smalltalk、C++等，還包括常規(guī)的過程式程序設計語言一諸如"C"語言或類似的程序設計語言，一種描述性語言如Perl、VBS或類似語言，和/或功能性語言，如Lisp和ML以及邏輯目標語言如Prolog。程序代碼可以完全地在用戶計算機上執(zhí)行、部分地在用戶計算機上執(zhí) 行、作為一個獨立的軟件包執(zhí)行、部分在用戶計算機上部分在遠程計算機上執(zhí)行、或者完全在遠程計算機或服務器上執(zhí)行。在涉及遠程計算機的情形中，遠程計算機可以通過任意種類的網絡一包括局域網（LAN)或廣域網（WAN) -連接到用戶計算機，或者，可以連接到外部計算機(例如利用因特網服務提供商來通過因特網連接)。
[0038] 將參照根據本發(fā)明實施例的方法、裝置(系統）和計算機程序產品的流程圖和/或框圖描述本發(fā)明的各個方面。應當理解，流程圖和/或框圖的每個方框以及流程圖和/或框圖中各方框的組合，都可以由計算機程序指令實現。這些計算機程序指令可以提供給通用計算機、專用計算機或其它可編程數據處理裝置的處理器，從而生產出一種機器，使得這些指令在通過計算機或其它可編程數據處理裝置的處理器執(zhí)行時，產生了實現流程圖和/ 或框圖中的一個或多個方框中規(guī)定的功能/動作的裝置。
[0039] 也可以把這些計算機程序指令存儲在計算機可讀介質中，這些指令使得計算機、其它可編程數據處理裝置、或其它設備以特定方式工作，從而，存儲在計算機可讀介質中的指令就產生出包括實現流程圖和/或框圖中的一個或多個方框中規(guī)定的功能/動作的指令的制造品（article of manufacture)〇
[0040] 也可以把計算機程序指令加載到計算機、其它可編程數據處理裝置、或其它設備上，使得在計算機、其它可編程裝置或其它設備上執(zhí)行一系列操作步驟，以產生計算機實現的過程，從而使得在計算機或其它可編程裝置上執(zhí)行的指令提供實現流程圖和/或框圖中的一個或多個方框中規(guī)定的功能/動作的過程。
[0041] 附圖中的流程圖和框圖顯示了根據本發(fā)明的不同實施例的系統、方法和計算機程序產品的可能實現的體系架構、功能和操作。在這點上，流程圖或框圖中的每個方框可以代表一個模塊、程序段或代碼的一部分，所述模塊、程序段或代碼的一部分包含一個或多個用于實現規(guī)定的邏輯功能的可執(zhí)行指令。也應當注意，在有些作為替換的實現中，方框中所標注的功能可以以不同于附圖中所標注的順序發(fā)生。例如，兩個連續(xù)的方框實際上可以基本并行地執(zhí)行，它們有時也可以按相反的順序執(zhí)行，這依所涉及的功能而定。也要注意的是，框圖和/或流程圖中的每個方框、以及框圖和/或流程圖中的方框的組合，可以用執(zhí)行規(guī)定的功能或動作的專用的基于硬件的系統來實現，或者可以用專用硬件與計算機指令的組合來實現。
[0042] 計算機程序產品可以包括能夠實現在此描述的方法的所有相應特性，并且當被加載到計算機系統中時，其能夠執(zhí)行這些方法。當前上下文中的計算機程序、軟件程序、程序或軟件是指一組指令的以任何語言、代碼或符號表示的任何表達，旨在使具有信息處理能力的系統直接執(zhí)行特定的功能，或者執(zhí)行以下兩者之一或全部后執(zhí)行特定的功能：（a)轉換為另一種語言、代碼或符號；和/或（b)以不同的材料形式再現。
[0043] 在此使用的術語只是為了描述特定的實施例并且并非旨在作為本發(fā)明的限制。如在此使用的，單數形式"一"、"一個"和"該"旨在同樣包括復數形式，除非上下文明確地另有所指。還將理解，當在此說明書中使用時，術語"包括"和/或"包含"指定了聲明的特性、整數、步驟、操作、元素和/或組件的存在，但是并不排除一個或多個其它特性、整數、步驟、操作、元素、組件和/或其組合的存在或增加。
[0044] 下面權利要求中的對應結構、材料、操作以及所有功能性限定(如果有）的裝置或步驟的等同替換，旨在包括任何用于與在權利要求中具體指出的其它元件相組合地執(zhí)行該功能的結構、材料或操作。出于示例和說明目的給出了對本發(fā)明的描述，但所述描述并非旨在是窮舉的或是將本發(fā)明限于所公開的形式。在不偏離本發(fā)明的范圍和精神的情況下，對于所屬【技術領域】的普通技術人員來說許多修改和變化都將是顯而易見的。實施例的選擇和描述是為了最佳地解釋本發(fā)明的原理和實際應用，并且當適合于所構想的特定使用時，使得所屬【技術領域】的其它普通技術人員能夠理解本發(fā)明的具有各種修改的各種實施例。
[0045] 本公開的各個方面可以實現為包含在計算機或機器可用或可讀介質中的程序、軟件或計算機指令，當在計算機、處理器和/或機器上執(zhí)行時，這些程序、軟件或計算機指令導致計算機或機器執(zhí)行所述方法步驟。還提供一種程序存儲設備，其可由機器讀取并且有形地包含可由機器執(zhí)行的指令程序以便執(zhí)行本公開中描述的各種功能和方法。
[0046] 本公開的系統和方法可以在通用計算機或專用計算機系統上實現和運行?？捎糜?本申請的術語"計算機系統"和"計算機網絡"可以包括固定和/或便攜式計算機硬件、軟件、外圍設備和存儲設備的各種組合。計算機系統可以包括聯網或以其它方式鏈接以協作執(zhí)行的多個單獨組件，或者可以包括一個或多個獨立的組件。本申請的計算機系統的硬件和軟件組件可以包括并且可以包括在固定和便攜式設備(例如臺式計算機、膝上型計算機和/或服務器）中。模塊可以是實現某種"功能"的設備、軟件、程序或系統的組件，其可以實現為軟件、硬件、固件、電子電路等。
[0047] 上面描述的實施例是示例性實例，并且不應該解釋為本發(fā)明限于這些特定的實施例。因此，所屬【技術領域】的技術人員可以實現各種更改和修改，而不偏離在所附權利要求中限定的本發(fā)明的精神或范圍。
【權利要求】
1. 一種防止音頻信息的非預期分發(fā)的方法，所述方法包括：由處理器分析麥克風所接收的說話者的語音的音頻數據；由所述處理器根據所述分析自動判定是否旨在經由所述麥克風將所述說話者的語音分發(fā)給聽眾；以及響應于判定并未旨在經由所述麥克風將所述說話者的語音分發(fā)給所述聽眾，執(zhí)行一個或多個操作。
2. 根據權利要求1的方法，其中所述分析包括檢測發(fā)出所述語音的說話者的音量變化、所述語音的諧波變化、所述語音的方式變化、所述語音的話題變化，或者它們的組合。
3. 根據權利要求1的方法，還包括收集可視提示，并且還使用所述可視提示來判定是否旨在分發(fā)所述說話者的語音。
4. 根據權利要求3的方法，其中所述可視提示包括發(fā)出所述語音的說話者和所述麥克風之間的距離的變化、所述說話者發(fā)出所述語音所在的位置的變化，或者它們的組合。
5. 根據權利要求1的方法，還包括收集與發(fā)出所述語音的說話者關聯的運動數據，并且還使用所述運動數據來判定是否旨在分發(fā)所述說話者的語音。
6. 根據權利要求1的方法，其中所述一個或多個操作包括向所述說話者提供反饋、使所述麥克風靜音、關閉所述麥克風，或者它們的組合。
7. 根據權利要求6的方法，其中所述反饋包括以下項中的一個或多個：閃光燈、觸覺信號、音頻信號、所述語音在顯示器上的轉寫，或者它們的組合。
8. 根據權利要求1的方法，還包括分析非語音信息以判定是否旨在分發(fā)所述說話者的語音。
9. 一種用于防止音頻信息的非預期分發(fā)的系統，所述系統包括：麥克風；處理器，其可操作以分析所述麥克風所接收的說話者的語音的音頻數據，并且還可操作以自動判定是否旨在經由所述麥克風將所述說話者的語音分發(fā)給聽眾，以及響應于判定并未旨在經由所述麥克風將所述說話者的語音分發(fā)給所述聽眾，所述處理器可操作以執(zhí)行一個或多個操作。
10. 根據權利要求9的系統，其中所述處理器進行分析以便檢測發(fā)出所述語音的說話者的音量變化、所述語音的諧波變化、所述語音的方式變化、所述語音的話題變化，或者它們的組合。
11. 根據權利要求9的系統，還包括攝像機，其可操作以收集可視提示，并且所述處理器還使用所述可視提示來判定是否旨在分發(fā)所述說話者的語音，其中所述可視提示包括發(fā) 出所述語音的說話者和所述麥克風之間的距離的變化、所述說話者發(fā)出所述語音所在的位置的變化，或者它們的組合。
12. 根據權利要求9的系統，其中所述一個或多個操作包括向所述說話者提供反饋、使所述麥克風靜音、關閉所述麥克風，或者它們的組合。
【文檔編號】G06F3/16GK104111814SQ201410149115
【公開日】2014年10月22日申請日期:2014年4月15日優(yōu)先權日:2013年4月16日
【發(fā)明者】S·H·巴松, D·卡涅夫斯基, P·K·馬爾金, M·N·韋格曼申請人:國際商業(yè)機器公司

完整全部詳細技術資料下載