本發(fā)明是有關(guān)于一種聲音信號處理技術(shù),且特別是有關(guān)于一種可應用于互聯(lián)網(wǎng)的交互顯示系統(tǒng)的聲音信號處理系統(tǒng)的聲音信號處理方法。
背景技術(shù):
隨著科技發(fā)展,交互式技術(shù)逐漸成為一種新的輸入輸出(input/output,簡稱I/O)介面以提供良好的操作體驗。對于交互顯示裝置而言,語音辨識可通過比對語音信號的語音特征以及數(shù)據(jù)庫,以辨識出使用者的語音信號。此外,也可通過辨識與語音信號對應的語音指令,以使交互顯示裝置能夠基于語音指令進而執(zhí)行對應的操作。
當接收自使用者的語音信號不包括環(huán)境噪音時,語音辨識可以獲得正確的結(jié)果。然而,在通過收音器接收語音信號時,常會伴隨地接收到背景噪聲(例如環(huán)境噪音和/或在交互顯示系統(tǒng)中的裝置所制造的噪音),造成語音辨識的品質(zhì)不佳。
技術(shù)實現(xiàn)要素:
本發(fā)明提供一種聲音信號處理系統(tǒng)的聲音信號處理方法,其可有效萃取出主要語音信號,由此提升語音辨識的精確度。
本發(fā)明提出一種聲音信號處理方法,其適用于包括收音裝置的聲音信號處理系統(tǒng),且收音裝置包括多個收音器。所述聲音信號處理方法包括下列步驟。通過收音器接收來自不同方向的第一聲音信號及至少一個第二聲音信號。對第一聲音信號進行信號分離處理以計算出第一成分信號以及第二成分信號。對各所述至少一個第二聲音信號進行信號分離處理以計算出第三成分信號以及第四成分信號。計算第一成分信號及所述至少一個第三成分信號以獲得主要語音信息。計算第二成分信號及所述至少一個第四成分信號以獲得非主要語音信息。將第一聲音信號減去非主要語音信息以獲得運算結(jié)果。計算 運算結(jié)果與主要語音信息的總和以獲得第一聲音信號及所述至少一個第二聲音信號中的主要語音信號。
在本發(fā)明的一實施例中,上述的收音器包括第一收音器及至少一個第二收音器,且通過收音器接收來自不同方向的第一聲音信號及至少一個第二聲音信號的步驟包括通過第一收音器接收第一聲音信號,以及通過至少一個第二收音器接收至少一個第二聲音信號。其中,主要語音信號由聲音源所發(fā)出,且第一收音器用以接收聲音源所發(fā)出的最大強度的主要語音信號,至少一個第二收音器用以檢測主要語音信號的噪聲。
在本發(fā)明的一實施例中,上述的聲音信號處理系統(tǒng)還包括顯示單元,其配置于聲音信號處理系統(tǒng)的第一側(cè),并用以依據(jù)主要語音信號顯示對應的信息。第一收音器配置于聲音信號處理系統(tǒng)的第一側(cè),且至少一個第二收音器配置于聲音信號處理系統(tǒng)的至少一個第二側(cè)。所述第二側(cè)與第一側(cè)為不同側(cè)。
在本發(fā)明的一實施例中,上述的聲音信號處理系統(tǒng)還包括穿戴式電子裝置,第一收音器配置于穿戴式電子裝置,且通過第一收音器接收第一聲音信號的步驟包括通過無線通信連接與穿戴式電子裝置連接,以及經(jīng)由無線通信連接以接收第一收音器所接收到的第一聲音信號。
在本發(fā)明的一實施例中,上述的聲音信號處理系統(tǒng)還包括第一無線通信單元,且通過無線通信連接與穿戴式電子裝置連接的步驟包括通過第一無線通信單元與穿戴式電子裝置的第二無線通信單元進行配對,以與第二無線通信單元建立無線通信連接。
在本發(fā)明的一實施例中,上述的第一無線通信單元包括無線保真模塊或藍牙模塊的至少其中之一。
在本發(fā)明的一實施例中,上述計算第一成分信號及至少一個第三成分信號以獲得主要語音信息的步驟包括將第一成分信號減去至少一個第三成分信號,以產(chǎn)生主要語音信息。
在本發(fā)明的一實施例中,上述計算該第二成分信號及該至少一第四成分信號以獲得該非主要語音信息的步驟包括將第二成分信號減去至少一個第四成分信號,以產(chǎn)生非主要語音信息。
在本發(fā)明的一實施例中,上述聲音信號處理方法還包括比對主要語音信號與數(shù)據(jù)庫以進行語音辨識,以及依據(jù)主要語音信號執(zhí)行對應的操作。
在本發(fā)明的一實施例中,上述比對主要語音信號與數(shù)據(jù)庫以進行語音辨識的步驟包括判斷主要語音信號的語音特征是否與數(shù)據(jù)庫中所儲存的多個語音特征的其中之一相同,以及當主要語音信號的語音特征與數(shù)據(jù)庫中所儲存的語音特征不同時,儲存主要語音信號的語音特征至數(shù)據(jù)庫。
本發(fā)明另提出一種聲音信號處理系統(tǒng),其包括收音裝置以及處理單元。收音裝置包括多個收音器,用以接收來自不同方向的第一聲音信號及至少一個第二聲音信號。處理單元耦接收音裝置,對第一聲音信號進行信號分離處理以計算出第一成分信號以及第二成分信號,對各所述至少一個第二聲音信號進行信號分離處理以計算出第三成分信號以及第四成分信號,計算第一成分信號及至少一個第三成分信號以獲得主要語音信息,計算第二成分信號及至少一個第四成分信號以獲得非主要語音信息,將第一聲音信號減去非主要語音信息以獲得運算結(jié)果,以及計算運算結(jié)果與主要語音信息的總和以獲得第一聲音信號及至少一個第二聲音信號中的主要語音信號。
在本發(fā)明的一實施例中,上述的收音器包括第一收音器及至少一個第二收音器,且第一收音器接收第一聲音信號,以及至少一個第二收音器接收至少一個第二聲音信號。主要語音信號由聲音源所發(fā)出,且第一收音器用以接收聲音源所發(fā)出的最大強度的主要語音信號,所述至少一個第二收音器用以檢測主要語音信號的噪聲。
在本發(fā)明的一實施例中,上述的聲音信號處理系統(tǒng)還包括顯示單元,其配置于聲音信號處理系統(tǒng)的第一側(cè),并用以依據(jù)主要語音信號顯示對應的信息。其中,第一收音器配置于聲音信號處理系統(tǒng)的第一側(cè),且至少一個第二收音器配置于聲音信號處理系統(tǒng)的至少一個第二側(cè),所述第二側(cè)與第一側(cè)為不同側(cè)。
在本發(fā)明的一實施例中,上述的聲音信號處理系統(tǒng)還包括穿戴式電子裝置,其耦接處理單元。其中,第一收音器配置于穿戴式電子裝置,處理單元通過無線通信連接與穿戴式電子裝置連接,以及經(jīng)由無線通信連接以接收第一收音器所接收的第一聲音信號。
在本發(fā)明的一實施例中,上述的聲音信號處理系統(tǒng)還包括第一無線通信單元,其耦接處理單元,用以與穿戴式電子裝置的第二無線通信單元進行配對,以與第二無線通信單元建立無線通信連接。
在本發(fā)明的一實施例中,上述的第一無線通信單元包括無線保真模塊或藍牙模塊的至少其中之一。
在本發(fā)明的一實施例中,上述的處理單元用以將第一成分信號減去至少一個第三成分信號,以產(chǎn)生主要語音信息。
在本發(fā)明的一實施例中,上述的處理單元用以將第二成分信號減去至少一個第四成分信號,以產(chǎn)生非主要語音信息。
在本發(fā)明的一實施例中,上述的處理單元用以比對主要語音信號與數(shù)據(jù)庫以進行語音辨識,以及用以依據(jù)主要語音信號執(zhí)行對應的操作。
在本發(fā)明的一實施例中,上述的處理單元用以判斷主要語音信號的語音特征是否與數(shù)據(jù)庫中所儲存的多個語音特征的其中之一相同,以及當主要語音信號的語音特征與數(shù)據(jù)庫中所儲存的語音特征不同時,處理單元儲存主要語音信號的語音特征至數(shù)據(jù)庫。
基于上述,本發(fā)明實施例所提出的聲音信號處理系統(tǒng)的聲音信號處理方法可從不同方向接收多個聲音信號,并將各聲音信號分離成主要語音成分信號以及可視為噪聲的非主要語音成分信號。由此,本發(fā)明實施例可基于非主要語音成分信號以有效減少噪聲,并且基于主要語音成分信號以增加主要語音信號的強度,從而提升語音品質(zhì)以及語音辨識的精確度。
為讓本發(fā)明的上述特征和優(yōu)點能更明顯易懂,下文特舉實施例,并配合附圖作詳細說明如下。
附圖說明
圖1是本發(fā)明一實施例所示出的一種聲音信號處理系統(tǒng)的方塊圖;
圖2是本發(fā)明一實施例所示出的一種聲音信號處理方法的流程圖;
圖3是本發(fā)明一實施例所示出的交互顯示系統(tǒng)的示意圖;
圖4A和圖4B是本發(fā)明一實施例所示出的聲音信號處理方法的示意圖;
圖5是本發(fā)明另一實施例所示出的一種聲音信號處理方法的流程圖;
圖6是本發(fā)明另一實施例所示出的交互顯示系統(tǒng)的示意圖;
圖7是本發(fā)明又一實施例所示出的一種聲音信號處理方法的流程圖。
附圖標記說明:
100:聲音信號處理系統(tǒng);
110:收音裝置;
112:第一收音器;
114:第二收音器;
120:處理單元;
130:顯示單元;
140:儲存單元;
152、154:揚聲器;
160:風扇;
170:第一無線通信單元;
300、600:交互顯示系統(tǒng);
300A、600A:正面圖;
300B、600B:背面圖;
300C:側(cè)面圖;
700:穿戴式電子裝置;
AU1~AU3:聲音信號;
CR:運算結(jié)果;
DB:數(shù)據(jù)庫;
MIC1~MIC5:收音器;
MVI:主要語音信息;
MVS:主要語音信號;
NMVI:非主要語音信息;
N1~N3:噪聲成分信號;
V1~V3:語音成分信號;
S210~S270、S410~S450、S510~S570、S710~S760:方法步驟。
具體實施方式
圖1是本發(fā)明一實施例所示出的一種聲音信號處理系統(tǒng)的方塊圖。請參照圖1,聲音信號處理系統(tǒng)100包括收音裝置110、處理單元120、顯示單元130以及儲存單元140,其功能分述如下。
收音裝置110可包括多個收音器,其用以接收來自不同方向的多個聲音 信號。在本實施例中,收音器可包括第一收音器112以及至少一個第二收音器114。為了便于說明,圖1中僅示出出1個第二收音器114,然而,本發(fā)明并不限制第二收音器的數(shù)量。需注意的是,第一收音器112可用以接收一聲音源所發(fā)出的最大強度的主要語音信號,而所述至少一個第二收音器(例如第二收音器114)則可用以檢測主要語音信號的噪聲。
處理單元120例如是單晶片、一般用途處理器(General-Purpose Processor)、特殊用途處理器、傳統(tǒng)的處理器、數(shù)字信號處理器(Digital Signal Processor,簡稱DSP)、多個微處理器(Microprocessor)、一個或多個結(jié)合數(shù)字信號處理器核心的微處理器、控制器、微控制器、專用集成電路(Application Specific Integrated Circuit,簡稱ASIC)、帶有數(shù)字信號處理器核心的場可編程門陣列電路(Field Programmable Gate Array,簡稱FPGA)等。在本實施例中,處理單元120用以實現(xiàn)本發(fā)明實施例所提出的聲音信號處理方法。
顯示單元130可包括液晶顯示器(Liquid Crystal Display,簡稱LCD)、發(fā)光二極管(light-Emitting Diode,簡稱LED)顯示器、場發(fā)射顯示器(Field Emission Display,簡稱FED)或其他種類的顯示器。在一些實施例中,顯示單元130可由上述顯示器的其中一者與電阻式、電容式、光學式、超音波式等觸控面板組合而成,以同時提供顯示及觸控操作功能。
儲存單元140可用以儲存數(shù)據(jù)(例如接收到的聲音信號、執(zhí)行信號分離處理所產(chǎn)生的信號、主要語音信息以及非主要語音信息等)并提供處理單元120進行存取。在本實施例中,儲存單元140可包括用來儲存語音特征的數(shù)據(jù)庫,其用以執(zhí)行語音辨識。儲存裝置140例如是硬盤(Hard Disk Drive,簡稱HDD)、易失性存儲器(Volatile Memory)及非易失性存儲器(Non-Volatile Memory)。
圖2是本發(fā)明一實施例所示出的一種聲音信號處理方法的流程圖,且適用于圖1的聲音信號處理系統(tǒng)100。以下即搭配聲音信號處理系統(tǒng)100的各個元件來說明本方法的詳細步驟。
請同時參照圖1及圖2,在步驟S210中,通過收音器接收來自不同方向的第一聲音信號及至少一個第二聲音信號。具體而言,在本實施例中,第一收音器112可用以接收第一聲音信號,且至少一個第二收音器114可用以接 收所述至少一個第二聲音信號。
在步驟S220中,處理單元120對第一聲音信號進行信號分離處理以計算出第一成分信號以及第二成分信號。在步驟S230中,處理單元120對各所述第二聲音信號進行信號分離處理以計算出第三成分信號以及第四成分信號。
詳言之,處理單元120可執(zhí)行獨立成分分析(Independent Component Analysis,簡稱ICA)以執(zhí)行信號分離處理,從而對第一聲音信號以及所述至少一個第二聲音信號進行分離。此外,第一成分信號可為第一聲音信號中的主要語音成分信號,且相對于第一成分信號而言,第二成分信號可為非主要語音成分信號(例如環(huán)境噪聲或其他噪聲)。類似地,所述至少一個第三成分信號可為第二聲音信號中的主要語音成分信號,且相對于第三成分信號而言,第四成分信號可為非主要語音成分信號。
在步驟S240中,處理單元120計算第一成分信號及至少一個第三成分信號以獲得主要語音信息。在步驟S250中,處理單元120計算第二成分信號及至少一個第四成分信號以獲得非主要語音信息。
具體來說,主要語音信息可基于第一成分信號和第三成分信號之間的權(quán)重比例而計算得到。類似地,非主要語音信息可基于第二成分信號和第四成分信號之間的權(quán)重比例而計算得到。特別是,上述基于第一成分信號和第三成分信號之間的權(quán)重比例以及第二成分信號和第四成分信號之間的權(quán)重比例所進行的計算可通過信號減法處理來實現(xiàn)。例如,在一實施例中,處理單元120可用以將第一成分信號減去所述至少一個第三成分信號,以產(chǎn)生主要語音信息。此外,處理單元120可用以將第二成分信號減去所述至少一個第四成分信號,以產(chǎn)生非主要語音信息。
在步驟S260中,處理單元120將第一聲音信號減去非主要語音信息以獲得一運算結(jié)果,以及在步驟S270中,處理單元120計算運算結(jié)果與主要語音信息的總和以獲得第一聲音信號及至少一個第二聲音信號中的主要語音信號。
因此,本實施例通過使用多個收音器以及對各個接收到的聲音信號執(zhí)行信號分離處理,可獲得非主要語音信息以及主要語音信息。之后,本實施例便可利用非主要語音信息消除主要語音信號中的噪聲,以及利用主要語音信息進一步提升主要語音信號的強度,由此而有效改善語音品質(zhì)。
圖3是本發(fā)明一實施例所示出的交互顯示系統(tǒng)的示意圖,其分別示出交互顯示系統(tǒng)300的正面圖300A、背面圖300B以及側(cè)面圖300C。交互顯示系統(tǒng)300的聲音信號處理系統(tǒng)可基于圖1中的聲音信號處理系統(tǒng)100而實現(xiàn)。因此,交互顯示系統(tǒng)300的聲音信號處理系統(tǒng)也可包括收音裝置110、處理單元120、顯示單元130以及儲存單元140,且這些元件的功能可與前述實施例類似。為了便于以下說明,圖3僅示出在交互顯示系統(tǒng)300的聲音信號處理系統(tǒng)中的顯示單元130。
在本實施例中,如正面圖300A所示,顯示單元130可配置于交互顯示系統(tǒng)300的正面(即,第一側(cè))。收音裝置110包括收音器MIC1、MIC2以及MIC3,其用以接收來自不同方向的多個聲音信號。需注意的是,為了能夠有效地分別接收主要語音信號(即,使用者的語音指令及語音特征)以及噪聲,收音器MIC1可配置于交互顯示系統(tǒng)300的正面(如正面圖300A所示),而收音器MIC2以及MIC3則可配置于交互顯示系統(tǒng)300的其他側(cè)(即,至少一個第二側(cè))而與上述的正面不相同。在圖3的實施例中,收音器MIC2可配置于側(cè)面(如側(cè)面圖300C所示),且收音器MIC3可配置于交互顯示系統(tǒng)300的背面(如背面圖300B所示)。因此,收音器MIC2可用以接收揚聲器152所產(chǎn)生的噪聲,且收音器MIC3可用以接收揚聲器152、154以及風扇160所產(chǎn)生的噪聲。換言之,收音器MIC2以及MIC3(即,所述至少一個第二收音器)可用以檢測主要語音信號的噪聲。此外,收音器MIC1(即,所述第一收音器)則可接收聲音源(即,使用者)所發(fā)出的最大強度的主要語音信號。
值得一提的是,在交互顯示系統(tǒng)300的聲音信號處理系統(tǒng)中,儲存單元140可包括數(shù)據(jù)庫DB,并用以儲存用來進行語音辨識的多個語音特征,其細節(jié)將于之后進行說明。
基于上述架構(gòu),圖4A和圖4B的實施例示出聲音信號處理的詳細流程。
圖4A和圖4B是本發(fā)明一實施例所示出的聲音信號處理方法的示意圖,且適用于圖3的交互顯示系統(tǒng)300的聲音信號處理系統(tǒng)。
請先參照圖4A,收音器MIC1、MIC2以及MIC3可分別接收聲音信號AU1、AU2以及AU3。其中,聲音信號AU1可對應于第一聲音信號,且聲音信號AU2、AU3可對應于第二聲音信號。接著,在步驟S410中,處理單 元120可對各個聲音信號AU1、AU2以及AU3執(zhí)行信號分離處理。在本實施例中,聲音信號AU1可被分離成語音成分信號V1以及噪聲成分信號N1,聲音信號AU2可被分離成語音成分信號V2以及噪聲成分信號N2,且聲音信號AU3可被分離成語音成分信號V3以及噪聲成分信號N3。
在步驟S420中,處理單元120可通過將語音成分信號V1減去語音成分信號V2以及語音成分信號V3,以獲得主要語音信息MVI。另一方面,在步驟S430中,處理單元120可通過將噪聲成分信號N1減去噪聲成分信號N2以及噪聲成分信號N3,以獲得非主要語音信息NMVI。步驟S420、S430的執(zhí)行順序可基于設(shè)計需求而適應性地調(diào)整。
接著,請參照圖4B,處理單元120可使用聲音信號AU1、非主要語音信息NMVI以及主要語音信息MVI以萃取出主要語音信號MVS。具體而言,在步驟S440中,處理單元120可將聲音信號AU1減去非主要語音信息NMVI,以獲得運算結(jié)果CR。之后,在步驟S450中,處理單元120可計算運算結(jié)果CR與主要語音信息MVI的總和,以獲得聲音信號AU1、AU2以及AU3中的主要語音信號MVS。
值得一提的是,處理單元120可在時域中執(zhí)行步驟S420、S430、S440以及S450的運算。在其他實施例中,處理單元120可將聲音信號AU1、AU2以及AU3從時域轉(zhuǎn)換至頻域,接著再執(zhí)行步驟S420、S430、S440以及S450的運算。換言之,本發(fā)明并不限制上述運算中所使用的信號類型。
基于圖3所示的交互顯示系統(tǒng)300的聲音信號處理系統(tǒng),以下實施例則對聲音信號處理流程進行說明。
圖5是本發(fā)明另一實施例所示出的一種聲音信號處理方法的流程圖。請參照圖5,在步驟S510中,處理單元120致能聲音信號檢測。舉例而言,當接收到來自使用者的致能操作,或是檢測到位于顯示單元130前方的使用者的臉部時,處理單元120可被觸發(fā)而致能聲音信號檢測。
在步驟S520中,處理單元120判斷是否通過收音器MIC1、MIC2以及MIC3接收到聲音信號AU1、AU2以及AU3。當接收到聲音信號AU1、AU2以及AU3時,在步驟S530中,處理單元120執(zhí)行聲音信號處理動作(其細節(jié)如圖4A和圖4B的實施例中所示出),并在步驟S540中獲得主要語音信號MVS。
在從聲音信號AU1、AU2以及AU3中萃取出主要語音信號MVS之后,處理單元120可比對主要語音信號以及數(shù)據(jù)庫DB以進行語音辨識。詳細而言,在步驟S550中,處理單元120判斷主要語音信號MVS的語音特征是否與數(shù)據(jù)庫DB中所儲存的多個語音特征的其中之一相同。當主要語音信號MVS的語音特征與數(shù)據(jù)庫DB中所儲存的語音特征相同時,在步驟S560中,處理單元120依據(jù)主要語音信號MVS執(zhí)行對應的操作。例如,處理單元120可依據(jù)主要語音信號MVS而在顯示單元130上顯示對應的信息,或是反應于主要語音信號MVS而通過揚聲器152、154來輸出回應信息。
另一方面,當主要語音信號MVS的語音特征與數(shù)據(jù)庫DB中所儲存的語音特征不同時,在步驟S570中,處理單元120可儲存主要語音信號MVS的語音特征至數(shù)據(jù)庫DB,接著再進入步驟S560以依據(jù)主要語音信號MVS執(zhí)行對應的操作。
由此,通過從不同方向接收多個聲音信號,并對各個接收到的聲音信號執(zhí)行信號分離處理,本發(fā)明實施例可有效地萃取出主要語音信號MVS,從而實現(xiàn)高準確度的語音辨識。此外,還可應用于更新數(shù)據(jù)庫DB中所儲存的語音特征,因此能夠適用于語音訓練流程。
需注意的是,第一收音器112的配置可基于設(shè)計需求而適應性地調(diào)整。在另一實施例中,聲音信號處理系統(tǒng)可應用于包括穿戴式電子裝置以及交互顯示裝置的交互顯示系統(tǒng),且第一收音器112可配置于穿戴式電子裝置上。以下對此實施例進行詳細說明。
圖6是本發(fā)明另一實施例所示出的交互顯示系統(tǒng)的示意圖,其分別示出出交互顯示系統(tǒng)600的正面圖600A以及背面圖600B。交互顯示系統(tǒng)600的聲音信號處理系統(tǒng)可基于圖1中的聲音信號處理系統(tǒng)100而實現(xiàn)。因此,交互顯示系統(tǒng)600的聲音信號處理系統(tǒng)也可包括收音裝置110、處理單元120、顯示單元130以及儲存單元140,且這些元件的功能可與前述實施例類似。類似地,為了便于以下說明,圖6僅示出在交互顯示系統(tǒng)600的聲音信號處理系統(tǒng)中的顯示單元130。
在本實施例中,交互顯示系統(tǒng)600的聲音信號處理系統(tǒng)還包括第一無線通信單元170以及穿戴式電子裝置700,且處理單元120可通過第一無線通信單元170而與穿戴式電子裝置700連接。
此外,收音裝置110包括收音器MIC4以及MIC5,其用以接收來自不同方向的多個聲音信號。需注意的是,為了便于使用,收音器MIC4可配置于穿戴式電子裝置700上。因此,收音器MIC4(即,第一收音器)可用以接收聲音源(即,使用者)所發(fā)出的最大強度的主要語音信號。至于收音器MIC5(即,至少一個第二收音器)則可配置于交互顯示裝置的背面(如背面圖600B所示),并可用以接收揚聲器152、154以及風扇160所產(chǎn)生的噪聲。
需注意的是,在本實施例中,處理單元120可通過無線通信連接與穿戴式電子裝置700連接,并可經(jīng)由上述的無線通信連接以通過收音器MIC4接收第一聲音信號。進一步而言,處理單元120可通過第一無線通信單元170與穿戴式電子裝置700的第二無線通信單元(未示出)進行配對,以與第二無線通信單元建立無線通信連接。第一無線通信單元170例如包括無線保真(WiFi)模塊或藍牙(Bluetooth)模塊的至少其中之一。
基于上述架構(gòu),交互顯示系統(tǒng)600的聲音信號處理系統(tǒng)可通過執(zhí)行類似于圖4A和圖4B的實施例所示出的聲音信號處理方法,以萃取出主要語音信號,其細節(jié)此處不再說明。值得一提的是,本實施例和前述實施例的差異在于,本實施例省略了配置在聲音信號處理系統(tǒng)的側(cè)面的第二收音器(例如圖3所示的收音器MIC2)。因此,相對于前述實施例而言,本實施例的聲音信號處理方法可以簡化。
基于圖6所示的交互顯示系統(tǒng)600的聲音信號處理系統(tǒng)100,以下實施例對聲音信號處理流程進行說明。
圖7是本發(fā)明又一實施例所示出的一種聲音信號處理方法的流程圖。請參照圖7,在步驟S710中,處理單元120致能與穿戴式電子裝置700的無線配對。在步驟S720中,處理單元120判斷無線配對是否完成。如前所述,無線配對可用以建立第一無線通信單元170以及穿戴式電子裝置700的第二無線通信單元之間的無線連接。
當無線配對完成(即,無線通信連接建立),在步驟S730中,處理單元120致能聲音信號檢測。接著,在步驟S740中,處理單元120判斷是否通過收音器MIC4以及MIC5接收到聲音信號。當接收到聲音信號時,在步驟S750中,處理單元120執(zhí)行聲音信號處理動作,并在步驟S760中獲得主要語音信號。步驟S730、S740、S750以及S760與圖5的步驟S510、S520、S530以 及S540類似,故此處不再贅述。在步驟S760之后,本實施例的處理單元120可通過步驟S550、S560、S570以進行語音辨識。這些步驟與前述實施例類似,故請參照前述。
綜上所述,本發(fā)明實施例可使用多個收音器以接收來自不同方向的多個聲音信號,并通過執(zhí)行信號分離處理以將各個接收到的聲音信號分離成主要語音成分信號以及非主要語音成分信號。因此,本發(fā)明實施例可基于非主要語音成分信號以有效減少噪聲,并且基于主要語音成分信號以增加主要語音信號的強度。此外,本發(fā)明實施例還可適用于多種系統(tǒng)架構(gòu),而易于使用者進行操作。如此一來,可以清楚地萃取出主要語音信號,并且改善語音品質(zhì),以及提升語音辨識的精確度。
最后應說明的是:以上各實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述各實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應當理解:其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分或者全部技術(shù)特征進行等同替換;而這些修改或者替換,并不使相應技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的范圍。