專利名稱:動(dòng)態(tài)創(chuàng)建語(yǔ)境的方法和系統(tǒng)的制作方法
動(dòng)態(tài)創(chuàng)建語(yǔ)境的方法和系統(tǒng)技術(shù)領(lǐng)域概括地說,本發(fā)明涉及語(yǔ)音識(shí)別領(lǐng)域。具體地說,本發(fā)明涉及動(dòng)態(tài)創(chuàng) 建特定語(yǔ)境的方法和系統(tǒng)。
背景技術(shù):
現(xiàn)今,語(yǔ)音識(shí)別(SR)系統(tǒng)在許多產(chǎn)業(yè)內(nèi)變得日益有效并得到很好地 運(yùn)用。采用語(yǔ)音識(shí)別處理,計(jì)算機(jī)把麥克風(fēng)接收到的聲學(xué)信號(hào)轉(zhuǎn)換成包括 一組單詞的文檔。然后,這些識(shí)別出的單詞可以在用于不同目的的各種應(yīng) 用中使用。把語(yǔ)音轉(zhuǎn)換成文本的自動(dòng)語(yǔ)音識(shí)別系統(tǒng)需要實(shí)現(xiàn)成本低、效率 高的文檔創(chuàng)建和高轉(zhuǎn)寫效率。但是,事實(shí)是由語(yǔ)音識(shí)別創(chuàng)建的文檔隨后仍需要由作者、轉(zhuǎn)寫員、質(zhì)保(QA)人員或其他人員手工或口述修改文檔而得以校對(duì)或?qū)徍耍@增 加了這些語(yǔ)音識(shí)別系統(tǒng)的復(fù)雜性。在過去的一些年里,已經(jīng)提出了一些提高語(yǔ)音識(shí)別準(zhǔn)確度的思想。出 版物WO 2005/052785舉例說明了如何使用文檔結(jié)構(gòu)知識(shí)進(jìn)行更加有效的 文檔創(chuàng)建。 一種框架用于檢測(cè)并處理文檔的邏輯結(jié)構(gòu),以生成語(yǔ)音已啟動(dòng) 的文檔。已知的是,使用單個(gè)語(yǔ)音識(shí)別器配置,統(tǒng)一用于具有例如聲學(xué)基準(zhǔn)、 語(yǔ)言模型、詞典或字典以及語(yǔ)法規(guī)則的恒定集的整個(gè)文檔。在這種情況下, 數(shù)據(jù)可能太過泛泛或太大,例如所有潛在主題的超集,這會(huì)降低識(shí)別率, 并且,沒有用于調(diào)整配置的動(dòng)態(tài)方法。還已知的是,對(duì)于文檔的每個(gè)段落或部分,使用一組有限的局部靜態(tài) 配置、語(yǔ)境,例如特定詞典、語(yǔ)言模型以及文檔特定語(yǔ)法等。在這些情況 下,通常難以確定各種配置,并難以將它們映射到文檔部分。特定局部配 置的創(chuàng)建也是一項(xiàng)非常耗時(shí)的處理,因?yàn)檎Z(yǔ)境創(chuàng)建涉及對(duì)通常包括數(shù)百萬(wàn) 個(gè)單詞的詞庫(kù)進(jìn)行處理。例如,在醫(yī)學(xué)口述系統(tǒng)中,己知的是,當(dāng)醫(yī)生口述諸如脊柱X-光J艮告之類的報(bào)告時(shí),語(yǔ)音識(shí)別系統(tǒng)使用普通放射線學(xué)配置,即放射線學(xué)語(yǔ)境, 它包括專用于放射線學(xué)的詞典、語(yǔ)言模型和語(yǔ)法。但是,放射線學(xué)領(lǐng)域仍然是很廣闊的,并且,由于誤識(shí)會(huì)識(shí)別出不正確的單詞,其(例如,^ffi網(wǎng) 膜)可能與特定主題(例如,脊柱)完全不相關(guān)。因此,就所使用的詞典 或特定詞匯量而論,這些系統(tǒng)提供的語(yǔ)境仍然是靜態(tài)的,并缺乏準(zhǔn)確性或 專業(yè)性。通常,語(yǔ)境過于概括,并且,與在特定文檔區(qū)域所需要的單詞和 句子相比,它支持更多的單詞和句子。因此,將需要著重強(qiáng)調(diào)那些在牛寺定 文檔區(qū)域中確實(shí)需要的單詞和句子,即語(yǔ)境的子集。因此,為了降低語(yǔ)音識(shí)別系統(tǒng)差錯(cuò)率,靜態(tài)度較小的且具有較好和較 窄的語(yǔ)境自適應(yīng)的改進(jìn)系統(tǒng)將是有益的。發(fā)明內(nèi)容因此,本發(fā)明至少部分地通過提供根據(jù)所附的權(quán)利要求書所述的用于 動(dòng)態(tài)創(chuàng)建特定語(yǔ)境的系統(tǒng)和方法,以單獨(dú)或以任何組合方式減少、削弱或 消除本領(lǐng)域中的一個(gè)或多個(gè)以上缺陷和缺點(diǎn),并解決至少上述問題。更具體地說,本發(fā)明涉及從文本文檔中提取結(jié)構(gòu)和內(nèi)容信息(例如標(biāo) 題、標(biāo)簽等)的語(yǔ)音識(shí)別系統(tǒng),并使用它來(lái)改善語(yǔ)音識(shí)別。針對(duì)文本文檔 部分自動(dòng)創(chuàng)建或生成特定語(yǔ)境,例如詞典、語(yǔ)法和語(yǔ)言模型。根據(jù)本發(fā)明的一方面,提供了包括電子文檔的語(yǔ)音識(shí)別系統(tǒng)所用的一 種方法,所述電子文檔是基于語(yǔ)音的文檔,其包括根據(jù)語(yǔ)音段識(shí)別或轉(zhuǎn)寫 出來(lái)的一個(gè)或多個(gè)文本段。語(yǔ)音段由作者口述,并由語(yǔ)音識(shí)別系統(tǒng)中的語(yǔ) 音識(shí)別器處理成基于語(yǔ)音的文檔的相應(yīng)文本段。所述方法包括由語(yǔ)音識(shí)別 器動(dòng)態(tài)創(chuàng)建和/或修改子語(yǔ)境,并使子語(yǔ)境與文本段相關(guān)聯(lián)。所述方法還可以包括以下步驟識(shí)別與電子文檔相關(guān)的基本主題;使基本語(yǔ)境與電子文檔相關(guān)聯(lián),所述基本語(yǔ)境包括至少一組單詞以及與基本主題相關(guān)的該組單詞的用法;識(shí)別子主題,每個(gè)子主題都與電子文檔里的一個(gè)特定文本段相 關(guān);根據(jù)基本語(yǔ)境創(chuàng)建子語(yǔ)境,所述子語(yǔ)境分別包括至少一組特定單詞和 與子主題相關(guān)的該組特定單詞的用法;使每個(gè)子語(yǔ)境與電子文檔里的一個(gè) 匹配文本段相關(guān)聯(lián)。此外,所述方法可以包括自動(dòng)執(zhí)行以下步驟給每個(gè)文本段創(chuàng)建子語(yǔ)境;修改所述電子文檔里的所述子語(yǔ)境。此外,所述方法 可以包括根據(jù)所述基本語(yǔ)境創(chuàng)建所述子語(yǔ)境,其包括識(shí)別與電子文檔的 剩余部分不同的與特定文本段有關(guān)的單詞;使用基本語(yǔ)境創(chuàng)建該組特定單詞o根據(jù)本發(fā)明的另一方面,提供了包括電子文檔的語(yǔ)音識(shí)別系統(tǒng)所用的 一種系統(tǒng),所述電子文檔是基于語(yǔ)音的文檔,其包括根據(jù)語(yǔ)音段識(shí)別或轉(zhuǎn) 寫出來(lái)的一個(gè)或多個(gè)文本段。語(yǔ)音段由作者口述,并由語(yǔ)音識(shí)別系統(tǒng)中的 語(yǔ)音識(shí)別器處理成基于語(yǔ)音的文檔的相應(yīng)文本段。所述系統(tǒng)包括由語(yǔ)音識(shí) 別器動(dòng)態(tài)創(chuàng)建和/或修改子語(yǔ)境的模塊和使子語(yǔ)境與文本段相關(guān)聯(lián)的模塊。所述系統(tǒng)還可以包括識(shí)別與電子文檔相關(guān)的基本主題的模塊;使基本語(yǔ) 境與電子文檔相關(guān)聯(lián)的模塊,其中,所述基本語(yǔ)境包括至少一組單詞和與 基本主題相關(guān)的該組單詞的用法;識(shí)別子主題的模塊,每個(gè)子主題都與電 子文檔里的一個(gè)特定文本段相關(guān);根據(jù)基本語(yǔ)境創(chuàng)建子語(yǔ)境的模塊,其中, 所述子語(yǔ)境分別包括至少一組特定單詞和與子主題相關(guān)的該組特定單詞的 用法;使每個(gè)子語(yǔ)境與電子文檔里的一個(gè)匹配文本段相關(guān)聯(lián)的模塊。此外, 給所述電子文檔里的每個(gè)文本段創(chuàng)建和/或修改子語(yǔ)境的模塊可以是自動(dòng)模 塊。此外,根據(jù)所述基本語(yǔ)境創(chuàng)建所述子語(yǔ)境的模塊可以包括識(shí)別與電 子文檔的剩余部分不同的與特定文本段有關(guān)的單詞的模塊;使用基本語(yǔ)境 創(chuàng)建該組特定單詞的模塊。根據(jù)本發(fā)明的另一方面,提供了一種計(jì)算機(jī)可讀介質(zhì),其上面承載著 由計(jì)算機(jī)處理的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序用于包括電子文檔的語(yǔ)音識(shí) 別系統(tǒng),所述電子文檔是基于語(yǔ)音的文檔,其包括根據(jù)語(yǔ)音段識(shí)別或轉(zhuǎn)寫 出來(lái)的一個(gè)或多個(gè)文本段,其中,所述語(yǔ)音段由作者口述,并由語(yǔ)音識(shí)別 系統(tǒng)中的語(yǔ)音識(shí)別器處理成基于所述語(yǔ)音的文檔的相應(yīng)文本段,所述計(jì)算 機(jī)程序包括用于創(chuàng)建并修改所述語(yǔ)音識(shí)別器里的子語(yǔ)境的代碼段和用于使 所述子語(yǔ)境與所述文本段相關(guān)聯(lián)的代碼段。所述計(jì)算機(jī)程序可以包括用 于確定與所述電子文檔相關(guān)的基本主題的代碼段;用于使基本語(yǔ)境與所述 電子文檔相關(guān)聯(lián)的代碼段,所述基本語(yǔ)境包括一組單詞和與所述基本主題 相關(guān)的該組單詞的用法;用于識(shí)別子主題的代碼段,每個(gè)子主題都與所述 電子文檔里的特定文本段相關(guān);通過使用所述基本語(yǔ)境創(chuàng)建子語(yǔ)境的代碼段,所述子語(yǔ)境分別包括至少一組特定單詞和與所述子主題相關(guān)的該組特定單詞的用法;使每個(gè)所述子語(yǔ)境與所述電子文檔里的一個(gè)匹配文本段相 關(guān)聯(lián)的代碼段。動(dòng)態(tài)創(chuàng)建特定語(yǔ)境的系統(tǒng)的優(yōu)點(diǎn)是特別易于使靜態(tài)語(yǔ)境(例如,普通 放射線學(xué)語(yǔ)境)適合用戶特定需要(例如,醫(yī)學(xué)報(bào)告中的關(guān)于肺部x線的 部分)。
根據(jù)下面參照附圖描述的本發(fā)明的實(shí)施例,本發(fā)明的這些和其它方面、 特征和優(yōu)點(diǎn)將是顯而易見的,其中圖l是根據(jù)本發(fā)明示例性實(shí)施例的裝置的框圖。
具體實(shí)施方式
下面主要描述適用于語(yǔ)音識(shí)別系統(tǒng)的本發(fā)明的實(shí)施例,具體主要描述 動(dòng)態(tài)創(chuàng)建特定語(yǔ)境的方法,以用于識(shí)別基于語(yǔ)音的文檔里的口述文本。但 應(yīng)當(dāng)認(rèn)識(shí)到,本發(fā)明不限于此應(yīng)用,而可以用于許多其它口述或語(yǔ)音管理 系統(tǒng)?;谡Z(yǔ)音的文檔的類型很多,有完全無(wú)結(jié)構(gòu)的普通文本,也有非常有 結(jié)構(gòu)的表格和模板?;谡Z(yǔ)音的文檔的結(jié)構(gòu)可以靜態(tài)地進(jìn)行定義(例如, 作為模板的一部分),或者,由作者通過一組文檔建立單元?jiǎng)討B(tài)地進(jìn)行創(chuàng)建。為了簡(jiǎn)單起見,將在本說明書的剩余部分里把"基于語(yǔ)音的文檔"稱 為"文檔",其中,可以設(shè)想到文檔用于信息的再現(xiàn),此信息至少部分地由 語(yǔ)音導(dǎo)出。圖1取自W0 2005/052785,其中將僅說明對(duì)本發(fā)明而言相關(guān)的部分。 圖1公開了用于把含有信號(hào)部分的音頻信號(hào)轉(zhuǎn)寫成含有文檔文本段的文本 的系統(tǒng)l。音頻信號(hào)表示講話人向麥克風(fēng)2發(fā)出的口述。系統(tǒng)具有接收音頻 信號(hào)的輸入端3。請(qǐng)注意,也可以采用其它方式提供音頻信號(hào),例如借助于 數(shù)據(jù)載體或數(shù)據(jù)網(wǎng)絡(luò)以數(shù)字表示形式提供,如果設(shè)備具有以基本類似方式 建立的裝置的話。此外,系統(tǒng)包括語(yǔ)音啟動(dòng)框架9。把本實(shí)施例的框架9實(shí)現(xiàn)為在計(jì)算機(jī)的一個(gè)或多個(gè)數(shù)據(jù)處理器上運(yùn)行8的計(jì)算機(jī)軟件。但是,框架9也可以在其它實(shí)施例中通過其它裝置來(lái)實(shí)現(xiàn), 例如編碼硬件。框架包括用于接收音頻信號(hào)并將信號(hào)部分轉(zhuǎn)寫成文本段的轉(zhuǎn)寫裝置4 (語(yǔ)音識(shí)別器)等等。信號(hào)部分的轉(zhuǎn)寫(語(yǔ)音識(shí)別)進(jìn)行,從而把講話人 數(shù)據(jù)和語(yǔ)境數(shù)據(jù)考慮進(jìn)去。語(yǔ)境數(shù)據(jù)表示各種可獲得的可選語(yǔ)境,其中, 各語(yǔ)境定義或包括詞典、語(yǔ)法和語(yǔ)言模型(LM),其包括關(guān)于單詞概率和 單詞序列的統(tǒng)計(jì)信息。轉(zhuǎn)寫裝置4生成文本數(shù)據(jù),其表示識(shí)別出的文本段。轉(zhuǎn)寫裝置依賴檢測(cè)出的文檔結(jié)構(gòu)進(jìn)行配置,其中,根據(jù)結(jié)構(gòu)而在不同 的語(yǔ)境之間作出選擇。W02005/052785公開了如果識(shí)別出結(jié)構(gòu)單元"報(bào)告標(biāo)題",則選擇第 一語(yǔ)境,如果識(shí)別出結(jié)構(gòu)單元"章節(jié)標(biāo)題",則選擇第二語(yǔ)境,如果識(shí)別出 結(jié)構(gòu)單元"文本",則選擇第三語(yǔ)境。此外, 一旦結(jié)構(gòu)單元"文本"出現(xiàn), 則提供具有最大詞匯范圍的語(yǔ)境。在本發(fā)明的實(shí)施例中,框架9包括修改裝置5,其針對(duì)轉(zhuǎn)寫裝置修改和 /或提高和/或創(chuàng)建相應(yīng)的語(yǔ)境。然后,把識(shí)別出的文本數(shù)據(jù)傳送到再現(xiàn)控制裝置6,其用于實(shí)施文檔的 文本數(shù)據(jù)的聲學(xué)和視覺再現(xiàn),這里不再對(duì)其進(jìn)行詳細(xì)描述。把聲學(xué)再現(xiàn)數(shù) 據(jù)傳遞到第一再現(xiàn)設(shè)備7,如擴(kuò)音器,并把文本再現(xiàn)數(shù)據(jù)傳送到用于信息的 視覺再現(xiàn)的第二再現(xiàn)設(shè)備8,如監(jiān)視器或顯示器。通常,文檔具有一些屬性,如語(yǔ)言、作者、語(yǔ)境,它們與整個(gè)文檔相關(guān)聯(lián)。語(yǔ)境定義了可用的單詞(詞典)及其用法(語(yǔ)言模型)。語(yǔ)境是諸如 標(biāo)題、客戶特定說明、藥物特定說明、病人歷史、治療等所有潛在主題的 超集,它們與特定的口述有關(guān)。通常,語(yǔ)境包括較廣泛的主題集和數(shù)量上 比實(shí)際口述需要多很多的單詞。在口述質(zhì)量和語(yǔ)境"尺寸"之間需要一定 的權(quán)衡。因?yàn)檎Z(yǔ)境是有限的,故需要提高連續(xù)語(yǔ)境,如新語(yǔ)境創(chuàng)建??紤] 到運(yùn)行時(shí)的性能,在線口述會(huì)話期間進(jìn)行快速語(yǔ)境切換常常是不可取的, 所以,對(duì)于具有不同語(yǔ)境而言,基本語(yǔ)境和各種子語(yǔ)境看來(lái)是合乎需要的。 因此,根據(jù)本實(shí)施例,不進(jìn)行慢語(yǔ)境切換,而是,基于通過一組子語(yǔ)境動(dòng) 態(tài)擴(kuò)展的基本語(yǔ)境來(lái)改善識(shí)別。語(yǔ)境可以通過在主題領(lǐng)域中收集龐大的文檔集進(jìn)行創(chuàng)建。語(yǔ)境對(duì)于特定主題領(lǐng)域(例如,放射線學(xué))而言可能是概括的,或者,可能專用于特 定口述類型或文檔模板。一些文檔區(qū)域可以與諸如病人歷史、治療等特定主題相關(guān)聯(lián)。與文檔 的各個(gè)區(qū)域相關(guān)聯(lián)的主題可以由模板的設(shè)計(jì)者進(jìn)行定義。主題定義可以在 語(yǔ)境創(chuàng)建時(shí)進(jìn)行,然后,由語(yǔ)音識(shí)別框架自動(dòng)完成,或者在對(duì)文檔模板進(jìn) 行語(yǔ)音啟動(dòng)時(shí)完成或者在裝載語(yǔ)音已啟動(dòng)的文檔時(shí)完成。下面不再對(duì)此進(jìn) 行詳細(xì)描述。在本實(shí)施例中,子語(yǔ)境與特定主題相關(guān)聯(lián)。通常,每個(gè)主題僅與單個(gè)子語(yǔ)境相關(guān)。子語(yǔ)境至少包括子語(yǔ)境詞典和子語(yǔ)境LM。如果在與該子語(yǔ)境 相關(guān)的文檔區(qū)域中已有口述,則子語(yǔ)境LM自動(dòng)修改。 、還可能有與特定主題相關(guān)聯(lián)的文檔區(qū)域。在這種情況下,基本語(yǔ)境將 與它們相關(guān)聯(lián)?;菊Z(yǔ)境和子語(yǔ)境的參考可以存儲(chǔ)在文檔中,并且,語(yǔ)音識(shí)別的合成 器可以使這些參考與正確的語(yǔ)境相關(guān)聯(lián)。在與特定主題(例如,脊柱X光)相關(guān)的特定文檔區(qū)域中進(jìn)行口述期 間,系統(tǒng)使用針對(duì)脊柱X光的現(xiàn)有子語(yǔ)境。脊柱X光的典型單詞可以得到 更好地支持,并由脊柱X光子語(yǔ)境然后由基本放射線學(xué)語(yǔ)境容易地^^別出 來(lái)。相反,基本放射線學(xué)語(yǔ)境可能不包含一些X光專用單詞,或者,它的 提供僅具有低概率,從而使得更加難于識(shí)別出這些單詞。與其它單詞相比, 由于使用了適當(dāng)?shù)淖诱Z(yǔ)境及其子語(yǔ)境語(yǔ)言模型和詞典,X光專用單詞將具 有更高概率。子語(yǔ)境的創(chuàng)建處理可以在不同時(shí)間開始。最早,可以在諸如 模板之類的文檔準(zhǔn)備過程之前或期間創(chuàng)建基本語(yǔ)境時(shí),創(chuàng)建子語(yǔ)境。也可 以在語(yǔ)音識(shí)別框架準(zhǔn)備文檔模板時(shí),自動(dòng)地或由用戶交互或兩者兼而有之 地創(chuàng)建子語(yǔ)境。如果文檔具有與特定主題相關(guān)的區(qū)域,因此與特定子語(yǔ)境相關(guān),并且, 如果向此區(qū)域進(jìn)行口述,然后對(duì)文檔進(jìn)行語(yǔ)境修改,那么,此區(qū)域的文本 將自動(dòng)修改到子語(yǔ)境。框架9中包括的另一特征也支持子語(yǔ)境的自動(dòng)修改或創(chuàng)建。這是由針 對(duì)現(xiàn)有語(yǔ)境的修改/創(chuàng)建裝置5通過使用文檔的結(jié)構(gòu)信息來(lái)實(shí)現(xiàn)的。例如, 如果文檔區(qū)域通常包含像病人歷史之類的特定主題的單詞和句子,則把這些句子(單詞)作為用于創(chuàng)建子語(yǔ)境的候選者。此夕卜,假設(shè)作者通常把類 似的句子口述到文檔的相同區(qū)域,并且,與適當(dāng)?shù)恼Z(yǔ)境相關(guān)聯(lián)變得更加容 易。修改/創(chuàng)建裝置以特定方式對(duì)待文檔的不同區(qū)域。對(duì)于新主題來(lái)說,將創(chuàng)建包括新詞典和新LM的新子語(yǔ)境,已經(jīng)分配了子語(yǔ)境的一些段的數(shù)據(jù) 將用于正確地修改所分配的子語(yǔ)境。生成文檔的示例性處理如下作者通過使用麥克風(fēng)2 口述文本??谑?可以是清楚概括的文本口述;受限主題的口述;簡(jiǎn)短文本;選定的關(guān)鍵 字標(biāo)識(shí)符、導(dǎo)航指令、選擇指令和/或簡(jiǎn)短關(guān)鍵的激活指令的口述??谑鑫?本/文件進(jìn)入系統(tǒng)1的框架9,其中,語(yǔ)音識(shí)別器4對(duì)口述文本/文件進(jìn)行處 理,并生成基于語(yǔ)音的文檔,其具有諸如語(yǔ)言、作者、語(yǔ)境等相關(guān)屬性。對(duì)與基于語(yǔ)音的文檔中的內(nèi)容相關(guān)的主要主題進(jìn)行確定??色@得預(yù)定 的一組語(yǔ)境。使與所述主題相關(guān)的基本主題跟文檔相適應(yīng)和/或相關(guān)聯(lián),基 本語(yǔ)境包括一組單詞、基本語(yǔ)境詞匯量和此組單詞的用法、基本語(yǔ)境LM。 子語(yǔ)境要么是基本語(yǔ)境的一部分,要么是在出于語(yǔ)音識(shí)別目的檢測(cè)文檔結(jié) 構(gòu)而對(duì)此文檔進(jìn)行定制時(shí),即,在對(duì)文檔進(jìn)行語(yǔ)音啟動(dòng)時(shí),進(jìn)行創(chuàng)建并使 其與文檔區(qū)域相關(guān)聯(lián)的。子語(yǔ)境包括一組特定單詞、子語(yǔ)境詞匯量和此組特定單詞的用法、子 語(yǔ)境LM,它們分別與特定文本段相關(guān)。文檔中的段或者與子語(yǔ)境相關(guān)聯(lián), 或者,它與單個(gè)子語(yǔ)境相關(guān)聯(lián)。本實(shí)施例的工作流程的示例1. 主題1+子語(yǔ)境1和主題2+子語(yǔ)境2已經(jīng)與語(yǔ)境A相關(guān)。2. 文檔模板進(jìn)行語(yǔ)音啟動(dòng)過程。3. 在語(yǔ)音啟動(dòng)時(shí),文檔X的一些區(qū)域與子語(yǔ)境1相關(guān)聯(lián)。4. 在語(yǔ)音啟動(dòng)過程中,識(shí)別出新主題3+子語(yǔ)境3和主題4+子語(yǔ)境4, 并且,文檔X的區(qū)域與子語(yǔ)境3和子語(yǔ)境4相關(guān)聯(lián)?,F(xiàn)在,在完成了文檔 X的語(yǔ)音啟動(dòng)過程之后,準(zhǔn)備高效地向其口述。5. 加載進(jìn)行了語(yǔ)音啟動(dòng)的文檔X,作者向文檔的不同區(qū)域進(jìn)行口述。 作者不必知道關(guān)于主題的任何事情。 一些文檔區(qū)域與主題1、主題3和主題 4相關(guān)聯(lián)。6. 在完成了口述(以及校正等等)動(dòng)作之后,下一步驟是修改文檔X。 作者了解到語(yǔ)境A不具有子語(yǔ)境3和子語(yǔ)境4,因此,修改器創(chuàng)建它們。7. 修改口述的單詞,在語(yǔ)境A的基本語(yǔ)境中修改與主題無(wú)關(guān)的區(qū)域, 不單在基本語(yǔ)境中而且還在子語(yǔ)境中修改其它區(qū)域。本發(fā)明可以用包括硬件、軟件、固件或其組合的任何適當(dāng)形式來(lái)實(shí)現(xiàn)。 但優(yōu)選情況下,本發(fā)明實(shí)現(xiàn)成在一個(gè)或多個(gè)數(shù)據(jù)處理器和/或數(shù)字信號(hào)處理 器上運(yùn)行的計(jì)算機(jī)軟件。本發(fā)明的實(shí)施例的元件和部件可以用任何適當(dāng)?shù)?方法物理性地、功能性地和邏輯性地來(lái)實(shí)現(xiàn)。實(shí)際上,功能可以在單個(gè)單 元、多個(gè)單元中實(shí)現(xiàn),或者,實(shí)現(xiàn)成其它功能單元的一部分。同樣,實(shí)施 例可以在單個(gè)單元中實(shí)現(xiàn),或者,可以在不同單元和處理器之間物理性地 和功能性地分布。雖然上面圍繞著特定實(shí)施例描述了本發(fā)明,但本發(fā)明并不限于這里列 明的特定形式。而且,本發(fā)明僅由所附的權(quán)利要求書加以界定,在這些所 附的權(quán)利要求的保護(hù)范圍下,除以上具體所述之外的其它實(shí)施例同樣是可 行的。例如,可以有若干級(jí)的子語(yǔ)境和子子語(yǔ)境。在權(quán)利要求中,詞語(yǔ)"包括/包含"并不排除存在其它部件或步驟。此 外,雖然是單獨(dú)列出的,但多個(gè)裝置、部件和方法步驟可以由例如單個(gè)單 元或處理器來(lái)實(shí)現(xiàn)。另外,雖然不同權(quán)利要求可包括其各自的特征,但這 些特征也有可能會(huì)被優(yōu)選地組合起來(lái),包括在不同權(quán)利要求中的特征并不 意味著它們的組合是不可行的和/無(wú)益的。還有,單個(gè)參考并不排除有多個(gè)。 詞語(yǔ)"一個(gè)"、"一種"、"第一"、"第二"等并不排除有多個(gè)。權(quán)利要求中 的附圖標(biāo)記僅僅是出于清楚起見,而不應(yīng)將其解釋為以任何方式對(duì)權(quán)利要 求的保護(hù)范圍構(gòu)成限制。權(quán)利要求
1、包括電子文檔的語(yǔ)音識(shí)別系統(tǒng)(1)所用的一種方法,所述電子文檔是基于語(yǔ)音的文檔,其包括根據(jù)語(yǔ)音段識(shí)別或轉(zhuǎn)寫出來(lái)的一個(gè)或多個(gè)文本段,其中,所述語(yǔ)音段由作者口述,并由所述語(yǔ)音識(shí)別系統(tǒng)(1)中的語(yǔ)音識(shí)別器(4)處理成所述基于語(yǔ)音的文檔的相應(yīng)文本段,所述方法包括由所述語(yǔ)音識(shí)別器動(dòng)態(tài)地創(chuàng)建和/或修改子語(yǔ)境;使所述子語(yǔ)境與所述文本段相關(guān)聯(lián)。
2、 根據(jù)權(quán)利要求1所述的方法,其中,所述方法包括--識(shí)別與所述電子文檔相關(guān)的基本主題;-使基本語(yǔ)境與所述電子文檔相關(guān)聯(lián),所述基本語(yǔ)境包括至少一組單 詞以及與所述基本主題相關(guān)的該組單詞的用法;-識(shí)別子主題,每個(gè)子主題都與所述電子文檔里的一個(gè)特定文本段相關(guān);-根據(jù)所述基本語(yǔ)境創(chuàng)建所述子語(yǔ)境,所述子語(yǔ)境分別包括至少一組 特定單詞以及與所述子主題相關(guān)的該組特定單詞的用法;-使每個(gè)所述子語(yǔ)境與所述電子文檔里的一個(gè)匹配文本段相關(guān)聯(lián)。
3、 根據(jù)權(quán)利要求2所述的方法,其中,自動(dòng)執(zhí)行以下步驟 給每個(gè)文本段創(chuàng)建所述子語(yǔ)境;修改所述電子文檔里的所述子語(yǔ)境。
4、 根據(jù)權(quán)利要求2所述的方法,其中,根據(jù)所述基本語(yǔ)境創(chuàng)建所述子 語(yǔ)境包括識(shí)別與所述電子文檔的剩余部分不同的與所述特定文本段有關(guān)的單詞;-使用所述基本語(yǔ)境創(chuàng)建該組特定單詞。
5、 包括電子文檔的語(yǔ)音識(shí)別系統(tǒng)(5)所用的一種系統(tǒng),所述電子文檔是基于語(yǔ)音的文檔,其包括根據(jù)語(yǔ)音段識(shí)別或轉(zhuǎn)寫出來(lái)的一個(gè)或多個(gè)文 本段,其中,所述語(yǔ)音段由作者口述,并由所述語(yǔ)音識(shí)別系統(tǒng)(1)中的語(yǔ) 音識(shí)別器(4)處理成所述基于語(yǔ)音的文檔的相應(yīng)文本段,所述系統(tǒng)包括由所述語(yǔ)音識(shí)別器創(chuàng)建和/或修改子語(yǔ)境的模塊;使所述子語(yǔ)境與所述文本段相關(guān)聯(lián)的模塊。
6、 根據(jù)權(quán)利要求5所述的系統(tǒng),其中,所述系統(tǒng)包括 -識(shí)別與所述電子文檔相關(guān)的基本主題的模塊;-使基本語(yǔ)境與所述電子文檔相關(guān)聯(lián)的模塊,其中,所述基本語(yǔ)境包 括至少一組單詞以及與所述基本主題相關(guān)的該組單詞的用法;-識(shí)別所述子主題的模塊,每個(gè)子主題都與所述電子文檔里的一個(gè)特 定文本段相關(guān);-根據(jù)所述基本語(yǔ)境創(chuàng)建子語(yǔ)境的模塊,其中,所述子語(yǔ)境分別包括 至少一組特定單詞以及與所述子主題相關(guān)的該組特定單詞的用法;-使每個(gè)所述子語(yǔ)境與所述電子文檔里的一個(gè)匹配文本段相關(guān)聯(lián)的模塊。
7、 根據(jù)權(quán)利要求6所述的系統(tǒng),其中,給所述電子文檔里的每個(gè)文本 段創(chuàng)建和/或修改子語(yǔ)境的模塊是自動(dòng)模塊。
8、 根據(jù)權(quán)利要求2所述的系統(tǒng),其中,根據(jù)所述基本語(yǔ)境創(chuàng)建所述子 語(yǔ)境的模塊包括用于識(shí)別與所述電子文檔的剩余部分不同的與所述特定文本段有關(guān)的 單詞的模塊;使用所述基本語(yǔ)境創(chuàng)建該組特定單詞的模塊。
9、 一種計(jì)算機(jī)可讀介質(zhì),其上面承載著由計(jì)算機(jī)處理的計(jì)算機(jī)程序, 所述計(jì)算機(jī)程序是為包括電子文檔的語(yǔ)音識(shí)別系統(tǒng)(5)配置的,所述電子 文檔是基于語(yǔ)音的文檔,其包括根據(jù)語(yǔ)音段識(shí)別或轉(zhuǎn)寫出來(lái)的一個(gè)或多個(gè) 文本段,其中,所述語(yǔ)音段由作者口述,并由所述語(yǔ)音識(shí)別系統(tǒng)(1)中的語(yǔ)音識(shí)別器(4)處理成所述基于語(yǔ)音的文檔的相應(yīng)文本段,所述計(jì)算機(jī)程 序包括在所述語(yǔ)音識(shí)別器里創(chuàng)建并修改子語(yǔ)境的代碼段; 用于使所述子語(yǔ)境與所述文本段相關(guān)聯(lián)的代碼段。
10、 根據(jù)權(quán)利要求9所述的計(jì)算機(jī)可讀介質(zhì),其中,所述計(jì)算機(jī)程序 包括-用于確定與所述電子文檔相關(guān)的基本主題的代碼段;-用于使基本語(yǔ)境與所述電子文檔相關(guān)聯(lián)的代碼段,所述基本語(yǔ)境包括一組單詞以及與所述基本主題相關(guān)的該組單詞的用法;-用于識(shí)別子主題的代碼段,每個(gè)子主題都與所述電子文檔里的一個(gè)特定文本段相關(guān);-使用所述基本語(yǔ)境創(chuàng)建子語(yǔ)境的代碼段,所述子語(yǔ)境分別包括至少 一組特定單詞以及與所述子主題相關(guān)的該組特定單詞的用法;-使每個(gè)所述子語(yǔ)境與所述電子文檔里的一個(gè)匹配文本段相關(guān)聯(lián)的代 碼段。
11、 一種醫(yī)學(xué)口述設(shè)備,其包括根據(jù)權(quán)利要求5至8中任一項(xiàng)所述的 系統(tǒng)。
全文摘要
包括電子文檔的語(yǔ)音識(shí)別系統(tǒng)(1)所用的方法和系統(tǒng),所述電子文檔是基于語(yǔ)音的文檔,所述基于語(yǔ)音的文檔包括根據(jù)語(yǔ)音段識(shí)別或轉(zhuǎn)寫出來(lái)的一個(gè)或多個(gè)文本段,其中,所述語(yǔ)音段由作者口述,并由所述語(yǔ)音識(shí)別系統(tǒng)(1)中的語(yǔ)音識(shí)別器(4)處理成所述基于語(yǔ)音的文檔的相應(yīng)文本段。所述方法包括以下步驟由所述語(yǔ)音識(shí)別器自動(dòng)創(chuàng)建和/或修改子語(yǔ)境;將所述子語(yǔ)境與所述文本段關(guān)聯(lián)起來(lái)。
文檔編號(hào)G10L15/183GK101326573SQ200680046095
公開日2008年12月17日 申請(qǐng)日期2006年12月7日 優(yōu)先權(quán)日2005年12月8日
發(fā)明者G·格羅鮑爾, M·帕保伊 申請(qǐng)人:皇家飛利浦電子股份有限公司