亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種加載詞庫的方法、字符輸入的方法和輸入法系統(tǒng)的制作方法

文檔序號(hào):6610205閱讀:488來源:國知局
專利名稱:一種加載詞庫的方法、字符輸入的方法和輸入法系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)字符輸入領(lǐng)域,特別是涉及一種加載詞庫的方法, 一種 字符輸入的方法以及一種輸入法系統(tǒng)。
背景技術(shù)
隨著計(jì)算機(jī)技術(shù)以及互聯(lián)網(wǎng)技術(shù)的普及與發(fā)展,輸入法已經(jīng)成為用戶 與計(jì)算機(jī)交互的重要手段,不同專業(yè)領(lǐng)域、不同興趣以及使用習(xí)慣的用戶 對(duì)于輸入法的智能性要求越來越高。
現(xiàn)有技術(shù)一般通過提高系統(tǒng)詞庫中的詞條的更新程度以及詞頻信息的 準(zhǔn)確度,來提高用戶向計(jì)算機(jī)完成字符輸入時(shí)的效率——可以通過首選詞
的準(zhǔn)確率進(jìn)行評(píng)價(jià)。例如,申請(qǐng)?zhí)枮?00610086577.4,名稱為"基于互聯(lián)網(wǎng) 信息的輸入法詞頻庫的生成方法和系統(tǒng)"的中國專利就公開了這樣的 一 種 提高系統(tǒng)詞庫性能的技術(shù)方案。
但是由于系統(tǒng)詞庫是相對(duì)固定的,針對(duì)每一個(gè)用戶而言,難以達(dá)到精 確匹配;為了增強(qiáng)個(gè)性化的輸入效率,現(xiàn)有技術(shù)提出了用戶詞庫的解決方 案。用戶詞庫的形成方法通常包括以下步驟記錄用戶輸入的字詞,學(xué)習(xí) 某個(gè)用戶適用的詞匯;通過一段時(shí)間地不斷學(xué)習(xí),將詞庫逐漸收斂到某個(gè) 用戶輸入的最佳狀態(tài),從而形成用戶詞庫。顯然,這種用戶詞庫的形成過 程可以在一定程度上調(diào)整候選項(xiàng)的排序,使其逐漸適應(yīng)該用戶,從而提高 輸入效率,但是由于某安裝有輸入法系統(tǒng)的PC或其它裝置的用戶不一定是 唯一的,很難實(shí)現(xiàn)更高程度的效率提升。
其次,通過用戶詞庫所實(shí)現(xiàn)的全局詞頻調(diào)整,對(duì)于用戶首次或者前幾 次使用的字詞無法給出個(gè)性化的調(diào)整,因?yàn)橛脩粼~庫的實(shí)現(xiàn)過程就是依據(jù) 該用戶的歷史信息而得到預(yù)測信息的,而首次或者前幾次使用的字詞恰恰 沒有歷史信息可供參考。但是,在大多數(shù)情況下,用戶希望能夠針對(duì)首次 或者前幾次使用的字詞就能夠得到非常好的輸入效率。
再者,對(duì)于同一個(gè)詞,在不同的輸入環(huán)境下,即使同一用戶也可能需 要不同的候選項(xiàng)排序。例如,對(duì)于"語料"和"預(yù)料",在日常輸入中,用戶 輸入"預(yù)料"一詞的情況較高,在系統(tǒng)詞庫和用戶詞庫中都是"預(yù)料"的詞頻
或者排序要高于"語料,,;但是當(dāng)該用戶在輸入專業(yè)文檔時(shí)(例如,語言分
析相關(guān)專業(yè)),則就期望"語料"候選項(xiàng)排序在前,而無論系統(tǒng)詞庫還是用戶 詞庫仍然會(huì)按照通常的排序輸出,無法隨著用戶輸入需求的變化而變化。
因此,現(xiàn)階段需要本領(lǐng)域技術(shù)人員迫切解決的一個(gè)技術(shù)問題就是,如 何改變現(xiàn)有輸入法系統(tǒng)的智能性不高的現(xiàn)狀,提供 一 種能夠動(dòng)態(tài)的與用戶 輸入環(huán)境或者輸入內(nèi)容相匹配,大大提高用戶輸入過程中首選詞準(zhǔn)確率的 輸入法解決方案。

發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種加載詞庫的方法,可以依據(jù)用戶當(dāng) 前的輸入環(huán)境或者輸入內(nèi)容,實(shí)時(shí)動(dòng)態(tài)的加載相應(yīng)的輔助詞庫,以4是供更加符 合用戶當(dāng)前需求的候選項(xiàng)排序,從而進(jìn)一步提高用戶的輸入效率。
相應(yīng)的,本發(fā)明還提供了釆用上述詞庫加載方法的字符輸入方法和系統(tǒng), 能夠即時(shí)的滿足用戶的動(dòng)態(tài)需求,提高輸入效率。
為了解決上述問題,依據(jù)本發(fā)明的實(shí)施例,公開了一種輸入法加載詞庫的
方法,包括'.采集用戶當(dāng)前輸入環(huán)境的相關(guān)信息;匹配獲得與用戶當(dāng)前輸入環(huán) 境相應(yīng)的輔助詞庫;加載所述與用戶當(dāng)前l(fā)t入環(huán)境相應(yīng)的輔助詞庫。
優(yōu)選的,所述的方法還可以包括卸載與用戶當(dāng)前輸入環(huán)境無關(guān)的輔助詞庫。
優(yōu)選的,可以通過以下方式完成加載輔助詞庫的過程將所需的輔助詞庫 合并至所述系統(tǒng)詞庫中;或者,將所需的輔助詞庫合并至一擴(kuò)展詞庫中,所述 擴(kuò)展詞庫與系統(tǒng)詞庫并列;或者,將所需的輔助詞庫作為各個(gè)獨(dú)立的詞庫置于 內(nèi)存中;或者,在啟動(dòng)輸入法時(shí),將系統(tǒng)詞庫和所有輔助詞庫都合并置于內(nèi)存 中,并針對(duì)每個(gè)詞條設(shè)定標(biāo)簽,通過將帶有相關(guān)標(biāo)簽的詞條設(shè)定為可用狀態(tài)而 實(shí)現(xiàn)對(duì)所述輔助詞庫的加載。
優(yōu)選的,可以通過以下方式完成對(duì)用戶當(dāng)前輸入環(huán)境的相關(guān)信息的采集 通過調(diào)用相應(yīng)的系統(tǒng)函數(shù)獲取當(dāng)前應(yīng)用程序的名稱;或者,通過調(diào)用相應(yīng)的系 統(tǒng)函數(shù)獲取剪貼板中的數(shù)據(jù);或者,通過調(diào)用相應(yīng)的系統(tǒng)函數(shù)獲取當(dāng)前窗口的 標(biāo)題;或者,通過調(diào)用相應(yīng)的系統(tǒng)函數(shù)獲取當(dāng)前應(yīng)用程序所操作的文件名稱及
其路徑,進(jìn)而掃描獲取該文件的內(nèi)容數(shù)據(jù);或者,通過調(diào)用相應(yīng)的系統(tǒng)函數(shù)獲 取當(dāng)前應(yīng)用程序向屏幕輸出的數(shù)據(jù);或者,通過當(dāng)前應(yīng)用程序的接口對(duì)象,獲 取相關(guān)信息。
優(yōu)選的,可以通過以下方式完成對(duì)用戶當(dāng)前輸入環(huán)境的相關(guān)信息的采集 通過網(wǎng)頁瀏覽器的接口對(duì)象,獲取當(dāng)前頁面的統(tǒng)一資源標(biāo)識(shí)符及內(nèi)容數(shù)據(jù)。 優(yōu)選的,在同一輸入環(huán)境中進(jìn)行多次采集和匹配。
優(yōu)選的,可以通過查詢預(yù)置對(duì)應(yīng)關(guān)系表的方式,完成用戶當(dāng)前輸入環(huán)境的 相關(guān)信息與輔助詞庫的匹配。也可以通過對(duì)所采集的文本語料數(shù)據(jù)進(jìn)行分析, 匹配得到與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫。
優(yōu)選的,所述輔助詞庫還可以位于服務(wù)器端。
優(yōu)選的,系統(tǒng)詞庫與所述輔助詞庫一同加載;或者,系統(tǒng)詞庫的加載完成 在所述輔助詞庫的加載之前。
依據(jù)本發(fā)明另一實(shí)施例,還公開了一種字符輸入的方法,包括加載系 統(tǒng)詞庫;采集用戶當(dāng)前輸入環(huán)境的相關(guān)信息;匹配獲得與用戶當(dāng)前輸入環(huán)境相 應(yīng)的輔助詞庫;加載所述與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫;接收用戶的 輸入信息;依據(jù)所接收的輸入信息,在所加載的系統(tǒng)詞庫和輔助詞庫中進(jìn)行 檢索,得到相應(yīng)的候選項(xiàng);接收用戶的選擇信息,輸出指定的候選項(xiàng)。
優(yōu)選的,所述的方法還可以包括卸載與用戶當(dāng)前輸入環(huán)境無關(guān)的輔助詞庫。
優(yōu)選的,可以通過以下方式完成對(duì)用戶當(dāng)前輸入環(huán)境的相關(guān)信息的采集 通過網(wǎng)頁瀏覽器的接口對(duì)象,獲取當(dāng)前頁面的統(tǒng)一資源標(biāo)識(shí)符及內(nèi)容數(shù)據(jù)。
優(yōu)選的,可以通過查詢預(yù)置對(duì)應(yīng)關(guān)系表的方式,完成用戶當(dāng)前輸入環(huán)境的 相關(guān)信息與輔助詞庫的匹配。也可以通過對(duì)所釆集的文本語料數(shù)據(jù)進(jìn)行分析, 匹配得到與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫。
進(jìn)一步,所述輔助詞庫也可以位于服務(wù)器端。
依據(jù)本發(fā)明的另一實(shí)施例,公開了一種輸入法系統(tǒng),包括
系統(tǒng)詞庫,用于記錄基礎(chǔ)字詞及其相關(guān)信息;
輔助詞庫,用于記錄擴(kuò)展字詞及其相關(guān)信息;
信息采集單元,用于采集用戶當(dāng)前輸入環(huán)境的相關(guān)信息;
匹配單元,用于依據(jù)所采集的相關(guān)信息,匹配獲得與用戶當(dāng)前輸入環(huán)境相
應(yīng)的輔助詞庫;
輔助詞庫應(yīng)用單元,用于加載所述與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫; 輸入接口單元,用于接收用戶的輸入信息;
信息轉(zhuǎn)換單元,用于依據(jù)所接收的輸入信息,在系統(tǒng)詞庫和所加載的輔助 詞庫中進(jìn)行檢索,得到相應(yīng)的候選項(xiàng);
顯示輸出單元,用于接收用戶的選擇信息,輸出指定的候選項(xiàng)。
優(yōu)選的,所述信息采集單元可以通過網(wǎng)頁瀏覽器的4妄口對(duì)象,獲取當(dāng)前頁 面的統(tǒng)一資源標(biāo)識(shí)符及內(nèi)容數(shù)據(jù)。
優(yōu)選的,所述匹配單元中包括預(yù)置的對(duì)應(yīng)關(guān)系表,通過查詢預(yù)置對(duì)應(yīng)關(guān)系 表的方式,完成用戶當(dāng)前輸入環(huán)境的相關(guān)信息與輔助詞庫的匹配。或者,所述 匹配單元中包括語料分析模塊,通過對(duì)所采集的文本語津+數(shù)據(jù)進(jìn)行分析,匹配 得到與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫。
進(jìn)一步,所述輔助詞庫也可以位于服務(wù)器端。
與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)
本發(fā)明通過多種手段檢測用戶當(dāng)前的輸入環(huán)境或者輸入內(nèi)容,以準(zhǔn)確判斷 該用戶的當(dāng)前需求,然后從多個(gè)輔助詞庫中選擇加載,從而非常好的滿足了用 戶的動(dòng)態(tài)需求,能夠克服現(xiàn)有技術(shù)中的詞頻調(diào)整無法針對(duì)新詞進(jìn)行調(diào)整的問 題,并無需用戶手動(dòng)設(shè)定,可以大幅度的提高用戶的輸入效率。
從詞庫改進(jìn)的歷史進(jìn)程來看,先是提高系統(tǒng)詞庫中詞頻的相對(duì)準(zhǔn)確性,從 而可以滿足大多數(shù)用戶對(duì)輸入效率的需求;進(jìn)而引入用戶詞庫技術(shù),以滿足各 個(gè)用戶不同的個(gè)性化需求;而本發(fā)明更是將單個(gè)用戶的需求進(jìn)行分解,可以滿 足該用戶在不同環(huán)境下的輸入需求,從而在提高用戶輸入效率方面實(shí)現(xiàn)質(zhì)的飛 躍。


圖1是本發(fā)明一種輸入法加載詞庫的方法實(shí)施例的步驟流程圖2a、圖2b和圖2c是本發(fā)明詞庫加載的三種具體實(shí)現(xiàn)方式示意圖3是本發(fā)明一種字符輸入方法實(shí)施例的步驟流程圖4是本發(fā)明一種輸入法系統(tǒng)實(shí)施例的結(jié)構(gòu)框圖。
具體實(shí)施例方式
為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式
對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說明。
本發(fā)明可以應(yīng)用于各種輸入方式的輸入法平臺(tái),包括鍵盤符號(hào)、手寫 信息以及語音輸入等等。即所述輸入信息可以包括編碼字符串,也可以包 括手寫輸入信息以及語音輸入的信息,因?yàn)檫@些輸入方式也都需要用到詞 庫進(jìn)行候選項(xiàng)排序。由于這些輸入方式中的信息轉(zhuǎn)換都屬于公知技術(shù),在 此就不詳述了 。下面僅4又以編碼字符串輸入為例進(jìn)行詳細(xì)說明。
另外,由于現(xiàn)有技術(shù)中,輸入法平臺(tái)可以運(yùn)行在多種計(jì)算設(shè)備上,例如, 個(gè)人電腦、個(gè)人數(shù)字助理、移動(dòng)終端設(shè)備等等,所以本發(fā)明也可以適用在上述 各種計(jì)算設(shè)備中。
本發(fā)明可以應(yīng)用于日文、韓文等需要出現(xiàn)候選詞排序的輸入法系統(tǒng), 例如,對(duì)于日文而言,由日文中的平假名、片假名拼成短語的時(shí)候就需要 出現(xiàn)候選詞排序。由于本發(fā)明在上述幾種輸入法系統(tǒng)中的應(yīng)用都是相似的, 所以為了方便說明,下面以對(duì)本發(fā)明應(yīng)用在中文的情況進(jìn)行舉例說明。
本發(fā)明所述的方法可以在由計(jì)算機(jī)執(zhí)行的計(jì)算機(jī)可執(zhí)行指令的一般上下 文中描述,例如程序模塊。 一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽 象數(shù)據(jù)類型的例程、程序、對(duì)象、組件、凄t據(jù)結(jié)構(gòu)等等。也可以在分布式計(jì)算 環(huán)境中實(shí)踐本發(fā)明,在這些分布式計(jì)算環(huán)境中,由通過通信網(wǎng)絡(luò)而被連接的遠(yuǎn) 程處理設(shè)備來執(zhí)行任務(wù)。在分布式計(jì)算環(huán)境中,程序模塊可以位于包括存儲(chǔ)設(shè) 備在內(nèi)的本地和遠(yuǎn)程計(jì)算機(jī)存儲(chǔ)介質(zhì)中。
本發(fā)明所述的輔助詞庫可以包括各種詞庫,例如,專業(yè)詞庫。專業(yè)詞庫是 基于不同專業(yè)領(lǐng)域的用戶所用的字詞、字詞搭配關(guān)系、詞頻信息和/或句法的 不同,為各類用戶定制對(duì)應(yīng)的專業(yè)詞庫, 一般可以按照學(xué)科領(lǐng)域?qū)⒃~庫分為醫(yī)
學(xué)類詞庫、電子類詞庫、IT類詞庫等等。當(dāng)然,用戶也可以自己根據(jù)需要進(jìn) 行制作、編輯和使用。專利申請(qǐng)?zhí)枮?00710099474.6,名稱為"一種字符輸入 的方法、輸入法系統(tǒng)及詞庫更新的方法"的中國專利申請(qǐng)文件中提及的細(xì)胞 詞庫可以作為另一種可行的輔助詞庫。所述細(xì)胞詞庫,具體含義為某一特定
群體、某一個(gè)人或一部分人使用的具有某一共性的詞庫(即每個(gè)細(xì)胞詞庫中的
字詞至少具有一個(gè)共同屬性),例如最新電影詞庫、最新歌名詞庫、魔獸世 界詞庫、生物學(xué)詞庫、清華大學(xué)所有人名詞庫、某某公司全體人名詞庫、海淀 區(qū)地名詞庫等。細(xì)胞詞庫可以通過細(xì)胞詞庫網(wǎng)站來提供用戶創(chuàng)建、編輯、檢索、 下載,進(jìn)而實(shí)現(xiàn)更高的個(gè)性化。
輔助詞庫主要用于記錄基礎(chǔ)字詞及其相關(guān)信息;其中,可以包含詞條信息, 也可以包含詞條的詞頻或者詞序信息。詞頻信息表達(dá)的是用戶使用該詞條的可 能性,其相對(duì)大小能夠代表詞序。詞序信息用來表達(dá)詞條的相對(duì)重要性,通常 可以反應(yīng)為詞條在候選項(xiàng)中的排序位置。某些情況下,也可以直接指定某詞條 在候選項(xiàng)中的位置(或者位置范圍)。對(duì)于中文拼音輸入法,輔助詞庫中的詞 條通常與對(duì)應(yīng)的拼音信息進(jìn)行關(guān)聯(lián)。但也可以直接與字母序列進(jìn)行關(guān)聯(lián),例如 搜狗拼音輸入法中的"自定義短語"。
參照?qǐng)D1,示出了本發(fā)明一種輸入法加載詞庫的方法實(shí)施例,具體可以包 括以下步驟
步驟IOI、采集用戶當(dāng)前輸入環(huán)境的相關(guān)信息; 步驟102、匹配獲得與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫; 步驟103、加載所述與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫。 通過上述步驟可以看出,當(dāng)通過所采集的信息得知用戶當(dāng)前的輸入環(huán)境發(fā) 生改變時(shí),本發(fā)明就可以實(shí)時(shí)的加載相應(yīng)的輔助詞庫,以提高用戶在當(dāng)前輸入 環(huán)境中的輸入效率和準(zhǔn)確率。通過加載相匹配的輔助詞庫, 一方面可以增加針 對(duì)該輸入環(huán)境的新詞,另一方面,可以調(diào)整候選項(xiàng)的排序位置以滿足當(dāng)前輸入 環(huán)境的需要。
需要說明的是,當(dāng)輸入環(huán)境改變后,如果原來加載的輔助詞庫已經(jīng)不再需 要,則本發(fā)明可以將其卸栽。
在本發(fā)明的一個(gè)優(yōu)選實(shí)施例中,所述輔助詞庫可以位于月l務(wù)器端,以實(shí)現(xiàn) 輔助詞庫的維護(hù)、更新,并降低對(duì)客戶端資源的占用。例如,當(dāng)用戶訪問一專 業(yè)的互聯(lián)網(wǎng)頁面,輸入法可以實(shí)時(shí)的向服務(wù)器端請(qǐng)求加載與該頁面相關(guān)的輔助 詞庫,下載到本地客戶端并加載之后,就可以滿足用戶在該頁面的輸入需求。
當(dāng)然,所述的服務(wù)器端可以是針對(duì)輸入法客戶端而言的,也可以是該頁面網(wǎng)站 的服務(wù)器端。
當(dāng)輔助詞庫位于服務(wù)器端時(shí), 一種情況是,本地輸入法完成輸入環(huán)境信息
采集和匹配,然后向服務(wù)器端發(fā)起下載請(qǐng)求,下載到本地后再加載;另一可能 的情況是,本地輸入法完成輸入環(huán)境信息的采集,而具體的輔助詞庫匹配和加 載、以及候選項(xiàng)的檢索都在服務(wù)器端完成。
實(shí)際上,與用戶當(dāng)前輸入環(huán)境相關(guān)的信息有多種多樣,不同的相關(guān)信息可 以從不同的角度反映該用戶當(dāng)前的輸入環(huán)境。下面簡單介紹一些步驟101中可 能采取的信息采集方式,僅僅用于舉例說明本發(fā)明的實(shí)現(xiàn),而不應(yīng)理解為對(duì)本 發(fā)明的限制。
方式1
通過調(diào)用相應(yīng)的系統(tǒng)函數(shù)獲取當(dāng)前應(yīng)用程序的名稱。因?yàn)閼?yīng)用程序的名稱 可以在一定程度上反映用戶的當(dāng)前需求,進(jìn)而加載相應(yīng)的輔助詞庫以滿足用戶 的當(dāng)前需求。 一般的,在windows操作系統(tǒng)中可以通過調(diào)用系統(tǒng)函數(shù) GetModuleFileName (參數(shù)),以讀取當(dāng)前應(yīng)用程序所對(duì)應(yīng)的文件名;也可以通 過調(diào)用系統(tǒng)函數(shù)GetCommandLine (參數(shù)),以獲取啟動(dòng)當(dāng)前應(yīng)用程序的命令 行信息。上述兩個(gè)函^:的調(diào)用,就可以識(shí)別出當(dāng)前應(yīng)用程序的名稱,例如, WinWord.exe, QQ.exe等等。
例如,輸入法啟動(dòng)后,調(diào)用GetModuleFilename發(fā)現(xiàn)應(yīng)用程序路徑名為 "C:\Program Files\Microsoft Office\OFFICEll\WINWORD.EXE",才艮據(jù)其文件名 "WinWord.exe,,識(shí)別其為word字處理軟件,進(jìn)而啟動(dòng)與文字寫作相關(guān)的輔助詞 庫。
上述系統(tǒng)函數(shù)的說明都是基于windows操作系統(tǒng)而言的,實(shí)際上,對(duì)于其 他的l喿作系統(tǒng),例如,Windows、 Linux、 MacOS、 FreeBSD, Unix, Solaris 等等,以及用于移動(dòng)終端的PalmOS, Windows Mobile, Symbian等等;不同 操作系統(tǒng)中的函數(shù)調(diào)用可能會(huì)有所不同,在此無法——列舉,所以下面的描述 中也僅僅以windows操作系統(tǒng)為例進(jìn)行說明,當(dāng)然,本領(lǐng)域技術(shù)人員應(yīng)該知悉, 本發(fā)明并不限定于windows操作系統(tǒng)中。
方式2
通過調(diào)用相應(yīng)的系統(tǒng)函數(shù)獲取剪貼板中的數(shù)據(jù);由于剪貼板中的數(shù)據(jù)也與 用戶當(dāng)前的輸入需求密切相關(guān),所以它也可以在一定程度上反映當(dāng)前輸入環(huán)境 的屬性;當(dāng)然,所述剪貼板中的文本數(shù)據(jù)對(duì)本發(fā)明而言是最重要的。 一般的, 在windows操作系統(tǒng)中可以通過調(diào)用系統(tǒng)函數(shù)OpenClipboard / GetClipboardData / CloseClipboard等等(用于查看剪貼板內(nèi)容)。由于輸入法 與應(yīng)用程序運(yùn)行于同 一地址空間中,這些系統(tǒng)函數(shù)的調(diào)用可以直接使用。
方式3
通過調(diào)用相應(yīng)的系統(tǒng)函數(shù)獲取當(dāng)前窗口的名稱,即通過向特定窗口發(fā)送消 息可以實(shí)現(xiàn)一些與窗口相關(guān)的功能。例如,QQ.exe的聊天窗口名為"與***聊 天中",只要向當(dāng)前窗口發(fā)送一個(gè)WM—GETTEXT消息就能夠取得該文字信息, 從而得到該用戶當(dāng)前的聊天對(duì)象,并加載與其相關(guān)的輔助詞庫即可。由于輸入 法與應(yīng)用程序運(yùn)行于同一地址空間中,這些窗口消息可以直接使用。當(dāng)然,對(duì) 于word等應(yīng)用程序,其當(dāng)前窗口的名稱一般就是當(dāng)前打開的文件名稱,也可 以在一定程度上反映用戶的當(dāng)前需求。
例如,用戶當(dāng)前的應(yīng)用程序窗口為針對(duì)字體相關(guān)的操作,則本發(fā)明可以通 過向頂層窗口發(fā)送WM一GETTEXT消息獲得窗口標(biāo)題"字體,,,從而判定用戶 進(jìn)行與字體有關(guān)的操作,進(jìn)而加載與字體名相關(guān)的輔助詞庫(例如,該詞庫就
是由各種常見的字體名詞條構(gòu)成,比如"宋體,,"楷體""雅黑"等等)。 方式4
通過鉤子函數(shù)獲取當(dāng)前應(yīng)用程序所操作的文件名稱及其路徑,進(jìn)而掃描獲 取該文件的內(nèi)容數(shù)據(jù)。由于輸入法與應(yīng)用程序運(yùn)行于同一地址空間中,輸入法 可以更改應(yīng)用程序本身的一些行為,為查看應(yīng)用程序狀態(tài)服務(wù)。這類似常見的 hook(鉤子)技術(shù),但hook需要先進(jìn)行進(jìn)程注入;輸入法已經(jīng)嵌入應(yīng)用程序, 沒有進(jìn)程注入的問題,實(shí)現(xiàn)起來要容易的多。 一般的,可以hook應(yīng)用程序的 文件操作OpenFile/ReadFile,從而了解當(dāng)前應(yīng)用程序都使用了哪些磁盤文件, 然后掃描這些文件,獲取其內(nèi)容數(shù)據(jù),并尋找與其匹配的輔助詞庫即可。
例如,識(shí)別出當(dāng)前應(yīng)用程序?yàn)閣ord字處理軟件后,hook系統(tǒng)的OpenFile 調(diào)用。發(fā)現(xiàn)打開的是一個(gè)名為"輸入法動(dòng)態(tài)加載詞庫的方法.doc"的文檔,則
可以打開該文檔,并依據(jù)其內(nèi)容數(shù)據(jù)匹配相關(guān)的輔助詞庫。
具體而言,對(duì)于文本文件(例如txt文件),可以直接讀取其文本數(shù)據(jù)。而
對(duì)于非文本文件,現(xiàn)有的操作系統(tǒng)一般都提供了 OLE技術(shù),OLE是Object Linking and Embedding的縮寫,可以翻譯為對(duì)象鏈接和嵌入。OLE是在客戶應(yīng) 用程序間傳輸和共享信息的一組綜合標(biāo)準(zhǔn),其允許創(chuàng)建帶有指向應(yīng)用程序的鏈 接的混合文檔以使用戶修改時(shí)不必在應(yīng)用程序間切換的協(xié)議。本發(fā)明可以利用
OLE技術(shù)讀取現(xiàn)有操:作系統(tǒng)上大部分文件中的文本數(shù)據(jù)。
例如,像Office、 PDF等文件在windows 2000以后的操作系統(tǒng),提供了 一個(gè)IFilter的COM接口,允許應(yīng)用程序注冊(cè)這個(gè)接口 。凡是注冊(cè)了這個(gè)接 口的應(yīng)用程序產(chǎn)生的文件,其他的應(yīng)用程序可以通過這個(gè)接口讀取其文本內(nèi) 容,比如對(duì)于O伍ce、 PDF等文件,本發(fā)明都可以通過這種方式讀取其文本內(nèi) 容。 一般過程可以為依據(jù)文件路徑獲取相應(yīng)文件的IFilter對(duì)象,判斷該文 件是否已被注冊(cè),如果該文件已被注冊(cè),則通過IFilter::GetValue獲取文本內(nèi) 容。
方式5
通過鉤子函數(shù)獲取當(dāng)前應(yīng)用程序向屏幕輸出的數(shù)據(jù); 一般的,可以hook 應(yīng)用程序的TextOut調(diào)用,監(jiān)視其向屏幕上輸出了哪些文本數(shù)據(jù),依據(jù)這些文 本數(shù)據(jù)匹配獲得相應(yīng)的輔助詞庫。以Windows操作系統(tǒng)為例, 一般的屏幕顯 示內(nèi)容都需要通過文本輸出函數(shù)(例如TextOut等)完成,則本發(fā)明可以給系 統(tǒng)掛API鉤子函數(shù)(Hook函數(shù))的方式實(shí)現(xiàn)屏幕文字的截取,如在TextOut 等文字輸出函數(shù)的開頭寫了一個(gè)jmp語句,通過Hook函數(shù),跳轉(zhuǎn)到事先定義 好的函數(shù)中,獲取要TextOut繪制的文本。通過這種方式,可以獲取通過屏幕 顯示的各種文本數(shù)據(jù)。例如,打開的郵件、即使通訊消息、word文檔等等。
例如,在QQ.exe中啟動(dòng)輸入法,輸入法可以hook應(yīng)用程序的DrawText 調(diào)用,監(jiān)視其向屏幕輸出的文字。采集到用戶的輸入內(nèi)容后,可以匹配加載與 聊天相關(guān)的輔助詞庫。
方式6
通過當(dāng)前應(yīng)用程序的接口對(duì)象,獲糾目關(guān)信息。對(duì)于 一些特殊的應(yīng)用程序, 通常都會(huì)提供一些公開的接口,以便進(jìn)行二次開發(fā),而本發(fā)明可以通過這些接
口對(duì)象,獲取所需的相關(guān)信息。
比較常用的情況是,取得網(wǎng)頁瀏覽器(例如,IE)的相應(yīng)COM對(duì)象,從 而獲取當(dāng)前網(wǎng)頁頁面的URI或者文本內(nèi)容等信息。
網(wǎng)絡(luò)上可用的每種資源HTML文檔、圖像、視頻片段、程序等等,都可 以由 一個(gè)統(tǒng)一資源標(biāo)識(shí)符(Uniform Resource Identifier,簡稱"URT )進(jìn)行定位。 URI—般由三部分組成訪問資源的命名機(jī)制;存放資源的主機(jī)名;資源自身 的名稱、路徑或者參數(shù)。在網(wǎng)絡(luò)資源數(shù)據(jù)傳輸領(lǐng)域中比較常用的是URL (Uniform Resource Location,統(tǒng)一資源定位符),URL是URI命名機(jī)制的一 個(gè)子集。
例如,輸入法啟動(dòng)后,如果能夠識(shí)別其為IE(應(yīng)用程序名為"iexplore.exe"), 則進(jìn)一步取得頁面URL。如果能夠判定其在寫博客(在http:〃blog.sohu.com/ 地址下),則可以加載與博客寫作相關(guān)的輔助詞庫。
上述舉例說明的各種方式既可以單獨(dú)應(yīng)用,也可以組合使用,以達(dá)到更好 的協(xié)同效果。而實(shí)際上,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,對(duì)于一些其他的操作系 統(tǒng)或者具體的應(yīng)用程序,則也可以采用各種特有的釆集方式,在此無法——詳 述。
下面簡單介紹步驟102中的具體匹配過程的幾個(gè)實(shí)施方式,僅僅用于舉例 說明本發(fā)明的實(shí)現(xiàn),而不應(yīng)理解為對(duì)本發(fā)明的限制。 匹配方式1
本發(fā)明可以采取對(duì)應(yīng)關(guān)系表的方式實(shí)現(xiàn)匹配過程。用于與輔助詞庫對(duì)照的 內(nèi)容可以是應(yīng)用程序名稱,也可以是網(wǎng)址URL、窗口標(biāo)題等內(nèi)容?;蛘咂渌?任意可以從當(dāng)前輸入環(huán)境中獲得的其他信息。
所述對(duì)應(yīng)關(guān)系表可以由用戶自己事先設(shè)定,或者由專業(yè)人員事先設(shè)定,或 者采用人工智能技術(shù)統(tǒng)計(jì)得到。當(dāng)然,用戶可以通過連接服務(wù)器端完成對(duì)應(yīng)關(guān) 系表的網(wǎng)絡(luò)更新。
匹配方式2
本發(fā)明還可以采取語料匹配的方式實(shí)現(xiàn)匹配過程。通過前述的各種信息采
集方式,可以獲得相應(yīng)的文本數(shù)據(jù),將所采集的文本數(shù)據(jù)進(jìn)行分詞之后與輔助 詞庫中的詞條進(jìn)行匹配,匹配度高于一定閾值的輔助詞庫就是當(dāng)前輸入環(huán)境需 要加載的輔助詞庫。另一種優(yōu)選的實(shí)施例是,針對(duì)每個(gè)輔助詞庫設(shè)定一段標(biāo)準(zhǔn) 文本,判斷所采集的文本數(shù)據(jù)與標(biāo)準(zhǔn)文本之間的相似度,相似度高于一定閾值 的輔助詞庫就是當(dāng)前輸入環(huán)境需要加載的輔助詞庫。 匹配方式3
本發(fā)明還可以采取信息分析的方式實(shí)現(xiàn)匹配過程。針對(duì)每個(gè)輔助詞庫都設(shè) 定相應(yīng)的屬性值或者類別值,然后對(duì)所采集的信息進(jìn)行分析,判斷該信息屬于
哪個(gè)類別,然后加載相應(yīng)類別的輔助詞庫即可。例如,對(duì)于URL: http://blog.sohu.com/,檢測到其中含有blog字符串,則確定應(yīng)加載blog類別的 輔助詞庫。再例如,可以針對(duì)一段文本數(shù)據(jù)進(jìn)行語義分析,將該文本數(shù)據(jù)按照 語義進(jìn)行分類,然后加載相應(yīng)類別的輔助詞庫即可。至于具體的語義分析過程, 則可以參考自然語言處理相關(guān)知識(shí)即可,本發(fā)明在此不再贅述。
上述三種方式而言,對(duì)應(yīng)關(guān)系表的匹配效率較高、實(shí)時(shí)性較好,但是準(zhǔn)確 性不是4艮高(僅根據(jù)應(yīng)用程序名稱、窗口標(biāo)題等信息容易導(dǎo)致判斷錯(cuò)誤)。而 采用信息分析或者語料匹配的方式,適應(yīng)性和準(zhǔn)確性都有所保證,但是由于積 累信息需要時(shí)間(例如字?jǐn)?shù)> 1000,或者時(shí)間超過一預(yù)設(shè)閾值),所以導(dǎo)致其 不能即時(shí)發(fā)揮作用,實(shí)時(shí)性稍差。根據(jù)實(shí)際情況選用或者組合使用,應(yīng)該是比 較好的選擇。
一般的,針對(duì)同一輸入環(huán)境,只要匹配記載一次即可;優(yōu)選的,針對(duì)同一 輸入環(huán)境,也可以反復(fù)執(zhí)行匹配過程,進(jìn)行多次采集和匹配,以提高輔助詞庫 加載的準(zhǔn)確性。當(dāng)然,由于匹配、加載具有一定代價(jià),有可能需要對(duì)匹配和加 載時(shí)間間隔進(jìn)行一定的控制。另外還可能需要考慮系統(tǒng)的CPU占用和內(nèi)存占 用(盡量在空閑時(shí)期進(jìn)41^司庫匹配和更新)。
下面筒單介紹步驟103中的具體輔助詞庫加載過程的幾個(gè)實(shí)施方式,4又僅 用于舉例說明本發(fā)明的實(shí)現(xiàn),而不應(yīng)理解為對(duì)本發(fā)明的限制。
由于系統(tǒng)詞庫主要用于記錄基礎(chǔ)字詞及其相關(guān)信息,以滿足用戶對(duì)普通詞 匯或者普通詞頻的使用習(xí)慣,所以優(yōu)選的,本發(fā)明也需要加載系統(tǒng)詞庫,將系 統(tǒng)詞庫數(shù)據(jù)和所需的輔助詞庫的數(shù)據(jù)都置于內(nèi)存空間中,可以滿足輸入過程中 的氺全索效率的要求。具體的,系統(tǒng)詞庫可以與所述輔助詞庫一同加載(例如,
匹配完成后,同時(shí)加載系統(tǒng)詞庫和輔助詞庫);或者,系統(tǒng)詞庫的加載也可以
完成在所述輔助詞庫的加載之前(例如,輸入法啟動(dòng)時(shí),先加載系統(tǒng)詞庫,再 進(jìn)行匹配)。由于輔助詞庫的匹配和加載過程可能需要較長的時(shí)間,所以先加 載系統(tǒng)詞庫,可以保證輸入法較快速度的啟動(dòng),并能夠打字,雖然準(zhǔn)確度不高, 但是幾秒鐘之后輔助詞庫加載完畢,就能夠達(dá)到很好的效果,而避免出現(xiàn)輸入 法啟動(dòng)較慢的情況出現(xiàn)。
力口載方式1
將所需的輔助詞庫合并至所述系統(tǒng)詞庫,置于內(nèi)存空間中,該方式可以適
用于系統(tǒng)詞庫和輔助詞庫同時(shí)加載的情況。參照?qǐng)D2a,將輔助詞庫201、輔助 詞庫202和輔助詞庫20n合并到系統(tǒng)詞庫200中。 力口載方式2
將所需的輔助詞庫合并至一擴(kuò)展詞庫中,所述擴(kuò)展詞庫與系統(tǒng)詞庫并列。 該方式的好處在于,當(dāng)輸入環(huán)境頻繁改變時(shí),不需要多次加載或重建系統(tǒng)詞庫。 參照?qǐng)D2b,將輔助詞庫201、輔助詞庫202和輔助詞庫20n合并到與系統(tǒng)詞庫 200并列的擴(kuò)展詞庫210中。
力口載方式3
將所需的輔助詞庫作為各個(gè)獨(dú)立的詞庫置于內(nèi)存中;該方式的好處是可以 滿足頻繁加載,但是由于各個(gè)輔助詞庫分別檢索,可能需要付出一定的檢索代 價(jià)。參照?qǐng)D2c,將輔助詞庫201、輔助詞庫202和輔助詞庫20n分別、獨(dú)立的 加載。
力口載方式4
在啟動(dòng)輸入法時(shí),將系統(tǒng)詞庫和所有輔助詞庫都合并置于內(nèi)存中,并針對(duì) 每個(gè)詞條設(shè)定標(biāo)簽,通過將帶有相關(guān)標(biāo)簽的詞條沒定為可用狀態(tài)而實(shí)現(xiàn)對(duì)所述 輔助詞庫的加載。
也就是說,本發(fā)明的加載應(yīng)該是指確定有效/無效的過程,而不限于^f茲盤 的讀取操作。
實(shí)際中,依據(jù)計(jì)算設(shè)備硬件資源的情況或者具體應(yīng)用環(huán)境的不同,本領(lǐng)域 技術(shù)人員可以選用上述任一方式或者組合優(yōu)化,以兼顧各方需求。
參照?qǐng)D3,示出了一種字符輸入的方法實(shí)施例,具體可以包括以下步驟 步驟301、加載系統(tǒng)詞庫;
步驟302、采集用戶當(dāng)前輸入環(huán)境的相關(guān)信息;例如,通過網(wǎng)頁瀏覽器的 接口對(duì)象,獲取當(dāng)前頁面的統(tǒng)一資源標(biāo)識(shí)符及內(nèi)容數(shù)據(jù);
步驟303、匹配獲得與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫;例如,可以通 過查詢預(yù)置對(duì)應(yīng)關(guān)系表的方式,完成用戶當(dāng)前輸入環(huán)境的相關(guān)信息與輔助詞庫 的匹配;或者,也可以通過對(duì)所采集的文本語料數(shù)據(jù)進(jìn)行分析,匹配得到與用 戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫;
步驟304、加載所述與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫;優(yōu)選的,所加 載的輔助詞庫可以位于本地客戶端,也可以位于網(wǎng)絡(luò)服務(wù)器端;
步驟305、卸載與用戶當(dāng)前輸入環(huán)境無關(guān)的輔助詞庫;
步驟306、接收用戶的輸入信息;
步驟307、依據(jù)所接收的輸入信息,在所加載的系統(tǒng)詞庫和輔助詞庫中進(jìn) 行;險(xiǎn)索,得到相應(yīng)的候選項(xiàng);
步驟308、接收用戶的選擇信息,輸出指定的候選項(xiàng)。
本實(shí)施例中步驟302的信息采集、步驟303的詞庫匹配、步驟304的詞庫 加載,在前面的實(shí)施例中已經(jīng)詳細(xì)介紹過,因此,在此不再贅述。
對(duì)于步驟307的檢索過程, 一般的,可以設(shè)定輔助詞庫的權(quán)重值大于已有 詞庫的權(quán)重值,例如,最簡單的一種情況,檢索策略可以設(shè)定為輔助詞庫中詞 的排序都先于系統(tǒng)詞庫中的詞。當(dāng)然,也可以通過用戶^1定的方式或者通過自 動(dòng)設(shè)定的方式,將輔助詞庫中的詞條直接以固定位置展現(xiàn)。
優(yōu)選的,在本實(shí)施例中,采用的檢索策略可以為當(dāng)某個(gè)候選項(xiàng)僅僅在已 有詞庫(包括系統(tǒng)詞庫和/或用戶詞庫)中4企索到,則以該候選項(xiàng)在已有詞庫 中的詞頻或其他信息為依據(jù)進(jìn)行排序;當(dāng)某個(gè)候選項(xiàng)僅僅在輔助詞庫中檢索 到,則以該候選項(xiàng)在輔助詞庫中的詞序或者其他信息為依據(jù)進(jìn)行排序;當(dāng)某個(gè) 候選項(xiàng)在已有詞庫和輔助詞庫中都找到,則可以對(duì)該詞條的詞頻進(jìn)行加權(quán)修
正,依據(jù)修正后的詞頻進(jìn)行排序(當(dāng)然,對(duì)于修正后的詞頻可以進(jìn)行存儲(chǔ),也 可以不進(jìn)行存儲(chǔ))。
對(duì)于前述的各方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動(dòng)作 組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制, 因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。例如,加載系統(tǒng)
詞庫的步驟301可以最先執(zhí)行,也可以與步驟304—同執(zhí)行。再例如,本發(fā)明 也不需要限定步驟304和305的執(zhí)行順序,在某些情況下(例如,內(nèi)存中沒有 無關(guān)詞庫時(shí)),還可以不執(zhí)行步驟305。
參照?qǐng)D4,示出了 一種輸入法系統(tǒng)的實(shí)施例,具體可以包括以下部件
系統(tǒng)詞庫401,用于記錄基礎(chǔ)字詞及其相關(guān)信息;
輔助詞庫402,用于記錄擴(kuò)展字詞及其相關(guān)信息;
信息采集單元403,用于采集用戶當(dāng)前輸入環(huán)境的相關(guān)信息;
匹配單元404,用于依據(jù)所采集的相關(guān)信息,匹配獲得與用戶當(dāng)前輸入環(huán) 境相應(yīng)的輔助詞庫;
輔助詞庫應(yīng)用單元405,用于加載所述與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞 庫;優(yōu)選的,所加載的輔助詞庫可以位于本地客戶端,也可以位于網(wǎng)絡(luò)服務(wù)器 端;進(jìn)一步,在某些情況下,輔助詞庫應(yīng)用單元405還需要用于完成任務(wù)卸 載與用戶當(dāng)前輸入環(huán)境無關(guān)的輔助詞庫;
輸入接口單元406,用于4矣收用戶的輸入信息;
信息轉(zhuǎn)換單元407,用于依據(jù)所接收的輸入信息,在系統(tǒng)詞庫和所加載的
輔助詞庫中進(jìn)行檢索,得到相應(yīng)的候選項(xiàng);
顯示輸出單元408,用于接收用戶的選擇信息,輸出指定的候選項(xiàng)。 所述信息采集單元403可以采用各種可行的方式完成信息采集,優(yōu)選的,
可以通過網(wǎng)頁瀏覽器的接口對(duì)象,獲取當(dāng)前頁面的統(tǒng)一資源標(biāo)識(shí)符及內(nèi)容數(shù)據(jù)。
在本發(fā)明一個(gè)實(shí)施例中,所述匹配單元404中可以包括預(yù)置的對(duì)應(yīng)關(guān)系 表,通過查詢預(yù)置對(duì)應(yīng)關(guān)系表的方式,完成用戶當(dāng)前輸入環(huán)境的相關(guān)信息與輔 助詞庫的匹配。在本發(fā)明的另一個(gè)實(shí)施例中,所述匹配單元404中包括語料分
析模塊,通過對(duì)所采集的文本語料數(shù)據(jù)進(jìn)行分析,匹配得到與用戶當(dāng)前輸入環(huán) 境相應(yīng)的輔助詞庫。
上述輸入法系統(tǒng)的實(shí)施例可以為普通llr入法系統(tǒng),如,通過用戶本地
計(jì)算設(shè)備完成整個(gè)輸入過程,包括信息輸入、信息轉(zhuǎn)換以及顯示輸出。上 述輸入法系統(tǒng)的實(shí)施例也可以為網(wǎng)絡(luò)輸入法系統(tǒng),如,通過用戶本地計(jì)算 設(shè)備完成輸入信息的接入,以及候選項(xiàng)的顯示輸出,而信息轉(zhuǎn)換過程則在 另一計(jì)算設(shè)備中完成。也就是說,本發(fā)明并不需要限定輸入法系統(tǒng)實(shí)施例 中的各個(gè)模塊的具體地理位置,只要具有相應(yīng)的功能和相應(yīng)的連接關(guān)系即 可。
需要說明的是,本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,每個(gè)實(shí) 施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同相似的部 分互相參見即可。對(duì)于系統(tǒng)實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以 描述的比較筒單,相關(guān)之處參見方法實(shí)施例的部分說明即可。其次,本領(lǐng)域技 術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng) 作和模塊并不一定是本發(fā)明所必須的。
以上對(duì)本發(fā)明所提供的一種加載詞庫的方法, 一種字符輸入的方法以及一 種輸入法系統(tǒng),進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí) 施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核
心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施
方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說明書內(nèi)容不應(yīng)理解為對(duì)本 發(fā)明的限制。
權(quán)利要求
1.一種輸入法加載詞庫的方法,其特征在于,包括采集用戶當(dāng)前輸入環(huán)境的相關(guān)信息;匹配獲得與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫;加載所述與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫。
2、 如權(quán)利要求l所述的方法,其特征在于,還包括 卸載與用戶當(dāng)前輸入環(huán)境無關(guān)的輔助詞庫。
3、 如權(quán)利要求1所述的方法,其特征在于,通過以下方式完成加載輔助 詞庫的過程將所需的輔助詞庫合并至所述系統(tǒng)詞庫中;或者,將所需的輔助詞庫合并至一擴(kuò)展詞庫中,所述擴(kuò)展詞庫與系統(tǒng)詞庫 并列;或者,將所需的輔助詞庫作為各個(gè)獨(dú)立的詞庫置于內(nèi)存中; 或者,在啟動(dòng)輸入法時(shí),將系統(tǒng)詞庫和所有輔助詞庫都合并置于內(nèi)存中, 并針對(duì)每個(gè)詞條設(shè)定標(biāo)簽,通過將帶有相關(guān)標(biāo)簽的詞條沒定為可用狀態(tài)而實(shí)現(xiàn)對(duì)所述輔助詞庫的加載。
4、 如權(quán)利要求1所述的方法,其特征在于,通過以下方式完成對(duì)用戶當(dāng) 前輸入環(huán)境的相關(guān)信息的采集通過調(diào)用相應(yīng)的系統(tǒng)函數(shù)獲取當(dāng)前應(yīng)用程序的名稱; 或者,通過調(diào)用相應(yīng)的系統(tǒng)函數(shù)獲取剪貼板中的數(shù)據(jù); 或者,通過調(diào)用相應(yīng)的系統(tǒng)函數(shù)獲取當(dāng)前窗口的標(biāo)題; 或者,通過調(diào)用相應(yīng)的系統(tǒng)函數(shù)獲取當(dāng)前應(yīng)用程序所操作的文件名稱及其 路徑,進(jìn)而掃描獲取該文件的內(nèi)容數(shù)據(jù);或者,通過調(diào)用相應(yīng)的系統(tǒng)函數(shù)獲取當(dāng)前應(yīng)用程序向屏幕輸出的數(shù)據(jù); 或者,通過當(dāng)前應(yīng)用程序的接口對(duì)象,獲取相關(guān)信息。
5、 如權(quán)利要求1所述的方法,其特征在于,通過以下方式完成對(duì)用戶當(dāng) 前輸入環(huán)境的相關(guān)信息的釆集通過網(wǎng)頁瀏覽器的接口對(duì)象,獲取當(dāng)前頁面的統(tǒng) 一 資源標(biāo)識(shí)符及內(nèi)容數(shù)
6、 如權(quán)利要求1所述的方法,其特征在于,在同一輸入環(huán)境中多次采集和匹配。
7、 如權(quán)利要求1所述的方法,其特征在于,通過查詢預(yù)置對(duì)應(yīng)關(guān)系表的 方式,完成用戶當(dāng)前輸入環(huán)境的相關(guān)信息與輔助詞庫的匹配。
8、 如權(quán)利要求1所述的方法,其特征在于,通過對(duì)所采集的文本語料數(shù) 據(jù)進(jìn)行分析,匹配得到與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫。
9、 如權(quán)利要求1或5所述的方法,其特征在于,所述輔助詞庫位于服務(wù) 器端。
10、 如權(quán)利要求l所述的方法,其特征在于, 系統(tǒng)詞庫與所述輔助詞庫一 同加載;或者,系統(tǒng)詞庫的加載完成在所述輔助詞庫的加載之前。
11、 一種字符輸入的方法,其特征在于,包括 力口載系統(tǒng)詞庫;采集用戶當(dāng)前輸入環(huán)境的相關(guān)信息; 匹配獲得與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫; 加載所述與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫; 接收用戶的輸入信息;依據(jù)所接收的輸入信息,在所加載的系統(tǒng)詞庫和輔助詞庫中進(jìn)行檢索,得 到相應(yīng)的4美選項(xiàng);接收用戶的選擇信息,輸出指定的候選項(xiàng)。
12、 如權(quán)利要求11所述的方法,其特征在于,還包括 卸載與用戶當(dāng)前輸入環(huán)境無關(guān)的輔助詞庫。
13、 如權(quán)利要求11所述的方法,其特征在于,通過以下方式完成對(duì)用戶 當(dāng)前輸入環(huán)境的相關(guān)信息的采集通過網(wǎng)頁瀏覽器的接口對(duì)象,獲取當(dāng)前頁面的統(tǒng) 一 資源標(biāo)識(shí)符及內(nèi)容數(shù)據(jù)。
14、 如權(quán)利要求11所述的方法,其特4i在于,通過查詢預(yù)置對(duì)應(yīng)關(guān)系表 的方式,完成用戶當(dāng)前輸入環(huán)境的相關(guān)信息與輔助詞庫的匹配。
15、 如權(quán)利要求11所述的方法,其特征在于,通過對(duì)所采集的文本語料 數(shù)據(jù)進(jìn)行分析,匹配得到與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫。
16、 如權(quán)利要求11或13所述的方法,其特征在于,所述輔助詞庫位于服 務(wù)器端。
17、 一種輸入法系統(tǒng),其特征在于,包括 系統(tǒng)詞庫,用于記錄基礎(chǔ)字詞及其相關(guān)信息; 輔助詞庫,用于記錄擴(kuò)展字詞及其相關(guān)信息; 信息釆集單元,用于采集用戶當(dāng)前輸入環(huán)境的相關(guān)信息;匹配單元,用于依據(jù)所采集的相關(guān)信息,匹配獲得與用戶當(dāng)前輸入環(huán)境相 應(yīng)的輔助詞庫;輔助詞庫應(yīng)用單元,用于加載所述與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫; 輸入接口單元,用于接收用戶的輸入信息;信息轉(zhuǎn)換單元,用于依據(jù)所接收的輸入信息,在系統(tǒng)詞庫和所加載的輔助 詞庫中進(jìn)行檢索,得到相應(yīng)的候選項(xiàng);顯示輸出單元,用于接收用戶的選擇信息,輸出指定的候選項(xiàng)。
18、 如權(quán)利要求17所述的系統(tǒng),其特征在于,所述信息采集單元通過網(wǎng)頁瀏覽器的"^妄口對(duì)象,獲取當(dāng)前頁面的統(tǒng)一資源 標(biāo)識(shí)符及內(nèi)容數(shù)據(jù)。
19、 如權(quán)利要求17所述的系統(tǒng),其特征在于,所述匹配單元中包括預(yù)置的對(duì)應(yīng)關(guān)系表,通過查詢預(yù)置對(duì)應(yīng)關(guān)系表的方 式,完成用戶當(dāng)前輸入環(huán)境的相關(guān)信息與輔助詞庫的匹配。
20、 如權(quán)利要求17所述的系統(tǒng),其特征在于,所述匹配單元中包括語料分析模塊,通過對(duì)所采集的文本語料數(shù)據(jù)進(jìn)行分 析,匹配得到與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫。
21、 如權(quán)利要求17或18所述的系統(tǒng),其特征在于,所述輔助詞庫位于服 務(wù)器端。
全文摘要
本發(fā)明提供了一種字符輸入的方法,包括加載系統(tǒng)詞庫;采集用戶當(dāng)前輸入環(huán)境的相關(guān)信息;匹配獲得與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫;加載所述與用戶當(dāng)前輸入環(huán)境相應(yīng)的輔助詞庫;接收用戶的輸入信息;依據(jù)所接收的輸入信息,在所加載的系統(tǒng)詞庫和輔助詞庫中進(jìn)行檢索,得到相應(yīng)的候選項(xiàng);接收用戶的選擇信息,輸出指定的候選項(xiàng)。本發(fā)明通過多種手段檢測用戶當(dāng)前的輸入環(huán)境或者輸入內(nèi)容,以準(zhǔn)確判斷該用戶的當(dāng)前需求,然后從多個(gè)輔助詞庫中選擇加載,從而非常好的滿足了用戶的動(dòng)態(tài)需求,能夠克服現(xiàn)有技術(shù)中的詞頻調(diào)整無法針對(duì)新詞進(jìn)行調(diào)整的問題,并無需用戶手動(dòng)設(shè)定,可以大幅度的提高用戶的輸入效率。
文檔編號(hào)G06F17/30GK101373468SQ200710120490
公開日2009年2月25日 申請(qǐng)日期2007年8月20日 優(yōu)先權(quán)日2007年8月20日
發(fā)明者磊 楊, 趙華中 申請(qǐng)人:北京搜狗科技發(fā)展有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1