專利名稱:日語輸入系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及日語輸入系統(tǒng),特別是涉及利用單詞的品詞信息進行假名漢字變換的日語輸入系統(tǒng)。
在用假名漢字辭典將輸入的假名字符變換成漢字的日語輸入系統(tǒng)中,假名漢字辭典沒有登錄的單詞用通常的漢字變換操作不能變換,為了輸入假名漢字辭典沒有登錄的口語體,例如「行つちやつた」、「なつちやつた」等,需要進行輸入無變換確定用的鍵等的特殊操作。但是,當頻繁使用口語體時,每次都要進行特殊操作,所以會導致日語輸入效率降低。
通過將使用的口語體進行單詞登錄,可以用通常的假名漢字變換操作進行變換。但是,對于頻繁使用口語體的情況,由于將它們都分別作為一個單詞登錄,所以會增大假名漢字變換辭典的容量。
所以也有例如登錄相當于上述的「行つちやつた」、「なつちやつた」的「ちやつ」的附屬語的品詞和包含該品詞的「行つ 」、「なつ」及「た」連接信息的品詞信息的定義,利用已登錄的品詞,只將「ちやつ」進行單詞登錄,就可變換「行つちやつた」、「なつちやつた」的日語輸入系統(tǒng)。
當?shù)卿浬鲜鲂缕吩~時,存在用戶不得不定義品詞的各種信息的問題。
而且,現(xiàn)有的日語輸入系統(tǒng),因為用戶不得不定義品詞的各種信息,所以還存在因用戶定義的品詞的各種信息導致誤變換的問題。
本發(fā)明針對上述情況,目的是提供利用日語輸入系統(tǒng)提供的原有品詞信息合成新品詞,使用戶不用定義品詞信息也能定義新品詞信息,而且受由新品詞的追加帶來的誤變換的影響小的日語輸入系統(tǒng)。
在日語輸入系統(tǒng)中,規(guī)定品詞的主要信息是在具有該品詞的單詞前后連接具有什么品詞的單詞來構成一個詞組這樣的連接信息。
為了實現(xiàn)上述目的,技術方案1記載的發(fā)明的特征是日語輸入系統(tǒng)包括輸入假名、輸入各種變換及登錄等的輸入裝置,顯示假名輸入及各種變換結果等內容的顯示裝置、用假名漢字變換辭典將已輸入的假名字符變換成假名漢字混合文的處理裝置。上述日語輸入系統(tǒng)的處理裝置包括預先存儲包括品詞及各品詞的連接信息的品詞信息的品詞信息存儲裝置,將已輸入的單詞的品詞從假名漢字辭典讀出的品詞讀出裝置,用上述品詞信息存儲裝置檢索從上述品詞讀出裝置讀出的品詞間連接信息,判定上述讀出的品詞與相連接的品詞間連接的連接信息判定裝置,控制包括上述品詞信息存儲裝置、品詞讀出裝置及連接信息判定裝置的各個部分,同時根據(jù)上述連接信息判定裝置的判定結果進行假名漢字變換的控制裝置。
而且,技術方案2記載的發(fā)明,在技術方案1記載的日語輸入系統(tǒng)中,其特征是上述品詞間的連接信息將表示應連接在成為變換對象的品詞前面的品詞的連接的前連接信息部和表示應連接在成為變換對象的品詞后面的品詞的連接的后連接信息部作為成為上述變換對象的品詞的獨立屬性信息存儲到上述品詞信息存儲裝置。
而且,技術方案3記載的發(fā)明,在技術方案1或技術方案2任何一項記載的日語輸入系統(tǒng)中,上述處理裝置還包括當上述輸入裝置有品詞登錄要求時,從上述品詞信息存儲裝置讀出品詞信息,對于被要求登錄的品詞的連接信息由已登錄的前連接信息部和后連接信息部構成的情況,將包含品詞和其品詞連接信息的品詞信息的定義登錄到上述品詞信息存儲裝置的品詞登錄裝置,當上述輸入裝置有單詞登錄要求時,對于被要求登錄的單詞指定的品詞登錄在上述品詞信息存儲裝置的情況,將上述要求登錄的單詞登錄到上述假名漢字辭典的單詞登錄裝置。
根據(jù)技術方案1至技術方案3記載的發(fā)明,存儲于品詞信息存儲裝置的各品詞的品詞信息中,將表示應連接在成為變換對象的品詞前面的品詞的連接的前連接信息部和表示應連接在成為變換對象的品詞后面的品詞的連接的后連接信息部這兩個獨立的屬性信息作為品詞間的連接信息預定義好,追加新品詞時,關于品詞信息的連接信息,能夠合成挪用了原有的一個品詞的前連接信息部和原有的另一個品詞的后連接信息部而成的新的品詞連接信息部,可以追加具有基于挪用的品詞的前連接信息部及后連接信息部的品詞,所以用戶不用定義品詞信息,也可以定義新品詞,可以實現(xiàn)受追加新品詞帶來的誤變換影響小的日語輸入系統(tǒng)。
而且,技術方案4記載的發(fā)明的特征在于由具有輸入裝置及顯示裝置的功能、及數(shù)據(jù)收發(fā)功能的假名漢字變換客戶機和技術方案1至技術方案3任何一項記載的處理裝置構成,構成上述處理裝置的控制裝置是有假名漢字變換功能及數(shù)據(jù)收發(fā)功能的假名漢字變換服務器,以客戶機服務器方式進行假名漢字變換。
而且,技術方案4記載的發(fā)明的特征在于由具有輸入裝置及顯示裝置的功能、及數(shù)據(jù)收發(fā)功能的假名漢字變換客戶機和技術方案1至技術方案3任何一項記載的處理裝置構成,構成上述處理裝置的控制裝置是有假名漢字變換功能及數(shù)據(jù)收發(fā)功能的假名漢字變換服務器,以客戶機服務器方式進行假名漢字變換,所以用戶不用定義品詞信息,也能定義新品詞,可以實現(xiàn)受追加新品詞帶來的誤變換影響小的日語輸入系統(tǒng)。
圖1表示與本發(fā)明的第一實施形態(tài)有關的日語輸入系統(tǒng)結構的方框圖。
圖2用圖1所示的處理裝置執(zhí)行的有關品詞登錄處理的一例流程圖。
圖3用圖1所示的處理裝置執(zhí)行的有關單詞登錄處理的一例流程圖。
圖4表示與本發(fā)明的第2實施形態(tài)有關的日語輸入系統(tǒng)結構的方框圖。
10 輸入裝置20 顯示裝置30 處理裝置100 變換引擎102 品詞讀出裝置104 連接信息判定裝置106 品詞連接存儲部108 品詞登錄裝置110 單詞登錄裝置112 假名漢字變換辭典200 假名漢字變換客戶機302 假名漢字變換服務器下面,關于本發(fā)明實施形態(tài),參考圖示進行詳細說明。圖1示出與本發(fā)明的第1實施形態(tài)有關的日語輸入系統(tǒng)的結構。在圖1中,日語輸入系統(tǒng)包括輸入裝置10、顯示裝置20和處理裝置30。
輸入裝置10是由例如鍵盤構成,顯示裝置20由例如CRT顯示器構成。輸入裝置10用于假名的輸入、假名漢字變換要求的輸入、品詞登錄要求的輸入、單詞登錄要求的輸入等。
顯示裝置20用于輸入的假名的顯示、包含變換后的漢字的文章的顯示等。
而且,處理裝置30控制包括品詞信息存儲部106、品詞讀出裝置102及連接信息判定裝置104的各個部分,同時具有根據(jù)連接信息判定裝置的判定結果,進行假名漢字變換的變換引擎100,從假名漢字辭典112讀出輸入單詞的品詞的品詞讀出裝置102,從品詞信息存儲部106檢索從品詞讀出裝置102讀出的品詞的連接信息,判定讀出的品詞和連接的品詞之間的連接的連接信息判定裝置104,預先存儲包含品詞及該品詞間的連接信息的品詞信息的品詞信息存儲部106,將包含品詞和該品詞的連接信息的品詞信息的定義登錄到品詞信息存儲部106的品詞登錄裝置108,被要求登錄的單詞指定的品詞登錄在品詞信息存儲部106時、將要求登錄的單詞登錄到假名漢字變換辭典112的單詞登錄裝置110和假名漢字變換辭典112。
品詞信息存儲部106存儲了包含日語輸入系統(tǒng)中使用的品詞,各品詞間的連接信息的品詞信息。品詞的連接信息將表示對前面品詞的連接的前連接信息部和表示對后面品詞的連接的后連接信息部作為兩個獨立屬性信息進行保持。例如,構成「行つてしまつた」及「なつてしまつた」文章的單詞的品詞的連接信息分別由“I1+I2”、“Te1+Te2”、“Sm1+Sm2”、“Ta1+Ta2”、“Na1+Na2”(“前連接信息部+后連接信息部”)兩個獨立的信息構成時,定義“相當于「て」單詞的品詞保持前連接信息Te1及后連接信息Te2”等各個品詞保持的連接信息,及對于各個連接信息部定義“前連接信息部Te1的前面連接I1或Na2”、“后連接信息部Sm2的后面連接Ta1”等的連接信息。
當輸入裝置輸入假名及假名漢字變換要求時,變換引擎100就啟動品詞讀出裝置102,讀入假名漢字變換辭典112,從讀入的假名漢字變換辭典112讀出輸入的假名的品詞信息。之后,變換引擎100啟動連接信息判定裝置104,判定從假名漢字辭典112讀出的品詞的連接信息,根據(jù)連接信息的判定結果,將假名變換成漢字。而且,輸入裝置10輸入品詞登錄要求時,變換引擎100就通知品詞登錄裝置108,登錄要求的品詞。輸入裝置10輸入單詞登錄要求時,變換引擎100就通知單詞登錄裝置110,登錄要求的單詞。
圖2示出在處理裝置30的處理中,用品詞登錄裝置108進行品詞登錄處理的一個例子。下面,關于品詞登錄處理的內容,參考圖1及圖2進行說明。
品詞登錄裝置108一被通知有品詞登錄要求,就確認必要的品詞信息是否都被指定,當所有信息都被指定時,即步驟50被判定為肯定時,從品詞信息存儲部106讀入品詞信息(步驟52)。
當步驟50被判定為否定、品詞信息不足時,即步驟50被判定為否定時,結束處理。而且,讀入品詞信息后,在步驟54中,連接信息判定裝置104判定要求登錄的品詞的連接信息部是否由已登錄的前連接信息部和后連接信息部構成,步驟54被判定為肯定時,即被判定為由已登錄的各連接信息部構成時,品詞登錄裝置將要求登錄的品詞登錄到品詞信息存儲部106(步驟58),結束品詞登錄處理。
步驟54被判定為否定時,即被指定的連接信息部沒有由已登錄的各連接信息部構成時,在步驟56中,將被指定的連接信息登錄到品詞信息存儲部106,而且,在步驟58中,將要求登錄的品詞登錄到品詞信息存儲部106,結束品詞登錄處理。例如,如上述例,品詞信息被登錄到品詞信息存儲部106時,要求登錄具有“Te1+Sm2”連接信息的品詞時,因為Te1已作為前連接信息部被登錄,Sm2已作為后連接信息部被登錄,故品詞登錄裝置108登錄具有Te1前連接信息及Sm2后連接信息的品詞。
下面,圖3示出在處理裝置30的處理中,用單詞登錄裝置110進行單詞登錄處理的一個例子。以下,關于單詞登錄處理的內容,參考圖1至圖3進行說明。
單詞登錄裝置110一被通知有單詞登錄要求,就在步驟60中,從品詞信息存儲部106讀入品詞信息,在步驟62中,判定被要求登錄的單詞指定的品詞是否登錄在品詞信息存儲部106。步驟62被判定為肯定時,即已登錄時,在步驟64中,登錄要求登錄在假名漢字變換辭典112的單詞,結束處理。
步驟62被判定為否定時,即被指定的品詞沒有登錄在品詞信息存儲部106時,不進行單詞登錄,結束處理。例如,上述例中,指定登錄的品詞(有“Te1+Sm2”連接信息),要求登錄「ちやつ」單詞時,單詞登錄裝置110登錄單詞「ちやつ」。
根據(jù)與本發(fā)明的第一實施形態(tài)有關的日語輸入系統(tǒng),存儲于品詞信息存儲裝置的各品詞的品詞信息中,將表示應連接在成為變換對象的品詞前面的品詞的連接的前連接信息部和表示應連接在成為變換對象的品詞后面的品詞的連接的后連接信息部這兩個獨立的屬性信息作為品詞間的連接信息預定義好,追加新品詞時,關于品詞信息的連接信息,能夠合成挪用了原有的一個品詞的前連接信息部和原有的另一個品詞的后連接信息部而成的新的品詞連接信息部,可以追加具有基于挪用的品詞的前連接信息部及后連接信息部的品詞,所以用戶不用定義品詞信息,也可以定義新品詞,可以實現(xiàn)受追加新品詞帶來的誤變換影響小的日語輸入系統(tǒng)。
圖4示出與本發(fā)明的第二實施形態(tài)有關的日語輸入系統(tǒng)的結構。與本實施的形態(tài)有關的日語輸入系統(tǒng)是以客戶機服務器方式進行假名漢字變換的日語輸入系統(tǒng),由成為服務器的處理裝置300和,與其相連接并可以進行通信的多個假名漢字變換客戶機200(為方便說明,圖4中只示出一個假名漢字變換客戶機200。)構成。
未圖示的假名漢字變換客戶機200,具有用于假名的輸入、假名漢字變換要求的輸入、品詞登錄要求的輸入、單詞登錄要求的輸入等的輸入裝置,例如鍵盤,用于輸入假名的顯示、包含變換后漢字的文章的顯示等的顯示裝置,例如CRT顯示器,將包含成為變換對象的假名的假名漢字變換要求和輸入的品詞及單詞的登錄要求等發(fā)送給處理裝置300,接收來自處理裝置300的假名漢字變換結果等的收發(fā)裝置。處理裝置300與圖1所示的日語處理系統(tǒng)中的30在結構上的區(qū)別是用漢字變換服務器302代替變換引擎100,其他結構要素相同,功能也相同,所以用同一符號,除必要部分,不作重復說明。
在上述結構中,假名漢字變換服務器302一從假名漢字變換客戶機200收到假名及假名漢字變換要求,就啟動品詞讀出裝置102,讀入假名漢字變換辭典112,從讀入的假名漢字變換辭典112讀出輸入的假名的品詞信息。
之后,假名漢字變換服務器302,啟動連接信息判定裝置104,判定讀出的品詞的連接信息,根據(jù)連接信息的判定結果,將假名變換成漢字,將變換結果發(fā)送給假名漢字變換客戶機200。
而且,假名漢字變換服務器302,一從假名漢字變換客戶機200收到品詞登錄要求,就通知給品詞登錄裝置108,登錄被要求的品詞。而且,假名漢字變換服務器302,一收到從假名漢字變換客戶機200發(fā)出的單詞登錄要求,就通知給單詞登錄裝置110,登錄被要求的單詞。
根據(jù)與本發(fā)明的第二實施形態(tài)有關的日語輸入系統(tǒng),由于可以用客戶機服務器方式進行假名漢字變換,所以用戶不用定義品詞信息,也可以定義新品詞,可以實現(xiàn)受追加新品詞帶來的誤變換影響小的日語輸入系統(tǒng)。
如上所述,根據(jù)技術方案1至技術方案3記載的發(fā)明,存儲于品詞信息存儲裝置的各品詞的品詞信息中,將表示應連接在成為變換對象的品詞前面的品詞的連接的前連接信息部和表示應連接在成為變換對象的品詞后面的品詞的連接的后連接信息部這兩個獨立的屬性信息作為品詞間的連接信息預定義好,追加新品詞時,關于品詞信息的連接信息,能夠合成挪用了原有的一個品詞的前連接信息部和原有的另一個品詞的后連接信息部而成的新的品詞連接信息部,可以追加具有基于挪用的品詞的前連接信息部及后連接信息部的品詞,所以用戶不用定義品詞信息,也可以定義新品詞,可以實現(xiàn)受追加新品詞帶來的誤變換影響小的日語輸入系統(tǒng)。
而且,根據(jù)技術方案4記載的發(fā)明,由包括技術方案1記載的輸入裝置及顯示裝置的功能、及數(shù)據(jù)收發(fā)功能的假名漢字變換客戶機和技術方案1至技術方案3任何一項記載的處理裝置構成,構成上述處理裝置的控制裝置是有假名漢字變換功能及數(shù)據(jù)收發(fā)功能的假名漢字變換服務器,用客戶機服務器方式進行假名漢字變換。所以可以實現(xiàn)用戶不用定義品詞信息,也能定義新品詞,而且受由新品詞的追加帶來的誤變換的影響小的日語輸入系統(tǒng)。
權利要求
1.一種具有輸入假名、輸入各種變換及登錄等的輸入裝置,顯示假名輸入及各種變換結果等內容的顯示裝置、用假名漢字變換辭典將已輸入的假名字符變換成假名漢字混合文的處理裝置的日語輸入系統(tǒng),其特征在于上述處理裝置包括預先存儲包含品詞及各品詞間的連接信息的品詞信息的品詞信息存儲裝置,將已輸入的單詞的品詞從假名漢字辭典讀出的品詞讀出裝置,用上述品詞信息存儲裝置檢索從上述品詞讀出裝置讀出的品詞的連接信息,并判定上述被讀出的品詞與相連接的品詞間的連接的連接信息判定裝置,控制包括上述品詞信息存儲裝置、品詞讀出裝置及連接信息判定裝置的各個部分,同時根據(jù)上述連接信息判定裝置的判定結果進行假名漢字變換的控制裝置。
2.如權利要求1記載的日語輸入系統(tǒng),其特征在于上述品詞間的連接信息將表示應連接在成為變換對象的品詞前面的品詞的連接的前連接信息部和表示應連接在成為變換對象的品詞后面的品詞的連接的后連接信息部作為成為上述變換對象的品詞的獨立屬性信息存儲到上述品詞信息存儲裝置。
3.如權利要求1或權利要求2任何一項記載的日語輸入系統(tǒng),其特征在于上述處理裝置還有當上述輸入裝置有品詞登錄要求時,從上述品詞信息存儲裝置讀入品詞信息,在被要求登錄的品詞的連接信息由已登錄的前連接信息部和后連接信息部構成的情況下,將包含品詞及其連接信息的品詞信息的定義登錄到上述品詞信息存儲裝置的品詞登錄裝置;當上述輸入裝置有單詞登錄要求時,在被要求登錄的單詞指定的品詞登錄在上述品詞信息存儲裝置的情況下,將上述被要求登錄的單詞登錄到上述假名漢字辭典的單詞登錄裝置。
4.一種日語輸入系統(tǒng),其特征在于由包含輸入裝置的功能、顯示裝置的功能、及數(shù)據(jù)收發(fā)功能的假名漢字變換客戶機和權利要求1至權利要求3任何一項記載的處理裝置構成,構成上述處理裝置的控制裝置是具有假名漢字變換功能及數(shù)據(jù)收發(fā)功能的假名漢字變換服務器,以客戶機服務器方式進行假名漢字變換。
全文摘要
本發(fā)明公開了實現(xiàn)用戶不用定義品詞信息,也能定義新品詞,而且受由新品詞的追加帶來的誤變換的影響小的日語輸入系統(tǒng),該系統(tǒng)有品詞信息存儲部106,品詞讀出裝置102,連接信息判定裝置104,控制品詞信息存儲部、品詞讀出裝置及連接信息判定裝置的各個部分,同時根據(jù)連接信息判定裝置判定的結構,進行假名漢字變換的變換引擎100。
文檔編號G06F3/06GK1273398SQ0010864
公開日2000年11月15日 申請日期2000年5月11日 優(yōu)先權日1999年5月11日
發(fā)明者三竿夕子 申請人:日本電氣株式會社