一種自然語(yǔ)言機(jī)器識(shí)別方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開(kāi)了一種自然語(yǔ)言機(jī)器識(shí)別方法,包括下述步驟:(1)建立似謂詞演算形式詞義對(duì)應(yīng)的數(shù)據(jù)庫(kù);(2)輸入自然語(yǔ)言信息;(3)對(duì)所述的自然語(yǔ)言信息的語(yǔ)句進(jìn)行逐句切分處理,并根據(jù)切分規(guī)則轉(zhuǎn)換為一個(gè)或一個(gè)以上的似謂詞演算形式句;(4)將所述的多個(gè)似謂詞演算形式句轉(zhuǎn)換為機(jī)器識(shí)別的電信號(hào),然后輸入至中央處理單元進(jìn)行搜索或識(shí)別或遞歸或替代中的至少一種方式進(jìn)行邏輯推理或隱喻或聯(lián)想創(chuàng)造性思維的功能處理,并生成新的數(shù)字代碼組合;(5)將所述的數(shù)字代碼組合回溯轉(zhuǎn)換為與輸入的自然語(yǔ)言信息相應(yīng)的新的自然語(yǔ)句作為輸出,或者作為學(xué)習(xí)結(jié)果進(jìn)行存儲(chǔ)。
【專利說(shuō)明】
一種自然語(yǔ)言機(jī)器識(shí)別方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及自然語(yǔ)言文字處理研究領(lǐng)域,特別涉及一種自然語(yǔ)言識(shí)別方法及系 統(tǒng)。
【背景技術(shù)】
[0002] 隨著人工智能的快速發(fā)展,各種人工智能產(chǎn)品在社會(huì)各方面獲得了愈加廣泛的應(yīng) 用。但是,人與機(jī)器直接使用人類自然語(yǔ)言交流,是實(shí)現(xiàn)人工智能的終極目標(biāo)。目前,由于方 法論和技術(shù)路線的欠缺,人工智能尚遠(yuǎn)遠(yuǎn)做不到這一點(diǎn)。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明要解決的技術(shù)問(wèn)題是針對(duì)現(xiàn)有人工智能的上述不足,提出對(duì)于現(xiàn)有人工智 能具有顛覆性的方法論,提供由人類思維通過(guò)自然語(yǔ)言文字完全轉(zhuǎn)為機(jī)器思維載體的方 法,從而實(shí)現(xiàn)人機(jī)思維的一致性,實(shí)現(xiàn)機(jī)器像人一樣思維和與人互動(dòng)。
[0004] 本發(fā)明的技術(shù)方案是這樣的:一種自然語(yǔ)言機(jī)器識(shí)別方法,包括下述步驟:(1)建 立似謂詞演算形式詞義對(duì)應(yīng)的數(shù)據(jù)庫(kù);(2)輸入自然語(yǔ)言信息;(3)對(duì)所述的自然語(yǔ)言信息 的語(yǔ)句進(jìn)行逐句切分處理,并根據(jù)切分規(guī)則轉(zhuǎn)換為一個(gè)或一個(gè)以上的似謂詞演算形式句;
[4] 將所述的多個(gè)似謂詞演算形式句轉(zhuǎn)換為機(jī)器識(shí)別的電信號(hào),然后輸入至中央處理單元 進(jìn)行搜索或識(shí)別或遞歸或替代中的至少一種方式進(jìn)行邏輯推理或隱喻或聯(lián)想創(chuàng)造性思維 的功能處理,并生成新的數(shù)字代碼組合;(5)將所述的數(shù)字代碼組合回溯轉(zhuǎn)換為與輸入的自 然語(yǔ)言信息相應(yīng)的新的自然語(yǔ)句作為輸出,或者作為學(xué)習(xí)結(jié)果進(jìn)行存儲(chǔ)。
[0005] 本發(fā)明所述的似謂詞演算形式的定義為:自然語(yǔ)言句式均是由四種最簡(jiǎn)思維模式 之一或組合構(gòu)成的句式,每一種最簡(jiǎn)思維模式句均為包括謂詞(謂語(yǔ))的最簡(jiǎn)句式,和現(xiàn)有 的謂詞演算的表達(dá)方式相似,將上述四種最簡(jiǎn)思維模式定義為似謂詞演算形式。
[0006] 本發(fā)明所述的數(shù)據(jù)庫(kù)至少包括用自然數(shù)編碼的新代碼字詞庫(kù),所述新代碼編碼數(shù) 據(jù)庫(kù)通過(guò)手工輸入或利用現(xiàn)有的開(kāi)放代碼源的字詞庫(kù)輸入字詞的方式來(lái)建立。
[0007] 本發(fā)明所述的切分規(guī)則為:將輸入的自然語(yǔ)言信息的句子切分為一個(gè)或一個(gè)以上 的似謂詞演算形式句,把句子每一層的意義完整地保留下來(lái),每一個(gè)所述的似謂詞演算形 式句是由最多三項(xiàng)一組的字詞組成的最簡(jiǎn)句式;所述的自然語(yǔ)言信息對(duì)應(yīng)段落的句子經(jīng)切 分后,轉(zhuǎn)換為多個(gè)由三項(xiàng)一組構(gòu)成的一組數(shù)列的集合。
[0008] 本發(fā)明所述的切分規(guī)則采用以下的算法模型來(lái)實(shí)現(xiàn):
[0009] (1)以句號(hào)為一個(gè)語(yǔ)句的句義中止標(biāo)識(shí),以段落為句義群中止標(biāo)識(shí),以整篇為段義 群中止標(biāo)識(shí);子句以逗號(hào)為界,搜索整體句中的最簡(jiǎn)句式中間項(xiàng)的謂詞,依次與字詞庫(kù)進(jìn)行 比時(shí);
[0010] (1.1)以此謂詞為界確定第一層面的前部項(xiàng)、后部項(xiàng)的句子成份,從而確定句式前 部項(xiàng)為第一層面的最簡(jiǎn)句式第一項(xiàng),確定句式后部項(xiàng)為第一層面的最簡(jiǎn)句式第三項(xiàng);
[0011] (1.2)如果原句中間項(xiàng)的謂詞有省略,則先補(bǔ)足謂詞,然后重復(fù)步驟1.1的操作;
[0012] (2)按順序分別對(duì)所述的句式前部項(xiàng)和句式后部項(xiàng)為進(jìn)行第二層面切分,重復(fù)進(jìn) 行相同于上述步驟1的切分過(guò)程;
[0013] (3)限定詞的受限主詞作為下一層面的最簡(jiǎn)式的第一項(xiàng),第二項(xiàng)添加謂詞/謂語(yǔ), 第三項(xiàng)則為該限定詞;
[0014] (4)再在下一層面進(jìn)行上述切分過(guò)程,直至全句完成切分。
[0015] 本發(fā)明所述的句子中謂詞的搜索算法模型為:
[0016] (1)在一句子中逐次將字與字詞庫(kù)比對(duì),對(duì)應(yīng)字詞庫(kù)輸出各詞在該句子中的屬性/ 詞性,直到搜索出第一個(gè)謂詞,繼續(xù)之后的搜索;如果再未有謂詞,則搜索完成;判斷詞或動(dòng) 詞之前者為行為使動(dòng)者,之后者為表述詞或行為受動(dòng)者,這即找出了最簡(jiǎn)句式。
[0017] (2)如果后邊搜索到第二個(gè)謂詞,繼續(xù)之后的搜索,如果再未有謂詞,則搜索完成; 謂詞之前者為行為使動(dòng)者,之后者為表述詞或行為受動(dòng)者,即找出了最簡(jiǎn)句式的復(fù)合結(jié)構(gòu)。
[0018] 本發(fā)明所述的自然語(yǔ)言信息轉(zhuǎn)換為似謂詞演算形式句后的自動(dòng)推理、聯(lián)想過(guò)程 為:切分后的語(yǔ)句變成了由三項(xiàng)一組的字詞構(gòu)成的最簡(jiǎn)思維模式的集合,運(yùn)用搜索匹配識(shí) 另IJ,進(jìn)行遞歸替代計(jì)算過(guò)程而實(shí)現(xiàn)自動(dòng)推理、聯(lián)想思維過(guò)程。
[0019] 本發(fā)明所述的由自然語(yǔ)言信息轉(zhuǎn)換的似謂詞演算形式進(jìn)行演算的推理算法模型:
[0020] (1)按時(shí)間優(yōu)先原則,取首句第一組數(shù)列中的第三項(xiàng)減次句中第一組數(shù)列中的第 一項(xiàng),如結(jié)果為0,并且首句第一組數(shù)列中的第二項(xiàng)減次句第二組數(shù)列中的第二項(xiàng)的結(jié)果也 為〇,則將次句第二組的第一項(xiàng)替代首句第一組數(shù)列的第三項(xiàng);新的首句第一組數(shù)列構(gòu)造完 成;
[0021] (1.1)如未有上述結(jié)果,則取首句第一組數(shù)列中的第三項(xiàng)減次2句第三組數(shù)列中的 第一項(xiàng),如結(jié)果為0,并且首句第一組數(shù)列中的第二項(xiàng)減次2句第三組數(shù)列中的第二項(xiàng)的結(jié) 果為〇,則將次2句第三組的第一項(xiàng)替代首句第一組數(shù)列的第三項(xiàng);新的首句第一組數(shù)列構(gòu) 造完成;
[0022] (2)取第一組數(shù)列中的第三項(xiàng)減去已成功完成步驟1運(yùn)算的次組數(shù)列中的第一項(xiàng), 如結(jié)果為0,并且第一組數(shù)列中的第二項(xiàng)減去已成功完成步驟1運(yùn)算的次組數(shù)列中的第二項(xiàng) 的結(jié)果為0,則將已成功完成步驟1運(yùn)算的次組數(shù)列中的第一項(xiàng)替代第一組數(shù)列的第三項(xiàng); 新的第一組數(shù)列構(gòu)造完成;
[0023] (3)繼續(xù)上述過(guò)程直至無(wú)法完成上述過(guò)程,中止;輸出新的第一組數(shù)列,這即是推 理結(jié)果;
[0024] (4)如果所選的一組數(shù)列無(wú)法完成上述過(guò)程,則選擇次一組數(shù)列進(jìn)行上述過(guò)程; [0025] (5)有推理結(jié)果或無(wú)推理結(jié)果,輸出結(jié)論。
[0026]本發(fā)明還提供一種自然語(yǔ)言機(jī)器識(shí)別系統(tǒng),包括人機(jī)接口模塊、句子切分模塊、中 央處理單元、句式合成模塊及數(shù)據(jù)庫(kù)模塊,所述的句子切分模塊和句式合成模塊分別與所 述中央處理單元的輸入端和輸出端通過(guò)電信號(hào)相連,所述的數(shù)據(jù)庫(kù)模塊至少包括字詞庫(kù)管 理模塊。
[0027]本發(fā)明所述的數(shù)據(jù)庫(kù)模塊為多庫(kù)協(xié)同模塊,還包括知識(shí)庫(kù)管理模塊、情景庫(kù)管理 模塊、多元語(yǔ)義網(wǎng)絡(luò)庫(kù)管理模塊及隱喻網(wǎng)絡(luò)庫(kù)管理系統(tǒng)。
[0028] 本發(fā)明與現(xiàn)有技術(shù)相比,具有下述優(yōu)點(diǎn):
[0029] 自然語(yǔ)言語(yǔ)句的基礎(chǔ)是基本思維表達(dá)模式,與謂詞演算形式相似。本發(fā)明可以實(shí) 現(xiàn)自然語(yǔ)言與謂詞演算形式的完全及自動(dòng)轉(zhuǎn)換,從而為實(shí)現(xiàn)機(jī)器直接使用人類自然語(yǔ)言的 人工智能奠定基礎(chǔ),實(shí)現(xiàn)與人的思維使用完全相同的載體一一語(yǔ)言文字系統(tǒng),智能工作的 基礎(chǔ)機(jī)制是相同的。由于轉(zhuǎn)換保留著全部完整句義信息,因而完全實(shí)現(xiàn)了機(jī)器對(duì)人類自然 語(yǔ)言直接使用的技術(shù)路徑,這體現(xiàn)在本發(fā)明所提出并論述的自然語(yǔ)言似謂詞形式轉(zhuǎn)換后的 基本思維表達(dá)方式及推理、隱喻、聯(lián)想等表述之中。
[0030] 按照本發(fā)明的方法實(shí)現(xiàn)的人工智能,通過(guò)使用和人一樣的思維載體一一自然語(yǔ)言 信息(如文字),使機(jī)器能夠和人一樣對(duì)話、推理思考、解決問(wèn)題,所以,最接近"人腦"。自然 語(yǔ)言符號(hào)系統(tǒng)直接作為人機(jī)交流的工具,其效率是最高的。
[0031] 本發(fā)明的自然語(yǔ)言機(jī)器識(shí)別方法及系統(tǒng),應(yīng)用前景廣泛:例如可以應(yīng)用本發(fā)明提 煉文章的摘要或主題,可以應(yīng)用到互聯(lián)網(wǎng)智能搜領(lǐng)域索,可以實(shí)現(xiàn)自動(dòng)閱讀和理解文章及 書籍,分類審查以及翻譯等工作。本發(fā)明可以讓機(jī)器通過(guò)自動(dòng)學(xué)習(xí)并自動(dòng)擴(kuò)充知識(shí)庫(kù);還可 以通過(guò)閱讀自然語(yǔ)言文字來(lái)使用其它的人工智能專業(yè)軟件,以及使機(jī)器人使用自然語(yǔ)言進(jìn) 行人機(jī)交流。
【附圖說(shuō)明】
[0032]圖1是本發(fā)明工作流程示意圖;
[0033]圖2是本發(fā)明的工作原理方框圖。
【具體實(shí)施方式】
[0034]下面接合【具體實(shí)施方式】對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)說(shuō)明,但不構(gòu)成對(duì)本 發(fā)明的任何限制。
[0035] 本發(fā)明的【具體實(shí)施方式】如圖1、圖2所示,一種自然語(yǔ)言機(jī)器識(shí)別方法,包括下述步 驟:(1)建立似謂詞演算形式詞義對(duì)應(yīng)的數(shù)據(jù)庫(kù);(2)輸入自然語(yǔ)言信息;(3)對(duì)所述的自然 語(yǔ)言信息的語(yǔ)句進(jìn)行逐句切分處理,并根據(jù)切分規(guī)則轉(zhuǎn)換為一個(gè)或一個(gè)以上的似謂詞演算 形式句;(4)將所述的多個(gè)似謂詞演算形式句轉(zhuǎn)換為機(jī)器識(shí)別的電信號(hào),然后輸入至中央處 理單元進(jìn)行搜索或識(shí)別或遞歸或替代中的至少一種方式進(jìn)行邏輯推理或隱喻或聯(lián)想創(chuàng)造 性思維的功能處理,并生成新的數(shù)字代碼組合;(5)將所述的數(shù)字代碼組合回溯轉(zhuǎn)換為與輸 入的自然語(yǔ)言信息相應(yīng)的新的自然語(yǔ)句作為輸出,或者作為學(xué)習(xí)結(jié)果進(jìn)行存儲(chǔ)。
[0036] 下面將本發(fā)明的方法詳細(xì)敘述如下:
[0037] ( - )首先,將人類思維歸納為四種簡(jiǎn)單模式及其少量模式的組合。
[0038]人類思維對(duì)各種事物的描述可以歸納為四種情形,這就是"什么是什么"、"什么做 (引起)什么"、"什么在哪里"、"什么在何狀態(tài)"四種模式以及它們復(fù)合之表達(dá)。上述這種四 種情形被本發(fā)明稱為"思維的最基本模式"。
[0039]與之相反的是被動(dòng)性方面,這就是"什么(被認(rèn)為)是什么"、"什么(被認(rèn)為)在何狀 態(tài)"、"什么(被認(rèn)為)在哪里"、和"什么被做(引起)什么,這是由作用是相互的自然原理所決 定的,即發(fā)生作用的必是作用者與被作用者參與的過(guò)程,按照這個(gè)作用與反作用同時(shí)發(fā)生 的原理,參與作用過(guò)程的二者同時(shí)又分別是作用者與被作用者,只是表述的對(duì)象因空間與 時(shí)間特質(zhì)(由時(shí)間與空間限定唯一性原理決定)不同而已。
[0040]本發(fā)明所述的似謂詞演算形式的定義為:自然語(yǔ)言句式均是由四種最簡(jiǎn)思維模式 之一或組合構(gòu)成的句式,每一種最簡(jiǎn)思維模式句均為包括謂詞(謂語(yǔ))的最簡(jiǎn)句式,和現(xiàn)有 的謂詞演算的表達(dá)方式相似,將上述四種最簡(jiǎn)思維模式定義為似謂詞演算形式。
[0041] 似謂詞演算形式句是由最多三項(xiàng)一組的字詞構(gòu)成的最簡(jiǎn)句式,對(duì)應(yīng)于四種思維的 最基本模式,包括以下四種類型:
[0042] (1) "WHAT BE WHAT"模式--"什么是什么"模式;
[0043] ⑵"WHAT DO WHAT"模式--"什么做(引起)什么"模式;
[0044] (3) "WHAT BE WHERE"模式--"什么在哪里"模式;
[0045] (4) "WHAT BE STATE"模式--"什么在何狀態(tài)"模式。
[0046] (1)WBW模式("WHAT BE WHAT" 模式);
[0047] =(determiner[x],noun(WHATl),IS,determiner[z]noun(ffHAT2)).
[0048] (2)WDW模式("WHAT DO WHAT" 模式);
[0049] =(determiner[x],noun(WHAT),determiner[y]verb(DO),determiner[z]noun).
[0050] (3) WBWH模式("WHAT BE WHERE" 模式);
[0051 ] =(determiner[x],noun(WHAT),IS,determiner[z]noun(ffhere)).
[0052] (4)WBST模式("WHAT BE STATE"模式);
[0053] =(determiner[x],noun(WHAT),IS,determiner[z]adjective(State)).
[0054] 當(dāng)determiner均為空集時(shí),句子為最簡(jiǎn)式。
[0055] 下面對(duì)WDW模式加以舉例說(shuō)明。
[0056] 假設(shè)我們要描述一幕人打狗的情景,造句"人打狗"作為核心句義,這是最簡(jiǎn)式。句 子中三個(gè)詞都是抽象概念,一般需要分別加以限定,才更具有描述性,從而成為日常的描 述。即"人"是"怎樣的人?"、如何"打?"、"狗"是"怎樣的狗?","事件發(fā)生在哪兒?"等等。下面 例句即是:
[0057] 早晨,一個(gè)污頭詬面的人在大街上狠狠地打一條黃皮狗。
[0058] (二)其次,人類自然語(yǔ)言的句式歸結(jié)為上述四種簡(jiǎn)單模式及其少量模式的組合。
[0059] 自然語(yǔ)言是思維的載體,句式是人類思維的組織結(jié)構(gòu)形式。句式由不同層次的一 個(gè)或幾個(gè)相同思維模式(即思維的最基本模式)構(gòu)成。
[0060] (三)句式切分
[0061] 建立以概念生成系統(tǒng)為基礎(chǔ)的字詞數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)至少包括用自然數(shù)編碼的新 代碼字詞庫(kù),所述新代碼編碼數(shù)據(jù)庫(kù)通過(guò)手工輸入或利用現(xiàn)有的開(kāi)放代碼源的字詞庫(kù)輸入 字詞的方式來(lái)建立。句式切分時(shí)具有自動(dòng)搜索功能并依據(jù)思維的最基本模式將句子分層次 逐項(xiàng)分割,自然語(yǔ)言文字的句子經(jīng)分層次切分后,句子變?yōu)槿?xiàng)一組的字詞構(gòu)成的最簡(jiǎn)思 維模式的集合。
[0062] -段相對(duì)完全的語(yǔ)句以標(biāo)點(diǎn)為界,逗號(hào)之間的語(yǔ)句可以認(rèn)為是合析(與A )或者 (或V)關(guān)系,也許是因果關(guān)系。中文通常將限定成分放在主題詞一一名詞或代詞主語(yǔ)及動(dòng) 詞謂語(yǔ),它們是WHAT和D0的基本核心。在句子后部動(dòng)詞之前的名詞,特別是前面有"的"的名 詞及其前面的句子成分通常是WHAT,其后的動(dòng)詞為D0,再后邊的成分為另一個(gè)WHAT。另一種 情形恰好相反,當(dāng)句首為名詞或代詞,緊接著動(dòng)詞BE,則可直接套用基本思維模式對(duì)句子切 分。
[0063] 具體切分規(guī)則為:將輸入的自然語(yǔ)言信息的句子切分為一個(gè)或一個(gè)以上的似謂詞 演算形式句,把句子每一層的意義完整地保留下來(lái),每一個(gè)所述的似謂詞演算形式句是由 最多三項(xiàng)一組的字詞組成的最簡(jiǎn)句式;所述的自然語(yǔ)言信息對(duì)應(yīng)段落的句子經(jīng)切分后,轉(zhuǎn) 換為多個(gè)由三項(xiàng)一組構(gòu)成的一組數(shù)列的集合。
[0064] 所述的切分規(guī)則采用以下的算法模型來(lái)實(shí)現(xiàn),此算法模型適用于大部分的規(guī)整句 式:
[0065] 1.以句號(hào)為一個(gè)語(yǔ)句的句義中止標(biāo)識(shí)。以段落為句義群中止標(biāo)識(shí),以整篇為段義 群中止標(biāo)識(shí)。子句以逗號(hào)為界,搜索整體句中的最簡(jiǎn)式中間項(xiàng)"BE,D0",依次與字詞庫(kù)進(jìn)行 比時(shí);
[0066] 1.1以此"BE"或"D0"為界確實(shí)第一層面的前后兩個(gè)"WHAT"句子成份,從而確定前 WHAT1為第一層面的最簡(jiǎn)式第一項(xiàng),確定后WHAT2為第一層面的最簡(jiǎn)式第三項(xiàng);
[0067] 1.2如果原句中間項(xiàng)"BE,D0"有省略,則先補(bǔ)足謂詞,然后重復(fù)步驟1.1的操作。
[0068] 2.按序分別對(duì)WHAT1和WHAT2進(jìn)行第二層面切分,重復(fù)進(jìn)行相同于上述步驟1的切 分過(guò)程;
[0069] 3.限定詞的受限主詞作為下一層面的最簡(jiǎn)式的第一項(xiàng),第二項(xiàng)添加"BE",第三項(xiàng) 則為該限定詞。限定詞指"……的,……地,摹狀詞,數(shù)量詞等起限定作用的詞,包括主名詞 之前的起限定作用的名詞。
[0070] 4.再在下一層面進(jìn)行上述切分過(guò)程,直至全句完成切分。
[0071]自然語(yǔ)言以逗號(hào)作為子句的分界標(biāo)識(shí),各子句間有某種邏輯關(guān)系或?yàn)椴⒘斜硎觥?以條件詞引出的子句,逗號(hào)位置替換為結(jié)果子句,下文例句中用標(biāo)識(shí)"―"來(lái)表示兩子句的 因果關(guān)系。
[0072]句子中BE或D0的謂詞搜索算法模型:
[0073] 1.在一句子中逐次將字與字詞庫(kù)比對(duì),對(duì)應(yīng)字詞庫(kù)輸出各詞在該句子中的屬性/ 詞性,直到搜索出第一個(gè)謂詞(判斷詞或動(dòng)詞),繼續(xù)之后的搜索,如果再未有謂詞(判斷詞 或動(dòng)詞),則搜索完成。判斷詞或動(dòng)詞之前者為行為使動(dòng)者(主語(yǔ)),之后者為表述詞或行為 受動(dòng)者。這即找出了最簡(jiǎn)句式。
[0074] 如果后邊搜索到第二個(gè)謂詞(判斷詞或動(dòng)詞),繼續(xù)之后的搜索,如果再未有謂詞 (判斷詞或動(dòng)詞),則搜索完成。謂詞(判斷詞或動(dòng)詞)之前者為行為使動(dòng)者(主語(yǔ)),之后者為 表述詞或行為受動(dòng)者。句子一般最長(zhǎng)是這種結(jié)構(gòu),即找出了最簡(jiǎn)句式的復(fù)合結(jié)構(gòu)。
[0075] 1.1.如果第一個(gè)基本句子模式中主語(yǔ)數(shù)項(xiàng)少(即數(shù)值個(gè)數(shù)少),則基本可判定此基 本句子模式為整句的主結(jié)構(gòu),第二個(gè)基本句子模式是次結(jié)構(gòu),第一個(gè)基本句子模式中的主 語(yǔ)即是整句主語(yǔ)。
[0076] 1.1.1.計(jì)算第一個(gè)基本句子模式中主語(yǔ)數(shù)項(xiàng)數(shù)量與謂語(yǔ)后的數(shù)項(xiàng)數(shù)量并比較,如 果主語(yǔ)數(shù)項(xiàng)數(shù)量小,則輸出此基本句子模式為整句的主結(jié)構(gòu)的判定。如非,則進(jìn)入下一步。
[0077] 1.2如果第二個(gè)基本句子模式中的表述詞或行為受者數(shù)項(xiàng)比第一個(gè)基本句子模 式中主語(yǔ)數(shù)項(xiàng)數(shù)量少(即數(shù)值個(gè)數(shù)少),則基本可判定此基本句子模式為整句的主結(jié)構(gòu),第 一個(gè)基本句子模式是整句主語(yǔ)。
[0078] 1.2.1.計(jì)算第二個(gè)基本句子模式中的表述詞或行為受者數(shù)項(xiàng)數(shù)量并與第一個(gè)基 本句子模式中主語(yǔ)數(shù)項(xiàng)數(shù)量比較。該數(shù)項(xiàng)數(shù)量小則輸出此基本句子模式為整句的主結(jié)構(gòu)的 判定。如非,則輸出第一個(gè)基本句子模式中的主語(yǔ)即是整句主語(yǔ)的判定。
[0079]下面是一種較簡(jiǎn)單的句型,但不同句型的算法類似。
[0080] 2.找出整句的主結(jié)構(gòu)后,將作為數(shù)列形式的句子主結(jié)構(gòu)中的謂詞(代碼)前的數(shù)列 各項(xiàng)作為W1,移出作為另一數(shù)列,將此謂詞(代碼)后的數(shù)列各項(xiàng)作為W2,移出作為另一數(shù) 列。
[0081] 2.1.對(duì)W1進(jìn)行步驟1的搜索判定,找出名詞中心詞,將名詞中心詞的代碼數(shù)與其他 詞性的詞的代碼數(shù)從新排序,依次為:名詞中心詞,判定詞"是"、"在"或動(dòng)詞,表詞或受詞; 如果W1僅是三個(gè)數(shù)項(xiàng),則是最簡(jiǎn)句式(最簡(jiǎn)基本句型),切分中止。
[0082] 2.1.1?復(fù)制W1中心詞。
[0083] 2.1.2.如果W1無(wú)判定詞"是"或"在",僅是二個(gè)數(shù)項(xiàng),則補(bǔ)缺。將"是"或"在"的代碼 數(shù)引入,并將三代碼數(shù)重新排序?yàn)椋好~中心、詞,判定詞"是"、"在",表詞,重新排序后的W1 設(shè)名為RW1。
[0084] 2.2?對(duì)W2進(jìn)行2.1 ?搜索判定
[0085] 如果句子主結(jié)構(gòu)中謂詞(代碼)是判定詞"是"或"在",則W2的中心詞是表詞;如果 是動(dòng)詞,則為名詞。復(fù)制W2中心詞。重新排序后的W2設(shè)名為RW2。
[0086] 2.3.將W1中心詞、W2中心詞,句子主結(jié)構(gòu)中謂詞排序成W1中心詞、句子主結(jié)構(gòu)的謂 詞,W2中心詞。
[0087] 2.4.將原句數(shù)列重新排序?yàn)槿?xiàng)數(shù)列的集合:
[0088] (W1中心詞,句子主結(jié)構(gòu)的謂詞,W2中心詞)八(RW1)八(RW2)
[0089] 句子中判斷詞組的搜索算法模型:
[0090] 1.第一個(gè)數(shù)加第二個(gè)數(shù)之和(非算術(shù)加法之和)與詞庫(kù)比對(duì),識(shí)別成功,則由這兩 數(shù)所代碼(定義)的兩個(gè)字詞是一個(gè)組合詞組。則轉(zhuǎn)入步驟2;
[0091]反之為單詞,判別中止。由此字詞(第二個(gè)數(shù))重新開(kāi)始步驟1的過(guò)程。
[0092] 2.加上第三個(gè)數(shù)再與詞庫(kù)比對(duì),如果依然被識(shí)別,則此三個(gè)數(shù)之和對(duì)應(yīng)的三個(gè)字 詞是一個(gè)三字組合詞,則轉(zhuǎn)入步驟3;
[0093]反之判別中止。由此字詞(第三個(gè)數(shù))重新開(kāi)始步驟1的過(guò)程;
[0094] 3.再與第四個(gè)數(shù)相加,如果依然被識(shí)別,則此四個(gè)數(shù)之和對(duì)應(yīng)的四個(gè)字詞是一個(gè) 四字組合詞,則轉(zhuǎn)入步驟4;
[0095] 反之判別中止,由此字詞(第四個(gè)數(shù))重新開(kāi)始步驟1的過(guò)程;
[0096] 4.N數(shù)再與次鄰數(shù)n+1相加,如果依然被識(shí)別,則此n+1數(shù)之和對(duì)應(yīng)的n+1個(gè)字詞是 一個(gè)n+1字組合詞。
[0097]反之判別中止,由此字詞(第n+1個(gè)數(shù))重新開(kāi)始步驟1的過(guò)程。〕
[0098] 5.上述過(guò)程一直進(jìn)行到識(shí)別失敗為止。后面的數(shù)再進(jìn)行上述相同的過(guò)程,直到遇 到判定詞"是"、"在"及唯一詞性的動(dòng)詞為止。
[0099] 6.由上述方式找到主語(yǔ)詞組及謂語(yǔ)。輸出結(jié)果。
[0100] 重要注釋:上述算法是基于最大多數(shù)的語(yǔ)句情形,對(duì)于語(yǔ)句中省略謂詞的和謂詞 屬于較少數(shù)的復(fù)合詞組的,則在字詞庫(kù)特別設(shè)定的基礎(chǔ)上,對(duì)上述語(yǔ)句切分算法的相關(guān)部 分加以微調(diào)即可。
[0101]我們以下面具有代表性的例句切分,來(lái)說(shuō)明將自然語(yǔ)句直接轉(zhuǎn)換為似謂詞演算的 形式的基本方法:
[0102] 瑪麗在過(guò)生日時(shí)收到兩只風(fēng)箏,所以她把一個(gè)退還給商店。
[0103] =(瑪麗在過(guò)生日時(shí),收到,兩只風(fēng)箏)4(所以)(她把一個(gè)退還,給,商店)
[0104] =((瑪麗,在,過(guò)生日時(shí)),收到,(風(fēng)箏,是,兩只))-(所以)(她,退還,一個(gè)(風(fēng) 箏)),把…給,商店)
[0105]=((瑪麗,在,(時(shí),是,(瑪麗,過(guò),生日)),收到,(風(fēng)箏,是,兩只))- (所以)(她,退 還,(風(fēng)箏,是,一只)),把…給,商店)
[0106](她,退還,一個(gè)(風(fēng)箏)),把…給,商店)
[0107]=(瑪麗,退還,(風(fēng)箏,是,一只))A(瑪麗,把…給,商店)
[0108]即
[0109]((瑪麗,在,(時(shí),是,(瑪麗,過(guò),生日)),收到,(風(fēng)箏,是,兩只))
[0110]-(瑪麗,退還,(風(fēng)箏,是,一只))M瑪麗,把風(fēng)箏給,商店)
[0111]可以逆方向從底部的最簡(jiǎn)式抽取始,將不同層面的結(jié)構(gòu)簡(jiǎn)化為最簡(jiǎn)式抽取出來(lái)。 具體操作如下:
[0112]((瑪麗,在,(時(shí),是,(瑪麗,過(guò),生日)),收到,(風(fēng)箏,是,兩只))
[0113]-(瑪麗,退還,(風(fēng)箏,是,一只))八(瑪麗,把風(fēng)箏給,商店)
[0114] (1)抽取最底部的最簡(jiǎn)式:(瑪麗,過(guò),生日)八(風(fēng)箏,是,兩只)
[0115]-(風(fēng)箏,是,一只)
[0116] (2)將上一層面的結(jié)構(gòu)簡(jiǎn)化為最簡(jiǎn)式抽取出來(lái)
[0117] (時(shí),是,生日)
[0118] (3)將再上一層面的結(jié)構(gòu)簡(jiǎn)化為最簡(jiǎn)式抽取出來(lái) [om](瑪麗,在,時(shí))
[0120] (4)將最上一層面的結(jié)構(gòu)簡(jiǎn)化為最簡(jiǎn)式抽取出來(lái)
[0121](瑪麗,收到,風(fēng)箏)
[0122] -(瑪麗,退還,風(fēng)箏)A (瑪麗,把風(fēng)箏給,商店)
[0123] 將以上四個(gè)層面合併,有
[0124](瑪麗,在,時(shí))八(時(shí),是,生日)八(瑪麗,過(guò),生日)八(瑪麗,收到,風(fēng)箏)
[0125] A (風(fēng)箏,是,兩只)
[0126] 風(fēng)箏,是,一只)八(瑪麗,退還,風(fēng)箏)八(瑪麗,把風(fēng)箏給,商店)
[0127]注:
[0128]((瑪麗,在,(時(shí),是,(瑪麗,過(guò),生日)),收到,(風(fēng)箏,是,兩只))中,"瑪麗、收到、風(fēng) 箏"是整句的核心詞,其他可取消,則有 [0129]((瑪麗,收到,風(fēng)箏)
[0130]另外,(時(shí),是,(瑪麗,過(guò),生日)中核心句義是(時(shí),是,生日)
[0131](她,退還,(風(fēng)箏,是,一只))八(她,把…給,商店)中核心句義是 [0132](她,退還,風(fēng)箏)八(她,把風(fēng)箏給,商店)
[0133] "把…退還給…"是個(gè)復(fù)合行為表述,即"退還"和"把…給…"的兩種連續(xù)行為的表 述。
[0134] 上段中沒(méi)有與下段中完全相同的或可遞歸的最簡(jiǎn)式,故不能合一。由之判斷二者 不直接相干,即不能構(gòu)成二者的直接因果關(guān)系。換言之,此上下文因果關(guān)系為假。由上面兩 項(xiàng)相同的最簡(jiǎn)式
[0135](風(fēng)箏,是,兩只)-(風(fēng)箏,是,一只)
[0136] 可以判斷這正是原因所在,進(jìn)入知識(shí)庫(kù)查詢。
[0137] 可連接指令,由(瑪麗過(guò)生日-收到兩只風(fēng)箏)發(fā)出疑問(wèn)句。
[0138] 瑪麗過(guò)生日-瑪麗應(yīng)該收到一只風(fēng)箏?
[0139] 注:由陳述句改疑問(wèn)句有簡(jiǎn)單的固定摸式,如
[0140] "時(shí)間到了,我去上班"可改為疑問(wèn)句"時(shí)間到了,我應(yīng)該去上班?"
[0141] 如果在切分語(yǔ)句時(shí)注意到動(dòng)詞隱含的主動(dòng)性還是被動(dòng)性,從而利用它在句中因果 關(guān)系的位置,該語(yǔ)句也可以這樣切分:
[0142] 瑪麗在過(guò)生日時(shí)收到兩只風(fēng)箏,所以她把一個(gè)退還給商店。
[0143] =(瑪麗在過(guò)生日時(shí)…,收到,兩只風(fēng)箏))- (她把一個(gè)退還,給,商店)
[0144] =(瑪麗,在(時(shí),是,過(guò)生日)-(瑪麗,收到,兩只風(fēng)箏))-((瑪麗,把…退還,一個(gè) (風(fēng)箏)),給,商店)
[0M5]=(瑪麗,在(時(shí),是,(瑪麗,過(guò),生日))-(瑪麗,收到,(風(fēng)箏,是,兩只)))-((瑪 麗,把…退還,(風(fēng)箏,是,一只)),給,商店)
[0146] =(瑪麗,在(時(shí),是,(瑪麗,過(guò),生日))- (瑪麗,收到,(風(fēng)箏,是,兩只)))
[0147] -(她,把…退還,(風(fēng)箏,是,一只))八(她,把…給,商店)
[0148] 簡(jiǎn)化后得到
[0149](瑪麗,過(guò),生日)-(瑪麗,收到,風(fēng)箏)八(風(fēng)箏,是,兩只)
[0150]-(她,退還,風(fēng)箏)八(她,把風(fēng)箏給,商店)八(風(fēng)箏,是,一只)
[0151]注:收到=-,
[0152]因?yàn)椤?,才收到……。所?收到……"是因果關(guān)系中的結(jié)果部分。
[0153] 自然語(yǔ)言句式的構(gòu)成及其切分詳述:
[0154] 基本思維模式為上述的四種最簡(jiǎn)句式,自然語(yǔ)言句式就由基本思維模式(最簡(jiǎn)句 式)構(gòu)成。
[0155] WBW模式("WHAT BE WHAT"模式)
[0156] determiner[x]noun(WHAT1),IS,determiner[z]noun(WHAT2).
[0157] WDW模式("WHAT DO WHAT"模式)
[0158] determiner[x]noun(WHAT1),determiner[y]verb(DO),determiner[z]noun (WHAT2).
[0159] WBWH模式("WHAT BE WHERE"模式,WHERE指時(shí)空位置)
[0160] determiner[x]noun(WHAT),IS,determiner[z]noun(ffhere).
[0161] WBST模式("WHAT BE STATE"模式)
[0162] determiner[x]noun(WHAT),IS,determiner[z]adjective(State).
[0163] 當(dāng)determiner均為空集時(shí),句子為最簡(jiǎn)式。
[0164] -般的句子(這里指的句子是以標(biāo)點(diǎn)符號(hào)為界的表述部分)不會(huì)太長(zhǎng),在整句層面 以單一模式構(gòu)成主體框架的句子為多,最多不會(huì)超過(guò)三個(gè)基本模式。下面以部分句式加以 說(shuō)明。
[0165] 1.WDW模式("WHAT DO WHAT"模式)
[0166] determiner[x]noun(WHAT1),determiner[y]verb(DO),determiner[z]noun (WHAT2).
[0167] 當(dāng)determiner均為空集時(shí),句子為最簡(jiǎn)式。
[0168] 1.1 adj[x]noun(WHATl),determiner[y]verb(DO),determiner[z]noun(WHAT2).
[0169] determiner[x] = adjective[x],quantifier[x]----[x]是與名詞匹配的表 達(dá)某種表現(xiàn)、性質(zhì)、關(guān)系、數(shù)量狀態(tài)的形容詞類屬,包括數(shù)量詞等。
[0170] determiner[x] = adj [XI,X2,…]
[0171] =(WHAT1 ,IS,X1 AX2,---)
[0172] 如果x中有歸屬性的類形容詞,如"名詞+的",則也可變換為
[0173] =(WHATl,has,Xl)A(WHATl,IS,X2,.")
[0174] 例句:他的漂亮的的房子就位于湖岸。
[0175] 他的漂亮的的房子就位于湖岸 [0176]=(他的漂亮的的房子,就位于,湖岸)
[0177]=((他,有,房子)A(房子,is,漂亮的),位于,湖岸)
[0178] 得到
[0179](他,有,房子)A(房子,IS,漂亮的)A(房子,位于,湖岸)
[0180] 1.2 determiner[x]noun(WHAT1),adverb[y]verb(DO),determiner[z]noun (WHAT2).
[0181 ] determiner[y] =adverb[y]----[y]是與動(dòng)詞匹配的表達(dá)行為某種程度、特 性、狀態(tài)的副詞類屬
[0182] determiner[y]=adverb[Y1,Y2,???]
[0183] =(D0 ,IS,Y1 AY2,---)
[0184] 例句:他流利地回答了外賓三個(gè)問(wèn)題。
[0185] 他流利地回答了外賓三個(gè)問(wèn)題
[0186] =(他,流利地回答了,外賓三個(gè)問(wèn)題)
[0187] =(他,(回答,IS,流利的),(外賓,has,三個(gè)問(wèn)題))
[0188] =(他,(回答,IS,流利的),(外賓,has,(問(wèn)題,IS,三個(gè))))
[0189] 底層:(問(wèn)題,IS,三個(gè))
[0190]第二層:(外賓,has,問(wèn)題)八(回答,IS,流利的)
[0191]頂層:(他,回答,外賓)八(他,回答,問(wèn)題)
[0192]=(他,回答,外賓八問(wèn)題)
[0193] 合并:(外賓,has,問(wèn)題)八(問(wèn)題,IS,三個(gè))-(他,回答,外賓八問(wèn)題)
[0194] 注:"回答"決定了(他,回答,外賓八問(wèn)題)在全句因果關(guān)系中的"果"之特性。所以
[0195] "回答,,= -
[0196] 利用Prolog語(yǔ)言表達(dá),即
[0197] reply(he,guest,question):-has(guest,question),three(question).
[0198] 1?3 determiner[x]noun(WHATl),determiner[y]verb(DO),adjective[z]noun (WHAT2).
[0199] determiner[z] = adjective[z],quantifier[z]----[z]是與名詞匹配的表 達(dá)某種表現(xiàn)、性質(zhì)、關(guān)系、數(shù)量狀態(tài)的形容詞類屬,包括數(shù)量詞等。。
[0200]以上句式是完全表示,從中可以演變出許許多多句型來(lái)。例如,有下面句型 [0201 ] adj[x]noun(WHATl),adverb[y]verb(DO),adj[z]noun(WHAT2).
[0202] 偉大的人民一定創(chuàng)造出偉大的成績(jī)。
[0203] 偉大的人民一定創(chuàng)造出偉大的成績(jī) [0204]=(偉大的人民,一定創(chuàng)造出,偉大的成績(jī))
[0205] =((人民,IS,偉大的),(創(chuàng)造出,IS,一定的),(成績(jī),IS,偉大的))
[0206] 或=((人民,IS,偉大的)-(創(chuàng)造出,(成績(jī),IS,偉大的))
[0207]由上式,得出
[0208]底層:(人民,IS,偉大的)-(創(chuàng)造出,IS,一定的)八(成績(jī),IS,偉大的)
[0209]頂層:(人民,創(chuàng)造出,成績(jī))
[0210]合并:(人民,IS,偉大的)-(人民,創(chuàng)造出,成績(jī))八(創(chuàng)造出,IS,一定的)八(成績(jī), IS,偉大的)
[0211] 2.(WDW)DW模式("WHAT DO WHAT"模式中前部項(xiàng)(主語(yǔ)位)是另一個(gè)WDW模式)
[0212] (determiner[xl]noun(WHAT3),determiner[yl]verb(D01),determiner[zl]noun (WHAT4)),determiner[y]verb(DO),determiner[z]noun(WHAT2).
[0213] 基本模式中WHAT1 = determiner[xl]noun(WHAT3),determiner[yl]verb(D01), determiner[zl]noun(WHAT4)
[0214] ideterminer[x]noun(WHATl)=WHATDOWHATjl]:
[0215] 他打開(kāi)抽屜拿出詞典來(lái)。
[0216] 他打開(kāi)抽屜拿出詞典來(lái)
[0217]=(他打開(kāi)抽屜,拿出…來(lái),詞典)
[0218]=((他,打開(kāi),抽屜),拿出…來(lái),詞典)
[0219]底層:(他,打開(kāi),抽屜)
[0220]頂層:(他,拿出…來(lái),詞典)
[0221]他打開(kāi)抽屜拿出詞典來(lái)
[0222]或(他,打開(kāi),抽屜)八(他,拿出…來(lái),詞典),
[0223] opens(he,drawer)A takes out(he,dictionary)
[0224] 這是兩個(gè)WHAT DO WHAT構(gòu)成的語(yǔ)句,(他,打開(kāi),抽屜)所表述的時(shí)間特性在先,從 時(shí)序上可知
[0225] (他,打開(kāi),抽屜)-(他,拿出…來(lái),詞典)
[0226] opens(he,drawer)^takes out(he,dictionary)
[0227] 3.WD(WDW)模式("WHAT DO WHAT"模式中后部項(xiàng)(賓語(yǔ)位)是另一個(gè)WDW模式)
[0228] determiner[x]noun(WHATl),determiner[y]verb(DO),(determiner[xl]noun (WHAT3),determiner[yl]verb(D01),determiner[zl]noun(WHAT4)).
[0229] 下面列舉一個(gè)符合上式變形之一的復(fù)雜語(yǔ)句:
[0230]我站在高聳得像一株亭亭玉立的玉蘭花似的燈柱下。
[0231 ] 語(yǔ)句切分如下:
[0232]我站在高聳得像一株亭亭玉立的玉蘭花似的燈柱下
[0233] =(我,站八在…下,(高聳得像一株亭亭玉立的玉蘭花似的燈柱))
[0234] =(我,站八在…下,(燈柱,IS,高聳得像一株亭亭玉立的玉蘭花似的))
[0235] =(我,站A在…下,(燈柱,IS,(燈柱,高聳得,像一株亭亭玉立的玉蘭花似的)))
[0236] =(我,站八在…下,(燈柱,IS,(…,高聳得,(…,像…似的,一株亭亭玉立的玉蘭 花))))
[0237] =(我,站八在…下,(燈柱,IS,(…,高聳得,(…,像…似的,(玉蘭花,IS,一株八亭 亭玉立的)))))
[0238] 底層:(玉蘭花,IS,一株八亭亭玉立的)
[0239]第四層:(燈柱,像…似的,玉蘭花)
[0240]第三層:(燈柱,IS,高聳的)
[0241]第二層:(燈柱,IS,高聳的)
[0242]頂層:(我,站八在…下,燈柱)
[0243] 合并:(我,站A在…下,燈柱)A (燈柱,IS,高聳的)A (燈柱,像…似的,玉蘭花)八 (玉蘭花,IS,一株八亭亭玉立的)
[0244] 利用Prolog語(yǔ)言表達(dá),即
[0245] stand_beneath(i,lamp standard),tower(lamp standard),1 ike(lamp standard,magnolia),
[0246] is a(magnolia,slim,graceful).
[0247] 4.(WBWHERE)DW模式("WHAT DO WHAT"模式),前部項(xiàng)(主語(yǔ)位)是另一個(gè)WBW模式。
[0248] (determiner[xl]noun(WHAT3),IS,adjective[zl]noun(WHAT4)),determiner[y] verb(DO),determiner[z]noun(WHAT2).
[0249] 基本模式中 WHAT 1 = determiner [xl ] noun (WHAT3 ),IS,determ iner[zl ] noun (WHAT4)
[0250] 例句:他在取得重大科研成果之后就走上了經(jīng)商的道路。
[0251] 他在取得重大科研成果之后就走上了經(jīng)商的道路
[0252] =((他在取得重大科研成果之后),就走上了,經(jīng)商的道路)
[0253] =((他,在…之后,取得重大科研成果)-走上了,(道路,IS,經(jīng)商的))
[0254] =((他,在…之后,(取得,重大科研成果))-走上了,(道路,IS,經(jīng)商的))
[0255] =((他,在…之后,(取得,(科研成果,IS,重大)))-走上了,(道路,IS,經(jīng)商的))
[0256] =((他,在…之后,(取得,((成果,IS,科研),IS,重大)))-走上了,(道路,IS,經(jīng) 商的))
[0257] (走上了,(道路,IS,經(jīng)商的)
[0258] =(他,走上了,道路)八(道路,IS,經(jīng)商的)
[0259] 他⑴
[0260] 道路(X,Y)
[0261] 道路(X,Y,Z)
[0262] is(Y,Z)
[0263] 道路(Y)
[0264] 經(jīng)商的⑵
[0265] 用Prolog表示即
[0266] he(X),go_on(X,Y,Z),is(Y,Z),road(Y),mercantile(Z)?
[0267] 5. (WBWHERE)D((WBWHERE)DW)模式,"WHAT DO WHAT"模式中前部項(xiàng)(主語(yǔ)位)是 WBWHERE模式,后部項(xiàng)(賓語(yǔ)位)則是自相似的(WBWHERE) DW模式。
[0268] (determiner[xl]noun(WHAT3),IS,determiner[zl]noun(WHAT4)),verb(DO), (determiner[x2]noun(WHAT5),IS,determiner[z2]noun(WHAT6)),determiner[y2]verb (D02),determiner[z2]noun(WHAT7)).
[0269] 基本模式中WHAT 1 = determiner[x]noun(WHAT3),IS,determiner[zl]noun (WHAT4)
[0270] WHAT2 = ((WISWHERE)DW)模式
[0271] 例句:他在大街上邂逅了那位日后成為他妻子的漂亮女孩。
[0272] 他在大街上邂逅了那位日后成為他妻子的漂亮女孩
[0273] =((他在大街上)邂逅了,那位日后成為他妻子的漂亮女孩)
[0274] =((他,在…上,大街)邂逅了,(女孩,IS,那位日后成為他妻子的八漂亮的))
[0275] =((他,在…上,大街)邂逅了,(女孩,IS,((那位,在,日后),成為,他的妻子)八漂 亮的))
[0276] 得到
[0277] (他,在…上,大街),(他,邂逅了,女孩),(女孩,IS,漂亮的),(女孩,在,日后 (女孩,成為,他的妻子).
[0278] 注:在此句中,"那位日后成為他妻子的漂亮女孩"是另一個(gè)相同的(WISWHERE)DW 模式,所以切分過(guò)程也相同。
[0279](四)語(yǔ)句切分后的計(jì)算
[0280] 切分后的自然語(yǔ)言語(yǔ)句轉(zhuǎn)換為由三項(xiàng)字詞構(gòu)成的最簡(jiǎn)思維模式的集合,運(yùn)用搜索 匹配識(shí)別,進(jìn)行遞歸替代等計(jì)算過(guò)程而實(shí)現(xiàn)自動(dòng)推理、聯(lián)想等思維過(guò)程。
[0281] 將自然語(yǔ)言語(yǔ)句切分后的似謂詞演算形式的完全自動(dòng)轉(zhuǎn)換為謂詞演算形式,從而 利用現(xiàn)有的人工智編程軟件,以實(shí)現(xiàn)特定的功能。
[0282] 由句子進(jìn)行似謂詞演算形式切分后與謂詞演算形式的完全對(duì)應(yīng),將二者通過(guò)機(jī)器 自動(dòng)轉(zhuǎn)換,進(jìn)而參照規(guī)劃算法及描述,用Prolog編程語(yǔ)言對(duì)轉(zhuǎn)換為謂詞演算形式后的句式 加以表達(dá)。
[0283] 【實(shí)例】將下面的句子轉(zhuǎn)換為謂詞演算形式:
[0284] ①任何通過(guò)歷史考試和中獎(jiǎng)的人是快樂(lè)的。
[0286] 從此句可得到最基礎(chǔ)的核心句義,即IF(人,通過(guò),歷史考試)八(人,中,獎(jiǎng))THEN (人,是,快樂(lè)的),由三項(xiàng)組成的表述式,與謂詞演算直接轉(zhuǎn)換。
[0287] sentence(人,是,快樂(lè)的):_WDW(人,通過(guò),歷史考試),WDW(人,中,獎(jiǎng))?
[0288] WDW(人,通過(guò),歷史考試):-
[0289] WDW(人,中,獎(jiǎng)):-
[0290] 回應(yīng)這句話,可以從上面三個(gè)基本句子引起。
[0291 ]注:(考試,是,歷史)表示"考試"與"歷史"等價(jià),為了簡(jiǎn)潔,可取消"考試"一詞。并 將"人"一詞替換為變量X。
[0292] 由上面
[0293]
[0294] 比較上式Vx (pass (x, history)八win (x,lottery) -happy (x))
[0295] 利用規(guī)劃算法及描述,用Prolog編程語(yǔ)言將句式轉(zhuǎn)換為謂詞形式:
[0296] 句式開(kāi)始狀態(tài)為
[0298] 轉(zhuǎn)換步驟如下:
[0299] 1、transform(add(whole_curves),out_of_who1e_curves(universal quantification全稱量化Vx.),(add(curvesl),put_in_curvesl(noun),put_in_curvesl (comma),add_in_curvesl(BE),add_in_curvesl(comma),put_in_curvesl(determiner [x]),add(comma),change(BE,implication-),add(comma),determiner(x))
[0300] 2、transform(add(whole_curves),out_of_who1e_curves(universal quantification 全稱量化 Vx),(add(curvesl) (add(curves2),put_in_curves2(noun), add_in_curves2(comma),put_in_curves2(D01),add_in_curves2(comma),(put_in_ curves2(determiner XI[x]),add(conjunction A),add(curves3),put_in_curves3 (noun),add_in_curves3(comma),(put_in_curves3(D02),add_in_curves3(comma),(put_ in_curves3(determiner X2[x])),add_in_whole_curves(comma),(change(BE, implication^),determiner X3(x))
[0301] 3ntransform(add(whole curves),out_of_curves(universal quantification 全稱量化V.x),(add(curvesl),(add(curves2),out_of_curves2(D01),put_in_curves2 (noun),add_in_curves2(comma),(put_in_curves2(determiner(Xl)[x]),add (conjunction八),add(curves3),out_of_curves3(D02),put_in_curves3(noun),add_in_ curves3(comma),(put_in_curves3(determiner(X2)[x])),add_in_whole_curves (comma), (change(BE, implication^) ,determiner(X3) (x))
[0302] 4ntransform(add(whole curves),out_of_curves(universal quantification 全稱量化Vx),(curves(curvesl),(curves(curves2),out_of_curves2(D01),change_to (x),in_curves2(comma),(determiner(XI),conjunction(A),curves(curves3),out_of_ curves3(D02),change_to(x),in_curves3(comma),(determiner(X2)),(implication (-),determiner(X3) (x))
[0303] 自然語(yǔ)言信息轉(zhuǎn)換為似謂詞演算形式句后的自動(dòng)推理、聯(lián)想過(guò)程為:切分后的語(yǔ) 句變成了由三項(xiàng)一組的字詞構(gòu)成的最簡(jiǎn)思維模式的集合,運(yùn)用搜索匹配識(shí)別,進(jìn)行遞歸替 代計(jì)算過(guò)程而實(shí)現(xiàn)自動(dòng)推理、聯(lián)想思維過(guò)程。段落的句子經(jīng)切分后,段落變?yōu)槎鄠€(gè)由三項(xiàng)構(gòu) 成的一組數(shù)列的集合。由最簡(jiǎn)式三項(xiàng)構(gòu)成的一組數(shù)列分放在寄存器地址。
[0304]自然語(yǔ)言似謂詞演算形式的自動(dòng)推理
[0305]【實(shí)例】作為"事"的描述的主語(yǔ)包含兩種情形,一種是行為事件,另一種是某種關(guān) 系表述。關(guān)于作為"事"的描述的主語(yǔ),在句中則以獨(dú)立的子句(即另一個(gè)基本思維模式)存 在為多見(jiàn)。例如
[0306] 短語(yǔ):在年青時(shí),我做了 一個(gè)重大決定,這就是去林場(chǎng)工作,在那里我遇到了一位 美麗的姑娘,她給我?guī)?lái)一生的幸福。如果一個(gè)決定給你帶來(lái)幸福,這個(gè)決定就是明智的。
[0307] 得出結(jié)論:我去林場(chǎng)工作是明智的決定。
[0308] 在年青時(shí),我做了 一個(gè)重大決定,這就是去林場(chǎng)工作,在那里我遇到了一位美麗的 姑娘,她給我?guī)?lái)一生的幸福。如果一個(gè)決定給你帶來(lái)幸福,這個(gè)決定這個(gè)就是明智的。
[0309] =(我,在…時(shí),年青)M我,做了,一個(gè)重大決定)M決定,是,去林場(chǎng)工作 (我,在,那里(林場(chǎng)))A (我,遇到了,一位美麗的姑娘)-(她,給我?guī)?lái),一生的幸福hif (一個(gè)決定,給你帶來(lái),幸福),-then(這個(gè)決定,是,明智的)。
[0310] -系列的行為動(dòng)作構(gòu)成因果關(guān)系鏈條,這隱含在上面語(yǔ)句分解后的行為動(dòng)作次序 中。
[0311 ]注:去…(那里),"去"后邊的詞即是"那里"。
[0312]上式=(我,在…時(shí),年青)八(我,做了,(決定,IS,一個(gè)八重大)A (決定,是,(我, 去…工作,林場(chǎng)))-(我,在,林場(chǎng))M我,遇到了,(姑娘,IS,一位A美麗的)-(她,給八帶 來(lái),(幸福,IS,我的八一生的hifG決定,IS,一個(gè)),給八帶來(lái),(幸福,IS,你的)),^(then) ((決定,IS,這個(gè)),是,明智的)。
[0313]將各層面核心句義提取出來(lái),得到
[0314](我,做了,決定)(決定,是,(我,去A工作,林場(chǎng)))
[0315]-(我,在,林場(chǎng))(我,遇到了,姑娘)
[0316]-(姑娘,給八帶來(lái),幸福)
[0317] if ((決定,給八帶來(lái),幸福)then((決定,是,明智的)
[0318]將(姑娘,給八帶來(lái),幸福)代入(我,遇到了,姑娘),得到
[0319](我,在,林場(chǎng))(我,遇到了,(姑娘,給A帶來(lái),幸福)),再代入(決定,是,(我,去八 工作,林場(chǎng))),得到
[0320] ((決定,是,(我,去八工作,林場(chǎng)),(我,遇到了,(姑娘,給八帶來(lái),幸福))
[0321] 取消因果關(guān)系鏈條中"結(jié)果"的行為主體,只保留原因的行為主體"決定",簡(jiǎn)化得 到
[0322](決定,給八帶來(lái),幸福),
[0323]由if((決定,給八帶來(lái),幸福)then((決定,是,明智的),將(決定,是,(我,去八工 作,林場(chǎng)))代入,得到
[0324]((決定,給八帶來(lái),幸福) -((我,去八工作,林場(chǎng)),是,明智的)
[0325] 注:在因果關(guān)系鏈條中,作為"結(jié)果"的行為主體詞(即主語(yǔ)),可由作為原因的行為 主體詞(即主語(yǔ))替代,因?yàn)橐蚬P(guān)系傳遞的原因,它的因果關(guān)系的本質(zhì)意義不變。例如,"他 的話把她說(shuō)哭了,她生氣地吃不飯,于是幾天后她瘦了三公斤",這段話中的因果關(guān)系可以 追溯為"他的話使她瘦了三公斤"。
[0326] 輸出短語(yǔ)的中心意義:
[0327] 我去林場(chǎng)工作是明智的決定
[0328]=(我去林場(chǎng)工作,是,(決定,是,明智的)
[0329] 將都含有"決定"的語(yǔ)句再抽取出來(lái),得到
[0330] 核心句義:
[0331](我,去…工作,林場(chǎng)),((我,去…工作,林場(chǎng)),是,決定),(決定,是,明智的)
[0332] 設(shè)wl = (我,去…工作,林場(chǎng))
[0333] wl(X)
[0334] 決定(X,Y,Z)
[0335] is(Y,Z)
[0336] 決定(X,Y)
[0337] 決定(Y)
[0338] 明智的(Z)
[0339] 用Prolog表示即
[0340] wl(X),decide(X,Y,Z),is(Y,Z),decide(Y),wise(Z).
[0341] 下面舉例兩種典型的推理模式,來(lái)說(shuō)明本發(fā)明的推理方法。
[0342] 邏輯推理模式一:
[0343]自然語(yǔ)言似謂詞演算形式的自動(dòng)推理算法模型(三段式形式邏輯):
[0344] 1 .在句式中以個(gè)體替代類屬作為對(duì)類屬這一變量的賦值,也可用類屬替代個(gè) 體一一這要看推理目標(biāo)的需要。終極的抽象概念(如"秩序"與"紊亂","好"與"壞"等成對(duì)的 兩極抽象概念)與被它所包括的具體概念之關(guān)系均如此。
[0345] 2.在句式中,如果說(shuō)明子句與主體表達(dá)相矛盾,貝lj句子無(wú)效。
[0346] 3.同一行為鏈中具有因果關(guān)系鏈的行為主體,在句式中可按照因果次序前者替換 后者(這由因果關(guān)系的時(shí)空限定的唯一性所決定)。
[0347] 4.Whati BE What2反過(guò)來(lái)也是一樣,What2 BE Whati,二者等價(jià)。
[0348] 5 ? Whati Do What2模式中,Do等價(jià)于What2。
[0349] 6.作為句中第三項(xiàng)的WjDWj+1都可以獨(dú)立地提出來(lái),有完整的意義,并與其他WDW進(jìn) 行歸結(jié)合一并形成新句子。而且作為第三項(xiàng),可以取消WD,只保留W j+1,句子縮減為中心意 義句。
[0350] 7.將句中最初切分為四種基本思維模式之一的D0的限定表述消去,并將同一句中 最后一個(gè)D0的WHAT保留,如果WHAT是BE型的,則BE兩邊等值而形成兩個(gè)簡(jiǎn)化句。
[0351] 8. -段話的分解充分的基本模式中的三項(xiàng)參數(shù),除BE(即謂詞)外,在同一情境中 等價(jià),即可以互相替代。可將這一段落中每一句話中的相同的詞用同一個(gè)等價(jià)的詞替換。
[0352] 下面,我們?cè)斒鼋柚景l(fā)明的方法,將自然語(yǔ)言切分后通過(guò)相同詞替代及全稱、單 體替代進(jìn)行推理。人工智能所謂的謂詞演算的歸一算法與之相同。
[0353] 【實(shí)例】假設(shè)有這樣一些事實(shí)表述的句子(括號(hào)內(nèi)為操作之表述):
[0354] ⑴Tony是Graham的朋友;(Tony,是,Graham的(朋友))
[0355](由原句"Tony是Graham的朋友",得出
[0356] Tony是(Graham的)朋友。由這句話,因?yàn)闆](méi)有特別說(shuō)明,按照名字可知
[0357] Graham和Tony均是人。)---將句子切分為思維基本模式之一。
[0358] (2)Graham的所有朋友都喜歡酒;(Graham的(朋友),喜歡,酒)
[0359](由原句"Graham的所有朋友都喜歡酒",將
[0360] "所有……都"取消,獲得---將句子中"所有……都"取消。
[0361] "Graham的朋友喜歡酒",然后用---將句子中變成抽象(無(wú)具體限定)表述。
[0362] Tony置換"Graham的朋友喜歡酒"中的"Graham的朋友",貝IJ得出
[0363] "Tony喜歡酒"。---將句子中"朋友"具體化。賦值,即給出確定值。
[0364] "所有……都"只是強(qiáng)調(diào)語(yǔ)氣而已)
[0365] ⑶每個(gè)喜歡酒的人都喝酒精飲料。(喜歡酒的(人),喝,酒精飲料)= ((人,喜歡, 酒),喝,酒精飲料);(人,喜歡,酒)與(Graham的(朋友),喜歡,酒)結(jié)構(gòu)相同,則可以Graham 的(朋友)替代"人";而Tony,是,Graham的(朋友),所以Tony可以替代"人"。替換后有
[0366] (喜歡酒的(Tony),喝,酒精飲料),即
[0367] (Tony,喝,酒精飲料),同時(shí),酒=酒精飲料。替代后又有
[0368] (喜歡酒精飲料的(Tony),喝,酒),即
[0369] Tony喜歡酒精飲料。
[0370](由原句"每個(gè)喜歡酒的人都喝酒精飲料",將
[0371 ] "每個(gè)……都"取消,獲得---將句子中"每個(gè)……都"取消。
[0372] "喜歡酒的人喝酒精飲料",---將句子中變成抽象(無(wú)具體限定)表述。
[0373] 因?yàn)?Tony是人",和"Tony是喜歡酒的人",用
[0374] Tony置換"喜歡酒的人喝酒精飲料"中的"喜歡酒的人",則得出
[0375] "Tony喝酒精飲料",同吋,"酒是酒精飲料"。然后用
[0376] "酒精飲料"置換"Tony喜歡酒"中的"酒",則有
[0377] "Tony喜歡酒精飲料"。---用等值的詞置換。思維基本模式中兩邊是等值的。
[0378] "所有……都"只是強(qiáng)調(diào)語(yǔ)氣而已)
[0379]⑷推理得出結(jié)論:Tony喜歡酒精飲料。
[0380]這些事實(shí)表述的句子,因?yàn)橄嗷ビ泄餐臉?gòu)成主題,所以,可以構(gòu)成一個(gè)復(fù)合句或 段落:
[0381 ] Si = (Is,Whati,What2(likes,What2,What3 A (drinks,What4,What5))
[0382] Whati = Tony;What2 = Graham 的所有朋友;What3 =酒;What4 =每個(gè)喜歡酒的人(自 然包括Tony) = (likes,What2,What3); What5 =酒精飲料。其中What2與What4包含Whati, What5包含What3,分別是類屬(抽象的概念)與個(gè)體的關(guān)系,二者相互依存和部分特性一樣, 故某些情形中可相互替代。在句式中可以個(gè)體替代類屬作為對(duì)類屬這一變量的賦值,也可 用類屬替代個(gè)體一一這要看推理目標(biāo)的需要。所以上式
[0383] = (Is ,ffhati, (likes,ffhati,ffhat3 A (drinks, (likes ,ffhati,ffhat3) ,ffhats))
[0384] =(Is,Whati,(drinks,(likes,Whati,What5),What5))
[0385] 句子中己有了( likes,Whati,What5)這一結(jié)論,這句子意指"Tony是喝酒精飲 料 Tony喜歡酒精飲料"。
[0386] 如果推理得出結(jié)論:Graham的所有朋友喜歡酒精飲料,則在句中是以What2替代 Whati,所以上式
[0387] =(Is,What2,(likes,What2,What3八(drinks,(likes,What2,What3),What5))
[0388] =(Is,What2,(drinks,(likes,What2,What5),What5))
[0389] 如果將What3替代What5。(句子中以個(gè)體替代類屬作為對(duì)類屬這一變量的賦值),所 以上式
[0390] =(Is,What2,(drinks,(likes,What2,What3),What3))
[0391 ] = (Is,What2,(drinks+likes,What2,What3)),這里Is,What2,可省去,即有:
[0392] = (drinks+likes,What2,What3)
[0393] (drinks,(likes,What2,What3),What3)意指"Graham的所有朋友喜歡酒--因而 飲酒"。推理得出結(jié)論:Graham的所有朋友飲酒。
[0394] 句子的主題詞(表達(dá)的主體)由動(dòng)機(jī)和語(yǔ)境決定。上述是以Tony為主題,則推理結(jié) 論表達(dá)Tony。以Graham的所有朋友為主題,則有了 "Graham的所有朋友飲酒"的推論。
[0395] 邏輯推理模式二
[0396] 由自然語(yǔ)言信息轉(zhuǎn)換的似謂詞演算形式進(jìn)行演算的推理算法模型:
[0397] (1)按時(shí)間優(yōu)先原則,取首句第一組數(shù)列中的第三項(xiàng)減次句中第一組數(shù)列中的第 一項(xiàng),如結(jié)果為0,并且首句第一組數(shù)列中的第二項(xiàng)減次句第二組數(shù)列中的第二項(xiàng)的結(jié)果也 為〇,則將次句第二組的第一項(xiàng)替代首句第一組數(shù)列的第三項(xiàng);新的首句第一組數(shù)列構(gòu)造完 成;
[0398] (1.1)如未有上述結(jié)果,則取首句第一組數(shù)列中的第三項(xiàng)減次2句第三組數(shù)列中的 第一項(xiàng),如結(jié)果為0,并且首句第一組數(shù)列中的第二項(xiàng)減次2句第三組數(shù)列中的第二項(xiàng)的結(jié) 果為0,則將次2句第三組的第一項(xiàng)替代首句第一組數(shù)列的第三項(xiàng);新的首句第一組數(shù)列構(gòu) 造完成;
[0399] (2)取第一組數(shù)列中的第三項(xiàng)減去已成功完成步驟1運(yùn)算的次組數(shù)列中的第一項(xiàng), 如結(jié)果為0,并且第一組數(shù)列中的第二項(xiàng)減去已成功完成步驟1運(yùn)算的次組數(shù)列中的第二項(xiàng) 的結(jié)果為0,則將已成功完成步驟1運(yùn)算的次組數(shù)列中的第一項(xiàng)替代第一組數(shù)列的第三項(xiàng); 新的第一組數(shù)列構(gòu)造完成;
[0400] (3)繼續(xù)上述過(guò)程直至無(wú)法完成上述過(guò)程,中止;輸出新的第一組數(shù)列,這即是推 理結(jié)果;
[0401] (4)如果所選的一組數(shù)列無(wú)法完成上述過(guò)程,則選擇次一組數(shù)列進(jìn)行上述過(guò)程;
[0402] (5)有推理結(jié)果或無(wú)推理結(jié)果,輸出結(jié)論。
[0403]【實(shí)例】將下面自然語(yǔ)句完全地轉(zhuǎn)換為謂詞形式并完成推理:
[0404]任何通過(guò)歷史考試和中獎(jiǎng)的人是快樂(lè)的,
[0405]任何努力學(xué)習(xí)或者幸運(yùn)的人能夠通過(guò)所有考試,
[0406]約翰不學(xué)習(xí)但是很幸運(yùn),
[0407]任何幸運(yùn)的人能中獎(jiǎng),
[0408] 推理證明:約翰是快樂(lè)的。
[0409] V:x: (pass (x,history)八win (x,. lottery) -happy (X))
[0410] 下面是中文句子與謂詞形式完全對(duì)應(yīng)過(guò)程,并可知能將二者通過(guò)機(jī)器自動(dòng)轉(zhuǎn)換。
[0411]
[0412] 從此句可得到最基礎(chǔ)的核心句義,即IF(人,通過(guò),歷史考試)八(人,中,獎(jiǎng))THEN (人,是,快樂(lè)的),由三項(xiàng)組成的表述式,與謂詞演算直接轉(zhuǎn)換。
[0413]以x取取代抽象主語(yǔ)詞"人",另外取"通過(guò)(人,考試)"和中(人,獎(jiǎng)),得到
[0415]注:(考試,是,歷史)表示"考試"與"歷史"等價(jià),為了簡(jiǎn)潔,可取"通過(guò)(人,考試)", 當(dāng)然,也可取"通過(guò)(人,歷史)"。
[0417] 將下面自然語(yǔ)句完全地轉(zhuǎn)換為謂詞形式:
[0418] ②任何努力學(xué)習(xí)或者幸運(yùn)的人能夠通過(guò)所有考試。
[0419] V x Vy (study (x ) V lucky (y) -^pass (x, y))
[0420] "能夠"、"原來(lái)" =%"。另外,"決定"的行為同時(shí)隱含著已經(jīng)"計(jì)劃"了什么。所以, "決定'WHAT'" = "計(jì)劃'WHAT'"。這是描述行為時(shí),因行為的連續(xù)性、因果關(guān)系而決定的概念 之間的關(guān)系。
[0421]
[0422] 從此句可得到最基礎(chǔ)的核心句義,即IF(x人,努力,學(xué)習(xí))V(y人,是,幸運(yùn)的)THEN ((x,y)人,通過(guò),考試),由三項(xiàng)組成的表述式。
[0423] "通過(guò)考試"與"通過(guò)"在句中等價(jià),為了簡(jiǎn)潔,可取"PaSS(x,y)"。
[0424] S2=Vx. Vy (strive Cx, study) V lucky (y) ^pasa (%, y))
[0425] 將下面自然語(yǔ)句完全地轉(zhuǎn)換為謂詞形式:
[0426] ③約翰不學(xué)習(xí)但是很幸運(yùn),
[0427] study (John) A lucky (john)
[0428] S3 =約翰不學(xué)習(xí)但是很幸運(yùn)
[0429]=((約翰,不,學(xué)習(xí))A(約翰,是,很幸運(yùn)))
[0430]=((約翰,不,學(xué)習(xí))A(約翰,是,(幸運(yùn),是,很的)))
[0431 ]從此句可得到最基礎(chǔ)的核心句義,即(john,不,學(xué)習(xí))V (john,是,幸運(yùn)的),得到 S3==" study (john) A lucky (John)
[0432]④任何幸運(yùn)的人能中獎(jiǎng),
[0434] 下面看推理證明:
[0435] 由sentence(x,中,獎(jiǎng)):_WBW(x,是,幸運(yùn)的)?
[0436] (john,是,幸運(yùn)的):_( john,是,x),得到
[0437] sentence( john,中,獎(jiǎng)):_WBW( john,是,幸運(yùn)的)?
[0438] 再由sentence(x,是,快樂(lè)的):_WDW(x,通過(guò),考試),WDW(x,中,獎(jiǎng)).得到
[0439] sentence( john,是,快樂(lè)的):_WDW( john,中,獎(jiǎng))
[0440] 推理證明:約翰是快樂(lè)的。
[0441 ]將上例SI、S2、S3、S4分別泛化為句式,則有
[0442] S5 =任何通過(guò)歷史考試和中獎(jiǎng)的人是快樂(lè)的。
[0443] ……的人人"泛化為變量x;x前是以"的"為標(biāo)識(shí)的一個(gè)或多個(gè)WDW或WBW限定成 分。
[0444] ……的人是-"是"泛化為變量BE;
[0445] ……的人是快樂(lè)的快樂(lè)的"泛化為變量y,y域?yàn)橄薅▎卧~類集。
[0446] 換一下表達(dá)方式,有:
[0447]
[0448] 從此句可得到最基礎(chǔ)的核心句義,即IF(人,通過(guò),歷史考試)八(人,中,獎(jiǎng))THEN (人,是,快樂(lè)的),由三項(xiàng)組成的表述式,與謂詞演算直接轉(zhuǎn)換。
[0449] sentence(人,是,快樂(lè)的):-WDW(人,通過(guò),歷史考試),WDW(人,中,獎(jiǎng)).
[0450] WDW(人,通過(guò),歷史考試):-[0451 ] WDW(人,中,獎(jiǎng)):_
[0452] 回應(yīng)這句話,可以從上面三個(gè)基本句子引起。
[0453] 注:(考試,是,歷史)表示"考試"與"歷史"等價(jià),為了簡(jiǎn)潔,可取消"考試"一詞。并 將"人"一詞替換為變量X。
[0456] (五)句子生成
[0457] 句式切分的回溯過(guò)程就是新句子的生成過(guò)程。在句式切分基礎(chǔ)上,依據(jù)相同字詞 的替代而完成的邏輯推理過(guò)程,將產(chǎn)生新的最簡(jiǎn)句式(最簡(jiǎn)思維模式)的集合,進(jìn)行切分的 逆向回溯,就會(huì)產(chǎn)生一個(gè)新的句子作為輸出結(jié)果,從而實(shí)現(xiàn)機(jī)器與人的邏輯思維的結(jié)果相 同。
[0458] 1.生成句子就是以最簡(jiǎn)單的基本思維模式為基礎(chǔ),通過(guò)增加WHAT--名詞或代詞 主語(yǔ)和D0--動(dòng)詞謂語(yǔ)的限定成份而逐步形成。設(shè)定determiner [x]為限定詞集合,把限定 詞集合與WHAT和D0結(jié)合一起,四種基本思維模式就組成了自然語(yǔ)言句式。生成語(yǔ)句是語(yǔ)句 切分后的反操作,一種回溯方式。由于我們的計(jì)算機(jī)的數(shù)據(jù)庫(kù)都以最簡(jiǎn)式一一即似謂詞演 算的形式構(gòu)成,所以可以很便捷地把知識(shí)重新組合成語(yǔ)句輸出。句式切分的回溯過(guò)程就是 新句子的生成過(guò)程。在句式切分基礎(chǔ)上,依據(jù)相同字詞的替代而完成的邏輯推理過(guò)程,將產(chǎn) 生新的最簡(jiǎn)思維模式的集合,進(jìn)行切分的逆向回溯,就會(huì)產(chǎn)生一個(gè)新的句子作為輸出結(jié)果 (與人的邏輯思維的結(jié)果相同)。
[0459] 【實(shí)例】依據(jù)語(yǔ)句內(nèi)在相同成分而形成的復(fù)合語(yǔ)句
[0460] 依據(jù)最簡(jiǎn)式或簡(jiǎn)單的語(yǔ)句內(nèi)在相同成分而形成復(fù)合語(yǔ)句,即通過(guò)逆分解過(guò)程回溯 并泛化生成句式。
[0461 ] 例如下面的語(yǔ)句:
[0462] 建筑風(fēng)格是維多利亞式。
[0463] 按照句式切分方法,可以得到 [0464]底層:(建筑,有,風(fēng)格)
[0465] 頂層:(風(fēng)格,是,維多利亞式)
[0466] 建筑(x) =building(x)
[0467] 風(fēng)格(x,y)=style(x,y)
[0468] 維多利亞式(y) =victorian(y)
[0469] 風(fēng)格(z) ? =style(z)
[0470] Vx'3 .y V z bui.ldi.ng (x) A.st.y.le (x,y)八style (z> -vietor.i.a.n (:y.)'
[0471] 泛化句式是
[0472] (whatl,HAS,what2)和
[0473] (what2,IS,what3)
[0474] is_contained_in(what3,what2):-location(what3,what2).
[0475] (what3屬于 what2 類集。)
[0476] 回溯得到語(yǔ)句"whatl what2 IS what3"。
[0477] 逆分解過(guò)程回溯上面的例句:
[0478]將(風(fēng)格,是,維多利亞式)代入(建筑,有,風(fēng)格)中,操作步驟是 [0479] (1)將(建筑,有,風(fēng)格)復(fù)原,取消"有"及括號(hào)內(nèi)逗號(hào),得到(建筑風(fēng)格);
[0480] (2)由(風(fēng)格,是,維多利亞式),取消括號(hào)內(nèi)逗號(hào),替換(建筑風(fēng)格)中的"風(fēng)格",得 到:
[0481 ] (3)建筑風(fēng)格是維多利亞式。
[0482] 注:上述泛化句式的各項(xiàng)可能是詞組或語(yǔ)句。
[0483] 采用本發(fā)明的方法,可以實(shí)現(xiàn)對(duì)自然語(yǔ)言整篇的進(jìn)行切分,這是實(shí)現(xiàn)機(jī)器思維與 人類思維完全一致的基礎(chǔ)。
[0484] 采用本發(fā)明的方法,可以實(shí)現(xiàn)對(duì)兩種不同的語(yǔ)言通過(guò)切分后進(jìn)行機(jī)器自動(dòng)翻譯。 本發(fā)明方法依據(jù)人類思維的本質(zhì)模式,所以,不同語(yǔ)言體系只有表達(dá)方式的細(xì)節(jié)差異,基本 結(jié)構(gòu)是相同的。切分后的最簡(jiǎn)思維模式之集合會(huì)有另一種語(yǔ)言相對(duì)應(yīng),翻譯即是將最簡(jiǎn)思 維模式中的詞匯相應(yīng)轉(zhuǎn)換為匹配的另一種語(yǔ)言的詞匯。
[0485] 采用本發(fā)明的方法,可以實(shí)現(xiàn)對(duì)數(shù)學(xué)的機(jī)器思維完全以自然語(yǔ)言表達(dá)并自動(dòng)完成 解決問(wèn)題過(guò)程。通過(guò)泛化處理,可以歸納出各種類型題的題目的自然語(yǔ)言似謂詞形式轉(zhuǎn)換 后的解題模式。
[0486] 采用本發(fā)明的方法,切分后的語(yǔ)句變成了由三項(xiàng)字詞構(gòu)成的最簡(jiǎn)思維模式的集 合,運(yùn)用搜索匹配識(shí)別,進(jìn)行遞歸替代等計(jì)算過(guò)程而實(shí)現(xiàn)自動(dòng)推理、聯(lián)想等思維過(guò)程。
[0487] 采用本發(fā)明的方法,通過(guò)詞(概念)的格式塔結(jié)構(gòu)維度的相似度,機(jī)器可以自動(dòng)搜 索識(shí)別,找出同類屬的概念(詞)和相反的概念(詞),表述行為的系列詞匯也可以同樣的方 法尋出,并作為學(xué)習(xí)結(jié)果儲(chǔ)存入字詞數(shù)據(jù)庫(kù)。
[0488] 采用本發(fā)明方法,對(duì)自然語(yǔ)言表述進(jìn)行似謂詞形式的轉(zhuǎn)換,泛化的基礎(chǔ)上實(shí)現(xiàn)機(jī) 器自動(dòng)編程。
[0489] 本發(fā)明的一種自然語(yǔ)言機(jī)器識(shí)別系統(tǒng),包括人機(jī)接口模塊、句子切分模塊、中央處 理單元、句式合成模塊及數(shù)據(jù)庫(kù)模塊,所述的句子切分模塊和句式合成模塊分別與所述中 央處理單元的輸入端和輸出端通過(guò)電信號(hào)相連,所述的數(shù)據(jù)庫(kù)模塊為多庫(kù)協(xié)同模塊,包括 字詞庫(kù)管理模塊、知識(shí)庫(kù)管理模塊、情景庫(kù)管理模塊、多元語(yǔ)義網(wǎng)絡(luò)庫(kù)管理模塊及隱喻網(wǎng)絡(luò) 庫(kù)管理模塊。
[0490]以下為本發(fā)明的多庫(kù)協(xié)同模塊的建立方法:
[0491 ]建立字詞庫(kù)管理模塊的新代碼字詞庫(kù)
[0492] 1.采用自然數(shù)編碼的新代碼字詞庫(kù),所述新代碼編碼數(shù)據(jù)庫(kù)通過(guò)手工輸入或利用 現(xiàn)有的開(kāi)放代碼源的字詞庫(kù)輸入字詞的方式來(lái)建立。
[0493] 建立數(shù)字代碼字詞庫(kù),并能輸出相應(yīng)數(shù)字(如:0,1,2,……9)用本身數(shù)字作代碼, 另加數(shù)位標(biāo)識(shí)代碼。數(shù)字以數(shù)位標(biāo)識(shí)和單數(shù)字共同定義。詞義特定的如"是、在、的、地"等和 標(biāo)點(diǎn)符號(hào),以及詞類確定的(如植物名稱、專有名詞等)用某個(gè)區(qū)間的數(shù)字作代碼。作為表達(dá) 行為的詞,在句式中位置決定其詞性(動(dòng)詞性或名詞性),這部分詞在字詞庫(kù)的構(gòu)成及形式 有不同情形而有不同輸出。
[0494]在字詞庫(kù)建立各種行為動(dòng)作模式,作為最簡(jiǎn)式中間項(xiàng)"D0"的組成部分;
[0495] 考慮到為詞的常規(guī)搭配及固定詞組,建立字詞庫(kù)初期賦詞代碼數(shù)字之間留足間 隔。
[0496] 在構(gòu)造字詞庫(kù)時(shí),將詞之間的固有搭配變?yōu)檫B續(xù)的兩個(gè)或多個(gè)數(shù)之?dāng)?shù)列,固有搭 配的詞組或成語(yǔ)也具有唯一性,那么,對(duì)于原有字詞庫(kù)中沒(méi)有的統(tǒng)計(jì)概率大的搭配一起的 詞,將其作為固有搭配的詞組進(jìn)入字詞數(shù)據(jù)庫(kù)。這將成為機(jī)器自動(dòng)學(xué)習(xí)方式之一。
[0497] 建立了字詞庫(kù)后,該庫(kù)具有納入輸入字詞、進(jìn)行搜索比對(duì),并輸出相應(yīng)數(shù)字代碼的 功能。
[0498] 2.建立句式切分模塊。句子切分模塊與詞性分類的字詞庫(kù)相聯(lián),并有分類的寄存 地址所構(gòu)成的句式。分層將數(shù)列句子分成由三項(xiàng)的數(shù)或數(shù)組組成的數(shù)列。
[0499] 由字詞庫(kù)管理模塊輸出的數(shù)組替代原句子,由之一個(gè)句子變?yōu)橐唤M數(shù)列,并進(jìn)入 句式切分模塊。句式切分模塊具備搜索比對(duì)功能,按自然順序逐一進(jìn)行。識(shí)別采用減法的計(jì) 算,結(jié)果為〇即成功,字詞庫(kù)功能之一是比對(duì)識(shí)別。
[0500] 由兩個(gè)字以上構(gòu)成的詞組比對(duì)識(shí)別的算法模型:
[0501] 1.按先后次序,先在作為詞組代碼的數(shù)之區(qū)間判別,再依次將作為詞組代碼的一 數(shù)減字詞數(shù)據(jù)庫(kù)該區(qū)間首遇的第一個(gè)代碼數(shù),差為零,則該詞組第1個(gè)字為首遇的數(shù)代碼定 義的字;如果差不為零,則余數(shù)依次減后面的代碼數(shù),直至差為零,另一字識(shí)別方式相同,由 之,詞組均得到比對(duì)識(shí)別。如果差數(shù)為非0,則判斷字詞庫(kù)無(wú)此詞組。
[0502] 2.如果1.判斷未完成與該詞組比對(duì)識(shí)別。則轉(zhuǎn)入下一詞組比對(duì);
[0503] 2.1.重復(fù)上述1.過(guò)程。如果仍未完成與詞組比對(duì)識(shí)別,則
[0504] 3.重復(fù)上述過(guò)程,直至完成比對(duì)識(shí)別。如果比對(duì)成功或比對(duì)失敗,則
[0505] 44俞出結(jié)果。
[0506]以似謂詞演算形式定義并詮釋一個(gè)詞,建立自然語(yǔ)言理解的字詞庫(kù)
[0507]詞的定義是最主要的基礎(chǔ)工作,應(yīng)在高度統(tǒng)一的層面開(kāi)始,逐層將格式塔結(jié)構(gòu)維 度確定為某詞的基礎(chǔ)意義。層面越低越具體化---這就是現(xiàn)在詞典的表述方式。
[0508]利用一系列的謂詞形式定義一個(gè)詞,再構(gòu)造出相應(yīng)的例句句式,建立自然語(yǔ)言理 解的詞典。以此方法建立常用字詞典。例如,在《漢字源流字典》P22有"才"的釋義,按我們的 方法可表達(dá)為:
[0509]原義:"才"像草木之初,由之可知,衍生出的意義都有隱喻的特性。
[0510](才,像,草木之初)-(才,是,初始)-(才,是,剛剛)
[0511](才,像,草木之初)-(才,是,質(zhì)性)-(才,是,能力)-(才,是,有能力的人)
[0512](才,像,草木之初)-(才,是,質(zhì)性)-(才,是,才能)-(才,是,有才能的人)
[0513] (才,像,草木之初)-(才,是,草木)-(才,是,木材)A (才,是,材)-(才,是,材 料)-(才,是,棺材)
[0514] -個(gè)詞以似謂詞演算形式表示是為了轉(zhuǎn)換為謂詞形式,從而進(jìn)行謂詞演算和用 Prolog表示。這樣,詞與詞之間的匹配就變成了謂詞演算的遞歸、合一的替換操作。
[0515] 上面的每一條關(guān)于"才"的定義可以寫成謂詞形式
[0516] BE(y,Z),或
[0517] Z(y).
[0518] "人"與"才"在語(yǔ)句中的匹配就有了內(nèi)在的邏輯運(yùn)算的依據(jù)。在涉及"人"或擬人化 的描述中,有關(guān)"人"或類人者之質(zhì)性的描述,"人"或類人者的詞與"才"匹配。譬如,人之有 才能的人,組合成"人才"、"才子"、"男才女貌"、"你太有才了!"等匹配。
[0519] 下面看如何利用上面詞之定義的方法,通過(guò)同義詞替換,自動(dòng)生成同義句:
[0520] "你太有才了!"原句為"你太有能力了!"由(才,是,能力)有(能力,是,才),"是"兩 邊等價(jià)。將(能力,是,才)代入"你太有能力了",以"才"替換"能力"一詞,就得到"你太有才 了!"
[0521] 用Prolog的語(yǔ)言來(lái)表達(dá),有
[0522] [D0](x,y):-[D0](x,z),BE(y,z).
[0523] [D0](x,z),
[0524] BE(y,z).
[0525] 建立字詞庫(kù)(詞典)的算法模型:
[0526] 1.選擇一個(gè)簡(jiǎn)單字詞進(jìn)行定義(如上面"才"之定義),建立詞庫(kù),依次將第一個(gè)詞 定義中出現(xiàn)的詞加以定義;
[0527] 2.當(dāng)下詞定義完畢,重新進(jìn)行1.操作。
[0528]按此算法,將上面"才"之定義中出現(xiàn)的第一個(gè)詞"像"加以定義,然后依次是"草, 木,之,初,……,棺"。此輪定義完畢,則從第二個(gè)出現(xiàn)的詞"草"開(kāi)始新的定義過(guò)程,此輪定 義完畢后,又重新進(jìn)行相似操作。此算法經(jīng)過(guò)編程,將可以利用已有電子辭典而自動(dòng)獲取該 辭典中的釋詞而建立詞庫(kù)。
[0529]詞典的另一個(gè)用途是傳統(tǒng)的查字。由于詞典采用謂詞形式建立,即一個(gè)詞都以語(yǔ) 句的形式存在于數(shù)據(jù)庫(kù)中。作為例句的句式則可直接輸出并自動(dòng)依照當(dāng)前語(yǔ)句替換相關(guān)詞 匯,謂詞形式為這種替換提供了可能。
[0530]建立詞匯數(shù)據(jù)庫(kù)
[0531] 將詞匯按事物類別分列構(gòu)成"詞林",并將常用詞組合列入單詞名下。參考《詩(shī)韻合 璧》作法,([1 ]清?湯文璐編.詩(shī)韻合璧.上海:上海古籍書店,1982.)摘取書中pi內(nèi)容如下。
[0532] 根據(jù)《詩(shī)韻合璧》詞林典股目錄?天文門,擴(kuò)大詞匯:
[0533] 天?日月
[0534] [日]={(春日,IS,(日子,IS,春季的))= (春日,IS,日子)M日子,IS,春季的), (夏日,IS,日子)八(日子,IS,夏季的),(秋日,IS,日子)八(日子,IS,秋季的),(冬日,IS,日 子)八(日子,IS,冬季的)}
[0535] 下面詞的數(shù)據(jù)庫(kù)組成形式與[日]相同。
[0536] [月]={新月,殘?jiān)?,月桂,中秋月}八{(lán)戴月,歲月,日月}
[0537] [星]={天河,云,慶云,云峰} A {愁云,云山,云雨,云飛,云鎖,星光,披星}
[0538] 天?風(fēng)雨
[0539] [風(fēng)]={春風(fēng),夏風(fēng),秋閃,冬風(fēng)}
[0M0][雨]={夜雨,喜雨,黃梅雨,久雨,春雨,夏雨,秋雨,冬雨}
[0541] [雷]={}
[0542] [電]={}
[0543] [虹]={}
[0544] [霞]={}
[0545] [露]={}
[0546] [霜]={}
[0547] [雪]={喜雪,春雪}
[0548] [霧]={}
[0549] [霽]={}
[0550] [煙]={游絲}空中飄浮著游絲,游絲即細(xì)細(xì)的煙。
[0551] [晴]={}
[0552] [陰]={}
[0553] 建立情景庫(kù)
[0554] 建立情景詞匯和專門詞匯數(shù)據(jù)庫(kù)的算法模型:
[0555] 1.情景構(gòu)成(字詞庫(kù)或知識(shí)庫(kù)構(gòu)成):以似謂詞演算形式的表達(dá)式聚集而構(gòu)成。包 含:事物命名;時(shí)間與空間特性;限定詞:回應(yīng)語(yǔ)句自動(dòng)生成及輸出,等等。應(yīng)能通過(guò)機(jī)器自 動(dòng)學(xué)習(xí)增加知識(shí)。
[0556] 2.將描述情景中各主要物體及相關(guān)事件的字詞以數(shù)列表達(dá),作為詞庫(kù)的子庫(kù)。此 子庫(kù)中各字詞有緊密的相關(guān)性。
[0557] 3.情景庫(kù)由情景特征詞匯為構(gòu)成基礎(chǔ)。在此基礎(chǔ)上,增加可被用于新的句子、段落 生成的描述句及段落,此由數(shù)列表達(dá)。
[0558] 4.大的方面分,詞義分為:表事、物命名的;表時(shí)間、空間存在、位置、數(shù)量特性的; 表行為動(dòng)作的;表狀態(tài)的;表抽象限定的如"是"、"在"等。
[0559] 參考圖文詞典建立分類的情景詞匯和專門詞匯數(shù)據(jù)庫(kù)。譬如參考《英漢圖文對(duì)照 詞典》,建立起非常豐富的語(yǔ)境數(shù)據(jù)庫(kù)和生成句子用的詞匯數(shù)據(jù)庫(kù),([2]《英漢圖文對(duì)照詞 典》翻譯組.英漢圖文對(duì)照詞典.上海:上海科學(xué)技術(shù)出版社,1984.)摘取書中p265咖啡室, 茶室內(nèi)容如下:
[0560] (咖啡店(室),有,Xl|X2|X3|."|Xn[X])
[0561] [X]表示情境中構(gòu)成部分或特征集合。
[0562] 柜臺(tái)(糕點(diǎn)柜臺(tái)){XI},一一{XI}是關(guān)于柜臺(tái)特性、特征及樣式的列表,下面{X}也 均是同類的列表。就樣式(style)而言,如果需要"樣式"輸出,可自動(dòng)聯(lián)結(jié)。一一(咖啡店 (室),有,柜臺(tái)(糕點(diǎn)柜臺(tái))[X])
[0563]咖啡壺{X2},--(咖啡店(室),有,咖啡壺[X])
[0564]放貨幣盤子{X3},一一(咖啡店(室),有,放貨幣盤子[X])
[0565]蛋糕{X4},--(咖啡店(室),有,蛋糕[X])
[0566] 帶摜奶油蛋白甜餅{X5},一一(咖啡店(室),有,帶摜奶油蛋白甜餅[X])
[0567] 制糕點(diǎn)學(xué)徒{X6},
[0568] 柜臺(tái)女服務(wù)員{X7},
[0569] 報(bào)架{X8},
[0570] 壁燈{X9},
[0571] 拐角軟墊沙發(fā){X10},
[0572] 咖啡室小圓桌{XII},
[0573] 大理石臺(tái)面{X12},
[0574] 女侍應(yīng)生{X13},
[0575] 托盤{X14},
[0576] -瓶檸檬水{X15},
[0577] 檸檬水杯{X16},
[0578] 對(duì)局下棋者{X17},
[0579] 咖啡餐具{X18},
[0580] 一杯咖啡{X19},
[0581] 方糖小缽{X20},
[0582] 奶油壺{X21},
[0583] 咖啡室顧客{X22},
[0584] 先生{X23},
[0585] 女士 {X24},
[0586] 正在看報(bào)的人{(lán)X25},
[0587] 報(bào)紙{X26},
[0588] 報(bào)夾{X27}。
[0589] 以上詞匯表達(dá)那個(gè)時(shí)代英國(guó)咖啡室,茶室主要內(nèi)容特征。
[0590] 任何詞匯的意義都與語(yǔ)境相關(guān),所以,非常重要是,指明詞義是在何種情境中才成 立的。這是詞匯數(shù)據(jù)庫(kù)中的詞的標(biāo)識(shí)之一。
[0591] 建立隱喻網(wǎng)絡(luò)庫(kù)
[0592] 建立用于隱喻生成的詞匯數(shù)據(jù)庫(kù),也需要象上面那樣去做。
[0593] 建立可輸出的能用于生成語(yǔ)句的知識(shí)庫(kù)。
[0594] 將知識(shí)全部表達(dá)為謂詞形式,以此建立能用于生成語(yǔ)句的知識(shí)庫(kù)可以很方便地組 合成語(yǔ)句輸出。知識(shí)庫(kù)中知識(shí)的謂詞形式不一定非基本思維模式的最簡(jiǎn)式不可,也可部分 為復(fù)式。
[0595] 如果是WBW的簡(jiǎn)式,即只有形容詞和名詞組成的詞組NP,那么由ADJ N有
[0596] (noun(x),BE,adj(y)),或(noun(x),BE,noun(y))。當(dāng)名詞為常項(xiàng)N時(shí),由
[0597] (noun(N),BE,adj(y))或(noun(x),BE,noun(y)),
[0598] 可知不同的形容詞或名詞y同屬于N的類屬集合。按照上式,將在文章中搜索到的y 自動(dòng)地歸屬到N的類屬集合,由此實(shí)現(xiàn)機(jī)器自動(dòng)學(xué)習(xí)。
[0599] 如
[0600] N =裝飾風(fēng)格[古羅馬式,拜占庭式,維多利亞式,洛可可式,巴洛克式,中國(guó)漢代 式,中國(guó)明式,中國(guó)清式……]
[0601 ]實(shí)例:設(shè)輸入語(yǔ)句(建筑,有,風(fēng)格)和(風(fēng)格,是,簡(jiǎn)潔的)。這兩條語(yǔ)句由原句"建筑 有簡(jiǎn)潔的風(fēng)格"切分而來(lái)。
[0602]在建筑條目下有關(guān)于建筑造型樣式的知識(shí),其中有一條對(duì)建筑的定義是:
[0603](建筑,有,風(fēng)格) 知識(shí)語(yǔ)句存在形式是(建筑,有,風(fēng)格)
[0604]依據(jù)"建筑"、"風(fēng)格"這兩個(gè)詞可以展開(kāi)相關(guān)知識(shí)的自動(dòng)搜索。
[0605]而在藝術(shù)條目下有關(guān)于藝術(shù)造型樣式的知識(shí),其中有"風(fēng)格"詞目,風(fēng)格包含許多 不同的樣式,關(guān)于建筑造型的有:
[0606]建筑風(fēng)格[古羅馬式,拜占庭式,維多利亞式,洛可可式,巴洛克式,現(xiàn)代式,中國(guó)漢 式,中國(guó)藏式,......]
[0607] 知識(shí)語(yǔ)句存在形式是(風(fēng)格,是,樣式(x))。
[0608] 其中的樣式之一是"現(xiàn)代式",關(guān)于"現(xiàn)代式"的知識(shí)語(yǔ)句存在形式是(現(xiàn)代式,是, 簡(jiǎn)潔的)。
[0609] 還需要有一個(gè)另外的約束條件才能在(風(fēng)格,是,樣式(x))中確定與知識(shí)語(yǔ)句(建 筑,有,風(fēng)格)的最佳匹配。這另一個(gè)約束條件就來(lái)自另一個(gè)輸入的語(yǔ)句(風(fēng)格,是,簡(jiǎn)潔的)。
[0610] 當(dāng)搜索進(jìn)行到知識(shí)語(yǔ)句(風(fēng)格,是,樣式(x))類集之后,還可以再搜索到下一層面 的知識(shí)語(yǔ)句類集,這是定義樣式的狀態(tài)的類屬集合:
[0611] (樣式(x),是,adj(y))
[0612] 按照相同詞進(jìn)行遞歸操作,可以得到
[0613](現(xiàn)代式,是,簡(jiǎn)潔的)-----"是"兩邊等價(jià)。
[0614]代入(風(fēng)格,是,簡(jiǎn)潔的),得到 [0615](風(fēng)格,是,現(xiàn)代式)
[0616] 再與(建筑,有,風(fēng)格)進(jìn)行回溯,得到新的語(yǔ)句:
[0617] 建筑風(fēng)格是現(xiàn)代式。
[0618] 以此語(yǔ)句作為輸出。
[0619] 這樣由輸入的原句"建筑有簡(jiǎn)潔的風(fēng)格",得到輸出語(yǔ)句"建筑風(fēng)格是現(xiàn)代式"。
[0620] 7.建立多元語(yǔ)義網(wǎng)絡(luò)庫(kù)管理模塊
[0621] 以下語(yǔ)句表述一條知識(shí):
[0622]小燕從春天到秋天占有一個(gè)巢。
[0623]傳統(tǒng)方法是 [0624]二元關(guān)系的合?。?br>[0625] _start(占有1,春天),finish(占有,秋天),
[0626] _owner(占有1,小燕),owner(占有1,巢1)
[0627] 采用本發(fā)明的方法,完全用似謂詞演算形式的自然語(yǔ)句表示,并進(jìn)一步以Prolog 語(yǔ)言自動(dòng)編程,將一種知識(shí)片斷建立起來(lái),構(gòu)成語(yǔ)義網(wǎng)絡(luò)的一部分:
[0628] 小燕從春天到秋天占有一個(gè)巢 [0629]=(小燕從春天到秋天,占有,一個(gè)巢)
[0630]=((小燕,(時(shí),從,春天(到,秋天)),占有,一個(gè)巢)
[0631]=(小燕,占有,一個(gè)巢)八(時(shí),從,春天(到,秋天)
[0632] =(小燕,占有,一個(gè)巢)八(小燕,從,春天(到,秋天))M占有,從,春天(到,秋 天))A (時(shí),從,春天(到,秋天)------①
[0633] 補(bǔ)充:(小燕,占有,一個(gè)巢)-(燕,占有)-(燕,是,占有者), (自動(dòng)生成)
[0634] (燕,是,鳥(niǎo))。
[0635] 利用Prolog語(yǔ)言自動(dòng)編程,將上式①表述的知識(shí)片斷建立起來(lái),構(gòu)成關(guān)于鳥(niǎo)類的 語(yǔ)義網(wǎng)絡(luò)的一部分。
[0636] "小燕從春天到秋天占有一個(gè)巢"程序這樣編寫:
[0637] program swallows (x):-own (swallow,一個(gè)巢),own_s tart (swallow,春天),own_ finish(swallow,秋天),start(own,春天),finish(own,秋天),start(time,春天),finish (time,秋天),owner(swallow),swallows(x) ?
[0638] swallows_report:-
[0639] writeC'Known swallows are:'),nl,swallows(x),write(x),nl,
[0640] fail.
[0641 ]把這個(gè)程序調(diào)入Listener中,運(yùn)行swallows_report ?。
[0642] 采用本發(fā)明方法,對(duì)自然語(yǔ)言表述進(jìn)行似謂詞演算形式的轉(zhuǎn)換,泛化的基礎(chǔ)上實(shí) 現(xiàn)機(jī)器自動(dòng)編程。
[0643] 本發(fā)明的方法在隱喻、聯(lián)想機(jī)制中的表達(dá)
[0644] 按照本發(fā)明方法,首先以格式塔結(jié)構(gòu)維度為基礎(chǔ)將信息與知識(shí)形式化,與推理機(jī) 制結(jié)合,并以前者為基礎(chǔ)進(jìn)行聯(lián)結(jié)、轉(zhuǎn)換,實(shí)現(xiàn)聯(lián)想的思維過(guò)程和結(jié)果。而且,一般在一個(gè)語(yǔ) 句中詞匯多數(shù)都有擴(kuò)展意義,這用格式塔結(jié)構(gòu)維度將它表達(dá)出來(lái),"詞"的格式塔結(jié)構(gòu)維度 正是表述的詞的"語(yǔ)境"。從下面用BNF(Bachus-Naur Form)表述式來(lái)表示"我在讀書"句子 的理論分析,可見(jiàn)其獨(dú)特性。
[0645] a.首先按照詞義和位置進(jìn)行轉(zhuǎn)換
[0646] 賦值語(yǔ)句::=匹配〈WHAT的定義> |設(shè)〈WHAT的定義〉
[0647] b.WHAT(1,2)的定義::=〈WHAT(1,2)的名稱>〈具有>〈格式塔結(jié)構(gòu)維度集合> |〈格 式塔結(jié)構(gòu)維度集合 >〈屬于>〇^^(1,2)的名稱>
[0648] c.動(dòng)詞::=具有|屬于
[0649] d.格式塔結(jié)構(gòu)維度集合::=〈維度1>,〈維度2>,〈維度3>,…〈維度n>
[0650] e.格式塔結(jié)構(gòu)維度::=〈空間限定〉,〈時(shí)間限定〉,〈量〉,〈相互關(guān)系〉,……
[0651 ] f.WHAT(l,2)名稱:: = (WHAT(1,2))〈設(shè)定的符號(hào)>| (WHAT(1,2))〈設(shè)定的符號(hào)〉的 格式塔結(jié)構(gòu)維度集合
[0652] g.選擇新的WHAT(R)的定義::=〈WHAT(l)or WHAT(2)的名稱>〈具有>〈格式塔結(jié)構(gòu) 維度集合> I〈格式塔結(jié)構(gòu)維度集合>〈屬于>〈WHAT( 1 )or WHAT(2)的名稱〉
[0653] h.回應(yīng)賦值語(yǔ)句::=設(shè)<what'(l,2)的定義X具有X格式塔結(jié)構(gòu)維度集合>|〈格 式塔結(jié)構(gòu)維度集合〉〈屬于〉〈what'(1,2)>
[0654] i.由省缺的原WHAT(1,2)的格式塔結(jié)構(gòu)維度中匹配提取某維度作為新句子的議 題。
[0655] (g)~(i)的行為由"語(yǔ)境"決定。語(yǔ)境由已設(shè)定的模式中按目標(biāo)狀態(tài)、時(shí)間狀態(tài)和 空間狀態(tài)等綜合因素決定激活其一。
[0656] 【實(shí)例】首一中一尾(3段組合)模式是隱喻式表述,是抽象模式上一中一下(以大地 重力為參照系,垂直向)、前一中一后(水平向)、左一中一右(水平向)的限定形態(tài)之一。這三 種形態(tài)模式統(tǒng)一表達(dá)為一端(start) -中間(middle)-另一端(end)的離散的空間限定的 終極抽象形式。用形式化的自然語(yǔ)言的表述方法,這屬于關(guān)系概念集合smea。
[0657] 設(shè)Q為n維關(guān)系元,則有
[0659] SME= [start] A [middle] A [end]
[0660] [start],[middle],[end]分別是一端(start) - 中間(middle)-另一端(end)的 概念集合。
[0661 ] W1是WHAT的一個(gè)常項(xiàng)。
[0662] 如婆媳關(guān)系:母一子一兒媳;社會(huì)成員角色分類關(guān)系:精英分子一社會(huì)大眾一弱勢(shì) 群體。此二例均為隱喻式表述。
[0663] "不受苦中苦,難為人上人"則屬于兩極概念的結(jié)構(gòu)模式。此類可表示為:
[0664] 不受苦中苦,難為人上人
[0665] =_,(…,受,苦中苦> -(…,難為.人h人:) =-(…,受,(苦,BE,苦中更苦))一(,",為(為,BE,難),(人,BE,人中更優(yōu))) C…,受,苦中更苦)一(為,BE,難)八(…:,為,人中更優(yōu))
[0666] 兩個(gè)相對(duì)矛盾終極概念表達(dá)為一端(start)--另一端(end),由上述方法表示即
[0667] SE= [start] A [end]
[0669] 隱喻式推理
[0670] 這是聯(lián)想、隱喻的形成方式。
[0671] 在隱喻的源體與目標(biāo)體關(guān)系中,相對(duì)應(yīng)的組成元素即相似的格式塔結(jié)構(gòu)維度。找 出隱喻的可自動(dòng)分解的操作模式就解決了創(chuàng)新性思維的可行模式問(wèn)題。利用格式塔結(jié)構(gòu)維 度部分相似來(lái)達(dá)到創(chuàng)新。從思維的角度看,創(chuàng)新是隱喻的結(jié)果。
[0672] 我們?cè)诖艘韵嗷リP(guān)系的征象之一一一形態(tài)的"聚"的格式塔結(jié)構(gòu)維度集合來(lái)加以 說(shuō)明:
[0673] "聚"的關(guān)系征象:①基元的數(shù)量2以上;②相互依存性;③形態(tài)相向的態(tài)勢(shì);④互補(bǔ) 性;⑤相似性;⑥有序性。
[0674] 顯然,直線形態(tài)不具有"聚"的特征,所以變曲的河流才有"聚氣"的功能,這已反映 在中國(guó)古代建筑"風(fēng)水術(shù)"的相關(guān)理論中。我們?cè)僖郧楦兄硎鲈~"愛(ài)"的格式塔結(jié)構(gòu)維度集 合來(lái)加以說(shuō)明:
[0675] 1) "愛(ài)"的格式塔結(jié)構(gòu)維度:①非平衡性。即"愛(ài)"是傾向性的,偏向的。②控制關(guān)系。 即對(duì)心靈的影響,對(duì)其有約束作用。③主體與客體(或稱施方與受方)。施方受"愛(ài)"的控制最 強(qiáng)。④相互作用關(guān)系,付出與回報(bào)同時(shí)存在。"愛(ài)"是付出(心靈的或行為的),但同時(shí)也使施 愛(ài)方得到"愿望的滿足",即付出"愛(ài)"的愿望得到實(shí)現(xiàn)。⑤在刺激一一反應(yīng)關(guān)系中,"愛(ài)"最先 顯現(xiàn)為一種接受刺激的傾向,然后才引起生理一一心理情感的相關(guān)激發(fā)體驗(yàn),即進(jìn)入"愛(ài)" 的狀態(tài)。這種接受刺激的傾向被稱為"態(tài)度"。
[0676] 2) "恨"與愛(ài)方向相反,部分結(jié)構(gòu)維度相同。但第⑤點(diǎn)不同,它具有排斥刺激的傾 向。
[0677] -個(gè)事物A由一系列由符號(hào)系統(tǒng)的概念所命名的中間過(guò)程和事物所組成,例如一 座房屋,一臺(tái)機(jī)器等等。將一個(gè)符號(hào)作為上述表示方式中的一個(gè)格式塔結(jié)構(gòu)維度,則該事物 就可以由一系列的格式塔結(jié)構(gòu)維度所定義。顯然,這是另一層面的格式塔結(jié)構(gòu)維度表示方 式,每一個(gè)維度又有與之相似的更深層面的格式塔結(jié)構(gòu)維度集合所定義。如此遞歸至上述 的最基礎(chǔ)的格式塔結(jié)構(gòu)維度表達(dá)方式。呈現(xiàn)為樹(shù)形構(gòu)成結(jié)構(gòu)。變化某一層面的某個(gè)或某些 維度的量值或進(jìn)行相似事物的代換,就能使事物A發(fā)生形態(tài)甚至性質(zhì)變異,而轉(zhuǎn)變?yōu)榱硪粋€(gè) 事物B,這就是我們創(chuàng)造思維的"機(jī)械化"方式。循著這一思路,利用人工智能技術(shù)對(duì)此進(jìn)行 表述,例如利用現(xiàn)在關(guān)于知識(shí)的產(chǎn)生式表示法,框架表示法和語(yǔ)義網(wǎng)絡(luò)表示法,只是表達(dá)的 內(nèi)容有所不同。
[0678] 相似的概念在其格式塔結(jié)構(gòu)維度集中,維度相同相似的數(shù)量大,例如,"肥"與 "密";"瘦"與"疏"作為現(xiàn)象描述時(shí),都是對(duì)表面形態(tài)體量的描述,在量的維度是"多"或"少" 的界定,它們每組都是相似的。而對(duì)于"全"與"缺",除了"多"或"少"的界定,還有量的變化 的表述,"缺"隱含著量未達(dá)標(biāo)準(zhǔn)。這兩個(gè)概念更加抽象,并不是直接地對(duì)表面形態(tài)的表述。 這組相反概念組與上述概念組部分相似維度數(shù)量是不同的,差異性更大些。差異性大的相 似概念相互替代,創(chuàng)新性和創(chuàng)新程度大,但也可能被認(rèn)為荒謬。下面以實(shí)例看看:
[0679] 隱喻的邏輯
[0680] 以"月光如水"來(lái)說(shuō)明,
[0681] 月("月"的特性集合一一格式塔結(jié)構(gòu)維度集合,就是"月"的抽象的語(yǔ)義網(wǎng)絡(luò)):
[0682] 在"陰陽(yáng)"概念上屬"陰"。
[0683]其形態(tài)與物理屬性:⑴有光、但柔和;⑵園形或扁圓形;⑶不發(fā)熱;⑷光色與水色相 似;(5溺。
[0684] 其空間屬性:⑴與太陽(yáng)同在天上;⑵尺度較太陽(yáng)為??;
[0685] 其時(shí)間屬性:夜間
[0686] 其環(huán)境屬性:⑴靜寂;⑵溫度低;⑶[視覺(jué)環(huán)境]模糊,故統(tǒng)一性極強(qiáng)。
[0688]水("7K"的特性集合一一格式塔結(jié)構(gòu)維度集合,就是"7K"的抽象的語(yǔ)義網(wǎng)絡(luò)): [0689]在"陰陽(yáng)"概念上屬"陰"。
[0690]其形態(tài)與物理屬性:⑴有光(反射光),但柔和;⑵有線狀紋理(當(dāng)風(fēng)吹動(dòng)時(shí));⑶不 發(fā)熱,可使人產(chǎn)生涼的記憶;⑷、光色與月色相似;(5)弱;(6)可有聲響;(7)清晰或模糊(依光照 而定)。
[0691] 其空間屬性:⑴、隨處而形,有依附性;⑵、尺度不定
[0692] 其時(shí)間屬性:⑴或靜止或流動(dòng)
[0693] 其環(huán)境屬性:地上的諸多因素而定。
[0695]比較"水"與"月"之屬性,可見(jiàn)二者在光、色、溫度、柔弱、模糊等諸方面同一,即G月 與G*相似度大,故可以形成隱喻的關(guān)系。可用G月水表示格式塔維度相似數(shù)量大的關(guān)系,簡(jiǎn) 稱G月與G*相似。
[0696] 設(shè)8為格式塔結(jié)構(gòu)分維度。
[0697] 如果以似謂語(yǔ)形式表達(dá),即
[0698]
[0700] 【隱喻生成實(shí)例】
[0701] 虛擬(非感覺(jué)性)的思維中的信息或情感像一件東西,語(yǔ)言是思維的載體,詞語(yǔ)像 裝載東西的容器,交談像信息或情感的傳遞,按隱喻生成機(jī)制,用語(yǔ)言交流信息和情感,這 個(gè)復(fù)雜概念由三個(gè)相關(guān)聯(lián)的隱喻有機(jī)地組成一個(gè)整體(引自《語(yǔ)法隱喻和隱喻語(yǔ)法》(沈家 煊講稿pi),這就是下面的三個(gè)相關(guān)聯(lián)的隱喻陳述:
[0702] ①信息或情感是一件東西
[0703] ②詞語(yǔ)是裝載東西的容器
[0704] ③交談過(guò)程是物件的傳遞過(guò)程
[0705] 下面我們看利用自然語(yǔ)言如何從①、②及補(bǔ)充的另外一些相關(guān)知識(shí)得出③:
[0706] 1.相似性:(信息或情感,像,一件東西)-隱喻:(信息或情感,是,一件東西)
[0707] 2.相似性:(詞語(yǔ),像,裝載東西的容器)-隱喻:(詞語(yǔ),是,容器)
[0708] =相似性:(詞語(yǔ),像,(容器,裝載,東西))-隱喻:(詞語(yǔ),是,容器)
[0709] =相似性:(詞語(yǔ),像,容器)八(容器,裝載,東西隱喻:(詞語(yǔ),是,容器)-(詞 語(yǔ),裝載,東西)
[071 0] 詞語(yǔ)G語(yǔ)言,思維單元G思維 [0711](語(yǔ)言,是,載體)A (載體,裝載,思維)
[0712](詞語(yǔ),屬于,語(yǔ)言)-(詞語(yǔ),裝載,思維單元)
[0713](容器,屬于,載體)-(容器,裝載,東西)
[0714] 3.相似性:(交談,像,信息或情感的傳遞)-隱喻:(交談,是,信息或情感的傳遞)
[0715]=相似性:(交談,像,(信息或情感的傳遞))-隱喻:(交談,是,(信息或情感的傳 遞))
[0716]=相似性:(交談,像,(…,傳遞,信息或情感))-隱喻:(交談,是,(…,傳遞,信息 或情感))
[0717]=相似性:(交談,像,傳遞)八(…,傳遞,信息或情感)-隱喻:(交談,是,傳遞)八 (…,傳遞,信息或情感)
[0718]代入1.式,得到
[0719]相似性:(交談,像,傳遞)M…,傳遞,一件東西)-隱喻:(交談,是,傳遞)A (…, 傳遞,一件東西)
[0720]由物件G東西,代入上式得到
[0721]相似性:(交談,像,傳遞)八(…,傳遞,物件)-隱喻:(交談,是,傳遞)八(…,傳遞, 物件)-(交談過(guò)程,是,傳遞過(guò)程)A(…,傳遞,物件)
[0722] (…,傳遞,物件)是對(duì)"傳遞"的限定,"傳遞"可以變換為"物件的傳遞",所以,回溯 得到
[0723] 交談過(guò)程是物件的傳遞過(guò)程。
[0724] 泛化上述的變換,
[0725] (…,D0,W)等價(jià)于WS DON
[0726] WS是原名詞形容詞化
[0727] DON是原動(dòng)詞名詞化
[0728] 創(chuàng)造思維最終目標(biāo)以計(jì)算機(jī)的無(wú)與倫比的記憶、聯(lián)結(jié)和極速來(lái)非常高效地模仿實(shí) 現(xiàn)人的創(chuàng)造思維。
[0729] 本發(fā)明將自然語(yǔ)言似謂詞演算形式轉(zhuǎn)換后可以實(shí)現(xiàn)機(jī)器自動(dòng)學(xué)習(xí):
[0730] 人類知識(shí)由各種具體景象中獲得,并通過(guò)發(fā)現(xiàn)它們的相似性而歸納出類屬,即一 些具有相似性的不同事物從某種角度看,被認(rèn)定為一些相同的東西。按照本發(fā)明方法,通過(guò) 詞(概念)的格式塔結(jié)構(gòu)維度的相似度,機(jī)器可以自動(dòng)搜索識(shí)別,找出同類屬的概念(詞)和 相反的概念(詞),表述行為的系列詞匯也可以同樣的方法尋出,并作為學(xué)習(xí)結(jié)果儲(chǔ)存入字 詞數(shù)據(jù)庫(kù)。
[0731]本發(fā)明可以實(shí)現(xiàn)機(jī)器通過(guò)對(duì)某事實(shí)表述的學(xué)習(xí),從中找尋因果關(guān)系并推理得出某 個(gè)結(jié)論:
[0732] 進(jìn)行這類推理,需要有知識(shí)庫(kù)提供不同的但是意義相同的概念(詞)和因果關(guān)系句 子最簡(jiǎn)似謂詞演算形式聯(lián)結(jié)。
[0733] 本發(fā)明的自然語(yǔ)言似謂詞演算形式轉(zhuǎn)換后可以實(shí)現(xiàn)機(jī)器自動(dòng)編程:
[0734] 11 ?自動(dòng)編程
[0735] 11.1程序"自變量為a時(shí),執(zhí)行p,q這種謂詞,自變量為b時(shí),執(zhí)行r,s這種謂詞"。
[0736] pred(a):_p,q
[0737] pred(b):-r,s
[0738] Pred(abbr.斷言;宣布;謂語(yǔ)(predicate))
[0739] first(初始)
[0740] rest(剩余部分)
[0741 ] cons(construction 的縮寫,建立,解釋)
[0742] 初始(first)元素為a,剩余的元素(rest)為[b,c],這時(shí)的表可以表示為[a |[b, c]]。若將這種表示進(jìn)行復(fù)原,即從表中取出初始元素first,和初始元素以外的元素rest, 或者構(gòu)成以謂詞描述的cons,則會(huì)變成下列形式:
[0743] first first([X|Y],X)
[0744] rest rest( [X | Y] ,Y)
[0745] cons cons(X,Y,[X|Y])
[0746] 11.2需要編制的程序
[0747] 11.2.1自動(dòng)生成詞庫(kù)和知識(shí)庫(kù)
[0748]設(shè)從辭典中抽取一詞"讀一一看著文字念出聲來(lái)或?qū)W習(xí)",把這個(gè)詞及其釋義轉(zhuǎn)換 為以Prolog建立的詞庫(kù)中的詞。
[0749]【實(shí)例】從已有辭典得到"讀,看著文字念出聲來(lái)或?qū)W習(xí)",先轉(zhuǎn)成英文:
[0750] Read is Look at words and sound or learn〇
[0751] 問(wèn)題1:能否直接聯(lián)結(jié)電子辭典而將漢字對(duì)應(yīng)轉(zhuǎn)換為英文詞?如果不行,則建立英 漢對(duì)應(yīng)的
[0752] 字庫(kù)(是字庫(kù)而不是辭庫(kù),如"讀 read"對(duì)應(yīng))。
[0753] 2.先人工將read的定義轉(zhuǎn)成似謂詞演算形式:
[0754] Read is Look at words and sound
[0755] =(read,is,(XI,Look at,words)A(XI,sound)V(XI,learn))
[0756] = (read, is ,ffl Aff2 VW3)
[0757] =(read,is,ffl)A(read,is,W2)V(read,is,W3)
[0758] ffl = (Xl,Look at,words)
[0759] W2 = (XI, sound)
[0760] W3 = (XI, learn)
[0761 ] 3.進(jìn)而機(jī)器自動(dòng)直接轉(zhuǎn)換為似謂詞演算形式并編程:
[0762] 似謂詞演算形式均是
[0763] (N1,D0,N2),
[0764] 或(N1,IS,N2),
[0765] 或(N,IS,WHERE),
[0766] 或(N,IS,STATE),
[0767]最后分解后的似謂詞演算形式均是最簡(jiǎn)式,即最多只有三個(gè)單詞,且第二個(gè)詞是 謂詞。一個(gè)語(yǔ)句可能分解為數(shù)個(gè)"與"關(guān)系的最簡(jiǎn)式,并由它們構(gòu)成完整句義。
[0768] 按最簡(jiǎn)式一組三詞的次序轉(zhuǎn)換為謂詞形式并編程,完成一組后,再進(jìn)行另一組的 相同操作,如此到完畢。
[0769] significance(read):-ffl,W2
[0770] significance(read):-ff3
[0771 ] ffl:-Look_at(X,words),person(X)
[0772] W2:-sound(X),person(X)
[0773] W3:-learn(X),person(X)
[0774] person(X)
[0775] 如此就是"讀一一read"在我們自建的詞庫(kù)中的形態(tài),所有的最簡(jiǎn)式都有自己的編 號(hào)Wj,以避免在定義其他詞時(shí)出現(xiàn)重復(fù)。其他詞均如此建立。
[0776] 以上對(duì)本發(fā)明實(shí)施例所提供的自然語(yǔ)言機(jī)器識(shí)別方法及系統(tǒng)進(jìn)行了詳細(xì)介紹,本 文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于 幫助理解本發(fā)明的方法及其核心思想;對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在 【具體實(shí)施方式】及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書內(nèi)容不應(yīng)理解為對(duì)本發(fā) 明的限制。
【主權(quán)項(xiàng)】
1. 一種自然語(yǔ)言機(jī)器識(shí)別方法,其特征在于包括下述步驟:(1)建立似謂詞演算形式詞 義對(duì)應(yīng)的數(shù)據(jù)庫(kù);(2)輸入自然語(yǔ)言信息;(3)對(duì)所述的自然語(yǔ)言信息的語(yǔ)句進(jìn)行逐句切分 處理,并根據(jù)切分規(guī)則轉(zhuǎn)換為一個(gè)或一個(gè)以上的似謂詞演算形式句;(4)將所述的多個(gè)似謂 詞演算形式句轉(zhuǎn)換為機(jī)器識(shí)別的電信號(hào),然后輸入至中央處理單元進(jìn)行搜索或識(shí)別或遞歸 或替代中的至少一種方式進(jìn)行邏輯推理或隱喻或聯(lián)想創(chuàng)造性思維的功能處理,并生成新的 數(shù)字代碼組合;(5)將所述的數(shù)字代碼組合回溯轉(zhuǎn)換為與輸入的自然語(yǔ)言信息相應(yīng)的新的 自然語(yǔ)句作為輸出,或者作為學(xué)習(xí)結(jié)果進(jìn)行存儲(chǔ)。2. 根據(jù)權(quán)利要求1所述的一種自然語(yǔ)言機(jī)器識(shí)別方法,其特征在于所述的似謂詞演算 形式的定義為:自然語(yǔ)言句式均是由四種最簡(jiǎn)思維模式之一或組合構(gòu)成的句式,每一種最 簡(jiǎn)思維模式句均為包括謂詞的最簡(jiǎn)句式,和現(xiàn)有的謂詞演算的表達(dá)方式相似,將上述四種 最簡(jiǎn)思維模式定義為似謂詞演算形式。3. 根據(jù)權(quán)利要求1所述的自然語(yǔ)言機(jī)器識(shí)別方法,其特征在于所述的數(shù)據(jù)庫(kù)至少包括 用自然數(shù)編碼的新代碼字詞庫(kù),所述新代碼編碼數(shù)據(jù)庫(kù)通過(guò)手工輸入或利用現(xiàn)有的開(kāi)放代 碼源的字詞庫(kù)輸入字詞的方式來(lái)建立。4. 根據(jù)權(quán)利要求2所述的一種自然語(yǔ)言機(jī)器識(shí)別方法,其特征在于所述的切分規(guī)則為: 將輸入的自然語(yǔ)言信息的句子切分為一個(gè)或一個(gè)以上的似謂詞演算形式句,把句子每一層 的意義完整地保留下來(lái),每一個(gè)所述的似謂詞演算形式句是由最多三項(xiàng)一組的字詞組成的 最簡(jiǎn)句式;所述的自然語(yǔ)言信息對(duì)應(yīng)段落的句子經(jīng)切分后,轉(zhuǎn)換為多個(gè)由三項(xiàng)一組構(gòu)成的 一組數(shù)列的集合。5. 根據(jù)權(quán)利要求4所述的一種自然語(yǔ)言機(jī)器識(shí)別方法,其特征在于所述的切分規(guī)則采 用以下的算法模型來(lái)實(shí)現(xiàn): (1) 以句號(hào)為一個(gè)語(yǔ)句的句義中止標(biāo)識(shí),以段落為句義群中止標(biāo)識(shí),以整篇為段義群中 止標(biāo)識(shí);子句以逗號(hào)為界,搜索整體句中的最簡(jiǎn)句式中間項(xiàng)的謂詞,依次與字詞庫(kù)進(jìn)行比 時(shí); (1.1) 以此謂詞為界確定第一層面的前部項(xiàng)、后部項(xiàng)的句子成份,從而確定句式前部項(xiàng) 為第一層面的最簡(jiǎn)句式第一項(xiàng),確定句式后部項(xiàng)為第一層面的最簡(jiǎn)句式第三項(xiàng); (1.2) 如果原句中間項(xiàng)的謂詞有省略,則先補(bǔ)足謂詞,然后重復(fù)步驟1.1的操作; (2) 按順序分別對(duì)所述的句式前部項(xiàng)和句式后部項(xiàng)為進(jìn)行第二層面切分,重復(fù)進(jìn)行相 同于上述步驟1的切分過(guò)程; (3) 限定詞的受限主詞作為下一層面的最簡(jiǎn)式的第一項(xiàng),第二項(xiàng)添加謂詞/謂語(yǔ),第三 項(xiàng)則為該限定詞; (4) 再在下一層面進(jìn)行上述切分過(guò)程,直至全句完成切分。6. 根據(jù)權(quán)利要求5所述的一種自然語(yǔ)言機(jī)器識(shí)別方法,其特征在于所述的句子中謂詞 的搜索算法模型為: (1) 在一句子中逐次將字與字詞庫(kù)比對(duì),對(duì)應(yīng)字詞庫(kù)輸出各詞在該句子中的屬性/詞 性,直到搜索出第一個(gè)謂詞,繼續(xù)之后的搜索;如果再未有謂詞,則搜索完成;判斷詞或動(dòng)詞 之前者為行為使動(dòng)者,之后者為表述詞或行為受動(dòng)者,這即找出了最簡(jiǎn)句式。 (2) 如果后邊搜索到第二個(gè)謂詞,繼續(xù)之后的搜索,如果再未有謂詞,則搜索完成;謂詞 之前者為行為使動(dòng)者,之后者為表述詞或行為受動(dòng)者,即找出了最簡(jiǎn)句式的復(fù)合結(jié)構(gòu)。7. 根據(jù)權(quán)利要求2所述的自然語(yǔ)言機(jī)器識(shí)別方法,其特征在于所述的自然語(yǔ)言信息轉(zhuǎn) 換為似謂詞演算形式句后的自動(dòng)推理、聯(lián)想過(guò)程為:切分后的語(yǔ)句變成了由三項(xiàng)一組的字 詞構(gòu)成的最簡(jiǎn)思維模式的集合,運(yùn)用搜索匹配識(shí)別,進(jìn)行遞歸替代計(jì)算過(guò)程而實(shí)現(xiàn)自動(dòng)推 理、聯(lián)想思維過(guò)程。8. 根據(jù)權(quán)利要求2或3所述的自然語(yǔ)言機(jī)器識(shí)別方法,其特征在于所述的由自然語(yǔ)言信 息轉(zhuǎn)換的似謂詞演算形式進(jìn)行演算的推理算法模型: (1) 按時(shí)間優(yōu)先原則,取首句第一組數(shù)列中的第三項(xiàng)減次句中第一組數(shù)列中的第一項(xiàng), 如結(jié)果為0,并且首句第一組數(shù)列中的第二項(xiàng)減次句第二組數(shù)列中的第二項(xiàng)的結(jié)果也為0, 則將次句第二組的第一項(xiàng)替代首句第一組數(shù)列的第三項(xiàng);新的首句第一組數(shù)列構(gòu)造完成; (1.1)如未有上述結(jié)果,則取首句第一組數(shù)列中的第三項(xiàng)減次2句第三組數(shù)列中的第一 項(xiàng),如結(jié)果為〇,并且首句第一組數(shù)列中的第二項(xiàng)減次2句第三組數(shù)列中的第二項(xiàng)的結(jié)果為 〇,則將次2句第三組的第一項(xiàng)替代首句第一組數(shù)列的第三項(xiàng);新的首句第一組數(shù)列構(gòu)造完 成; (2) 取第一組數(shù)列中的第三項(xiàng)減去已成功完成步驟1運(yùn)算的次組數(shù)列中的第一項(xiàng),如結(jié) 果為0,并且第一組數(shù)列中的第二項(xiàng)減去已成功完成步驟1運(yùn)算的次組數(shù)列中的第二項(xiàng)的結(jié) 果為0,則將已成功完成步驟1運(yùn)算的次組數(shù)列中的第一項(xiàng)替代第一組數(shù)列的第三項(xiàng);新的 第一組數(shù)列構(gòu)造完成; (3) 繼續(xù)上述過(guò)程直至無(wú)法完成上述過(guò)程,中止;輸出新的第一組數(shù)列,這即是推理結(jié) 果; (4) 如果所選的一組數(shù)列無(wú)法完成上述過(guò)程,則選擇次一組數(shù)列進(jìn)行上述過(guò)程; (5) 有推理結(jié)果或無(wú)推理結(jié)果,輸出結(jié)論。9. 一種自然語(yǔ)言機(jī)器識(shí)別系統(tǒng),其特征在于包括人機(jī)接口模塊、句子切分模塊、中央處 理單元、句式合成模塊及數(shù)據(jù)庫(kù)模塊,所述的句子切分模塊和句式合成模塊分別與所述中 央處理單元的輸入端和輸出端通過(guò)電信號(hào)相連,所述的數(shù)據(jù)庫(kù)模塊至少包括字詞庫(kù)管理模 塊。10. 根據(jù)權(quán)利要求9所述的一種自然語(yǔ)言機(jī)器識(shí)別系統(tǒng),其特征在于所述的數(shù)據(jù)庫(kù)模塊 為多庫(kù)協(xié)同模塊,還包括知識(shí)庫(kù)管理模塊、情景庫(kù)管理模塊、多元語(yǔ)義網(wǎng)絡(luò)庫(kù)管理模塊及隱 喻網(wǎng)絡(luò)庫(kù)管理系統(tǒng)。
【文檔編號(hào)】G06F17/27GK106055537SQ201610349629
【公開(kāi)日】2016年10月26日
【申請(qǐng)日】2016年5月23日
【發(fā)明人】王立山
【申請(qǐng)人】王立山