our-point probe, transparent electrode's sheet resistance was tested',。用戶輸 入關(guān)鍵詞為:graphene, transparent electrode, conduction。對該句子提取主要成份,語 法主要成份為:主語 transparent electrode's sheetresistance,謂語 was tested,狀語 為 through four-point probe ;詞性主要成份為:名詞 sheet resistance,transparent electrode,four-point probe,動詞tested。由于用戶具備一定的英語水平,并且對所從 事領(lǐng)域的專業(yè)詞匯比較熟悉,因此該句子沒有明顯的語法錯誤,但是并不符合英語常用的 表達(dá)邏輯。將用戶輸入句子的主要成份在文獻(xiàn)數(shù)據(jù)庫中進(jìn)行匹配,比較所有文獻(xiàn)句子的 主要成份。例如上文中提到ACSnano期刊中文獻(xiàn)的句子"The sheet resistance of the hybrid transparent electrode was measured by an Alessi four-point probe. ',語 法主要成份為:主語 the sheet resistance of the hybrid transparent electrode, 謂語was measured,狀語by an Alessi four-point probe ;詞性主要成份為:名詞 sheet resistance,transparent electrode, four-point probe,動詞 measured,形容 詞hybrid。兩個句子進(jìn)行比較,語法主要成份中用戶輸入句子中主語中的詞transparent electrode和文獻(xiàn)句子主語中的詞transparent electrode完全匹配,同理主語中的詞 sheet resistance、狀語中的詞four-point probe完全匹配,相似度設(shè)置為Umeasured和 tested都有測試的意思,屬于近義詞,可在詞性擴(kuò)展中匹配,相似度設(shè)置為0. 5。綜上所述 句子語法結(jié)構(gòu)的相似度Qsl為0. 3+0. 3+0. 2+0. 3X0. 5=0. 95。詞性主要成份中用戶輸入句子 中名詞 sheet resistance,transparent electrode, four-point probe 和文南犬句子主語 中的詞 sheet resistance,transparent electrode,four-point probe 完全匹配,相似度 設(shè)置為1,動詞measured和tested屬于近義詞,相似度設(shè)置為0. 5。綜上所述句子詞性主 要成份的相似度Qs2為〇. 3+0. 3+0. 3+0. 3X0. 5=1. 05。因此上述兩個句子的主要成份相似度 為Q= Qsl+Qs2=2。對文獻(xiàn)例句與用戶輸入語句的關(guān)鍵詞相似度計(jì)算,graphene, transparent electrode兩個詞完全相同,貝lj :Qg=0. 67。
[0048] 計(jì)算將用戶輸入句子和文獻(xiàn)例句的最終相似度,設(shè)定句子主要成份的權(quán)值為0. 6, 關(guān)鍵詞權(quán)值和作者英語熟練度權(quán)值分別設(shè)為〇. 2。則Q=2X0. 6+0. 67X0. 2+1X0. 2=1. 534。 按此方法計(jì)算文獻(xiàn)庫中所有句子與用戶輸入句子的最終相似度,并反饋給用戶最高的一個 或幾個例句。
[0049] 實(shí)施例二 以美國光學(xué)學(xué)會0SA收錄的Optical Engineering期刊作為數(shù)據(jù)庫,該數(shù)據(jù)庫收錄了 Optical Engineering期刊發(fā)表的部分電子版論文。將該數(shù)據(jù)庫中所有論文中的第一作者 所在國家和關(guān)鍵詞提取出來。例如文獻(xiàn)"Two-color infrared counter-countermeasure based on the signal ratio between two detection bands for a crossed-array tracker"的作者來自韓國的Pukyong National University,關(guān)鍵詞為:infrared seeker; two-color counter-countermeasure; crossed-array tracker〇 該文南犬作者的英語熟練 度權(quán)值設(shè)為Qc=〇· 5〇 以及文南犬"Countermeasure effectiveness against a man-portable air-defense system containing a two-color spinscan infrared seeker',的作者來 自美國的 Cranfield University,關(guān)鍵詞為:man-portable air-defense; simulation; infrared; electro-optics; countermeasures。該文獻(xiàn)的作者英語熟練度權(quán)值設(shè)為Qc=l。
[0050] 將該數(shù)據(jù)庫中所有文獻(xiàn)的摘要和正文文本提取出來,按照句子為單位進(jìn)行劃分并 提取句子主要成份。句子的主要成份指的是提取句子的主語、謂語、賓語、定語和狀語作為 句子的語法主要成份。并且提取句子的名詞、動詞、形容詞、副詞作為句子的詞性主要成份。 給句子的主要成份設(shè)定不同的權(quán)值,其中名詞設(shè)為〇. 4,動詞設(shè)為0. 4,形容詞、副詞分別設(shè) 為0. 1、0. 1。句子的主語、謂語、賓語設(shè)定權(quán)值分別為0. 4、0. 4、0. 4,定語和狀語設(shè)定權(quán)值 分別為〇. 1、〇. 1。
[0051] 用戶需要根據(jù)自己的英語知識寫出一個英語句子,例如用戶想要表達(dá)的意思是 "雙色抗干擾能夠利用物體在兩個波段內(nèi)的輻射差異來區(qū)分目標(biāo)和干擾。"用戶寫出的句子 為:"Two-color IRCCM can efficiently distinguish target from flare by using the difference of two waveband. "關(guān)鍵詞為 infrared,countermeasure,tw〇-color〇 對該句 子提取主要成份,語法主要成份為:主語IRCCM,謂語can efficiently distinguish,賓語 target,定語 two-color,狀語 from flare by using the difference of two waveband。 詞性主要成份為:名詞 Two-color,IRCCM,target,flare,difference,waveband,動詞 can distinguish,using,副詞efficiently^將用戶輸入句子的主要成份在文獻(xiàn)數(shù)據(jù)庫中 進(jìn)行匹配,比較所有文獻(xiàn)句子的主要成份例如上文中提到Optical Engineering期刊中 文獻(xiàn) "Countermeasure effectiveness against a man-portable air-defense system containing a two-color spinscan infrared seeker" 的句子"Termed two-color, the seeker can compare the emissions from the target and a countermeasure in different wavebands and reject the countermeasure"。語法主要成份為:主語 seeker, 謂語 can compare,reject,賓語 emission,countermeasure,狀語 from the target and a countermeasure in different wavebands,termed tw〇-color〇 詞性主要成份為:名 詞 two-color,seeker,emission,target,countermeasure,waveband,countermeasure, 動詞can compare,reject,形容詞different。兩個句子進(jìn)行比較,語法主要成份中主語 相似度為〇,謂語中distiguish和compare屬于近義詞,相似度為0. 5,賓語相似度為0,定 語相似度為0,狀語中flare和countermeasure在專業(yè)術(shù)語中屬于近義詞,相似度為0. 5, difference和different的詞性不同,詞義相近,相似度為0. 5,waveband的相似度為1。因 此兩個句子的語法主要成份相似度為0. 4X0. 5+(0. 5+0. 5+1)Χ0. 1=0. 4。詞性主要成份中 名詞 two-color,target,waveband 相似度為 1,countermeasure 和 flare,countermeasure 和IRCCM相似度為0. 5。動詞compare和distinguish為近義詞,相似度為0. 5,形容詞和 副詞的相似度為0。因此兩個句子的詞性相似度為(1+1+1) X〇. 4+(0. 5+0. 5) X0. 4+0. 5X 0.4=1. 8。兩個句子的主要成份相似度為Q=l. 8+0. 4=2. 2。在文獻(xiàn)"Two-color infrared counter-countermeasure based on the signal ratio between two detection bands for a crossed-array tracker',中匹配到句子"Most IRCCMs use two separate detection bands to distinguish the target from the IRCM"。語法主要成份為:主語 IRCCMs,謂語 use,賓語 detection bands,定語 Most,two separate,狀語 to distinguish the target from the IRCM。詞性主要成份為:名詞 IRCCMs,detection b