亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種基于模板的自動生成作文的系統(tǒng)及實(shí)現(xiàn)方法與流程

文檔序號:12034569閱讀:769來源:國知局
一種基于模板的自動生成作文的系統(tǒng)及實(shí)現(xiàn)方法與流程

本發(fā)明涉及自然語言處理領(lǐng)域,特別涉及一種基于模板的自動生成作文的系統(tǒng)及實(shí)現(xiàn)方法。



背景技術(shù):

早在2009年,英國考試機(jī)構(gòu)愛德思就宣布使用電腦批閱英語寫作試卷。英國《泰晤士報(bào)教育增刊》當(dāng)時的報(bào)道說,經(jīng)過特殊編程的電腦將“掃描”試卷,評估學(xué)生的語法與詞匯,辨定可能正確的答案,并給出總分。

在2014年,英國《衛(wèi)報(bào)》進(jìn)行了一項(xiàng)紙媒測試計(jì)劃?!皺C(jī)器人”被安排將社交網(wǎng)絡(luò)上的分享熱點(diǎn)和關(guān)注熱度進(jìn)行統(tǒng)計(jì)分析,隨即進(jìn)行內(nèi)容篩選、編輯排版和印刷,最后生成一份報(bào)紙。

在2015年,日本公立函館未來大學(xué)研發(fā)團(tuán)隊(duì)利用人工智能創(chuàng)作的這篇作文,是由人類事先設(shè)定好登場人物、內(nèi)容大綱等“零部件”后,人工智能再根據(jù)這些“零部件”自動生成的。

近日,以色列創(chuàng)業(yè)公司articoolo開發(fā)了一種算法,可根據(jù)用戶選擇的任何主題去生成作文,只要這樣的主題能用2到5個單詞去描述。用戶需要準(zhǔn)確總結(jié)自己的主題,告訴計(jì)算機(jī)用戶希望作文有多少單詞,并選擇偏好,隨后點(diǎn)擊生成按鈕,即可等待人工智能完成作文的創(chuàng)作。

可見,目前自動生成作文的方法有的基于人工智能領(lǐng)域中機(jī)器自主學(xué)習(xí)的過程,有的基于分類算法和機(jī)器自主學(xué)習(xí)的方式?,F(xiàn)有技術(shù)中也有一些解決方案,比如,中國專利申請cn201611003822.0,基于描述文本自動生成作文的方法及系統(tǒng),方法包括:接收待生成作文的描述文本;確定所述描述文本的主題,并將該主題作為待生成作文的主題;根據(jù)與所述主題對應(yīng)的文本語料構(gòu)建主題詞圖;根據(jù)構(gòu)建的主題詞圖生成對應(yīng)所述主題的作文。本發(fā)明可以提高生成作文的效率及準(zhǔn)確性。缺點(diǎn)在于:為了保證生成結(jié)果的一致性,文本預(yù)料和主題的對應(yīng)關(guān)系方式單一。又比如,中國專利申請cn201610803388.8,一種應(yīng)用文自動生成方法,步驟1)建立語料庫;步驟2)選擇多個適用實(shí)體并輸入其對應(yīng)的具體內(nèi)容;步驟3)建立模板庫并從中選擇一個模板;步驟4)對所選擇的模板進(jìn)行潤色。雖然建立足夠大的預(yù)料庫,但是缺點(diǎn)在于:無法保證作文能夠符合多領(lǐng)域的不同要求。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明要解決的技術(shù)問題是,提供能夠針對特殊模塊和關(guān)鍵詞進(jìn)行準(zhǔn)確定位的一種基于模板的自動生成作文的系統(tǒng)。

解決上述技術(shù)問題,本發(fā)明提供了一種基于模板的自動生成作文的系統(tǒng),包括:模板單元、規(guī)則單元、選取單元、話題單元,

所述模板單元,用以提供作文模板接口,

所述規(guī)則單元,用以提供生成規(guī)則接口,

所述選取單元,用以選定擬生成作文中的中心話題和關(guān)鍵詞,

所述話題單元,用以根據(jù)中心話題話題提供可調(diào)用話題參數(shù),

基于上述作文模板和生成規(guī)則,并根據(jù)所述中心話題和關(guān)鍵詞,生成作文。

更進(jìn)一步,系統(tǒng)還包括:一客戶端,所述客戶端包括:輸入條件頁面和作文生成結(jié)果頁面,

用戶通過在所述輸入條件頁面輸入擬生成作文的{參數(shù),條件};

所述作文生成結(jié)果頁面接收上述{參數(shù),條件},并向后臺服務(wù)器發(fā)出作文內(nèi)容請求,

所述服務(wù)器向所述作文生成結(jié)果頁面返回作文模板內(nèi)容,并通過所述作文生成結(jié)果頁面轉(zhuǎn)化后向用戶顯示作文內(nèi)容。

更進(jìn)一步,所述模板單元包括:第一模板、第二模板、第三模板以及第四模板,

所述第一模板,用以建立一網(wǎng)絡(luò)爬蟲程序獲取網(wǎng)頁中模板內(nèi)容相關(guān)的內(nèi)容,

所述第二模板,用以建立中文作文模板,

所述第三模板,用以建立英文作文模板,

所述第四模板,用以建立可互譯的作文語料庫。

更進(jìn)一步,所述規(guī)則單元包括:

時態(tài)單元,用以建立符合中文/英文的時態(tài)使用規(guī)則

語態(tài)單元,用以建立符合中文/英文的語態(tài)使用規(guī)則,

詞法單元,用以建立符合中文/英文的詞法處理規(guī)則。

更進(jìn)一步,所述選取單元包括:查詢接口、關(guān)聯(lián)接口以及匹配接口,

所述查詢接口,用以提供所述關(guān)鍵詞/中心話題的查詢接口,

所述關(guān)聯(lián)接口,用以根據(jù)所述關(guān)鍵詞和/或中心話題進(jìn)行關(guān)聯(lián),

所述匹配接口,用以根據(jù)查詢和關(guān)聯(lián)結(jié)構(gòu)進(jìn)行匹配。

更進(jìn)一步,所述關(guān)鍵詞包括:中文關(guān)鍵詞、英文關(guān)鍵詞以及修正關(guān)鍵詞,

所述中文關(guān)鍵詞或英文關(guān)鍵詞,用以作為作文中的標(biāo)簽數(shù)據(jù),

所述修正關(guān)鍵詞,用以對上述中文關(guān)鍵詞或英文關(guān)鍵詞的語義進(jìn)行修正。

更進(jìn)一步,所述中心話題包括:{必要話題、熱點(diǎn)話題、學(xué)術(shù)話題}的標(biāo)簽。

更進(jìn)一步,用戶通過終端上的web瀏覽器向后臺服務(wù)器發(fā)出訪問請求,所述后臺服務(wù)器上的web服務(wù)器查找對應(yīng)頁面并轉(zhuǎn)交給所述后臺服務(wù)器的應(yīng)用程序服務(wù)器,所述應(yīng)用程序服務(wù)器定位并完成在所述頁面的指令,并將完成的頁面回傳至web服務(wù)器,通過所述web服務(wù)器完成頁面訪問請求的響應(yīng),

所述訪問請求至少包括:擬生成作文。

基于上述,本發(fā)明還提供了一種自動生成作文的方法,包括如下步驟:

s1初始化提供作文模板、生成規(guī)則,

s2選定擬生成作文中的中心話題和關(guān)鍵詞,

s3根據(jù)中心話題話題提供可調(diào)用話題參數(shù),

s4基于上述作文模板和生成規(guī)則,并根據(jù)所述中心話題和關(guān)鍵詞,生成作文。

更進(jìn)一步,所述s1還包括:初始化作文模板為:說明文、描寫文、記敘文、議論文或者應(yīng)用文中的一種或者多種。

本發(fā)明的有益效果:

在本發(fā)明中,由于在所述模板單元提供作文模板接口,能夠基于語言專家?guī)臁⒖荚嚸麕煄煲约熬W(wǎng)絡(luò)更新模板庫,能夠最大化的滿足用戶的作文寫作類型。由于在所述規(guī)則單元提供生成規(guī)則接口,基于包括但不限于語法、語義以及詞義的規(guī)則,能夠使得生成的作文符合思考和敘述邏輯,從而更加低貼近人的表達(dá)。由于在所述選取單元選定擬生成作文中的中心話題和關(guān)鍵詞,在具有模板和規(guī)則的前提下,通過鍵入用戶想要表達(dá)或者傳遞的中心話題,能夠提供用戶不同維度的選擇形式,同時配合關(guān)鍵詞,形成類似作文摘要的主旨文件用以后續(xù)的擴(kuò)充。由于在所述話題單元,根據(jù)中心話題話題提供可調(diào)用話題參數(shù),話題參數(shù)決定了作文的走向以及與用戶想要表達(dá)的中心話題之間的置信度。通過本發(fā)明中的系統(tǒng),基于模板和關(guān)鍵詞,能夠準(zhǔn)確地生成符合用戶期望的作文,同時作文符合寫作規(guī)則,緊扣用戶的中心話題。

附圖說明

圖1是本發(fā)明一實(shí)施例中的系統(tǒng)結(jié)構(gòu)示意圖;

圖2是本發(fā)明一實(shí)施例中的交互方式流程示意圖;

圖3是圖1中的模板單元結(jié)構(gòu)示意圖;

圖4是圖1中的規(guī)則單元結(jié)構(gòu)示意圖;

圖5是圖1中的選取單元結(jié)構(gòu)示意圖;

圖6是本發(fā)明一實(shí)施例中的方法流程示意圖。

具體實(shí)施方式

現(xiàn)在將參考一些示例實(shí)施例描述本公開的原理??梢岳斫猓@些實(shí)施例僅出于說明并且?guī)椭绢I(lǐng)域的技術(shù)人員理解和實(shí)施例本公開的目的而描述,而非建議對本公開的范圍的任何限制。在此描述的本公開的內(nèi)容可以以下文描述的方式之外的各種方式實(shí)施。

如本文中所述,術(shù)語“包括”及其各種變體可以被理解為開放式術(shù)語,其意味著“包括但不限于”。術(shù)語“基于”可以被理解為“至少部分地基于”。術(shù)語“一個實(shí)施例”可以被理解為“至少一個實(shí)施例”。術(shù)語“另一實(shí)施例”可以被理解為“至少一個其它實(shí)施例”。

請參考圖1是本發(fā)明一實(shí)施例中的系統(tǒng)結(jié)構(gòu)示意圖,本實(shí)施例中的一種基于模板的自動生成作文的系統(tǒng),包括:模板單元1、規(guī)則單元3、選取單元2、話題單元4,所述模板單元1,用以提供作文模板接口,所述規(guī)則單元2,用以提供生成規(guī)則接口,所述選取單元2,用以選定擬生成作文中的中心話題和關(guān)鍵詞,所述話題單元4,用以根據(jù)中心話題話題提供可調(diào)用話題參數(shù),基于上述作文模板和生成規(guī)則,并根據(jù)所述中心話題和關(guān)鍵詞,生成作文。所述模板單元1,獲取模板的方式包括但不限于,基于現(xiàn)有的作文模板、基于專家的作文模塊、基于考試機(jī)經(jīng)、基于互聯(lián)網(wǎng)中模板等。所述規(guī)則單元3,包括但不限于,中文語法、中文詞法以及中文語義,英文語法、英文詞法以及英文語義等。所述選取單元2可以是基于用戶的需求采集,在所述選取單元2中接收用戶提交的中心話題,所述中心話題包括但不限于,必要話題、熱點(diǎn)話題、學(xué)術(shù)話題等等,比如必要話題根據(jù)可按照不同類型考試科目確定,又比如熱點(diǎn)話題可根據(jù)設(shè)定范圍(比如,高考、考研)內(nèi)受關(guān)注度較高的話題,再比如學(xué)術(shù)話題根據(jù)按照不同的領(lǐng)域劃分(比如基于大不列顛百科全書定義的學(xué)術(shù)問題)。

采用本實(shí)施例中的系統(tǒng),能夠最大化的滿足用戶的作文寫作類型。而基于規(guī)則使得生成的作文符合思考和敘述邏輯,從而更加低貼近人的表達(dá)。在用戶進(jìn)行選擇時能夠提供用戶不同維度的選擇形式,同時配合關(guān)鍵詞,形成類似作文摘要的主旨文件用以后續(xù)的擴(kuò)充。作為本實(shí)施例中的優(yōu)選,請參考圖2是本發(fā)明一實(shí)施例中的交互方式流程示意圖,系統(tǒng)中基于一客戶端,所述客戶端包括:輸入條件頁面和作文生成結(jié)果頁面,用戶通過在所述輸入條件頁面輸入擬生成作文的{參數(shù),條件};所述作文生成結(jié)果頁面接收上述{參數(shù),條件},并向后臺服務(wù)器發(fā)出作文內(nèi)容請求,所述服務(wù)器向所述作文生成結(jié)果頁面返回作文模板內(nèi)容,并通過所述作文生成結(jié)果頁面轉(zhuǎn)化后向用戶顯示作文內(nèi)容。

在一些實(shí)施例中,上述客戶端包括但不限于,手機(jī)、平板電腦、臺式機(jī)。

在一些實(shí)施例中,上述客戶端包括但不限于,pc端、安卓端、iphone端、wp端、ipad端、mac端等六大客戶端。

在一些實(shí)施例中,上述{參數(shù),條件}包括但不限于,{中心話題,關(guān)鍵詞}。

在一些實(shí)施例中,上述{參數(shù),條件}包括但不限于,{字?jǐn)?shù)/格式,中文/英文}。

在一些實(shí)施例中,上述{參數(shù),條件}包括但不限于,{論文,學(xué)術(shù)}。

在一些實(shí)施例中,上述{參數(shù),條件}包括但不限于,{工作函,日常}。

在一些實(shí)施例中,上述{參數(shù),條件}包括但不限于,{作文,托福}。

在一些實(shí)施例中,上述{參數(shù),條件}包括但不限于,{作文,雅思}。

作為本實(shí)施例中的優(yōu)選,請參考圖3是圖1中的模板單元結(jié)構(gòu)示意圖,所述模板單元1包括:第一模板11、第二模板12、第三模板13以及第四模板14,所述第一模板11,用以建立一網(wǎng)絡(luò)爬蟲程序獲取網(wǎng)頁中模板內(nèi)容相關(guān)的內(nèi)容,所述第二模板12,用以建立中文作文模板,所述第三模板13,用以建立英文作文模板,所述第四模板14,用以建立可互譯的作文語料庫。在所述第一模板11中采用網(wǎng)絡(luò)爬蟲程序獲取網(wǎng)頁中模板內(nèi)容相關(guān)的內(nèi)容。本領(lǐng)域技術(shù)人員能夠明了,網(wǎng)絡(luò)爬蟲(又被稱為網(wǎng)頁蜘蛛,網(wǎng)絡(luò)機(jī)器人,在foaf社區(qū)中間,更經(jīng)常的稱為網(wǎng)頁追逐者),是一種按照一定的規(guī)則,自動地抓取萬維網(wǎng)信息的程序或者腳本。第二模板12根據(jù)網(wǎng)絡(luò)爬蟲中獲取的信息建立中中文作文模板,或者第二模板12可采用語言專家模板、機(jī)經(jīng)模板、考試高分模板等。

在一些實(shí)施例中,第二模板12根據(jù)網(wǎng)絡(luò)爬蟲中獲取的信息建立中中文作文模板,包括但不限于如下處理方式:從文本內(nèi)容中抽取數(shù)值特征中的標(biāo)記(tokenizing)文本以及為每一個可能的標(biāo)記(token)分配的一個整型id,例如用白空格和標(biāo)點(diǎn)符號作為標(biāo)記的分割符(若為中文則涉及到分詞的問題)。

在一些實(shí)施方式中,第二模板12可以與機(jī)經(jīng)系統(tǒng)進(jìn)行整合或者可以包括在例如包括服務(wù)器的不同于機(jī)經(jīng)系統(tǒng)的計(jì)算設(shè)備或系統(tǒng)之中。包括但不限于百度百科、wikipedia等。

在一些實(shí)施方式中,第二模板12對使用關(guān)鍵詞生成引擎所生成的關(guān)鍵詞所概括的各種新聞集合進(jìn)行訪問、接收有關(guān)其的評論、分享、贊同等。

在一些實(shí)施例中,第二模板12根據(jù)網(wǎng)絡(luò)爬蟲中獲取的信息建立中中文作文模板,包括但不限于如下處理方式:計(jì)數(shù)(counting)標(biāo)記在每個文本中的出現(xiàn)頻率即特征。特征定義為:每個標(biāo)記出現(xiàn)的頻率(無論是否正態(tài)化)。

在一些實(shí)施例中,第二模板12根據(jù)網(wǎng)絡(luò)爬蟲中獲取的信息建立中中文作文模板,包括但不限于如下處理方式:正態(tài)化(nomalizating)降低在大多數(shù)樣本/文檔中都出現(xiàn)的標(biāo)記的權(quán)重,多元樣本定義為:給定文件中所有標(biāo)記的出現(xiàn)頻率所構(gòu)成的向量作為。

優(yōu)選地,網(wǎng)絡(luò)爬蟲采用scrapy。

在一些實(shí)施例中,第三模板13直接只用量化模板,并將定義的關(guān)鍵詞篩選出來。

在一些實(shí)施例中,所述第四模板14中優(yōu)選使用包括但不限于如下的方式:

雙語語料的對齊技術(shù)(alignment),國內(nèi)外學(xué)者就此提出多種策略和方法,已經(jīng)出現(xiàn)了許多對齊雙語或多語語料的程序或工具[gale1993];

雙語語料的各種應(yīng)用,如在基于統(tǒng)計(jì)的機(jī)器翻譯技術(shù)[brown1990]、基于實(shí)例的機(jī)器翻譯技術(shù)[nagao1984],雙語詞典編纂[klavansandtzoukermann1990]技術(shù)中,雙語語料庫都發(fā)揮著十分重要的作用;

雙語語料庫的設(shè)計(jì)、采集、編碼和管理問題。比較著名的語料庫編碼方案有tei文本編碼標(biāo)準(zhǔn)以及ces標(biāo)準(zhǔn),兩者均基于sgml標(biāo)記語言研究。

在一些實(shí)施例中,所述第四模板14中優(yōu)選基于大規(guī)模真實(shí)文本的語料庫,對語言文字的使用進(jìn)行動態(tài)追蹤的語料庫,并對語言的發(fā)展變化進(jìn)行監(jiān)測的語料庫。

在一些實(shí)施例中,所述第四模板14中的作文語料庫優(yōu)選級為:托??荚?、雅思考試、研究生入學(xué)考試。

作為本實(shí)施例中的優(yōu)選,請參考圖4是圖1中的規(guī)則單元結(jié)構(gòu)示意圖,所述規(guī)則單元3包括:時態(tài)單元31,用以建立符合中文/英文的時態(tài)使用規(guī)則語態(tài)單元33,用以建立符合中文/英文的語態(tài)使用規(guī)則,詞法單元32,用以建立符合中文/英文的詞法處理規(guī)則。

在一些實(shí)施例中,時態(tài)單元31包括但不限于,tense{一般現(xiàn)在時,一般過去時,一般將來時,一般過去將來時;現(xiàn)在進(jìn)行時,過去進(jìn)行時,將來進(jìn)行時,過去將來進(jìn)行時;現(xiàn)在完成時,過去完成時,將來完成時,過去將來完成時;現(xiàn)在完成進(jìn)行時,過去完成進(jìn)行時,將來完成進(jìn)行時,過去將來完成進(jìn)行時}。

在一些實(shí)施例中,所述時態(tài)單元31包括但不限于,{完成狀態(tài)、進(jìn)行狀態(tài)、完成進(jìn)行狀態(tài)或一般狀態(tài)}。

在一些實(shí)施例中,所述時態(tài)單元31包括但不限于,{過去,現(xiàn)在,將來}。

在一些實(shí)施例中,所述語態(tài)單元33包括但不限于,{主動語態(tài),被動語態(tài)}。

在一些實(shí)施例中,所述語態(tài)單元33包括但不限于,{一般現(xiàn)在時,be+v.\v.s,am\is\are+(p.p)一般將來時,will\begoingto,willbe+(p.p)

現(xiàn)在進(jìn)行時,am\is\are+v.ing,am\is\are+being+(p.p),一般過去時,①was\were②v.ed,was\were+(p.p)}。

在一些實(shí)施例中,所述語態(tài)單元33包括但不限于,{現(xiàn)在完成時,have\has+v.p.p,have\has+been+(p.p),過去完成時,had+v.p.p,had+been+(p.p),過去進(jìn)行時,was\were+v.ing,was\were+being+(p.p)}。

在一些實(shí)施例中,所述語態(tài)單元33包括但不限于,{情態(tài)動詞,情態(tài)動詞+v.,情態(tài)動詞+be+(p.p)}。

在一些實(shí)施例中,詞法單元32中按照構(gòu)詞規(guī)則分解成一系列單詞符號。單詞是語言中具有獨(dú)立意義的最小單位,包括關(guān)鍵字、標(biāo)識符、運(yùn)算符、界符和常量等。其中,關(guān)鍵字是由英文語言定義的具有固定意義的標(biāo)識符。例如,begin,end,if,while都是保留字,而將人名、建筑物、地名等去除。這些字通常不用作一般標(biāo)識符。標(biāo)識符,用來表示各種名字,如變量名,數(shù)組名,過程名等等。常數(shù),常數(shù)的類型一般有整型、實(shí)型、布爾型、文字型等。運(yùn)算符如+、-、*、/等等。界符,如逗號、分號、括號、等等。

作為本實(shí)施例中的優(yōu)選,請參考圖5是圖1中的選取單元結(jié)構(gòu)示意圖,所述選取單元3包括:查詢接口31、關(guān)聯(lián)接口32以及匹配接口33,所述查詢接口31,用以提供所述關(guān)鍵詞/中心話題的查詢接口,所述關(guān)聯(lián)接口32,用以根據(jù)所述關(guān)鍵詞和/或中心話題進(jìn)行關(guān)聯(lián),所述匹配接口33,用以根據(jù)查詢和關(guān)聯(lián)結(jié)構(gòu)進(jìn)行匹配。查詢接口的規(guī)則為,單詞、詞語或者可連接的語句。關(guān)聯(lián)接口的規(guī)則為,連詞關(guān)聯(lián)、熱度詞關(guān)聯(lián)以及用戶輸入的主動關(guān)聯(lián)。關(guān)聯(lián)方式包括但不限于,and,or,not等。

作為本實(shí)施例中的優(yōu)選,請參考圖6是本發(fā)明一實(shí)施例中的方法流程示意圖,本實(shí)施例中的一種自動生成作文的方法,包括如下步驟:

步驟s1初始化提供作文模板、生成規(guī)則,

步驟s2選定擬生成作文中的中心話題和關(guān)鍵詞,

步驟s3根據(jù)中心話題話題提供可調(diào)用話題參數(shù),

步驟s4基于上述作文模板和生成規(guī)則,并根據(jù)所述中心話題和關(guān)鍵詞,生成作文。

上述步驟s3中具體包括:用戶通過終端上的web瀏覽器向后臺服務(wù)器發(fā)出訪問請求,所述后臺服務(wù)器上的web服務(wù)器查找對應(yīng)頁面并轉(zhuǎn)交給所述后臺服務(wù)器的應(yīng)用程序服務(wù)器,所述應(yīng)用程序服務(wù)器定位并完成在所述頁面的指令,并將完成的頁面回傳至web服務(wù)器,通過所述web服務(wù)器完成頁面訪問請求的響應(yīng),所述訪問請求至少包括:擬生成作文。本領(lǐng)域技術(shù)人員能夠明了,web應(yīng)用程序是一組靜態(tài)和動態(tài)web頁的集合。靜態(tài)web頁是指當(dāng)web服務(wù)器接到用戶請求時內(nèi)容不會發(fā)生更改的頁,web服務(wù)器直接將該頁發(fā)送到請求web瀏覽器,而不對其做任何處理。相反,在將動態(tài)web頁發(fā)送到請求瀏覽器之前,服務(wù)器將對該頁處理,執(zhí)行嵌在網(wǎng)頁里的在服務(wù)器端運(yùn)行的代碼,從而動態(tài)的生成一個html網(wǎng)頁,發(fā)送給客戶端瀏覽器。

上述步驟s4中具體包括:通過gensim提供的文本預(yù)處理腳本提取模板/規(guī)則語料,每篇文章一行文本存放,然后基于gensim的word2vec模塊訓(xùn)練詞向量模型。gensim是一款開源的第三方python工具包,用于從原始的非結(jié)構(gòu)化的文本中,無監(jiān)督地學(xué)習(xí)到文本隱層的主題向量表達(dá)。

上述步驟s4中進(jìn)一步包括:基于馬爾可夫模型建立一種語言模型,在這個模型中,能夠根據(jù)當(dāng)前的一個或幾個詞預(yù)測下一個詞是什么。如果只是根據(jù)上一個詞預(yù)測,則是一個一階馬爾可夫模型。如果用上兩個詞預(yù)測,則是一個二階馬爾可夫模型?;趎ltk(python中的nlp庫),利用split()函數(shù)將字符串(從文本文件中獲得的)轉(zhuǎn)換成一個數(shù)組。

上邊兩個函數(shù)是代碼的基本函數(shù)。最終要使用的nltk中的“條件頻率字典”必須以成對數(shù)組作為輸入,所以短語“hellohernameisa”需要變?yōu)閇(“hello”,“her”),(“her,“name”),(“name”,“is”),(“is”,“a”)]。函數(shù)makepairs以一個數(shù)組(以詞分割字符串得到)作為輸入,輸出符合上邊格式的數(shù)組。

上述方法實(shí)現(xiàn)時基于客戶端,所述客戶端包括:輸入條件頁面和作文生成結(jié)果頁面,

用戶通過在所述輸入條件頁面輸入擬生成作文的{參數(shù),條件};

所述作文生成結(jié)果頁面接收上述{參數(shù),條件},并向后臺服務(wù)器發(fā)出作文內(nèi)容請求,

所述服務(wù)器向所述作文生成結(jié)果頁面返回作文模板內(nèi)容,并通過所述作文生成結(jié)果頁面轉(zhuǎn)化后向用戶顯示作文內(nèi)容。

上述步驟s1中作文模板包括但不限于,用以建立一網(wǎng)絡(luò)爬蟲程序獲取網(wǎng)頁中模板內(nèi)容相關(guān)的內(nèi)容的第一模板,用以建立中文作文模板的第二模板,用以建立英文作文模板額第三模板,用以建立可互譯的作文語料庫的第四模板。

上述步驟s1中所述規(guī)則單元包括:

建立符合中文/英文的時態(tài)使用規(guī)則

建立符合中文/英文的語態(tài)使用規(guī)則,

建立符合中文/英文的詞法處理規(guī)則。

上述步驟s3中選取方式包括但不限于,用以提供所述關(guān)鍵詞/中心話題的查詢接口,用以根據(jù)所述關(guān)鍵詞和/或中心話題進(jìn)行關(guān)聯(lián),以及用以根據(jù)查詢和關(guān)聯(lián)結(jié)構(gòu)進(jìn)行匹配。

上述步驟s2中所述關(guān)鍵詞包括:用以作為作文中的標(biāo)簽數(shù)據(jù)中文關(guān)鍵詞或英文關(guān)鍵詞和用以對上述中文關(guān)鍵詞或英文關(guān)鍵詞的語義進(jìn)行修正的修正關(guān)鍵詞。

應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來實(shí)現(xiàn)。在上述實(shí)施方式中,多個步驟或方法可以用存儲在存儲器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來實(shí)現(xiàn)。例如,如果用硬件來實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來實(shí)現(xiàn):具有用于對數(shù)據(jù)信號實(shí)現(xiàn)邏輯功能的邏輯門電路的離散邏輯電路,具有合適的組合邏輯門電路的專用集成電路,可編程門陣列(pga),現(xiàn)場可編程門陣列(fpga)等。

在本說明書的描述中,參考術(shù)語“一個實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個實(shí)施例或示例中。在本說明書中,對上述術(shù)語的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個或多個實(shí)施例或示例中以合適的方式結(jié)合。

總體而言,本公開的各種實(shí)施例可以以硬件或?qū)S秒娐?、軟件、邏輯或其任意組合實(shí)施。一些方面可以以硬件實(shí)施,而其它一些方面可以以固件或軟件實(shí)施,該固件或軟件可以由控制器、微處理器或其它計(jì)算設(shè)備執(zhí)行。雖然本公開的各種方面被示出和描述為框圖、流程圖或使用其它一些繪圖表示,但是可以理解本文描述的框、設(shè)備、系統(tǒng)、技術(shù)或方法可以以非限制性的方式以硬件、軟件、固件、專用電路或邏輯、通用硬件或控制器或其它計(jì)算設(shè)備或其一些組合實(shí)施。

此外,雖然操作以特定順序描述,但是這不應(yīng)被理解為要求這類操作以所示的順序執(zhí)行或是以順序序列執(zhí)行,或是要求所有所示的操作被執(zhí)行以實(shí)現(xiàn)期望結(jié)果。在一些情形下,多任務(wù)或并行處理可以是有利的。類似地,雖然若干具體實(shí)現(xiàn)方式的細(xì)節(jié)在上面的討論中被包含,但是這些不應(yīng)被解釋為對本公開的范圍的任何限制,而是特征的描述僅是針對具體實(shí)施例。在分離的一些實(shí)施例中描述的某些特征也可以在單個實(shí)施例中組合地執(zhí)行。相反對,在單個實(shí)施例中描述的各種特征也可以在多個實(shí)施例中分離地實(shí)施或是以任何合適的子組合的方式實(shí)施。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1