亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

用于生成文章的方法和裝置與流程

文檔序號(hào):11691027閱讀:242來(lái)源:國(guó)知局
用于生成文章的方法和裝置與流程

本申請(qǐng)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及用于生成文章的方法和裝置。



背景技術(shù):

目前,通過(guò)機(jī)器實(shí)現(xiàn)自動(dòng)化寫(xiě)作,從而生成文章的方式,基本停留在特殊領(lǐng)域的特殊題材,多是采用將素材填入規(guī)則或模板的技術(shù)來(lái)生成文章。例如,可以篩選原始文章后直接引用;或者,對(duì)原始文章進(jìn)行簡(jiǎn)單的變換直接發(fā)布;或者,將原始文章以一定的順序進(jìn)行組合和摘要提??;又或者,通過(guò)模板對(duì)數(shù)據(jù)進(jìn)行組織并展現(xiàn)。

然而,目前的生成文章的方式,由于題材和方法的限制,產(chǎn)出的文章形式和內(nèi)容比較單調(diào),并且行文可能出現(xiàn)前后邏輯不合理、文法風(fēng)格不一致等情況,機(jī)器寫(xiě)作的痕跡較重。



技術(shù)實(shí)現(xiàn)要素:

本申請(qǐng)的目的在于提出一種改進(jìn)的用于生成文章的方法和裝置,來(lái)解決以上背景技術(shù)部分提到的技術(shù)問(wèn)題。

第一方面,本申請(qǐng)實(shí)施例提供了一種用于生成文章的方法,方法包括:基于輸入的文章主題和以下任意一項(xiàng)生成文章提綱:提綱模型,根據(jù)對(duì)應(yīng)文章主題的用戶(hù)行為數(shù)據(jù)建立的提綱數(shù)據(jù)庫(kù),以及人工設(shè)定的提綱;從預(yù)先建立的素材庫(kù)中,提取與文章提綱的特征相關(guān)聯(lián)的素材;向文章提綱中,插入提取的素材,得到生成的文章。

在一些實(shí)施例中,根據(jù)對(duì)應(yīng)文章主題的用戶(hù)行為數(shù)據(jù)建立的提綱數(shù)據(jù)庫(kù)包括:檢索全網(wǎng)圍繞文章主題的子主題,建立子主題數(shù)據(jù)庫(kù);根據(jù)用戶(hù)對(duì)子主題數(shù)據(jù)庫(kù)中的子主題的點(diǎn)擊順序和/或子主題數(shù)據(jù)庫(kù)中的子主題的語(yǔ)義遞進(jìn)順序,排序子主題數(shù)據(jù)庫(kù)中的子主題;剔除子主題數(shù)據(jù)庫(kù)中不符合預(yù)定邏輯規(guī)則的子主題,得到符合預(yù)定邏輯規(guī)則的子主題;將各符合預(yù)定邏輯規(guī)則的子主題作為提綱,得到提綱數(shù)據(jù)庫(kù)。

在一些實(shí)施例中,預(yù)先建立的素材庫(kù)通過(guò)以下步驟建立:獲取素材的特征,素材為將現(xiàn)有的文章的內(nèi)容根據(jù)篩選規(guī)則篩選得到和/或變換現(xiàn)有的文章的內(nèi)容得到;根據(jù)素材的特征建立索引結(jié)構(gòu),得到素材庫(kù)。

在一些實(shí)施例中,方法還包括:對(duì)生成的文章進(jìn)行優(yōu)化處理,得到優(yōu)化后的生成的文章,優(yōu)化處理包括以下一項(xiàng)或多項(xiàng):潤(rùn)色處理、插入富媒體數(shù)據(jù)處理以及排版優(yōu)化處理。

在一些實(shí)施例中,潤(rùn)色處理包括以下一項(xiàng)或多項(xiàng):統(tǒng)一生成的文章的文法風(fēng)格;刪除與前后語(yǔ)句不連貫的語(yǔ)句;以及替換與前后語(yǔ)句不連貫的語(yǔ)句。

在一些實(shí)施例中,插入富媒體數(shù)據(jù)處理包括:從預(yù)先建立的資源庫(kù),提取與生成的文章的特征相關(guān)聯(lián)的富媒體數(shù)據(jù);向生成的文章中,插入提取的富媒體數(shù)據(jù)。

在一些實(shí)施例中,從預(yù)先建立的資源庫(kù),提取與生成的文章的特征相關(guān)聯(lián)的富媒體數(shù)據(jù)包括:根據(jù)以下一項(xiàng)或多項(xiàng)從預(yù)先建立的資源庫(kù)中提取富媒體數(shù)據(jù)生成候選富媒體列表:文章主題、文章提綱、生成的文章的各段落的摘要以及生成的文章的各段落的關(guān)鍵詞;采用質(zhì)量篩選從候選富媒體列表中提取與生成的文章的特征相關(guān)聯(lián)的富媒體數(shù)據(jù)。

在一些實(shí)施例中,預(yù)先建立的資源庫(kù)通過(guò)以下步驟建立:獲取富媒體數(shù)據(jù)的特征;根據(jù)富媒體數(shù)據(jù)的特征建立索引結(jié)構(gòu),得到資源庫(kù)。

在一些實(shí)施例中,質(zhì)量篩選根據(jù)以下一項(xiàng)或多項(xiàng)進(jìn)行:圖文相關(guān)性、圖片分辨率、圖片長(zhǎng)寬比、圖片來(lái)源權(quán)威度、廣告過(guò)濾策略、反作弊過(guò)濾策略、反黃過(guò)濾策略和水印過(guò)濾策略。

在一些實(shí)施例中,方法還包括:將文章主題和文章提綱輸入標(biāo)題模型,得到生成的文章的標(biāo)題。

在一些實(shí)施例中,方法還包括:對(duì)標(biāo)題中的核心詞進(jìn)行屬性擴(kuò)展;對(duì)屬性擴(kuò)展后的標(biāo)題中的核心詞進(jìn)行替換和改寫(xiě),得到更新后的標(biāo)題。

第二方面,本申請(qǐng)實(shí)施例提供了一種用于生成文章的裝置,裝置包括:提綱生成單元,用于基于輸入的文章主題和以下任意一項(xiàng)生成文章提綱:提綱模型,根據(jù)對(duì)應(yīng)文章主題的用戶(hù)行為數(shù)據(jù)建立的提綱數(shù)據(jù)庫(kù),以及人工設(shè)定的提綱;素材提取單元,用于從預(yù)先建立的素材庫(kù)中,提取與文章提綱的特征相關(guān)聯(lián)的素材;素材插入單元,用于向文章提綱中,插入提取的素材,得到生成的文章。

在一些實(shí)施例中,提綱生成單元中的根據(jù)對(duì)應(yīng)文章主題的用戶(hù)行為數(shù)據(jù)建立的提綱數(shù)據(jù)庫(kù)包括:檢索全網(wǎng)圍繞文章主題的子主題,建立子主題數(shù)據(jù)庫(kù);根據(jù)用戶(hù)對(duì)子主題數(shù)據(jù)庫(kù)中的子主題的點(diǎn)擊順序和/或子主題數(shù)據(jù)庫(kù)中的子主題的語(yǔ)義遞進(jìn)順序,排序子主題數(shù)據(jù)庫(kù)中的子主題;剔除子主題數(shù)據(jù)庫(kù)中不符合預(yù)定邏輯規(guī)則的子主題,得到符合預(yù)定邏輯規(guī)則的子主題;將各符合預(yù)定邏輯規(guī)則的子主題作為提綱,得到提綱數(shù)據(jù)庫(kù)。

在一些實(shí)施例中,素材提取單元中的預(yù)先建立的素材庫(kù)通過(guò)以下步驟建立:獲取素材的特征,素材為將現(xiàn)有的文章的內(nèi)容根據(jù)篩選規(guī)則篩選得到和/或變換現(xiàn)有的文章的內(nèi)容得到;根據(jù)素材的特征建立索引結(jié)構(gòu),得到素材庫(kù)。

在一些實(shí)施例中,裝置還包括:文章優(yōu)化單元,用于對(duì)生成的文章進(jìn)行優(yōu)化處理,得到優(yōu)化后的生成的文章,優(yōu)化處理包括以下一項(xiàng)或多項(xiàng):潤(rùn)色處理、插入富媒體數(shù)據(jù)處理以及排版優(yōu)化處理。

在一些實(shí)施例中,文章優(yōu)化單元中的潤(rùn)色處理包括以下一項(xiàng)或多項(xiàng):統(tǒng)一生成的文章的文法風(fēng)格;刪除與前后語(yǔ)句不連貫的語(yǔ)句;以及替換與前后語(yǔ)句不連貫的語(yǔ)句。

在一些實(shí)施例中,文章優(yōu)化單元中的插入富媒體數(shù)據(jù)處理包括:從預(yù)先建立的資源庫(kù),提取與生成的文章的特征相關(guān)聯(lián)的富媒體數(shù)據(jù);向生成的文章中,插入提取的富媒體數(shù)據(jù)。

在一些實(shí)施例中,文章優(yōu)化單元中的從預(yù)先建立的資源庫(kù),提取與生成的文章的特征相關(guān)聯(lián)的富媒體數(shù)據(jù)包括:根據(jù)以下一項(xiàng)或多項(xiàng)從預(yù)先建立的資源庫(kù)中提取富媒體數(shù)據(jù)生成候選富媒體列表:文章主題、文章提綱、生成的文章的各段落的摘要以及生成的文章的各段落的關(guān)鍵詞;采用質(zhì)量篩選從候選富媒體列表中提取與生成的文章的特征相關(guān)聯(lián)的富媒體數(shù)據(jù)。

在一些實(shí)施例中,文章優(yōu)化單元中的預(yù)先建立的資源庫(kù)通過(guò)以下步驟建立:獲取富媒體數(shù)據(jù)的特征;根據(jù)富媒體數(shù)據(jù)的特征建立索引結(jié)構(gòu),得到資源庫(kù)。

在一些實(shí)施例中,文章優(yōu)化單元中的質(zhì)量篩選根據(jù)以下一項(xiàng)或多項(xiàng)進(jìn)行:圖文相關(guān)性、圖片分辨率、圖片長(zhǎng)寬比、圖片來(lái)源權(quán)威度、廣告過(guò)濾策略、反作弊過(guò)濾策略、反黃過(guò)濾策略和水印過(guò)濾策略。

在一些實(shí)施例中,裝置還包括:標(biāo)題生成單元,用于將文章主題和文章提綱輸入標(biāo)題模型,得到生成的文章的標(biāo)題。

在一些實(shí)施例中,裝置還包括:屬性擴(kuò)展單元,用于對(duì)標(biāo)題中的核心詞進(jìn)行屬性擴(kuò)展;標(biāo)題更新單元,用于對(duì)屬性擴(kuò)展后的標(biāo)題中的核心詞進(jìn)行替換和改寫(xiě),得到更新后的標(biāo)題。

第三方面,本申請(qǐng)實(shí)施例提供了一種設(shè)備,包括:一個(gè)或多個(gè)處理器;存儲(chǔ)裝置,用于存儲(chǔ)一個(gè)或多個(gè)程序;當(dāng)一個(gè)或多個(gè)程序被一個(gè)或多個(gè)處理器執(zhí)行,使得一個(gè)或多個(gè)處理器實(shí)現(xiàn)如上任一所述的用于生成文章的方法。

第四方面,本申請(qǐng)實(shí)施例提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上任一所述的用于生成文章的方法。

本申請(qǐng)實(shí)施例提供的用于生成文章的方法和裝置,首先基于輸入的文章主題和以下任意一項(xiàng)生成文章提綱:提綱模型;根據(jù)對(duì)應(yīng)文章主題的用戶(hù)行為數(shù)據(jù)建立的提綱數(shù)據(jù)庫(kù);以及人工設(shè)定的提綱;之后,從預(yù)先建立的素材庫(kù)中,提取與文章提綱的特征相關(guān)聯(lián)的素材;之后,向文章提綱中,插入提取的素材,得到生成的文章。本實(shí)施例實(shí)現(xiàn)了根據(jù)輸入的文章主題生成提綱,提高了文章提綱的質(zhì)量,保證了生成的文章的行文邏輯合理、形式豐富,并根據(jù)文章提綱插入與文章提綱的特征相關(guān)聯(lián)的素材,豐富了文章的內(nèi)容,從而使得生成的文章邏輯合理并且內(nèi)容豐富。

附圖說(shuō)明

通過(guò)閱讀參照以下附圖所作的對(duì)非限制性實(shí)施例所作的詳細(xì)描述,本申請(qǐng)的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:

圖1是根據(jù)本申請(qǐng)的用于生成文章的方法的一個(gè)實(shí)施例的示意性流程圖;

圖2是根據(jù)本申請(qǐng)的用于生成文章的方法的又一個(gè)實(shí)施例的示意性流程圖;

圖3是應(yīng)用本申請(qǐng)的用于生成文章的方法的一個(gè)實(shí)施例的示例性應(yīng)用場(chǎng)景;

圖4是根據(jù)本申請(qǐng)的用于生成文章的裝置的一個(gè)實(shí)施例的示例性結(jié)構(gòu)圖;

圖5是適于用來(lái)實(shí)現(xiàn)本申請(qǐng)實(shí)施例的終端設(shè)備或服務(wù)器的計(jì)算機(jī)系統(tǒng)的結(jié)構(gòu)示意圖。

具體實(shí)施方式

下面結(jié)合附圖和實(shí)施例對(duì)本申請(qǐng)作進(jìn)一步的詳細(xì)說(shuō)明??梢岳斫獾氖牵颂幩枋龅木唧w實(shí)施例僅僅用于解釋相關(guān)發(fā)明,而非對(duì)該發(fā)明的限定。另外還需要說(shuō)明的是,為了便于描述,附圖中僅示出了與有關(guān)發(fā)明相關(guān)的部分。

需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來(lái)詳細(xì)說(shuō)明本申請(qǐng)。

圖1示出了根據(jù)本申請(qǐng)的用于生成文章的方法的一個(gè)實(shí)施例的流程100。該用于生成文章的方法包括:

在步驟110中,基于輸入的文章主題和以下任意一項(xiàng)生成文章提綱:提綱模型;根據(jù)對(duì)應(yīng)文章主題的用戶(hù)行為數(shù)據(jù)建立的提綱數(shù)據(jù)庫(kù);以及人工設(shè)定的提綱。

在本實(shí)施例中,輸入的文章主題可以為機(jī)器挖掘或人工輸入的文章主題。

提綱模型通常是指以文章主題為自變量的函數(shù)。首先,可以設(shè)定文章模型=f(主題,提綱,素材),也即文章模型由函數(shù)f中的自變量(主題、提綱和素材)得到,并借由該文章模型,可以得到一種用于生成文章的方法,即選定主題,通過(guò)提綱模型挖掘提綱并排序,通過(guò)素材庫(kù)來(lái)掛載素材;最后通過(guò)配圖、排版和潤(rùn)色得到文章。

根據(jù)對(duì)應(yīng)文章主題的用戶(hù)行為數(shù)據(jù)建立的提綱數(shù)據(jù)庫(kù)是指從文章主題角度確定文章目錄,并根據(jù)用戶(hù)行為數(shù)據(jù)對(duì)文章目錄進(jìn)行合理排序和篩選,得到提綱數(shù)據(jù)庫(kù)。應(yīng)當(dāng)理解,這里的提綱生成策略生成的提綱具有一定的邏輯順序,以保障行文的合理性。

在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,上述的根據(jù)對(duì)應(yīng)所述文章主題的用戶(hù)行為數(shù)據(jù)建立的提綱數(shù)據(jù)庫(kù)包括:檢索全網(wǎng)圍繞文章主題的子主題,建立子主題數(shù)據(jù)庫(kù);根據(jù)用戶(hù)對(duì)子主題數(shù)據(jù)庫(kù)中的子主題的點(diǎn)擊順序和/或子主題數(shù)據(jù)庫(kù)中的子主題的語(yǔ)義遞進(jìn)順序,排序子主題數(shù)據(jù)庫(kù)中的子主題;剔除子主題數(shù)據(jù)庫(kù)中不符合預(yù)定邏輯規(guī)則的子主題,得到符合預(yù)定邏輯規(guī)則的子主題;將各符合預(yù)定邏輯規(guī)則的子主題作為提綱,得到提綱數(shù)據(jù)庫(kù)。

在本實(shí)現(xiàn)方式中,根據(jù)對(duì)應(yīng)所述文章主題的用戶(hù)行為數(shù)據(jù)建立的提綱數(shù)據(jù)庫(kù),充分考慮了用戶(hù)的行為數(shù)據(jù)來(lái)建立提綱,可以提高建立的提綱的針對(duì)性,進(jìn)而增強(qiáng)了生成的文章與用戶(hù)的交互能力。

在步驟120中,從預(yù)先建立的素材庫(kù)中,提取與文章提綱的特征相關(guān)聯(lián)的素材。

在本實(shí)施例中,預(yù)先建立的素材庫(kù),是指根據(jù)素材的特征建立索引結(jié)構(gòu)得到的素材庫(kù)。當(dāng)素材的特征與文章提綱的特征相關(guān)聯(lián)時(shí),可以提取該素材以備后續(xù)使用。當(dāng)多個(gè)素材的特征均與文章提綱的特征相關(guān)聯(lián)時(shí),可以從多個(gè)素材中,提取特征與文章提綱的特征最為相關(guān)的預(yù)定數(shù)量個(gè)素材,以備后續(xù)使用。

在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,預(yù)先建立的素材庫(kù)通過(guò)以下步驟建立:獲取素材的特征,素材為將現(xiàn)有的文章的內(nèi)容根據(jù)篩選規(guī)則篩選得到和/或變換現(xiàn)有的文章的內(nèi)容得到;根據(jù)素材的特征建立索引結(jié)構(gòu),得到素材庫(kù)。

在本實(shí)現(xiàn)方式中,素材庫(kù)的生成包括有明確主題的素材和無(wú)明確主題的素材,后者需要使用文章摘要技術(shù)提取主題。獲取素材的特征,可以理解為從文本素材中提取特征,這些特征可以說(shuō)明文本素材的主題、關(guān)鍵詞、核心語(yǔ)義等信息,用于和文章提綱、文章主題進(jìn)行相關(guān)性計(jì)算和排序。

具體地,上述的根據(jù)篩選規(guī)則篩選得到可以包括根據(jù)以下一項(xiàng)或多項(xiàng)內(nèi)容進(jìn)行篩選:文章的內(nèi)容長(zhǎng)度、文章的內(nèi)容質(zhì)量評(píng)分、文章的內(nèi)容滿(mǎn)意度評(píng)分、文章的瀏覽量、文章的時(shí)效性等等。而上述的變換現(xiàn)有的文章內(nèi)容主要是為了控制素材的粒度,可以采用預(yù)定規(guī)則來(lái)完成變換。例如,將字?jǐn)?shù)大于預(yù)定值的段落進(jìn)行拆解分段。假設(shè)一個(gè)素材是一篇原始語(yǔ)料,篩選后根據(jù)提綱排序組合就可以了;假設(shè)一個(gè)素材是一段,就需要考慮段落的主題相關(guān)性、段落間排序等;同理,還可以假設(shè)素材是一句話(huà)、一個(gè)詞,當(dāng)素材的粒度越小時(shí),拆解和/或變換的難度越大。

在步驟130中,向文章提綱中,插入提取的素材,得到生成的文章。

在本實(shí)施例中,可以向步驟110中得到的文章提綱中,插入步驟120中提取的素材,從而得到生成的文章。

本申請(qǐng)的上述實(shí)施例提供的用于生成文章的方法,通過(guò)生成文章提綱,提取與文章提綱的特征相關(guān)聯(lián)的素材,插入提取的素材,得到生成的文章,可以根據(jù)輸入的文章主題生成文章提綱,并且插入文章提綱的素材極為豐富,因此生成的文章的邏輯順序合理、形式和內(nèi)容更為豐富,接近于專(zhuān)業(yè)人士寫(xiě)的文章,從而摒棄了目前機(jī)器寫(xiě)作的局限性。

進(jìn)一步參考圖2,圖2示出了根據(jù)本申請(qǐng)的用于生成文章的方法的又一個(gè)實(shí)施例的示意性流程圖。該用于生成文章的方法200包括:

在步驟210中,基于輸入的文章主題和以下任意一項(xiàng)生成文章提綱:提綱模型;根據(jù)對(duì)應(yīng)文章主題的用戶(hù)行為數(shù)據(jù)建立的提綱數(shù)據(jù)庫(kù);以及人工設(shè)定的提綱。

在本實(shí)施例中,在本實(shí)施例中,輸入的文章主題可以為機(jī)器挖掘或人工輸入的文章主題。

提綱模型通常是指以文章主題為自變量的函數(shù)。首先,可以設(shè)定文章模型=f(主題,提綱,素材),也即文章模型由函數(shù)f中的自變量(主題、提綱和素材)得到,并借由該文章模型,可以得到一種用于生成文章的方法,即選定主題,通過(guò)提綱模型挖掘提綱并排序,通過(guò)素材庫(kù)來(lái)掛載素材;最后通過(guò)配圖、排版和潤(rùn)色得到文章。

根據(jù)對(duì)應(yīng)文章主題的用戶(hù)行為數(shù)據(jù)建立的提綱數(shù)據(jù)庫(kù)是指從文章主題角度確定文章目錄,并根據(jù)用戶(hù)行為數(shù)據(jù)對(duì)文章目錄進(jìn)行合理排序和篩選,得到提綱數(shù)據(jù)庫(kù)。應(yīng)當(dāng)理解,這里的提綱生成策略生成的提綱具有一定的邏輯順序,以保障行文的合理性。

在步驟220中,從預(yù)先建立的素材庫(kù)中,提取與文章提綱的特征相關(guān)聯(lián)的素材。

在本實(shí)施例中,預(yù)先建立的素材庫(kù),是指根據(jù)素材的特征建立索引結(jié)構(gòu)得到的素材庫(kù)。當(dāng)素材的特征與文章提綱的特征相關(guān)聯(lián)時(shí),可以提取該素材以備后續(xù)使用。當(dāng)多個(gè)素材的特征均與文章提綱的特征相關(guān)聯(lián)時(shí),可以從多個(gè)素材中,提取特征與文章提綱的特征最為相關(guān)的預(yù)定數(shù)量個(gè)素材,以備后續(xù)使用。

在步驟230中,向文章提綱中,插入提取的素材,得到生成的文章。

在本實(shí)施例中,可以向步驟210中得到的文章提綱中,插入步驟220中提取的素材,從而得到初具雛形的生成的文章。

在步驟240中,對(duì)生成的文章進(jìn)行優(yōu)化處理,得到優(yōu)化后的生成的文章。

在本實(shí)施例中,優(yōu)化處理包括以下一項(xiàng)或多項(xiàng):潤(rùn)色處理、插入富媒體數(shù)據(jù)處理以及排版優(yōu)化處理。

對(duì)于生成的文章,由于素材庫(kù)中存在不同的文法風(fēng)格的素材,并且前后連接處可能并不連貫,因此可以對(duì)生成的文章進(jìn)行潤(rùn)色處理,也即對(duì)文章的文法風(fēng)格和語(yǔ)句等進(jìn)行處理。這里的文法,即文章的書(shū)寫(xiě)法規(guī),一般用來(lái)指以文字、詞語(yǔ)、短句、句子的編排而組成的完整語(yǔ)句和文章的合理性組織。這里的風(fēng)格,是指具有獨(dú)特于其他文章的表現(xiàn),帶有綜合性的總體特點(diǎn)。

在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,進(jìn)行潤(rùn)色處理包括以下一項(xiàng)或多項(xiàng):統(tǒng)一生成的文章的文法風(fēng)格;刪除與前后語(yǔ)句不連貫的語(yǔ)句;以及替換與前后語(yǔ)句不連貫的語(yǔ)句。

在本實(shí)現(xiàn)方式中,統(tǒng)一生成的文章的文法風(fēng)格,可以通過(guò)對(duì)于特定詞匯、特定句式的替換和變換實(shí)現(xiàn),從而使得文章的文法風(fēng)格一致。而刪除與前后語(yǔ)句不連貫的語(yǔ)句,或者替換與前后語(yǔ)句不連貫的語(yǔ)句,均可改善語(yǔ)句的不連貫現(xiàn)象。

在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,插入富媒體數(shù)據(jù)處理包括:從預(yù)先建立的資源庫(kù),提取與生成的文章的特征相關(guān)聯(lián)的富媒體數(shù)據(jù),向生成的文章中,插入提取的富媒體數(shù)據(jù)。

在本實(shí)施例中,向生成的文章中,插入提取的富媒體數(shù)據(jù)包括:首先根據(jù)主題、提綱、段落摘要和關(guān)鍵詞中的一項(xiàng)或多項(xiàng)查找富媒體數(shù)據(jù),之后通過(guò)質(zhì)量篩選挑選出優(yōu)質(zhì)富媒體數(shù)據(jù)庫(kù),并根據(jù)圖片間字?jǐn)?shù)或段落數(shù),保證插入的富媒體數(shù)據(jù)相對(duì)均勻。例如,若文章中有兩張圖之間1000字,而另外兩個(gè)圖間10個(gè)字,那么插入的富媒體數(shù)據(jù)不均勻,并不符合用戶(hù)群體的閱讀習(xí)慣。富媒體數(shù)據(jù)為可以包含流媒體、聲音、flash、以及java、javascript、動(dòng)態(tài)的html等程序設(shè)計(jì)語(yǔ)言的形式之一或者幾種的組合。富媒體數(shù)據(jù)可以應(yīng)用于各種網(wǎng)絡(luò)服務(wù)中,如網(wǎng)站設(shè)計(jì)、電子郵件、網(wǎng)站頁(yè)面的橫幅、按鈕、彈出式廣告、插播式廣告等。應(yīng)當(dāng)理解,富媒體數(shù)據(jù)可以加強(qiáng)信息,而信息更準(zhǔn)確的定向會(huì)具有更好的交互效果。

在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,從預(yù)先建立的資源庫(kù),提取與潤(rùn)色后的文章的特征相關(guān)聯(lián)的富媒體數(shù)據(jù)包括:根據(jù)以下一項(xiàng)或多項(xiàng)從預(yù)先建立的資源庫(kù)中提取富媒體數(shù)據(jù)生成候選富媒體列表:文章主題、文章提綱、潤(rùn)色后的文章的各段落的摘要以及潤(rùn)色后的文章的各段落的關(guān)鍵詞;采用質(zhì)量篩選從候選富媒體列表中提取與潤(rùn)色后的文章的特征相關(guān)聯(lián)的富媒體數(shù)據(jù)。

在本實(shí)現(xiàn)方式中,通過(guò)根據(jù)文章主題、文章提綱、潤(rùn)色后的文章的各段落的摘要以及潤(rùn)色后的文章的各段落的關(guān)鍵詞中的一項(xiàng)或多項(xiàng)提取富媒體數(shù)據(jù),生成富媒體列表;之后采用質(zhì)量篩選從富媒體列表中提取與潤(rùn)色后的文章的特征相關(guān)聯(lián)的富媒體數(shù)據(jù),可以提高資源庫(kù)中的富媒體數(shù)據(jù)的質(zhì)量。

在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,預(yù)先建立的資源庫(kù)可以通過(guò)以下步驟建立:獲取富媒體數(shù)據(jù)的特征;根據(jù)富媒體數(shù)據(jù)的特征建立索引結(jié)構(gòu),得到資源庫(kù)。

在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,上述的質(zhì)量篩選可以根據(jù)以下一項(xiàng)或多項(xiàng)進(jìn)行:圖文相關(guān)性、圖片分辨率、圖片長(zhǎng)寬比、圖片來(lái)源權(quán)威度、廣告過(guò)濾策略、反作弊過(guò)濾策略、反黃過(guò)濾策略和水印過(guò)濾策略。

在本實(shí)現(xiàn)方式中,廣告過(guò)濾策略可以包括廣告過(guò)濾規(guī)則和廣告過(guò)濾模型;反作弊過(guò)濾策略可以包括反作弊過(guò)濾規(guī)則和反作弊過(guò)濾模型;反黃過(guò)濾策略可以包括反黃過(guò)濾規(guī)則和反黃過(guò)濾模型;水印過(guò)濾策略則可以包括水印過(guò)濾策略和水印過(guò)濾模型。

在本實(shí)施例中,排版優(yōu)化處理可以采用現(xiàn)有技術(shù)或未來(lái)發(fā)展的技術(shù)中的排版優(yōu)化方法來(lái)完成,本申請(qǐng)對(duì)此不做限定。例如,排版優(yōu)化處理可以為在確定各種需要呈現(xiàn)的文章內(nèi)容之后,選擇需要重點(diǎn)突出的內(nèi)容,最后搭配恰當(dāng)?shù)念伾媸剑瑥亩玫絻?yōu)化后的文章。這里的排版優(yōu)化處理,也可以根據(jù)對(duì)文章樣本數(shù)據(jù)和用戶(hù)針對(duì)文章樣本數(shù)據(jù)的行為數(shù)據(jù)的分析結(jié)果來(lái)確定與生成的文章相適應(yīng)的排版,從而得到優(yōu)化后的文章。

在步驟250中,將文章主題和文章提綱輸入標(biāo)題模型,生成文章的標(biāo)題。

在本實(shí)施例中,在得到生成的文章之后,可以將文章主題和文章提綱輸入標(biāo)題模型,以便生成文章的主題。這里的標(biāo)題模型,是自變量為文章主題和文章提綱的函數(shù),當(dāng)接收到文章主題和文章提綱時(shí),根據(jù)該函數(shù)即可輸出文章的主題。例如,可以為機(jī)器根據(jù)現(xiàn)有的文章樣本中包括的文章主題、文章提綱和文章的標(biāo)題學(xué)習(xí)得到的標(biāo)題模型,也可以為人為設(shè)定的標(biāo)題模型。

在本實(shí)施例的一些可選實(shí)現(xiàn)方式中,方法還包括:對(duì)標(biāo)題中的核心詞進(jìn)行屬性擴(kuò)展;對(duì)屬性擴(kuò)展后的標(biāo)題中的核心詞進(jìn)行替換和改寫(xiě),得到更新后的標(biāo)題。

在本實(shí)現(xiàn)方式中,可以首先挖掘標(biāo)題中的核心詞,之后對(duì)核心詞進(jìn)行屬性擴(kuò)展,再對(duì)屬性擴(kuò)展后的標(biāo)題中的核心詞進(jìn)行替換和改寫(xiě),得到更新后的標(biāo)題。例如,對(duì)于皇帝xxx的介紹,挖掘出標(biāo)題中的核心詞為xxx,之后可以得到xxx的屬性是放牛娃出身的皇帝,因此可以將皇帝xxx的介紹替換和改寫(xiě)為:放牛娃出身的皇帝是誰(shuí)?

應(yīng)當(dāng)理解,上述圖2中的描述僅為本申請(qǐng)實(shí)施例的用于生成文章的方法的一個(gè)示例性描述,并不代表對(duì)本申請(qǐng)的限定。例如,本申請(qǐng)實(shí)施例中的用于生成文章的方法,也可以不包括上述步驟240,或者不包括上述步驟250,從而得到新的用于生成文章的方法。圖2中的步驟210、步驟220和步驟230分別與圖1中的步驟110、步驟120和步驟130相對(duì)應(yīng),因此,圖1中針對(duì)步驟110、步驟120和步驟130描述的操作和特征同樣適用于步驟210、步驟220和步驟230,在此不再贅述。

本申請(qǐng)的上述實(shí)施例提供的用于生成文章的方法,通過(guò)與圖1中描述的用于生成文章的方法相比,增加了步驟240和步驟250,根據(jù)步驟240和步驟250,可以得到優(yōu)化后的生成的文章以及得到生成的文章的標(biāo)題,從而使得生成的文章的內(nèi)容更為全面,包含的信息更為豐富,文章的標(biāo)題更具有吸引力,并且文章的內(nèi)容和標(biāo)題更為適應(yīng)用戶(hù)群體的閱讀習(xí)慣。

以下結(jié)合圖3,描述本申請(qǐng)實(shí)施例的用于生成文章的方法的一個(gè)示例性應(yīng)用場(chǎng)景。

如圖3所示,根據(jù)本申請(qǐng)實(shí)施例的用于生成文章的方法,首先,根據(jù)輸入的文章主題310的具體實(shí)施例311“諸葛亮稱(chēng)帝”,可以生成文章提綱320的具體實(shí)施例,也即包括提綱321:劉備托孤時(shí)為什么讓諸葛亮稱(chēng)帝;提綱322:諸葛亮為什么不稱(chēng)帝;以及提綱323:諸葛亮如果稱(chēng)帝會(huì)怎么樣。之后,從預(yù)先建立的素材庫(kù)中,提取與文章提綱321至323的特征相關(guān)聯(lián)的素材330,包括以下素材:素材331“政權(quán)問(wèn)題”、素材332“欲擒故縱”、素材333“明智決定”、素材334“文人是造不了反的”、素材335“集團(tuán)外部的阻力”、素材336“集團(tuán)內(nèi)部的阻力”、素材337“外部方面的阻力”、素材338“兵民厭戰(zhàn)”以及素材339“最關(guān)鍵的一點(diǎn)”。之后,向文章提綱中,插入提取的素材330(包括素材331-339),得到生成的文章。之后,對(duì)生成的文章進(jìn)行潤(rùn)色340,具體包括在步驟341中,統(tǒng)一文章的文風(fēng),以及在步驟342中,連貫語(yǔ)句,得到潤(rùn)色后的文章。然后,從預(yù)先建立的資源庫(kù),提取與潤(rùn)色后的文章的特征相關(guān)聯(lián)的富媒體350,包括標(biāo)號(hào)為351的圖片1、標(biāo)號(hào)為352的圖片2以及標(biāo)號(hào)為353的圖片3。之后,向潤(rùn)色后的文章中,插入提取的富媒體350(包括富媒體351-353),得到插入富媒體后的文章;之后,在標(biāo)題360的生成步驟,將文章主題和文章提綱輸入標(biāo)題模型,得到初始標(biāo)題,并對(duì)初始標(biāo)題中的核心詞進(jìn)行屬性擴(kuò)展,對(duì)屬性擴(kuò)展后的初始標(biāo)題中的核心詞進(jìn)行替換和改寫(xiě),得到更新后的標(biāo)題361“有顏有實(shí)力,集盡萬(wàn)千追捧的男神為何終未加冕?”。之后,在排版370的處理步驟中,對(duì)插入富媒體后的文章進(jìn)行排版優(yōu)化處理,例如進(jìn)行具體操作371,突出重點(diǎn),并進(jìn)行顏色版式調(diào)整,從而得到排版優(yōu)化后的文章。最后,在輸出380的處理步驟中,可以具體進(jìn)行操作381,輸出排版優(yōu)化后的文章。

本申請(qǐng)的上述應(yīng)用場(chǎng)景中提供的用于生成文章的方法,提高了文章的生成效率,并豐富了文章的內(nèi)容,使得生成的文章的行文與現(xiàn)有技術(shù)相比,前后邏輯、文法風(fēng)格一致,形式、內(nèi)容更為豐富且更為合理。

進(jìn)一步參考圖4,作為對(duì)上述方法的實(shí)現(xiàn),本申請(qǐng)實(shí)施例提供了一種用于生成文章的裝置的一個(gè)實(shí)施例,該用于生成文章的方法的實(shí)施例與圖1至圖3所示的用于生成文章的方法的實(shí)施例相對(duì)應(yīng),由此,上文針對(duì)圖1至圖3中用于生成文章的方法描述的操作和特征同樣適用于用于生成文章的裝置400及其中包含的單元,在此不再贅述。

如圖4所示,該配置用于生成文章的裝置400包括:提綱生成單元410,用于基于輸入的文章主題和以下任意一項(xiàng)生成文章提綱:提綱模型;根據(jù)對(duì)應(yīng)文章主題的用戶(hù)行為數(shù)據(jù)建立的提綱數(shù)據(jù)庫(kù);以及人工設(shè)定的提綱;素材提取單元420,用于從預(yù)先建立的素材庫(kù)中,提取與文章提綱的特征相關(guān)聯(lián)的素材;素材插入單元430,用于向文章提綱中,插入提取的素材,得到生成的文章。

在一些實(shí)施例中,提綱生成單元中的根據(jù)對(duì)應(yīng)文章主題的用戶(hù)行為數(shù)據(jù)建立的提綱數(shù)據(jù)庫(kù)包括:檢索全網(wǎng)圍繞文章主題的子主題,建立子主題數(shù)據(jù)庫(kù);根據(jù)用戶(hù)對(duì)子主題數(shù)據(jù)庫(kù)中的子主題的點(diǎn)擊順序和/或子主題數(shù)據(jù)庫(kù)中的子主題的語(yǔ)義遞進(jìn)順序,排序子主題數(shù)據(jù)庫(kù)中的子主題;剔除子主題數(shù)據(jù)庫(kù)中不符合預(yù)定邏輯規(guī)則的子主題,得到符合預(yù)定邏輯規(guī)則的子主題;將各符合預(yù)定邏輯規(guī)則的子主題作為提綱,得到提綱數(shù)據(jù)庫(kù)。

在一些實(shí)施例中,素材提取單元中的預(yù)先建立的素材庫(kù)通過(guò)以下步驟建立:獲取素材的特征,素材為將現(xiàn)有的文章的內(nèi)容根據(jù)篩選規(guī)則篩選得到和/或變換現(xiàn)有的文章的內(nèi)容得到;根據(jù)素材的特征建立索引結(jié)構(gòu),得到素材庫(kù)。

在一些實(shí)施例中,裝置還包括:文章優(yōu)化單元440,用于對(duì)生成的文章進(jìn)行優(yōu)化處理,得到優(yōu)化后的生成的文章,優(yōu)化處理包括以下一項(xiàng)或多項(xiàng):潤(rùn)色處理、插入富媒體數(shù)據(jù)處理以及排版優(yōu)化處理。

在一些實(shí)施例中,文章優(yōu)化單元440中的潤(rùn)色處理包括以下一項(xiàng)或多項(xiàng):統(tǒng)一生成的文章的文法風(fēng)格;刪除與前后語(yǔ)句不連貫的語(yǔ)句;以及替換與前后語(yǔ)句不連貫的語(yǔ)句。

在一些實(shí)施例中,文章優(yōu)化單元440中的插入富媒體數(shù)據(jù)處理包括:從預(yù)先建立的資源庫(kù),提取與生成的文章的特征相關(guān)聯(lián)的富媒體數(shù)據(jù);向生成的文章中,插入提取的富媒體數(shù)據(jù)。

在一些實(shí)施例中,文章優(yōu)化單元440中的從預(yù)先建立的資源庫(kù),提取與生成的文章的特征相關(guān)聯(lián)的富媒體數(shù)據(jù)包括:根據(jù)以下一項(xiàng)或多項(xiàng)從預(yù)先建立的資源庫(kù)中提取富媒體數(shù)據(jù)生成候選富媒體列表:文章主題、文章提綱、生成的文章的各段落的摘要以及生成的文章的各段落的關(guān)鍵詞;采用質(zhì)量篩選從候選富媒體列表中提取與生成的文章的特征相關(guān)聯(lián)的富媒體數(shù)據(jù)。

在一些實(shí)施例中,文章優(yōu)化單元440中的預(yù)先建立的資源庫(kù)通過(guò)以下步驟建立:獲取富媒體數(shù)據(jù)的特征;根據(jù)富媒體數(shù)據(jù)的特征建立索引結(jié)構(gòu),得到資源庫(kù)。

在一些實(shí)施例中,文章優(yōu)化單元440中的質(zhì)量篩選根據(jù)以下一項(xiàng)或多項(xiàng)進(jìn)行:圖文相關(guān)性、圖片分辨率、圖片長(zhǎng)寬比、圖片來(lái)源權(quán)威度、廣告過(guò)濾策略、反作弊過(guò)濾策略、反黃過(guò)濾策略和水印過(guò)濾策略。

在一些實(shí)施例中,裝置還包括:標(biāo)題生成單元450,用于將文章主題和文章提綱輸入標(biāo)題模型,得到生成的文章的標(biāo)題。

在一些實(shí)施例中,裝置還包括:屬性擴(kuò)展單元(圖中未示出),用于對(duì)標(biāo)題中的核心詞進(jìn)行屬性擴(kuò)展;標(biāo)題更新單元(圖中未示出),用于對(duì)屬性擴(kuò)展后的標(biāo)題中的核心詞進(jìn)行替換和改寫(xiě),得到更新后的標(biāo)題。

本申請(qǐng)還提供了一種設(shè)備的實(shí)施例,包括:一個(gè)或多個(gè)處理器;存儲(chǔ)裝置,用于存儲(chǔ)一個(gè)或多個(gè)程序;當(dāng)一個(gè)或多個(gè)程序被一個(gè)或多個(gè)處理器執(zhí)行,使得一個(gè)或多個(gè)處理器實(shí)現(xiàn)如上任一所述的用于生成文章的方法。

本申請(qǐng)還提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的實(shí)施例,其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上任一所述的用于生成文章的方法。

下面參考圖5,其示出了適于用來(lái)實(shí)現(xiàn)本申請(qǐng)實(shí)施例的終端設(shè)備或服務(wù)器的計(jì)算機(jī)系統(tǒng)500的結(jié)構(gòu)示意圖。圖5示出的終端設(shè)備僅僅是一個(gè)示例,不應(yīng)對(duì)本申請(qǐng)實(shí)施例的功能和使用范圍帶來(lái)任何限制。

如圖5所示,計(jì)算機(jī)系統(tǒng)500包括中央處理單元(cpu)501,其可以根據(jù)存儲(chǔ)在只讀存儲(chǔ)器(rom)502中的程序或者從存儲(chǔ)部分508加載到隨機(jī)訪問(wèn)存儲(chǔ)器(ram)503中的程序而執(zhí)行各種適當(dāng)?shù)膭?dòng)作和處理。在ram503中,還存儲(chǔ)有系統(tǒng)500操作所需的各種程序和數(shù)據(jù)。cpu501、rom502以及ram503通過(guò)總線504彼此相連。輸入/輸出(i/o)接口505也連接至總線504。

以下部件連接至i/o接口505:包括鍵盤(pán)、鼠標(biāo)等的輸入部分506;包括諸如陰極射線管(crt)、液晶顯示器(lcd)等以及揚(yáng)聲器等的輸出部分507;包括硬盤(pán)等的存儲(chǔ)部分508;以及包括諸如lan卡、調(diào)制解調(diào)器等的網(wǎng)絡(luò)接口卡的通信部分509。通信部分509經(jīng)由諸如因特網(wǎng)的網(wǎng)絡(luò)執(zhí)行通信處理。驅(qū)動(dòng)器510也根據(jù)需要連接至i/o接口505??刹鹦督橘|(zhì)511,諸如磁盤(pán)、光盤(pán)、磁光盤(pán)、半導(dǎo)體存儲(chǔ)器等等,根據(jù)需要安裝在驅(qū)動(dòng)器510上,以便于從其上讀出的計(jì)算機(jī)程序根據(jù)需要被安裝入存儲(chǔ)部分508。

特別地,根據(jù)本公開(kāi)的實(shí)施例,上文參考流程圖描述的過(guò)程可以被實(shí)現(xiàn)為計(jì)算機(jī)軟件程序。例如,本公開(kāi)的實(shí)施例包括一種計(jì)算機(jī)程序產(chǎn)品,其包括承載在計(jì)算機(jī)可讀介質(zhì)上的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序包含用于執(zhí)行流程圖所示的方法的程序代碼。在這樣的實(shí)施例中,該計(jì)算機(jī)程序可以通過(guò)通信部分509從網(wǎng)絡(luò)上被下載和安裝,和/或從可拆卸介質(zhì)511被安裝。在該計(jì)算機(jī)程序被中央處理單元(cpu)501執(zhí)行時(shí),執(zhí)行本申請(qǐng)的方法中限定的上述功能。

需要說(shuō)明的是,本申請(qǐng)所述的計(jì)算機(jī)可讀介質(zhì)可以是計(jì)算機(jī)可讀信號(hào)介質(zhì)或者計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)或者是上述兩者的任意組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)例如可以是——但不限于——電、磁、光、電磁、紅外線、或半導(dǎo)體的系統(tǒng)、裝置或器件,或者任意以上的組合。計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)的更具體的例子可以包括但不限于:具有一個(gè)或多個(gè)導(dǎo)線的電連接、便攜式計(jì)算機(jī)磁盤(pán)、硬盤(pán)、隨機(jī)訪問(wèn)存儲(chǔ)器(ram)、只讀存儲(chǔ)器(rom)、可擦式可編程只讀存儲(chǔ)器(eprom或閃存)、光纖、便攜式緊湊磁盤(pán)只讀存儲(chǔ)器(cd-rom)、光存儲(chǔ)器件、磁存儲(chǔ)器件、或者上述的任意合適的組合。在本申請(qǐng)中,計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)可以是任何包含或存儲(chǔ)程序的有形介質(zhì),該程序可以被指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用。而在本申請(qǐng)中,計(jì)算機(jī)可讀的信號(hào)介質(zhì)可以包括在基帶中或者作為載波一部分傳播的數(shù)據(jù)信號(hào),其中承載了計(jì)算機(jī)可讀的程序代碼。這種傳播的數(shù)據(jù)信號(hào)可以采用多種形式,包括但不限于電磁信號(hào)、光信號(hào)或上述的任意合適的組合。計(jì)算機(jī)可讀的信號(hào)介質(zhì)還可以是計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)以外的任何計(jì)算機(jī)可讀介質(zhì),該計(jì)算機(jī)可讀介質(zhì)可以發(fā)送、傳播或者傳輸用于由指令執(zhí)行系統(tǒng)、裝置或者器件使用或者與其結(jié)合使用的程序。計(jì)算機(jī)可讀介質(zhì)上包含的程序代碼可以用任何適當(dāng)?shù)慕橘|(zhì)傳輸,包括但不限于:無(wú)線、電線、光纜、rf等等,或者上述的任意合適的組合。

附圖中的流程圖和框圖,圖示了按照本申請(qǐng)各種實(shí)施例的系統(tǒng)、方法和計(jì)算機(jī)程序產(chǎn)品的可能實(shí)現(xiàn)的體系架構(gòu)、功能和操作。在這點(diǎn)上,流程圖或框圖中的每個(gè)方框可以代表一個(gè)單元、程序段、或代碼的一部分,所述單元、程序段、或代碼的一部分包含一個(gè)或多個(gè)用于實(shí)現(xiàn)規(guī)定的邏輯功能的可執(zhí)行指令。也應(yīng)當(dāng)注意,在有些作為替換的實(shí)現(xiàn)中,方框中所標(biāo)注的功能也可以以不同于附圖中所標(biāo)注的順序發(fā)生。例如,兩個(gè)接連地表示的方框?qū)嶋H上可以基本并行地執(zhí)行,它們有時(shí)也可以按相反的順序執(zhí)行,這依所涉及的功能而定。也要注意的是,框圖和/或流程圖中的每個(gè)方框、以及框圖和/或流程圖中的方框的組合,可以用執(zhí)行規(guī)定的功能或操作的專(zhuān)用的基于硬件的系統(tǒng)來(lái)實(shí)現(xiàn),或者可以用專(zhuān)用硬件與計(jì)算機(jī)指令的組合來(lái)實(shí)現(xiàn)。

描述于本申請(qǐng)實(shí)施例中所涉及到的單元可以通過(guò)軟件的方式實(shí)現(xiàn),也可以通過(guò)硬件的方式來(lái)實(shí)現(xiàn)。所描述的單元也可以設(shè)置在處理器中,例如,可以描述為:一種處理器包括提綱生成單元、素材提取單元、素材插入單元。其中,這些單元的名稱(chēng)在某種情況下并不構(gòu)成對(duì)該單元本身的限定,例如,提綱生成單元還可以被描述為“基于輸入的文章主題和提綱生成策略,生成文章提綱的單元”。

作為另一方面,本申請(qǐng)還提供了一種非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì),該非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)可以是上述實(shí)施例中所述裝置中所包含的非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì);也可以是單獨(dú)存在,未裝配入終端中的非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)。上述非易失性計(jì)算機(jī)存儲(chǔ)介質(zhì)存儲(chǔ)有一個(gè)或者多個(gè)程序,當(dāng)所述一個(gè)或者多個(gè)程序被一個(gè)設(shè)備執(zhí)行時(shí),使得所述設(shè)備:基于輸入的文章主題和以下任意一項(xiàng)生成文章提綱:提綱模型;根據(jù)對(duì)應(yīng)文章主題的用戶(hù)行為數(shù)據(jù)建立的提綱數(shù)據(jù)庫(kù);以及人工設(shè)定的提綱;從預(yù)先建立的素材庫(kù)中,提取與文章提綱的特征相關(guān)聯(lián)的素材;向文章提綱中,插入提取的素材,得到生成的文章。

以上描述僅為本申請(qǐng)的較佳實(shí)施例以及對(duì)所運(yùn)用技術(shù)原理的說(shuō)明。本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,本申請(qǐng)中所涉及的發(fā)明范圍,并不限于上述技術(shù)特征的特定組合而成的技術(shù)方案,同時(shí)也應(yīng)涵蓋在不脫離上述發(fā)明構(gòu)思的情況下,由上述技術(shù)特征或其等同特征進(jìn)行任意組合而形成的其它技術(shù)方案。例如上述特征與本申請(qǐng)中公開(kāi)的(但不限于)具有類(lèi)似功能的技術(shù)特征進(jìn)行互相替換而形成的技術(shù)方案。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢(xún)問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1