本發(fā)明實(shí)施例涉及數(shù)據(jù)處理,尤其涉及一種文章生成方法、裝置、設(shè)備及介質(zhì)。
背景技術(shù):
1、目前對(duì)于多篇文獻(xiàn)自動(dòng)整合成專業(yè)領(lǐng)域(如醫(yī)學(xué)領(lǐng)域)文章的實(shí)現(xiàn),基本上都是基于對(duì)單篇文獻(xiàn)的概括總結(jié)摘要,再組合潤(rùn)色,批量生成實(shí)現(xiàn)的。這種做法得到的專業(yè)領(lǐng)域文章的準(zhǔn)確度較低,可讀性較差。
技術(shù)實(shí)現(xiàn)思路
1、本發(fā)明提供一種文章生成方法、裝置、設(shè)備及介質(zhì),以提高生成的專業(yè)領(lǐng)域文章的準(zhǔn)確度,提高可讀性。
2、根據(jù)本發(fā)明的一方面,提供了一種文章生成方法,包括:
3、獲取待生成文章主題下的至少一個(gè)待處理文獻(xiàn),并構(gòu)建各所述待處理文獻(xiàn)對(duì)應(yīng)的候選文獻(xiàn)圖譜;
4、確定各所述候選文獻(xiàn)圖譜中同一節(jié)點(diǎn)級(jí)別的候選文獻(xiàn)節(jié)點(diǎn)之間的節(jié)點(diǎn)相似度,并根據(jù)所述節(jié)點(diǎn)相似度,對(duì)各所述候選文獻(xiàn)圖譜進(jìn)行整合,得到一個(gè)文章生成圖譜;
5、確定所述文章生成圖譜中各候選文章節(jié)點(diǎn)對(duì)應(yīng)的候選文章節(jié)點(diǎn)權(quán)重,并根據(jù)所述候選文章節(jié)點(diǎn)權(quán)重和所述候選文章節(jié)點(diǎn),生成所述待生成文章主題對(duì)應(yīng)的文章。
6、根據(jù)本發(fā)明的另一方面,提供了一種文章生成裝置,包括:
7、文獻(xiàn)圖譜構(gòu)建模塊,用于獲取待生成文章主題下的至少一個(gè)待處理文獻(xiàn),并構(gòu)建各所述待處理文獻(xiàn)對(duì)應(yīng)的候選文獻(xiàn)圖譜;
8、文章生成圖譜構(gòu)建模塊,用于確定各所述候選文獻(xiàn)圖譜中同一節(jié)點(diǎn)級(jí)別的候選文獻(xiàn)節(jié)點(diǎn)之間的節(jié)點(diǎn)相似度,并根據(jù)所述節(jié)點(diǎn)相似度,對(duì)各所述候選文獻(xiàn)圖譜進(jìn)行整合,得到一個(gè)文章生成圖譜;
9、文章生成模塊,用于確定所述文章生成圖譜中各候選文章節(jié)點(diǎn)對(duì)應(yīng)的候選文章節(jié)點(diǎn)權(quán)重,并根據(jù)所述候選文章節(jié)點(diǎn)權(quán)重和所述候選文章節(jié)點(diǎn),生成所述待生成文章主題對(duì)應(yīng)的文章。
10、根據(jù)本發(fā)明的另一方面,提供了一種電子設(shè)備,包括:
11、一個(gè)或多個(gè)處理器;
12、存儲(chǔ)器,用于存儲(chǔ)一個(gè)或多個(gè)程序;
13、當(dāng)一個(gè)或多個(gè)程序被一個(gè)或多個(gè)處理器執(zhí)行,使得一個(gè)或多個(gè)處理器能夠執(zhí)行本發(fā)明實(shí)施例所提供的任意一種文章生成方法。
14、根據(jù)本發(fā)明的另一方面,提供了一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)存儲(chǔ)有計(jì)算機(jī)指令,計(jì)算機(jī)指令用于使處理器執(zhí)行時(shí)實(shí)現(xiàn)本發(fā)明實(shí)施例所提供的任意一種文章生成方法。
15、本發(fā)明實(shí)施例提供了一種文章生成方案,通過獲取待生成文章主題下的至少一個(gè)待處理文獻(xiàn),并構(gòu)建各待處理文獻(xiàn)對(duì)應(yīng)的候選文獻(xiàn)圖譜;確定各候選文獻(xiàn)圖譜中同一節(jié)點(diǎn)級(jí)別的候選文獻(xiàn)節(jié)點(diǎn)之間的節(jié)點(diǎn)相似度,并根據(jù)節(jié)點(diǎn)相似度,對(duì)各候選文獻(xiàn)圖譜進(jìn)行整合,得到一個(gè)文章生成圖譜;確定文章生成圖譜中各候選文章節(jié)點(diǎn)對(duì)應(yīng)的候選文章節(jié)點(diǎn)權(quán)重,并根據(jù)候選文章節(jié)點(diǎn)權(quán)重和候選文章節(jié)點(diǎn),生成待生成文章主題對(duì)應(yīng)的文章。上述方案,通過引入候選文獻(xiàn)圖譜、文章生成圖譜和候選文章節(jié)點(diǎn)權(quán)重,生成文章,提高了生成的專業(yè)領(lǐng)域文章的準(zhǔn)確度和可讀性;同時(shí),根據(jù)節(jié)點(diǎn)相似度,對(duì)各候選文獻(xiàn)圖譜進(jìn)行整合,得到一個(gè)文章生成圖譜,避免了重復(fù)節(jié)點(diǎn)對(duì)文章生成的影響,提高了文章生成圖譜的準(zhǔn)確度。
16、應(yīng)當(dāng)理解,本部分所描述的內(nèi)容并非旨在標(biāo)識(shí)本發(fā)明的實(shí)施例的關(guān)鍵或重要特征,也不用于限制本發(fā)明的范圍。本發(fā)明的其它特征將通過以下的說明書而變得容易理解。
1.一種文章生成方法,其特征在于,包括:
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定各所述候選文獻(xiàn)圖譜中同一節(jié)點(diǎn)級(jí)別的候選文獻(xiàn)節(jié)點(diǎn)之間的節(jié)點(diǎn)相似度,并根據(jù)所述節(jié)點(diǎn)相似度,對(duì)各所述候選文獻(xiàn)圖譜進(jìn)行整合,得到一個(gè)文章生成圖譜,包括:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述節(jié)點(diǎn)相似度,對(duì)各所述候選文獻(xiàn)圖譜中的當(dāng)前文獻(xiàn)節(jié)點(diǎn)進(jìn)行節(jié)點(diǎn)合并,包括:
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述根據(jù)所述節(jié)點(diǎn)相似度和預(yù)設(shè)相似度閾值,確定所述節(jié)點(diǎn)相似度對(duì)應(yīng)的任意兩個(gè)當(dāng)前文獻(xiàn)節(jié)點(diǎn)之間的候選合并方式,包括:
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述文章生成圖譜中各候選文章節(jié)點(diǎn)對(duì)應(yīng)的候選文章節(jié)點(diǎn)權(quán)重,包括:
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述確定所述參考母節(jié)點(diǎn)對(duì)應(yīng)的母節(jié)點(diǎn)向量分別與各所述參考子節(jié)點(diǎn)對(duì)應(yīng)的子節(jié)點(diǎn)向量之間的節(jié)點(diǎn)隱性特征,包括:
7.根據(jù)權(quán)利要求1-6中任一項(xiàng)所述的方法,其特征在于,所述根據(jù)所述候選文章節(jié)點(diǎn)權(quán)重和所述候選文章節(jié)點(diǎn),生成所述待生成文章主題對(duì)應(yīng)的文章,包括:
8.一種文章生成裝置,其特征在于,包括:
9.一種電子設(shè)備,其特征在于,包括:
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-7任一項(xiàng)所述的一種文章生成方法。