句。若不從中提取摘要,則商品介紹很繁瑣。從每類語(yǔ)句中分別提取一個(gè)語(yǔ)句,可以得到候選摘要,能夠完整、簡(jiǎn)潔的向用戶介紹電子商務(wù)網(wǎng)頁(yè)上的商品。每個(gè)語(yǔ)句的類中可能含有多句語(yǔ)句,獲得的候選摘要也有多個(gè)方案,需要通過后續(xù)了步驟采取合適的方案。
[0088]步驟S307、從候選摘要中選取與預(yù)設(shè)文本摘要長(zhǎng)度差值最小的候選摘要作為電子商務(wù)網(wǎng)頁(yè)的摘要文本,其中預(yù)設(shè)文本摘要長(zhǎng)度根據(jù)待生成的視頻長(zhǎng)度和預(yù)先設(shè)定的文本摘要朗讀速度確定。
[0089]預(yù)設(shè)文本摘要長(zhǎng)度根據(jù)待生成的視頻長(zhǎng)度和預(yù)先設(shè)定的文本摘要朗讀速度確定,例如視頻長(zhǎng)度定為I分鐘,文本摘要朗讀速度定為120字每分鐘,則預(yù)設(shè)文本摘要長(zhǎng)度定為120字。步驟ld3得到的多個(gè)文本摘要中,需要篩選出合適的文本摘要。多個(gè)文本摘要中與預(yù)設(shè)的文本摘要長(zhǎng)度差值最小的候選摘要被選取為電子商務(wù)網(wǎng)頁(yè)的摘要文本。當(dāng)存在多個(gè)方案使得文本內(nèi)容摘要長(zhǎng)度相同時(shí),采用提取最前語(yǔ)句的方案。例如獲取的文本語(yǔ)句可分為兩個(gè)類,其中語(yǔ)句I和語(yǔ)句3是一個(gè)類,語(yǔ)句2和語(yǔ)句4是另一個(gè)類,語(yǔ)句I加語(yǔ)句2的字?jǐn)?shù)與預(yù)設(shè)文本摘要長(zhǎng)度差值最小且語(yǔ)句I加語(yǔ)句2的長(zhǎng)度等于語(yǔ)句3加語(yǔ)句4的長(zhǎng)度,此時(shí)語(yǔ)句I是文本中最先出現(xiàn)的語(yǔ)句,則文本摘要由語(yǔ)句I和語(yǔ)句2組成。通過此步驟獲取文本摘要,能夠完整、簡(jiǎn)潔的向用戶介紹目標(biāo)電子商務(wù)網(wǎng)頁(yè)上的商品。
[0090]步驟S308、解析文本摘要,得到文本摘要中的關(guān)鍵詞。
[0091]本步驟能夠得到商品介紹的關(guān)鍵詞,為后續(xù)步驟提供關(guān)鍵詞信息。
[0092]步驟S309、對(duì)關(guān)鍵詞進(jìn)行語(yǔ)義分析,得到關(guān)鍵詞本體語(yǔ)義。
[0093]本步驟得到關(guān)鍵詞的語(yǔ)義分析得到本體語(yǔ)義,以便后續(xù)步驟中正確的基于電子商務(wù)網(wǎng)頁(yè)內(nèi)容生成視頻摘要。
[0094]步驟S310、基于關(guān)鍵詞本體語(yǔ)義,從互聯(lián)網(wǎng)絡(luò)中檢索對(duì)應(yīng)的圖片或視頻,形成背景圖;
[0095]本步驟得到背景圖,作為后續(xù)步驟中合成視頻摘要的素材。
[0096]步驟S311、基于關(guān)鍵詞本體語(yǔ)義,從預(yù)先設(shè)立的語(yǔ)法數(shù)據(jù)庫(kù)中獲取與關(guān)鍵詞對(duì)應(yīng)的動(dòng)畫模板;
[0097]本步驟能夠獲得生成視頻摘要的方式。
[0098]步驟S312、將文本摘要轉(zhuǎn)化為音頻數(shù)據(jù);
[0099]本步驟將文本摘要轉(zhuǎn)化成音頻數(shù)據(jù),以此音頻數(shù)據(jù)作為合成視頻摘要的音頻素材。
[0100]步驟S313、按照預(yù)設(shè)渲染規(guī)則,將背景圖、動(dòng)畫模板及所音頻數(shù)據(jù)合成渲染為視頻文件。
[0101]本步驟渲染生成視頻文件。
[0102]實(shí)施例4:
[0103]本實(shí)施例4在實(shí)施例1的基礎(chǔ)上提供一種優(yōu)選的基于電子商務(wù)網(wǎng)頁(yè)內(nèi)容生成視頻摘要的方法,其流程示意圖為圖4,主要步驟包括:
[0104]步驟S401、提取目標(biāo)電子商務(wù)網(wǎng)頁(yè)文本內(nèi)容的文本摘要。
[0105]本步驟獲取文本摘要,能夠完整、簡(jiǎn)潔的向用戶介紹目標(biāo)電子商務(wù)網(wǎng)頁(yè)上的商品。
[0106]步驟S402、對(duì)文本摘要進(jìn)行分詞;
[0107]中文語(yǔ)句表述中以漢字為基本單位,沒有類似英文語(yǔ)句中的分詞信息,故首先對(duì)文本摘要進(jìn)行分詞,得到文本摘要中分詞信息。
[0108]步驟S403、將分詞后得到的詞語(yǔ)與預(yù)設(shè)的語(yǔ)法數(shù)據(jù)庫(kù)中的詞語(yǔ)模板進(jìn)行比對(duì),確定分詞后得到的詞語(yǔ)的詞性;
[0109]語(yǔ)法數(shù)據(jù)庫(kù)中存儲(chǔ)詞語(yǔ)模板。通過將分詞后得到的詞語(yǔ)與預(yù)設(shè)的語(yǔ)法數(shù)據(jù)庫(kù)中的詞語(yǔ)模板進(jìn)行比對(duì),能確定分詞后得到的詞語(yǔ)的詞性,即詞語(yǔ)是名詞、動(dòng)詞、數(shù)詞、量詞、代詞、形容詞、副詞、介詞、連詞、助詞、擬聲詞和嘆詞的詞性劃分。類似虛詞如副詞、介詞、連詞、助詞、擬聲詞和嘆詞通常不包括關(guān)鍵信息,通過將分詞后得到的詞語(yǔ)與預(yù)設(shè)的語(yǔ)法數(shù)據(jù)庫(kù)中的詞語(yǔ)模板進(jìn)行比對(duì),確定分詞后得到的詞語(yǔ)的詞性,能夠更快速獲取關(guān)鍵詞。
[0110]步驟S404、根據(jù)詞性的判斷結(jié)果,從分詞后的詞語(yǔ)中選取名詞及數(shù)詞作為文本摘要的關(guān)鍵詞。
[0111]電子商務(wù)網(wǎng)頁(yè)中商品介紹的關(guān)鍵詞是名詞和數(shù)詞,名詞介紹了商品的名稱和分類信息,數(shù)詞介紹了商品的尺寸、重量和價(jià)格信息。提取了文本摘要中的名詞和數(shù)詞,能夠得到商品介紹的關(guān)鍵信息。
[0112]步驟S405、對(duì)關(guān)鍵詞進(jìn)行語(yǔ)義分析,得到關(guān)鍵詞本體語(yǔ)義。
[0113]本步驟得到關(guān)鍵詞的語(yǔ)義分析得到本體語(yǔ)義,以便后續(xù)步驟中正確的基于電子商務(wù)網(wǎng)頁(yè)內(nèi)容生成視頻摘要。
[0114]步驟S406、基于關(guān)鍵詞本體語(yǔ)義,從互聯(lián)網(wǎng)絡(luò)中檢索對(duì)應(yīng)的圖片或視頻,形成背景圖;
[0115]本步驟得到背景圖,作為后續(xù)步驟中合成視頻摘要的素材。
[0116]步驟S407、基于關(guān)鍵詞本體語(yǔ)義,從預(yù)先設(shè)立的語(yǔ)法數(shù)據(jù)庫(kù)中獲取與關(guān)鍵詞對(duì)應(yīng)的動(dòng)畫模板;
[0117]本步驟能夠獲得生成視頻摘要的方式。
[0118]步驟S408、將文本摘要轉(zhuǎn)化為音頻數(shù)據(jù);
[0119]本步驟將文本摘要轉(zhuǎn)化成音頻數(shù)據(jù),以此音頻數(shù)據(jù)作為合成視頻摘要的音頻素材。
[0120]步驟S409、按照預(yù)設(shè)渲染規(guī)則,將背景圖、動(dòng)畫模板及所音頻數(shù)據(jù)合成渲染為視頻文件。
[0121]本步驟渲染生成視頻文件。
[0122]實(shí)施例5:
[0123]本實(shí)施例5在實(shí)施例1的基礎(chǔ)上提供一種優(yōu)選的基于電子商務(wù)網(wǎng)頁(yè)內(nèi)容生成視頻摘要的方法,其流程示意圖為圖5,主要步驟包括:
[0124]步驟S501、提取目標(biāo)電子商務(wù)網(wǎng)頁(yè)文本內(nèi)容的文本摘要。
[0125]本步驟獲取文本摘要,能夠完整、簡(jiǎn)潔的向用戶介紹目標(biāo)電子商務(wù)網(wǎng)頁(yè)上的商品。
[0126]步驟S502、解析文本摘要,得到文本摘要中的關(guān)鍵詞。
[0127]本步驟得到商品介紹的關(guān)鍵詞,為后續(xù)步驟提供關(guān)鍵詞信息。
[0128]步驟S503、在預(yù)設(shè)的語(yǔ)法數(shù)據(jù)庫(kù)中檢索關(guān)鍵詞,獲取與關(guān)鍵詞相關(guān)的所有本體描述;
[0129]預(yù)設(shè)的語(yǔ)法數(shù)據(jù)庫(kù)中存儲(chǔ)有各個(gè)詞語(yǔ)對(duì)應(yīng)的本體描述,在語(yǔ)法數(shù)據(jù)庫(kù)中檢索關(guān)鍵詞,可以獲取與關(guān)鍵詞相關(guān)的所有本體描述。例如,通過檢索語(yǔ)法數(shù)據(jù)庫(kù),得到“襯衫”的本體描述是“服飾”。
[0130]步驟S504、利用網(wǎng)絡(luò)本體語(yǔ)言O(shè)WL從關(guān)鍵詞的所有本體描述中確定出當(dāng)前語(yǔ)境下的關(guān)鍵詞本體語(yǔ)義。
[0131]關(guān)鍵詞可能含有多個(gè)本體描述,例如“蘋果”,可能是“水果”,也可能是“公司”,此時(shí),可利用OWL確定出當(dāng)前語(yǔ)境下的關(guān)鍵詞本體語(yǔ)義,得到關(guān)鍵詞的正確描述,以便后續(xù)步驟中正確的基于電子商務(wù)網(wǎng)頁(yè)內(nèi)容生成視頻摘要。
[0132]步驟S505、基于關(guān)鍵詞本體語(yǔ)義,從互聯(lián)網(wǎng)絡(luò)中檢索對(duì)應(yīng)的圖片或視頻,形成背景圖;
[0133]本步驟得到背景圖,作為后續(xù)步驟中合成視頻摘要的素材。
[0134]步驟S506、基于關(guān)鍵詞本體語(yǔ)義,從預(yù)先設(shè)立的語(yǔ)法數(shù)據(jù)庫(kù)中獲取與關(guān)鍵詞對(duì)應(yīng)的動(dòng)畫模板;
[0135]本步驟能夠獲得生成視頻摘要的模板。
[0136]步驟S507、將文本摘要轉(zhuǎn)化為音頻數(shù)據(jù);
[0137]本步驟將文本摘要轉(zhuǎn)化成音頻數(shù)據(jù),以此音頻數(shù)據(jù)作為合成視頻摘要的音頻素材。O
[0138]步驟S508、按照預(yù)設(shè)渲染規(guī)則,將背景圖、動(dòng)畫模板及所音頻數(shù)據(jù)合成渲染為視頻文件。
[0139]本步驟渲染生成視頻文件。
[0140]實(shí)施例6:
[0141]本實(shí)施例6提供了一種基于電子商務(wù)網(wǎng)頁(yè)內(nèi)容生成視頻摘要的裝置,其結(jié)構(gòu)示意圖如圖6,包括:
[0142]提取模塊21,用于提取目標(biāo)電子商務(wù)網(wǎng)頁(yè)文本內(nèi)容的文本摘要;
[0143]關(guān)鍵詞獲取模塊22,用于解析文本摘要,得到文本摘要中的關(guān)鍵詞;
[0144]語(yǔ)義分析模塊23,用于對(duì)關(guān)鍵詞進(jìn)行語(yǔ)義分析,得到關(guān)鍵詞本體語(yǔ)義;
[0145]背景圖形成模塊24,用于基于關(guān)鍵詞本體語(yǔ)義,從互聯(lián)網(wǎng)絡(luò)中檢索對(duì)應(yīng)的圖片或視頻,形成背景圖;
[0146]動(dòng)畫模板獲取模塊25,用于基于關(guān)鍵詞本體語(yǔ)義,從預(yù)先設(shè)立的語(yǔ)法數(shù)據(jù)庫(kù)中獲取與關(guān)鍵詞對(duì)應(yīng)的動(dòng)畫模板;
[0147]音頻轉(zhuǎn)換模塊26,用于將文本摘要轉(zhuǎn)化為音頻數(shù)據(jù);
[0148]視頻合成模塊27,用于按照預(yù)設(shè)渲染規(guī)則,將背景圖、動(dòng)畫模板及音頻數(shù)據(jù)合成渲染為視頻文件。
[0149]本實(shí)施例6提供的一種基于電子商務(wù)網(wǎng)頁(yè)內(nèi)容生成視頻摘要的裝置,通過提取模塊21提取目標(biāo)電子商務(wù)網(wǎng)頁(yè)文本內(nèi)容的文本摘要;然后由關(guān)鍵詞獲取模塊22解析提取的文本摘要,得到文本摘要中的關(guān)鍵詞;之后,語(yǔ)義分析模塊23分析關(guān)鍵詞得到關(guān)鍵詞本體語(yǔ)義,再由背景圖形成模塊24基于關(guān)鍵詞本體語(yǔ)義,從互聯(lián)網(wǎng)絡(luò)中檢索對(duì)應(yīng)的圖片或視頻,形成背景圖;由動(dòng)畫模板獲取模塊25基于關(guān)鍵詞本體語(yǔ)義,從預(yù)先設(shè)立的語(yǔ)法數(shù)據(jù)庫(kù)中獲取與關(guān)鍵詞對(duì)應(yīng)的動(dòng)畫模板;音頻轉(zhuǎn)換模塊26將文本摘要轉(zhuǎn)化為音頻數(shù)據(jù);最后,視頻合成模塊27按照預(yù)設(shè)渲染規(guī)則,將背景圖、動(dòng)畫模板及音頻數(shù)據(jù)合成渲染為視頻文件。當(dāng)用戶訪問電子商務(wù)網(wǎng)頁(yè)時(shí),可以在網(wǎng)頁(yè)上看到基于相應(yīng)電子商務(wù)網(wǎng)頁(yè)內(nèi)容生成視