亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

文章章節(jié)生成方法、系統(tǒng)和電子書(shū)閱讀器的制造方法_3

文檔序號(hào):9547160閱讀:來(lái)源:國(guó)知局
節(jié)通過(guò)第三篩選規(guī)則篩選,刪除第二候選章節(jié)中為預(yù)設(shè)字符串的候選章節(jié),最后留下的第二候選章節(jié)就形成最后所需的章節(jié)。當(dāng)然,篩選過(guò)程不一定需要按照上述順序。
[0094]經(jīng)過(guò)上述的篩選規(guī)則從多個(gè)候選章節(jié)中得到多個(gè)章節(jié)后,按照預(yù)設(shè)的排列規(guī)則排列多個(gè)章節(jié)以建立章節(jié)列表。預(yù)設(shè)的排列規(guī)則可以是按照文章的文本數(shù)據(jù)順序。
[0095]按序組織綱目?jī)?nèi)容以建立文章的章節(jié)列表后,建立章節(jié)列表到對(duì)應(yīng)的章節(jié)內(nèi)容之間的索引關(guān)系。建立文章的章節(jié)列表后,根據(jù)每個(gè)章節(jié)在文章中的位置來(lái)確定對(duì)應(yīng)的章節(jié)內(nèi)容。例如建立了的章節(jié)列表中,其中相鄰兩個(gè)章節(jié)為“第一回”和“第二回”。根據(jù)“第一回”在文章中的位置,可以確定“第一回”后緊接著的文本內(nèi)容為“第一回”所對(duì)應(yīng)的章節(jié)內(nèi)容的起始位置。畢竟對(duì)于用戶而言,只需知道章節(jié)所對(duì)應(yīng)的章節(jié)內(nèi)容起始位置即可以閱讀,并不需要知道章節(jié)所對(duì)應(yīng)的全部章節(jié)內(nèi)容。
[0096]繼續(xù)文章《三國(guó)演義》為例,“第一回”后緊接著的文本內(nèi)容為:
[0097]“滾長(zhǎng)江東逝水,浪花淘盡英雄。
[0098]是非成敗轉(zhuǎn)頭空,
[0099]青山依舊在,幾度夕陽(yáng)紅。
[0100]白發(fā)漁樵江渚上,慣看秋月春風(fēng)。
[0101]一壺濁酒喜相逢,
[0102]古今多少事,都付笑談中?!?br>[0103]因此,可以建立“第一回”和上述文本內(nèi)容(位置)的索引關(guān)系,用戶可以通過(guò)章節(jié)列表中的文章章節(jié)找到對(duì)應(yīng)的章節(jié)內(nèi)容的起始位置,從而方便用戶從章節(jié)列表直接跳轉(zhuǎn)到相應(yīng)的章節(jié)內(nèi)容的起始位置。
[0104]當(dāng)然,可以通過(guò)章節(jié)列表中相鄰兩個(gè)章節(jié)的各自位置,來(lái)確定相鄰兩個(gè)章節(jié)中的第一個(gè)章節(jié)的章節(jié)內(nèi)容。例如建立了的章節(jié)列表中,其中相鄰兩個(gè)章節(jié)為“第一回”和“第二回”。根據(jù)“第一回”和“第二回”在文章中的位置,可以確定“第一回”之后到“第二回”之前的文本內(nèi)容即為“第一回”的章節(jié)內(nèi)容。通過(guò)這種方法確定的章節(jié)內(nèi)容為相應(yīng)章節(jié)的全部章節(jié)內(nèi)容。
[0105]章節(jié)列表建立好,且章節(jié)列表到對(duì)應(yīng)的章節(jié)內(nèi)容之間的索引關(guān)系也建立好后,可以執(zhí)行步驟S130。
[0106]步驟S130:推送或顯示章節(jié)列表。
[0107]此時(shí)可以將建立好的章節(jié)列表直接推送或顯示給用戶。推送或顯示章節(jié)列表之后,還可以包括步驟S140。
[0108]步驟S140:提供章節(jié)列表給用戶確認(rèn)。
[0109]推送或顯示章節(jié)列表后,可以提供用戶界面給用戶進(jìn)行相關(guān)的確認(rèn)或重新建立章節(jié)列表等操作。例如可以提供確認(rèn)按鍵和重新建立章節(jié)列表按鍵,如果章節(jié)列表滿足用戶的要求,則用戶可以通過(guò)點(diǎn)擊確認(rèn)按鍵確認(rèn)章節(jié)列表;如果覺(jué)得所建立的章節(jié)列表并不符合用戶要求,還可以通過(guò)點(diǎn)擊重新建立章節(jié)列表按鍵來(lái)重新建立章節(jié)列表。
[0110]如果覺(jué)得所建立的章節(jié)列表并不符合用戶要求,用戶還可以通過(guò)自行修改得到自己想要的章節(jié)列表,例如進(jìn)行刪除或修改某些章節(jié)。因此,推送或顯示章節(jié)列表之后,還可以包括步驟S150
[0111]步驟S150:提供章節(jié)列表給用戶修改和確認(rèn)。
[0112]最后執(zhí)行步驟S160:保存經(jīng)用戶確認(rèn)的章節(jié)列表。保存的章節(jié)列表可以保存成TXT、DOC、PDF, HTM、HTML、EPUB, CHM等等格式,也可以直接將章節(jié)列表添加保存到文章中,例如文章的起始部分中。
[0113]本發(fā)明還提供一種文章章節(jié)生成系統(tǒng),包括獲取模塊100、提取模塊110、生成模塊120、輸出模塊130。圖3為一個(gè)實(shí)施例的文章章節(jié)生成系統(tǒng)模塊示意圖。
[0114]獲取模塊100用于根據(jù)文章的用戶指定內(nèi)容而獲得文章。
[0115]用戶指定內(nèi)容可以包括文章的關(guān)鍵詞,獲取模塊100通過(guò)搜索引擎搜索關(guān)鍵詞而獲取文章。例如,當(dāng)應(yīng)用于在線閱讀時(shí),獲取模塊100可以提供用戶界面給用戶進(jìn)行輸入,獲取用戶輸入的內(nèi)容后,以用戶輸入的內(nèi)容作為關(guān)鍵詞,通過(guò)搜索引擎在互聯(lián)網(wǎng)搜索關(guān)鍵詞,并將搜索的相關(guān)的文章鏈接向用戶顯示;當(dāng)用戶選擇了其中的文章鏈接后,將與該文章鏈接相對(duì)應(yīng)的文章獲取。
[0116]用戶指定內(nèi)容可以包括文章的存儲(chǔ)路徑,獲取模塊100通過(guò)讀取存儲(chǔ)路徑所指向的文件而獲取文章。例如,當(dāng)應(yīng)用于電子書(shū)閱讀器時(shí),用戶可以事先下載好文章存儲(chǔ)到存儲(chǔ)介質(zhì),電子書(shū)閱讀器的獲取模塊100可以通過(guò)用戶操作得到文章的存儲(chǔ)路徑,然后通過(guò)存儲(chǔ)路徑獲取文章。當(dāng)然,存儲(chǔ)介質(zhì)可以是本地存儲(chǔ)介質(zhì),也可以是遠(yuǎn)端存儲(chǔ)介質(zhì);下載好的文章既可以存儲(chǔ)于本地存儲(chǔ)介質(zhì),也可以存儲(chǔ)于遠(yuǎn)端存儲(chǔ)介質(zhì),例如云端存儲(chǔ)空間。
[0117]所述的文章可以理解為文檔,是具有載體的。文章的載體可以為T(mén)XT、DOC、PDF,HTM、HTML、EPUB, CHM等等格式的文件。獲取文章可以理解為獲取文件。
[0118]提取模塊110用于遍歷文章的文本數(shù)據(jù),提取其中具有章節(jié)特征的綱目?jī)?nèi)容。
[0119]提取模塊110遍歷文章的文本數(shù)據(jù)的過(guò)程,可以按照文本數(shù)據(jù)順序依次提取文本數(shù)據(jù)中具有章節(jié)特征的綱目?jī)?nèi)容。文本數(shù)據(jù)順序可以理解為文本數(shù)據(jù)的前后的排列順序。將文本數(shù)據(jù)從頭到尾進(jìn)行搜索,發(fā)現(xiàn)符合章節(jié)特征的綱目?jī)?nèi)容時(shí),就將該綱目?jī)?nèi)容復(fù)制提取出來(lái)。
[0120]章節(jié)特征可以設(shè)置為:相鄰兩個(gè)標(biāo)識(shí)符之間的字符數(shù)滿足預(yù)設(shè)條件。標(biāo)記符通常是用于區(qū)分不同的段落,也即在相鄰的兩個(gè)標(biāo)記符之間,通常為一段的自然段落。這種標(biāo)記符,可以是段落符和斷行符中的一種。當(dāng)然,根據(jù)不同的電子書(shū)文檔格式,標(biāo)記符的表達(dá)可能不一樣,只要用于區(qū)分不同段落的字符都可以理解為所述標(biāo)記符?;ヂ?lián)網(wǎng)上大部分的電子書(shū),通常文章的文本數(shù)據(jù)中都有文章章節(jié),只是由于很多電子書(shū)是直接從網(wǎng)站抓取,然后抓取形成電子書(shū),這類(lèi)電子書(shū)通常是沒(méi)有文章目錄的。然而,這類(lèi)電子書(shū)的文本數(shù)據(jù)中有文章章節(jié),而通常這些文章章節(jié)都具備章節(jié)特征,例如這些文章章節(jié)通常自起一段,以與文章正文內(nèi)容區(qū)分開(kāi)。因此,文章章節(jié)通常存在于相鄰的兩個(gè)標(biāo)記符之間,具有章節(jié)特征的綱目?jī)?nèi)容為相鄰兩個(gè)標(biāo)識(shí)符之間的字符。
[0121]文章章節(jié)通常自起一段,而且具有字?jǐn)?shù)較少的特征。畢竟,如果是文章正文內(nèi)容,通常一段的文本字?jǐn)?shù)大部分都不會(huì)存在字?jǐn)?shù)較少的特征。以文章《三國(guó)演義》為例,《三國(guó)演義》的第一章的標(biāo)題(即文章章節(jié))為“第一回宴桃園豪杰三結(jié)義斬黃巾英雄首立功”,標(biāo)題里加上空格字符總共21個(gè)字符,然而在《三國(guó)演義》通篇文本正文內(nèi)容中,并沒(méi)有一個(gè)非文章章節(jié)的自然段落中的字符數(shù)會(huì)少于21的。因此,可以通過(guò)判斷相鄰兩個(gè)標(biāo)識(shí)符之間的字符數(shù)滿足預(yù)設(shè)條件來(lái)初步判斷是否為文章章節(jié)。
[0122]所述預(yù)設(shè)條件可以包括:字符數(shù)大于0且少于預(yù)設(shè)數(shù)值。預(yù)設(shè)數(shù)值可以通過(guò)用戶自行設(shè)定,畢竟用戶了解了文章內(nèi)容后,可以判斷文章章節(jié)的字符數(shù)范圍。繼續(xù)以文章《三國(guó)演義》為例,用戶了解文章內(nèi)容后可以將預(yù)設(shè)數(shù)值設(shè)為22。因此,文章章節(jié)生成系統(tǒng)還可以包括預(yù)設(shè)模塊,在獲取模塊100獲得文章之后、提取模塊110提取其中具有章節(jié)特征的綱目?jī)?nèi)容之前,預(yù)設(shè)模塊用于用戶設(shè)置預(yù)設(shè)數(shù)值。
[0123]提取模塊110可以提取到多組綱目?jī)?nèi)容。
[0124]生成模塊120用于按序組織綱目?jī)?nèi)容以建立文章的章節(jié)列表,建立章節(jié)列表到對(duì)應(yīng)的章節(jié)內(nèi)容之間的索引關(guān)系。
[0125]生成模塊120將提取到的多組綱目?jī)?nèi)容(相鄰兩個(gè)標(biāo)識(shí)符之間的字符)按預(yù)設(shè)的排列規(guī)則組織排列,并形成由多組綱目?jī)?nèi)容組成的章節(jié)列表。預(yù)設(shè)的排列規(guī)則可以是文章的文本數(shù)據(jù)順序。
[0126]生成模塊120包括:提取單元121和排列單元122。圖4為一個(gè)實(shí)施例的生成模塊不意圖。
[0127]提取單元121用于提取相鄰兩個(gè)標(biāo)識(shí)符之間的字符作為候選章節(jié),并得到多個(gè)候選章節(jié);排列單元122用于從多個(gè)候選章節(jié)中得到多個(gè)章節(jié),并按照預(yù)設(shè)的排列規(guī)則排列多個(gè)章節(jié)以建立章節(jié)列表。
[0128]在一些電子書(shū)中,由于所抓取的網(wǎng)站編輯的原因,通常會(huì)在文章中添加一些并非文章本身內(nèi)容的字符或字符串。例如,可能會(huì)添加“TXT下載”、“無(wú)彈窗”、“全文閱讀”、“免費(fèi)閱讀”等字符或字符串,有些還會(huì)添加類(lèi)似于廣告的字符,例如“XX小說(shuō)網(wǎng)”。
[0129]因此,如果電子書(shū)的內(nèi)容中沒(méi)有這類(lèi)并非文章本身內(nèi)容的字符,則排列單元122通常從候選章節(jié)中可以直接得到最后所需的章節(jié),然后按照預(yù)設(shè)的排列規(guī)則排列多個(gè)章節(jié)以建立章節(jié)列表。
[0130]然而,如果電子書(shū)的內(nèi)容中存在這類(lèi)并非文章本身內(nèi)容的字符,則需要通過(guò)從多個(gè)候選章節(jié)中按照預(yù)設(shè)的篩選規(guī)則得到多個(gè)章節(jié)。畢竟,僅僅通過(guò)上述的章節(jié)特征(相鄰兩個(gè)標(biāo)識(shí)符之間的字符數(shù)滿足預(yù)設(shè)條件)而提取的綱目?jī)?nèi)容可能還存在大量的非文章章節(jié)的內(nèi)容。
[0131]預(yù)設(shè)的篩選規(guī)則可以是第一篩選規(guī)則:保留具有數(shù)字字符的候選章節(jié)。文章章節(jié)通常具有章節(jié)序號(hào),例如“第一章”、“第一回”、“第一節(jié)”、“第一集”、“第一卷”、“第一篇”等等,通常都具有表征章節(jié)序號(hào)的數(shù)字字符。以文章《三國(guó)演義》為例,《三國(guó)演義》的第一章的標(biāo)題(即文章章節(jié))為“第一回宴桃園豪杰三結(jié)義斬黃巾英雄首立功”,顯然章節(jié)序號(hào)“第一回”中具有數(shù)字字符“一”。因此,當(dāng)候選章節(jié)中具有數(shù)字字符的,可以保留下來(lái),然后可以再?gòu)木哂袛?shù)字字符的候選章節(jié)中得到最后所需的章節(jié)。
[0132]預(yù)設(shè)的篩選規(guī)則還可以是第二篩選規(guī)則:保留具有預(yù)設(shè)字符的候選章節(jié)。文章章節(jié)通常具有章節(jié)序號(hào),例如“第一章”、“第一回”、“第一節(jié)”、“第一集”、“第一卷”、“第一篇”等等,通常都具有表征章節(jié)含義的特殊字符“章”、“回”、“節(jié)”、“集”、“卷”、“篇”等等。以文章《三國(guó)演義》為例,《三國(guó)演義》的第一章的標(biāo)題(即文章章節(jié))為“第一回宴桃園豪杰三結(jié)義斬黃巾英雄首立功”,顯然章節(jié)序號(hào)“第一回”中具有特殊字符“回”。因此,預(yù)設(shè)字符
當(dāng)前第3頁(yè)1 2 3 4 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1