設(shè)備”可以是便攜式、可運輸、安裝在交通工具(航空、海運和/或陸地)中的,或者適合于和/或配置為在本地運行,和/或以分布形式,運行在地球和/或空間的任何其他位置運行。這里所使用的“終端”、“終端設(shè)備”還可以是通信終端、上網(wǎng)終端、音樂/視頻播放終端,例如可以是PDA、MID(Mobile Internet Device,移動互聯(lián)網(wǎng)設(shè)備)和/或具有音樂/視頻播放功能的移動電話,也可以是智能電視、機(jī)頂盒等設(shè)備。
[0065]本技術(shù)領(lǐng)域技術(shù)人員可以理解,這里所使用的遠(yuǎn)端網(wǎng)絡(luò)設(shè)備,其包括但不限于計算機(jī)、網(wǎng)絡(luò)主機(jī)、單個網(wǎng)絡(luò)服務(wù)器、多個網(wǎng)絡(luò)服務(wù)器集或多個服務(wù)器構(gòu)成的云。在此,云由基于云計算(Cloud Computing)的大量計算機(jī)或網(wǎng)絡(luò)服務(wù)器構(gòu)成,其中,云計算是分布式計算的一種,由一群松散耦合的計算機(jī)集組成的一個超級虛擬計算機(jī)。本發(fā)明的實施例中,遠(yuǎn)端網(wǎng)絡(luò)設(shè)備、終端設(shè)備與WNS服務(wù)器之間可通過任何通信方式實現(xiàn)通信,包括但不限于,基于3GPP、LTE、WIMAX的移動通信、基于TCP/IP、UDP協(xié)議的計算機(jī)網(wǎng)絡(luò)通信以及基于藍(lán)牙、紅外傳輸標(biāo)準(zhǔn)的近距無線傳輸方式。
[0066]針對傳統(tǒng)電子書閱讀器或在線閱讀電子書存在的缺陷,以下提供一種解決該缺陷的智能車載終端觸發(fā)系統(tǒng)和方法。
[0067]圖1為一個實施例的文章章節(jié)生成方法流程圖。
[0068]—種文章章節(jié)生成方法,包括如下步驟:
[0069]步驟S100:根據(jù)文章的用戶指定內(nèi)容而獲得文章。
[0070]用戶指定內(nèi)容可以包括文章的關(guān)鍵詞,通過搜索引擎搜索關(guān)鍵詞而獲取文章。例如,當(dāng)應(yīng)用于在線閱讀時,可以提供用戶界面給用戶進(jìn)行輸入,獲取用戶輸入的內(nèi)容后,以用戶輸入的內(nèi)容作為關(guān)鍵詞,通過搜索引擎在互聯(lián)網(wǎng)搜索關(guān)鍵詞,并將搜索的相關(guān)的文章鏈接向用戶顯示;當(dāng)用戶選擇了其中的文章鏈接后,將與該文章鏈接相對應(yīng)的文章獲取。
[0071]用戶指定內(nèi)容可以包括文章的存儲路徑,通過讀取存儲路徑所指向的文件而獲取文章。例如,當(dāng)應(yīng)用于電子書閱讀器時,用戶可以事先下載好文章存儲到存儲介質(zhì),電子書閱讀器可以通過用戶操作得到文章的存儲路徑,然后通過存儲路徑獲取文章。當(dāng)然,存儲介質(zhì)可以是本地存儲介質(zhì),也可以是遠(yuǎn)端存儲介質(zhì);下載好的文章既可以存儲于本地存儲介質(zhì),也可以存儲于遠(yuǎn)端存儲介質(zhì),例如云端存儲空間。
[0072]所述的文章可以理解為文檔,是具有載體的。文章的載體可以為TXT、D0C、PDF,HTM、HTML、EPUB、CHM等等格式的文件。獲取文章可以理解為獲取文件。
[0073]步驟S110:遍歷文章的文本數(shù)據(jù),提取其中具有章節(jié)特征的綱目內(nèi)容。
[0074]遍歷文章的文本數(shù)據(jù)的過程,可以按照文本數(shù)據(jù)順序依次提取文本數(shù)據(jù)中具有章節(jié)特征的綱目內(nèi)容。文本數(shù)據(jù)順序可以理解為文本數(shù)據(jù)的前后的排列順序。將文本數(shù)據(jù)從頭到尾進(jìn)行搜索,發(fā)現(xiàn)符合章節(jié)特征的綱目內(nèi)容時,就將該綱目內(nèi)容復(fù)制提取出來。
[0075]章節(jié)特征可以設(shè)置為:相鄰兩個標(biāo)識符之間的字符數(shù)滿足預(yù)設(shè)條件。標(biāo)記符通常是用于區(qū)分不同的段落,也即在相鄰的兩個標(biāo)記符之間,通常為一段的自然段落。這種標(biāo)記符,可以是段落符和斷行符中的一種。當(dāng)然,根據(jù)不同的電子書文檔格式,標(biāo)記符的表達(dá)可能不一樣,只要用于區(qū)分不同段落的字符都可以理解為所述標(biāo)記符?;ヂ?lián)網(wǎng)上大部分的電子書,通常文章的文本數(shù)據(jù)中都有文章章節(jié),只是由于很多電子書是直接從網(wǎng)站抓取,然后抓取形成電子書,這類電子書通常是沒有文章目錄的。然而,這類電子書的文本數(shù)據(jù)中有文章章節(jié),而通常這些文章章節(jié)都具備章節(jié)特征,例如這些文章章節(jié)通常自起一段,以與文章正文內(nèi)容區(qū)分開。因此,文章章節(jié)通常存在于相鄰的兩個標(biāo)記符之間,具有章節(jié)特征的綱目內(nèi)容為相鄰兩個標(biāo)識符之間的字符。
[0076]文章章節(jié)通常自起一段,而且具有字?jǐn)?shù)較少的特征。畢竟,如果是文章正文內(nèi)容,通常一段的文本字?jǐn)?shù)大部分都不會存在字?jǐn)?shù)較少的特征。以文章《三國演義》為例,《三國演義》的第一章的標(biāo)題(即文章章節(jié))為“第一回宴桃園豪杰三結(jié)義斬黃巾英雄首立功”,標(biāo)題里加上空格字符總共21個字符,然而在《三國演義》通篇文本正文內(nèi)容中,并沒有一個非文章章節(jié)的自然段落中的字符數(shù)會少于21的。因此,可以通過判斷相鄰兩個標(biāo)識符之間的字符數(shù)滿足預(yù)設(shè)條件來初步判斷是否為文章章節(jié)。
[0077]所述預(yù)設(shè)條件可以包括:字符數(shù)大于0且少于預(yù)設(shè)數(shù)值。預(yù)設(shè)數(shù)值可以通過用戶自行設(shè)定,畢竟用戶了解了文章內(nèi)容后,可以判斷文章章節(jié)的字符數(shù)范圍。繼續(xù)以文章《三國演義》為例,用戶了解文章內(nèi)容后可以將預(yù)設(shè)數(shù)值設(shè)為22。因此,在步驟S100和步驟S110之間,可以包括一個提供用戶設(shè)置預(yù)設(shè)數(shù)值的步驟。
[0078]通過步驟S110后,可以提取到多組綱目內(nèi)容。
[0079]步驟S120:按序組織綱目內(nèi)容以建立文章的章節(jié)列表,建立章節(jié)列表到對應(yīng)的章節(jié)內(nèi)容之間的索引關(guān)系。
[0080]將提取到的多組綱目內(nèi)容(相鄰兩個標(biāo)識符之間的字符)按預(yù)設(shè)的排列規(guī)則組織排列,并形成由多組綱目內(nèi)容組成的章節(jié)列表。預(yù)設(shè)的排列規(guī)則可以是文章的文本數(shù)據(jù)順序。
[0081]按序組織綱目內(nèi)容以建立文章的章節(jié)列表可以包括步驟S121?步驟S123。圖2為一個實施例按序組織綱目內(nèi)容以建立文章的章節(jié)列表流程圖。
[0082]步驟S121:提取相鄰兩個標(biāo)識符之間的字符作為候選章節(jié)。即首先將提取到的具有章節(jié)特征的綱目內(nèi)容(相鄰兩個標(biāo)識符之間的字符)都作為候選章節(jié)。
[0083]步驟S122:得到多個候選章節(jié)。具有章節(jié)特征的多組綱目內(nèi)容提取出來后得到多個候選章節(jié)。
[0084]步驟S123:從多個候選章節(jié)中得到多個章節(jié),并按照預(yù)設(shè)的排列規(guī)則排列多個章節(jié)以建立章節(jié)列表。
[0085]在一些電子書中,由于所抓取的網(wǎng)站編輯的原因,通常會在文章中添加一些并非文章本身內(nèi)容的字符或字符串。例如,可能會添加“TXT下載”、“無彈窗”、“全文閱讀”、“免費閱讀”等字符或字符串,有些還會添加類似于廣告的字符,例如“XX小說網(wǎng)”。
[0086]因此,如果電子書的內(nèi)容中沒有這類并非文章本身內(nèi)容的字符,則通常從候選章節(jié)中可以直接得到最后所需的章節(jié),然后按照預(yù)設(shè)的排列規(guī)則排列多個章節(jié)以建立章節(jié)列表。
[0087]然而,如果電子書的內(nèi)容中存在這類并非文章本身內(nèi)容的字符,則需要通過從多個候選章節(jié)中按照預(yù)設(shè)的篩選規(guī)則得到多個章節(jié)。畢竟,僅僅通過上述的章節(jié)特征(相鄰兩個標(biāo)識符之間的字符數(shù)滿足預(yù)設(shè)條件)而提取的綱目內(nèi)容可能還存在大量的非文章章節(jié)的內(nèi)容。
[0088]預(yù)設(shè)的篩選規(guī)則可以是第一篩選規(guī)則:保留具有數(shù)字字符的候選章節(jié)。文章章節(jié)通常具有章節(jié)序號,例如“第一章”、“第一回”、“第一節(jié)”、“第一集”、“第一卷”、“第一篇”等等,通常都具有表征章節(jié)序號的數(shù)字字符。以文章《三國演義》為例,《三國演義》的第一章的標(biāo)題(即文章章節(jié))為“第一回宴桃園豪杰三結(jié)義斬黃巾英雄首立功”,顯然章節(jié)序號“第一回”中具有數(shù)字字符“一”。因此,當(dāng)候選章節(jié)中具有數(shù)字字符的,可以保留下來,然后可以再從具有數(shù)字字符的候選章節(jié)中得到最后所需的章節(jié)。
[0089]預(yù)設(shè)的篩選規(guī)則還可以是第二篩選規(guī)則:保留具有預(yù)設(shè)字符的候選章節(jié)。文章章節(jié)通常具有章節(jié)序號,例如“第一章”、“第一回”、“第一節(jié)”、“第一集”、“第一卷”、“第一篇”等等,通常都具有表征章節(jié)含義的特殊字符“章”、“回”、“節(jié)”、“集”、“卷”、“篇”等等。以文章《三國演義》為例,《三國演義》的第一章的標(biāo)題(即文章章節(jié))為“第一回宴桃園豪杰三結(jié)義斬黃巾英雄首立功”,顯然章節(jié)序號“第一回”中具有特殊字符“回”。因此,預(yù)設(shè)字符可以設(shè)置為“章”、“回”、“節(jié)”、“集”、“卷”、“篇”等等字符,當(dāng)候選章節(jié)中具有預(yù)設(shè)字符的,可以保留下來,然后可以再從具有預(yù)設(shè)字符的候選章節(jié)中得到最后所需的章節(jié)。
[0090]當(dāng)然,預(yù)設(shè)字符也可以通過用戶自行設(shè)定,畢竟用戶了解了文章內(nèi)容后,可以判斷文章章節(jié)中的特殊字符。繼續(xù)以文章《三國演義》為例,用戶了解文章內(nèi)容后可以將預(yù)設(shè)字符設(shè)為“回”。因此,在步驟S100和步驟S110之間,還可以包括一個提供用戶設(shè)置預(yù)設(shè)字符的步驟。
[0091]預(yù)設(shè)的篩選規(guī)則還可以是第三篩選規(guī)則:刪除候選章節(jié)為預(yù)設(shè)字符串的候選章節(jié)。上面已經(jīng)分析,在一些電子書中,由于所抓取的網(wǎng)站編輯的原因,通常會在文章中添加一些并非文章本身內(nèi)容的字符或字符串。例如,可能會添加“TXT下載”、“無彈窗”、“全文閱讀”、“免費閱讀”等字符,有些還會添加類似于廣告的字符或字符串,例如“XX小說網(wǎng)”。因此,如果通過提取具有章節(jié)特征的綱目內(nèi)容僅僅是這些字符或字符串,可以刪除之。因此,預(yù)設(shè)字符串可以設(shè)置為“TXT下載”、“無彈窗”、“全文閱讀”、“免費閱讀”、“XX小說網(wǎng)”等等。
[0092]當(dāng)然,上述預(yù)設(shè)字符串也可以通過用戶自行設(shè)定,畢竟用戶了解了文章內(nèi)容后,可以判斷文章章節(jié)中的并非文章本身內(nèi)容的字符串。繼續(xù)以文章《三國演義》為例,假設(shè)文章中添加了有“XX小說網(wǎng)”,用戶了解文章內(nèi)容后可以將預(yù)設(shè)字符串設(shè)為“XX小說網(wǎng)”。因此,在步驟S100和步驟S110之間,還可以包括一個提供用戶設(shè)置預(yù)設(shè)字符串的步驟。
[0093]預(yù)設(shè)的篩選規(guī)則可以是包含上述第一篩選規(guī)則、第二篩選規(guī)則和第三篩選規(guī)則中的至少一種。可以包含第一篩選規(guī)則、第二篩選規(guī)則和第三篩選規(guī)則中的任意組合。例如,預(yù)設(shè)的篩選規(guī)則包含上述第一篩選規(guī)則、第二篩選規(guī)則和第三篩選規(guī)則。首先,將候選章節(jié)通過第一篩選規(guī)則篩選,保留具有數(shù)字字符的候選章節(jié),保留下來的候選章節(jié)形成第一候選章節(jié)。然后,將第一候選章節(jié)通過第二篩選規(guī)則篩選,保留具有預(yù)設(shè)字符的候選章節(jié)形成第二候選章節(jié)。最后,將第二候選章