背景技術(shù):
電子出版涉及數(shù)字圖書館的發(fā)展和電子書籍、數(shù)字雜志的數(shù)字出版物。這些數(shù)字出版物可以由尋求傳達(dá)特定想法的作者創(chuàng)建。此外,這些數(shù)字出版物可以用作學(xué)生從事信息和/或想法交換的學(xué)習(xí)工具。
附圖說(shuō)明
在附圖中,相似的附圖標(biāo)號(hào)表示相似的組件或塊。以下詳細(xì)描述參考附圖,其中:
圖1是獲得數(shù)字內(nèi)容的多個(gè)區(qū)域以用于斷點(diǎn)識(shí)別的示例系統(tǒng)的框圖;
圖2a是在其中將由多個(gè)區(qū)域組成的數(shù)字內(nèi)容劃分成多個(gè)章節(jié)的示例斷點(diǎn)的框圖;
圖2b是圖示出根據(jù)針對(duì)彼此相鄰定位的多個(gè)區(qū)域產(chǎn)生的相關(guān)性值的示例斷點(diǎn)識(shí)別的圖表;
圖3a是圖示出數(shù)字內(nèi)容的多個(gè)區(qū)域之中的章節(jié)的示例斷點(diǎn)的圖;
圖3b是區(qū)域與其中該區(qū)域所屬章節(jié)和相鄰章節(jié)的中心平均值之間的相似度的示例可視化的圖;
圖4是獲得數(shù)字內(nèi)容的多個(gè)區(qū)域以用于基于相關(guān)性測(cè)量來(lái)識(shí)別數(shù)字內(nèi)容的多個(gè)區(qū)域之間的斷點(diǎn)的示例方法的流程圖;
圖5是基于所調(diào)整的相關(guān)性測(cè)量來(lái)修改數(shù)字內(nèi)容中所識(shí)別的斷點(diǎn)的示例方法的流程圖;
圖6是如果內(nèi)容長(zhǎng)度低于所確定的內(nèi)容最小長(zhǎng)度,則調(diào)整斷點(diǎn)的示例方法的流程圖;和
圖7是具有執(zhí)行機(jī)器可讀存儲(chǔ)介質(zhì)中的指令以用于基于相關(guān)性值和相似性值來(lái)修改所識(shí)別的斷點(diǎn)的處理器的示例計(jì)算設(shè)備的框圖。
具體實(shí)施方式
在數(shù)字出版中,作者或教師可以組織內(nèi)容以創(chuàng)建電子書籍或其他類型的文檔。在電子書籍創(chuàng)建期間的這種情況下,作者可以收集材料或內(nèi)容并且按照作者所期望的順序?qū)@些材料進(jìn)行組織;然而,作者可能難以決定如何以讀者可以在邏輯上跟隨并理解關(guān)鍵點(diǎn)的這種方式對(duì)這些材料或內(nèi)容進(jìn)行分割。例如,內(nèi)容的創(chuàng)建者可能難以確定在材料中的哪些點(diǎn)處來(lái)創(chuàng)建通過(guò)章節(jié)和/或部分的停止點(diǎn)和起始點(diǎn)。另外,作者可能手動(dòng)決定如何分割這些材料以在電子書籍中創(chuàng)建章節(jié),從而耗費(fèi)大量的時(shí)間和精力。手動(dòng)分割章節(jié)也可能在向讀者提供一致性以確保理解材料方面帶來(lái)困難。盡管在遍及本文檔中始終將術(shù)語(yǔ)章節(jié)用作內(nèi)容的主要?jiǎng)澐郑欢鴮?shí)現(xiàn)不應(yīng)受限制,因?yàn)檎鹿?jié)可以另外表示內(nèi)容的部分或其他類型的劃分。因此,在遍及本文檔中的術(shù)語(yǔ)章節(jié)和部分可以互換使用。
為了解決這些問(wèn)題,本文所公開的示例提供了用于從作者收集的內(nèi)容和/或材料使章節(jié)識(shí)別自動(dòng)化的機(jī)制。示例以作者收集的順序獲得數(shù)字內(nèi)容的多個(gè)區(qū)域。使用該順序,示例計(jì)算出該順序所提出的彼此相鄰定位的數(shù)字內(nèi)容的那些多個(gè)區(qū)域之間的相關(guān)性值。使用該相關(guān)性值,示例識(shí)別出數(shù)字內(nèi)容的多個(gè)區(qū)域之間的斷點(diǎn),同時(shí)保持作者收集的數(shù)字內(nèi)容的順序。斷點(diǎn)提供數(shù)字內(nèi)容的多個(gè)區(qū)域之間的中斷,從而在數(shù)字內(nèi)容中創(chuàng)建了劃分,這使章節(jié)識(shí)別自動(dòng)化。使數(shù)字內(nèi)容內(nèi)的章節(jié)的識(shí)別自動(dòng)化向作者提供了如何分割書籍或文檔中的數(shù)字內(nèi)容的建議。識(shí)別如何分割數(shù)字內(nèi)容為作者節(jié)省了大量的時(shí)間和精力。
另外,通過(guò)識(shí)別如何分割數(shù)字內(nèi)容,示例為讀者從邏輯上理解和領(lǐng)會(huì)內(nèi)容提供了更一致的分割。進(jìn)一步使數(shù)字內(nèi)容分割成章節(jié)自動(dòng)化提供了可以在搜索查詢中將其返回的內(nèi)容邏輯單元。通過(guò)返回與搜索請(qǐng)求最相關(guān)的邏輯單元(例如,章節(jié))而不是返回可能壓垮請(qǐng)求者的完整文檔,這給予內(nèi)容更多的上下文。
本文所討論的其他示例基于斷點(diǎn)識(shí)別來(lái)計(jì)算所調(diào)整的相關(guān)性值。針對(duì)與所識(shí)別的斷點(diǎn)相鄰的那些區(qū)域來(lái)計(jì)算所調(diào)整的相關(guān)性值。基于該所調(diào)整的相關(guān)性值,可以準(zhǔn)確地訪問(wèn)每個(gè)內(nèi)容區(qū)域以確定哪個(gè)章節(jié)更適合于包括那個(gè)區(qū)域。例如,所調(diào)整的相關(guān)性值可以確定是否應(yīng)該將特定區(qū)域合并到相鄰章節(jié)中。合并特定區(qū)域提供了對(duì)所識(shí)別的斷點(diǎn)的調(diào)整或修改以確保每章節(jié)都包括最合適的內(nèi)容。在該實(shí)現(xiàn)中,對(duì)內(nèi)容流進(jìn)行調(diào)整或修改,從而對(duì)斷點(diǎn)進(jìn)行修改,因此內(nèi)容中的中斷可以在內(nèi)容流中出現(xiàn)得更早或更晚。
然而,本文所討論的其它示例確定了數(shù)字內(nèi)容內(nèi)的總內(nèi)容量以及每章節(jié)中應(yīng)包括的最小內(nèi)容量。因此,如果基于所識(shí)別的斷點(diǎn)的所建議章節(jié)低于最小內(nèi)容量,則可以將所建議的章節(jié)合并或組合到相鄰章節(jié)中。合并章節(jié)避免了過(guò)小的章節(jié),從而向讀者提供附加的一致性。
因此,本文所公開的示例在正在創(chuàng)建的書籍中使章節(jié)識(shí)別自動(dòng)化。示例針對(duì)那些彼此相鄰定位的內(nèi)容或材料的區(qū)域計(jì)算出相關(guān)性值。通過(guò)計(jì)算相關(guān)性值,示例可以識(shí)別內(nèi)容或材料的那些區(qū)域之間的斷點(diǎn)。通過(guò)識(shí)別斷點(diǎn),示例在內(nèi)容和/或材料的區(qū)域之間創(chuàng)建了劃分分割,從而在數(shù)字內(nèi)容內(nèi)創(chuàng)建了章節(jié)。
現(xiàn)在參見(jiàn)附圖,圖1是示例系統(tǒng)102的框圖,該系統(tǒng)包括獲得數(shù)字內(nèi)容106的多個(gè)區(qū)域104的處理引擎108。處理引擎108處理多個(gè)區(qū)域104以用于相關(guān)性引擎110。相關(guān)性引擎110確定針對(duì)那些彼此相鄰定位的多個(gè)區(qū)域104的相關(guān)性值。在確定了相關(guān)性值時(shí),識(shí)別引擎112識(shí)別要在多個(gè)區(qū)域104之間插入的斷點(diǎn)114。在識(shí)別了斷點(diǎn)114時(shí),調(diào)整引擎116可以針對(duì)與所識(shí)別的斷點(diǎn)114相鄰定位的多個(gè)區(qū)域104中的每個(gè)區(qū)域來(lái)確定所調(diào)整的相關(guān)性值。因此,取決于所調(diào)整的相關(guān)性值,調(diào)整引擎116可產(chǎn)生所調(diào)整的斷點(diǎn)118。盡管系統(tǒng)102將引擎組件108、110、112和116描繪為彼此分離的組件,然而該描繪是為了說(shuō)明目的做出的,因?yàn)檫@些引擎組件108、110、112和116可以包括此類組件108、110、112和116的組合。
多個(gè)區(qū)域104是構(gòu)成數(shù)字內(nèi)容106的那些內(nèi)容塊。將數(shù)字內(nèi)容106視為這樣的內(nèi)容:其可以構(gòu)成用戶可能希望在其中插入至少一個(gè)斷點(diǎn)的文檔或電子書籍。斷點(diǎn)根據(jù)所計(jì)算的相關(guān)性值來(lái)提供在多個(gè)區(qū)域104之間的中斷。因此,斷點(diǎn)表示在其中對(duì)數(shù)字內(nèi)容106進(jìn)行劃分以創(chuàng)建多個(gè)章節(jié)的中斷。多個(gè)區(qū)域104是數(shù)字內(nèi)容106的子部分,其中,將斷點(diǎn)插入這些區(qū)域104之間以創(chuàng)建數(shù)字內(nèi)容106內(nèi)的章節(jié)。因此,通過(guò)舉例的方式,多個(gè)區(qū)域104可以包括文章頁(yè)面、段落、句子等。在一個(gè)實(shí)現(xiàn)中,用戶創(chuàng)建數(shù)字內(nèi)容106的多個(gè)區(qū)域104。在另一實(shí)現(xiàn)中,用戶創(chuàng)建數(shù)字內(nèi)容106的完整文檔。在本實(shí)現(xiàn)中,系統(tǒng)102獲得數(shù)字內(nèi)容106并且將該內(nèi)容分割成多個(gè)區(qū)域104。
處理引擎108獲得多個(gè)區(qū)域104以用于處理多個(gè)區(qū)域104中每個(gè)區(qū)域內(nèi)的內(nèi)容。處理引擎108可以包括處理多個(gè)區(qū)域104中的每個(gè)區(qū)域,以用于停止文本和/或詞干文本的移除。停止文本是在對(duì)多個(gè)區(qū)域104內(nèi)的內(nèi)容進(jìn)行處理之前和之后將其濾除的那些單詞或文本。停止單詞的示例可以包括但不限于該(the)、是(is)、在(at)、哪個(gè)(which)、在……上(on)等。詞干文本是在對(duì)多個(gè)區(qū)域104內(nèi)的內(nèi)容進(jìn)行處理之前和之后可能出現(xiàn)的將其縮減到單詞的詞根形式的那些單詞。處理引擎108可以包括實(shí)現(xiàn)處理引擎108的功能的電子電路(即,硬件)。在本示例中,通過(guò)舉例的方式,處理引擎108可以包括集成電路、應(yīng)用集成電路(asic)、控制器、處理器、半導(dǎo)體、處理資源、芯片組、半導(dǎo)體或其他類型的能夠?qū)崿F(xiàn)處理引擎108的功能的硬件組件??商鎿Q地,處理引擎108可以包括在由硬件組件(例如,處理器和/或控制器)執(zhí)行時(shí)來(lái)實(shí)現(xiàn)處理引擎108的功能的指令(例如,存儲(chǔ)在機(jī)器可讀介質(zhì)上)。
相關(guān)性引擎110針對(duì)多個(gè)區(qū)域104中彼此相鄰定位的每一對(duì)區(qū)域計(jì)算相關(guān)性值。例如,多個(gè)區(qū)域104中彼此相鄰定位的區(qū)域?qū)梢园ǎ簠^(qū)域1和區(qū)域2;區(qū)域2和區(qū)域3;區(qū)域n-1和區(qū)域n等。相關(guān)性值是這些相鄰區(qū)域104的這些區(qū)域?qū)χg的關(guān)聯(lián)內(nèi)容和/或相似內(nèi)容的測(cè)量值??梢允褂酶鞣N機(jī)制來(lái)計(jì)算相關(guān)性值,通過(guò)舉例的方式,這些機(jī)制包括pearson相關(guān)性、主題模型、bm25或其他類型的相關(guān)性度量。在稍后的附圖中詳細(xì)地解釋了相關(guān)性值。相關(guān)性引擎110在功能上可以類似于處理引擎108。因此,相關(guān)性引擎110的實(shí)現(xiàn)可以包括實(shí)現(xiàn)相關(guān)性引擎110的功能的電子電路(即,硬件)??商鎿Q地,相關(guān)性引擎110可以包括在硬件組件(例如,處理器和/或控制器)執(zhí)行時(shí)實(shí)現(xiàn)相關(guān)性引擎110的功能的指令(例如,存儲(chǔ)在機(jī)器可讀介質(zhì)上)。
識(shí)別引擎112使用相關(guān)性引擎110產(chǎn)生的相關(guān)性值來(lái)識(shí)別多個(gè)區(qū)域104之間的斷點(diǎn)114。在一個(gè)實(shí)現(xiàn)中,識(shí)別引擎112確定哪些相關(guān)性值是多個(gè)相關(guān)性值之中的較低值。在該實(shí)現(xiàn)中,假設(shè)屬于不同章節(jié)的相鄰多個(gè)區(qū)域104的區(qū)域?qū)Φ南嚓P(guān)性值將低于屬于同一章節(jié)中的相鄰多個(gè)區(qū)域104的區(qū)域?qū)?。該較低值指示與具有較高的計(jì)算相關(guān)性值的相鄰多個(gè)區(qū)域104的其他區(qū)域?qū)ο啾?,位于相鄰多個(gè)區(qū)域104的那個(gè)區(qū)域?qū)χ械膬?nèi)容較為不關(guān)聯(lián)和/或較為不相似。在另一實(shí)現(xiàn)中,如果相關(guān)性值低于特定閾值,則這可能指示在那些區(qū)域104之間插入斷點(diǎn)。識(shí)別引擎112在功能上可以類似于處理引擎108。因此,識(shí)別引擎112的實(shí)現(xiàn)可以包括實(shí)現(xiàn)識(shí)別引擎112的功能的電子電路(即,硬件)??商鎿Q地,識(shí)別引擎112可以包括在由硬件組件(例如,處理器和/或控制器)執(zhí)行時(shí)實(shí)現(xiàn)識(shí)別引擎112的功能的指令(例如,存儲(chǔ)在機(jī)器可讀介質(zhì)上)。
所識(shí)別的斷點(diǎn)114是多個(gè)區(qū)域104之間的中斷,其創(chuàng)建了數(shù)字內(nèi)容106內(nèi)的章節(jié)。因此,所識(shí)別的斷點(diǎn)114提供了來(lái)自相鄰章節(jié)之前的一個(gè)章節(jié)的停止點(diǎn)。所識(shí)別的斷點(diǎn)114是基于在引擎110處計(jì)算出的所計(jì)算的相關(guān)性值,其使得系統(tǒng)102能夠使數(shù)字內(nèi)容106內(nèi)的章節(jié)識(shí)別自動(dòng)化。在一個(gè)實(shí)現(xiàn)中,所識(shí)別的斷點(diǎn)114充當(dāng)初始或建議斷點(diǎn)。在該實(shí)現(xiàn)中,調(diào)整引擎116基于與初始斷點(diǎn)相鄰的每個(gè)區(qū)域104的位置來(lái)計(jì)算所調(diào)整的相關(guān)性值。這個(gè)所調(diào)整的相關(guān)性值使得調(diào)整引擎116能夠識(shí)別是應(yīng)該將特定區(qū)域合并到相鄰章節(jié)中還是應(yīng)該將其保留在其中它所屬的章節(jié)中。在該實(shí)現(xiàn)中,如果將特定區(qū)域排除和/或?qū)⑵浜喜⒌秸鹿?jié)之一中,則調(diào)整引擎116可進(jìn)一步調(diào)整初始斷點(diǎn)。
調(diào)整引擎116基于所識(shí)別的斷點(diǎn)114來(lái)計(jì)算所調(diào)整的相關(guān)性值。所調(diào)整的相關(guān)性值是針對(duì)與所識(shí)別的斷點(diǎn)114相鄰定位的區(qū)域104的那個(gè)值。在稍后的附圖中詳細(xì)地討論了所調(diào)整的相關(guān)性值。調(diào)節(jié)引擎116在功能上可以類似于處理引擎108。因此,調(diào)整引擎116的實(shí)現(xiàn)可以包括實(shí)現(xiàn)調(diào)整引擎116的功能的電子電路(即,硬件)??商鎿Q地,調(diào)整引擎116可以包括在由硬件組件(例如,處理器和/或控制器)執(zhí)行時(shí)實(shí)現(xiàn)調(diào)整引擎116的功能的指令(例如,存儲(chǔ)在機(jī)器可讀介質(zhì)上)。
所調(diào)整的斷點(diǎn)118是基于調(diào)整引擎116計(jì)算出的所調(diào)整的相關(guān)性值對(duì)所識(shí)別的斷點(diǎn)114的修改。在一個(gè)實(shí)現(xiàn)中,調(diào)整引擎116可以確定數(shù)字內(nèi)容106的總長(zhǎng)度和每一章節(jié)中應(yīng)該包括的內(nèi)容的最小量。因此,考慮到每個(gè)初始斷點(diǎn),調(diào)整引擎116可以確定每一章節(jié)是否滿足內(nèi)容的最小量。如果章節(jié)低于內(nèi)容的最小量,則可以將該章節(jié)合并到相鄰章節(jié)中,因此也調(diào)整了初始斷點(diǎn)以包括所合并的章節(jié)。在稍后的附圖中詳細(xì)地討論了這些實(shí)現(xiàn)。
圖2a是圖示出多個(gè)斷點(diǎn)206的框圖,其中,將由內(nèi)容的多個(gè)區(qū)域204組成的數(shù)字內(nèi)容劃分成多個(gè)章節(jié)208。斷點(diǎn)206之間的多個(gè)區(qū)域204組成每個(gè)相應(yīng)的章節(jié)208。例如,第一章節(jié)208(章節(jié)1)包括來(lái)自區(qū)域1到區(qū)域(i-1)的內(nèi)容204的區(qū)域。
如圖2a中所圖示,為了創(chuàng)建至少三個(gè)章節(jié)208(章節(jié)1、章節(jié)2和章節(jié)3),識(shí)別出兩個(gè)斷點(diǎn)206以用于分解內(nèi)容的多個(gè)區(qū)域204?;诒舜讼噜彾ㄎ坏亩鄠€(gè)區(qū)域204的那些區(qū)域?qū)χg的相關(guān)性值來(lái)識(shí)別斷點(diǎn)206。計(jì)算相關(guān)性值以確定多個(gè)區(qū)域204中的每個(gè)區(qū)域中的內(nèi)容彼此之間如何關(guān)聯(lián)。在識(shí)別各種斷點(diǎn)206之前計(jì)算相關(guān)性值。相反,將相關(guān)性值用于識(shí)別這些斷點(diǎn)206。例如,相鄰多個(gè)區(qū)域204的區(qū)域?qū)梢园ㄒ韵聝?nèi)容:區(qū)域1和區(qū)域2;區(qū)域2和區(qū)域3;區(qū)域i和區(qū)域(i+1);區(qū)域j和區(qū)域(j+1);以及區(qū)域(n-1)和區(qū)域n。通過(guò)舉例的方式,可以使用包括pearson相關(guān)性、主題模型、bm25或其他類型的相關(guān)度量的各種機(jī)制來(lái)計(jì)算相關(guān)性值。在另一實(shí)現(xiàn)中,基于用戶可能輸入數(shù)字內(nèi)容的次序來(lái)確定多個(gè)區(qū)域204的順序。在該實(shí)現(xiàn)中,對(duì)數(shù)字內(nèi)容進(jìn)行上傳的次序是多個(gè)區(qū)域204的次序或順序。在該實(shí)現(xiàn)中,根據(jù)其中輸入數(shù)字內(nèi)容的次序來(lái)設(shè)置多個(gè)區(qū)域204的次序。
圖2b是圖示出數(shù)字內(nèi)容的多個(gè)區(qū)域之間的多個(gè)斷點(diǎn)206的識(shí)別的圖表。基于相關(guān)性值210來(lái)識(shí)別多個(gè)斷點(diǎn)206。在圖表的x軸上觀察到的相關(guān)性值210是基于相鄰多個(gè)區(qū)域的區(qū)域?qū)χg的內(nèi)容的關(guān)聯(lián)性產(chǎn)生的值。在圖表的y軸上觀察到與多個(gè)區(qū)域204的位置相對(duì)應(yīng)的章節(jié)208。
如圖2b中所圖示,假設(shè)屬于不同章節(jié)208的相鄰多個(gè)區(qū)域204的區(qū)域?qū)Φ南嚓P(guān)性值低于屬于同一章節(jié)208中的相鄰多個(gè)區(qū)域204的區(qū)域?qū)?。在一個(gè)實(shí)現(xiàn)中,在為較低值的那些相關(guān)性值210之中標(biāo)識(shí)斷點(diǎn)206。例如,第一斷點(diǎn)206(斷點(diǎn)1)是區(qū)域1與區(qū)域(i+1)之間的相關(guān)性值210,其低于對(duì)應(yīng)于區(qū)域1和區(qū)域2的相關(guān)性值。相關(guān)性值210越低指示那些區(qū)域內(nèi)的內(nèi)容與其它區(qū)域相比其關(guān)聯(lián)性越小。在一個(gè)實(shí)現(xiàn)中,認(rèn)為這些斷點(diǎn)206是初始斷點(diǎn),其中,可以將斷點(diǎn)206修改成包括或排除特定的內(nèi)容區(qū)域。在該實(shí)現(xiàn)中,針對(duì)與初始斷點(diǎn)206相鄰定位的多個(gè)區(qū)域204中的每個(gè)區(qū)域計(jì)算所調(diào)整的相關(guān)性值。基于這個(gè)所調(diào)整的相關(guān)性值,可以調(diào)整初始斷點(diǎn)206以包括或排除特定的內(nèi)容區(qū)域。在稍后的附圖中詳細(xì)地解釋該實(shí)現(xiàn)。
圖3a是圖示出數(shù)字內(nèi)容的多個(gè)區(qū)域304之中的章節(jié)308的示例斷點(diǎn)306的圖。如圖3a中所圖示,第一斷點(diǎn)306(斷點(diǎn)1)位于內(nèi)容前一區(qū)域和區(qū)域304(區(qū)域p)之間。第二斷點(diǎn)306(斷點(diǎn)2)位于多個(gè)區(qū)域304(區(qū)域i)和(區(qū)域(i+1))之間。第三斷點(diǎn)306(斷點(diǎn)3)位于區(qū)域304(區(qū)域(q+1))和后續(xù)的多個(gè)區(qū)域之間。第一斷點(diǎn)306和第二斷點(diǎn)306之間的多個(gè)區(qū)域304組成章節(jié)308(章節(jié)a)中包括的內(nèi)容。第二斷點(diǎn)306和第三斷點(diǎn)306之間的多個(gè)區(qū)域304組成章節(jié)308(章節(jié)b)中包括的內(nèi)容。
當(dāng)各個(gè)區(qū)域304之間的相關(guān)性值為較低值并因此指示那些相鄰區(qū)域之間的內(nèi)容并不關(guān)聯(lián)時(shí)選擇每一個(gè)斷點(diǎn)306。相關(guān)性值的較低量使得能夠那些識(shí)別斷點(diǎn)306以用于不同章節(jié)308的自動(dòng)化。
在其他實(shí)現(xiàn)中,可以基于與每個(gè)斷點(diǎn)306相鄰的多個(gè)區(qū)域304中的每個(gè)區(qū)域來(lái)調(diào)整相關(guān)性值。例如,與斷點(diǎn)306相鄰的這些多個(gè)區(qū)域可以包括區(qū)域p、區(qū)域i、區(qū)域(i+1)和區(qū)域(q+1)。在另一個(gè)示例中,考慮包括區(qū)域i的章節(jié)308(章節(jié)a)和包括區(qū)域(i+1)的相鄰章節(jié)308(章節(jié)b)。在該示例中,相對(duì)于與相鄰或鄰近章節(jié)308(章節(jié)b)的關(guān)聯(lián),預(yù)期區(qū)域304(區(qū)域i)內(nèi)的內(nèi)容與章節(jié)308(章節(jié)a)內(nèi)的內(nèi)容更關(guān)聯(lián)。可能的是,相對(duì)于與其中區(qū)域304(區(qū)域i)所處的章節(jié)308(章節(jié)a)中的內(nèi)容的關(guān)聯(lián),區(qū)域304(區(qū)域i)內(nèi)的內(nèi)容與相鄰章節(jié)308(章節(jié)b)中的內(nèi)容更關(guān)聯(lián)。在這種情況下,結(jié)合圖3b確定了所調(diào)整的相關(guān)性值以驗(yàn)證區(qū)域304(區(qū)域i)與哪個(gè)章節(jié)308(章節(jié)a或章節(jié)b)更為密切關(guān)聯(lián)。
圖3b是區(qū)域304(區(qū)域i)與其中區(qū)域304所屬的章節(jié)308(章節(jié)a)和相鄰章節(jié)(章節(jié)b)的中心平均值之間的相似度的可視化的圖。圖3b表示這樣一種情況,其中相對(duì)于與其所處的章節(jié)(章節(jié)a)的關(guān)聯(lián),區(qū)域304內(nèi)的內(nèi)容與相鄰章節(jié)308(章節(jié)b)更密切關(guān)聯(lián)。因此,在這種情況下,將調(diào)整或修改如圖3a中的第二斷點(diǎn)306。
將區(qū)域304移動(dòng)更接近相鄰章節(jié)308(章節(jié)b),意味著該區(qū)域304與相鄰章節(jié)308的相似性可以相應(yīng)地增加或減少。此外,將區(qū)域304移動(dòng)到相鄰章節(jié)308中意味著相鄰章節(jié)308獲得附加區(qū)域304,而原始章節(jié)(章節(jié)a)失去內(nèi)容的該區(qū)域304。因此,等式1可用于測(cè)量區(qū)域304和章節(jié)308之間的相似性的函數(shù)變化。在等式1中,cold是其中區(qū)域304最初是其一部分的章節(jié)(章節(jié)a),并且cnew是要在其中移動(dòng)區(qū)域304的章節(jié)(章節(jié)b)。
δf1=sim(ri,cnew)-sim(ri,cold)等式(1)
下面的等式2用于測(cè)量所移動(dòng)的區(qū)域304和與第二斷點(diǎn)306相鄰的區(qū)域的相關(guān)性的變化。在等式2中,rx是在將區(qū)域304組合到相鄰章節(jié)308(章節(jié)b)之前跨初始第二斷點(diǎn)306的與區(qū)域304(ri)相鄰的內(nèi)容區(qū)域,而ry是在將區(qū)域304調(diào)整到相鄰章節(jié)308(章節(jié)b)中之后跨所調(diào)整的第二斷點(diǎn)306的與區(qū)域304相鄰的內(nèi)容區(qū)域。
δf2=corr(ri,ry)-corr(ri,rx)等式(2)
將來(lái)自這些方程的結(jié)果與不同的權(quán)重θ1和θ2相組合,其中,δf是如等式3中的總體效益。
δf=(θ1δf1)-(θ2δf2)等式(3)
在圖3b中,位于每個(gè)斷點(diǎn)306附近的多個(gè)區(qū)域304中的每個(gè)區(qū)域確定所調(diào)整的相關(guān)性值以用于選擇是否將多個(gè)區(qū)域304移動(dòng)到相鄰章節(jié)中。對(duì)于位于每個(gè)斷點(diǎn)306附近的多個(gè)區(qū)域304中的每個(gè)區(qū)域,基于總體效益來(lái)驗(yàn)證是否將該區(qū)域304組合到相鄰章節(jié)中。將該區(qū)域304組合到相鄰章節(jié)中相應(yīng)地修改了相鄰的斷點(diǎn)306。
圖4是可由計(jì)算設(shè)備執(zhí)行的用于基于相關(guān)性測(cè)量來(lái)識(shí)別斷點(diǎn)的示例方法的流程圖。計(jì)算設(shè)備獲得多個(gè)內(nèi)容區(qū)域,并進(jìn)行以確定相關(guān)性測(cè)量。相關(guān)性測(cè)量是表示彼此相鄰定位的區(qū)域之間的關(guān)聯(lián)性的值。計(jì)算設(shè)備使用相關(guān)性測(cè)量來(lái)識(shí)別數(shù)字內(nèi)容中的斷點(diǎn)。斷點(diǎn)表示數(shù)字內(nèi)容中的中斷之處,從而在數(shù)字內(nèi)容中創(chuàng)建劃分。識(shí)別數(shù)字內(nèi)容中的(一個(gè)或多個(gè))斷點(diǎn)提供了使數(shù)字內(nèi)容內(nèi)的(一個(gè)或多個(gè))章節(jié)自動(dòng)化的機(jī)制。在討論圖4的過(guò)程中,可以對(duì)圖1-圖3b中的組件進(jìn)行參考以提供上下文的示例。在圖4的一個(gè)實(shí)現(xiàn)中,如圖1中的系統(tǒng)102在計(jì)算設(shè)備上操作以執(zhí)行操作402-406。在該實(shí)現(xiàn)中,操作402-406可以在計(jì)算設(shè)備的后臺(tái)中操作以識(shí)別數(shù)字內(nèi)容中的斷點(diǎn)。此外,盡管將圖4描述為由計(jì)算設(shè)備來(lái)實(shí)現(xiàn),其可以在其他合適的組件上執(zhí)行。例如,圖4可以由控制器(未圖示)來(lái)實(shí)現(xiàn),和/或結(jié)合如圖7中的機(jī)器可讀存儲(chǔ)介質(zhì)704上的可執(zhí)行指令來(lái)實(shí)現(xiàn)。
在操作402處,計(jì)算設(shè)備獲得數(shù)字內(nèi)容的多個(gè)區(qū)域。在操作402處,用戶輸入數(shù)字內(nèi)容用于計(jì)算設(shè)備使數(shù)字內(nèi)容內(nèi)的(一個(gè)或多個(gè))章節(jié)自動(dòng)化。當(dāng)諸如作者之類的用戶上傳或掃描可以被轉(zhuǎn)換為機(jī)器可讀語(yǔ)言以用于處理的內(nèi)容時(shí),計(jì)算設(shè)備獲得數(shù)字內(nèi)容。例如,數(shù)字內(nèi)容可以包括由多個(gè)數(shù)字內(nèi)容塊組成的正在創(chuàng)建的書籍,可以將每個(gè)內(nèi)容塊視為數(shù)字內(nèi)容的區(qū)域,比如頁(yè)面、段落等。因此,作者生成這些內(nèi)容塊并將這些內(nèi)容塊鏈接在一起用于輸入以創(chuàng)建該書籍。繼而,計(jì)算設(shè)備可以獲得可能先前已分割成數(shù)字內(nèi)容的多個(gè)區(qū)域的內(nèi)容,或者計(jì)算設(shè)備將數(shù)字內(nèi)容分割成多個(gè)區(qū)域。每個(gè)區(qū)域可以在內(nèi)容中半關(guān)聯(lián),因此計(jì)算設(shè)備測(cè)量哪個(gè)內(nèi)容區(qū)域可能相對(duì)于其他內(nèi)容區(qū)域來(lái)說(shuō)更為關(guān)聯(lián)。因此,計(jì)算設(shè)備確定彼此相鄰次序定位的內(nèi)容區(qū)域的相關(guān)性測(cè)量。在另一實(shí)現(xiàn)中,在上傳數(shù)字內(nèi)容時(shí),用戶可以輸入其中用戶希望在其中劃分?jǐn)?shù)字內(nèi)容的多個(gè)斷點(diǎn)。與使用數(shù)字內(nèi)容的完整文檔截然相反,將數(shù)字內(nèi)容分割成多個(gè)區(qū)域,使得計(jì)算設(shè)備能夠更準(zhǔn)確地識(shí)別用于將數(shù)字內(nèi)容分割成(一個(gè)或多個(gè))章節(jié)的(一個(gè)或多個(gè))斷點(diǎn)。
在操作404處,計(jì)算設(shè)備確定彼此相鄰定位的多個(gè)區(qū)域的區(qū)域?qū)χg的相關(guān)性測(cè)量。根據(jù)如在操作402處如何輸入這些區(qū)域,按照次序獲得多個(gè)區(qū)域。相關(guān)性測(cè)量是所獲得的彼此相鄰定位的區(qū)域之間的關(guān)聯(lián)性的值。根據(jù)用戶如何輸入內(nèi)容對(duì)區(qū)域位置進(jìn)行排序。例如,用戶可以創(chuàng)建一本關(guān)于動(dòng)物園的書籍,并因此以諸如猴子、動(dòng)物園、熊、魚等的相繼次序?qū)?nèi)容塊上傳。因此,可以獲得下列之間的相關(guān)性測(cè)量:猴子和動(dòng)物園;動(dòng)物園和熊;熊和魚。在實(shí)現(xiàn)中,借助通過(guò)示例的方式包括pearson相關(guān)性、話題模型、bm25等的相關(guān)函數(shù)來(lái)獲得相關(guān)性測(cè)量。
在操作406處,計(jì)算設(shè)備基于在操作404的相關(guān)性測(cè)量來(lái)識(shí)別數(shù)字內(nèi)容中的斷點(diǎn)。斷點(diǎn)位于數(shù)字內(nèi)容的多個(gè)區(qū)域之間。斷點(diǎn)將數(shù)字內(nèi)容分?jǐn)喑啥鄠€(gè)章節(jié),因此可以將數(shù)字內(nèi)容的區(qū)域聚集在一起以在數(shù)字內(nèi)容中創(chuàng)建各個(gè)章節(jié)。根據(jù)輸入數(shù)字內(nèi)容的次序保持聚集在一起的多個(gè)區(qū)域的次序。在一個(gè)實(shí)現(xiàn)中,如果相關(guān)性測(cè)量低于特定閾值,則這種情況指示在數(shù)字內(nèi)容中應(yīng)該存在中斷。在另一實(shí)現(xiàn)中,計(jì)算設(shè)備確定多個(gè)相關(guān)性測(cè)量值,每個(gè)相關(guān)性測(cè)量對(duì)應(yīng)于彼此相鄰定位的多個(gè)區(qū)域的不同區(qū)域?qū)?。在該?shí)現(xiàn)中,根據(jù)較低的排序值對(duì)相關(guān)性測(cè)量值進(jìn)行排序。較低的排序值指示區(qū)域之間的關(guān)聯(lián)性較低,并由此指示斷點(diǎn)。在另一個(gè)實(shí)現(xiàn)中,斷點(diǎn)充當(dāng)可以調(diào)整的初始斷點(diǎn)。在稍后的附圖中詳細(xì)地討論該實(shí)現(xiàn)。
圖5是可由計(jì)算設(shè)備執(zhí)行的基于所調(diào)整的相關(guān)性測(cè)量來(lái)修改數(shù)字內(nèi)容中的所識(shí)別斷點(diǎn)的示例方法的流程圖。計(jì)算設(shè)備獲得數(shù)字內(nèi)容并將該內(nèi)容分割成多個(gè)區(qū)域。針對(duì)彼此相鄰定位的多個(gè)區(qū)域中的每一對(duì)確定相關(guān)性值。對(duì)這些相關(guān)性值進(jìn)行排序以確定哪些相關(guān)性值指示在數(shù)字內(nèi)容中應(yīng)該存在斷點(diǎn)。通過(guò)對(duì)相關(guān)性值進(jìn)行排序,計(jì)算設(shè)備識(shí)別數(shù)字內(nèi)容中的初始斷點(diǎn)。在識(shí)別初始斷點(diǎn)時(shí),計(jì)算設(shè)備獲得針對(duì)與初始斷點(diǎn)相鄰定位的多個(gè)區(qū)域中的每個(gè)區(qū)域的不同相關(guān)性值。計(jì)算設(shè)備可以基于不同的或調(diào)整的相關(guān)性值來(lái)進(jìn)行以修改初始斷點(diǎn)。在討論圖5的過(guò)程中,可以參考圖1-圖3b中的組件來(lái)提供上下文的示例。在圖5的一個(gè)實(shí)現(xiàn)中,如圖1中所示的系統(tǒng)102在計(jì)算設(shè)備上操作以執(zhí)行操作502-518。在該實(shí)現(xiàn)中,操作502-518可以在計(jì)算設(shè)備的后臺(tái)中操作以識(shí)別數(shù)字內(nèi)容中的斷點(diǎn)。此外,盡管將圖5描述為由計(jì)算設(shè)備來(lái)實(shí)現(xiàn),然而它可以在其他合適的組件上實(shí)現(xiàn)。例如,圖5可以由控制器(未圖示)來(lái)實(shí)現(xiàn),和/或與如圖7中的機(jī)器可讀存儲(chǔ)介質(zhì)704上的可執(zhí)行指令結(jié)合來(lái)實(shí)現(xiàn)。
在操作502處,計(jì)算設(shè)備獲得數(shù)字內(nèi)容的多個(gè)區(qū)域。在一個(gè)實(shí)現(xiàn)中,如在操作504,用戶輸入數(shù)字內(nèi)容的文檔,計(jì)算設(shè)備將該數(shù)字內(nèi)容的文檔分割成多個(gè)區(qū)域。操作502在功能上可以類似于如圖4中的操作402。
在操作504處,計(jì)算設(shè)備將數(shù)字內(nèi)容分割成多個(gè)區(qū)域。在在操作502處獲得數(shù)字內(nèi)容時(shí),計(jì)算設(shè)備可將該內(nèi)容分割成區(qū)域或部分。在操作504處,將數(shù)字內(nèi)容分?jǐn)喑捎糜谔幚淼臄?shù)字內(nèi)容的子部分或區(qū)域。將數(shù)字內(nèi)容分割成多個(gè)區(qū)域使得計(jì)算設(shè)備能夠在操作506-510處確定那些彼此相鄰的區(qū)域?qū)χg的相關(guān)性測(cè)量。
在操作506處,計(jì)算設(shè)備確定彼此相鄰的多個(gè)區(qū)域的那些區(qū)域?qū)χg的相關(guān)性測(cè)量。相關(guān)性測(cè)量用于確定相鄰的多個(gè)區(qū)域彼此之間有多關(guān)聯(lián)。較多的關(guān)聯(lián)向計(jì)算設(shè)備指示那些多個(gè)區(qū)域應(yīng)該位于同一章節(jié)內(nèi)。較少的關(guān)聯(lián)向計(jì)算設(shè)備指示在那些多個(gè)區(qū)域之間插入斷點(diǎn),從而創(chuàng)建章節(jié)。在一個(gè)實(shí)現(xiàn)中,計(jì)算設(shè)備進(jìn)行到操作508-510以確定相關(guān)性測(cè)量。操作506在功能上可以類似于如圖4中的操作404。
在操作508處,計(jì)算設(shè)備確定針對(duì)彼此相鄰定位的多個(gè)區(qū)域中每對(duì)區(qū)域的相關(guān)性值。每個(gè)相關(guān)性值對(duì)應(yīng)于多個(gè)區(qū)域的不同區(qū)域?qū)?,從而產(chǎn)生計(jì)算設(shè)備可以在操作510處進(jìn)行排序的多個(gè)相關(guān)性值。
在操作510處,計(jì)算設(shè)備對(duì)針對(duì)彼此相鄰定位的多個(gè)區(qū)域中的每個(gè)區(qū)域?qū)Λ@得的每個(gè)相關(guān)性值進(jìn)行排序。在一個(gè)實(shí)現(xiàn)中,相關(guān)性值根據(jù)那些低于特定閾值的值來(lái)進(jìn)行排序。在另一實(shí)現(xiàn)中,相關(guān)性值按升序到降序來(lái)排序。在這些實(shí)現(xiàn)中,相關(guān)性值的量越小指示相鄰區(qū)域之間的內(nèi)容的關(guān)聯(lián)越小。內(nèi)容的相鄰區(qū)域之間的關(guān)聯(lián)性越小向計(jì)算設(shè)備指示在內(nèi)容的那些相鄰區(qū)域之間應(yīng)該存在斷點(diǎn)。
在操作512處,計(jì)算設(shè)備識(shí)別數(shù)字內(nèi)容中的斷點(diǎn)。在一個(gè)實(shí)現(xiàn)中,計(jì)算設(shè)備根據(jù)預(yù)定的章節(jié)數(shù)和/或預(yù)定的斷點(diǎn)數(shù)來(lái)識(shí)別多個(gè)斷點(diǎn)。在該實(shí)現(xiàn)中,可以由用戶來(lái)定義章節(jié)數(shù)和/或斷點(diǎn)數(shù)。另外,使用相關(guān)性值指示多個(gè)區(qū)域?qū)Ρ舜酥g有多關(guān)聯(lián)的度量使得計(jì)算設(shè)備能夠識(shí)別斷點(diǎn)。操作512在功能上可以類似于如圖4中的操作406。
在操作514,計(jì)算設(shè)備根據(jù)其中上傳數(shù)字內(nèi)容的次序或順序來(lái)維持多個(gè)區(qū)域的順序。
在操作516處,在操作512處識(shí)別斷點(diǎn)時(shí),計(jì)算設(shè)備確定所調(diào)整的相關(guān)性測(cè)量。所調(diào)整的相關(guān)性測(cè)量值是針對(duì)與所識(shí)別的斷點(diǎn)相鄰的多個(gè)區(qū)域中每個(gè)區(qū)域的關(guān)聯(lián)性的值。關(guān)聯(lián)性的值指示是將該區(qū)域與相鄰的章節(jié)或部分組合,還是將該多個(gè)區(qū)域保留為初始章節(jié)的一部分?;谶@個(gè)值,計(jì)算設(shè)備可以在操作518處對(duì)斷點(diǎn)進(jìn)行修改。
在操作518處,計(jì)算設(shè)備基于在操作516處所調(diào)整的相關(guān)性測(cè)量來(lái)修改所識(shí)別的斷點(diǎn)。在該實(shí)現(xiàn)中,如果所調(diào)整的相關(guān)性測(cè)量指示內(nèi)容區(qū)域和內(nèi)容相鄰章節(jié)之間有較高的關(guān)聯(lián)性,則將該區(qū)域作為該章節(jié)的一部分合并到相鄰章節(jié)。將特定區(qū)域合并或組合到相鄰章節(jié)中調(diào)整相鄰章節(jié)以包括該特定區(qū)域。這修改了所識(shí)別的斷點(diǎn)以增加該相鄰章節(jié)中的內(nèi)容。
圖6是可由計(jì)算設(shè)備執(zhí)行以如果內(nèi)容長(zhǎng)度低于所確定的內(nèi)容的最小長(zhǎng)度則調(diào)整斷點(diǎn)的方法的流程圖。計(jì)算設(shè)備獲得數(shù)字內(nèi)容的多個(gè)區(qū)域,并且確定彼此相鄰定位的多個(gè)區(qū)域的那些區(qū)域?qū)χg的相關(guān)性值。在確定了針對(duì)相鄰多個(gè)區(qū)域的相關(guān)性值時(shí),計(jì)算設(shè)備將斷點(diǎn)識(shí)別為數(shù)字內(nèi)容內(nèi)的初始斷點(diǎn)。將斷點(diǎn)認(rèn)為是內(nèi)容的區(qū)域之間的中斷,因此在章節(jié)和/或部分中將最相關(guān)的內(nèi)容聚集在一起。如圖6中所圖示,計(jì)算設(shè)備可以進(jìn)行以確定數(shù)字內(nèi)容的總長(zhǎng)度,并且因此可以確定該章節(jié)應(yīng)包括的內(nèi)容的最小長(zhǎng)度。在確定最小長(zhǎng)度時(shí),計(jì)算設(shè)備可以識(shí)別由所識(shí)別的斷點(diǎn)創(chuàng)建的章節(jié)是否低于最小長(zhǎng)度。如果計(jì)算設(shè)備確定該章節(jié)低于內(nèi)容的最小長(zhǎng)度,則計(jì)算設(shè)備可以進(jìn)行將該章節(jié)組合到相鄰章節(jié)中。組合這些章節(jié)調(diào)整或修改斷點(diǎn),因此數(shù)字中的中斷可能出現(xiàn)得更早或更晚。在討論圖6的過(guò)程中,可以參考圖1-圖3b中的組件以提供上下文的示例。在圖6的一個(gè)實(shí)現(xiàn)中,如圖1中的系統(tǒng)102在計(jì)算設(shè)備上操作以執(zhí)行操作602-616。在該實(shí)現(xiàn)中,操作602-616可以在計(jì)算設(shè)備的后臺(tái)下操作以識(shí)別數(shù)字內(nèi)容中的斷點(diǎn)。此外,盡管將圖6描述為由計(jì)算設(shè)備來(lái)實(shí)現(xiàn),它可以在其他合適的組件上執(zhí)行。例如,圖6可以由控制器(未圖示)來(lái)實(shí)現(xiàn),和/或結(jié)合圖7中的機(jī)器可讀存儲(chǔ)介質(zhì)704上的可執(zhí)行指令來(lái)實(shí)現(xiàn)。
在操作602處,計(jì)算設(shè)備可以獲得數(shù)字內(nèi)容的多個(gè)區(qū)域。操作602在功能上可以類似于如圖4到圖5中的操作402和502。
在操作604處,計(jì)算設(shè)備確定在數(shù)字內(nèi)容中彼此相鄰定位的那些多個(gè)區(qū)域的(一個(gè)或多個(gè))區(qū)域?qū)χg的相關(guān)性測(cè)量。操作604在功能上可以類似于如圖4到圖5中的操作404和506。
在操作606處,計(jì)算設(shè)備識(shí)別數(shù)字內(nèi)容中的初始斷點(diǎn)。操作606在功能上可以類似于如圖4到圖5中的操作406和512。
在操作608處,計(jì)算設(shè)備確定在操作602處獲得的數(shù)字內(nèi)容的總長(zhǎng)度。數(shù)字內(nèi)容的總長(zhǎng)度用于確定每章節(jié)中內(nèi)容的最小長(zhǎng)度。
在操作610處,計(jì)算設(shè)備確定每章節(jié)中應(yīng)包括的內(nèi)容的最小長(zhǎng)度。確定最小長(zhǎng)度確保章節(jié)的內(nèi)容不會(huì)過(guò)小。
在操作612處,計(jì)算設(shè)備確定與初始斷點(diǎn)相鄰的章節(jié)中包括的內(nèi)容的實(shí)際長(zhǎng)度或量。在操作616處,如果內(nèi)容的長(zhǎng)度低于最小內(nèi)容量,則計(jì)算設(shè)備將該章節(jié)合并到相鄰章節(jié)中,從而調(diào)整斷點(diǎn)。如果計(jì)算設(shè)備確定章節(jié)的長(zhǎng)度不低于最小內(nèi)容量,則計(jì)算設(shè)備進(jìn)行到操作614,并且不調(diào)整斷點(diǎn)。
在操作614處,在確定該章節(jié)中的內(nèi)容的實(shí)際長(zhǎng)度不低于在操作610處識(shí)別的最小長(zhǎng)度時(shí),計(jì)算設(shè)備不調(diào)整斷點(diǎn)??商鎿Q地,在確定內(nèi)容的實(shí)際長(zhǎng)度等于或高于內(nèi)容的最小長(zhǎng)度時(shí),計(jì)算設(shè)備可以將在操作606處識(shí)別的初始斷點(diǎn)保持為用于分離數(shù)字內(nèi)容的斷點(diǎn)。
在操作616處,在確定該章節(jié)低于內(nèi)容的最小長(zhǎng)度時(shí),計(jì)算設(shè)備可以調(diào)整斷點(diǎn)以將該章節(jié)組合到相鄰章節(jié)中。將章節(jié)合并到相鄰章節(jié)中也會(huì)修改斷點(diǎn),因此斷點(diǎn)在數(shù)字內(nèi)容中來(lái)得更早或更晚。
圖7是具有執(zhí)行機(jī)器可讀存儲(chǔ)介質(zhì)704內(nèi)的指令706-724的處理器702的計(jì)算設(shè)備700的框圖。具體地,具有處理器702的計(jì)算設(shè)備700基于相關(guān)性值和相似性值來(lái)修改所識(shí)別的斷點(diǎn)。盡管計(jì)算設(shè)備700包括處理器702和機(jī)器可讀存儲(chǔ)介質(zhì)704,但是其還可以包括適合于本領(lǐng)域技術(shù)人員的其它組件。例如,計(jì)算設(shè)備700可以包括圖1中的引擎102。計(jì)算設(shè)備700是具有能夠執(zhí)行指令706-724的處理器702的電子設(shè)備,并且因此計(jì)算設(shè)備700的實(shí)施例包括計(jì)算設(shè)備、移動(dòng)設(shè)備、客戶端設(shè)備、個(gè)人計(jì)算機(jī)、臺(tái)式計(jì)算機(jī)、膝上型計(jì)算機(jī)、平板電腦、視頻游戲控制臺(tái)或能夠執(zhí)行指令706-724的其他類型的電子設(shè)備??梢詫⒅噶?06-724實(shí)現(xiàn)為如在存儲(chǔ)介質(zhì)704上存儲(chǔ)的機(jī)器可讀指令實(shí)現(xiàn)的方法、功能、操作和其他處理,存儲(chǔ)介質(zhì)704可以是非暫時(shí)的,比如硬件存儲(chǔ)設(shè)備(例如,隨機(jī)存取存儲(chǔ)器ram)、只讀存儲(chǔ)器(rom)、可擦除可編程rom、電可擦除rom、硬盤驅(qū)動(dòng)器和閃存)。
處理器702可以基于相關(guān)性值和相似性值來(lái)獲取、解碼和執(zhí)行指令706-724以修改所識(shí)別的斷點(diǎn)。在一個(gè)實(shí)現(xiàn)中,在執(zhí)行指令706-710時(shí),處理器702可以通過(guò)執(zhí)行指令714來(lái)執(zhí)行指令712。在另一實(shí)現(xiàn)中,在執(zhí)行指令706-714時(shí),處理器702可以在執(zhí)行指令724之前進(jìn)行執(zhí)行指令716-722。具體地,處理器702執(zhí)行指令706-714以:以諸如上傳和/或輸入數(shù)字內(nèi)容的順序來(lái)接收數(shù)字內(nèi)容;將數(shù)字內(nèi)容分割成多個(gè)區(qū)域;針對(duì)彼此相鄰定位的多個(gè)區(qū)域?qū)?lái)確定相關(guān)性值;基于相關(guān)性值識(shí)別初始斷點(diǎn);以及對(duì)多個(gè)相關(guān)性值之中的相關(guān)性值進(jìn)行排序,每個(gè)相關(guān)性值對(duì)應(yīng)于以彼此相鄰的方式定位的多個(gè)區(qū)域的不同對(duì)。處理器702可以進(jìn)行執(zhí)行以執(zhí)行指令716-724以:針對(duì)與斷點(diǎn)相鄰的多個(gè)區(qū)域中的每個(gè)區(qū)域來(lái)確定所調(diào)整的相關(guān)性值;通過(guò)獲得章節(jié)或部分中包括的數(shù)字內(nèi)容的中心平均值,并且通過(guò)確定與斷點(diǎn)鄰近的區(qū)域的距離是否更接近其中它所屬章節(jié)或相鄰章節(jié)中的中心平均值,確定相似性值;以及基于所調(diào)整的相關(guān)性值和相似性值來(lái)修改所識(shí)別的斷點(diǎn)。
機(jī)器可讀存儲(chǔ)介質(zhì)704包括用于處理器702獲取、解碼和執(zhí)行的指令706-724。在另一個(gè)實(shí)施例中,機(jī)器可讀存儲(chǔ)介質(zhì)704可以是包括或存儲(chǔ)可執(zhí)行指令的電、磁、光、存儲(chǔ)器、儲(chǔ)存器、閃存驅(qū)動(dòng)器或其他物理設(shè)備。因此,機(jī)器可讀存儲(chǔ)介質(zhì)704例如可以包括隨機(jī)存取存儲(chǔ)器(ram)、電可擦除可編程只讀存儲(chǔ)器(eeprom)、存儲(chǔ)驅(qū)動(dòng)器、存儲(chǔ)器高速緩存、網(wǎng)絡(luò)存儲(chǔ)器、只讀光盤存儲(chǔ)器(cdrom)等。因此,機(jī)器可讀存儲(chǔ)介質(zhì)704可以包括應(yīng)用和/或固件,其可以獨(dú)立地和/或與處理器702結(jié)合使用來(lái)獲取、解碼和/或執(zhí)行機(jī)器可讀存儲(chǔ)介質(zhì)704的指令。應(yīng)用和/或固件可以存儲(chǔ)在機(jī)器可讀存儲(chǔ)介質(zhì)704上和/或存儲(chǔ)在計(jì)算設(shè)備700的另一位置上。