一種語(yǔ)音播放紙質(zhì)書籍內(nèi)容的方法及裝置制造方法
【專利摘要】本發(fā)明公開(kāi)了一種語(yǔ)音播放紙質(zhì)書籍內(nèi)容的方法及裝置。該方法包括:獲取圖像序列;判斷圖像序列是否與書籍?dāng)[放動(dòng)作或書籍翻頁(yè)動(dòng)作相適配;如果判斷圖像序列與書籍?dāng)[放動(dòng)作相適配,提取并識(shí)別圖像序列中圖像的封面特征信息,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的書名內(nèi)容;在書名內(nèi)容查找成功的情況下,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于書名內(nèi)容的語(yǔ)音;如果判斷圖像序列與書籍翻頁(yè)動(dòng)作相適配,提取并識(shí)別圖像序列中圖像的頁(yè)面特征信息,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的頁(yè)面內(nèi)容;在頁(yè)面內(nèi)容查找成功的情況下,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于頁(yè)面內(nèi)容的語(yǔ)音。本發(fā)明提出的技術(shù)方案能夠降低紙質(zhì)書籍內(nèi)容播放之時(shí)所需用戶操作的復(fù)雜度,縮短啟動(dòng)播放的時(shí)間。
【專利說(shuō)明】一種語(yǔ)音播放紙質(zhì)書籍內(nèi)容的方法及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明實(shí)施例涉及計(jì)算機(jī)【技術(shù)領(lǐng)域】,尤其涉及一種語(yǔ)音播放紙質(zhì)書籍內(nèi)容的方法及裝置。
【背景技術(shù)】
[0002]紙質(zhì)書籍作為兒童一種主要的獲取知識(shí)的工具,在其學(xué)習(xí)成長(zhǎng)的過(guò)程當(dāng)中扮演著舉足輕重的地位。兒童通過(guò)閱讀此類書籍可以幫助自己了解世界、增長(zhǎng)見(jiàn)識(shí)。但是,對(duì)于認(rèn)字不準(zhǔn)確或者完全不識(shí)字的兒童而言,由于其自身能力的局限性,無(wú)法閱讀故事較為復(fù)雜的文字類書籍,從而大大降低了其閱讀興趣。
[0003]學(xué)習(xí)機(jī)實(shí)現(xiàn)了筆點(diǎn)課本上文字內(nèi)容的語(yǔ)音播放,為兒童的學(xué)習(xí)帶來(lái)了極大的幫助。但是,現(xiàn)有的學(xué)習(xí)機(jī)通常需要用戶預(yù)先在該學(xué)習(xí)機(jī)上進(jìn)行書籍和頁(yè)碼選擇操作,并通過(guò)使用所配備的點(diǎn)讀筆實(shí)現(xiàn)書籍上對(duì)應(yīng)頁(yè)碼中目標(biāo)位置的定位,進(jìn)而以語(yǔ)音形式播放該目標(biāo)位置處的內(nèi)容。此種語(yǔ)音播放技術(shù)對(duì)于兒童而言,其操作復(fù)雜,難度較大。
【發(fā)明內(nèi)容】
[0004]本發(fā)明提供一種語(yǔ)音播放紙質(zhì)書籍內(nèi)容的方法及裝置,以降低紙質(zhì)書籍內(nèi)容播放之時(shí)所需用戶操作的復(fù)雜度,縮短啟動(dòng)播放的時(shí)間。
[0005]第一方面,本發(fā)明實(shí)施例提供了一種語(yǔ)音播放紙質(zhì)書籍內(nèi)容的方法,該方法包括:
[0006]獲取圖像序列;
[0007]判斷所述圖像序列是否與書籍?dāng)[放動(dòng)作或書籍翻頁(yè)動(dòng)作相適配;
[0008]如果判斷所述圖像序列與書籍?dāng)[放動(dòng)作相適配,提取并識(shí)別所述圖像序列中圖像的封面特征信息,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的書名內(nèi)容;在所述書名內(nèi)容查找成功的情況下,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述書名內(nèi)容的語(yǔ)音;
[0009]如果判斷所述圖像序列與書籍翻頁(yè)動(dòng)作相適配,提取并識(shí)別所述圖像序列中圖像的頁(yè)面特征信息,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的頁(yè)面內(nèi)容;在所述頁(yè)面內(nèi)容查找成功的情況下,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述頁(yè)面內(nèi)容的語(yǔ)音。
[0010]第二方面,本發(fā)明實(shí)施例還提供了一種語(yǔ)音播放紙質(zhì)書籍內(nèi)容的裝置,該裝置包括:
[0011]圖像獲取單元,用于獲取圖像序列;
[0012]動(dòng)作判斷單元,用于判斷所述圖像序列是否與書籍?dāng)[放動(dòng)作或書籍翻頁(yè)動(dòng)作相適配;
[0013]書名語(yǔ)音播放單元,用于當(dāng)所述動(dòng)作判斷單元判斷所述圖像序列與書籍?dāng)[放動(dòng)作相適配時(shí),提取并識(shí)別所述圖像序列中圖像的封面特征信息,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的書名內(nèi)容;在所述書名內(nèi)容查找成功的情況下,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述書名內(nèi)容的語(yǔ)音;[0014]頁(yè)面語(yǔ)音播放單元,用于當(dāng)所述動(dòng)作判斷單元判斷所述圖像序列與書籍翻頁(yè)動(dòng)作相適配,提取并識(shí)別所述圖像序列中圖像的頁(yè)面特征信息,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的頁(yè)面內(nèi)容;在所述頁(yè)面內(nèi)容查找成功的情況下,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述頁(yè)面內(nèi)容的語(yǔ)音。
[0015]本發(fā)明提出的技術(shù)方案能夠降低播放紙質(zhì)書籍內(nèi)容所需的用戶操作的復(fù)雜度,縮短啟動(dòng)播放的時(shí)間,從而延長(zhǎng)了電池的續(xù)航能力。
【專利附圖】
【附圖說(shuō)明】
[0016]圖1是本發(fā)明實(shí)施例一提供的一種語(yǔ)音播放紙質(zhì)書籍內(nèi)容的方法的流程示意圖;
[0017]圖2是本發(fā)明實(shí)施例二提供的一種語(yǔ)音播放紙質(zhì)書籍內(nèi)容的方法的流程示意圖;
[0018]圖3是本發(fā)明實(shí)施例三提供的一種語(yǔ)音播放紙質(zhì)書籍內(nèi)容的裝置的結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0019]下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明??梢岳斫獾氖?,此處所描述的具體實(shí)施例僅僅用于解釋本發(fā)明,而非對(duì)本發(fā)明的限定。另外還需要說(shuō)明的是,為了便于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部結(jié)構(gòu)。
[0020]實(shí)施例一
[0021]圖1是本發(fā)明實(shí)施例一提供的一種語(yǔ)音播放紙質(zhì)書籍內(nèi)容的方法的流程示意圖,該方法可以由語(yǔ)音播放紙質(zhì)書籍內(nèi)容的裝置來(lái)執(zhí)行,所述裝置可以是學(xué)習(xí)機(jī)、智能手機(jī)、平板電腦、個(gè)人數(shù)字助理或者其他任何一種具有處理器、存儲(chǔ)器和揚(yáng)聲器的電子設(shè)備。參見(jiàn)圖1,該語(yǔ)音播放紙質(zhì)書籍內(nèi)容的方法具體包括如下步驟:
[0022]110、獲取圖像序列。
[0023]在本實(shí)施例中,語(yǔ)音播放紙質(zhì)書籍內(nèi)容的裝置可控制攝像頭每隔固定時(shí)間捕捉一次圖像,得到預(yù)設(shè)時(shí)間長(zhǎng)度上或預(yù)設(shè)捕捉次數(shù)下的圖像序列。其中,攝像頭可內(nèi)嵌于語(yǔ)音播放紙質(zhì)書籍內(nèi)容的裝置中,也可獨(dú)立于所述裝置而被置備。所述固定時(shí)間、預(yù)設(shè)時(shí)間長(zhǎng)度或捕捉次數(shù)可以根據(jù)不同的應(yīng)用場(chǎng)景進(jìn)行設(shè)定,也可在所述裝置出廠時(shí)被設(shè)定為固定值,例如設(shè)定固定時(shí)間為0.5秒,預(yù)設(shè)時(shí)間長(zhǎng)度為5秒,或者預(yù)設(shè)捕捉次數(shù)為10次。
[0024]120、判斷圖像序列是否與書籍?dāng)[放動(dòng)作或書籍翻頁(yè)動(dòng)作相適配。
[0025]在本實(shí)施例中,考慮到用戶將書籍從其他地方擺放到攝像頭的掃描范圍之內(nèi)或者在攝像頭的掃描范圍之內(nèi)進(jìn)行翻頁(yè)的過(guò)程中,攝像頭所采集到的一些圖像之間會(huì)存在較大差別,語(yǔ)音播放紙質(zhì)書籍內(nèi)容的裝置可通過(guò)對(duì)圖像序列中相鄰幀的圖像進(jìn)行比對(duì),根據(jù)比對(duì)結(jié)果來(lái)判斷圖像序列是否與書籍?dāng)[放動(dòng)作或書籍翻頁(yè)動(dòng)作相適配。
[0026]在本實(shí)施例的一個(gè)具體的實(shí)施方式中,所判斷的過(guò)程為:將圖像序列中每相鄰的兩幀圖像作差值運(yùn)算,得到差值圖像集;計(jì)算差值圖像集中各差值圖像的信息熵;根據(jù)所計(jì)算得到的各信息熵中是否存在大于設(shè)定閾值的信息熵,來(lái)判斷圖像序列是否與書籍?dāng)[放動(dòng)作或者書籍翻頁(yè)動(dòng)作相適配。
[0027]當(dāng)然,本領(lǐng)域的普通技術(shù)人員應(yīng)理解,其判斷過(guò)程還可以通過(guò)其它方式來(lái)實(shí)現(xiàn)。
[0028]例如,判斷圖像序列是否與書籍?dāng)[放動(dòng)作相適配可具體為:將圖像序列中的各張圖像與預(yù)設(shè)的背景圖作相似度運(yùn)算,根據(jù)所計(jì)算得到的相似度結(jié)果中是否存在大于設(shè)定閾值的相似度,來(lái)判斷圖像序列是否與書籍?dāng)[放動(dòng)作相適配;
[0029]例如,判斷圖像序列是否與書籍翻頁(yè)動(dòng)作相適配可具體為:將圖像序列中相隔預(yù)設(shè)數(shù)量幀的圖像作相似度運(yùn)算,根據(jù)所計(jì)算得到的相似度結(jié)果中是否存在大于設(shè)定閾值的相似度,來(lái)判斷圖像序列是否與書籍翻頁(yè)動(dòng)作相適配。
[0030]130、如果判斷圖像序列與書籍?dāng)[放動(dòng)作相適配,提取并識(shí)別圖像序列中圖像的封面特征信息,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的書名內(nèi)容。
[0031]當(dāng)判斷圖像序列與書籍?dāng)[放動(dòng)作相適配時(shí),語(yǔ)音播放紙質(zhì)書籍內(nèi)容的裝置可先從圖像序列中查找拍攝時(shí)間距離當(dāng)前時(shí)間最近的圖像,并提取所查找到的圖像的封面特征信息(例如線條和色塊);然后,將所提取的封面特征信息與預(yù)先存儲(chǔ)的封面特征信息進(jìn)行相似度計(jì)算,根據(jù)計(jì)算結(jié)果得到識(shí)別結(jié)果;進(jìn)而,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的書名內(nèi)容。
[0032]140、在書名內(nèi)容查找成功的情況下,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述書名內(nèi)容的語(yǔ)
曰?
[0033]150、如果判斷圖像序列與書籍翻頁(yè)動(dòng)作相適配,提取并識(shí)別圖像序列中圖像的頁(yè)面特征信息,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的頁(yè)面內(nèi)容。
[0034]當(dāng)判斷圖像序列與書籍翻頁(yè)動(dòng)作相適配時(shí),語(yǔ)音播放紙質(zhì)書籍內(nèi)容的裝置可先從圖像序列中查找拍攝時(shí)間距離當(dāng)前時(shí)間最近的圖像,并提取所查找到的圖像的頁(yè)面特征信息;然后,將所提取的頁(yè)面特征信息與預(yù)先存儲(chǔ)的頁(yè)面特征信息進(jìn)行相似度計(jì)算,根據(jù)計(jì)算結(jié)果得到識(shí)別結(jié)果;進(jìn)而,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的頁(yè)面內(nèi)容。
[0035]160、在頁(yè)面內(nèi)容查找成功的情況下,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述頁(yè)面內(nèi)容的語(yǔ)
曰?
[0036]在本實(shí)施例中,發(fā)音模塊存儲(chǔ)了預(yù)設(shè)字庫(kù)中各漢字或者英文單詞所對(duì)應(yīng)的語(yǔ)音信號(hào)。語(yǔ)音播放紙質(zhì)書籍內(nèi)容的裝置可首先向發(fā)音模塊發(fā)送包含有發(fā)音內(nèi)容(例如書名內(nèi)容或頁(yè)面內(nèi)容)的控制指令,發(fā)音模塊根據(jù)該控制指令查找對(duì)應(yīng)于發(fā)音內(nèi)容的語(yǔ)音信號(hào),然后將該語(yǔ)音信號(hào)通過(guò)揚(yáng)聲器進(jìn)行發(fā)音。
[0037]本實(shí)施例提出的技術(shù)方案,無(wú)需用戶預(yù)先在學(xué)習(xí)機(jī)上進(jìn)行書籍和頁(yè)碼選擇操作,而只要用戶將書籍?dāng)[放在學(xué)習(xí)機(jī)上的圖像采集裝置能捕捉到的地方,并通過(guò)翻頁(yè)動(dòng)作就能夠?qū)崿F(xiàn)紙質(zhì)書籍內(nèi)容的語(yǔ)音播放,能夠降低播放紙質(zhì)書籍內(nèi)容所需的用戶操作的復(fù)雜度,縮短啟動(dòng)播放的時(shí)間,從而延長(zhǎng)了電池的續(xù)航能力。
[0038]實(shí)施例二
[0039]圖2是本發(fā)明實(shí)施例二提供的一種語(yǔ)音播放紙質(zhì)書籍內(nèi)容的方法的流程示意圖。本實(shí)施例在實(shí)施例一的基礎(chǔ)上,提供一優(yōu)選實(shí)施例。參見(jiàn)圖2,該語(yǔ)音播放紙質(zhì)書籍內(nèi)容的方法具體包括如下步驟:
[0040]200、獲取第一圖像序列;
[0041]210、判斷第一圖像序列是否與書籍?dāng)[放動(dòng)作相適配,如果是,則執(zhí)行步驟220,否則執(zhí)行返回步驟200 ; [0042]220、提取并識(shí)別第一圖像序列中圖像的封面特征信息,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的書名內(nèi)容;
[0043]230、如果書名內(nèi)容查找成功,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述書名內(nèi)容的語(yǔ)音,執(zhí)行步驟250 ;
[0044]240、如果書名內(nèi)容查找失敗,通過(guò)發(fā)音模塊發(fā)出失敗提示音,執(zhí)行步驟250 ;
[0045]250、獲取第二圖像序列;
[0046]260、判斷第二圖像序列是否與書籍翻頁(yè)動(dòng)作相適配,如果是,則執(zhí)行步驟270,否則返回執(zhí)行步驟250 ;
[0047]270、提取并識(shí)別第二圖像序列中圖像的頁(yè)面特征信息,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的頁(yè)面內(nèi)容;
[0048]280、如果頁(yè)面內(nèi)容查找成功,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述頁(yè)面內(nèi)容的語(yǔ)音;
[0049]290、如果頁(yè)面內(nèi)容查找失敗,對(duì)第二圖像序列中的圖像進(jìn)行文字識(shí)別,得到所述圖像所包含的文字信息,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述文字信息的語(yǔ)音。
[0050]實(shí)施例三
[0051]圖3是本發(fā)明實(shí)施例二提供的一種語(yǔ)音播放紙質(zhì)書籍內(nèi)容的裝置的結(jié)構(gòu)示意圖。參見(jiàn)圖3,該裝置的具體結(jié)構(gòu)如下:
[0052]圖像獲取單元310,用于獲取圖像序列;
[0053]動(dòng)作判斷單元320,用于判斷所述圖像序列是否與書籍?dāng)[放動(dòng)作或書籍翻頁(yè)動(dòng)作相適配;
[0054]書名語(yǔ)音播放單元330,用于當(dāng)所述動(dòng)作判斷單元判斷所述圖像序列與書籍?dāng)[放動(dòng)作相適配時(shí),提取并識(shí)別所述圖像序列中圖像的封面特征信息,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的書名內(nèi)容;在所述書名內(nèi)容查找成功的情況下,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述書名內(nèi)容的語(yǔ)首;
[0055]頁(yè)面語(yǔ)音播放單元340,用于當(dāng)所述動(dòng)作判斷單元判斷所述圖像序列與書籍翻頁(yè)動(dòng)作相適配,提取并識(shí)別所述圖像序列中圖像的頁(yè)面特征信息,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的頁(yè)面內(nèi)容;在所述頁(yè)面內(nèi)容查找成功的情況下,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述頁(yè)面內(nèi)容的語(yǔ)音。
[0056]進(jìn)一步的,所述圖像獲取單元310,具體用于:
[0057]控制攝像頭每隔固定時(shí)間捕捉一次圖像,得到預(yù)設(shè)時(shí)間長(zhǎng)度上或預(yù)設(shè)捕捉次數(shù)下的圖像序列。
[0058]所述書名語(yǔ)音播放單元330,具體用于:從所述圖像序列中查找拍攝時(shí)間距離當(dāng)前時(shí)間最近的圖像,并提取所查找到的圖像的封面特征信息;將所提取的封面特征信息,與預(yù)先存儲(chǔ)的封面特征信息進(jìn)行相似度計(jì)算,根據(jù)計(jì)算結(jié)果得到識(shí)別結(jié)果;或
[0059]所述頁(yè)面語(yǔ)音播放單元340,具體用于:從所述圖像序列中查找拍攝時(shí)間距離當(dāng)前時(shí)間最近的圖像,并提取所查找到的圖像的頁(yè)面特征信息;將所提取的頁(yè)面特征信息,與預(yù)先存儲(chǔ)的所有的頁(yè)面特征信息進(jìn)行相似度計(jì)算,根據(jù)計(jì)算結(jié)果得到識(shí)別結(jié)果。
[0060]進(jìn)一步的,所述動(dòng)作判斷單元320,具體用于:
[0061]對(duì)所述圖像序列中相鄰幀的圖像進(jìn)行比對(duì),根據(jù)所述比對(duì)結(jié)果判斷所述圖像序列是否與書籍?dāng)[放動(dòng)作或書籍翻頁(yè)動(dòng)作相適配。
[0062]進(jìn)一步的,語(yǔ)音播放紙質(zhì)書籍內(nèi)容的裝置還包括:
[0063]第一失敗處理單元(未示出),用于在所述書名內(nèi)容查找失敗的情況下,通過(guò)發(fā)音模塊發(fā)出失敗提示音;[0064]第二失敗處理單元(未示出),用于在所述頁(yè)面內(nèi)容查找失敗的情況下,對(duì)所述圖像序列中的圖像進(jìn)行文字識(shí)別,得到所述圖像所包含的文字信息,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述文字信息的語(yǔ)音。
[0065]上述產(chǎn)品可執(zhí)行本發(fā)明任意實(shí)施例所提供的方法,具備執(zhí)行方法相應(yīng)的功能模塊和有益效果。
[0066]注意,上述僅為本發(fā)明的較佳實(shí)施例及所運(yùn)用技術(shù)原理。本領(lǐng)域技術(shù)人員會(huì)理解,本發(fā)明不限于這里所述的特定實(shí)施例,對(duì)本領(lǐng)域技術(shù)人員來(lái)說(shuō)能夠進(jìn)行各種明顯的變化、重新調(diào)整和替代而不會(huì)脫離本發(fā)明的保護(hù)范圍。因此,雖然通過(guò)以上實(shí)施例對(duì)本發(fā)明進(jìn)行了較為詳細(xì)的說(shuō)明,但是本發(fā)明不僅僅限于以上實(shí)施例,在不脫離本發(fā)明構(gòu)思的情況下,還可以包括更多其他等效實(shí)施例,而本發(fā)明的范圍由所附的權(quán)利要求范圍決定。
【權(quán)利要求】
1.一種語(yǔ)音播放紙質(zhì)書籍內(nèi)容的方法,其特征在于,包括: 獲取圖像序列; 判斷所述圖像序列是否與書籍?dāng)[放動(dòng)作或書籍翻頁(yè)動(dòng)作相適配; 如果判斷所述圖像序列與書籍?dāng)[放動(dòng)作相適配,提取并識(shí)別所述圖像序列中圖像的封面特征信息,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的書名內(nèi)容;在所述書名內(nèi)容查找成功的情況下,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述書名內(nèi)容的語(yǔ)音; 如果判斷所述圖像序列與書籍翻頁(yè)動(dòng)作相適配,提取并識(shí)別所述圖像序列中圖像的頁(yè)面特征信息,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的頁(yè)面內(nèi)容;在所述頁(yè)面內(nèi)容查找成功的情況下,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述頁(yè)面內(nèi)容的語(yǔ)音。
2.根據(jù)權(quán)利要求1所述的語(yǔ)音播放紙質(zhì)書籍內(nèi)容的方法,其特征在于,所述獲取圖像序列,包括: 控制攝像頭每隔固定時(shí)間捕捉一次圖像,得到預(yù)設(shè)時(shí)間長(zhǎng)度上或預(yù)設(shè)捕捉次數(shù)下的圖像序列。
3.根據(jù)權(quán)利要求1所述的語(yǔ)音播放紙質(zhì)書籍內(nèi)容的方法,其特征在于,所述提取并識(shí)別所述圖像序列中圖像的封面特征信息或頁(yè)面特征信息,包括: 從所述圖像序列中查找拍攝時(shí)間距離當(dāng)前時(shí)間最近的圖像,并提取所查找到的圖像的封面特征信息或頁(yè)面特征信息; 將所提取的封面特征信息或頁(yè)面特征信息,與預(yù)先存儲(chǔ)的封面特征信息或頁(yè)面特征信息進(jìn)行相似度計(jì)算,根據(jù)計(jì)算結(jié)果得到識(shí)別結(jié)果。
4.根據(jù)權(quán)利要求1所述的語(yǔ)音播`放紙質(zhì)書籍內(nèi)容的方法,其特征在于,所述判斷所述圖像序列是否與書籍?dāng)[放動(dòng)作或書籍翻頁(yè)動(dòng)作相適配,包括: 對(duì)所述圖像序列中相鄰幀的圖像進(jìn)行比對(duì),根據(jù)所述比對(duì)結(jié)果判斷所述圖像序列是否與書籍?dāng)[放動(dòng)作或書籍翻頁(yè)動(dòng)作相適配。
5.根據(jù)權(quán)利要求1所述的語(yǔ)音播放紙質(zhì)書籍內(nèi)容的方法,其特征在于,還包括: 在所述書名內(nèi)容查找失敗的情況下,通過(guò)發(fā)音模塊發(fā)出失敗提示音; 在所述頁(yè)面內(nèi)容查找失敗的情況下,對(duì)所述圖像序列中的圖像進(jìn)行文字識(shí)別,得到所述圖像所包含的文字信息,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述文字信息的語(yǔ)音。
6.一種語(yǔ)音播放紙質(zhì)書籍內(nèi)容的裝置,其特征在于,包括: 圖像獲取單元,用于獲取圖像序列;動(dòng)作判斷單元,用于判斷所述圖像序列是否與書籍?dāng)[放動(dòng)作或書籍翻頁(yè)動(dòng)作相適配;書名語(yǔ)音播放單元,用于當(dāng)所述動(dòng)作判斷單元判斷所述圖像序列與書籍?dāng)[放動(dòng)作相適配時(shí),提取并識(shí)別所述圖像序列中圖像的封面特征信息,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的書名內(nèi)容;在所述書名內(nèi)容查找成功的情況下,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述書名內(nèi)容的語(yǔ)音; 頁(yè)面語(yǔ)音播放單元,用于當(dāng)所述動(dòng)作判斷單元判斷所述圖像序列與書籍翻頁(yè)動(dòng)作相適配,提取并識(shí)別所述圖像序列中圖像的頁(yè)面特征信息,從數(shù)據(jù)庫(kù)中查找與識(shí)別結(jié)果相匹配的頁(yè)面內(nèi)容;在所述頁(yè)面內(nèi)容查找成功的情況下,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述頁(yè)面內(nèi)容的語(yǔ)音。
7.根據(jù)權(quán)利要求6所述的語(yǔ)音播放紙質(zhì)書籍內(nèi)容的裝置,其特征在于,所述圖像獲取單元,具體用于: 控制攝像頭每隔固定時(shí)間捕捉一次圖像,得到預(yù)設(shè)時(shí)間長(zhǎng)度上或預(yù)設(shè)捕捉次數(shù)下的圖像序列。
8.根據(jù)權(quán)利要求6所述的語(yǔ)音播放紙質(zhì)書籍內(nèi)容的裝置,其特征在于, 所述書名語(yǔ)音播放單元,具體用于:從所述圖像序列中查找拍攝時(shí)間距離當(dāng)前時(shí)間最近的圖像,并提取所查找到的圖像的封面特征信息;將所提取的封面特征信息,與預(yù)先存儲(chǔ)的封面特征信息進(jìn)行相似度計(jì)算,根據(jù)計(jì)算結(jié)果得到識(shí)別結(jié)果;或 所述頁(yè)面語(yǔ)音播放單元,具體用于:從所述圖像序列中查找拍攝時(shí)間距離當(dāng)前時(shí)間最近的圖像,并提取所查找到的圖像的頁(yè)面特征信息;將所提取的頁(yè)面特征信息,與預(yù)先存儲(chǔ)的所有的頁(yè)面特征信息進(jìn)行相似度計(jì)算,根據(jù)計(jì)算結(jié)果得到識(shí)別結(jié)果。
9.根據(jù)權(quán)利要求6所述的語(yǔ)音播放紙質(zhì)書籍內(nèi)容的裝置,其特征在于,所述動(dòng)作判斷單元,具體用于: 對(duì)所述圖像序列中相鄰幀的 圖像進(jìn)行比對(duì),根據(jù)所述比對(duì)結(jié)果判斷所述圖像序列是否與書籍?dāng)[放動(dòng)作或書籍翻頁(yè)動(dòng)作相適配。
10.根據(jù)權(quán)利要求6所述的語(yǔ)音播放紙質(zhì)書籍內(nèi)容的裝置,其特征在于,還包括: 第一失敗處理單元,用于在所述書名內(nèi)容查找失敗的情況下,通過(guò)發(fā)音模塊發(fā)出失敗提不首; 第二失敗處理單元,用于在所述頁(yè)面內(nèi)容查找失敗的情況下,對(duì)所述圖像序列中的圖像進(jìn)行文字識(shí)別,得到所述圖像所包含的文字信息,通過(guò)發(fā)音模塊發(fā)出對(duì)應(yīng)于所述文字信息的語(yǔ)音。
【文檔編號(hào)】G06F17/30GK103761892SQ201410025898
【公開(kāi)日】2014年4月30日 申請(qǐng)日期:2014年1月20日 優(yōu)先權(quán)日:2014年1月20日
【發(fā)明者】簡(jiǎn)文杰, 秦偉 申請(qǐng)人:廣東小天才科技有限公司