專利名稱:用于評價理解文件的難度的系統(tǒng)和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于評價理解文件的難度程度的系統(tǒng)和方法。尤其是,本發(fā)明涉及一種用于評價通過從屏幕讀取器輸出的聲音對文件中每頁內(nèi)容進(jìn)行理解的難度的系統(tǒng)。
背景技術(shù):
近年來,人們使用屏幕讀取器(文本到語音讀取系統(tǒng))目的是視力弱的人可以通過聽聲音來理解文本數(shù)據(jù)。屏幕讀取器將文件中的文本數(shù)據(jù)轉(zhuǎn)換成音頻數(shù)據(jù),并為用戶輸出該音頻數(shù)據(jù)。因此,用戶通過聽該音頻數(shù)據(jù)而不用看屏幕就可以理解文件的內(nèi)容。然而,即使使用屏幕讀取器,也很難理解包括向量圖形的文件的內(nèi)容。
下面將給出關(guān)于理解向量圖形的內(nèi)容的技術(shù)。有一種傳統(tǒng)的屏幕讀取器以Z順序朗讀包括在頁面中的顯示對象(或它們的替代文本)(參見非專利文獻(xiàn)1和2)。Z順序是在多個顯示對象被相互重疊地顯示的情況下該多個顯示對象的重疊順序的排序。對于一個視力正常的人來說,就像在被指定了較低優(yōu)先級的顯示對象之前顯示被指定了較高優(yōu)先級的顯示對象。通過使用這個技術(shù),可以確定朗讀顯示對象的某種順序。但是,即使當(dāng)按照Z順序朗讀頁面上的顯示對象時,總還是不能從總體上輕易地理解該頁面。
此外,還有一些已提出的技術(shù),它們通過在文件上執(zhí)行圖像處理來分析文件的結(jié)構(gòu)(參見專利文獻(xiàn)1和2)。利用該技術(shù),可以將通過使用復(fù)雜結(jié)構(gòu)和例如灰度的色彩信息表示的文件轉(zhuǎn)換成音頻數(shù)據(jù)。然而,這些技術(shù)不能廣泛應(yīng)用于普通文件,因為這些技術(shù)只可以應(yīng)用于具有特定的規(guī)則結(jié)構(gòu)的文件。
此外,有一種技術(shù),該技術(shù)對應(yīng)于屏幕上顯示對象的顯示位置產(chǎn)生音域(參見專利文獻(xiàn)3)。利用這個技術(shù),對應(yīng)于文字大小和字體類型可以生成具有音質(zhì)的聲音。而且,對應(yīng)于屏幕上文字所顯示的相關(guān)位置,可以在音區(qū)的該位置生成聲音。然而,通過聽聲音而獲得的位置信息的準(zhǔn)確性要明顯低于通過使用視覺而獲得的位置信息的準(zhǔn)確性。由于這個原因,有時僅僅通過使用這個技術(shù)很難理解圖示的內(nèi)容。此外,已經(jīng)使用二維針顯示作為使用非聲音手段的技術(shù)(參見專利文獻(xiàn)4)。然而,人類手指尖的分辨率非常低,以至于很難獲得與視覺信息相等的信息。
專利文獻(xiàn)11日本專利申請公開平5-34232專利文獻(xiàn)2日本專利申請公開平6-68300專利文獻(xiàn)3日本專利申請公開平8-263260專利文獻(xiàn)1日本專利申請公開平10-232600非專利文獻(xiàn)1Jaws,http//www.freedomscientific.com/fs_products/software_jaws.asp非專利文獻(xiàn)2WindowEyes,http//www.gwmicro.com/products/非專利文獻(xiàn)3Valbo,A.B.&Johanson,R.S.The tactile sensoryinnervation of glabrous skin of the human hand.In G. Gordon(Ed.),Active Touch.2954,Pergamon Press,1978.
非專利文獻(xiàn)4Shardanand,U.and Maes,P. Social informationfilteringAlgorithms for automating“word of mouth”.In Proceedings ofthe 1995ACM Conference on Human Factors in Computing Systems.
發(fā)明內(nèi)容
如上所述,通常對于弱視的人來說通過使用目前技術(shù)水平的任何技術(shù)很難理解圖形的內(nèi)容。另一方面,當(dāng)文件包括多個頁面時,存在這樣一種情況,即有些頁面可以容易地理解。為了發(fā)現(xiàn)哪頁面可以清楚地理解,弱視的人不得不通過使用屏幕讀取器來理解每一頁面。這需要大量的時間和力氣。
注意,已經(jīng)為HTML格式(超文本鏈接標(biāo)示語語言)的文件建立了用于評價獲得信息的難度程度的方針。該方針的一個例子是由W3C(The World Wide Web Consortium)的WAI(Web Accessibility Initiative)制成的WCAG(Web Content Accessibility Guidelines)。HTML文件包括稱為標(biāo)簽的meta信息。然后,通過使用標(biāo)簽中的關(guān)系定義文件結(jié)構(gòu)。如果通過使用標(biāo)簽定義的結(jié)構(gòu)符合該方針,即使是弱視的人在許多情況下可以容易地理解其內(nèi)容。反之,如果通過使用標(biāo)簽定義的結(jié)構(gòu)不符合該方針,弱視的人在許多情況下難以理解其內(nèi)容。簡言之,關(guān)于HTML文件,即使是當(dāng)不能通過使用屏幕讀取器逐頁面地朗讀文件中的所有頁面時,還是有可能發(fā)現(xiàn)具有一定準(zhǔn)確度的難度。
然而,通過使用軟件創(chuàng)建用于顯示的一般圖形經(jīng)常不包括在HTML文件中所用的任何標(biāo)簽。這種情況下,難以應(yīng)用上述方針來評價難度。而且,雖然至少以HTML所寫的整個HTML文件具有統(tǒng)一性,但在一般圖形的情況下不存在這樣的統(tǒng)一性。這是因為一般圖形是通過使用不同類型的軟件而創(chuàng)建的。為此,很難制造一個標(biāo)準(zhǔn),可以利用該標(biāo)準(zhǔn)以統(tǒng)一地評判理解通過使用不同類型的軟件中的任意一種而創(chuàng)建的圖形的內(nèi)容的難度。不僅如此,由于還存在各種不同類型的屏幕讀取器,因此文件創(chuàng)建器經(jīng)常無法決定要創(chuàng)建哪種類型的文件。
作為相關(guān)技術(shù),已提出的技術(shù)有用于根據(jù)用戶的喜好估計用戶對信息的評價(參見非專利文獻(xiàn)4)。利用該技術(shù),基于由多個用戶(每個用戶具有和某用戶A類似的喜好)作出的評價,可以估計由用戶A所做的評價。然而,該文獻(xiàn)簡單地指出用于估計未知評價的大概想法,而沒有描述將該技術(shù)應(yīng)用于弱視人的文件的特殊方法。例如,考慮到依據(jù)用戶喜好的分類通常不影響理解文件的容易度。
因此,本發(fā)明的目的是提供一種可以解決上述問題的系統(tǒng)、方法和程序。該目的可以通過結(jié)合權(quán)利要求范圍中獨立權(quán)利要求的特征而獲得。此外,從屬權(quán)利要求進(jìn)一步指定了本發(fā)明的優(yōu)選的特定例子。
為了解決上述問題,本發(fā)明的實施例提供了一種系統(tǒng),用于評價通過聽由屏幕讀取器輸出的聲音理解文件每一頁面內(nèi)容的難度。該系統(tǒng)包括第一函數(shù)記錄部、收集部和第一更新部。該第一函數(shù)記錄部記錄用于基于表示頁面特征的特征量來計算該頁面難度的評價值的評價函數(shù)。針對其通過使用評價函數(shù)所計算的評價值與用戶對難度的評價不一致的頁面中至少一個頁面,該收集部從用戶收集由用戶對于理解該頁面的難度所評價的值(此后,簡稱為“用戶對難度的評價值”)和該頁面的特征量。該第一更新部基于從用戶收集的該特征量和評價值更新該記錄在第一函數(shù)記錄部中的評價函數(shù),以便能輸出與用戶的評價更為一致的評價值。此外,本實施例還提供一種通過使用該系統(tǒng)評價難度的方法,和一種使信息處理設(shè)備作為該系統(tǒng)工作的程序。
注意,對本發(fā)明的上述概要不是包括本發(fā)明所有必要特征的列舉,這些特征的任何子集合并都包括在本發(fā)明中。
根據(jù)本發(fā)明,可以以高準(zhǔn)確度評價通過聽由屏幕讀取器輸出的聲音理解文件內(nèi)容的難度。
圖1示出信息處理系統(tǒng)10的整體配置。
圖2示出服務(wù)器設(shè)備20的功能性配置。
圖3示出用戶終端30的功能性配置。
圖4示出評價值DB 230的數(shù)據(jù)結(jié)構(gòu)的示例。
圖5示出由難度評價部330輸出的屏幕的第一個顯示示例。
圖6示出由難度評價部330輸出的屏幕的第二個顯示示例。
圖7示出由難度評價部330輸出的屏幕的第三個顯示示例。
圖8示出一過程的流程圖,其中服務(wù)器設(shè)備20收集用戶對難度的評價值,并更新評價函數(shù)。
圖9示出了用戶終端30計算和輸出評價值的過程的流程圖。
圖10A和10B示出了以Z順序掃描顯示對象所遵循的掃描軌跡。
圖11示出了步驟S900中過程的細(xì)節(jié)。
圖12示出了服務(wù)器設(shè)備20為文件創(chuàng)建者執(zhí)行的處理的范例。
圖13示出了信息處理設(shè)備500的硬件配置的范例,該設(shè)備作為服務(wù)器設(shè)備20或用戶終端30作。
附圖標(biāo)記10信息處理系統(tǒng)20服務(wù)器設(shè)備30用戶終端200 第一函數(shù)記錄部210 發(fā)出部220 收集部230 評價值DB240 第一更新部250 性能評價部300 文件DB310 特征量計算部320 第二函數(shù)記錄部330 難度評價部340 輸入部350 評價值DB360 第二更新部500 信息處理設(shè)備具體實施方式
以下將通過使用本發(fā)明的實施例解釋本發(fā)明。但是,下面所描述的實施例不限制在權(quán)利要求范圍內(nèi)所陳述的本發(fā)明。此外,實施例中所描述特征的整體組合對于本發(fā)明的解決裝置并不總是必要的。
圖1示出信息處理系統(tǒng)10的整個配置。該信息處理系統(tǒng)10包括服務(wù)器設(shè)備20和多個用戶終端30。該服務(wù)器設(shè)備20向每個用戶終端30發(fā)出計算程序,用于計算代表文件中所包括的每個頁面特征的特征量。而且,該服務(wù)器設(shè)備20也向每個用戶終端30發(fā)出評價函數(shù),用于計算通過使用屏幕讀取器理解文件內(nèi)容的難度的評價值。
多個用戶終端30中的每一個與多個用戶之一相關(guān)聯(lián),并且包括用于以聲音輸出文件內(nèi)容的屏幕讀取器。通過使用由服務(wù)器設(shè)備20發(fā)出的該計算程序和評價函數(shù),每個用戶終端30計算包括在由用戶指定的文件中每個頁面的評價值,并輸出該用戶所計算的評價值。因此,在實際朗讀該文件之前,該用戶可以發(fā)現(xiàn)理解該文件中每個頁面內(nèi)容的難度,并可以有效地選擇一個頁面以實際朗讀。
圖2示出服務(wù)器設(shè)備20的功能配置。該服務(wù)器設(shè)備20包括第一函數(shù)記錄部200、發(fā)出部210、收集部220、評價值DB 230和第一更新部240。該第一函數(shù)記錄部200記錄與用戶的用戶配置文件相關(guān)聯(lián)的評價函數(shù),該評價函數(shù)用于該用戶,并且用于基于該頁面的特征量計算該頁面難度的評價值。例如,該用戶的用戶配置文件包括該用戶所使用的屏幕讀取器的類型、或用戶生成該用戶試圖理解的文件的創(chuàng)建系統(tǒng)的類型。
所述發(fā)出部210向每個用戶終端30發(fā)出記錄在第一函數(shù)記錄部200中的評價函數(shù)。向某用戶所發(fā)出的評價函數(shù)與該用戶的用戶配置文件相關(guān)聯(lián)。此外,正如下面將描述的,每次第一更新部240更新評價函數(shù)時,發(fā)出部210向多個用戶終端30中的每一個發(fā)出已更新的評價函數(shù),并因此使得用戶終端30中的第二函數(shù)記錄部320記錄該已更新的評價函數(shù)。此外,當(dāng)從管理者處獲得用于計算特征量的計算程序時,該發(fā)出部210可以響應(yīng)該獲得,并向多個用戶終端30中的每一個發(fā)出該計算程序。
針對其通過使用評價函數(shù)所計算的評價值與用戶對難度的評價不一致的頁面中至少一個頁面,該收集部220從用戶收集由用戶的難度評價值和該頁面的特征量,并一起收集用戶的用戶配置文件。特別地,該收集部220可以在用戶終端30中所記錄的用戶的難度評價值的數(shù)量達(dá)到預(yù)定水平時收集用戶的難度評價值和特征量,或者不管評價值的數(shù)量而周期地對其進(jìn)行收集。
評價值DB 230與用戶配置文件相關(guān)聯(lián)地記錄通過收集部220從用戶收集的用戶的難度評價值和特征量。在第一函數(shù)記錄部200中,該第一更新部240更新與每個用戶配置文件相關(guān)的評價函數(shù)。這里,基于與用戶配置文件相關(guān)聯(lián)地收集的評價值和特征量更新所述評價函數(shù)。此外,該服務(wù)器設(shè)備20可以包括表現(xiàn)評價部250。該表現(xiàn)評價部250通過使用由收集部220收集的評價值評價每種屏幕讀取器的表現(xiàn)水平。例如,在對應(yīng)于某種屏幕讀取器的評價值平均高于那些對應(yīng)于其它各種屏幕讀取器的評價值的情況下,該表現(xiàn)評價部250可以以高水平評估某種屏幕讀取器的表現(xiàn)。
圖3示出了用戶終端30的功能配置。除作為屏幕讀取器之外,該用戶終端30還包括用于評價通過聽所輸出的聲音理解內(nèi)容的難度的功能。特別地,該用戶終端30包括文件DB 300、特征量計算部310、第二函數(shù)記錄部320、難度評價部330、輸入部340、評價值DB 350和第二更新部360。該文件DB 300記錄通過使用文件創(chuàng)建系統(tǒng)而生成的文件。該文件可以包括多個頁面,這些頁面具有相互不同的結(jié)構(gòu)。而且,每個頁面不僅可以包括文字還可以包括圖形。此外,圖形可以包括多個顯示對象。
響應(yīng)于來自用戶的指定頁面的指示,特征量計算部310計算代表所指定頁面的特征量。根據(jù)以預(yù)定次序掃描包括在所指定頁面中的多個顯示對象的軌跡,可以計算該特征量。第二函數(shù)記錄部320接收由發(fā)出部210的發(fā)出,并由此獲得來自第一函數(shù)記錄部200的評價函數(shù)。接著,第二函數(shù)記錄部320記錄因此所獲得的評價函數(shù)。通過將特征量計算部310所計算的特征量傳遞至評價函數(shù),難度評價部330計算該頁面的評價值。這樣,該難度評價部330為用戶輸出所計算的評價值。優(yōu)選地,可以在屏幕讀取器朗讀文件之前,為用戶輸出該評價值。在由難度評價部330所計算的評價值與用戶的難度評價不一致的情況下,輸入部340接收用戶的難度評價值的輸入。
評價值DB 350記錄用戶的難度評價值及該頁面的特征量,該評價值由用戶關(guān)于每頁面輸入。這里,評價值 DB 350只是本發(fā)明的頁面記錄部的一個例子。評價值DB 350可以記錄多個頁面中的每個頁面,其所計算的評價值與用戶的難度評價不一致,并一起記錄由輸入部340輸入的該頁面的用戶的難度評價值?;谒斎氲拿總€頁面的用戶的難度評價值和該頁面的特征量,第二更新部360更新記錄在第二函數(shù)記錄部320中的評價函數(shù),以便可以輸出與用戶的評價更為一致的評價值。
圖4示出了評價值DB 230的數(shù)據(jù)結(jié)構(gòu)的示例。在該評價值DB 230中,記錄由收集部220從每個用戶終端30所收集的特征量和用戶對難度的評價值,并相關(guān)聯(lián)地記錄與作為收集目標(biāo)的用戶的用戶配置文件和用于計算特征量的計算程序的版本。圖4中所示的用戶配置文件包括屏幕讀取器的類型和創(chuàng)建系統(tǒng)的類型。該屏幕讀取器并不一定是單獨的軟件,也可以是某軟件的一部分,諸如瀏覽器軟件的插件之類。這種情況下,優(yōu)選的是,軟件和插件的類型在用戶配置文件中是可辨別的。作為另一個例子,屏幕讀取器可以通過將多個軟件組合而獲得。例如,該屏幕讀取器可以包括用于轉(zhuǎn)換文件的數(shù)據(jù)格式的轉(zhuǎn)換程序,和用于在轉(zhuǎn)換之后朗讀文件的朗讀程序。這種情況下,優(yōu)選的是,每個構(gòu)成屏幕讀取器的程序在用戶配置文件中是可辨別的。
此外,記錄在評價值DB 230中的特征量可以是包括多個元素的矢量數(shù)據(jù)。一組矢量數(shù)據(jù)中的元素分別表示一頁面的不同特征。而且,例如,通過使用比例表示記錄在評價值DB 230中的評價值,并因此指示通過聽聲音理解的容易度。取而代之的是,可以通過使用基于比例100的連續(xù)值之一來表示該評價值,并因此指示通過聽聲音理解的容易度。計算程序的版本示出新計算程序和舊計算程序中的哪一個用于在更新計算程序的過渡期中評價特征量。下面將參考附圖11描述涉及該版本信息的過程。
圖5示出由難度評價部330輸出的屏幕的第一顯示示例。在該第一顯示示例中的文件是演示程序包。該演示程序包包括多頁面,且各個頁面的標(biāo)題顯示在屏幕上。通過使用用戶終端30中所提供的屏幕讀取器的功能,用戶可以使這些標(biāo)題以聲音被朗讀。該難度評價部330使每頁面難度的評價值與該頁面的標(biāo)題一起被顯示。例如,在圖5中,顯示為5星的等級指示其內(nèi)容很容易理解。另一方面,顯示為1星的等級指示其內(nèi)容很難理解。
圖6示出由難度評價部330輸出的屏幕的第二顯示示例。該第二顯示示例說明當(dāng)用戶指定某頁面時所顯示的彈出窗口。為了更加精確,當(dāng)用戶指定某頁面時,該難度評價部330使該頁面的評價值及該評價值所表達(dá)的內(nèi)容顯示在彈出窗口內(nèi)。通過指定頁面,用戶可以在該頁面被實際朗讀之前確定理解該頁面內(nèi)容的難度。
圖7示出由難度評價部330輸出的第三顯示示例。該第三顯示示例顯示當(dāng)輸入部340收到用于改變評價值的操作時所顯示的屏幕。收到用于改變評價值的選擇菜單(例如,工具欄上的編輯菜單)的操作后,輸入部340使屏幕顯示用于改變難度的評價值的命令選項。這里,顯示有Change Star 1等。這樣,通過使用戶選擇這些命令中的任意一個,輸入部340可以接收用戶的難度評價值的輸入。
圖8示出服務(wù)器設(shè)備20收集用戶的難度評價值并更新評價函數(shù)的過程的流程圖。第一更新部240基于預(yù)定的樣品文件產(chǎn)生評價函數(shù),并在第一函數(shù)記錄部200中記錄該評價函數(shù)(S800)。如果評價值是新記錄在第一函數(shù)記錄部200中的,或者第一函數(shù)記錄部200中所記錄的評價函數(shù)被更新,則發(fā)出部210向每個用戶終端30發(fā)出記錄在第一函數(shù)記錄部200中的評價函數(shù)(S810)。如果由難度評價部330計算的評價值與用戶的難度評價不一致,則收集部220從每個用戶終端30收集輸入至輸入部340的用戶的難度評價值和由特征量計算部310計算的特征量(S820)。可選地,例如,可以定期進(jìn)行收集。
第一更新部240在所收集的與用戶配置文件相關(guān)的特征量和用戶的難度評價值的基礎(chǔ)上更新記錄在第一函數(shù)記錄部200中的評價函數(shù),以便可以輸出與用戶的評價更為一致的評價值(S830)。下面將描述處理過程的詳細(xì)示例。首先,第一更新部240將所收集的特征量和所收集的用戶的難度評價值分類為各用戶配置文件的組。接下來,第一更新部240通過使用諸如多元回歸分析或機器學(xué)習(xí)(神經(jīng)網(wǎng)絡(luò)、決策樹學(xué)習(xí)、支持向量機等)的技術(shù)為分類而成的每組生成評價函數(shù)。所生成的評價函數(shù)最有可能是可以通過使用所收集的特征量返回所收集的用戶的難度評價值的函數(shù)。第一更新部240將現(xiàn)有的評價函數(shù)更新成新生成的評價函數(shù)。
發(fā)出部210判斷用于計算特征量的計算程序是否已經(jīng)更新(S840)。如果該計算程序已經(jīng)更新(S840是),發(fā)出部210向用戶終端30發(fā)出更新后的計算程序(S850),然后該處理返回至步驟S810。這樣,每次評價函數(shù)被更新時,向用戶終端30發(fā)出新的評價函數(shù)。
圖9示出用戶終端30計算和輸出評價值的過程的流程圖。響應(yīng)于來自用戶的用于指定頁面的指令,特征量計算部310計算該指定頁面的特征量(S900)。通過使用在以預(yù)定順序掃描的指定頁面中所包括的多個顯示對象所遵循的掃描軌跡來計算特征量是可行的。其細(xì)節(jié)示于圖10A和10B。
每個圖10A和10B示出了以Z順序掃描顯示對象所遵循的掃描軌跡。該Z順序是在多個顯示對象被相互重疊著顯示的情況下該多個顯示對象的重疊順序。例如,顯示對象按照該對象被創(chuàng)建的順序從底層到頂層順序重疊顯示。在每個圖10A和10B中,諸如矩形和箭頭線的形狀表示顯示對象,而將這些顯示對象相互連接的虛線表示掃描軌跡。在圖10A中,掃描軌跡非常復(fù)雜。這樣,以Z順序進(jìn)行朗讀的屏幕讀取器分立地朗讀顯示對象,而不考慮屏幕上在X方向和Y方向上的相對位置。結(jié)果,朗讀顯示對象的順序與視力正常的人直觀地觀察到的顯示結(jié)構(gòu)極其不一致。另一方面,在10B中,掃描軌跡相對線性。結(jié)果,朗讀顯示對象的順序與視力正常的人直觀地觀察到的顯示結(jié)構(gòu)更為一致。
為了檢測如上所述的作為特征量的朗讀順序和顯示結(jié)構(gòu)之間的不一致性,特征量計算部310通過使用以Z順序掃描多個顯示對象所遵循的掃描軌跡來計算特征量。例如,根據(jù)軌跡中的距離和角度可以計算特征量。下面將描述該過程的細(xì)節(jié)。在一個例子中,特征量計算部310計算第一顯示對象和鄰接該第一顯示對象掃描的第二顯示對象之間的距離。這里,特征量計算部310對每個顯示對象進(jìn)行這樣的計算。然后,在所計算的總的或平均的距離較長的情況下,特征量計算部310計算比總的或平均的距離較短的情況下的大的特征量。換句話說,在某頁面中的掃描軌跡復(fù)雜并因此總體很長的情況下,特征量計算部310將該頁面鑒定為具有可能不易理解頁面內(nèi)容的特征的頁面。
在另一個例子中,特征量計算部310計算連接第一顯示對象和鄰接該第一顯示對象掃描的第二顯示對象的線與連接第二顯示對象和鄰接該第二顯示對象掃描的第三顯示對象的線之間的角度。這里,特征量計算部310對每個顯示對象進(jìn)行這樣的計算。然后,在所計算的總的或平均的角度的絕對值較大的情況下,特征量計算部310計算比總的或平均的角度的絕對值較小的情況下大的特征量。例如,如公式1所示用于計算特征量的公式。通過使用該公式,特征量計算部310可以計算如圖10A所示的部分掃描軌跡相互重疊的情況下的大特征量,也可計算如圖10B所示的部分掃描軌跡不相互重疊的情況下的小特征量。
max(abs(Σl=1kAj)|1≤k≤N-2)]]>…公式1通過參考附圖10A和10B所示的過程是一個示例。特征量計算部310可以通過使用其它多種方法計算多個特征量,并可以將由所計算的特征量所組成的矢量輸入評價函數(shù)。下面將描述用于計算特征量的方法的示例。
(1)顯示對象的數(shù)目、其區(qū)域尺寸等特征量計算部310將包括在一頁面中的顯示對象分類成多種類型。該分類是根據(jù)標(biāo)準(zhǔn)進(jìn)行的,諸如,每個顯示對象是否包括文本數(shù)據(jù)和可選的文本數(shù)據(jù)中的任意一個,及顯示對象是否是表示頁面標(biāo)題和概要文本中的任意一個的占位符。此后,特征量計算部310計算每個標(biāo)準(zhǔn)的顯示對象的數(shù)目或由每個標(biāo)準(zhǔn)的顯示對象所占據(jù)的區(qū)域占該頁面整個區(qū)域的比例作為特征量。這樣,此顯示對象是否具有某種特征,并且如果有,占有大區(qū)域(即很可能非常重要)的顯示對象具有何特征,可以作為特征量來表示。
(2)文本中文字的數(shù)目和字體的改變量特征量計算部310可以計算頁面中所包括的文字的總數(shù)或每個顯示對象中所包括的文字的平均數(shù)或總數(shù)作為特征量。而且,特征量計算部310可以計算在以Z順序朗讀完顯示對象的時間期間內(nèi)文字的字體或顏色改變的次數(shù)作為特征量。這是因為,弱視的人一般很難理解包括少量文字的句子。此外,也難以將通過使用文字的顏色和字體所表達(dá)的信息翻譯成音頻數(shù)據(jù)。
(3)在分組等級的每個水平上對象和文字的數(shù)目有時,顯示對象具有由將多個顯示對象分組而形成的結(jié)構(gòu)。為了更為精確,如果文件創(chuàng)建者執(zhí)行將多個顯示對象分組的操作,則該文件創(chuàng)建者可以處理該多個顯示對象(改變其位置、增大或減小其尺寸等),就像它們是一個顯示對象一樣。此外,顯示對象可以具有包括顯示對象的嵌套組的結(jié)構(gòu)。
特征量計算部310可以計算包括在某頁面中的組的等級的數(shù)目,或者可以計算包括在每個組的等級中的顯示對象或文字?jǐn)?shù)的平均值和方差,然后可以將所計算的結(jié)果作為特征量輸出。一般而言,這是因為在某頁面具有過于深的等級或根本沒有等級的情況下,弱視的人通常難以理解該頁面的內(nèi)容。
(4)其它在另一個實施例中,特征量計算部310可以計算關(guān)于頁面是否包括動畫的信息作為特征量。如果顯示對象是相互重疊著顯示的,特征量計算部310可以在顯示對象相互重疊的區(qū)域的基礎(chǔ)上來計算特征量。這是因為,當(dāng)頁面上大量使用動畫或者當(dāng)頁面包括相互重疊的顯示對象時,弱視的人通常難以理解頁面的內(nèi)容。
此處,將再次描述圖9。在修改用于尋找特征量的計算程序的過渡期中,特征量計算部310在步驟S900的處理過程中執(zhí)行用于減少由于該修改而引發(fā)的問題的另一處理。稍后將參考圖11對用于最小化問題的該處理進(jìn)行詳細(xì)描述。步驟S900之后,難度評價部330將由特征量計算部310計算出的特征量傳遞至已發(fā)出的評價函數(shù),并因此計算評價值(S910)。接著,難度評價部330為用戶輸出評價值(S920)。輸入部340接收與由難度評價部330計算出的評價值不同的用戶的難度評價值的輸入(S930)。
如果輸入部340接收用戶的難度評價值的輸入(S930是),則第二更新部360在所輸入的用戶對每頁面難度的評價值和該頁面的特征量的基礎(chǔ)上更新記錄在第二函數(shù)記錄部320中的評價函數(shù)(S940)。由于此更新,評價函數(shù)被修改,以便評價函數(shù)可以輸出與用戶的評價更為一致的評價值。與該頁面的特征量一起,評價值DB 350存儲由用戶輸入的每頁面的評價值(S950)。此外,評價值DB 350可以存儲多頁面中的每個其所計算的評價值與用戶對困難的評價不一致的頁面,并一起存儲輸入至輸入部340的用戶的難度評價值。
圖11示出了步驟S900中過程的細(xì)節(jié)。如果用戶終端30在已經(jīng)具有第一計算程序的同時新收到第二計算程序的發(fā)出,則使用先前產(chǎn)生的未修改的評價函數(shù)有時會導(dǎo)致問題的出現(xiàn)。因此,希望產(chǎn)生新的評價函數(shù)。然而,用戶的評價并沒有反映在新評價函數(shù)上。因此,新評價函數(shù)有時返回準(zhǔn)確性不夠的評價值。為了避免這個問題,在收到第二計算程序的發(fā)出之后,用戶終端30在預(yù)定的參考期中執(zhí)行下列處理。此處,將參考期認(rèn)作用于改變計算程序的過渡期。
特征量計算部310判斷是否已經(jīng)接收到第二計算程序的發(fā)出(S1100)。響應(yīng)于發(fā)出了第二計算程序的接收(S1100是),特征量計算部310判斷自從接收到第二計算程序的發(fā)出以來參考期是否已經(jīng)結(jié)束(S1110)。當(dāng)沒有接收到第二計算程序的發(fā)出,或者如果自從接收到第二計算程序的發(fā)出以來參考時間已經(jīng)結(jié)束,則特征量計算部310通過使用最新的計算程序來計算特征量,然后終止該處理過程(S1105)。
當(dāng)參考期沒有結(jié)束時(S1110否),特征量計算部310執(zhí)行下面的處理。順便提一句,如果較新的第二計算程序是在參考期結(jié)束之前發(fā)出的,則特征量計算部310將把現(xiàn)有的第二計算程序所執(zhí)行的處理無效掉,并為新的第二計算程序執(zhí)行下列處理。
首先,特征量計算部310通過使用第一計算程序來計算特征量(S1120)。然后,如上所述,難度評價部330在步驟S910中,從通過使用第一計算程序所計算的特征量中計算評價值。接著,特征量計算部310通過使用第二計算程序來計算評價值(S1130)。特征量計算部310在文件DB 300中存儲通過使用第二計算程序所計算的特征量,并與通過使用第一計算程序在步驟S910中所計算的評價值和指示第二計算程序的版本的信息相關(guān)聯(lián)地存儲(S1140)。注意,如果由于所計算的評價值與用戶的評價不一致而接收新的用戶的難度評價值的輸入,則與新的用戶的難度評價值相關(guān)聯(lián)地存儲特征量。
例如,服務(wù)器設(shè)備20周期性地收集存儲在文件DB 300中的特征量、評價值和指示版本的信息。特別地,收集部220從文件DB 300收集由難度評價部330計算的評價值或輸入至輸入部340的用戶的難度評價值;及特征量計算部310通過使用第二計算程序計算的特征量。對此響應(yīng),第一更新部240基于所收集的評價值和所收集的特征量產(chǎn)生一對應(yīng)于第二計算程序的第二評價函數(shù)。這樣,對應(yīng)于新計算程序的第二評價函數(shù)的評價準(zhǔn)確性可以由發(fā)出新計算程序的點提高到參考期結(jié)束的點。
除了上述處理,服務(wù)器設(shè)備20可以使用已經(jīng)被存儲在文件DB 300中的每頁面(也就是,其通過使用第一評價函數(shù)計算的評價值與用戶的評價不一致的頁面),以便提高第二評價函數(shù)的評價準(zhǔn)確性。為了更加精確,通過使用第二計算程序,特征量計算部310計算已經(jīng)存儲在文件DB 300中的每頁面的特征量。期望可以在用戶終端30的計算負(fù)荷低于預(yù)定參考負(fù)荷的條件下執(zhí)行此計算處理。然后,收集部220收集存儲在文件DB 300中的每頁面的特征量,該特征量是通過使用第二計算程序計算出的,在某種意義上,該特征量與和該頁面相關(guān)聯(lián)地存儲在文件DB 300中的評價值(也就是,通過使用第一評價函數(shù)計算的評價值,或由用戶輸入的用戶的難度評價值)相關(guān)。因此,為了提高新評價函數(shù)的評價準(zhǔn)確性,上述處理使得可以利用其通過使用第一評價函數(shù)計算的評價值先前與用戶的評價不一致的頁面。
圖12示出了服務(wù)器設(shè)備20為文件創(chuàng)建者執(zhí)行的處理的示例。參考圖12,將描述文件創(chuàng)建者使用用戶終端30的處理示例。在此例子中,用戶終端30也作為文件創(chuàng)建系統(tǒng)工作。每次用戶終端響應(yīng)于文件創(chuàng)建者的指令更新頁面時(S1200是),特征量計算部310計算表示被更新頁面的特征的特征量(S1210)。接著,難度評價部330通過將如此計算的特征量傳遞至評價函數(shù)來計算該頁面的評價值,然后為該文件的創(chuàng)建者輸出該評價值(S1220)。
正如圖12的示例中所描述的,在每次更新頁面時計算評價值。根據(jù)這個例子,文件創(chuàng)建者可以參考著評價值來編輯頁面,并且因此可以簡單地創(chuàng)建弱視的人可以容易理解的文件。注意,另一種關(guān)于為弱視的人創(chuàng)建文件的技術(shù)可以附加地合并在用戶終端30中。例如,用戶終端30先存儲指示為了弱視的人可以容易地理解文件要滿足的要求的信息。此處,該要求包括代替圖像而被朗讀的字符串的指定。該要求的另一個例子是構(gòu)成表格的多個對象與指示表格的信息(標(biāo)簽或類似的)相關(guān)聯(lián)地記錄,而不是簡單地任意地分散地顯示在屏幕上。此外,該要求也可以是表示標(biāo)題的字符串,與指示該字符串表示該標(biāo)題的信息(占位符等)相關(guān)聯(lián)地記錄。然后,每當(dāng)更新頁面時,用戶終端30判斷所更新的頁面是否滿足該要求。如果不滿足該要求,則用戶終端30為文件創(chuàng)建者輸出當(dāng)前不滿足的要求,并因此鼓勵文件創(chuàng)建者修改文件。將這些處理和本發(fā)明結(jié)合起來使得更容易創(chuàng)建一種弱視的人可以容易理解的文件。
圖13示出了信息處理設(shè)備500的硬件配置的示例,該設(shè)備作為服務(wù)器設(shè)備20或用戶終端30工作。信息處理設(shè)備500包括CPU外圍單元,輸入/輸出單元和傳統(tǒng)輸入/輸出單元。CPU外圍單元包括CPU1000,RAM 1020和圖形控制器1075,它們通過主控制器1082互相連接。輸入/輸出單元包括通信接口1030,硬盤驅(qū)動器1040和CD-ROM驅(qū)動器,它們通過輸入/輸出控制器1084連接至主控制器1082。傳統(tǒng)輸入/輸出單元包括BIOS 1010、軟盤驅(qū)動器1050和輸入/輸出芯片1070,它們都連接至輸入/輸出控制器1084。
主控制器1082將RAM 1020連接至CPU 1000和圖形控制器1075,二者以高轉(zhuǎn)換速率對RAM 1020進(jìn)行存取。CPU 1000根據(jù)存儲在BIOS 1010和RAM 1020中的程序進(jìn)行操作,并控制每個組件。圖形控制器1075獲得在RAM 1020內(nèi)部提供的幀緩沖器中由CPU 1000等所產(chǎn)生的圖像數(shù)據(jù),并將所獲得的圖像數(shù)據(jù)顯示在顯示設(shè)備1080上。或者,圖形控制器1075內(nèi)部可以包括幀緩沖器,該幀緩沖器存儲由CPU 1000等所產(chǎn)生的圖像數(shù)據(jù)。
輸入/輸出控制器1084將主控制器1082連接至通信接1030、硬盤驅(qū)動器1040和CD-ROM驅(qū)動器1060,它們都是高速輸入/輸出設(shè)備。通信接口1030通過網(wǎng)絡(luò)與外圍設(shè)備通信。硬盤驅(qū)動器1040存儲供信息處理設(shè)備500使用的程序和數(shù)據(jù)。CD-ROM驅(qū)動器1060從CD-ROM 1095中讀取程序或數(shù)據(jù),并向RAM 1020或硬盤1040提供讀出的程序或數(shù)據(jù)。
然而,輸入/輸出控制器1084連接至BIOS 1010和諸如軟盤驅(qū)動器1050和輸入/輸出芯片1070的低速輸入/輸出設(shè)備。BIOS 1010存儲程序,諸如由CPU 1000在信息處理裝置500啟動時所執(zhí)行的引導(dǎo)程序和取決于信息處理設(shè)備500的硬件的程序。所述軟盤驅(qū)動器1050從軟盤1090讀取程序或數(shù)據(jù),并經(jīng)由輸入/輸出芯片1070將所讀取的程序或數(shù)據(jù)提供給RAM 1020或硬盤驅(qū)動1040。輸入/輸出芯片1070連接至軟盤驅(qū)動1050和例如帶并行端口、串行端口、鍵盤端口、鼠標(biāo)端口等的各種輸入/輸出設(shè)備。
將要提供給信息處理設(shè)備500的程序由具有存儲在諸如軟盤1090、CD-ROM 1095和IC卡中的程序的用戶所提供。經(jīng)由輸入/輸出芯片1070和/或輸入/輸出控制器1084從記錄介質(zhì)讀取該程序,并將其安裝在信息處理設(shè)備500中。從而執(zhí)行該程序。由于在使信息處理裝置500執(zhí)行程序中的操作與參考圖1至12所描述的服務(wù)器設(shè)備20或用戶終端30的操作相同,因此省略對其的描述。
上述程序可存儲在外部存儲介質(zhì)中。除軟盤1090和CD-ROM1095之外,待用的存儲介質(zhì)的例子包括諸如DVD和PD的光存儲介質(zhì)、諸如MD的磁光存儲介質(zhì)、磁帶介質(zhì)和諸如IC卡的半導(dǎo)體介質(zhì)?;蛘撸ㄟ^使用提供給連接至專用通信網(wǎng)絡(luò)或互聯(lián)網(wǎng)的服務(wù)器系統(tǒng)的諸如硬盤和RAM的存儲設(shè)備作為記錄介質(zhì),可以經(jīng)由網(wǎng)絡(luò)將該程序提供給信息處理設(shè)備500。
如上所述,本實施例的信息處理系統(tǒng)10可以恰當(dāng)?shù)卦u價對包括圖形的文件進(jìn)行理解的難度,而對于圖形理解的難度的評價曾經(jīng)很難。在此系統(tǒng)中,基于從多個用戶所收集到的評價,適宜地更新用于評價難度的函數(shù)。因此,即使用于最新開始使用屏幕讀取器的用戶,仍然可以恰當(dāng)?shù)卦u價其難度。此外,用戶的評價以這樣的狀態(tài)收集,即其中用戶的評價由包括一種屏幕讀取器等上的信息的用戶配置文件所分類。通過使用所收集的用戶評價,可以進(jìn)一步提高難度的評價準(zhǔn)確性。而且,在更新用于計算特征量的計算程序的情況下,設(shè)定更新的過渡期,使得可以防止在更新之后的評價準(zhǔn)確性降低。
至此,已經(jīng)通過使用實施例描述了本發(fā)明。然而,本發(fā)明的技術(shù)范圍并不受限于上述實施例。對于本領(lǐng)域技術(shù)人員來說很明顯的是,可以對該實施例進(jìn)行各種變化和改進(jìn)。而且,同樣明顯的是,對本發(fā)明的權(quán)利要求的范圍所進(jìn)行的變化和改進(jìn)包括在本發(fā)明的技術(shù)范圍內(nèi)。
權(quán)利要求
1.一種用于評價通過聽由屏幕讀取器輸出的聲音理解文件中每頁內(nèi)容的難度的系統(tǒng),該系統(tǒng)包括第一函數(shù)記錄部,其記錄用于基于表示頁面特征的特征量計算頁面的評價值的評價函數(shù);收集部,其從用戶收集用戶的難度評價值和其使用評價函數(shù)計算出的評價值與用戶的難度評價值不一致的至少一頁中的每個頁面的特征量;和第一更新部,其基于從用戶收集到的特征量和評價值更新記錄在第一函數(shù)記錄部中的評價函數(shù),以便輸出與用戶的評價更為一致的評價值。
2.如權(quán)利要求1所述的系統(tǒng),其中對于每種屏幕讀取器,第一函數(shù)記錄部記錄用于計算通過聽由該種屏幕讀取器輸出的聲音理解內(nèi)容的難度的評價值的評價函數(shù),對于這樣的頁面,即其通過使用對應(yīng)于由多個用戶的每一個所使用的屏幕讀取器的類型的評價函數(shù)所計算的評價值與用戶對困難的評價不一致,該收集部從用戶與屏幕讀取器的類型相關(guān)聯(lián)地收集用戶的難度評價值和該頁面的特征量,并且第一更新部基于用戶的難度評價值和特征量更新對應(yīng)于每種屏幕讀取器的評價函數(shù),其中用戶對困難的評價值和特征量與屏幕讀取器的類型相關(guān)聯(lián)地被收集。
3.如權(quán)利要求2所述的系統(tǒng),其中對于每種用于創(chuàng)建文件的文件創(chuàng)建系統(tǒng),該第一函數(shù)記錄部記錄用于計算通過聽由屏幕讀取器輸出的聲音理解文件的難度的評價值的評價函數(shù),該文件由該種文件創(chuàng)建系統(tǒng)所創(chuàng)建,對于這樣的頁面,即其通過使用對應(yīng)于用于創(chuàng)建文件的文件創(chuàng)建系統(tǒng)的類型的評價函數(shù)所計算的評價值與用戶的難度評價不一致,該收集部與文件創(chuàng)建系統(tǒng)的類型相關(guān)聯(lián)地收集用戶的難度評價值和該頁面的特征量,并且第一更新部基于用戶的難度評價值和特征量更新對應(yīng)于每種文件創(chuàng)建系統(tǒng)的評價函數(shù),其中用戶的難度評價值和特征量與文件創(chuàng)建系統(tǒng)的類型相關(guān)聯(lián)地被收集。
4.如權(quán)利要求2所述的系統(tǒng),還包括表現(xiàn)評價部,該表現(xiàn)評價部基于由收集部收集的用戶的難度評價值評價每個類型的屏幕讀取器的表現(xiàn)水平。
5.如權(quán)利要求1所述的系統(tǒng),還包括特征量計算部,其根據(jù)以預(yù)定順序掃描頁面中所包括的多個顯示對象所遵循的軌跡計算用戶所指定的頁面的特征量;和難度評價部,其通過將所計算的特征量傳遞給評價函數(shù)而計算該頁面的評價值,然后為用戶輸出該評價值,所述系統(tǒng)中,如果由難度評價部計算的評價值與用戶的難度評價不一致,則收集部從用戶收集用戶的難度評價值。
6.如權(quán)利要求5所述的系統(tǒng),其中,在顯示對象互相重疊著顯示的情況下,特征量計算部根據(jù)以Z順序掃描指定頁面中所包括的多個顯示對象所遵循的軌跡計算頁面的特征量,Z順序是多個顯示對象重疊的順序。
7.如權(quán)利要求5所述的系統(tǒng),其中關(guān)于多個顯示對象的每一個,所述特征量計算部計算第一顯示對象和鄰接第一顯示對象掃描的第二顯示對象之間的距離,并且在如此計算的總的或平均的距離較大的情況下,所述特征量計算部計算比所計算的總的或平均的距離較小的情況下的大的特征量。
8.如權(quán)利要求5所述的系統(tǒng),其中關(guān)于多個顯示對象的每一個,所述特征量計算部計算連接第一顯示對象和鄰接第一顯示對象之后掃描的第二顯示對象之間的線到連接第二顯示對象和鄰接第二顯示對象掃描的第三顯示對象之間的線之間的角度,并且在如此計算的總的或平均的角度較大的情況下,所述特征量計算部計算比所計算的總的或平均的角度較小的情況下的大的特征量。
9.如權(quán)利要求1所述的系統(tǒng),還包括向多個用戶分別提供的多個用戶終端,每個用戶終端包括第二函數(shù)記錄部,記錄從第一函數(shù)記錄部獲得的評價函數(shù);特征量計算部,計算用戶所指定的頁面的特征量;難度評價部,通過將所計算的特征量傳遞給評價函數(shù),計算該頁面的評價值,并接著向用戶輸出該評價值;輸入部,如果由難度評價部計算的評價值和用戶的難度評價不一致,則接收用戶的難度評價值的輸入;以及第二更新部,基于所輸入的用戶的難度評價值和所計算的特征量更新記錄在第二函數(shù)記錄部中的評價函數(shù);該系統(tǒng)還包括具有第一函數(shù)記錄部、收集部和第一更新部的服務(wù)器設(shè)備,所述系統(tǒng)中,該收集部從多個用戶終端的每一個收集輸入至輸入部的用戶的難度評價值和由特征量計算部計算的特征量,并且所述服務(wù)器設(shè)備還包括發(fā)出部,該發(fā)出部向多個用戶終端的每一個發(fā)送由第一更新部更新的評價函數(shù),并使得第二函數(shù)記錄部記錄該評價函數(shù)。
10.如權(quán)利要求9所述的系統(tǒng),其中所述發(fā)出部向多個用戶終端的每一個發(fā)出用于計算特征量的計算程序;并且在已接收到第一計算程序的狀態(tài)下響應(yīng)于第二計算程序的接收,在之后的預(yù)定參考期期間,所述特征量計算部通過使用各第一和第二計算程序計算特征量,所述難度評價部通過使用第一計算程序?qū)⑺嬎愕奶卣髁總鬟f至評價函數(shù)來計算該頁面的評價值,所述收集部收集如此計算的評價值或被輸入至輸入部的用戶的難度評價值,以及通過使用第二計算程序由特征量計算部所計算的特征量,并且所述第一更新部基于所收集的評價值和所收集的特征量生成對應(yīng)于第二計算程序的評價函數(shù),并將該評價函數(shù)記錄在第一函數(shù)記錄部中。
11.如權(quán)利要求10所述的系統(tǒng),其中每個用戶終端還包括頁面記錄部,與輸入至輸入部的該頁面的用戶的難度評價值相關(guān)聯(lián)地記錄多個頁面中所計算的評價值與用戶的難度評價不一致的每個頁面;而且,在參考期期間,所述特征量計算部通過使用第二計算程序還計算記錄在頁面記錄部中的每個頁面的特征量,并且所述收集部將所計算的記錄在頁面記錄部中的每個頁面的特征量與對應(yīng)于頁面記錄部中的該頁面而記錄的評價值相關(guān)聯(lián)地收集。
12.如權(quán)利要求11所述的系統(tǒng),其中在參考期期間,如果用戶終端的計算負(fù)載低于預(yù)定的參考負(fù)載,則每個用戶終端的所述特征量計算部通過使用第二計算程序,計算記錄在頁面記錄部中的每個頁面的特征量。
13.如權(quán)利要求1所述的系統(tǒng),還包括特征量計算部,在每次創(chuàng)建或編輯文件的用戶更新頁面時計算表示頁面特征的特征量;和難度評價部,通過將所計算的特征量傳遞給評價函數(shù)計算該頁面的評價值,并因此向用戶輸出評價值。
14.一種用于評價通過聽由屏幕讀取器輸出的聲音理解文件中每頁內(nèi)容的難度的方法,該方法包括步驟記錄基于表示頁面特征的特征量計算頁面難度的評價值的評價函數(shù);從用戶收集用戶的難度評價值和其通過使用評價函數(shù)計算的評價值與用戶的難度評價不一致的至少一頁中的每個頁面的特征量;和基于從用戶收集到的特征量和評價值更新評價函數(shù),以便輸出與用戶的評價更為一致的評價值。
全文摘要
為了高準(zhǔn)確性地評價通過聽由屏幕讀取器輸出的聲音來理解文件內(nèi)容的難度,本發(fā)明提供一種用于評價通過聽由屏幕讀取器輸出的聲音理解文件每頁內(nèi)容的難度的系統(tǒng)。該系統(tǒng)包括第一函數(shù)記錄部,其基于表示頁面特征的特征量計算頁面難度的評價值;收集部,其從用戶收集用戶的難度評價值和其評價值與用戶的難度評價值不一致的至少一頁中的每個頁面的特征量;和第一更新部,其基于從用戶收集到的特征量和評價值更新記錄在第一函數(shù)記錄部中的評價函數(shù),以便輸出與用戶的評價更為一致的評價值。
文檔編號G06F3/16GK101038581SQ20071008858
公開日2007年9月19日 申請日期2007年3月16日 優(yōu)先權(quán)日2006年3月17日
發(fā)明者佐藤大介, 淺川智惠子, 高木啟伸 申請人:國際商業(yè)機器公司