專利名稱:一種Diff打分方法以及系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及頁面效果的回歸測試領(lǐng)域,具體地說涉及一種Diff打分方法以及系統(tǒng)。
背景技術(shù):
為了對各種頁面的展現(xiàn)效果進(jìn)行評價(jià),最直觀、最便捷的方法就是對頁面進(jìn)行測試。頁面測試通常是指對兩個(gè)相似網(wǎng)頁進(jìn)行對比,例如:原始網(wǎng)頁和其升級版本的網(wǎng)頁進(jìn)行對比;或者是使用不同版本轉(zhuǎn)碼器對原始網(wǎng)頁進(jìn)行轉(zhuǎn)碼,以獲得原始網(wǎng)頁的不同版本的轉(zhuǎn)碼網(wǎng)頁,再對這兩個(gè)不同版本的轉(zhuǎn)碼網(wǎng)頁進(jìn)行對比。使用不同版本轉(zhuǎn)碼器對原始網(wǎng)頁進(jìn)行轉(zhuǎn)碼主要是為了滿足各種設(shè)備的需求,目前的網(wǎng)頁主要針對計(jì)算機(jī)等固定終端。隨著智能終端例如:智能手機(jī)、Ipad等移動(dòng)終端的出現(xiàn),其也可以瀏覽各種網(wǎng)頁,但是由于顯示屏幕的大小,或者移動(dòng)終端中系統(tǒng)的限制,并不是所有的移動(dòng)終端都能夠很好地顯示出各種網(wǎng)頁的網(wǎng)頁效果,因此需要使用轉(zhuǎn)碼器對原本針對計(jì)算機(jī)設(shè)計(jì)的原網(wǎng)頁進(jìn)行轉(zhuǎn)碼,使其適應(yīng)各種移動(dòng)終端的顯示屏幕。轉(zhuǎn)碼器(Transcoder)系統(tǒng)中的tckernel模塊屬于策略型模塊,頁面展現(xiàn)效果的轉(zhuǎn)換主要依賴于該模塊,其他一些模塊主要負(fù)責(zé)一些碼獲取等外圍工作,因此對于策略性模塊tckernel模塊的測試至關(guān)重要。在目前的測試現(xiàn)狀中,針對策略型模塊無特別適合的測試方法?,F(xiàn)在一種常用的方法是通過對頁面數(shù)據(jù)集進(jìn)行大規(guī)模的Diff打分,來衡量一個(gè)策略對頁面效果的影響。但是,現(xiàn)有技術(shù)并不適合對比兩個(gè)版本頁面的差異化,因?yàn)閮蓚€(gè)版本的頁面所對應(yīng)的原始頁面是相同的,只是在展現(xiàn)上存在差異,而現(xiàn)有技術(shù)中對網(wǎng)頁相似度進(jìn)行比較時(shí)通常采用的方法為對網(wǎng)頁文本進(jìn)行切詞,并據(jù)此通過計(jì)算文本相似度來反映網(wǎng)頁相似度,即主要關(guān)注的是兩個(gè)不同網(wǎng)頁的文字內(nèi)容上的差別。因此,現(xiàn)有技術(shù)中的網(wǎng)頁相似度計(jì)算方法并不能反應(yīng)用戶視覺上的差異,即不能針對每種類型的元素(折疊分支,鏈接,圖片,文本)進(jìn)行差異化相似度計(jì)算。其中,折疊分支主要是指為了讓網(wǎng)頁主要內(nèi)容更加突出,將網(wǎng)頁內(nèi)容中的次要部分被折疊起來,每一個(gè)被折疊的部分就是一個(gè)折疊分支。在現(xiàn)有技術(shù)中,如果需要對頁面展現(xiàn)效果進(jìn)行測試,則完全依賴于人工測試,即人工對兩個(gè)網(wǎng)頁進(jìn)行一一比對以找到差異,不但成本高而且效率低。
發(fā)明內(nèi)容
本發(fā)明提供一種DifT打分方法,用于實(shí)現(xiàn)高效、自動(dòng)化的頁面效果測試。Diff打分系統(tǒng)可降低人工頁面檢查的成本,大幅度提升頁面效果類回歸測試的效率。根據(jù)本發(fā)明的一個(gè)方面,提供一種Diff打分方法,其特征在于,包括以下步驟:a)獲取待比較的第一網(wǎng)頁和第二網(wǎng)頁;b)提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息,并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行對比,獲得Diff結(jié)果;c)為所述元素信息賦予不同的權(quán)重,并根據(jù)所述權(quán)重統(tǒng)計(jì)分析所述Diff結(jié)果,以獲取所述第一網(wǎng)頁和第二網(wǎng)頁的相似度值。根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例,所述步驟b)還進(jìn)一步包括:提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息,并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行向量化,生成第一向量和第二向量;對所述第一向量和所述第二向量進(jìn)行對比,獲得Diff結(jié)果。根據(jù)本發(fā)明的又一個(gè)優(yōu)選實(shí)施例,所述第一網(wǎng)頁由第一版本轉(zhuǎn)碼器對原始網(wǎng)頁轉(zhuǎn)碼獲得;所述第二網(wǎng)頁由第二版本所述轉(zhuǎn)碼器對所述原始網(wǎng)頁轉(zhuǎn)碼獲得。根據(jù)本發(fā)明的另一個(gè)方面,提供一種Diff打分系統(tǒng),其特征在于,包括:獲取裝置,用于獲取待比較的第一網(wǎng)頁和第二網(wǎng)頁;對比裝置,用于提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息,并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行對比,獲得Diff結(jié)果;加權(quán)裝置,用于為所述元素信息賦予不同的權(quán)重,并根據(jù)所述權(quán)重統(tǒng)計(jì)分析所述Diff結(jié)果,以獲取所述第一網(wǎng)頁和第二網(wǎng)頁的相似度值。根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例,所述對比裝置還進(jìn)一步包括:向量生成模塊,用于提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息,并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行向量化,生成第一向量和第二向量;Diff模塊,用于對所述第一向量和所述第二向量進(jìn)行對比,獲得Diff結(jié)果。根據(jù)本發(fā)明的另一個(gè)優(yōu)選實(shí)施例,所述獲取裝置還包括:第一轉(zhuǎn)碼器,用于將原始網(wǎng)頁轉(zhuǎn)碼生成所述第一網(wǎng)頁;第二轉(zhuǎn)碼器,用于將所述原始網(wǎng)頁轉(zhuǎn)碼生成所述第二網(wǎng)頁。本發(fā)明提供的Diff打分方法及其系統(tǒng),重點(diǎn)在于對待比較的兩個(gè)頁面的展現(xiàn)效果,如文字字體、顏色、圖片、鏈接等量化為向量表示,然后通過對比兩個(gè)向量的差異來表示兩個(gè)頁面展現(xiàn)效果的差異,并將對比結(jié)果,即各個(gè)向量的差異進(jìn)行加權(quán)計(jì)算,把計(jì)算值直觀的展現(xiàn)給用戶。對頁面展現(xiàn)效果進(jìn)行測試時(shí)所涉及到的比較內(nèi)容不僅限于現(xiàn)有技術(shù)中常用的文本,還包括鏈接、圖片等元素。通過對多種元素的向量化以及比較,可以大幅度提高兩個(gè)頁面效果的測試效率,且由于可以對各種元素進(jìn)行向量化,向量化之后進(jìn)行對比,有效提高了測試的自動(dòng)化水平。
通過閱讀參照以下附圖所作的對非限制性實(shí)施例所作的詳細(xì)描述,本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:圖1為根據(jù)本發(fā)明的一種Diff打分方法的一種具體實(shí)施方式
的流程示意圖;圖2為根據(jù)本發(fā)明的一種Diff打分方法中獲取原始網(wǎng)頁的具體實(shí)施方式
的示意圖;圖3為根據(jù)圖1所示流程S102可能具有的分解步驟流程圖;圖4為根據(jù)本發(fā)明的一種Diff打分系統(tǒng)的一種具體實(shí)施方式
的結(jié)構(gòu)示意圖;圖5為根據(jù)圖4所示的Diff打分系統(tǒng)中獲取裝置的一種具體實(shí)施方式
的結(jié)構(gòu)示
意圖;圖6為根據(jù)圖4所示的Diff打分系統(tǒng)中對比裝置的一種具體實(shí)施方式
的結(jié)構(gòu)示意圖。附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合附圖對本發(fā)明的實(shí)施例作詳細(xì)描述。下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能解釋為對本發(fā)明的限制。下文的公開提供了許多不同的實(shí)施例或例子用來實(shí)現(xiàn)本發(fā)明的不同結(jié)構(gòu)。為了簡化本發(fā)明的公開,下文中對特定例子的部件和設(shè)置進(jìn)行描述。當(dāng)然,它們僅僅為示例,并且目的不在于限制本發(fā)明。此外,本發(fā)明可以在不同例子中重復(fù)參考數(shù)字和/或字母。這種重復(fù)是為了簡化和清楚的目的,其本身不指示所討論各種實(shí)施例和/或設(shè)置之間的關(guān)系。應(yīng)當(dāng)注意,在附圖中所圖示的部件不一定按比例繪制。本發(fā)明省略了對公知組件和處理技術(shù)及工藝的描述以避免不必要地限制本發(fā)明。如圖1所示,圖1為根據(jù)本發(fā)明提供的一種Diff打分方法的一個(gè)具體實(shí)施方式
的流程示意圖,包括步驟SlOl S103,下面結(jié)合具體的實(shí)施例對圖1所示的方法進(jìn)行說明。步驟S101,獲取待比較的第一網(wǎng)頁和第二網(wǎng)頁。所述第一網(wǎng)頁和所述第二網(wǎng)頁可以是任意的兩個(gè)網(wǎng)頁,但是如果是毫無關(guān)聯(lián)的網(wǎng)頁進(jìn)行對比,那么將失去比較的意義。因此,優(yōu)選的,所述第一網(wǎng)頁和第二網(wǎng)頁都是基于同一個(gè)原始網(wǎng)頁獲得,即:所述第一網(wǎng)頁由第一轉(zhuǎn)碼器對原始網(wǎng)頁轉(zhuǎn)碼獲得;所述第二網(wǎng)頁由第二轉(zhuǎn)碼器對所述原始網(wǎng)頁轉(zhuǎn)碼獲得。第一轉(zhuǎn)碼器和第二轉(zhuǎn)碼器是指同一轉(zhuǎn)碼器的不同版本??梢岳斫?,由于目前的網(wǎng)頁大部分都是基于固定終端進(jìn)行編寫,因此在移動(dòng)終端上的顯示可能會(huì)出現(xiàn)各種各樣的問題,例如,字體不全,顯示為亂碼;格式不匹配,顯示格式錯(cuò)亂等。隨著移動(dòng)終端的日新月異以及各種移動(dòng)終端系統(tǒng)的出現(xiàn),需要對原始網(wǎng)頁進(jìn)行轉(zhuǎn)換,以期能使原本適應(yīng)于固定終端的網(wǎng)頁可以在各種移動(dòng)終端中有完美展現(xiàn)??梢岳斫?,作為一種客戶端軟件,轉(zhuǎn)碼器也是在不斷升級的,因此需要對不同版本的轉(zhuǎn)碼器對原始頁面的轉(zhuǎn)碼效果進(jìn)行測試??梢岳斫?,第二轉(zhuǎn)碼器優(yōu)選為第一轉(zhuǎn)碼器的升級版本。所述原始網(wǎng)頁的來源多種多樣,包括但不限于本地存儲、實(shí)時(shí)抓取或代理抓取,參考圖2。在本地抓取方式中,先通過srcURL重定向到本地?cái)?shù)據(jù)的路徑,然后進(jìn)行拼接抓取URL參數(shù),最后通過URL參數(shù)訪問互聯(lián)網(wǎng)抓取頁面。srcURL字符串的值可以是需要獲得的網(wǎng)頁內(nèi)容的地址(例如,http://www.baidu.com)或者本地服務(wù)器上的一個(gè)HTML文件的文件名(例如,example, html),其中參數(shù)可以任意修改,諸如width, fontFacel等等。實(shí)時(shí)抓取直接拼接抓取URL參數(shù),并通過該參數(shù)訪問互聯(lián)網(wǎng)抓取所需頁面。面對更新速度過快的網(wǎng)頁,例如:BBS、微博等頁面,優(yōu)選采用實(shí)時(shí)抓取的方式。另外,還可以通過設(shè)置代理服務(wù)器的方式抓取所需頁面,例如掌百代理等。當(dāng)獲取到原始頁面后,會(huì)通過不同版本的轉(zhuǎn)碼器對其進(jìn)行轉(zhuǎn)碼,生成第一網(wǎng)頁和第二網(wǎng)頁。接下來,執(zhí)行步驟S102,提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息,并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行對比,獲得Diff結(jié)果。所述元素信息包括:所述元素的個(gè)數(shù)和所述元素的內(nèi)容屬性。所述元素包括但不限于圖片、鏈接、純文本、折疊分支等;元素個(gè)數(shù)即為圖片的多少、文本文件的個(gè)數(shù)等等。元素的內(nèi)容屬性例如:純文本元素的字體、文字的多少等;圖片元素的尺寸、像素、格式等。優(yōu)選的,參考圖3,所述步驟S102進(jìn)一步包括:步驟S102-1,提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息,并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行向量化,生成第一向量和第二向量。對各種元素進(jìn)行向量化即將連續(xù)變化的模擬量(各種元素)轉(zhuǎn)換成離散數(shù)字量樣本值。數(shù)字化的結(jié)果有助于進(jìn)行比較。例如,對圖片進(jìn)行向量化,可以是根據(jù)其尺寸對其在網(wǎng)頁中的位置進(jìn)行定位;對字體顏色進(jìn)行向量化,可以是對級聯(lián)樣式表(Cascading Style Sheet, CSS)中相關(guān)變量的提取等。步驟S102-2,對所述第一向量和所述第二向量進(jìn)行對比,獲得Diff結(jié)果。對第一向量和第二向量進(jìn)行對比,即對數(shù)字化的樣本進(jìn)行對比,這種對比簡單且正確性高,因此為本發(fā)明的優(yōu)選方案。通過對比,即可得到第一向量和第二向量的區(qū)別,將其區(qū)別整合,即為Diff結(jié)果。繼續(xù)執(zhí)行步驟S103,為所述元素信息賦予不同的權(quán)重,并根據(jù)所述權(quán)重統(tǒng)計(jì)分析所述Diff結(jié)果,以獲取所述第一網(wǎng)頁和第二網(wǎng)頁的相似度值。Diff結(jié)果通常會(huì)顯示出第一網(wǎng)頁和第二網(wǎng)頁各種元素的不同,例如:文本的不同,其可能具體體現(xiàn)在文本中字體的不同;鏈接的不同,其具體可能體現(xiàn)在超鏈接數(shù)目的不同等等。為了更好地對Diff結(jié)果進(jìn)行分析,需要對各種元素賦予不同的權(quán)重,如:圖片占30%、鏈接占20%、純文本占40%、折疊分支占10%等。進(jìn)一步地,還可以為各個(gè)元素的各個(gè)屬性賦予不同的權(quán)重,例如:在圖片元素中,圖片的尺寸占40%、圖片的像素占40%、圖片的格式占20%等。根據(jù)不同的需求,可以為各種元素或者元素屬性設(shè)置不同的權(quán)重,以獲得所需的分析結(jié)果。圖4為根據(jù)本發(fā)明的Diff打分系統(tǒng)10的一個(gè)具體實(shí)施方式
的結(jié)構(gòu)示意圖。系統(tǒng)10包括:獲取裝置11、對比裝置12和加權(quán)裝置13。獲取裝置11用于獲取待比較的第一網(wǎng)頁和第二網(wǎng)頁。所述第一網(wǎng)頁和所述第二網(wǎng)頁可以是任意的兩個(gè)網(wǎng)頁,但是如果是毫無關(guān)聯(lián)的網(wǎng)頁進(jìn)行對比,那么將失去比較的意義。因此,優(yōu)選的,所述第一網(wǎng)頁和第二網(wǎng)頁都是基于同一個(gè)原始網(wǎng)頁獲得,即:所述第一網(wǎng)頁由第一轉(zhuǎn)碼器111對原始網(wǎng)頁轉(zhuǎn)碼獲得;所述第二網(wǎng)頁由第二所述轉(zhuǎn)碼器112對所述原始網(wǎng)頁轉(zhuǎn)碼獲得,如圖5所示。第一轉(zhuǎn)碼器111和第二轉(zhuǎn)碼器112是指同一轉(zhuǎn)碼器的不同版本。由于技術(shù)更新速度非常快,客戶端、軟件等的更新也是日新月異,如果每次都重新命名,不但會(huì)導(dǎo)致工作量巨大,而且名稱混亂,不利于使用和查找,因此目前常用的命名法,就是對相似功能、版本不同的的客戶端、軟件統(tǒng)一命名,例如:QQ2009、QQ2011等等。可以理解,第二轉(zhuǎn)碼器112優(yōu)選為第一轉(zhuǎn)碼器111的升級版本。所述原始網(wǎng)頁的來源多種多樣,包括但不限于本地存儲、實(shí)時(shí)抓取或代理抓取,參考圖2。在本地抓取方式中,先通過srcURL重定向到本地?cái)?shù)據(jù)的路徑,然后進(jìn)行拼接抓取URL參數(shù),最后通過URL參數(shù)訪問互聯(lián)網(wǎng)抓取頁面。srcURL字符串的值可以是需要獲得的網(wǎng)頁內(nèi)容的地址(例如,http://www.baidu.com)或者本地服務(wù)器上的一個(gè)HTML文件的文件名(例如,example, html),其中參數(shù)可以任意修改,諸如width, fontFacel等等。實(shí)時(shí)抓取直接拼接抓取URL參數(shù),并通過該參數(shù)訪問互聯(lián)網(wǎng)抓取所需頁面。面對更新速度過快的網(wǎng)頁,例如:BBS、微博等頁面,優(yōu)選采用實(shí)時(shí)抓取的方式。另外,還可以通過設(shè)置代理服務(wù)器的方式抓取所需頁面,例如掌百代理等。當(dāng)獲取到原始頁面后,會(huì)通過獲取裝置11中的不同轉(zhuǎn)碼器對其進(jìn)行轉(zhuǎn)碼,生成第一網(wǎng)頁和第二網(wǎng)頁。對比裝置12用于提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息,并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行對比,獲得Diff結(jié)果。所述元素信息包括:所述元素的個(gè)數(shù)和所述元素的內(nèi)容屬性。所述元素包括但不限于圖片、鏈接、純文本、折疊分支等;元素個(gè)數(shù)即為圖片的多少、文本文件的個(gè)數(shù)等等。元素的內(nèi)容屬性例如:純文本元素的字體、文字的多少等;圖片元素的尺寸、像素、格式等。優(yōu)選的,參考圖6,所述對比裝置12進(jìn)一步包括:向量生成模塊121,用于提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息,并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行向量化,生成第一向量和第二向量。對各種元素進(jìn)行向量化即將連續(xù)變化的模擬量(各種元素)轉(zhuǎn)換成離散數(shù)字量樣本值。數(shù)字化的結(jié)果有助于進(jìn)行比較。Diff模塊122,用于對所述第一向量和所述第二向量進(jìn)行對比,獲得Diff結(jié)果。對第一向量和第二向量進(jìn)行對比,即對數(shù)字化的樣本進(jìn)行對比,這種對比簡單且正確性高,因此為本發(fā)明的優(yōu)選方案。通過對比,即可得到第一向量和第二向量的區(qū)別,將其區(qū)別整合,即為Diff結(jié)果。加權(quán)裝置13,用于為所述元素信息賦予不同的權(quán)重,并根據(jù)所述權(quán)重統(tǒng)計(jì)分析所述Diff結(jié)果,以獲取所述第一網(wǎng)頁和第二網(wǎng)頁的相似度值。Diff結(jié)果通常會(huì)顯示出第一網(wǎng)頁和第二網(wǎng)頁各種元素的不同,例如:文本的不同,其可能具體體現(xiàn)在文本中字體的不同;鏈接的不同,其具體可能體現(xiàn)在超鏈接數(shù)目的不同等等。為了更好地對Diff結(jié)果進(jìn)行分析,需要對各種元素賦予不同的權(quán)重,如:圖片占30 %、鏈接占20 %、純文本占40 %、折疊分支占10%等。進(jìn)一步地,還可以為各個(gè)元素的各個(gè)屬性賦予不同的權(quán)重,例如:在圖片元素中,圖片的尺寸占40%、圖片的像素占40%、圖片的格式占20%等。根據(jù)不同的需求,可以為各種元素或者元素屬性設(shè)置不同的權(quán)重,以獲得所需的分析結(jié)果。采用本發(fā)明的方法和系統(tǒng),可以通過對待對比網(wǎng)頁中的多種元素進(jìn)行比對,獲取精確的對比結(jié)果,且自動(dòng)化程度和效率高。對于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實(shí)施例的細(xì)節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實(shí)現(xiàn)本發(fā)明。因此,無論從哪一點(diǎn)來看,均應(yīng)將實(shí)施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化涵括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。此夕卜,顯然“包括” 一詞不排除其他模塊或步驟,單數(shù)不排除復(fù)數(shù)。
權(quán)利要求
1.一種DifT打分方法,其特征在于,包括以下步驟: a)獲取待比較的第一網(wǎng)頁和第二網(wǎng)頁; b)提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息,并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行對比,獲得Diff結(jié)果; c)為所述元素信息賦予不同的權(quán)重,并根據(jù)所述權(quán)重統(tǒng)計(jì)分析所述Diff結(jié)果,以獲取所述第一網(wǎng)頁和第二網(wǎng)頁的相似度值。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟b)還進(jìn)一步包括: 提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息,并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行向量化,生成第一向量和第二向量; 對所述第一向量和所述第二向量進(jìn)行對比,獲得Diff結(jié)果。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,在步驟a)中,所述第一網(wǎng)頁由第一版本轉(zhuǎn)碼器對原始網(wǎng)頁轉(zhuǎn)碼獲得;所述第二網(wǎng)頁由第二版本轉(zhuǎn)碼器對所述原始網(wǎng)頁轉(zhuǎn)碼獲得。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述原始網(wǎng)頁來源于本地存儲、實(shí)時(shí)抓取或代理抓取。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述元素信息包括:所述元素的個(gè)數(shù)和所述元素的內(nèi)容屬性。
6.根據(jù)權(quán)利要求1所述的 方法,其特征在于,所述元素包括:圖片、鏈接、純文本、折疊分支。
7.—種DifT打分系統(tǒng),其特征在于,包括: 獲取裝置,用于獲取待比較的第一網(wǎng)頁和第二網(wǎng)頁; 對比裝置,用于提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息,并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行對比,獲得Diff結(jié)果; 加權(quán)裝置,用于為所述元素信息賦予不同的權(quán)重,并根據(jù)所述權(quán)重統(tǒng)計(jì)分析所述Diff結(jié)果,以獲取所述第一網(wǎng)頁和第二網(wǎng)頁的相似度值。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述對比裝置還進(jìn)一步包括: 向量生成模塊,用于提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息,并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行向量化,生成第一向量和第二向量; Diff模塊,用于對所述第一向量和所述第二向量進(jìn)行對比,獲得Diff結(jié)果。
9.根據(jù)權(quán)利要求7或8所述的系統(tǒng),其特征在于,所述獲取裝置還包括: 第一轉(zhuǎn)碼器,用于將原始網(wǎng)頁轉(zhuǎn)碼生成所述第一網(wǎng)頁; 第二轉(zhuǎn)碼器,用于將所述原始網(wǎng)頁轉(zhuǎn)碼生成所述第二網(wǎng)頁。
10.根據(jù)權(quán)利要求9所述的系統(tǒng),其特征在于,所述原始網(wǎng)頁來源于本地存儲、實(shí)時(shí)抓取或代理抓取。
11.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述元素信息包括:所述元素的個(gè)數(shù)和所述元素的內(nèi)容屬性。
12.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述元素包括:圖片、鏈接、純文本、折疊分支。
全文摘要
本發(fā)明提供一種Diff打分方法,包括獲取待比較的第一網(wǎng)頁和第二網(wǎng)頁;提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息,并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行對比,獲得Diff結(jié)果;為所述元素信息賦予不同的權(quán)重,并根據(jù)所述權(quán)重統(tǒng)計(jì)分析所述Diff結(jié)果,以獲取所述第一網(wǎng)頁和第二網(wǎng)頁的相似度值。本發(fā)明還提供一種使用該方法的系統(tǒng)。本發(fā)明可以實(shí)現(xiàn)高效自動(dòng)化的頁面效果測試。
文檔編號G06F17/30GK103218358SQ20121001632
公開日2013年7月24日 申請日期2012年1月18日 優(yōu)先權(quán)日2012年1月18日
發(fā)明者翁巖青 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司