一種Diff打分方法以及系統(tǒng)的制作方法

文檔序號：6363492閱讀：201來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：一種Diff打分方法以及系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及頁面效果的回歸測試領(lǐng)域，具體地說涉及一種Diff打分方法以及系統(tǒng)。
背景技術(shù)：
為了對各種頁面的展現(xiàn)效果進(jìn)行評價(jià)，最直觀、最便捷的方法就是對頁面進(jìn)行測試。頁面測試通常是指對兩個(gè)相似網(wǎng)頁進(jìn)行對比，例如:原始網(wǎng)頁和其升級版本的網(wǎng)頁進(jìn)行對比；或者是使用不同版本轉(zhuǎn)碼器對原始網(wǎng)頁進(jìn)行轉(zhuǎn)碼，以獲得原始網(wǎng)頁的不同版本的轉(zhuǎn)碼網(wǎng)頁，再對這兩個(gè)不同版本的轉(zhuǎn)碼網(wǎng)頁進(jìn)行對比。使用不同版本轉(zhuǎn)碼器對原始網(wǎng)頁進(jìn)行轉(zhuǎn)碼主要是為了滿足各種設(shè)備的需求，目前的網(wǎng)頁主要針對計(jì)算機(jī)等固定終端。隨著智能終端例如:智能手機(jī)、Ipad等移動(dòng)終端的出現(xiàn)，其也可以瀏覽各種網(wǎng)頁，但是由于顯示屏幕的大小，或者移動(dòng)終端中系統(tǒng)的限制，并不是所有的移動(dòng)終端都能夠很好地顯示出各種網(wǎng)頁的網(wǎng)頁效果，因此需要使用轉(zhuǎn)碼器對原本針對計(jì)算機(jī)設(shè)計(jì)的原網(wǎng)頁進(jìn)行轉(zhuǎn)碼，使其適應(yīng)各種移動(dòng)終端的顯示屏幕。轉(zhuǎn)碼器(Transcoder)系統(tǒng)中的tckernel模塊屬于策略型模塊,頁面展現(xiàn)效果的轉(zhuǎn)換主要依賴于該模塊，其他一些模塊主要負(fù)責(zé)一些碼獲取等外圍工作，因此對于策略性模塊tckernel模塊的測試至關(guān)重要。在目前的測試現(xiàn)狀中，針對策略型模塊無特別適合的測試方法?，F(xiàn)在一種常用的方法是通過對頁面數(shù)據(jù)集進(jìn)行大規(guī)模的Diff打分，來衡量一個(gè)策略對頁面效果的影響。但是，現(xiàn)有技術(shù)并不適合對比兩個(gè)版本頁面的差異化，因?yàn)閮蓚€(gè)版本的頁面所對應(yīng)的原始頁面是相同的，只是在展現(xiàn)上存在差異，而現(xiàn)有技術(shù)中對網(wǎng)頁相似度進(jìn)行比較時(shí)通常采用的方法為對網(wǎng)頁文本進(jìn)行切詞，并據(jù)此通過計(jì)算文本相似度來反映網(wǎng)頁相似度，即主要關(guān)注的是兩個(gè)不同網(wǎng)頁的文字內(nèi)容上的差別。因此，現(xiàn)有技術(shù)中的網(wǎng)頁相似度計(jì)算方法并不能反應(yīng)用戶視覺上的差異，即不能針對每種類型的元素(折疊分支，鏈接，圖片，文本)進(jìn)行差異化相似度計(jì)算。其中，折疊分支主要是指為了讓網(wǎng)頁主要內(nèi)容更加突出，將網(wǎng)頁內(nèi)容中的次要部分被折疊起來，每一個(gè)被折疊的部分就是一個(gè)折疊分支。在現(xiàn)有技術(shù)中，如果需要對頁面展現(xiàn)效果進(jìn)行測試，則完全依賴于人工測試，即人工對兩個(gè)網(wǎng)頁進(jìn)行一一比對以找到差異，不但成本高而且效率低。

發(fā)明內(nèi)容
本發(fā)明提供一種DifT打分方法，用于實(shí)現(xiàn)高效、自動(dòng)化的頁面效果測試。Diff打分系統(tǒng)可降低人工頁面檢查的成本，大幅度提升頁面效果類回歸測試的效率。根據(jù)本發(fā)明的一個(gè)方面，提供一種Diff打分方法，其特征在于，包括以下步驟:a)獲取待比較的第一網(wǎng)頁和第二網(wǎng)頁；b)提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息，并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行對比，獲得Diff結(jié)果；c)為所述元素信息賦予不同的權(quán)重，并根據(jù)所述權(quán)重統(tǒng)計(jì)分析所述Diff結(jié)果，以獲取所述第一網(wǎng)頁和第二網(wǎng)頁的相似度值。根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例，所述步驟b)還進(jìn)一步包括:提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息，并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行向量化，生成第一向量和第二向量；對所述第一向量和所述第二向量進(jìn)行對比，獲得Diff結(jié)果。根據(jù)本發(fā)明的又一個(gè)優(yōu)選實(shí)施例，所述第一網(wǎng)頁由第一版本轉(zhuǎn)碼器對原始網(wǎng)頁轉(zhuǎn)碼獲得；所述第二網(wǎng)頁由第二版本所述轉(zhuǎn)碼器對所述原始網(wǎng)頁轉(zhuǎn)碼獲得。根據(jù)本發(fā)明的另一個(gè)方面，提供一種Diff打分系統(tǒng)，其特征在于，包括:獲取裝置，用于獲取待比較的第一網(wǎng)頁和第二網(wǎng)頁；對比裝置，用于提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息，并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行對比，獲得Diff結(jié)果；加權(quán)裝置，用于為所述元素信息賦予不同的權(quán)重，并根據(jù)所述權(quán)重統(tǒng)計(jì)分析所述Diff結(jié)果，以獲取所述第一網(wǎng)頁和第二網(wǎng)頁的相似度值。根據(jù)本發(fā)明的一個(gè)優(yōu)選實(shí)施例，所述對比裝置還進(jìn)一步包括:向量生成模塊，用于提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息，并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行向量化，生成第一向量和第二向量；Diff模塊，用于對所述第一向量和所述第二向量進(jìn)行對比，獲得Diff結(jié)果。根據(jù)本發(fā)明的另一個(gè)優(yōu)選實(shí)施例，所述獲取裝置還包括:第一轉(zhuǎn)碼器，用于將原始網(wǎng)頁轉(zhuǎn)碼生成所述第一網(wǎng)頁；第二轉(zhuǎn)碼器，用于將所述原始網(wǎng)頁轉(zhuǎn)碼生成所述第二網(wǎng)頁。本發(fā)明提供的Diff打分方法及其系統(tǒng)，重點(diǎn)在于對待比較的兩個(gè)頁面的展現(xiàn)效果，如文字字體、顏色、圖片、鏈接等量化為向量表示，然后通過對比兩個(gè)向量的差異來表示兩個(gè)頁面展現(xiàn)效果的差異，并將對比結(jié)果，即各個(gè)向量的差異進(jìn)行加權(quán)計(jì)算，把計(jì)算值直觀的展現(xiàn)給用戶。對頁面展現(xiàn)效果進(jìn)行測試時(shí)所涉及到的比較內(nèi)容不僅限于現(xiàn)有技術(shù)中常用的文本，還包括鏈接、圖片等元素。通過對多種元素的向量化以及比較，可以大幅度提高兩個(gè)頁面效果的測試效率，且由于可以對各種元素進(jìn)行向量化，向量化之后進(jìn)行對比，有效提高了測試的自動(dòng)化水平。

通過閱讀參照以下附圖所作的對非限制性實(shí)施例所作的詳細(xì)描述，本發(fā)明的其它特征、目的和優(yōu)點(diǎn)將會(huì)變得更明顯:圖1為根據(jù)本發(fā)明的一種Diff打分方法的一種具體實(shí)施方式
的流程示意圖；圖2為根據(jù)本發(fā)明的一種Diff打分方法中獲取原始網(wǎng)頁的具體實(shí)施方式
的示意圖；圖3為根據(jù)圖1所示流程S102可能具有的分解步驟流程圖；圖4為根據(jù)本發(fā)明的一種Diff打分系統(tǒng)的一種具體實(shí)施方式
的結(jié)構(gòu)示意圖；圖5為根據(jù)圖4所示的Diff打分系統(tǒng)中獲取裝置的一種具體實(shí)施方式
的結(jié)構(gòu)示
意圖；圖6為根據(jù)圖4所示的Diff打分系統(tǒng)中對比裝置的一種具體實(shí)施方式
的結(jié)構(gòu)示意圖。附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
具體實(shí)施例方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚，下面將結(jié)合附圖對本發(fā)明的實(shí)施例作詳細(xì)描述。下面詳細(xì)描述本發(fā)明的實(shí)施例，所述實(shí)施例的示例在附圖中示出，其中自始至終相同或類似的標(biāo)號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的，僅用于解釋本發(fā)明，而不能解釋為對本發(fā)明的限制。下文的公開提供了許多不同的實(shí)施例或例子用來實(shí)現(xiàn)本發(fā)明的不同結(jié)構(gòu)。為了簡化本發(fā)明的公開，下文中對特定例子的部件和設(shè)置進(jìn)行描述。當(dāng)然，它們僅僅為示例，并且目的不在于限制本發(fā)明。此外，本發(fā)明可以在不同例子中重復(fù)參考數(shù)字和/或字母。這種重復(fù)是為了簡化和清楚的目的，其本身不指示所討論各種實(shí)施例和/或設(shè)置之間的關(guān)系。應(yīng)當(dāng)注意，在附圖中所圖示的部件不一定按比例繪制。本發(fā)明省略了對公知組件和處理技術(shù)及工藝的描述以避免不必要地限制本發(fā)明。如圖1所示，圖1為根據(jù)本發(fā)明提供的一種Diff打分方法的一個(gè)具體實(shí)施方式
的流程示意圖，包括步驟SlOl S103，下面結(jié)合具體的實(shí)施例對圖1所示的方法進(jìn)行說明。步驟S101，獲取待比較的第一網(wǎng)頁和第二網(wǎng)頁。所述第一網(wǎng)頁和所述第二網(wǎng)頁可以是任意的兩個(gè)網(wǎng)頁，但是如果是毫無關(guān)聯(lián)的網(wǎng)頁進(jìn)行對比，那么將失去比較的意義。因此，優(yōu)選的，所述第一網(wǎng)頁和第二網(wǎng)頁都是基于同一個(gè)原始網(wǎng)頁獲得，即:所述第一網(wǎng)頁由第一轉(zhuǎn)碼器對原始網(wǎng)頁轉(zhuǎn)碼獲得；所述第二網(wǎng)頁由第二轉(zhuǎn)碼器對所述原始網(wǎng)頁轉(zhuǎn)碼獲得。第一轉(zhuǎn)碼器和第二轉(zhuǎn)碼器是指同一轉(zhuǎn)碼器的不同版本?？梢岳斫?，由于目前的網(wǎng)頁大部分都是基于固定終端進(jìn)行編寫，因此在移動(dòng)終端上的顯示可能會(huì)出現(xiàn)各種各樣的問題，例如，字體不全，顯示為亂碼；格式不匹配，顯示格式錯(cuò)亂等。隨著移動(dòng)終端的日新月異以及各種移動(dòng)終端系統(tǒng)的出現(xiàn)，需要對原始網(wǎng)頁進(jìn)行轉(zhuǎn)換，以期能使原本適應(yīng)于固定終端的網(wǎng)頁可以在各種移動(dòng)終端中有完美展現(xiàn)?？梢岳斫?，作為一種客戶端軟件，轉(zhuǎn)碼器也是在不斷升級的，因此需要對不同版本的轉(zhuǎn)碼器對原始頁面的轉(zhuǎn)碼效果進(jìn)行測試?？梢岳斫?，第二轉(zhuǎn)碼器優(yōu)選為第一轉(zhuǎn)碼器的升級版本。所述原始網(wǎng)頁的來源多種多樣，包括但不限于本地存儲、實(shí)時(shí)抓取或代理抓取，參考圖2。在本地抓取方式中，先通過srcURL重定向到本地?cái)?shù)據(jù)的路徑，然后進(jìn)行拼接抓取URL參數(shù)，最后通過URL參數(shù)訪問互聯(lián)網(wǎng)抓取頁面。srcURL字符串的值可以是需要獲得的網(wǎng)頁內(nèi)容的地址(例如，http://www.baidu.com)或者本地服務(wù)器上的一個(gè)HTML文件的文件名(例如,example, html),其中參數(shù)可以任意修改,諸如width, fontFacel等等。實(shí)時(shí)抓取直接拼接抓取URL參數(shù)，并通過該參數(shù)訪問互聯(lián)網(wǎng)抓取所需頁面。面對更新速度過快的網(wǎng)頁，例如:BBS、微博等頁面，優(yōu)選采用實(shí)時(shí)抓取的方式。另外，還可以通過設(shè)置代理服務(wù)器的方式抓取所需頁面，例如掌百代理等。當(dāng)獲取到原始頁面后，會(huì)通過不同版本的轉(zhuǎn)碼器對其進(jìn)行轉(zhuǎn)碼，生成第一網(wǎng)頁和第二網(wǎng)頁。接下來，執(zhí)行步驟S102，提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息，并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行對比，獲得Diff結(jié)果。所述元素信息包括:所述元素的個(gè)數(shù)和所述元素的內(nèi)容屬性。所述元素包括但不限于圖片、鏈接、純文本、折疊分支等；元素個(gè)數(shù)即為圖片的多少、文本文件的個(gè)數(shù)等等。元素的內(nèi)容屬性例如:純文本元素的字體、文字的多少等；圖片元素的尺寸、像素、格式等。優(yōu)選的，參考圖3，所述步驟S102進(jìn)一步包括:步驟S102-1，提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息，并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行向量化，生成第一向量和第二向量。對各種元素進(jìn)行向量化即將連續(xù)變化的模擬量(各種元素)轉(zhuǎn)換成離散數(shù)字量樣本值。數(shù)字化的結(jié)果有助于進(jìn)行比較。例如，對圖片進(jìn)行向量化，可以是根據(jù)其尺寸對其在網(wǎng)頁中的位置進(jìn)行定位；對字體顏色進(jìn)行向量化，可以是對級聯(lián)樣式表(Cascading Style Sheet, CSS)中相關(guān)變量的提取等。步驟S102-2，對所述第一向量和所述第二向量進(jìn)行對比，獲得Diff結(jié)果。對第一向量和第二向量進(jìn)行對比，即對數(shù)字化的樣本進(jìn)行對比，這種對比簡單且正確性高，因此為本發(fā)明的優(yōu)選方案。通過對比，即可得到第一向量和第二向量的區(qū)別，將其區(qū)別整合，即為Diff結(jié)果。繼續(xù)執(zhí)行步驟S103，為所述元素信息賦予不同的權(quán)重，并根據(jù)所述權(quán)重統(tǒng)計(jì)分析所述Diff結(jié)果，以獲取所述第一網(wǎng)頁和第二網(wǎng)頁的相似度值。Diff結(jié)果通常會(huì)顯示出第一網(wǎng)頁和第二網(wǎng)頁各種元素的不同，例如:文本的不同，其可能具體體現(xiàn)在文本中字體的不同；鏈接的不同，其具體可能體現(xiàn)在超鏈接數(shù)目的不同等等。為了更好地對Diff結(jié)果進(jìn)行分析，需要對各種元素賦予不同的權(quán)重，如:圖片占30%、鏈接占20%、純文本占40%、折疊分支占10%等。進(jìn)一步地，還可以為各個(gè)元素的各個(gè)屬性賦予不同的權(quán)重，例如:在圖片元素中，圖片的尺寸占40%、圖片的像素占40%、圖片的格式占20%等。根據(jù)不同的需求，可以為各種元素或者元素屬性設(shè)置不同的權(quán)重，以獲得所需的分析結(jié)果。圖4為根據(jù)本發(fā)明的Diff打分系統(tǒng)10的一個(gè)具體實(shí)施方式
的結(jié)構(gòu)示意圖。系統(tǒng)10包括:獲取裝置11、對比裝置12和加權(quán)裝置13。獲取裝置11用于獲取待比較的第一網(wǎng)頁和第二網(wǎng)頁。所述第一網(wǎng)頁和所述第二網(wǎng)頁可以是任意的兩個(gè)網(wǎng)頁，但是如果是毫無關(guān)聯(lián)的網(wǎng)頁進(jìn)行對比，那么將失去比較的意義。因此，優(yōu)選的，所述第一網(wǎng)頁和第二網(wǎng)頁都是基于同一個(gè)原始網(wǎng)頁獲得，即:所述第一網(wǎng)頁由第一轉(zhuǎn)碼器111對原始網(wǎng)頁轉(zhuǎn)碼獲得；所述第二網(wǎng)頁由第二所述轉(zhuǎn)碼器112對所述原始網(wǎng)頁轉(zhuǎn)碼獲得，如圖5所示。第一轉(zhuǎn)碼器111和第二轉(zhuǎn)碼器112是指同一轉(zhuǎn)碼器的不同版本。由于技術(shù)更新速度非常快，客戶端、軟件等的更新也是日新月異，如果每次都重新命名，不但會(huì)導(dǎo)致工作量巨大，而且名稱混亂，不利于使用和查找，因此目前常用的命名法，就是對相似功能、版本不同的的客戶端、軟件統(tǒng)一命名，例如:QQ2009、QQ2011等等。可以理解，第二轉(zhuǎn)碼器112優(yōu)選為第一轉(zhuǎn)碼器111的升級版本。所述原始網(wǎng)頁的來源多種多樣，包括但不限于本地存儲、實(shí)時(shí)抓取或代理抓取，參考圖2。在本地抓取方式中，先通過srcURL重定向到本地?cái)?shù)據(jù)的路徑，然后進(jìn)行拼接抓取URL參數(shù)，最后通過URL參數(shù)訪問互聯(lián)網(wǎng)抓取頁面。srcURL字符串的值可以是需要獲得的網(wǎng)頁內(nèi)容的地址(例如，http://www.baidu.com)或者本地服務(wù)器上的一個(gè)HTML文件的文件名(例如,example, html),其中參數(shù)可以任意修改,諸如width, fontFacel等等。實(shí)時(shí)抓取直接拼接抓取URL參數(shù)，并通過該參數(shù)訪問互聯(lián)網(wǎng)抓取所需頁面。面對更新速度過快的網(wǎng)頁，例如:BBS、微博等頁面，優(yōu)選采用實(shí)時(shí)抓取的方式。另外，還可以通過設(shè)置代理服務(wù)器的方式抓取所需頁面，例如掌百代理等。當(dāng)獲取到原始頁面后，會(huì)通過獲取裝置11中的不同轉(zhuǎn)碼器對其進(jìn)行轉(zhuǎn)碼，生成第一網(wǎng)頁和第二網(wǎng)頁。對比裝置12用于提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息，并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行對比，獲得Diff結(jié)果。所述元素信息包括:所述元素的個(gè)數(shù)和所述元素的內(nèi)容屬性。所述元素包括但不限于圖片、鏈接、純文本、折疊分支等；元素個(gè)數(shù)即為圖片的多少、文本文件的個(gè)數(shù)等等。元素的內(nèi)容屬性例如:純文本元素的字體、文字的多少等；圖片元素的尺寸、像素、格式等。優(yōu)選的，參考圖6，所述對比裝置12進(jìn)一步包括:向量生成模塊121，用于提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息，并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行向量化，生成第一向量和第二向量。對各種元素進(jìn)行向量化即將連續(xù)變化的模擬量(各種元素)轉(zhuǎn)換成離散數(shù)字量樣本值。數(shù)字化的結(jié)果有助于進(jìn)行比較。Diff模塊122，用于對所述第一向量和所述第二向量進(jìn)行對比，獲得Diff結(jié)果。對第一向量和第二向量進(jìn)行對比，即對數(shù)字化的樣本進(jìn)行對比，這種對比簡單且正確性高，因此為本發(fā)明的優(yōu)選方案。通過對比，即可得到第一向量和第二向量的區(qū)別，將其區(qū)別整合，即為Diff結(jié)果。加權(quán)裝置13，用于為所述元素信息賦予不同的權(quán)重，并根據(jù)所述權(quán)重統(tǒng)計(jì)分析所述Diff結(jié)果，以獲取所述第一網(wǎng)頁和第二網(wǎng)頁的相似度值。Diff結(jié)果通常會(huì)顯示出第一網(wǎng)頁和第二網(wǎng)頁各種元素的不同，例如:文本的不同，其可能具體體現(xiàn)在文本中字體的不同；鏈接的不同，其具體可能體現(xiàn)在超鏈接數(shù)目的不同等等。為了更好地對Diff結(jié)果進(jìn)行分析，需要對各種元素賦予不同的權(quán)重，如:圖片占30 %、鏈接占20 %、純文本占40 %、折疊分支占10%等。進(jìn)一步地，還可以為各個(gè)元素的各個(gè)屬性賦予不同的權(quán)重，例如:在圖片元素中，圖片的尺寸占40%、圖片的像素占40%、圖片的格式占20%等。根據(jù)不同的需求，可以為各種元素或者元素屬性設(shè)置不同的權(quán)重，以獲得所需的分析結(jié)果。采用本發(fā)明的方法和系統(tǒng)，可以通過對待對比網(wǎng)頁中的多種元素進(jìn)行比對，獲取精確的對比結(jié)果，且自動(dòng)化程度和效率高。對于本領(lǐng)域技術(shù)人員而言，顯然本發(fā)明不限于上述示范性實(shí)施例的細(xì)節(jié)，而且在不背離本發(fā)明的精神或基本特征的情況下，能夠以其他的具體形式實(shí)現(xiàn)本發(fā)明。因此，無論從哪一點(diǎn)來看，均應(yīng)將實(shí)施例看作是示范性的，而且是非限制性的，本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定，因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化涵括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。此夕卜，顯然“包括” 一詞不排除其他模塊或步驟，單數(shù)不排除復(fù)數(shù)。
權(quán)利要求
1.一種DifT打分方法，其特征在于，包括以下步驟: a)獲取待比較的第一網(wǎng)頁和第二網(wǎng)頁； b)提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息，并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行對比，獲得Diff結(jié)果； c)為所述元素信息賦予不同的權(quán)重，并根據(jù)所述權(quán)重統(tǒng)計(jì)分析所述Diff結(jié)果，以獲取所述第一網(wǎng)頁和第二網(wǎng)頁的相似度值。
2.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述步驟b)還進(jìn)一步包括: 提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息，并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行向量化，生成第一向量和第二向量；對所述第一向量和所述第二向量進(jìn)行對比，獲得Diff結(jié)果。
3.根據(jù)權(quán)利要求1或2所述的方法，其特征在于，在步驟a)中，所述第一網(wǎng)頁由第一版本轉(zhuǎn)碼器對原始網(wǎng)頁轉(zhuǎn)碼獲得；所述第二網(wǎng)頁由第二版本轉(zhuǎn)碼器對所述原始網(wǎng)頁轉(zhuǎn)碼獲得。
4.根據(jù)權(quán)利要求3所述的方法，其特征在于，所述原始網(wǎng)頁來源于本地存儲、實(shí)時(shí)抓取或代理抓取。
5.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述元素信息包括:所述元素的個(gè)數(shù)和所述元素的內(nèi)容屬性。
6.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述元素包括:圖片、鏈接、純文本、折疊分支。
7.—種DifT打分系統(tǒng)，其特征在于，包括: 獲取裝置，用于獲取待比較的第一網(wǎng)頁和第二網(wǎng)頁；對比裝置，用于提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息，并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行對比，獲得Diff結(jié)果；加權(quán)裝置，用于為所述元素信息賦予不同的權(quán)重，并根據(jù)所述權(quán)重統(tǒng)計(jì)分析所述Diff結(jié)果，以獲取所述第一網(wǎng)頁和第二網(wǎng)頁的相似度值。
8.根據(jù)權(quán)利要求7所述的系統(tǒng)，其特征在于，所述對比裝置還進(jìn)一步包括: 向量生成模塊，用于提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息，并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行向量化，生成第一向量和第二向量； Diff模塊，用于對所述第一向量和所述第二向量進(jìn)行對比，獲得Diff結(jié)果。
9.根據(jù)權(quán)利要求7或8所述的系統(tǒng)，其特征在于，所述獲取裝置還包括: 第一轉(zhuǎn)碼器，用于將原始網(wǎng)頁轉(zhuǎn)碼生成所述第一網(wǎng)頁；第二轉(zhuǎn)碼器，用于將所述原始網(wǎng)頁轉(zhuǎn)碼生成所述第二網(wǎng)頁。
10.根據(jù)權(quán)利要求9所述的系統(tǒng)，其特征在于，所述原始網(wǎng)頁來源于本地存儲、實(shí)時(shí)抓取或代理抓取。
11.根據(jù)權(quán)利要求7所述的系統(tǒng)，其特征在于，所述元素信息包括:所述元素的個(gè)數(shù)和所述元素的內(nèi)容屬性。
12.根據(jù)權(quán)利要求7所述的系統(tǒng)，其特征在于，所述元素包括:圖片、鏈接、純文本、折疊分支。
全文摘要
本發(fā)明提供一種Diff打分方法，包括獲取待比較的第一網(wǎng)頁和第二網(wǎng)頁；提取所述第一網(wǎng)頁和所述第二網(wǎng)頁中的元素信息，并分別對所述第一網(wǎng)頁和所述第二網(wǎng)頁中的相應(yīng)元素信息進(jìn)行對比，獲得Diff結(jié)果；為所述元素信息賦予不同的權(quán)重，并根據(jù)所述權(quán)重統(tǒng)計(jì)分析所述Diff結(jié)果，以獲取所述第一網(wǎng)頁和第二網(wǎng)頁的相似度值。本發(fā)明還提供一種使用該方法的系統(tǒng)。本發(fā)明可以實(shí)現(xiàn)高效自動(dòng)化的頁面效果測試。
文檔編號G06F17/30GK103218358SQ20121001632
公開日2013年7月24日申請日期2012年1月18日優(yōu)先權(quán)日2012年1月18日
發(fā)明者翁巖青申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：翁巖青
技術(shù)所有人：百度在線網(wǎng)絡(luò)技術(shù)（北京）有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動(dòng)力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

打分系統(tǒng)相關(guān)技術(shù)

亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

一種Diff打分方法以及系統(tǒng)的制作方法