專利名稱:一種語音增值業(yè)務(wù)數(shù)據(jù)信息處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信領(lǐng)域,更確切地說是涉及一種語音增值業(yè)務(wù)數(shù)據(jù)信息處理方法。
背景技術(shù):
各種語音增值業(yè)務(wù),如多媒體語音增值業(yè)務(wù),最近幾年才在我國出現(xiàn),但發(fā)展非常迅猛。多媒體語音增值業(yè)務(wù)的興起對語音資源平臺的集成度和可靠性都提出了更高的要求。
語音增值業(yè)務(wù)的數(shù)據(jù)需求非常大,以彩鈴為例,一般中等局點可供用戶選擇的歌曲都在8000-10000首左右,加上其它的冗余數(shù)據(jù)大概占有15-20G的空間,而且還在迅速增長中。現(xiàn)有的語音資源平臺大多使用硬盤緩存方式,將語音文件從文件服務(wù)器上同步到本地。但是硬盤存在存取速度慢,可靠性差等缺點,后續(xù)隨著數(shù)據(jù)量的不斷擴大,存儲空間也將不能滿足需求。
現(xiàn)有多數(shù)產(chǎn)品都將硬盤作為本地語音文件的緩存,優(yōu)點是簡單,緩存容量大,但缺點也很明顯1、硬盤作為一個機械部件,其運行壽命是有限的,而在每年24×365的運行條件下,其安全和可靠性是很難達到電信級的運行要求。
2、隨著彩鈴用戶的發(fā)展,鈴音文件的數(shù)目也在迅速膨脹,硬盤的存儲空間將很快耗盡。
3、由于硬盤的存在,考慮到散熱和占有空間等問題,設(shè)備的集成度將很難提高。
4、硬盤的存取速度慢,如果經(jīng)常訪問的話會明顯降低系統(tǒng)性能。
發(fā)明內(nèi)容
本發(fā)明的主要目的在于提供一種語音增值業(yè)務(wù)數(shù)據(jù)信息處理方法,能夠在基本不增加網(wǎng)絡(luò)和文件服務(wù)器負荷的情況下替代原有的硬盤方案,從而提高系統(tǒng)的可靠性和集成度。
實現(xiàn)本發(fā)明的技術(shù)方案如下一種語音增值業(yè)務(wù)數(shù)據(jù)信息處理方法,其中,建立用于存儲增值業(yè)務(wù)數(shù)據(jù)文件的緩沖(CACHE)存取區(qū),并進行如下步驟A、根據(jù)前一設(shè)定周期中增值業(yè)務(wù)數(shù)據(jù)文件的使用頻率屬性更新CACHE存取區(qū);B、當(dāng)系統(tǒng)需要使用增值業(yè)務(wù)數(shù)據(jù)文件時,依據(jù)所述增值業(yè)務(wù)數(shù)據(jù)文件標(biāo)識在CACHE存取區(qū)中進行檢索,判斷所述增值業(yè)務(wù)數(shù)據(jù)文件是否在該CACHE存取區(qū)中,如果是,則直接從CACHE存取區(qū)調(diào)用所述增值業(yè)務(wù)數(shù)據(jù)文件;否則,從文件服務(wù)器上調(diào)用所述增值業(yè)務(wù)數(shù)據(jù)文件。
在CACHE存取區(qū)或文件服務(wù)器上檢索到所述增值業(yè)務(wù)數(shù)據(jù)文件并調(diào)用后,更新該增值業(yè)務(wù)數(shù)據(jù)文件的使用頻率值。
步驟B后進一步包括,檢測本次設(shè)定周期是否結(jié)束,并在周期結(jié)束時記錄本次周期內(nèi)增值業(yè)務(wù)數(shù)據(jù)文件的使用頻率和計算該文件權(quán)值,以及將CACHE存取區(qū)內(nèi)容清空和標(biāo)識本次設(shè)定周期為前一周期后進入步驟A。
步驟A是指依據(jù)增值業(yè)務(wù)數(shù)據(jù)文件在上一周期的使用頻率屬性依次將文件從文件服務(wù)器加載到CACHE存取區(qū)中,直到加滿為止。
將存儲CACHE存取區(qū)的普通內(nèi)存虛擬成Ramdisk,在其上安裝文件系統(tǒng)對CACHE存取區(qū)進行操作。
本發(fā)明通過方法實現(xiàn)了在基本不增加網(wǎng)絡(luò)和文件服務(wù)器負荷的情況下替代原有的硬盤方案,從而提高系統(tǒng)的可靠性和集成度,同時1、因不用實時計算權(quán)值和進行換入換出操作,對CPU占用小。
2、因每天凌晨加載時都會清理掉原來的CACHE存取區(qū)內(nèi)數(shù)據(jù)內(nèi)容,而且平時運行時并不更新CACHE存取區(qū),因此CACHE中不會有任何碎片。
3、使用隨機存儲器磁盤(Ramdisk)系統(tǒng),可以利用操作系統(tǒng)來管理CACHE中的文件,實現(xiàn)簡單,效率較高,同時操作方式和磁盤完全一致,對原有代碼改動小。
圖1為彩鈴業(yè)務(wù)使用頻度分布圖;圖2為全部彩鈴音使用頻度分布圖;圖3為本發(fā)明所述方法系統(tǒng)組網(wǎng)圖;圖4為本發(fā)明所述方法流程圖。
具體實施例方式
由于語音增值業(yè)務(wù)數(shù)據(jù)都有業(yè)務(wù)數(shù)據(jù)使用頻度相差極大的特點,往往少部分業(yè)務(wù)數(shù)據(jù)被使用的頻率極高,甚至占到總使用率的百分之九十以上,這就為超速緩存(CACHE)技術(shù)的使用提供了前提。本發(fā)明依據(jù)增值業(yè)務(wù)數(shù)據(jù)文件使用頻率建立CACHE存取區(qū),依增值業(yè)務(wù)數(shù)據(jù)文件使用頻率對增值業(yè)務(wù)數(shù)據(jù)文件進行操作,但同CACHE算法操作CACHE存取區(qū)不同,該CACHE存取區(qū)的數(shù)據(jù)并不是實時更新,即不需要實時對增值業(yè)務(wù)數(shù)據(jù)文件換進換出。
以彩鈴業(yè)務(wù)為例。首先,對彩鈴業(yè)務(wù)的話務(wù)模型進行分析,表一是某省彩鈴用戶鈴音的使用情況。從該表可以看出鈴音總數(shù)為8000條,前10條音占到了登記總數(shù)的1/4,而后3000條音才占登記總數(shù)的0.4%,鈴音的使用頻度相差極大。
由于鈴音文件使用頻率的巨大差異性,就給CACHE的使用提供了前提,如圖1、圖2結(jié)合表一的數(shù)據(jù)分析可以看出,只需要緩存前800條語音,就可以達到90%以上的命中率。而一條鈴音文件按300k計算,所需的內(nèi)存大小為800×300k=240M,這在技術(shù)和成本上都是可以接受的。
表一
要在語音增值業(yè)務(wù)系統(tǒng)中使用CACHE技術(shù),主要存在這么幾個問題1、CACHE算法通常要進行大量的換入換出操作,這樣會很容易產(chǎn)生內(nèi)存碎片,對于語音文件,由于其大小不定,這個問題更加嚴(yán)重。
2、CACHE算法往往比較復(fù)雜,涉及到權(quán)值的計算,換入換出的操作,CACHE塊的查找等等,會占用大量的CPU資源。
通過對語音增值業(yè)務(wù)數(shù)據(jù)文件的使用情況進行分析可以發(fā)現(xiàn),增值業(yè)務(wù)數(shù)據(jù)文件的使用頻率是在平穩(wěn)變化的,也就是說相鄰一段時間內(nèi),增值業(yè)務(wù)數(shù)據(jù)文件的使用頻率是基本相同的。
本發(fā)明通過建立緩沖(CACHE)存取區(qū)來存儲增值業(yè)務(wù)數(shù)據(jù)文件,該CACHE存取區(qū)可以建立在普通內(nèi)存上,其系統(tǒng)結(jié)構(gòu)圖如圖3所示。
利用CACHE存取區(qū)來處理增值業(yè)務(wù)數(shù)據(jù)信息的具體過程如如圖4所示A、依據(jù)增值業(yè)務(wù)數(shù)據(jù)文件上一設(shè)定周期中使用頻率屬性更新CACHE存取區(qū)。
B、系統(tǒng)需要使用增值業(yè)務(wù)數(shù)據(jù)文件時,依據(jù)所述增值業(yè)務(wù)數(shù)據(jù)文件標(biāo)識在CACHE存取區(qū)中進行檢索。
C、判斷所述增值業(yè)務(wù)數(shù)據(jù)文件是否在該CACHE存取區(qū)中,如果是,直接調(diào)用;否則,在文件服務(wù)器上進行檢索。
在檢索到所述增值業(yè)務(wù)數(shù)據(jù)文件并調(diào)用后,更新該增值業(yè)務(wù)數(shù)據(jù)文件的使用頻率值,如可以將該增值業(yè)務(wù)數(shù)據(jù)文件本周期的使用頻率值加1。
系統(tǒng)還對本次設(shè)定周期是否結(jié)束進行檢測,若本周期結(jié)束,則記錄本次周期增值業(yè)務(wù)數(shù)據(jù)文件的使用頻率,根據(jù)記錄結(jié)果計算文件權(quán)值,將CACHE存取區(qū)內(nèi)容清空,標(biāo)識本次設(shè)定周期為上一周期,更新CACHE存取區(qū)。設(shè)定周期的結(jié)束點是系統(tǒng)負載最小的時間點。
文件的權(quán)值可以依據(jù)文件的使用次數(shù)和大小進行加權(quán)計算,比如W1×Num-W2×Size,其中Num是指文件被使用的次數(shù),Size是指文件大小,W1和W2指加權(quán)系數(shù),依據(jù)系統(tǒng)需要設(shè)定。也可以依據(jù)系統(tǒng)需要引入其他文件屬性及使用屬性確定權(quán)值,如文件更新時間等等。
更新CACHE存取區(qū)可以依據(jù)增值業(yè)務(wù)數(shù)據(jù)文件的上一周期的權(quán)值依次將語音文件從服務(wù)器加載到CACHE存取區(qū)中,直到加滿為止。
CACHE存取區(qū)數(shù)據(jù)并不像現(xiàn)有CACHE算法對數(shù)據(jù)實時更新,平時運行時只記錄當(dāng)天語音文件的使用頻率,在凌晨負荷很小的時候根據(jù)記錄的結(jié)果計算文件權(quán)值,再將CACHE中的內(nèi)容清空,然后依據(jù)權(quán)值依次將語音文件從服務(wù)器加載到CACHE中,直到加滿為止。這樣每次CACHE中保存的就是上一天統(tǒng)計的語音文件,由于當(dāng)天語音文件的使用頻率和上一天基本相同,所以這么作是符合實際的。
為了便于CACHE存取區(qū)的操作,可以將存儲CACHE存取區(qū)的普通內(nèi)存虛擬成Ramdisk,在其上安裝文件系統(tǒng),這樣操作CACHE存取區(qū)就像操作普通磁盤一樣。將存儲CACHE存取區(qū)的普通內(nèi)存虛擬成Ramdisk,就可以利用操作系統(tǒng)現(xiàn)有的文件管理功能來管理CACHE存取區(qū)中的文件,而不需要同現(xiàn)有的CACHE技術(shù)一樣,進行手工管理,需要為文件建立索引,設(shè)計查找算法,管理存取等。文件系統(tǒng)可以建立CACHE存取區(qū)內(nèi)增值業(yè)務(wù)數(shù)據(jù)文件內(nèi)存索引、起始及結(jié)束點,并進行CACHE存取區(qū)內(nèi)增值業(yè)務(wù)數(shù)據(jù)文件的換入換出操作。用戶并不需要關(guān)心數(shù)據(jù)文件內(nèi)存索引、起始及結(jié)束點,這些均由現(xiàn)有操作系統(tǒng)處理。
為了避免因文件服務(wù)器上的文件變化而未實時更新CACHE存取區(qū)數(shù)據(jù),導(dǎo)致從CACHE存取區(qū)內(nèi)調(diào)取的相應(yīng)增值業(yè)務(wù)數(shù)據(jù)文件時產(chǎn)生錯誤,可在每次使用CACHE存取區(qū)增值業(yè)務(wù)數(shù)據(jù)文件數(shù)據(jù)前,將CACHE中的文件屬性和服務(wù)器上的進行比較,如果相符才調(diào)取使用該增值業(yè)務(wù)數(shù)據(jù)文件,否則,到文件服務(wù)器取該相應(yīng)增值業(yè)務(wù)數(shù)據(jù)文件,以避免誤讀失效數(shù)據(jù)。
因系統(tǒng)第一次運行時CACHE不能起作用,會對文件服務(wù)器產(chǎn)生較大的負載,為解決這一問題,系統(tǒng)第一次運行CACHE時對其進行初始化,即系統(tǒng)實時檢查增值業(yè)務(wù)數(shù)據(jù)文件的使用情況,當(dāng)某個文件被使用了多次而還沒有被加載時,如某個文件使用超過了設(shè)定的閥值且還未被加載,且CACHE中還有空間時,將其復(fù)制至CACHE中。
權(quán)利要求
1.一種語音增值業(yè)務(wù)數(shù)據(jù)信息處理方法,其特征在于,建立用于存儲增值業(yè)務(wù)數(shù)據(jù)文件的緩沖(CACHE)存取區(qū),所述方法包括如下步驟A、根據(jù)前一設(shè)定周期中增值業(yè)務(wù)數(shù)據(jù)文件的使用頻率屬性更新CACHE存取區(qū);B、當(dāng)系統(tǒng)需要使用增值業(yè)務(wù)數(shù)據(jù)文件時,依據(jù)所述增值業(yè)務(wù)數(shù)據(jù)文件標(biāo)識在CACHE存取區(qū)中進行檢索,判斷所述增值業(yè)務(wù)數(shù)據(jù)文件是否在該CACHE存取區(qū)中,如果是,則直接從CACHE存取區(qū)調(diào)用所述增值業(yè)務(wù)數(shù)據(jù)文件;否則,從文件服務(wù)器上調(diào)用所述增值業(yè)務(wù)數(shù)據(jù)文件。
2.如權(quán)利要求1所述的方法,其特征在于,在CACHE存取區(qū)或文件服務(wù)器上檢索到所述增值業(yè)務(wù)數(shù)據(jù)文件并調(diào)用后,更新該增值業(yè)務(wù)數(shù)據(jù)文件的使用頻率值。
3.如權(quán)利要求1所述的方法,其特征在于,步驟B后進一步包括,檢測本次設(shè)定周期是否結(jié)束,并在周期結(jié)束時記錄本次周期內(nèi)增值業(yè)務(wù)數(shù)據(jù)文件的使用頻率和計算該文件權(quán)值,以及將CACHE存取區(qū)內(nèi)容清空和標(biāo)識本次設(shè)定周期為前一周期后進入步驟A。
4.如權(quán)利要求1所述的方法,其特征在于,步驟A是指依據(jù)增值業(yè)務(wù)數(shù)據(jù)文件在前一周期的使用頻率屬性依次將文件從文件服務(wù)器加載到CACHE存取區(qū)中,直到加滿為止。
5.如權(quán)利要求1所述的方法,其特征在于,所述設(shè)定周期的結(jié)束點為系統(tǒng)負載最小的時間點。
6.如權(quán)利要求1所述的方法,其特征在于,所述CACHE存取區(qū)設(shè)置在普通內(nèi)存中。
7.如權(quán)利要求6所述的方法,其特征在于,將存儲CACHE存取區(qū)的普通內(nèi)存虛擬成隨機存儲器磁盤(Ramdisk),在其上安裝文件系統(tǒng)對CACHE存取區(qū)進行操作。
8.如權(quán)利要求7所述的方法,其特征在于,所述文件系統(tǒng)對CACHE存取區(qū)進行操作包括建立CACHE存取區(qū)內(nèi)增值業(yè)務(wù)數(shù)據(jù)文件內(nèi)存索引、起始及結(jié)束點,并可以進行CACHE存取區(qū)內(nèi)增值業(yè)務(wù)數(shù)據(jù)文件的換入換出操作。
9.如權(quán)利要求1所述的方法,其特征在于,步驟B中,在判斷所述增值業(yè)務(wù)數(shù)據(jù)文件在CACHE存取區(qū)中后,先將CACHE存取區(qū)中的文件屬性和文件服務(wù)器上該文件屬性進行比較,如果相一致則直接調(diào)用。
10.如權(quán)利要求1所述的方法,其特征在于,在初始設(shè)定周期運行時,實時檢查增值業(yè)務(wù)數(shù)據(jù)文件的使用情況,并在未被加載的文件的使用次數(shù)超過了設(shè)定的閥值且CACHE還有空間時,將其復(fù)制至CACHE中。
全文摘要
本發(fā)明公開一種語音增值業(yè)務(wù)數(shù)據(jù)信息處理方法,該方法建立用于存儲增值業(yè)務(wù)數(shù)據(jù)文件的緩沖(CACHE)存取區(qū),并根據(jù)前一設(shè)定周期中增值業(yè)務(wù)數(shù)據(jù)文件的使用頻率屬性更新CACHE存取區(qū);當(dāng)系統(tǒng)需要使用增值業(yè)務(wù)數(shù)據(jù)文件時,依據(jù)所述增值業(yè)務(wù)數(shù)據(jù)文件標(biāo)識在CACHE存取區(qū)中進行檢索,判斷所述增值業(yè)務(wù)數(shù)據(jù)文件是否在該CACHE存取區(qū)中,如果是,則直接從CACHE存取區(qū)調(diào)用所述增值業(yè)務(wù)數(shù)據(jù)文件;否則,從文件服務(wù)器上調(diào)用所述增值業(yè)務(wù)數(shù)據(jù)文件。通過本方法能夠在基本不增加網(wǎng)絡(luò)和文件服務(wù)器負荷的情況下替代原有的硬盤方案,從而提高系統(tǒng)的可靠性和集成度。
文檔編號H04M3/42GK1845567SQ20051006341
公開日2006年10月11日 申請日期2005年4月7日 優(yōu)先權(quán)日2005年4月7日
發(fā)明者曹漢平, 游崇, 楊高峰 申請人:華為技術(shù)有限公司