專利名稱:一種基于手機話費數(shù)據挖掘的互聯(lián)網捐款系統(tǒng)的制作方法
技術領域:
本發(fā)明涉及一種網絡系統(tǒng),尤其涉及一種基于手機話費數(shù)據挖掘的互聯(lián)網捐款系統(tǒng)。
背景技術:
在這個經濟高速發(fā)展的時代中,貧困問題雖一定程度的得到了緩和,但并未完全解決,依然是困擾各國及全球發(fā)展的重要難題之一。傳統(tǒng)的捐助模式主要是由捐助者將善款直接提供給慈善機構,由慈善機構去選定貧困對象進行發(fā)放,但這種模式一直存在著幾個較大的問題。首先,慈善機構的維持需要成本,這就為社會增加了額外的成本損耗,再加上機構中可能存在的挪用、浪費及信息披露不完全等現(xiàn)象,將直接導致這類非營利性公益機構對資金的運用效率相對較低。其次,此類模式由于程序較為復雜,不利于小規(guī)模的善款的積累,同時其受地域限制較強,若國際友人想打破限制對別國公民進行捐贈,其復雜性將給捐助者帶來高昂的間接成本,這就造成了國際捐助這類同樣重要的捐助方式受到了相當大的阻礙。此外,善款發(fā)放對象的選擇也存在著一定的困難,選擇怎樣的分發(fā)標準、如何驗證被捐助者的信息是否屬實、發(fā)放給被捐助者的資金額度如何控制,這些問題都關乎善款落實的質量。當然,在全球經濟發(fā)展不斷產生貧富差距等社會性問題的同時,也在創(chuàng)造著一些解決此類問題的新方法、新機遇。根據國際電信聯(lián)盟數(shù)據顯示,2010年全球手機用戶的手機用戶達到了 52.8億。其中中國內陸地區(qū)達到7.38億,占整個國家人口的56.97%。互聯(lián)網、手機等信息工具的廣泛普及,使得世界各地的相互交流變得較為容易,也為我們通過信息手段來改善貧困問題帶來了新的機會。針對上述背景,本發(fā)明希望能夠為捐助者提供一種簡便快捷的捐款模式,打破傳統(tǒng)的國界及地域的限制,使更多人積極地加入到慈善行業(yè)中,這種模式在極大地節(jié)約社會成本的同時準確有效地將善款送達至貧困者手中,避免資金的流失與浪費,同時,這種基于互聯(lián)網的捐款方式還將增強捐款者與被捐款者及其所在地的感情關聯(lián),為全球化友好進程的發(fā)展起到極大的推動作用。
發(fā)明內容
為了克服上述背景技術的不足之處,本發(fā)明所提出的一種基于手機話費數(shù)據挖掘的互聯(lián)網捐款系統(tǒng)將通過手機話費的消費數(shù)據來識別用戶的貧困情況,并進一步通過互聯(lián)網為捐款者提供便捷而有效的捐款方式,使得捐款能快速且有效地直接充入貧困者的話費余額中,其技術方案包括如下組成部分:(I)數(shù)據挖掘模塊,該模塊主要包含初始處理、聚類處理、貧困類群篩選三個部分。初始處理需要將移動通信運營商提供的以月結算的用戶歷史話費數(shù)據信息進行分次過濾,該數(shù)據信息包含用戶手機號碼、用戶實名編號、用戶所在地區(qū)、用戶號碼狀態(tài)、用戶月話費金額、用戶月套餐業(yè)務使用情況及相應費用、用戶主叫時長、用戶主叫次數(shù)、用戶接聽時長、用戶接聽次數(shù)、用戶短信發(fā)送數(shù)量及用戶短信接收數(shù)量,首先,剔除前a個月中明顯存在錯誤數(shù)據或某些數(shù)據殘缺的用戶;其次,剔除狀態(tài)通訊服務規(guī)定為非正常的用戶,即剔除如高額停機、局方停機、停機保號、申請預銷停機、申請停機及欠費停機等的用戶 ’最后,剔除在前a個月中存在b個月以上月話費金額大于c的用戶,從而得到一個初步的數(shù)據樣本。聚類處理需要將用戶進行根據話費的消耗情況利用聚類分析進行分類,提取出用戶前a個月的月話費金額數(shù)據并對其采用聚類算法,例如應用以歐幾里德距離作為聚類測度及數(shù)據代數(shù)平均作為聚類中心的k-means算法,其k值由貧困類群篩選中所涉及到的篩選參數(shù)的個數(shù)η確定,即其滿足k = n+1,在應用此算法后用戶將被分為k個聚類,使得各聚類本身盡可能的緊湊,而各聚類之間盡可能的分開。貧困類群篩選將對上述k個聚類中不符合貧困群體特性的部分進行剔除,從而得到一個最可能為貧困人口的群體,其涉及的非貧困參數(shù)主要包含次要或奢侈業(yè)務使用較多(指的是如彩信、彩鈴、大流量的GPRS服務等)、日常話費優(yōu)化不足(指的是對于某些每月都存在的固定費用可以采用套餐節(jié)省花費的卻未采用)、所在區(qū)域發(fā)展較好、存在一人多號情況、移動電話需求不足(指的是使用手機進行主叫與接聽的次數(shù))等。對于聚類的剔除,采用基于參數(shù)重要性的由主到次分布剔除法,例如先計算出各個聚類中b個月以上非必要業(yè)務使用金額都超過d的用戶數(shù)量,然后剔除該數(shù)量最多的一個聚類;相應地計算出各個聚類中b個月以上都存在未進行日常話費優(yōu)化的用戶數(shù)量、所在地為一線城市及二線城市的用戶數(shù)量、存在一人多號的用戶數(shù)量、b個月以上接聽及主叫次數(shù)同時小于e次的用戶數(shù)量,并依次以其為指標對聚類進行剔除。在剔除結束后將得到唯一的一個聚類,再對其中的滿足這五個指標的任意一個的用戶進行逐個剔除,則最后得到的用戶群即作為系統(tǒng)的潛在捐助對象。(2)話費捐助模塊,該模塊主要包含信息展示、捐助處理兩個部分。信息展示將把上述通過話費信息挖掘出的貧困用戶的手機號碼及所在地址數(shù)據儲存在web服務器端并在捐助網站的界面上進行顯示。捐助處理將把捐助者來`助金額,并在充值成功后將信息反饋給捐助者。
圖1為本發(fā)明一種基于手機話費數(shù)據挖掘的互聯(lián)網捐款系統(tǒng)中的互聯(lián)網捐款系統(tǒng)所包含的各部分模塊匯總圖。圖2為本發(fā)明一種基于手機話費數(shù)據挖掘的互聯(lián)網捐款系統(tǒng)中的初始處理步驟圖。圖3為本發(fā)明一種基于手機話費數(shù)據挖掘的互聯(lián)網捐款系統(tǒng)中的聚類處理、貧困類群篩選步驟圖。圖4為本發(fā)明一種基于手機話費數(shù)據挖掘的互聯(lián)網捐款系統(tǒng)中的通過網絡所實現(xiàn)的話費捐助流程圖。
具體實施例方式下面結合附圖與具體實施例來對本發(fā)明所述的一種基于手機話費數(shù)據挖掘的互聯(lián)網捐款系統(tǒng)作詳細描述。但本發(fā)明并不僅限于實施例,其范圍由權利要求規(guī)定。下面將描述大量的具體細節(jié)以提供對本發(fā)明的詳細理解,但所述細節(jié)僅用于例目的,可以在不涉及這些具體細節(jié)的一些或全部的情況下根據權利要求實踐本發(fā)明。以限于國內用戶的互聯(lián)網捐助系統(tǒng)為例,首先需要對全國的話費數(shù)據進行采集及匯總,并在整理后將其存入數(shù)據庫中,但由于國內手機用戶太多,從而導致數(shù)據量太過龐大,可以采取先分省進行數(shù)據初步處理再匯總的方式。如圖1所示,本發(fā)明所述的一種基于手機話費數(shù)據挖掘的互聯(lián)網捐款系統(tǒng)包含數(shù)據挖掘與話費捐助兩個基本模塊,先由數(shù)據挖掘模塊篩選出需被捐款的用戶信息,再由話費捐助模塊基于此信息引導捐款工作的完成。如圖2所示,系統(tǒng)將先對話費信息進行初步處理以刪除一些無法正常使用的數(shù)據,包括剔除前a個月中明顯存在錯誤數(shù)據或某些數(shù)據殘缺、狀態(tài)通訊服務規(guī)定為“非正?!奔锤哳~停機、局方停機、停機保號、申請預銷停機、申請停機及欠費停機、前a個月中存在b個月以上月話費金額大于c的三大類用戶。在此例中,可首先剔除存在前10個月中用戶月話費金額、各類套餐及業(yè)務使用費、用戶主叫時長、用戶主叫次數(shù)、用戶接聽時長、用戶接聽次數(shù)、用戶短信發(fā)送數(shù)量及用戶短信接收數(shù)量為錯誤類型數(shù)據、負值、空值或數(shù)值過大的孤立點情況的用戶信息,剔除前10個月中存在用戶手機號碼、用戶實名編號為錯誤類型數(shù)據、錯誤位數(shù)格式或空值情況的用戶信息,剔除前10個月中用戶所在地區(qū)錯誤類型數(shù)據或空值情況的用戶信息;剔除完上述異常數(shù)據后,對狀態(tài)為高額停機、局方停機、停機保號、申請預銷停機、申請停機 及欠費停機的用戶信息進行剔除,過濾出號碼至今為止仍然正常使用的用戶;最后,剔除那些在前10個月中存在3個月及其以上月話費金額大于100的用戶信息,將那些明顯不屬于貧困群體的用戶排除在數(shù)據樣本之外。如圖3所示,在經過上述過程得到了初步話費信息樣本數(shù)據后,即可采用聚類分析對樣本數(shù)據進行分類處理,這種分類手段基于用戶的話費消費行為,使得其同類用戶之間聯(lián)系較強,而不同類的用戶之間關聯(lián)較弱,因消費模式在相當程度上反映了人們的收入情況,此分類也可近似視為根據收入情況所作的分類,即某一個聚類將為收入較低的人群即系統(tǒng)需要的貧困群體。設定K值為6,即將數(shù)據樣本分為六個類,對于由用戶前10個月的月話費金額組成的多維話費流數(shù)據,系統(tǒng)采用歐式距離來對數(shù)據間的距離進行度量,其公式為 d = [ (A1-B1) 2+ (A2-B2) 2+...+ (A10-B10) 2] 1/2,其中(AnA2, *..,Α10), (BijB2,…,B10)為兩個不同的用戶在前十個月中的話費流數(shù)據;采用數(shù)據群的代數(shù)平均值來表示一個聚類白勺中心對象,其公式為 m = ((An+A12+…+Aln)/n, (A21+A22+...+A2n)/n,…,(Aml+Am2+...+Amn)/n),其中(Akl,Akl,…,Akn),特別的,整數(shù)k屬于[1,10]。從數(shù)據樣本中隨機抽取6個數(shù)據作為初始聚類中心,計算每個數(shù)據與這些中心對象的距離,將數(shù)據劃分進與其具有最小距離的聚類中;對新生成的6個聚類重新計算其中心對象,同時再重新計算每個數(shù)據與這些中心對象的距離,將數(shù)據劃分進與其具有最小距離的聚類中;不斷重復此過程直至前后兩次的中心對象重疊為止,至此,將得到包含潛在貧困群體在內的6個最終聚類。如圖3所示,由于貧困特征屬于較為隱性的特征,系統(tǒng)采用反向排除法進行篩選,即逐步剔除那些比較不具有貧困特性的群體,以得到最終的貧困群體。對于上述6個聚類,本例將按照次要或奢侈業(yè)務使用較多、日常話費優(yōu)化不足、所在區(qū)域發(fā)展較好、存在一人多號情況、移動電話需求不足5個非貧困參數(shù)的順序對聚類進行依次剔除。首先,計算出各個聚類中所存在的3個月以上的月次要或奢侈業(yè)務使用費用超過15元以上的用戶數(shù)量,其中主要包括彩信彩鈴等多媒體娛樂性質的業(yè)務、手機報車訊通等商務資訊性質的業(yè)務及30M以上的GPRS流量業(yè)務,并將具有此類用戶最多的一個聚類進行剔除;其次,計算出各個聚類中所存在的3個月以上的日常話費優(yōu)化不足的用戶數(shù)量,其中主要包括使用長途、短信、漫游已達到最低套餐標準而又沒有申請?zhí)撞头盏那闆r,并將具有此類用戶最多的一個聚類進行剔除;再次,計算出各個聚類中包含一線或是二線城市的用戶數(shù)量,一線城市包括北京、上海、廣州、深圳,二線城市包括杭州、濟南、南京、天津、重慶、青島、大連、寧波、廈門、武漢、沈陽、成都、哈爾濱、長春、西安、蘇州、無錫、溫州、煙臺、長沙、福州、鄭州、石家莊、太原、合肥、南昌、南寧、昆明,將具有此類用戶最多的一個聚類進行剔除;然后,計算出各個聚類中存在一人多號情況的用戶數(shù)量,一人多號由用戶實名編號與該實名編號下所擁有的號碼來判定,若后者大于前者,則屬于一人多號情況,將具有此類用戶最多的一個聚類進行剔除;最后,計算出各個聚類中3個月以上月主叫次數(shù)與月接聽次數(shù)都小于8次的用戶,并將具有此類用戶最多的一個聚類進行剔除。至此,系統(tǒng)將得到唯一的一個聚類,計算此聚類所包含的用戶數(shù)量,若其高于或等于初步話費信息樣本數(shù)據的10%,則需再次使用上述的5個非貧困參數(shù)對此聚類中的用戶進行進一步的剔除,即將任意滿足以上五個條件之一的用戶從該聚類中剔除,進而得到最終的潛在貧困群體數(shù)據;若其低于于初步話費信息樣本數(shù)據的10%,則可不進行此步驟,直接將此聚類作為最終潛在貧困群體數(shù)據。如圖4所示,當最終潛在貧困群體數(shù)據挖掘完成后,將被儲存至信息展示網站的服務器端并在網站前臺顯示出來,其中顯示的內容僅包括貧困用戶的手機及所處地區(qū)。當捐助者訪問本站時,即可在這些貧困用戶中選擇其想資助的對象,可一次捐助一個或多個,當捐助者輸入捐贈金額并通過網銀、支付寶、Paypal或是其它網絡支付形式進行支付后,系統(tǒng)將立即為該貧困用戶充值相應金額的話費,并在充值成功后將成功信息反饋給捐助者。任意小的金額都可以進行捐助,若捐助金額未達到充值最低標準,則系統(tǒng)將暫時保管此金額,一旦累積到滿足標準系統(tǒng)將立即為該貧困用戶進行充值,并將充值結果同時反饋給為此次充值進行過捐助的各個捐助者。同時,為豐富用戶體驗,增進捐款者與被捐款者及其所在地的感情關聯(lián),信息將以三維地球站點的形式進行展示,將用戶的地址對應到三維地球的相應位置,捐助者可通過將地球進行縮放、滾動等操作更加直觀地與貧困用戶的信息進行接觸,同時,在捐助者捐款成功后,系統(tǒng)還將提供更詳細的關于被捐助者的相關信息,但并不涉及該用戶的個人隱私,主要包括其所在地的自然地理、歷史人文、實時新聞、趣聞軼事等,在豐富文化知識的同時,并以此為基礎與被捐助地區(qū)建立更深層次的精神情感紐帶,促進全球化友好進程的加速發(fā)展。這種通過手機話費挖掘貧困用戶并通過手機話費充值進行捐贈的方式不僅解決了傳統(tǒng)捐贈模式中對人力及其他資源的無謂消耗問題,在極大簡化用戶的捐贈及受贈過程的同時又保證了捐贈的精準性,更重要的在于它提供了一種資金的全球化流動機制,通過積少成多,促使資源從高收入國家向低收入國家流入,從高收入地區(qū)向低收入地區(qū)流動。并且,在捐助活動中,存在一些敏感的心理學因素,捐助者若與被捐助者建立起直白而完全的聯(lián)系,那么必然會一定程度上對雙方造成生活、心里上的影響,而本發(fā)明通過建立起二者之間較為間接的感情關聯(lián),實質上是建立了兩個地區(qū)乃至兩個國家之間的聯(lián)系,從而利用這種巧妙而有彈性的關系促進捐贈事業(yè)的持續(xù)發(fā)展。
權利要求
1.一種基于手機話費數(shù)據挖掘的互聯(lián)網捐款系統(tǒng),其特征在于該方法包括如下步驟: 1)數(shù)據挖掘模塊,該模塊主要包含初始處理、聚類處理、貧困類群篩選三個部分。
2)初始處理需要將移動通信運營商提供的以月結算的用戶歷史話費數(shù)據信息進行分次過濾,對不屬于挖掘范疇的用戶的相應信息進行剔除,該數(shù)據信息包含用戶手機號碼、用戶實名編號、用戶所在地區(qū)、用戶號碼狀態(tài)、用戶月話費金額、用戶月套餐業(yè)務使用情況及相應費用、用戶主叫時長、用戶主叫次數(shù)、用戶接聽時長、用戶接聽次數(shù)、用戶短信發(fā)送數(shù)量及用戶短信接收數(shù)量及其他所可能涉及到的話費相關信息。
3)聚類處理需要將用戶進行根據話費的消耗情況利用聚類分析進行分類,提取出用戶前a個月的月話費金額數(shù)據,應用聚類分析算法將其進行分類,進而得到群內用戶話費消費行為相關、而群間用戶話費消費行為存在較大差異的幾個群類。
4)貧困類群篩選將對上述k個聚類中不符合貧困群體特性的部分進行剔除,從而得到一個最可能為貧困人口的群體,根據涉及的非貧困指標的重要性由主要次地對聚類采取逐步剔除,以求得到一個最接近貧困群體的用戶聚類,同時,再對該聚類將不滿足上述指標的用戶進行進一步的剔除。
5)話費捐助模塊,該模塊主要包含信息展示、捐助處理兩個部分。
6)信息展示將把上述通過話費信息挖掘出的貧困用戶的手機號碼及所在地址數(shù)據儲存在web服務器端并在捐助網站的界面上進行顯示。
7)捐助處理將把捐助者來自互聯(lián)網的捐助請求轉化為對貧困用戶的話費充值請求,為貧困用戶的手機充值相應的捐助金額,并在充值成功后將信息反饋給捐助者。
2.根據權利要求1所述的一種基于手機話費數(shù)據挖掘的互聯(lián)網捐款系統(tǒng),其特征在于:步驟(2)所述不屬于挖掘范疇的用戶的相應信息的具體內容包括前a個月中明顯存在錯誤數(shù)據或某些數(shù)據殘缺的用戶,狀態(tài)通訊服務規(guī)定為非正常即高額停機、局方停機、停機保號、申請預銷停機、申請停機及欠費停機等的用戶及前a個月中存在b個月以上月話費金額大于c的用戶的相應信息。
3.根據權利要求1所述的一種基于手機話費數(shù)據挖掘的互聯(lián)網捐款系統(tǒng),其特征在于:步驟(3)中所述的聚類分析算法的具體內容包括K-MEANS算法、K-MEDOIDS算法、Clara算法、Clarans算法。
4.根據權利要求1所述的一種基于手機話費數(shù)據挖掘的互聯(lián)網捐款系統(tǒng),其特征在于:步驟(4)所述的非貧困參數(shù)的具體內容包括次要或奢侈業(yè)務使用較多(指的是如彩信、彩鈴、大流量的GPRS服務等)、日常話費優(yōu)化不足(指的是對于某些每月都存在的固定費用可以采用套餐節(jié)省花費的卻未采用)、所在區(qū)域發(fā)展較好、存在一人多號情況、移動電話需求不足(指的是使用手機進行主叫與接聽的次數(shù)較少)。
全文摘要
本發(fā)明公開了一種基于手機話費數(shù)據挖掘的互聯(lián)網捐款系統(tǒng),該系統(tǒng)結合聚類分析以及雙層篩選等方法基于用戶的話費消費模式對用戶話費數(shù)據進行挖掘,以快捷有效的方式找到需要接收捐助的貧困用戶,主要包含初步處理、聚類處理、貧困類群篩選三個部分,同時,本系統(tǒng)還將通過互聯(lián)網為這部分用戶及潛在捐款者提供了一種有助于捐助過程快速精準進行的以話費充值實現(xiàn)捐助目的的平臺,在極大地提高傳統(tǒng)捐款模式中存在的資源運行效率較低問題的同時,打破傳統(tǒng)的國界及地域對于慈善行為的較大限制,以最寬松的條件讓更多的用戶投身到捐助事業(yè)中,促進慈善事業(yè)的持續(xù)發(fā)展。此外,這種捐款者與被捐款者所在地之間感情關聯(lián)的不斷建立使得全球化進程得到加速。
文檔編號G06Q20/32GK103186854SQ201110448968
公開日2013年7月3日 申請日期2011年12月28日 優(yōu)先權日2011年12月28日
發(fā)明者蔡恒進, 羊志倫, 徐恒, 吳云, 楊善媛 申請人:武漢元寶創(chuàng)意科技有限公司