亚洲成年人黄色一级片,日本香港三级亚洲三级,黄色成人小视频,国产青草视频,国产一区二区久久精品,91在线免费公开视频,成年轻人网站色直接看

高效率的學(xué)生記錄匹配的制作方法

文檔序號(hào):6496819閱讀:240來源:國知局
高效率的學(xué)生記錄匹配的制作方法
【專利摘要】公開了一種用于有效地且智能地匹配學(xué)生注冊(cè)記錄的系統(tǒng)和方法。該方法例如可以用于追蹤學(xué)生從中學(xué)機(jī)構(gòu)到高等教育機(jī)構(gòu)的進(jìn)展情況且生成關(guān)于總的大學(xué)入學(xué)率的統(tǒng)計(jì)資料以通知政策決定。在示例性實(shí)施方式中,匹配算法分析學(xué)生姓名的常用變型以及中學(xué)機(jī)構(gòu)與學(xué)生的當(dāng)前已知地址之間的地理距離,以生成較高可信度的匹配。
【專利說明】高效率的學(xué)生記錄匹配
【背景技術(shù)】
[0001]確保從高中畢業(yè)的所有學(xué)生都為大學(xué)作好準(zhǔn)備是國家的必要的事。存在大的有待拉近的成績差距,并且我們的國家需要提高對(duì)于所有學(xué)生的教育標(biāo)準(zhǔn)以保持競爭力。雖然要達(dá)到這些目標(biāo)存在一系列挑戰(zhàn),但是從聯(lián)邦政府,許多州、地區(qū)和教育改革者以及慈善家的努力中顯現(xiàn)出對(duì)于改變的強(qiáng)勁勢頭。
[0002]一些群體的目標(biāo)是確保從高中畢業(yè)的高中學(xué)生中的80%為大學(xué)作好準(zhǔn)備,在達(dá)到該目標(biāo)的過程中,著重于支持低收入和少數(shù)民族的年輕人。該策略的關(guān)鍵因素是確保豐富和可靠的數(shù)據(jù)的可得,利用這些數(shù)據(jù)在從校舍到州議會(huì)大廈的所有層面上制定出合理的政策和實(shí)踐決策,這對(duì)學(xué)生的成績和成果有很大影響。該數(shù)據(jù)既提供了 K-12教育系統(tǒng)的性能的成果數(shù)據(jù),而且還為項(xiàng)目的評(píng)估提供了強(qiáng)大的數(shù)據(jù)集。進(jìn)一步地,用于測量大學(xué)準(zhǔn)備策略的成功的最有可能的方式將是評(píng)估學(xué)生的高等教育的成績和成果。
[0003]一些需要答復(fù)的獨(dú)特問題如下:
[0004]我們高中畢業(yè)生在畢業(yè)后直接上大學(xué)或者在畢業(yè)后的兩年內(nèi)上大學(xué)的百分比是多少?
[0005]我們學(xué)生團(tuán)體年年保持登記入讀的百分比是多少以及獲得學(xué)位的百分比是多少?
[0006]如何使對(duì)這些問題的答復(fù)針對(duì)各個(gè)地區(qū)、高中學(xué)校和關(guān)鍵的學(xué)生群體而不同?如何使對(duì)這些問題的答復(fù)針對(duì)各種類型的高等教育制度(例如,公共/私人,2年制/4年制,選擇性的/非選擇性的)而不同?
[0007]K-12項(xiàng)目(例如,所完成的高中課程、國家成績測試分?jǐn)?shù))和高等教育成果之間的關(guān)系是什么?
[0008]什么高等教育成果與我們的特定K-12項(xiàng)目(尤其是為了提高大學(xué)準(zhǔn)備率和就讀率而設(shè)計(jì)的項(xiàng)目)相關(guān)聯(lián)?
[0009]尋找這些問題的答案呈現(xiàn)出許多獨(dú)特的且具有挑戰(zhàn)性的難題。必須記錄和維護(hù)的數(shù)據(jù)量本身就是挑戰(zhàn),即使是在這個(gè)數(shù)字化時(shí)代。然而,如果適當(dāng)?shù)亟M織數(shù)據(jù)且向數(shù)據(jù)提供適當(dāng)?shù)挠糜谒饕臉?biāo)識(shí)符,則當(dāng)前的數(shù)據(jù)庫技術(shù)允許大量數(shù)據(jù)的管理。適當(dāng)?shù)乃饕试S有效地且高可靠性地進(jìn)行檢索。利用所積累的數(shù)據(jù)和適當(dāng)?shù)乃饕?,可以答?fù)部分上述問題,并且為我們的一些教育難題找到了解決方案。
[0010]目前,國內(nèi)大多數(shù)大學(xué)生的記錄由全國學(xué)生資料庫存儲(chǔ)和保管。該機(jī)構(gòu)通過維護(hù)來自學(xué)院和大學(xué)的反映其當(dāng)前招生情況的更新信息的數(shù)據(jù)庫,來提供許多政府職能所需的服務(wù)(例如,大學(xué)貸款服務(wù))。該數(shù)據(jù)庫目前持有許多記錄,這些記錄反映了從1993年以來的大學(xué)招生數(shù)據(jù)。全國的高中學(xué)校地區(qū)具有關(guān)于其學(xué)生的信息,包括學(xué)生在標(biāo)準(zhǔn)化考試中的成績?nèi)绾?,學(xué)生的種族和影響教育的其它因素。
[0011]因?yàn)樵谥袑W(xué)記錄和高等教育記錄之間出現(xiàn)的差異,導(dǎo)致將來自高中學(xué)校的記錄匹配到大學(xué)注冊(cè)記錄的能力是難以滿足的。這些問題可以包括簡單的筆誤、學(xué)生改變其姓名、學(xué)生的姓名通過什么形式記錄。例如,在中學(xué)記錄上,學(xué)生的姓名可以是Jimmy Johnson,但是在高等教育記錄中,他的姓名被記錄為James Johnson或者Jim Johnson。在這種情況下,即使一名學(xué)生在兩個(gè)數(shù)據(jù)庫中都有記錄,匹配中學(xué)記錄和高等教育記錄也可能是困難的或者無法實(shí)現(xiàn)的。這會(huì)導(dǎo)致Ji_y沒有去上大學(xué)的錯(cuò)誤結(jié)論。
[0012]為了有助于防止出現(xiàn)不匹配,用戶將經(jīng)常想要使用學(xué)生的社會(huì)安全號(hào)碼(SocialSecurity Number, SSN)作為標(biāo)識(shí)符來獲取匹配。然而,在當(dāng)前的隱私法(例如家庭教育權(quán)利和隱私法(FERPA))下,不允許研究員出于研究目的而使用SSN來匹配記錄。因此,代理處和研究員可被迫使用姓名和出生日期來進(jìn)行搜索,導(dǎo)致準(zhǔn)確度低的結(jié)果。
[0013]因此,需要這樣的系統(tǒng),該系統(tǒng)在符合保護(hù)學(xué)生信息的法律的同時(shí),允許在匹配高等教育數(shù)據(jù)庫以提供與中學(xué)學(xué)生信息的匹配上增大可靠性和效率。

【發(fā)明內(nèi)容】

[0014]公開了一種用于有效地且智能地匹配學(xué)生注冊(cè)記錄的計(jì)算機(jī)系統(tǒng)和基于計(jì)算機(jī)的方法。該方法例如可以用于利用計(jì)算機(jī)追蹤學(xué)生從中學(xué)機(jī)構(gòu)到高等教育機(jī)構(gòu)的進(jìn)展情況且生成關(guān)于總的大學(xué)注冊(cè)率的統(tǒng)計(jì)資料以報(bào)告政策決定。在示例性實(shí)施方式中,可將來自中學(xué)機(jī)構(gòu)(例如高中學(xué)校)的記錄與來自高等教育機(jī)構(gòu)(例如大學(xué)和學(xué)院)的記錄進(jìn)行匹配。
[0015]可以使用基于計(jì)算機(jī)的在計(jì)算機(jī)處理器中實(shí)現(xiàn)的匹配算法來匹配來自各個(gè)機(jī)構(gòu)的記錄,該匹配算法基于姓名、姓名的變型、出生日期、地理位置、注冊(cè)日期和中學(xué)機(jī)構(gòu)代碼來匹配記錄。在示例性實(shí)施方式中,該匹配算法可以基于學(xué)生姓名的拼寫的常用變型來匹配姓名和出生日期。姓名的常用變型可以通過檢查預(yù)先匹配的學(xué)生注冊(cè)記錄并識(shí)別學(xué)生姓名的拼寫的常用變型來確定。該匹配算法也可以調(diào)換記錄的名字和中間名,以將該記錄與其它記錄進(jìn)行匹配。附加地,該匹配算法可以計(jì)算中學(xué)機(jī)構(gòu)和學(xué)生的當(dāng)前已知地址之間的地理距離,以生成較高可信度的匹配。此外,該匹配算法可以將與高等教育機(jī)構(gòu)記錄相關(guān)聯(lián)的注冊(cè)日期與學(xué)生從其中學(xué)機(jī)構(gòu)畢業(yè)的日期進(jìn)行比較。
【專利附圖】

【附圖說明】
[0016]圖1示出中學(xué)記錄數(shù)據(jù)庫和高等教育記錄數(shù)據(jù)庫以及其中的個(gè)人記錄;
[0017]圖2示出用于在中學(xué)數(shù)據(jù)庫和高等教育數(shù)據(jù)庫之間匹配記錄的匹配算法;以及
[0018]圖3示出用于匹配的硬件系統(tǒng)。
【具體實(shí)施方式】
[0019]在下面的詳細(xì)描述中,參照附圖,這些附圖形成本發(fā)明的一部分并且以說明性的方式示出本發(fā)明的【具體實(shí)施方式】。足夠詳細(xì)地描述這些實(shí)施方式以使本領(lǐng)域的技術(shù)人員能夠?qū)崿F(xiàn)這些實(shí)施方式,并且應(yīng)當(dāng)理解,可以利用其它實(shí)施方式且可進(jìn)行符合邏輯的處理變化。
[0020]圖1示出中學(xué)(高中學(xué)校)記錄數(shù)據(jù)庫100,高等教育記錄數(shù)據(jù)庫120。中學(xué)記錄數(shù)據(jù)庫100包括記錄110、記錄112、記錄114、記錄116,其中,記錄110、記錄112、記錄114、記錄116每個(gè)都包含單個(gè)學(xué)生的信息。記錄110、記錄112、記錄114、記錄116可以包括名字和姓氏、中間名或者首字母、SSN、出生日期(D0B)、中學(xué)學(xué)校的畢業(yè)日期、以及中學(xué)學(xué)校代碼?;蛘?,記錄110、記錄112、記錄114、記錄116可以包括學(xué)生的SSN、名字和姓氏、種族和高中學(xué)校代碼。一些記錄110、記錄112、記錄114、記錄116可以包括SSN,其它記錄可以不包括SSN。進(jìn)一步地,個(gè)人記錄110、個(gè)人記錄112、個(gè)人記錄114、個(gè)人記錄116每個(gè)都可以包括除名字和姓氏以及出生日期以外的不同信息。本質(zhì)上,記錄110、記錄112、記錄114、記錄116可以包括學(xué)生的許多標(biāo)識(shí)符和屬性,且不應(yīng)當(dāng)被限制于所給出的示例。
[0021]高等教育數(shù)據(jù)庫120包括學(xué)生記錄130、學(xué)生記錄132、學(xué)生記錄134、學(xué)生記錄136、學(xué)生記錄138。這些記錄130、記錄132、記錄134、記錄136、記錄138中的每個(gè)都可以包括與中學(xué)記錄數(shù)據(jù)庫100中的記錄110、記錄112、記錄114、記錄116相同的信息,例如,學(xué)生的名字和姓氏、中間名或者首字母、SSN, DOB和其它標(biāo)識(shí)信息。應(yīng)該理解,記錄130、記錄132、記錄134、記錄136、記錄138可以包括其它信息且這些信息可以不限于所給出的示例。高等教育記錄130、記錄132、記錄134、記錄136、記錄138由高等教育機(jī)構(gòu)提供且反映這些機(jī)構(gòu)的各自的招生記錄。進(jìn)一步地,當(dāng)在高等教育數(shù)據(jù)庫120中創(chuàng)建高等教育記錄130、記錄132、記錄134、記錄136、記錄138時(shí),這些記錄中的每個(gè)記錄都被提供獨(dú)特的或特定的聞等教育標(biāo)識(shí)符。
[0022]中學(xué)記錄數(shù)據(jù)庫100和高等教育記錄數(shù)據(jù)庫120可以配置在任何允許有效地存儲(chǔ)和檢索數(shù)據(jù)庫的數(shù)據(jù)庫結(jié)構(gòu)中。中學(xué)數(shù)據(jù)庫100可以包括為具有特定屬性而已經(jīng)被預(yù)先選擇的記錄。例如,中學(xué)數(shù)據(jù)庫100中的所有記錄可以是進(jìn)入某高中學(xué)?;蛘哌M(jìn)入某地區(qū)的高中學(xué)校的學(xué)生。進(jìn)一步地,中學(xué)數(shù)據(jù)庫100可以包括特定種族的學(xué)生的記錄或者在特定的標(biāo)準(zhǔn)化考試中得分高于或低于某閾值分?jǐn)?shù)的學(xué)生的記錄。這些因素(例如,與追蹤教育成績相關(guān)的因素)的任何組合可以用于確定什么樣的記錄包括在中學(xué)數(shù)據(jù)庫100中。
[0023]為了追蹤教育進(jìn)展,需要確定中學(xué)數(shù)據(jù)庫100中這些預(yù)先選擇的學(xué)生中哪些學(xué)生繼續(xù)進(jìn)入高等教育機(jī)構(gòu)。這樣做,使得中學(xué)數(shù)據(jù)庫100中的記錄與高等教育數(shù)據(jù)庫120中的記錄相匹配,如圖2所示的匹配過程200所示。
[0024]圖2示出根據(jù)示例性實(shí)施方式的可用來匹配記錄的計(jì)算機(jī)化的匹配過程200。具體地,過程200可以用于匹配學(xué)生記錄。計(jì)算機(jī)化的過程200可以在使用計(jì)算機(jī)可讀代碼的處理器上實(shí)現(xiàn),該處理器例如為服務(wù)器(例如,圖3中的服務(wù)器310)。計(jì)算機(jī)化的過程200可以實(shí)現(xiàn)成匹配存儲(chǔ)在同一數(shù)據(jù)庫中或不同數(shù)據(jù)庫中的學(xué)生記錄。例如,過程200可以用于將來自中學(xué)數(shù)據(jù)庫100的記錄110與其在高等教育數(shù)據(jù)庫120中的對(duì)應(yīng)記錄進(jìn)行匹配。
[0025]計(jì)算機(jī)化的過程200開始于獲取將要匹配到數(shù)據(jù)庫中的記錄的未匹配的記錄。例如,未匹配的記錄可以是學(xué)生記錄110,該學(xué)生記錄110包括關(guān)于學(xué)生的信息組,例如學(xué)生的名字和姓氏、學(xué)生的中間名或首字母、D0B、中學(xué)學(xué)校代碼、中學(xué)學(xué)校郵政編碼以及中學(xué)學(xué)校畢業(yè)日期,并且該數(shù)據(jù)庫可以是高等教育數(shù)據(jù)庫120。
[0026]接著,在計(jì)算機(jī)處理步驟205處,計(jì)算機(jī)化的過程200將未匹配的記錄的DOB與該數(shù)據(jù)庫中的記錄的DOB進(jìn)行匹配。計(jì)算機(jī)化的過程200首先執(zhí)行精確的字符匹配功能,該功能要求匹配是精確的。如果發(fā)現(xiàn)一個(gè)或者多個(gè)包含精確姓氏的記錄,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟210。如果沒有找到匹配,則計(jì)算機(jī)化的過程200進(jìn)行局部的匹配,從而允許一個(gè)或者多個(gè)字符是不準(zhǔn)確的。例如,計(jì)算機(jī)化的過程200可以發(fā)現(xiàn)未匹配的記錄的為1988年I月31的DOB與數(shù)據(jù)庫中的記錄的為1988年I月21的DOB相匹配。應(yīng)該理解,匹配記錄中的DOB所需的匹配字符的數(shù)量可以改變。
[0027]如果沒有識(shí)別到匹配,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟290,并且指示出沒有找到匹配。如果一個(gè)或者多個(gè)記錄的DOB與未匹配的記錄的DOB相匹配,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟210。
[0028]在計(jì)算機(jī)處理步驟210處,計(jì)算機(jī)化的過程200將未匹配的記錄的姓氏和數(shù)據(jù)庫中的記錄的姓氏進(jìn)行匹配。計(jì)算機(jī)化的過程200首先執(zhí)行嚴(yán)格的字符匹配功能,該功能要求匹配是精確的。如果發(fā)現(xiàn)一個(gè)或者多個(gè)包含精確姓氏的記錄,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟220。如果沒有找到匹配,則計(jì)算機(jī)化的過程200進(jìn)行局部的匹配,從而允許一個(gè)或者多個(gè)字符是不準(zhǔn)確的。例如,計(jì)算機(jī)化的過程200可以發(fā)現(xiàn)未匹配的記錄的為Weinstein的姓氏與數(shù)據(jù)庫中的記錄的為Wienstein的姓氏相匹配。應(yīng)該理解,匹配記錄中的姓氏所需的匹配字符的數(shù)量可以改變。
[0029]如果沒有識(shí)別到匹配,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟290,并且指示沒有找到匹配。如果一個(gè)或者多個(gè)記錄的姓氏與未匹配的記錄的姓氏相匹配,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟220。在計(jì)算機(jī)處理步驟220處,計(jì)算機(jī)化的過程200使用精確的匹配來將未匹配的記錄的名字與在計(jì)算機(jī)處理步驟210處所匹配到的記錄的名字進(jìn)行匹配。如果沒有找到精確的匹配,則計(jì)算機(jī)化的過程200將未匹配的記錄的名字與在計(jì)算機(jī)處理步驟210處所匹配到的記錄進(jìn)行局部匹配。計(jì)算機(jī)化的過程200可以遵循與在計(jì)算機(jī)處理步驟210處所使用的局部匹配相同的標(biāo)準(zhǔn)或者不同的標(biāo)準(zhǔn)。如果找到一個(gè)或者多個(gè)匹配,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟230。
[0030]如果沒有找到匹配,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟225,并且使用來自姓名變型數(shù)據(jù)庫的姓名來執(zhí)行名字的匹配。姓名變型數(shù)據(jù)庫提供且排列名字的已知變型。該變型數(shù)據(jù)庫可以包括使用數(shù)據(jù)庫內(nèi)的記錄所編輯的姓名歷史變型的經(jīng)驗(yàn)性分析。也可以基于使用計(jì)算機(jī)化的過程200所匹配的或者由人類分析師所匹配的記錄來填充該變型數(shù)據(jù)庫。可以基于數(shù)據(jù)庫中的新記錄和使用計(jì)算機(jī)化的過程200所進(jìn)行的或者由人類分析師所進(jìn)行的新匹配,來連續(xù)地或者周期性地更新該變型數(shù)據(jù)庫。例如,對(duì)于名字Lyndsey,該變型數(shù)據(jù)庫可以包括一組變型,例如Lindsey、Lyndsay> Lindsay、Lindsi等。作為另一個(gè)示例,對(duì)于名字Cami,該變型數(shù)據(jù)庫可以包括一組變型,例如Camilie、CamiIe、Cami 11a、Cami 11等。作為另一個(gè)示例,對(duì)于名字Christopher,該變型數(shù)據(jù)庫可以包括這些變型,例如 Chris、Cris、Christofer 等。
[0031]為了使用姓名變型數(shù)據(jù)庫中的姓名來執(zhí)行名字的匹配,計(jì)算機(jī)化的過程200首先識(shí)別姓名變型數(shù)據(jù)庫中包括未匹配的記錄的名字的一組變型。如果姓名變型數(shù)據(jù)庫中不存在包括未匹配的記錄的名字的一組變型,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟224。否則,計(jì)算機(jī)化的過程200將該組變型中的所有姓名與數(shù)據(jù)庫中的在計(jì)算機(jī)處理步驟210處所匹配到的記錄的名字進(jìn)行比較。如果數(shù)據(jù)庫中的在計(jì)算機(jī)處理步驟210處所匹配到的姓名都不包括該組變型中的任一姓名,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟224。否則,計(jì)算機(jī)化的過程200可以根據(jù)匹配到的姓名的排序來排列與該組變型中的姓名的匹配。在完成匹配后,計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟230。
[0032]在計(jì)算機(jī)處理步驟224處,計(jì)算機(jī)化的過程200確定名字和中間名是否已被調(diào)換。如果名字和中間名已被預(yù)先調(diào)換,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟290,并且指示沒有找到匹配。如果名字和中間名沒有被預(yù)先調(diào)換,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟222。在計(jì)算機(jī)處理步驟222處,將未匹配的記錄的名字和中間名調(diào)換,從而出于匹配目的使中間名變成名字。在調(diào)換名字和中間名之后,計(jì)算機(jī)化的過程200返回到計(jì)算機(jī)處理步驟220,并嘗試將未匹配的記錄的中間名與數(shù)據(jù)庫中的記錄的名字進(jìn)行匹配。如果在計(jì)算機(jī)處理步驟220處進(jìn)行匹配,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟270。
[0033]在計(jì)算機(jī)處理步驟230處,計(jì)算機(jī)化的過程200將未匹配的記錄的中間名或者中間名首字母與在計(jì)算機(jī)處理步驟220處使用精確匹配所匹配到的記錄的中間名或者中間名首字母進(jìn)行匹配。如果沒有找到精確的匹配,則計(jì)算機(jī)化的過程200將未匹配的記錄的中間名或者中間名首字母與在計(jì)算機(jī)處理步驟220處所匹配到的記錄進(jìn)行局部匹配。過程200可以遵循與在計(jì)算機(jī)處理步驟210和計(jì)算機(jī)處理步驟220處所使用的局部匹配相同的標(biāo)準(zhǔn)或者不同的標(biāo)準(zhǔn)。如果僅找到一個(gè)匹配,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟230,并且指示發(fā)現(xiàn)了精確匹配。如果計(jì)算機(jī)處理步驟230產(chǎn)生不止一個(gè)匹配,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟240。
[0034]在計(jì)算機(jī)處理步驟240處,計(jì)算機(jī)化的過程200將未匹配的記錄的中學(xué)學(xué)校代碼與在計(jì)算機(jī)處理步驟230處所匹配到的記錄的中學(xué)學(xué)校代碼進(jìn)行匹配。如果僅有一個(gè)精確匹配,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟270。如果沒有匹配或者存在不止一個(gè)匹配,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟250。
[0035]在計(jì)算機(jī)處理步驟250處,計(jì)算機(jī)化的過程200利用區(qū)域映射數(shù)據(jù)庫來將與未匹配的記錄中的中學(xué)學(xué)校相關(guān)聯(lián)的郵政編碼和數(shù)據(jù)庫的記錄中的學(xué)生的郵政編碼相匹配。區(qū)域映射數(shù)據(jù)庫包括將未匹配的記錄中的中學(xué)學(xué)校周圍的郵政編碼關(guān)聯(lián)到中學(xué)學(xué)校代碼的數(shù)據(jù)。于是可將中學(xué)學(xué)校的關(guān)聯(lián)的郵政編碼與在計(jì)算機(jī)處理步驟240處或在計(jì)算機(jī)處理步驟230處(如果在計(jì)算機(jī)處理步驟240處沒有出現(xiàn)匹配)所匹配到的記錄中的學(xué)生郵政編碼相匹配。例如,未匹配的記錄可以包括中學(xué)學(xué)校代碼,基于區(qū)域映射數(shù)據(jù)庫,該中學(xué)學(xué)校代碼與如下郵政編碼相關(guān)聯(lián):22040、22041、22042、22043、22044和22046。區(qū)域映射數(shù)據(jù)庫可以包括與使用數(shù)據(jù)庫內(nèi)的記錄所編輯的學(xué)校相關(guān)的郵政編碼的經(jīng)驗(yàn)性分析。也可以基于使用計(jì)算機(jī)化的過程200所匹配的或者由人類分析師所匹配的記錄來填充該區(qū)域映射數(shù)據(jù)庫??梢曰跀?shù)據(jù)庫中的新記錄和使用計(jì)算機(jī)化的過程200所進(jìn)行的或者由人類分析師所進(jìn)行的新匹配,來連續(xù)地或者周期性地更新該區(qū)域映射數(shù)據(jù)庫。
[0036]為了將與未匹配的記錄相關(guān)聯(lián)的郵政編碼和數(shù)據(jù)庫中的學(xué)生記錄的郵政編碼進(jìn)行匹配,計(jì)算機(jī)化的過程200首先識(shí)別區(qū)域映射數(shù)據(jù)庫中的一組與未匹配的記錄的中學(xué)學(xué)校代碼相關(guān)聯(lián)的郵政編碼。如果區(qū)域映射數(shù)據(jù)庫中沒有與未匹配的記錄的中學(xué)學(xué)校代碼相關(guān)聯(lián)的郵政編碼,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟260。否則,計(jì)算機(jī)化的過程200將該組與未匹配的記錄相關(guān)聯(lián)的郵政編碼與數(shù)據(jù)庫中的在計(jì)算機(jī)處理步驟240或者步驟230處所匹配到的記錄的學(xué)生郵政編碼相比較。如果僅有一個(gè)精確匹配,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟270。如果不存在匹配或者存在不止一個(gè)匹配,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟260。
[0037]在計(jì)算機(jī)處理步驟260處,計(jì)算機(jī)化的過程200將未匹配的記錄的中學(xué)學(xué)校畢業(yè)日期與在計(jì)算機(jī)處理步驟250處、或者在計(jì)算機(jī)處理步驟240處(如果在計(jì)算機(jī)處理步驟250處沒有出現(xiàn)匹配)、或者在計(jì)算機(jī)處理步驟230處(如果在計(jì)算機(jī)處理步驟240和計(jì)算機(jī)處理步驟250處沒有出現(xiàn)匹配)所匹配到的記錄的注冊(cè)日期在可接受的范圍內(nèi)進(jìn)行匹配。例如,如果中學(xué)學(xué)校畢業(yè)日期是2008年6月15日,則其可以與2008年8月或者9月中的注冊(cè)日期相匹配。如果僅有一個(gè)精確匹配,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟230。如果不存在匹配或者存在不止一個(gè)匹配,則計(jì)算機(jī)化的過程200進(jìn)入計(jì)算機(jī)處理步驟280。在計(jì)算機(jī)處理步驟280處,計(jì)算機(jī)化的過程200報(bào)告所有可能的匹配。
[0038]應(yīng)該理解,計(jì)算機(jī)化的過程200可以在范圍上進(jìn)行改變,并不應(yīng)該被限制于所描述的具體過程??蓪⒁粋€(gè)或者多個(gè)步驟從過程200中省略,也可添加額外的步驟。匹配的計(jì)算機(jī)化的過程200提供了多種優(yōu)勢。例如,提供了使用姓名的多種拼寫和變換來匹配記錄的過程。該過程也提供了使用除僅姓名的匹配之外的信息和使用由中學(xué)記錄所提供的有限信息而減小可能的匹配范圍的能力。
[0039]圖3示出包括第一數(shù)據(jù)存儲(chǔ)器320和第二數(shù)據(jù)存儲(chǔ)器322的系統(tǒng)300。系統(tǒng)300還包括連接到數(shù)據(jù)存儲(chǔ)器320和數(shù)據(jù)存儲(chǔ)器322的服務(wù)器310。在一個(gè)實(shí)施方式中,服務(wù)器310是來自IBM公司的型號(hào)為3650的數(shù)據(jù)庫服務(wù)器,該數(shù)據(jù)庫服務(wù)器運(yùn)行甲骨文(Oracle)公司的軟件。數(shù)據(jù)存儲(chǔ)器320和數(shù)據(jù)存儲(chǔ)器322可以是IBM公司的DS4800存儲(chǔ)系統(tǒng)的一部分。在一個(gè)實(shí)施方式中,中學(xué)數(shù)據(jù)庫100位于數(shù)據(jù)存儲(chǔ)器320中,高等教育數(shù)據(jù)庫120位于數(shù)據(jù)存儲(chǔ)器322中。服務(wù)器310與數(shù)據(jù)存儲(chǔ)器320、數(shù)據(jù)存儲(chǔ)器322進(jìn)行通信,并且在數(shù)據(jù)庫之間傳輸信息。進(jìn)一步地,服務(wù)器310運(yùn)行用于確定一個(gè)數(shù)據(jù)庫的記錄是否與另一個(gè)數(shù)據(jù)庫的記錄相匹配的算法。在另一個(gè)實(shí)施方式中,數(shù)據(jù)庫100和數(shù)據(jù)庫120都位于同一個(gè)數(shù)據(jù)存儲(chǔ)器中,但是位于該數(shù)據(jù)存儲(chǔ)器的不同部分。
[0040]上述描述和附圖示出了實(shí)現(xiàn)本發(fā)明的目標(biāo)、特征和優(yōu)勢的優(yōu)選實(shí)施方式。盡管上文已經(jīng)描述了某些優(yōu)勢和優(yōu)選實(shí)施方式,但是本領(lǐng)域的技術(shù)人員將意識(shí)到,可以進(jìn)行代替、增加、刪除、修改和/或其它改變,而不脫離本發(fā)明的精神或范圍。因此,本發(fā)明不由以上描述所限定,而僅由任何后續(xù)的要求其優(yōu)先權(quán)的非臨時(shí)申請(qǐng)的權(quán)利要求的范圍所限定。
【權(quán)利要求】
1.一種用于匹配學(xué)生注冊(cè)記錄的計(jì)算機(jī)化的方法,所述方法包括: 使用處理器檢索與學(xué)生相關(guān)聯(lián)的注冊(cè)記錄; 確定所述學(xué)生的姓名的拼寫的常用變型;以及 使用所述處理器來基于所述變型識(shí)別與所述學(xué)生相關(guān)聯(lián)的其它注冊(cè)記錄。
2.如權(quán)利要求1所述的方法,其中,該確定步驟包括:檢查針對(duì)其他學(xué)生預(yù)先匹配的學(xué)生注冊(cè)記錄,并且識(shí)別學(xué)生的姓名的拼寫的常用變型。
3.如權(quán)利要求1所述的方法,其中,該識(shí)別步驟包括: 使用所述處理器調(diào)換所述學(xué)生的名字和中間名;以及 使用所述處理器來基于調(diào)換后的名字和中間名識(shí)別與所述學(xué)生相關(guān)聯(lián)的其它注冊(cè)記錄。
4.如權(quán)利要求1所述的方法,其中,該識(shí)別步驟包括:將與所述注冊(cè)記錄相關(guān)聯(lián)的學(xué)校的位置與所述學(xué)生的當(dāng)前已知地址進(jìn)行匹配。
5.如權(quán)利要求1所述的方法,其中,該識(shí)別步驟包括:將與所述注冊(cè)記錄相關(guān)聯(lián)的注冊(cè)日期和所述學(xué)生的來自另一注冊(cè)記錄的畢業(yè)日期進(jìn)行比較。
6.一種用于確定第一注冊(cè)記錄和第二注冊(cè)記錄是否與同一學(xué)生相關(guān)聯(lián)的計(jì)算機(jī)化的方法,所述方法包括: 使用處理器將與所述第 一注冊(cè)記錄相關(guān)聯(lián)的學(xué)生的姓名的變型和與所述第二注冊(cè)記錄相關(guān)聯(lián)的學(xué)生的姓名進(jìn)行比較; 使用所述處理器確定與所述第一注冊(cè)記錄相關(guān)聯(lián)的學(xué)校的位置; 使用所述處理器將與所述第一注冊(cè)記錄相關(guān)聯(lián)的注冊(cè)日期和與所述第二注冊(cè)記錄相關(guān)聯(lián)的注冊(cè)日期進(jìn)行比較,以確定所述第一注冊(cè)記錄和所述第二注冊(cè)記錄是否與同一學(xué)生相關(guān)聯(lián);以及 如果確定所述第一注冊(cè)記錄和所述第二注冊(cè)記錄與同一學(xué)生相關(guān)聯(lián),則將匹配的指示存儲(chǔ)在數(shù)據(jù)庫中。
7.如權(quán)利要求6所述的方法,其中,與所述第一注冊(cè)記錄相關(guān)聯(lián)的所述學(xué)生的姓名的變型是基于與預(yù)先匹配的注冊(cè)記錄相關(guān)聯(lián)的學(xué)生的姓名的變型而確定的。
8.如權(quán)利要求6所述的方法,還包括:將與所述第一注冊(cè)記錄相關(guān)聯(lián)的學(xué)校的位置和所述學(xué)生的當(dāng)前已知地址進(jìn)行匹配。
9.一種用于追蹤學(xué)生注冊(cè)記錄的計(jì)算機(jī)系統(tǒng),所述系統(tǒng)包括: 存儲(chǔ)設(shè)備,所述存儲(chǔ)設(shè)備包含中學(xué)注冊(cè)記錄和高等教育注冊(cè)記錄;和 處理器,所述處理器配置成: 檢索與學(xué)生相關(guān)聯(lián)的注冊(cè)記錄; 確定所述學(xué)生的姓名的拼寫的常用變型;以及 基于所述變型識(shí)別與所述學(xué)生相關(guān)聯(lián)的其它注冊(cè)記錄。
10.如權(quán)利要求9所述的系統(tǒng),其中,所述處理器還配置成檢查預(yù)先匹配的學(xué)生注冊(cè)記錄,并且識(shí)別學(xué)生的姓名的拼寫的常用變型。
11.如權(quán)利要求9所述的系統(tǒng),其中,所述處理器還配置成: 調(diào)換所述學(xué)生的名字和中間名;以及 基于調(diào)換后的名字和中間名識(shí)別與所述學(xué)生相關(guān)聯(lián)的其它注冊(cè)記錄。
12.如權(quán)利要求9所述的系統(tǒng),其中,所述處理器還配置成計(jì)算所述學(xué)生就讀的學(xué)校與所述學(xué)生的當(dāng)前已知地址之間的距離。
13.如權(quán)利要求9所述的系統(tǒng),其中,所述處理器還配置成將與所述注冊(cè)記錄相關(guān)聯(lián)的注冊(cè)日期和所述學(xué)生的來自另一注冊(cè)`記錄的畢業(yè)日期進(jìn)行比較。
【文檔編號(hào)】G06F7/02GK103874981SQ201280050737
【公開日】2014年6月18日 申請(qǐng)日期:2012年8月16日 優(yōu)先權(quán)日:2011年8月16日
【發(fā)明者】道格拉斯·T·夏皮羅, 黛安娜·吉勒姆 申請(qǐng)人:全國學(xué)生資料庫
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1