專利名稱:基于基因組的警報系統的制作方法
基于基因組的警報系統發(fā)明領域
本發(fā)明涉及用于分析和發(fā)布遺傳學信息的自動化系統,更具體地涉及基于個人基 因組的信息分析和發(fā)布。
發(fā)明背景
遺傳學研究領域快速不斷地產生關于人類健康和疾病的引人注目的新成果。眾多 研究者和研究機構致力于定期產生關于且基于人類遺傳組成的新成果。即便是本領域的專 家也發(fā)現難以跟上快速發(fā)展且高度動態(tài)的人類基因組以及其隱含的健康相關問題的科學 知識。就個人健康而言,非專業(yè)人員依賴其個人醫(yī)生的專業(yè)知識,但是不能從新的遺傳學發(fā) 現中受益,除非等待若干年直到一項重大的遺傳學發(fā)現成熟并在衛(wèi)生系統中廣泛傳播直到 社區(qū)醫(yī)生的辦公室。
近幾個月來出現了遺傳測試服務的供應商,其以相對低廉的價格向普通民眾提供 對其基因組非常高程度的利用。雖然個人現在可以得到相當詳細的個體遺傳組成信息,但 還需要解釋其含義以及對個人健康和疾病的可能影響,這很棘手。雖然咨詢個人醫(yī)生甚至 查閱最新研究可能有助于理解遺傳組成的含義,但理解消化遺傳學研究并將其歸納成有助 于進行健康決定的抽象規(guī)則仍然非常復雜。因此非常需要運用自動化系統,將大量新近發(fā) 表的研究信息歸納為離散的定義和規(guī)則,并進一步基于任何特定的基因組自動整理該信 息,并根據具體基因組的具體遺傳特征向個人發(fā)布信息。這樣,個人就不用分析新的遺傳學 研究來找出那些適用于自己遺傳組成的研究成果。
發(fā)明概述
現在,詹姆士 普朗特和大衛(wèi)·貝克發(fā)明了基于基因組的警報系統,其包括在新進 展的研究基礎上根據會員的基因組數據提供電子警報的裝置和方法。這些會員系統或者基 于遺傳學的“直接面向客戶”的系統的主要功能是根據會員的具體遺傳檔案以“警報”的方 式提供高度相關的信息。
已經設計并發(fā)明了遺傳信息分析和發(fā)布系統,并且在此首次披露。這些基于基因 組的計算機警報系統主要由會員數據庫組成,該數據庫為基因組數據和電子通訊地址信息 分配存儲容量,并為其內包括的每個會員建立基因組數據和電子通訊地址信息之間的聯 系。這些警報系統進一步包括表現為存儲的計算機邏輯的規(guī)則,所述規(guī)則取決于遺傳特征 相關的參數(即,基因、SNP、拷貝數等)。有時,分析模塊的查詢引擎部分對會員數據庫中 存儲的數據進行查詢,所述查詢根據這些已定規(guī)則形成。返回的結果集包括那些可能受到 影響或者由于其個人基因組的具體特征而被關注的會員。對于執(zhí)行查詢產生的結果集中所 包括的任何會員,系統警報模塊自動生成報告描述新研究如何可能引起關注,并通過電子 通訊系統例如電子郵件服務器來發(fā)布該報告。
因此本發(fā)明與此前已知的方法和裝置形成對照。本發(fā)明包括的自動化警報系統根 據新近發(fā)布的研究數據向會員提供針對他們遺傳檔案的警報。
發(fā)明目的
本發(fā)明的主要目的是提供遺傳會員系統,其用于提供電子警報。
本發(fā)明的一個目的是直接向客戶提供遺傳學分析和監(jiān)測。
通過參考優(yōu)選實施方案的詳細描述和附圖可以更好地理解本發(fā)明。本說明書中的 實施方案是實現本發(fā)明的具體途徑,但不包括所有可能的途徑。因此,可能存在某些實施方 案,其并不偏離所附權利要求書中所闡明的本發(fā)明的精神與范圍,但是并沒有在本說明書 中以具體實例出現。本領域普通技術人員可以理解有許多可能的替代方案。
通過以下說明、所附權利要求書、以及附圖將能更好地理解本發(fā)明的各種特征、方 面和優(yōu)點。
圖1為依據本發(fā)明的警報系統的示例方案的一般性框圖2為依據這些教導的警報系統的另一種重要方案的詳細框圖。
本發(fā)明的優(yōu)選實施方案
在第一個重要的說明性實施例中,本發(fā)明基于基因組的計算機警報系統結合圖1 的示意圖進行了說明。具體而言,基于基因組的警報系統1包括與基因組掃描儀3結合的 計算機服務器2或者計算機系統。人DNA 4樣本作為輸入在所述掃描儀的接收端口 5被接 收。所述基因組掃描儀應用現代生物學、化學、光學和電子學方法來分離具體的遺傳序列, 包括重要的SNP(單核苷酸多態(tài)性)以及其它被關注的序列。所述基因組掃描儀將人基因 組轉換為數字輸出,可存儲在專門準備的會員數據庫6中。
為多個會員中的每個存儲會員記錄,其中可以包括數字化基因組類型數據。設定 數據庫方案,使會員與存儲的關聯基因組一一對應。這些可以通過獨特的標識數據庫索引 機制或“主關鍵字”相結合。
分析模塊被設置成根據其中生成的數據庫查詢指令來查詢會員數據庫。那些數 據庫查詢指令根據規(guī)則生成器8不斷生成并提供給所述分析模塊的動態(tài)的、更新的規(guī)則形 成。所述規(guī)則生成器響應從研究界9和具體研究工作10接收的輸入生成代表計算機邏輯 的規(guī)則,該輸入包括基于特定遺傳特征存在或不存在而得出的結論。
在某些特別優(yōu)選的方案中,可以使用專家11查閱研究成果并將非離散的結論轉 換成離散的規(guī)則與算法。該專家可與作為規(guī)則生成器的一部分提供的用戶界面一起協同工 作,從而使所述研究可轉換為完全的邏輯描述。
可替代地,某些研究可通過用于分析和解釋數據的完全自動化系統結合到所述規(guī) 則生成器。尤其是當研究者用可被自動化系統分析的規(guī)定格式發(fā)表研究成果時。所述分析 模塊對數據庫執(zhí)行一個或多個查詢后,結果集12從該分析模塊被傳送到警報模塊13。所述 警報模塊包括根據作為結果集接收的信息編寫報告所需的所有設備。例如,當結果集識別 出具有新研究所鑒定出的遺傳特征的特定標記時,編寫報告以向受影響的會員詳細解釋情 況。該報告可直接發(fā)送給該會員。一些報告可設定為發(fā)給會員的代理人或代表,例如醫(yī)生。 相應地,所述警報被送到指定地址,并且報告格式可顧及接收者的具體專業(yè)知識。
電子發(fā)布系統可被設置為例如電子郵件服務器14,其從所述警報模塊接收編寫好 的報告并根據合適的會員電子郵件地址自動發(fā)送,其中所述電子郵件地址已經通過所述數 據庫方案與會員的基因組關聯,所述報告通過互聯網15發(fā)送到會員的工作站16,在那里該 報告可被用戶接收并查閱。這樣,可通過個人的基因組連續(xù)地向該個體提供最新研究。再也不需要梳理成千上萬的文獻去尋找那些與該個體特定遺傳組成相關的文獻,相反地,“前 沿的”新研究會自動來到用戶/會員身邊。
新的遺傳學發(fā)現被公開發(fā)表后的很短一段時間內,具有與該研究相關的基因特征 的系統用戶不需做任何事情即可了解該新成果。所述系統反應的特征可被描述為“信息推 動”作用,其中在來自用戶的要求觸發(fā)下,報告和信息被自動傳送。
通過圖2的詳細示意圖可更深入地了解本發(fā)明。研究界21定期產生記錄新的遺傳 學相關醫(yī)學研究成果的出版物。其可包括但不限于出版物例如醫(yī)學雜志、期刊、博士論文、 新聞網、FDA報告/警告、基因學發(fā)現等等。新近發(fā)表的研究22可以以與機器處理相配合 的格式提供,從而其提出的結果被規(guī)則生成器M的數據處理器23部分分析并解釋,得到依 賴于例如特定的遺傳學標記的規(guī)則或算法形式的離散的計算機可執(zhí)行邏輯。
可替代地,新近發(fā)表的研究可被專家接收以解釋結果并形成離散的機器可執(zhí)行邏 輯和規(guī)則。在這種情況下,提供了規(guī)則生成器的專家界面25部分,由此專家能夠控制規(guī)定 的模板規(guī)則的狀態(tài)和變量以得到反映所查閱研究的本質的算法和邏輯。這種抽象化步驟允 許不容易被自動化系統分析的研究通過人類解釋者的幫助轉換為離散的規(guī)則。
當DNA樣本沈存入基因組掃描儀系統27的接收端口時,該系統針對會員個體而 啟動。所述基因組掃描儀的輸出是個人基因組的數字化表示,并且對于具體個體,該數字化 表示與會員數據庫結合,基因組數據被存儲在會員數據庫中,所述會員數據庫具有特別準 備的方案,其中會員與任何特定基因組的一一對應關系被強化。在某些優(yōu)選的實施方案中, 該信息被存儲在單獨的數據庫記錄中(如示意圖中數據行觀所示)。例如通過這種方式每 個會員可被分配在不同的數據庫記錄中。
除了基因組信息,數據庫記錄還可提供與會員健康和生活方式相關的其它信息存 儲。存儲在不同欄中的信息(例如標明會員為吸煙者的二元指標,或者表示會員體重的體 重值整數表示)可與遺傳數據存儲在一起。這樣,當一個研究涉及與其它健康因素相關的 遺傳發(fā)現時,它們的數字化表示可錄入數據庫。其中可用于關聯個體會員的數據包括生活 方式因素、代謝測定值、家族史、醫(yī)療記錄數據、鍛煉方案,等等。
雖然這些類別的信息本身值得關注,但對于這些系統最重要的數據元素還包括具 體聯系說明。由于這些裝置的基本目的是提供電子警報,有必要指定該警報被傳送到哪里。 在最優(yōu)選的方案中,所述警報通過“電子郵件服務器”形式的電子通訊系統發(fā)布。因此,在 任何特定的基因組、其它健康信息以及警報傳送地址(例如電子郵件地址、醫(yī)生電子郵件 地址、或患者電子郵件地址)之間建立了重要關聯。相應地,為這些數據庫提供方案以適應 健康數據,其中所述健康數據與為警報指定的至少一個電子郵件地址相結合。
就所述規(guī)則生成器模塊所形成的規(guī)則而言,規(guī)則集保持作為分析模塊210的一部 分。多個存儲的規(guī)則211形成了基礎,基于該基礎,查詢引擎212可以查詢由與會員關聯的 遺傳信息所形成的數據庫。例如,新的研究可能提示當在某些人的遺傳序列中發(fā)現已知的 多態(tài)性213 (SNPl)時,其具有罹患某種疾病的重大風險??蓪T信息數據庫運行查詢,得 到所有具有該多態(tài)性的會員的結果集214??稍谛乱?guī)則加入規(guī)則集時運行查詢,或者可設定 時間215定期進行查詢。當查詢產生結果集并且一個或多個會員符合所述規(guī)則中闡明的條 件時,那些會員的記錄被送到警報模塊。對每一個會員,可編制反映新研究細節(jié)的定制的報 告。新研究的確切含義可能對任何兩組人是不同的,即根據該研究,相對于非吸煙者,新發(fā)現的癌癥基因可能對吸煙者更加重要。在另一個說明性實施例中,某一報告可能更適合于 老年會員,其可在存儲為警報模塊一部分的模板217中得到說明。
警報一旦最終完成,就以電子形式被傳遞與發(fā)布,例如通過SMTP電子郵件服務器 結合互聯網218,到達用戶/會員工作站219,在此該警報和警報報告可在標準HTML瀏覽器 210或客戶桌面程序221中查看。
根據本發(fā)明的每個優(yōu)選的實施方案,提供了基于遺傳學的警報系統。本領域普通 技術人員能夠了解所述每個實施方案包括一種裝置,一個優(yōu)選實施方案中的裝置可能不同 于另一實施方案中的裝置。相應地,在一種實施例中提到的限制不應被延續(xù)并推定為另一 實施例的一部分。
以上實施例是針對特定的實施方案,其闡明了本發(fā)明的裝置和方法的優(yōu)選方案。 為了完整起見,對本發(fā)明裝置和其組成元件以及包括所述裝置的方法和步驟進行了更全面 的說明。
本領域普通技術人員現在可以充分了解如何實現基于遺傳學的警報系統,所述警 報系統監(jiān)測新研究從而提供與系統會員中特定會員相關的警報。雖然參考一些優(yōu)選方案 (包括發(fā)明者預期的最佳模式),已經用清晰且簡明的語言對本發(fā)明進行了相當詳細的描 述,但其它方案也是可能的。因此,本發(fā)明的精神和范圍不限于本文中優(yōu)選方案的描述,而 應限于本說明書所附的權利要求書。權利要求
1.一種基于基因組的計算機警報系統,其包括記錄會員基因組數據的會員數據庫;規(guī)則生成器,分析模塊,和警報模塊,其中,所述規(guī)則生成器被設置成將定性的研究成果轉換成定量的、離散的規(guī)則,并將這 些規(guī)則傳送給所述分析模塊,所述分析模塊被設置成根據所述規(guī)則對所述會員數據庫中的基因組數據進行查詢,并 將生成的結果集輸出給所述警報模塊,所述警報模塊被設置成根據所述結果集中的信息編寫警報報告。
2.如權利要求1所述的基于基因組的算機警報系統,其中所述規(guī)則生成器包括數據處 理器,該數據處理器將所述定性的研究成果轉換成所述定量的、離散的規(guī)則。
3.如權利要求1所述的基于基因組的算機警報系統,其中所述規(guī)則生成器包括專家界 面,該專家界面將所述定性的研究成果轉換成所述定量的、離散的規(guī)則。
4.如權利要求1所述的基于基因組的算機警報系統,其中所述會員數據庫還包括與會 員健康和生活方式相關的其它信息。
5.如權利要求4所述的基于基因組的算機警報系統,其中所述分析模塊包括查詢引 擎,該查詢引擎根據所述規(guī)則對所述會員數據庫中的基因組數據進行查詢。
6.如權利要求1-5任一項所述的基于基因組的計算機警報系統,其還包括電子發(fā)布系 統,該電子發(fā)布系統可從所述警報模塊接收編寫好的報告,并將報告發(fā)送給所述會員或其 代理人。
7.如權利要求6所述的基于基因組的計算機警報系統,其中所述電子發(fā)布系統是電子 郵件服務器。
全文摘要
本發(fā)明提供了一種基于基因組的計算機警報系統,包括記錄會員基因組數據的會員數據庫、規(guī)則生成器、分析模塊和警報模塊,其中所述規(guī)則生成器被設置成將定性的研究成果中包含的數據轉換成定量的、離散的規(guī)則,并將這些規(guī)則傳送給所述分析模塊,所述分析模塊被設置成根據所述規(guī)則對所述會員數據庫中的基因組數據進行查詢,并將生成的結果集輸出給所述警報模塊,所述警報模塊被設置成根據所述結果集中的信息編寫警報報告。這些警報報告可以被傳送給與所述會員。
文檔編號G06F19/00GK102034015SQ20091017459
公開日2011年4月27日 申請日期2009年9月30日 優(yōu)先權日2009年9月30日
發(fā)明者大衛(wèi)·貝克, 詹姆士·普朗特 申請人:帕斯維基因組學公司