專利名稱:Hiv-1感染的人輔因子的全基因組目視鑒定的制作方法
HIV-1感染的人輔因子的全基因組目視鑒定本發(fā)明涉及在HIV感染的早期階段中所牽涉的人宿主因子的鑒定。此外,本發(fā)明 涉及所鑒定的基因用于闡明HIV感染的機制、作為藥物靶標和用于鑒定在治療HIV中有用 的化合物的用途。
背景技術:
大多數(shù)慢性疾病和感染在細胞的整體水平上顯現(xiàn)。通過活細胞成像來檢查疾病進 展允許達到高的分辨率程度,其中使得分子疾病機制和其對遺傳變化的響應可視化。盡管 該類型的方法在獨個實驗中是非常成功的,但對于系統(tǒng)性的全基因組分析來說在很大程度 上仍是難以適用的。在進化過程中,HIV學會了將其生活周期的大部分分包給人宿主因子。在最近十年 中,已通過多種方法鑒定了幾種此類宿主因子(關于綜述,請參見O。沒有幾種在鑒定宿主 因子中的方法是系統(tǒng)性的,并且迄今沒有一種方法是徹底的。但是,宿主因子的可得并不只 對于充分理解HIV生活周期是重要的。探尋病毒宿主因子的有效方法將進一步允許將HIV 亞型的因子特異性相互地或與SIV(猿猴免疫缺陷病毒)進行比較,從而指出感染表現(xiàn)中的 關鍵機制,和潛在的治療靶標。本發(fā)明的目標是,鑒定在HIV感染的早期階段中所牽涉的人宿主因子,其用于闡 明HIV感染的機制、作為藥物靶標和用于鑒定在治療HIV中有用的化合物。發(fā)明描述本發(fā)明的目標通過下述技術方案而得到實現(xiàn)具有由SEQ ID No. 46所表示的序列 的核酸,或其部分序列,或與所述核酸或所述部分序列互補的序列,其中所述部分序列包含 至少20個連續(xù)核苷酸,它們用于a)闡明HIV感染的機制;b)作為藥物靶標;或者c)鑒定在治療HIV中有用的化合物。本發(fā)明的目標還通過下述技術方案而得到實現(xiàn)具有由SEQ ID No. 1或SEQ ID No. 2所表示的序列的核酸,或其部分序列,或與所述核酸或所述部分序列互補的序列,其中 所述部分序列包含至少20個連續(xù)核苷酸,它們用于a)闡明HIV感染的機制;b)作為藥物靶標;或者c)鑒定在治療HIV中有用的化合物。本發(fā)明的目標還通過下述技術方案而得到實現(xiàn)具有由SEQ ID No. 5所表示的序 列的核酸,或其部分序列,或與所述核酸或所述部分序列互補的序列,其中所述部分序列包 含至少20個連續(xù)核苷酸,它們用于a)闡明HIV感染的機制;b)作為藥物靶標;或者c)鑒定在治療HIV中有用的化合物。本發(fā)明的目標還通過下述技術方案而得到實現(xiàn)具有由SEQ ID No. 3_4和6_45中任一個所表示的序列的核酸,或其部分序列,或與所述核酸或所述部分序列互補的序列,其 中所述部分序列包含至少20個連續(xù)核苷酸,它們用于a)闡明HIV感染的機制;b)作為藥物靶標;或者c)鑒定在治療HIV中有用的化合物。如在本文中所使用的,術語“核酸”意指脫氧核糖核酸(DNA)和核糖核酸(RNA)。如在本文中所使用的,術語“與所述核酸或所述部分序列互補的序列”還指相應的 (互補的)RNA序列或部分序列。所述部分序列的20個連續(xù)核苷酸的最小長度確保了它們的特異性。在一個優(yōu)選 的實施方案中,所述部分序列包含至少21個連續(xù)核苷酸,和在一個更加優(yōu)選的實施方案 中,所述部分序列包含至少22個連續(xù)核苷酸。如在本文中所使用的,術語“藥物”意指適合用于治療HIV的藥物學試劑。抑制(a)與靶蛋白的結合、(b)靶蛋白的活性或者(C)靶蛋白的表達的化合物的最 初鑒定可以通過實驗來達到,或者可以基于關于靶標的可用信息。抑制(a)和(b)的化合 物在蛋白質水平上起作用。抑制(C)的化合物針對編碼蛋白質或具有調(diào)控功能的核酸(例 如DNA,RNA,mRNA)。可以使用諸如競爭性和非競爭性結合測定法的技術來測定化合物結合 蛋白質的能力。此類測定法可以例如使用經(jīng)標記的化合物(直接測量)或與各自化合物相 結合的可檢測試劑(間接測量)來進行。經(jīng)鑒定的靶蛋白的編碼性核酸序列(例如由SEQ ID No. 1至46,優(yōu)選地SEQ ID No. 46,1-2或5所表示的基因/核酸)為能夠與所述核酸雜 交的化合物提供了靶標。此類化合物的例子包括siRNAs、核酶和反義核酸。優(yōu)選地,將具有由SEQ ID No. 1至46,優(yōu)選地SEQ ID No. 46,1-2或5中任一個所 表示的序列的核酸,或其部分序列,或與所述核酸或所述部分序列互補的序列(其中所述 部分序列包含至少20個連續(xù)核苷酸),用作藥物靶標或者用于根據(jù)WO 2008/03462228中所 概述的方法來鑒定在治療HIV中有用的化合物。優(yōu)選地,鑒定關于靶蛋白候選物(由SEQ ID No. 1至46,優(yōu)選地SEQ ID No. 46、 1-2或5中任一個所編碼的蛋白質)的小分子調(diào)節(jié)劑(其也代表了在治療HIV中有用的化 合物)的方法包括下列步驟-提供這樣類型的第一細胞,所述類型在當將所述第一細胞暴露于小分子調(diào)節(jié)劑 時能夠產(chǎn)生信號,其中所述信號為這樣的信號,其可以在空間上進行分辨,和任選地可以進 行定量,優(yōu)選地通過顯微術,-將所述第一細胞暴露于小分子調(diào)節(jié)劑,并對由所述第一細胞作為對于所述小分 子調(diào)節(jié)劑作出的應答而產(chǎn)生的第一信號在空間上進行分辨,和任選地進行定量,-提供與所述第一細胞相同類型的第二細胞,-進行下列步驟-將編碼標志蛋白的第一核酸引入到載體中,-將編碼所述靶蛋白候選物(其表達待檢測和/或定量)的第二核酸引入到所述 載體中,以便所述第一核酸和第二核酸有效地連接,從而所述標志蛋白的表達成為所述靶 蛋白候選物的表達的指示,-將所述載體引入到所述第二細胞中,
-檢測和/或定量所述標志蛋白的表達,-將所述標志蛋白的所述表達與所述靶蛋白候選物的表達相關聯(lián),并由此檢測和 /或定量所述靶蛋白候選物的表達,-在所述第二細胞上進行上述步驟期間,在將所述載體引入到所述第二細胞中后, 將所述第二細胞暴露于所述小分子調(diào)節(jié)劑,并對由所述第二細胞作為對于所述小分子調(diào)節(jié) 劑作出的應答而產(chǎn)生的第二信號在空間上進行分辨,和任選地進行定量,-將所述第一信號與所述第二信號進行比較,并且,如果在所述第一信號和所述 第二信號之間存在差異的話,將所述差異歸因于所述靶蛋白候選物在所述第二細胞中的表 達,從而將所述靶蛋白候選物鑒定為所述小分子調(diào)節(jié)劑的靶蛋白。優(yōu)選地,所述第一細胞和與所述第一細胞相同類型的所述第二細胞為LTR-GFP HeLa細胞(LTR =長末端重復序列)。優(yōu)選地,將具有由SEQ ID No. 1至46,優(yōu)選地SEQ ID No. 46,1-2或5中任一個所 表示的序列的核酸,或其部分序列,或與所述核酸或所述部分序列互補的序列(其中所述 部分序列包含至少20個連續(xù)核苷酸)用于通過利用網(wǎng)絡或系統(tǒng)生物學領域中的標準方法 來闡明HIV感染的機制,所述標準方法包括但不限于蛋白質組相互作用圖譜、pull-down實 驗(S卩,AP/MS)、微陣列分析和計算機建模ffl。SEQ ID No. 1 至 46 列于表 2 中。通過全基因組RNA干擾、高密度細胞微陣列、共聚焦成像和圖像分析的組合,發(fā)明 人已鑒定了在HIV感染的早期階段中所牽涉的迄今未知的人宿主因子。通過在7個目視 全基因組分析上使用HIV受體分子⑶4作為分類器(classifier),已顯示出,HIV-I雇用 了 0.21%的人基因組,或44個宿主基因,來完成其早期生活周期。通過將目視圖像的高 信息內(nèi)容與基于陣列的全基因組篩選的快速重現(xiàn)性相組合,本方法允許以高可靠性來鑒定 HIV-I宿主因子。為了直接鑒定在細胞水平上在HIV/疾病發(fā)病機理中所牽涉的基因,發(fā)明人開發(fā) 出了全基因組目視RNA干擾方法。它被設計為活細胞內(nèi)的途徑和病原體活性的自動化分 析,其中使用定量成像工具2。已經(jīng)以一個孔/基因水平,在微量滴定板中,以低分辨率篩選 了在病毒載體中的短干擾RNAs(siRNAs)和短發(fā)夾RNAs的全基因組文庫3。已證明,將此擴 展至高分辨率成像是非常具有挑戰(zhàn)性的。細胞微陣列是用于使細胞事件成像的備選的、通 用的解決方案4’5。疊蓋在siRNA、病毒顆?;蚧衔?其反向轉染細胞)的印刷斑點陣列 上的細胞單層為費力的機器化篩選提供了備選方案4’7’8’1(1_12。發(fā)明人已利用了這些優(yōu)點 來通過使用細胞微陣列來篩選HIV感染。附圖現(xiàn)在,提及附圖,其中
圖1顯示了,通過使用細胞微陣列,從基因組到單個細胞,在LTR-GFPHeLa細胞中 HIV感染的自動化全基因組篩選用細胞疊蓋七個細胞微陣列48小時,固定,并進行核染 色,然后進行三色自動化點掃描共聚焦成像。圖版A顯示了在具有78% (21,127個斑點) 的基因組特異性siRNAs和22% (6089個斑點)的對照的七個載玻片(總共27,216個斑 點)上進行的單個全基因組篩選的圖像。圖版B顯示了來自該篩選的單個陣列(3,888個斑 點)。圖版C顯示了來自該單個陣列的18個斑點,其中框出了來自該陣列的三個斑點,其中中間的斑點包含⑶4 siRNA、上面的斑點包含TRIM50B siRNA和下面的斑點包含F(xiàn)LJ43374 siRNA。圖版D顯示了斑點圖像,圖版E顯示了核染色,圖版F顯示了 HIV感染誘導的GFP 表達,和圖版G顯示了來自該陣列的單個斑點,其中突出顯現(xiàn)了在該斑點中心處的由CD4 siRNA轉染的細胞和與該斑點接界的經(jīng)感染的對照細胞。核用2. 5μΜ Draq5染色(藍色)。 比例尺上面的和中間的圖版為10mm,下面的圖版為100 μ m。圖2概括了大的高分辨率細胞微陣列的圖像分析·Λ描繪了真實的陣列獲取示意 圖,其顯示了傾斜的整個陣列,缺失的斑點,和相對于圖像邊界(黑色線)而言斑點對siRNA 斑點位置(灰色小點)的變化。B描繪了相比于具有多個跨越圖像邊界的斑點/圖像的真 實情況而言,具有一個斑點/圖像的假定情況(上面的圖版)。C顯示了用于與陣列微縮圖 (miniature)進行適配的siRNA注釋節(jié)點(總共3,888個節(jié)點)的柔性的陣列網(wǎng)格模型。D 至F 該柔韌的網(wǎng)格功能強制使節(jié)點與其緊鄰鄰居產(chǎn)生關系,其中,D)兩個毗鄰節(jié)點之間的 90°角,E)預先確定的斑點間距(d),和F)在計算的曲率圖(computed curvature map)上 的最小值是受到偏愛的。G顯示了用該模型來注釋陣列微縮圖。H描繪了通過使用來自在 微縮圖上的適配的坐標,從毗鄰的高分辨率圖像產(chǎn)生的高分辨率復合斑點圖像。I顯示了經(jīng) 適配的大陣列,其顯示了缺失的斑點的檢測和在紅色siRNA斑點圖像上的網(wǎng)格疊蓋層(插 圖)。圖3A顯示了⑶4 siRNA斑點圖像,其中具有在白色正方形中的所自動檢測的斑點 區(qū)域。B顯示了⑶4 siRNA斑點圖像分析,其檢測在該斑點區(qū)域之內(nèi)和之外的細胞中心以測 得它們的數(shù)目、核強度、GFP強度、關于細胞間連接的最小強度(連接值是關于該連接的最 小強度)、細胞強度之間的距離及其各自的標準偏差以及總GFP(總共15個描述符)。C顯 示了雜亂的(scramb 1 ed) siRNA斑點圖像,其中具有在白色正方形中的所檢測的斑點區(qū)域。 D描述了雜亂的siRNA斑點圖像分析。E顯示了現(xiàn)在被減少至15-維向量的實驗(=斑點)。 一個陣列包含3,888個斑點(108X36網(wǎng)格)。因此,可以將每個結果維度表現(xiàn)為具有代表 一個實驗的一個像素的2-D灰度級圖片。每個像素的值相應于所測量的維度。第一列在 單個陣列的3,888個斑點上測量的15個描述符。從上至下celINumber、IinkMinGFPAvg, linkMinGFPSdtdev、 linkLengthAvg、 linkLengthSdtdev、 inTotalGFP、 inlntNucleiAvg、 inIntNucleiSdtdev> inlntGFPAvg、inlntGFPSdtdev、outTotalGFP、outIntNucleiAvg> outlntNucleiSdtdev、outlntGFPAvg、outlntGFPSdtdev。第二列經(jīng)標準化的相同的測量 值。那些經(jīng)標準化的相對值對于空間排列變形(spatial array distortions)來說強有力 得多而同時保持本地命中(local hits)。圖4A顯示了投影在二維空間上的15-維測量⑶4和SCRAMBLED云狀物,其是在 分布之間最具辨別力的??梢郧宄乜闯?,可以區(qū)分為兩個類別。B顯示了在該相同視圖 上190,510個實驗(7X7陣列)的投影,和C顯示了基于15-變量結果的分類。A、B、C 水 平的標準軸(canonical axis) 1 ;垂直的標準軸2 ;顏色類別;強度值距各自類別中心 的15-維的馬哈拉諾比斯距離(Mahalanobis distance)(參見第9頁)。D描繪了直方圖, 其顯示了在標準平面上值的出現(xiàn)(Z軸最高出現(xiàn)值為252)。落入CD4類別中的實驗被標 記為綠色,并且代表所有實驗的一小部分(0.8%)。E為顯示命中的圖,所述命中選自⑶4 類別中的這樣的實驗,其是具有相比于所有實驗的大部分而言低于1的密度比率的那些實 驗。因此,在CD4類別之內(nèi)比CD4類別之外存在有按比例地更多的相同基因的實驗。注意,該比率很快落到0. 1以下,這顯示44個命中中的大多數(shù)的密度在⑶4類別之內(nèi)為在⑶4類 別之外的至少10倍。F顯示了 siRNA實驗的代表性例子。圖5概括了來自LTR-GFP HeLa細胞的結果,所述LTR-GFP HeLa細胞用所示siRNA 轉染M小時,然后用HIV-IIIB進行感染。在48小時后,將經(jīng)固定的細胞用PM抗體進行 染色。A顯示了以RNASEH2A、JMY、MED28和⑶4(陽性對照)的喪失而阻斷了 HIV感染。 將GFP (綠色)和P24(紅色)用作HIV感染的指示劑。核(藍色)用DraQ5染色?!昂喜?(merge) ”指明了核(藍色)、GFP (綠色)和HIV P24 (紅色)的組合圖像。比例尺為20 μ m。 B圖解說明了基于GFP強度/像素/細胞的GFP表達的定量。C圖解說明了基于PM強度 /像素/細胞的PM表達的定量。D顯示了通過各自的siRNA減少了 RNASEH2A、MED28和 JMY mRNAo細胞用所示siRNA轉染72小時,然后制備cDNA并通過RT-PCR來測量RNASEH2A、 MED28和JMY mRNA表達水平。在圖6A中,Jurkat細胞用所示siRNA轉染72小時,然后用HIV-I毒株IIIB (Μ0Ι 0. 1)進行感染。在96小時后,通過p24 ELISA在細胞培養(yǎng)物上清液中測量PM抗原。在B 中,Jurkat細胞用所示siRNA轉染72小時,然后用HIV-I毒株11 IB (MOI :0. 05)進行感染。 在96小時后,通過p24 ELISA在細胞培養(yǎng)物上清液中測量PM抗原。C顯示了通過各自的 Acell siRNA減少了 RNASE H2A mRNA。Jurkat細胞用所示siRNA轉染96小時,然后制備 cDNA并通過RT-PCR來測量RNASE H2AmRNA表達水平。D顯示了通過RT-PCR測量的RNASE H2A敲減(knockdown)的定量。
實施例制備細胞微陣列以便以最小的陣列數(shù)目覆蓋人基因組,從而使得能夠進行共聚焦 成像,并去除任何對于關于siRNA斑點位置和成像的機械精確性的依賴7。使用高通量接 觸式印刷機來大量制備印刷在對乂60!11111光學玻璃薄片上的陣列。各自標有條形碼的陣列 以108列X36行和以500 μ m的間距,包括以300 μ m直徑斑點形式的3,888個siRNAs。 將siRNAs包囊在包含轉染試劑和明膠7_9’12’13以及紅色熒光siRNA的混合物中。紅色熒光 siRNA給出光學上可鑒別的、獨個地可尋址的斑點,并且整個陣列可以在細胞疊蓋后進行可 視化(圖1)。在干燥后1至21天,測量反向轉染。通過使用干燥了>5天的陣列,在表達 GFP的HeLa細胞系的轉染后48小時,接近60%的細胞被轉染并且GFP敲減為> 70%。通 過采用P65或核輸出蛋白1 (XP01/CRM_1)的間接免疫標記以及固定的陣列的共聚焦成像, 在轉染后48小時,內(nèi)源蛋白質表達沉默為> 60%。斑點與斑點之間的污染是最小的,不論 與GFP siRNA斑點的距離為多少,在所有鄰近斑點中沉默是低的(< 5% )。HIV感染測定法包括HeLa LTR-GFP細胞的觀小時反向轉染,隨后為以0. 14的 HIV-I MOI進行的48小時的感染。HIV感染使得能夠實現(xiàn)穩(wěn)定整合的GFP的由TAT驅動的 表達,并因此重演了病毒感染中的早期步驟14。在這些條件下,在用CD4 siRNA轉染的細胞 中,HIV感染顯著地被抑制(圖1)。將處于包囊混合物中的84,508個siRNAs (其相應于四個獨特的siRNA雙鏈體,它 們靶向21,127個獨特的人基因中的每一個)與對照siRNAs的集合進行印刷。每個陣列包 含3,888個斑點(其中包括648個對照),并且在7個載玻片中掩蓋整個人基因組(圖1A)。 使用倒置自動化點掃描共聚焦顯微鏡來使陣列成像。以1,820個邊長為800 μ m的三色16比特圖像獲取了整個陣列,對于覆蓋基因組的1/7的陣列來說,這相當于 10千兆字節(jié)的 圖像信息(70千兆字節(jié)/基因組)。總共獲取了 7個基因組(7X7陣列=49個陣列),其 中包括了幾乎二十萬個獨個的實驗和0. 5兆兆字節(jié)的成像數(shù)據(jù)。圖1中顯示了關于HIV感染的單個目視全基因組分析。它從包含人基因組SiRNA 文庫的7個陣列(圖1A)跨越至單個陣列(圖1B),以及系統(tǒng)地從那個陣列跨越至單個斑 點,在該單個斑點中HIV感染在⑶4沉默后被抑制(圖IC至G)。圖像分辨率適合于高內(nèi) 涵形態(tài)學和表型分析15,然而,陣列圖像數(shù)據(jù)集的大小和拓撲結構需要新的圖像分析解決方案。第一個圖像分析目的為鑒別和注釋陣列上的斑點。在此,在印刷陣列、SiRNA注 釋和圖像順序之間沒有關系(圖2A)。此外,圖像的數(shù)量是相當大的(對于一個三色陣列, 5,460)。單個陣列圖像包含直至四個斑點——常常與鄰近圖像共享——以20X分辨率(圖 2B),而沒有關于斑點身份的內(nèi)在信息。陣列印刷中固有的機械和定位的不精確產(chǎn)生了整體 地在XY上傾斜和移位的陣列,并且在相關的行/列間距、斑點定位和對準排列中存在有斑 點與斑點之間的變化(圖2A)。重要的是,未經(jīng)壓縮的陣列圖像如此之大,以致如果將其集 合成一個連續(xù)圖像,則由于處理能力的限制而不能觀看或操作該圖像。專用軟件自動地采 集各個圖像并創(chuàng)建壓縮的鑲嵌微縮圖(mosaic miniature),其在存儲于服務器上的高分辨 率圖像中保留了空間信息。與原始圖像相比,該圖像被壓縮了 2,500倍(4Mb對10( )。使 該陣列適配的過程使用了該圖像微縮圖,以便用它們的s i RNA身份來注釋斑點。這通過 使3,888個^7變量(3,888個斑點位置)的函數(shù)最小化來達到。這采用兩個約束第一個 是柔性的經(jīng)注釋的網(wǎng)格模型(flexible annotated grid model)(模型約束),其在當該柔 性網(wǎng)格相對于原始網(wǎng)格模型而言嚴重變形時具有高的值。這通過控制毗鄰節(jié)點之間的角度 (圖2D)和已知的斑點間距離(圖2E)來達到,并且所述值隨著這些變形而逐漸增加。第二 個約束是微縮圖的變換(圖像約束),其中當接近斑點中心時該值降低。這通過計算該微縮 圖的曲率圖來達到(圖2F)。該算法定義一個粗略的近似值,然后使上述函數(shù)最小化以產(chǎn)生 與該微縮圖的斑點相適配的網(wǎng)格模型的節(jié)點(圖2G)。然后,使用通過所述適配而確定的斑 點位置的倒轉變換(back transform),用siRNA身份注釋每個斑點,并且從來自數(shù)據(jù)庫的 原始16比特圖像來實時重建之(圖2H)。然后,將斑點的這些高分辨率圖像用于圖像分析 (圖 21)。將七個完全的人基因組(總共49個siRNA陣列)培養(yǎng)觀小時以允許進行宿主基 因沉默。用感染復數(shù)為0. 14的活HIV-I感染陣列3小時,洗滌,并在成像前溫育45小時。 一旦對網(wǎng)格進行了適配并獲得了每個斑點的身份,就使用下述圖像和數(shù)據(jù)分析策略在每個 斑點上獨立地分析HIV感染。僅測量GFP熒光不會產(chǎn)生關于細胞形狀、密度和細胞細胞融 合的信息。更重要的是,不能容易地將在合胞體形成期間GFP信號的稀釋與GFP產(chǎn)生受到 抑制相區(qū)分。為了解決這一點,發(fā)明人開發(fā)了測定15個描述符的算法。為了能夠定量HIV感染,發(fā)明人測量了在siRNA斑點內(nèi)和在圍繞該斑點的邊界上 的細胞。這通過使用這樣的算法來達到,所述算法隨機測量在比斑點大的圖像中的像素以 確定最佳的可能斑點位置(圖3A,白色正方形),這在具有預測的斑點尺寸的情況下進行。 通過二維高斯形狀的模板匹配(template matching)來檢測核中心,所述二維高斯形狀粗 略地建立了關于圖像中的經(jīng)染色的發(fā)熒光的核的模型。在位于那些核中心上的小圓盤之上測量GFP和核染色。該測量相對于背景或細胞形狀變化來說是強有力的。為了測量合胞體 形成和細胞分散,從所有核中心的集來計算德洛內(nèi)三角剖分(Delaimay triangulation)16 以建立獨特的鄰域圖(neighborhood map)。測定關于每個獨特的核核連接的最小GFP 值,并且德洛內(nèi)三角剖分給出沃羅諾伊圖形(Voronoi diagram)17,其被用于分開密集地 擠在一起的核。所述算法在150ms內(nèi)為每個實驗/斑點產(chǎn)生15-維的向量(cellNumber、 linkMinGFPAvg、 linkMinGFPSdtdev、 linkLengthAvg、 IinkLengthSdtdeν> inTotalGFP、 inlntNucleiAvg、iηIntNucIeiSdtdev> inlntGFPAvg、inlntGFPSdtdev、outTotalGFP、 outIntNucleiAvg>outIntNucleiSdtdev>outIntGFPAvg>outlntGFPSdtdev)。圖 3B M7^7 將所述算法應用于CD4斑點和SCRAMBLED斑點的目視結果。鑒于細胞培養(yǎng)中的變化,在全部陣列范圍內(nèi)將感染的測量值進行標準化。由于在 整個其表面上的不完美的細胞密度,因而所述陣列是具有低頻率空間變化的大實驗。在圖 4A中顯示了陣列圖像,其代表了關于整個單個陣列的結果向量的每個維度。使用具有3個 斑點的半徑大小(其被定義為使對照類別之間的分開最大化的半徑,見下面)的中部濾波 器(median filter)來過濾結果陣列。該標準化產(chǎn)生了與在全部7個基因組范圍內(nèi)的所有 測量值相當?shù)南鄬χ?。發(fā)明人的意圖是鑒定出在抑制早期階段HIV感染中與對照CD4 —樣有效的基因。 因此,他們從215個獨個⑶4實驗和3896個SCRAMBLED實驗的兩個對照分布建立了兩類 別分類器(two class classifier)。由于它們都是15-變量高斯分布,因而他們設定了 簡單而強有力的分類器并且計算出了最具區(qū)別性的投影,如圖4B-E中所顯示的。對于所 有190,510個數(shù)據(jù)點,發(fā)明人計算了相對于⑶4和SCRAMBLED類別的15-維的馬哈拉諾比 斯距離。馬哈拉諾比斯距離是1936年由P. C. Mahalanobis所介紹的一種距離量度。它基 于變量之間的相關性,通過其可以鑒別和分析不同的圖式(patterns)。它與歐幾里得距離 (Euclidean distance)的不同在于,它考慮數(shù)據(jù)集的相關性。發(fā)明人僅將更接近于⑶4而 非SCRAMBLED并同時具有小于由卡方(chi-squared)(具有15個自由度)確定的給定g的 平方根的距⑶4類別中心的距離的點選擇為相應于被選定為至少0. 99的門控概率(gating probability)(即點必須以0. 99的概率在⑶4類別中,不包括畸形的和不相關的、然而更 接近于⑶4而非SCRAMBLED的實驗)。這將1680個實驗(0. 8% )鑒定為可能與⑶4相似。 發(fā)明人計算了在這兩個類別中的基于實驗密度的得分比。對于每一個基因,計算CD4類別 之內(nèi)的實驗對CD4類別之外的實驗的百得分之間的比率。所有得分低于1的基因被認為具 有異常高的在CD4類別中的顯現(xiàn),并且得分越低,那個顯現(xiàn)越強。例如,CD4具有0.043的 值,這意味著,它在CD4類別之中的密度為在CD4類別之外的23倍(1/0.043)。鑒定了 44 個具有低于0.1的比率(這表明其在⑶4類別中過顯現(xiàn))的基因(表1,圖4)。低于0.1 的得分意味著在CD4類別之內(nèi)的密度為在CD4類別之外的至少十倍(圖4)。就它們在HIV感染中的牽涉而言,在這44個基因中,36個被鑒定為是新的(參見 表2)。其余的八個基因先前已顯示直接或間接地參與HIV感染。最近,由Brass等人18進 行的功能基因組篩選將MED28、CSPP1和ERP27揭示為編碼HIV感染所需的蛋白質的幾個宿 主基因中的三個。在此之前,已將MED28(magiCin)鑒定為FYN(其為已知的HIV相互作用 伙伴)的相互作用伙伴19。Ku70由于其與逆轉錄病毒復制中間體和預整合復合物的相互作 用而為眾所周知的逆轉錄病毒感染早期步驟的介體2°。PKNl (也稱為I^akl)已顯示與HIV輔助因子Nef相互作用,并且PKNl的耗竭強烈地抑制多細胞體系中的HIV感染21。FDA-批 準的靶向PTGIS的藥物苯基丁氮酮(phenylbutazone)已作為潛在的用于人和動物的抗病 毒(包括HIV)劑而被授予了專利權22。CCL2/MCP-1編碼在HIV感染過程中由HIV基質蛋 白P17誘導的促炎趨化因子23’24。此外,先前報道過,UNG2被包裝進HIV病毒顆粒中,并且 與病毒的逆轉錄酶在物理上相結合25。超過20%的鑒定出的基因是已知的HIV感染的效應 子這一事實驗證了本文中所呈現(xiàn)的總體結果。令人感興趣的是,RNASEH2A中的突變已顯示 導致艾-古綜合征(Aicardi-GoutiSres syndrome, AGS)這一神經(jīng)病學病癥26。為了證實這些篩選結果的重要意義,必要的是證明,最終,LTR-GFPHeLa細胞中候 選基因的耗竭以與通過⑶4敲減所看到的相似的方式阻斷HIV復制。為了測試這一點,我 們選擇了 RNASEH2A、MED28和JMY,并且使用CD4作為對照。將細胞用各自的siRNA轉染24 小時,并用HIV感染48小時。通過監(jiān)測表達GFP和P24的細胞的出現(xiàn)來測量病毒復制14。 細胞中RNASEH2A、MED28和JMY敲減阻斷了 HIV感染(圖5A)。使用GFP強度和P24表達 來進行這些圖像的定量(圖5B,5C)。RNASEH2A敲減導致相比于用雜亂的siRNA轉染的群 體而言HIV感染幾乎降低了 80% (圖5B,5C)。MED28和JMY敲減也導致HIV感染降低了大 約50 % (圖5B,5C)。通過以RT-PCR測量它們的表達,我們還證實了,所靶向的mRNA被下 調(diào)(圖5D)。因此,RNAseH2A、MED28和JMY對于HIV感染過程來說是必需的。 為了進一步證實這些篩選結果的重要意義,在對于HIV感染而言更具代表性的 細胞類型中將RNASEH2A用作用于敲減的代表基因。為了進行有效的基因沉默,將各自的 RNASEH2A #1和#2 siRNA轉染到Jurkat細胞(T淋巴細胞)中。通過以定性(圖6C)和定量 (圖6D)方式的RT-PCR,證實了通過其表達而下調(diào)了所靶向的mRNA。大約50%的RNASEH2A 被沉默。以兩個不同的MOI用HIV感染經(jīng)RNASEH2A siRNA轉染的細胞,并且通過P24 ELISA 來測量病毒復制(圖6A,B)??傊?,RNASEH2A的敲減取消了 Jurkat細胞中WT HIVl病毒的 復制。這些觀察結果確認了先前的發(fā)現(xiàn),即RNASEH2A對于HIV感染過程來說是必需的。材料和方法化學藥品所有精細化學藥品均購自Sigma-Aldrich。DRAQ5 來自 BioStatus (Sh印shed,UK)。 所有 siRNA 雙鏈體均購自 Dharmacon (USA)。siRNA 文庫包括 1. OnM 的 Dharmacon si ARRAY 全人基因組 siRNA 文庫(Thermof isher,West Lafayette, CO),該 siRNA 文庫包含 84,508 個siRNAs,其相應于四個獨特的siRNA雙鏈體,它們靶向21,127個獨特的人基因中的每一 個。一抗來自Santa Cruz Biotechnology,并且所有發(fā)熒光的二抗來自Molecular Probes/ Invitrogen (Carlsbad, CA)。轉染試劑來自商業(yè)來源。細胞系和細胞培養(yǎng)如所描述的14 那樣來制備 LTR-GFP HeLa 細胞(A. Boese, Institut Pasteur Korea) 0在補充有110mg/mL丙酮酸鈉、10%胎牛血清(Gibco, USA)和青霉素-鏈霉 素(Invitrogen ;Carlsbad, USA)的高葡萄糖 glutamax Dulbecco 改良的 Eagle 培養(yǎng)基 (Invitrogen ;Carlsbad, USA)中培養(yǎng)野生型 HeLa(ATCC)和表達 GFP-扭轉蛋白(torsin) 的HeLa (R. Grai Ihe,Institut Pasteur Korea)。將穩(wěn)定的細胞系在補充有選擇標記的培 養(yǎng)基中進行維持。將細胞系在陣列上培養(yǎng)12至72小時,以便對反向轉染進行定量。關于 HIV感染,每陣列(24X 60mm)接種650,000個細胞,并且在補充有5 %胎牛血清(Gibco,USA)和 青霉素-鏈霉素(Invitrogen ;Carlsbad, USA))的 Opti-MEM(Invitrogen ; Carlsbad, USA)中培養(yǎng) 28 小時。以 0. 14 的 MOI 用 HIV-1 毒株 11 IB (Daymoon industries ; Cerritos,USA)對細胞接種過夜。次日,添加補充有5%胎牛血清(Gibco,USA)和青霉 素-鏈霉素(Invitrogen ;Carlsbad, USA)的新鮮 Opti-MEM(Invitrogen ;Carlsbad, USA)。 將細胞再培養(yǎng)45小時,隨后在處于Dulbecco磷酸鹽緩沖鹽水中的(w/v)低聚甲醛之中 進行固定,并且在成像之前用2. 5 μ M Draq5 (BioStatus, UK)對核進行染色。將Jurkat克 隆E6-1 (ATTCC)在補充有10%胎牛血清(Gibco, USA)、1 %青霉素-鏈霉素(Invitrogen ; Carlsbad,USA)、lmM 丙酮酸鈉(Gibco,USA)、IOmM HEPES 的 RPMI 培養(yǎng)基 1640 (Invitrogen ; Carlsbad, USA)中進行培養(yǎng)。
微陣列印刷基本上如所描述的27那樣來制備SiRNA轉染溶液,并且在封閉在定制的潔凈 室(其提供無菌的經(jīng)HEPA過濾的氣氛)中的情況下,在22-25°C和55-65% RH下,使用 stealth 針(telechem,USA)和高通量微陣列印刷機(Genomic Solutions,USA),在 1 號蓋 玻片上將其印刷為3,888斑點陣列(108X36個斑點)。將陣列貯存在干燥器中,在印刷后 1周至8個月沒有顯著的性能改變。7個載玻片覆蓋了基因組,并且包含16%的對照siRNA 斑點。微陣列獲取和分析用點掃描共聚焦閱讀器(ImageexpressUltra,Molecular Devices,USA),將陣列 獲取為直接寫至外部數(shù)據(jù)庫的16比特TIFF文件。從所述數(shù)據(jù)庫中直接讀取圖像,以便使 用為此目的而設計的軟件來進行分析。應用適合的網(wǎng)格適配以鑒定整個陣列中的siRNA斑 點,使這些斑點大小合適,并修剪它們,然后提取圖像以進行分析、注釋和結果輸出。RNA 分離和 RT-PCR用Trizol 法(Invitrogen,USA)從經(jīng) siRNA 轉染的 LTR-GFP HeLa 和 / 或 Jurkat 細胞中分離出總RNA。在37°C下,在60分鐘期間,在50pmololigo(dT)引物和20 μ M dNTP 混合物存在下,在25 μ 1反應混合物中使用IygS RNA和MMLV-逆轉錄酶(Promega)來制 備cDNA。關于PCR擴增,在25yL反應混合物中,將特異的寡核苷酸引物對(各0. 2pmol) 與 200ng cDNA、1 個單位的 LA Tag 聚合酶(Takara)、1 X LA PCR 緩沖液 2 (2. 5mM MgCl2)禾口 100 μ M dNTP —起進行溫育。所使用的引物的序列如下RNASEH2A 有義引物 5,-GACCCTATTGGAGAGCGAGC-3,和 RNASEH2A 反義引物 5’ -GTCTCTGGCATCCCTACGGT-3,;JMY 有義弓丨物 5,-GCAACTCTGGTTAGGAGCCC-3,和 JMY 反義弓丨物 5' -TATCTCCTCGGAGACCGTCC-3‘;MED28 有義弓丨物 5,-GGACTATGTCAATGGCACCG-3,和 MED28 反義引物 5' -TTGTGCTGCACGTTGATGTC-3‘;CD4 有義弓丨物 5,-GGATAGTGGCACCTGGACAT-3,和 CD4 反義弓丨物 5’ -CTTGCCCATCTGGAGCTTAG-3’ ;和GAPDH 有義弓丨物 5,-TGATGACATCAAGAAGGTGGTGAAG-3,和 GAPDH 反義引物 5’ -TCCTTGGAGGCCATGTGGGCCAT-3’。PCR條件為95°C 30秒,54°C 30秒,和72°C 3分鐘,總共40個循環(huán)。將PCR產(chǎn)物施加到瓊脂糖凝膠上,并用溴化乙錠來可視化。 ιΗ向siRNA轉染和病毒感染在24-孔平板中,用1 μ M針對所選擇的獨個RNASEH2A#1、#2的Acell siRNA (Dharmacon,USA)或者雜亂的siRNA轉染Jurkat細胞(40,000個細胞/孔),然后溫 育 72 小時。以 0. 5,0. 01 的 MOI 用 HIV-I 毒株 11 IB (Daymoon industries ;Cerritos, USA) 感染細胞,并接種3小時。在移除病毒上清液后,將細胞在補充有10%胎牛血清(Gibco, USA)、1 % 青霉素-鏈霉素(Invitrogen ;Carlsbad, USA)、lmM 丙酮酸鈉(Gibco, USA)禾口 IOmM HEPES 的 RPMI 培養(yǎng)基 1640 (Invitrogen ;Carlsbad, USA)中培養(yǎng) 96 小時。通過用 P24ELISA(Perkin-Elmer)檢測無細胞上清液中的p24 HIV-I病毒核心抗原來確定病毒復 制。在96-孔平板中,用 50nM 所選擇的 siRNA (Dharmacon,USA)轉染 LTR-GFP HeLa 細胞(5,000個細胞/孔),隨后溫育24小時。用HIV-I毒株II IB (Daymoon industries ; Cerritos,USA)感染細胞,并接種3小時。在移除病毒上清液后,將細胞在生長培養(yǎng)基中進 行培養(yǎng)。將細胞在處于Dulbecco磷酸鹽緩沖鹽水中的4% (w/v)低聚甲醛之中進行固定, 用抗-P24抗體(Abcam,USA)進行染色,并用2. 5 μ M Draq5 (Biostatus, UK)進行染色,然后 進行成像。P24免疫熒光檢測將細胞用磷酸鹽緩沖鹽水(PBS)洗滌兩次,用在PBS中的4% (w/v)低聚甲醛固定 10分鐘,然后用PBS進行洗滌。關于透化,將細胞在處于PBS中的0. Triton-X 100之 中溫育10分鐘,隨后在PBS中進行洗滌。然后,在4°C下,與在處于PBS中的10%山羊血清 之中的小鼠抗-P24抗體的1 200稀釋物一起溫育2小時。在軌道式旋轉器上,將平板用 PBS洗滌3次,10分鐘。在室溫下,將Alexa 532山羊抗小鼠二抗(1 1000)與所述細胞 一起溫育1小時,然后在軌道式搖動器上用PBS洗滌細胞3次(10分鐘),然后在室溫下添 加在PBS中的5 μ M DraQ510分鐘。參考文獻1 J. Lama 禾口 V. Planelles,Retrovirology 4,52(2007).2 S. G. Megason 和 S. Ε· Fraser,Cell 130 (5), 784 (2007).3 A. W. ffhitehurst, B. 0. Bodemann, J.Cardenas φ A, Nature 446(7137), 815(2007).4 R.Z.Wu,S.N.Bailey 和 D.M.Sabatini,Trends in Cell Biology 12(10), 485(2002).5 J. Ziauddin 和 D.M. Sabatini ,Nature 411 (6833),107 (2001) ·6 S. N. Bailey,S. M. Ali,A. E. Carpenter 等人,Nature Methods 3(2), 117(2006); S. N. Bailey, D. Μ· Sabatini 禾口 B. R. Stockwel1, Proceedings of the National Academy of Sciences of the United States of America 101 (46),16144(2004) ;D. B. Wheeler, S. N. Bailey, D. A. Guertin 等人,Nature Methods 1 (2),127 (2004).7 H. Erfle, B. Neumann, U. Liebel 等人,Nature Protocols 2 (2),392 (2007).8 H. Erfle, J. C. Simpson, P. I. Bastiaens 等 人,BioTechniques 37(3), 454(2004).
9 J. C. Simps on, C. Cetin, H. Erfle ^A, Journal of Biotechnology 129(2), 352(2007).10 D. B. Wheeler, A. E. Carpenter 禾口 D. M. Sabatini, Nature Genetics 37 Suppl, S25(2005).11 C. Conrad, H. Erfle, P. Warnat φ A, Genome Research 14 (6),1130 (2004); U. Liebel, V. Starkuviene, H. Erfle ^A, FEBS Letters 554 (3), 394 (2003) ;B. Neumann, M. Held,U. Liebel 等人,Nature Methods 3 (5),385 (2006).12 H. Erfle 禾口 R. Pepperkok, Methods in Enzymology 404,1 (2005).13 H. Erfle禾口R. P印perkok,Methods in Molecular Biology (Clifton,N. J 360, 155(2007).14 D. I. Dorsky, M. Wells 禾口 R. D. Harrington, J Acquir Immune Defic Syndr Hum Retrovirol 13 (4),308 (1996).15 C. Bakal,J. Aach,G. Church 等人,Science (New York, N. Y 316(5832), 1753(2007).16 B. Delaunay, Izvestia Akademii Nauk SSSR Otdelenie Matematicheskikh i Estestvennykh Nauk 7,793(1934).17 G. F. Vorono i, J. Reine Angew. Math. 134,198 (1908).18 A. Brass, D. Dykxhoorn, Y. Benita 等人,Science 319 (5865),921 (2008).19 M-F. Lee, R. Beauchamp, K. Beyer 等人’ Biochem Biophys Res Commun. 348, 826(2006).20 L. Li, J. M. Olvera, K. E. Yoder 等人,The EMBO Journal 20 (12),3272 (2001) ·21 D. Nguyen, K Wolff, H. Yin 等人,J Virol. 80 (1),130 (2006) ·22 J-0. Miesch, US04956377.23 E.Marlnl,L. Tlberlo,S. Caracclolo 等人,Cell Microbiol. 10 (3), 655 (2008).24 A. Ansari,R. Schmidt 和 H. Heiken,Clin Immunol. 125,1 (2007).25 S. Priet,J-M. Navarro,N. Gros 等人,J Biol Chem. 278 (7), 4566 (2003).26 Y. Crow, A. Leitch, B. Hayward 等人,Nat Genet. 38 (8),910 (2006).27 H. Erfle, B. Neumann, U. Liebel 等人,Nature Protocols 2 (2),392 (2007); H. Erfle 禾口 R. Pepperkok, Methods in Enzymology 404,1 (2005).28 N. Emans 和 U. Nehrbass,WO 2008/034622.29 G. Ilsley, N. Luscombe 禾口 R. ApweiIer, Biochim Biophys Acta doi 10. 1016/ j. bbapap. 2009. 05. 002 (2009).
權利要求
1.具有由SEQID No. 46所表示的序列的核酸,或其部分序列,或與所述核酸或所述部 分序列互補的序列,其中所述部分序列包含至少20個連續(xù)核苷酸,它們用于a)闡明HIV感染的機制;b)作為藥物靶標;或者c)鑒定在治療HIV中有用的化合物。
2.具有由SEQID No. 1或SEQ ID No. 2所表示的序列的核酸,或其部分序列,或與所述 核酸或所述部分序列互補的序列,其中所述部分序列包含至少20個連續(xù)核苷酸,它們用于a)闡明HIV感染的機制;b)作為藥物靶標;或者c)鑒定在治療HIV中有用的化合物。
3.具有由SEQID No. 5所表示的序列的核酸,或其部分序列,或與所述核酸或所述部分 序列互補的序列,其中所述部分序列包含至少20個連續(xù)核苷酸,它們用于a)闡明HIV感染的機制;b)作為藥物靶標;或者c)鑒定在治療HIV中有用的化合物。
4.具有由SEQID No. 3-4和6_45中任一個所表示的序列的核酸,或其部分序列,或與 所述核酸或所述部分序列互補的序列,其中所述部分序列包含至少20個連續(xù)核苷酸,它們 用于a)闡明HIV感染的機制;b)作為藥物靶標;或者c)鑒定在治療HIV中有用的化合物。
全文摘要
本發(fā)明涉及在HIV感染的早期階段中所牽涉的人宿主因子的鑒定。此外,本發(fā)明涉及所鑒定的基因用于闡明HIV感染的機制、作為藥物靶標和用于鑒定在治療HIV中有用的化合物的用途。
文檔編號C12Q1/68GK102131939SQ200980127188
公開日2011年7月20日 申請日期2009年6月25日 優(yōu)先權日2008年6月25日
發(fā)明者A·蓋諾威索, C·S·楊, H·C·金, M·P·文迪施, N·Y·金, N·伊曼斯, S·俊, U·內(nèi)爾巴斯, Y·J·洪 申請人:巴斯德研究所, 韓國巴斯德研究所