腫瘤靶向肽數據庫
腫瘤靶向肽既有來源于抗體CDRs的類型、模擬抗體和受體相互作用的類型,也有基于配體(EGFR、激素受體、整合素受體等)的腫瘤靶向肽。
Kapoor等構建了一個基于腫瘤靶向肽的數據庫TumorHoPe,其網址為 http://crdd.osdd.net/raghava/tumorhope/。這個數據庫中的多肽可以特異性識別腫瘤細胞和腫 瘤相關的微環境(如新生血管)。網站中的信息來源于已發表的論文、專利和數據庫。 TumorHoPe的當前版本包含744條肽。每個條目提供了肽的綜合信息,如序列、靶向的腫瘤、靶向的細胞、鑒定技術、肽受體等。此外,該網站還收錄了由肽的序列衍生出的其他各種信息,如肽的二級和三級結構、氨基酸成分、肽的物理化學性質。此數據庫包含針對多種腫瘤的靶向肽,包括乳腺癌、肺癌、前列腺癌、黑色素瘤、結腸癌等;部分肽類具有一些共同的基序,如特異性識別腫瘤血管的RGD和NGR基序。TumorHoPe已經集成了諸如搜索功能、數據庫瀏覽和肽繪圖等許多基于Web的工具。這些工具允許用戶基于氨基酸序列、電荷性、極性、疏水性來搜索腫瘤靶向肽(圖5-1) 。
噬菌體展示技術
噬菌體展示技術是一項特殊的基因重組表達技術,亦是一種強大的篩選技術,指將外源蛋白分子或多肽的基因克隆到絲狀噬菌體基因組中,與噬菌體外膜蛋白融合表達,然后展示在噬菌體顆粒的表面。由于外源蛋白或多肽的基因型和表型統一在同一噬菌體顆粒內,因此,通過表型篩選就可以獲得它的編碼基因。
1990年,Scott等在噬菌體展示技術的基礎上發展并構建了噬菌體展示隨機肽庫。噬菌體肽庫技術是一種新興的藥物發現工具,通過噬菌體展示隨機肽庫篩選獲得的肽可以作為子載體運載藥物,起到生物導彈的功能。篩選的肽也可以直接與藥物靶點分子特異性結合,起到生物治療的作用。近年來,噬菌體肽庫技術已廣泛應用于篩選腫瘤靶向短肽的研究中。
常用于噬菌體展示技術的噬菌體有兩種類型:M1線性噬菌體和T7噬菌體。噬菌體展示庫是把隨機短肽片段與噬菌體P3或基因的N端進行融合,通過展示技術讓隨機短肽得以獨立表達并具有生物學功能。噬菌體肽庫構建的關鍵環節是得到足夠多的能獨立表達多肽的單克隆噬菌體,以便于靶標的結合與識別。篩選的結果受多個因素的影響,而合理地應用篩選方法是能得到高特異性、高親和力多肽的最重要的環節。
噬菌體展示文庫由數十億條肽組成,它可以在體內鑒定組織的特異性從而研究疾病的特異性差異。將噬菌體展示文庫注射到小鼠體內,進入血液循環,表達有組織靶向肽的噬菌體會結合在靶組織上,然后從靶組織中提取噬菌體并通過感染合適的細菌宿主來進行擴增;將整個過程重復幾次以富集對靶組織具有高親和力的表達腫瘤靶向肽的特異性噬菌體(圖5-2)。此方法可以用于鑒定各種組織類型表達的分子標簽、目前采用該技術已經篩選到多種靶向特定組織(包括正常和癌性組織)的多肽。因為需要在多輪重復淘選中富集到有活性的噬菌體,該噬菌體展示圖譜的篩選可能相當費時。
合成肽庫
合成肽庫(synthetic peptide librarie, SPL)的方法也可以用于篩選及鑒定耙向肽。SPL方法允許篩選含有天然和非天然氨基酸的多種肽。它通過由含有4~10個氨基酸的短肽組成,這對于有效地選擇性傳遞送藥物最為適宜。通過分裂和混合方法能夠合成出數十萬數百萬的肽。
SPL是直接以氨基酸為原料,將其偶聯于某些載體或者是游離于溶液中的小肽的集合。根據最終的存在狀態將其分為固相SPL和液相肽庫,固相SPL的載體可以選擇聚苯乙烯珠、棉花、濾紙和聚乙二醇等。
mRNA展示技術
2012年Nature Communication 雜志上報道了采用mRNA展示技術篩選腫瘤穿透肽的方法?,F以此文獻為例,做簡單介紹,如圖5-3所示。在體外將DNA文庫轉錄成RNA文序,把RNA的3'端和帶有嘌呤霉素的連接子結合使之與 RNA文庫在無細胞翻譯體系中共翻譯,隨后可以得到一個含有嘌呤霉素錨定的隨機化肽-mRNA-cDNA嵌合分子文庫。將Jurkat、CHO成HeLa等腫瘤細胞與該展示文庫溶液的培養基共孵育1小時。采用ELISA、磁珠法等,分離含有目標肽的肽-mRNA-cDNA嵌合分子,洗脫后加酶分解到cDNA,將其進行PCR,得到產物進入下一輪循環,經過多次循環,目標肽及其編碼的基因序列最終得到富集和分離,部分氨基酸序列被鑒定為CPP的主要候選物。將得到的具有15個氨基酸的長度的CPP 與異硫氰酸熒光素(FITC)結合,采用Jurkat、CHO和HeLa細胞驗證肽的功能?;谠擁椦芯浚髡咄ㄟ^嘗試不同細胞起源的惡性腫瘤系,篩選和鑒定了 47條具有對人腫瘤免疫治療細胞具有獨特穿透性的CPP。
軟件模擬
Sharma等利用TumorHPD網絡服務器分析了大量的腫瘤靶向肽和非腫瘤靶向肽的數據,在初步分析這些數據時,研究者觀察到某些殘基存在于腫瘤靶向肽中的比例高于其他殘基,并且在特定位置存在“優選氨基酸”如C、R、G、W、P、L和S在TTP中更豐富。為了理解N末端和C末端殘基的偏好,研壽考們計算并比較了 TTP和非TTP的 N-末端和C-末端殘基的氨基酸組成(AAC)百分比。然而,在末端殘基中沒有發現氨基酸組成的任何顯著性差異。另外在特定位置,存在某些優選殘基,如在N末端第一位置的 C、A、S、G;在N末端第二位置的G、R、P、E等。類似地,在C末端P、R、C、N和 S等是優選殘基。
基于這些觀察,研究者開發了軟件來區分腫瘤靶向肽和非腫瘤靶向肽的模型,并已經開發使用了氨基酸組成(AAC),二肽組成(DPC)和二元圖譜(BPP)等SVM模型。由于二元圖譜法含有關于氨基酸順序及氨基酸出現頻率的信息,該方法在判斷腫瘤靶向肽方面相比于其他方法而言更具優勢。基于上述方法,研究者已經開發了 TumorHPD在線服務, 網址為:http://crddosdd.net/raghava/tumorhpd/,TumorHPD 是用于預測腫瘤耙向肽的第一 種計算機模擬方法。
另外有一套依據著名的熱點理論實現的靶向肽設計方法,其僅需要支架片段文庫和一些關鍵的錨定殘基就可以設計靶向多種蛋白的肽配體。
以hPD-1為例介紹該靶向肽的設計方法。關鍵錨點hPD-L1 [蛋白質數據庫(PDB)代 碼:4ZQK]的殘基為 Y56、R113、A121、D122 和 Y123,這五個殘基對 hPD-L1 與 hPD-1 的結合具有很大的影響。支架片段文庫由109 805個螺旋和123 230個鏈片段組成。受到五個錨的位置和支架片段的結構特征的限制,研究者從支架文庫中選擇31個鏈和56個螺旋以承載錨A121、D122、Y123、Y56和R113的組合,形成513對支架對。513對支架對隨后被重塑和精制為連續肽,選擇其中4個肽并化學合成用于后續的生化驗證。用基于SPR的方法檢測肽和hPD-1的結合親和力。四種肽的知值均不大于5umo1/L,最有效的 肽Ar5Y_4具有1.38±0.39umo1/L的KD值,表明這種方法能夠設計出具有理想親和力的肽配體。在四種肽中,肽Ar5Y_4具有最高結合親和力,代表它是最有效的hPD-1結合肽。后續研究驗證了肽Ar5Y_4是有希望的hPD-1抑制劑,并且有待進一步的優化。