整個已知宇宙充滿了無限多的分子。但是,這些分子中哪一部分具有潛在的類藥物特征,可以用于開發救生藥物治療?數以百萬計的?數十億?萬億?答案是:11億或1060。這個龐大的數字延長了快速傳播疾病(如2019冠狀病毒疾病)的藥物開發過程,因為它遠遠超出了現有藥物設計模型所能計算的范圍中國化工網okmart.com。從長遠來看,銀河系大約有10億顆恒星,即108顆。
在一篇將在國際機器學習會議(ICML)上發表的論文中,麻省理工學院的研究人員開發了一種稱為EquiBind的幾何深度學習模型,該模型在成功將類藥物分子與蛋白質結合方面比現有最快的計算分子對接模型QuickVina2-W快1200倍。EquiBind以其前身EquiDock為基礎,EquiDock專門使用后期屋大維Eugen Ganea開發的技術結合兩種蛋白質,最近的麻省理工學院計算機科學和人工智能實驗室和Abdul Latif Jameel Clinic for Machine Learning in Health(Jameel Clinic)博士后共同撰寫了EquiBind論文。
在藥物開發之前,藥物研究人員必須找到有前途的類藥物分子,這些分子可以在藥物發現過程中與某些蛋白質靶點正確結合或“對接”。在成功對接到蛋白質后,結合藥物(也稱為配體)可以阻止蛋白質發揮功能。如果這種情況發生在細菌的一種必需蛋白質上,它可以殺死細菌,從而保護人體。
然而,藥物發現過程可能在財務和計算上都很昂貴,在食品和藥物管理局最終批準之前,需要投入數十億美元,并經過十多年的開發和測試。更重要的是,90%的藥物一旦在人體上測試就失敗了,因為它們沒有任何作用或有太多的副作用。制藥公司彌補這些失敗成本的方法之一是提高成功藥物的價格。
目前尋找有希望的藥物候選分子的計算過程是這樣的:大多數最先進的計算模型依賴于重候選采樣,以及評分、排序和微調等方法,以獲得配體和蛋白質之間的最佳“匹配”。漢內斯街盲rk是麻省理工學院電氣工程和計算機科學系的一年級研究生,也是這篇論文的主要作者,他將典型的配體與蛋白質結合方法比作“試圖將鑰匙塞進有很多鎖孔的鎖中”典型的模型在選擇最佳模型之前會花費大量時間對每個“適合”進行評分。相反,EquiBind在一個步驟中直接預測精確的關鍵位置,而無需事先了解蛋白質的目標口袋,這被稱為“盲對接”與大多數需要多次嘗試尋找配體在蛋白質中有利位置的模型不同,EquiBind已經具有內置的幾何推理,可以幫助模型學習分子的基本物理,并在遇到新的、看不見的數據時成功地進行概括,以做出更好的預測。
這些發現的發布很快引起了行業專業人士的注意,包括接力療法首席數據官帕特·沃爾特斯。Walters建議團隊在一種已經存在的用于肺癌、白血病和胃腸道腫瘤的藥物和蛋白質上嘗試他們的模型。雖然大多數傳統的對接方法無法成功地結合作用于這些蛋白質的配體,但EquiBind成功了。Walters說:“EquiBind為對接問題提供了一種獨特的解決方案,它結合了位姿預測和結合位點識別。”“這種方法利用了數千種公開可用的晶體結構的信息,有可能以新的方式影響該領域。”
雖然EquiBind收到了行業專業人士的大量反饋,幫助團隊考慮計算模型的實際用途,但St盲rk希望在7月即將舉行的ICML上找到不同的觀點。“我最期待的反饋是關于如何進一步改進模型的建議,”他說。“我想和那些研究人員討論一下鈥?告訴他們我認為下一步可以做什么,并鼓勵他們繼續前進,將該模型用于他們自己的論文和方法鈥?我們已經有很多研究人員伸出手來詢問我們是否認為該模型對他們的問題有用。"
這部作品是為了紀念屋大維·尤根·加內亞,他對幾何機器學習研究做出了重要貢獻,并慷慨地指導了許多學生鈥攁 才華橫溢的學者,謙遜的靈魂。
本故事由麻省理工學院新聞網(web.MIT.edu/newoffice/)轉載,該網站是一個熱門網站,涵蓋麻省理工學院研究、創新和教學方面的新聞。