編輯:David
【新智元導(dǎo)讀】在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)上,AI革命還在繼續(xù)。這次是探尋蛋白質(zhì)之間的相互所用。華盛頓大學(xué)新研究確定了1000多種可能發(fā)生相互作用的不同蛋白質(zhì),并繪制出數(shù)百種蛋白質(zhì)的精確結(jié)構(gòu)。
蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域的AI革命仍在繼續(xù)!這次的焦點(diǎn)不是蛋白質(zhì)結(jié)構(gòu)和形態(tài),而是進(jìn)一步關(guān)注不同蛋白質(zhì)之間的相互作用。一年前,軟件程序首次成功地模擬了單個(gè)蛋白質(zhì)的3D形狀,其精度與幾十年前的實(shí)驗(yàn)技術(shù)測(cè)出的一樣準(zhǔn)確。幾個(gè)月前,研究人員使用AI程序編程了一個(gè)近乎完整的人類蛋白質(zhì)結(jié)構(gòu)目錄。現(xiàn)在,研究人員更進(jìn)一步,使用AI技術(shù)確定了不同蛋白質(zhì)之間可能的相互作用,以及由這種相互作用的「復(fù)合體」產(chǎn)物是什么樣子的。這項(xiàng)新發(fā)現(xiàn)會(huì)促進(jìn)細(xì)胞生物學(xué)領(lǐng)域產(chǎn)生一系列新觀點(diǎn),并為發(fā)現(xiàn)下一代治療藥物指明新方向。從蛋白質(zhì)結(jié)構(gòu)到相互作用,AI技術(shù)立大功
過去幾十年來,精確重現(xiàn)人類蛋白質(zhì)的形態(tài)和結(jié)構(gòu),一直是研究人員的目標(biāo)。過去,要追求這個(gè)目標(biāo)是很困難的,需要昂貴且緩慢的實(shí)驗(yàn),比如X射線晶體學(xué)和核磁共振光譜學(xué)實(shí)驗(yàn)。而且,即使實(shí)驗(yàn)取得進(jìn)展,也只能得到單個(gè)蛋白質(zhì)某些結(jié)構(gòu)。
計(jì)算機(jī)專家一直致力于加快速度。借助AI和深度學(xué)習(xí)算法,研究人員在過去兩年內(nèi)取得了重大突破。該算法使用實(shí)驗(yàn)解決的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)來訓(xùn)練軟件程序如何根據(jù)蛋白質(zhì)的氨基酸序列預(yù)測(cè)蛋白質(zhì)的結(jié)構(gòu)。走在前面的是DeepMind和華盛頓大學(xué)。今年7月15日,DeepMind在Nature上發(fā)表論文,開源了其基于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的AlphaFold 2模型。AlphaFold對(duì)人類蛋白質(zhì)組的結(jié)構(gòu)預(yù)測(cè),覆蓋了98.5%的所有人類蛋白質(zhì)組,還對(duì)20種其它生物蛋白質(zhì)的結(jié)構(gòu)進(jìn)行了預(yù)測(cè)。幾天后,在Science上,華盛頓大學(xué)也發(fā)表了自己開發(fā)的蛋白質(zhì)預(yù)測(cè)工具 RoseTTAFold。RoseTTAFold不僅性能上和AlphaFold 2相當(dāng),預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)也「快、狠、準(zhǔn)」。這些程序都可以預(yù)測(cè)出成千上萬的蛋白質(zhì)結(jié)構(gòu),還為少數(shù)已知的蛋白質(zhì)復(fù)合物生成了結(jié)構(gòu)。但在真核生物中,蛋白質(zhì)之間的相互作用通常還是未知的。為了實(shí)現(xiàn)這個(gè)目標(biāo),兩個(gè)研究團(tuán)隊(duì)都調(diào)整了AI程序。今天,華盛頓大學(xué)團(tuán)隊(duì)在《科學(xué)》期刊發(fā)文,使用AI技術(shù)工具解決了真核生物中712 種復(fù)合物(蛋白質(zhì)相互作用下的產(chǎn)物)的結(jié)構(gòu)問題。該研究同時(shí)使用了華盛頓大學(xué)的RoseTTAFold和DeepMind的AlphaFold工具,篩選了830萬對(duì)酵母蛋白的配對(duì)多序列比對(duì),識(shí)別出了1505種可能的相互作用,并為 106 個(gè)以前未識(shí)別的部分和 806 個(gè)尚未結(jié)構(gòu)表征的部分構(gòu)建了結(jié)構(gòu)模型。為了找到可以形成復(fù)合物的蛋白質(zhì),團(tuán)隊(duì)首先將所有6000種酵母蛋白質(zhì)的氨基酸序列,與 2026 種其他真菌、4325種其他真核生物的氨基酸序列進(jìn)行比較。在比較過程中,研究人員追蹤這些蛋白質(zhì)的進(jìn)化過程,并識(shí)別出不同蛋白質(zhì)中同時(shí)發(fā)生變化的序列。據(jù)此推斷,這些蛋白質(zhì)可能會(huì)形成復(fù)合物,并會(huì)逐步改變以保持它們之間的相互作用。團(tuán)隊(duì)使用自研的RoseTTAFold 的 AI 程序以及此前DeepMind已開源的 AlphaFold工具,嘗試解決每組候選對(duì)象的 3D 結(jié)構(gòu)。在總共830萬個(gè)「候選」酵母蛋白質(zhì)對(duì)中,兩個(gè)AI工具合力識(shí)別出了 1506 個(gè)可能發(fā)生相互作用的蛋白質(zhì),并成功繪制出其中 712個(gè) 3D 結(jié)構(gòu),約占成功識(shí)別數(shù)的一半。研究團(tuán)隊(duì)核心成員、論文共同通訊作者David Baker和Qian Cong介紹:「這些相互作用涵蓋了真核細(xì)胞的所有活動(dòng)。這個(gè)研究的亮點(diǎn)在于發(fā)現(xiàn)了蛋白質(zhì)復(fù)合物的結(jié)構(gòu)。這種復(fù)合物在細(xì)胞活動(dòng)中發(fā)揮著不可替代的重要作用?!?/span>「比如讓細(xì)胞修復(fù) DNA 損傷,將RNA翻譯成核糖體中的蛋白質(zhì),在細(xì)胞繁殖過程中將染色體拉開,并將分子運(yùn)送通過細(xì)胞膜等?!?/span>同樣密切關(guān)注這一研究的DeepMind團(tuán)隊(duì),也對(duì)這一發(fā)現(xiàn)的意義給予了高度評(píng)價(jià)。AlphaFold工具的首席開發(fā)人員John Jumper表示,「這是再現(xiàn)蛋白質(zhì)3D結(jié)構(gòu)的一個(gè)很有前途的研究實(shí)例。明白了蛋白質(zhì)之間如何相互作用,生物學(xué)家就可以進(jìn)一步發(fā)現(xiàn)復(fù)合物細(xì)胞內(nèi)執(zhí)行多項(xiàng)任務(wù)的機(jī)制。「這些模型為實(shí)驗(yàn)人員提供了可測(cè)試的假設(shè),而且,由于破壞這些相互作用,可能獲得干預(yù)各種疾病的新方法,可以說,這一發(fā)現(xiàn)為未來新靶向藥物的研發(fā)提供了更多可能。」Qian Cong表示。上個(gè)月,Jumper 和他的同事在bioRxiv 上發(fā)布了一篇預(yù)印本論文,介紹了AlphaFold AI工具的新版本,名為AlphaFold-Multimer。該工具繪制出了 4433 種蛋白質(zhì)復(fù)合物的結(jié)構(gòu),準(zhǔn)確率達(dá)到了69%。「對(duì)于結(jié)構(gòu)生物學(xué)來說,這確實(shí)是一個(gè)激動(dòng)人心的時(shí)刻」,Baker說。參考資料:
https://www.science.org/content/article/ai-cracks-code-protein-complexes-providing-road-map-new-drug-targets
https://www.science.org/doi/10.1126/science.abm4805
https://www.biorxiv.org/content/10.1101/2021.10.04.463034v1.full.pdf
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。