
潛在諾獎候選人、蛋白質設計師

來源:新智元
蛋白質設計最近風頭正盛,這不又來了新作品,華盛頓大學的研究人員開發了兩種深度學習算法可預設計特定功能的蛋白質。
蛋白質是構成生命的基石,而如何快速、準確地確定蛋白質的三維空間結構,在生命科學領域一直是個難題。
復雜的蛋白質結構 圖源:science
而現在研究人員利用全蛋白質組氨基酸協同進化分析和基于深度學習的結構建模,可完成對蛋白質結構的系統性預測。
隨后,來自華盛頓大學生物化學系的Jue Wang等人提出了兩種深度學習方法來設計「預設定功能位點的蛋白質」,并將其成果發表在Science上。
論文鏈接:https://www.science.org/doi/10.1126/science.abn2100
首先,他們發現了可折疊成包含功能位點的蛋白質序列。
然后,他們重新訓練了一個結構預測網絡,從而在只確定功能位點的情況下恢復蛋白質的序列和完整結構。
第一種方法叫Constrained hallucination,通過在序列空間中進行梯度下降以優化損失函數,并輔以特定問題的交互項,以設計候選免疫原呈現被中和抗體識別的表位,用于抗逃逸病毒抑制的受體陷阱,金屬蛋白和酶,以及具有圍繞已知結合基序擴展的設計界面的靶結合蛋白。
第二種Missing information recovery中,從所需的功能位點開始,共同填充蛋白質所需的缺失序列和結構信息,并通過經過更新的RoseTTAFold訓練以從結構中恢復序列。
AlphaFold2 結構預測計算表明,這些方法可以準確地生成包含非常廣泛的功能位點的蛋白質。
潛在諾獎候選人、蛋白質設計師
提到蛋白質設計,不能不提到大名鼎鼎的蛋白質設計師——David Baker。
他是華盛頓大學生物化學教授和霍華德休斯醫學研究所的研究員,IPD 所長和首席研究員。
作為蛋白質設計和結構研究的領頭人,這幾年來一直被認為是諾獎的有力競爭者。
2020年11月30日,由 DeepMind公司開發的人工智能程序AlphaFold2,在蛋白質結構預測大賽CASP14中,對大部分蛋白質結構的預測與真實結構只差一個原子的寬度,達到了人類利用冷凍申鏡等復雜儀器觀察預測的水平,這是蛋白質結構預測史無前例的與大進步。
隨后,David Baker 教授帶領的研究人員,研發出了一款完全免費的RoseTTAFold,不僅擁有媲美AlphaFold2的蛋白質結構預測超高準確度,而且更快、所需計算機處理能力更低,
現在,David Baker教授帶領的研究團隊,進一步將AlphaFold2與RoseTTAFold相結合,成功用干蛋白質-蛋白質復合物結構的預測。
Baker表示,「在蛋白質設計研究所這忙碌的一年中,我們設計COVID-19療法和疫苗并將其投入臨床試驗,同時開發出用于高精度蛋白質結構預測的RoseTTAFold工具。我很高興科學界已經在使用 RoseTTAFold 服務器來解決突出的生物學問題」。
夢想和現實
OpenAI使用神經網絡,僅憑文本就創建了大量的生動圖像。
DALL·E算法是GPT-3的衍生產品,它通過檢測訓練中的模式,根據簡單的文本提示生成了栩栩如生的圖像。
構建蛋白質功能位點也是類似的。
其中,氨基酸是字母,蛋白質的功能位點是圖像。神經網絡可以通過訓練來觀察數據中的模式。訓練結束,便可以對它進行測試,檢測它是否能產生一個還算不錯的解決方案。
該團隊從之前的產品trRosetta入手。這是一個神經網絡,最初的設計目的是基于氨基酸序列來構建新的蛋白質,同時能夠預測它們的結構。
這個算法看起來很完美,因為它既能預測蛋白質的氨基酸序列,又能預測其結構。
然而,它并沒有真正起作用。相比之下,RoseTTAFold表現得更為出色。
這個算法的強大之處就在于它的設計,即在納米尺度上對每個氨基酸進行建模,為每個原子提供坐標。
RoseTTAFold可以就手頭問題去預測一個特定的功能結構,并提出一個粗略的草圖作為最終設計。
不過,研究小組隱藏了部分蛋白質序列(或結構)。
這款軟件必須學會如何從嘈雜的無線電攔截中破譯信息,也就是說,在這種情況下,你只能聽到前幾個單詞,然后通過填空理解其真實含義。
RoseTTAFold解決了「缺失信息恢復問題」,自動完成氨基酸序列和結構,以高保真度構建了給定的功能區。
RoseTTAFold可以同時解決構建氨基酸序列,并為該位點生成骨架的問題。這就像把單詞寫在紙上:寫信人除了要確保拼寫無誤,還要檢查語法和語義是否正確。
該團隊對他們的新發明進行了測試,設計出了幾種藥物和疫苗,這些藥物和疫苗可能會成功對抗病毒和癌癥。
在進行該項目期間,Jue Wang博士兩歲的兒子因RSV肺部感染而住院,這種病毒通常表現出類似感冒的癥狀,但對小孩和老年人來說可能是致命的。
當時,Jue Wang博士正在使用該算法設計新的治療方法,其中包括RSV上的潛在位點,以進一步測試疫苗和藥物。這是一個相對良好的結構。
這個軟件的設計概括了該疫苗可能結合的兩個位點。深度學習方法在此奏效了!
在其他的幾個測試中,該團隊還為酶、蛋白質結合蛋白和抓住金屬離子的蛋白質設計了功能位點。
這種方法為揭開天然蛋白質的神秘面紗打開了大門,同時也可能為合成生物學設計新的蛋白質。
總之,這是深度學習的另一個勝利,也是人工智能和生物學巧妙結合的「作品」。
參考資料:
https://singularityhub.com/2022/07/26/protein-designing-ai-opens-door-to-medicines-humans-couldnt-dream-up/