AlphaFold 3發布,谷歌DeepMind是如何顛覆AI生物學的?

0 評論 469 瀏覽 0 收藏 17 分鐘

最近,生物學預測模型AlphaFold的最新版本——AlphaFold 3正式發布了,而這是谷歌在AI生物學領域的又一次突破。一起來看看AI可以如何應用于生物學領域。

在大語言模型領域處處被OpenAI壓一頭的谷歌,還是憑借自己在AI生物學領域的優勢成功搶得了一次頭條。

北京時間5月8日晚,谷歌DeepMind和谷歌旗下藥物發現子公司Isomorphic Labs聯合發布了其生物學預測模型AlphaFold的最新版本——AlphaFold 3。這是在AlphaFold 2發布三年后,谷歌在AI生物學領域的又一次突破,相關成果已發表在《Nature》上。

與前代相比,AlphaFold 3不僅可以預測蛋白質的結構,還可以預測生物生命中幾乎所有元素(DNA、RNA、配體等)的結構,并且可以準確預測蛋白質與其他分子的相互作用。與現有的預測方法相比,AlphaFold 3發現蛋白質與其他分子類型的相互作用至少提高了50%,對于一些重要的相互作用類別,如蛋白質與配體的結合、以及抗體與其靶蛋白的結合等,預測準確率甚至提高了一倍。

DeepMind首席執行官德米什·哈薩比斯(Demis Hassabis)在新聞發布會上表示:“發布 AlphaFold 3 對我們來說是一個重要的里程碑,生物學是一個動態系統,你必須了解生物學特性是如何通過細胞中不同分子之間的相互作用而出現的。你可以將AlphaFold 3視為我們朝著這個目標邁出的第一步?!?/p>

Isomorphic Labs已經將該模型用于科研,并與制藥公司合作,探索新的疾病治療方法。

一、基于擴散模型解決分子預測泛化難題

DeepMind比OpenAI成立時間更早,但它沒有像OpenAI一樣在大語言模型領域越走越深,而是在蛋白質結構預測上大放異彩。

2018年,谷歌DeepMind推出了首個蛋白質結構預測模型AlphaFold,并在國際蛋白質結構預測競賽中獲得第一名。2020年,DeepMind發布了AlphaFold軟件的第二個版本,AlphaFold 2整合了一個子網絡系統到單一的可微模型中,應用Transformer來預測基于氨基酸序列的復雜3D結構。

在2020年的CASP14,AlphaFold 2脫穎而出,預測精確到原子精度,即使對于缺乏模板的蛋白質,它也能在幾分鐘內產生出色的結果。

2021年,DeepMind發布了AlphaFold蛋白質結構數據庫,與歐洲分子生物學實驗室的歐洲生物信息學研究所(EMBL-EBI)合作創建,為全球研究人員提供了數百萬預測的蛋白質結構。

如今,全球已有數百萬研究人員將AlphaFold 2應用在瘧疾疫苗、癌癥治療和酶設計等領域。AlphaFold已被引用超過20000次,其科學影響力通過許多獎項得到了認可,其中最近的一個是生命科學突破獎(Breakthrough Prize in Life Sciences Awarded),之后發布的AlphaFold-Multimer則推動了對蛋白質-蛋白質復合物的預測。

AlphaFold 3解決了一個生物分子預測懸而未決的難題——由于不同分子類型的特異性相互作用差異太大,難以通過擴大單一深度學習模型來預測所有復合物范圍。

AlphaFold 3在AlphaFold 2的基礎上更進一步,采用了AI繪畫的常見技術——去噪擴散模型(DDPM,Denoising Diffusion Probabiblistic Model)。

想象一下,這個模型像是一位藝術家,從一團模糊的原子“泥漿”開始,一步步雕琢,最后呈現出了清晰的分子結構,連每個原子的三維位置都能精準給出。于是,AlphaFold 3預測分子之間相互作用本事,比現在所有的工具都要厲害。

比如,在一個案例里,AlphaFold 3預測了一個蛋白質(我們可以想象成藍色的積木)和DNA雙螺旋(粉紅色的梯子)如何緊密擁抱,而且這個預測幾乎和科學家辛苦實驗發現的真實樣子一模一樣。

7R6R – DNA 結合蛋白:AlphaFold 3 對分子復合物的預測,其特征是蛋白質(藍色)與 DNA 雙螺旋(粉色)結合,與通過艱苦實驗發現的真實分子結構(灰色)近乎完美匹配。

AlphaFold 3的工作方式很簡單,你給它一份分子名單,它就能畫出這些分子怎么拼在一起的立體圖像。不管是蛋白質、DNA還是RNA這樣的大塊頭,還是藥物小分子這樣的小配件,它都能搞定。要知道,很多藥物就是通過這些小分子和特定大分子的“握手”(指相互作用)來治病的。

不僅如此,AlphaFold 3還能模擬這些分子的化學修飾(就像開關,控制著細胞的健康功能),這些細胞一旦受到破壞就會導致疾病。研究團隊表示,其預測準確度無人能敵,而且作為全能選手,它能一次性計算出整個分子團隊的行動策略,這是前所未有的科學洞察力。

也正是得益于AlphaFold 3的這種能力,其在「藥物發現」中作用巨大,實現了前所未有的準確性,包括蛋白質與配體的結合以及抗體與其靶蛋白的結合。

論文顯示,在無需輸入任何結構信息的情況下,AlphaFold 3比PoseBusters基準測試中最好的傳統方法準確率高50%,這使得AlphaFold 3成為第一個超越基于物理的生物分子結構預測工具的人工智能系統。

預測「抗體-蛋白質」結合的能力對于理解人類免疫反應的各個方面和新抗體的設計至關重要,這是一種不斷增長的治療方法。哥倫比亞大學系統生物學助理教授Mohammed AlQuraishi表示, “AlphaFold 2系統只了解氨基酸,因此它對于生物制藥的效用非常有限,”他說。 “但現在,AlphaFold 3原則上可以預測藥物與蛋白質結合的位置?!?/p>

AlQuraishi表示,盡管在某些方面,AlphaFold 3的成功率是RoseTTAFold等類似領先模型的兩倍,已經是AI在生物學研究領域的一個巨大的飛躍,但它也不是完全沒有缺點——比如蛋白質-RNA 相互作用上,它仍然非常不準確。

對此,DeepMind回應稱,在建模的交互過程中,AlphaFold 3的預測準確度可以從40%提高到80%以上;同時在回答一些基礎性的科研問題時(比如“哪些酶可能分解水瓶中的塑料”等),AlphaFold 3比其他模型靠譜的多。

目前,DeepMind旗下的Isomorphic Labs正在使用AlphaFold 3來加速藥物設計,將其應用在疾病靶點靠近、新靶點發現等項目上。

二、免費賦能科學家,但尚未發布源代碼

在推出AlphaFold 3的同時,Google DeepMind也基于AlphaFold 3推出了一個免費平臺——AlphaFold Server,供全世界的科學家進行非商業性研究,預測蛋白質如何與細胞中的其他分子相互作用。

只需點擊幾下,科學家就可以利用AlphaFold 3為由蛋白質、DNA、RNA以及選擇的配體、離子和化學修飾組成的結構進行建模。

對此,Francis Crick研究所Uhlmann實驗室的研究科學家Céline Bouchoux評價道:“AlphaFold 3一經發布,有可能像AlphaFold一樣具有開創性。有了AlphaFold Server,其不再僅僅是預測結構,而是慷慨地提供訪問權限:允許研究人員提出大膽的問題,并加速發現?!?/p>

然而,Nature報道指出,科學家對AlphaFold 3服務器的訪問是有限的,目前每天只能進行10次預測,而且不可能獲得可能與藥物結合的蛋白質結構,也不能將其用于商業用途。同時,DeepMind似乎也沒有發布AlphaFold 3的開源代碼,而是只發布了AlphaFold 2的。

對此,有Narure論文的審稿人在X平臺上呼吁,應該盡快發布AlphaFold 3的開源代碼,以促進更廣泛的科學研究:“我們已經用AlphaFold 2代碼制作了大約10萬個模型,如果不發布AlphaFold 3的代碼,我們怎么能用AlphaFold Server處理這些研究數據呢?”

三、AI制藥商業化提速

盡管對于外界的科學家提供了訪問限制,但是對于自家“親兄弟”Isomorphic Labs,DeepMind卻給予了廣泛的權限——不僅擁有無限制的訪問次數,Isomorphic Labs的研究人員還擁有對 AlphaFold 3商業用途的獨家訪問權限。

2021年AlphaFold數據庫推出后,谷歌積極為其尋找商業化途徑,在同年成立了Isomorhpic Labs子公司,旨在運用AI尤其是機器學習的方法、從第一性原理重構藥物發現過程,通過建立新的生物現象預測和生成模型,最終找到一些人類最具破壞性疾病的治療方法。

如果說DeepMind的工作主要聚焦基礎研究,那么Isomorphic就專注于更具體的藥物發現。

在2023年9月Endpoints News的專訪中,Demis Hassabis表示,AlphaFold只是整個藥物發現過程的一小部分,AlphaFold不會做ADME(藥代動力學和藥理學中吸收、分布、代謝和排泄的英文首字母縮寫,描述了藥物化合物在生物體內處置的動態變化)屬性之類的事情。言外之意是,這些事情都由Isomorphic Labs來做。

Isomorphic Labs的誕生,代表了從AI模型到AI制藥工業的落地。它預示著「AI制藥」真正從實驗室走向了產業,為人類研發出真正有效的創新藥提供了更多的可能。

創立以來,Isomorphic Labs也相當爭氣,與DeepMind密切配合,取得了不少成果:

  • 2023年9月19日,《Science》雜志的封面文章發表了DeepMind和Isomorphic團隊在AlphaFold的基礎上改進衍生的錯義變異致病性預測模型AlphaMissense。AlphaMissense總共分析了7100個可能的錯義不清,其中的89%進行了分類,其中有32%可能是疾病的,另外57%則可能是良性的;
  • 兩天后的9月21日,被譽為諾獎風向標的“2023拉斯克獎”,頒給了DeepMind的首席執行官Demis Hassabis博士,和John Jumper博士,代表了主流科學界的認可;
  • 2023年10月,Google DeepMind聯合Isomorphic Labs共同發布了新一代AlphaFold模型,它可以預測蛋白質數據庫(PDB)中幾乎任何分子的結構,通常具有原子精度,包括配體(小分子)、蛋白質、核酸(DNA 和 RNA)以及含有翻譯后修飾(PTM)的生物分子;
  • 2024年1月,Isomorphic Labs宣布與禮來(Eli lilly)和諾華(Novartis)達成藥物研發外包合作,通過人工智能方式針對多個靶點開發小分子療法,交易價值達30億美元,這是lsomorphic Labs首次建立制藥合作關系。

目前,關于Isomorphic自身藥物項目的細節仍處于保密狀態,但Isomorphic已將大約20個靶點的清單縮短到幾個,并且正在利用CRO來制造和測試潛在的化合物。

近些年來,“AI+醫藥”成為熱門賽道。在國外,以英偉達為代表,不僅有CEO黃仁勛在公共場合力推、投入重金布局(2023年有10家AI制藥企業獲得英偉達的投資),更是在2023年推出BioNeMo云服務、在2024年推出新的醫療保健項目GenAI和聚焦醫療場景的25個微服務(Nim);在國內,阿里、百度、騰訊等互聯網巨頭也紛紛成立了醫療AI部門,雖目前尚無明確數據顯示其將直接參與制藥環節,但毫無疑問的是,科技巨頭們正在試圖用AI為制藥打開無限的想象空間。

然而,近兩年AI制藥行業也出現了一些泡沫,降本增效的故事開始被質疑,臨床階段的藥物也面臨著有效性不足的難題。

對此,Demis Hassabis在Endpoints News的專訪中似乎做出了回應:“如果我們是正確的并且能夠實現另外六個AlphaFold級別的突破,我們可以將藥物研發所需的時間減少一個數量級,也許是成本和時間,并且在下一階段獲得更高的成功率?!?/p>

作者:王藝;編輯:趙健

原文標題:AlphaFold 3發布,谷歌DeepMind是如何顛覆AI生物學的?|甲子光年

來源公眾號:甲子光年(ID:jazzyear),立足中國科技創新前沿陣地,動態跟蹤頭部科技企業發展和傳統產業技術升級案例。

本文由人人都是產品經理合作媒體 @甲子光年 授權發布,未經許可,禁止轉載。

題圖來自Unsplash,基于CC0協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發揮!