5月9日,谷歌DeepMind和Isomorphic Labs聯合發布了最新預測蛋白質等結構的大模型——AlphaFold3。
據悉,AlphaFold3可以通過準確預測蛋白質、DNA、RNA、配體等的結構以及它們之間的相互作用,增強人類對新藥的發現方法與效率。
例如,用AlphaFold3去預測新冠病毒(COVID-19)的刺突蛋白結構,深度解讀病毒與宿主細胞ACE2受體之間的相互作用關系。
醫療研究人員便能基于該結構的完整信息快速開發一種小分子藥物,阻斷新冠與ACE2的結合,從而有效地阻止病毒的入侵、復制和傳播。再經過多輪動物、臨床、人體的實驗,一款特效藥、疫苗就能快速誕生了。
所以,不少醫學領域的科學家對AlphaFold3的評價非常高,認為AI也有機會去競爭醫學領域的諾貝爾獎。
目前,AlphaFold3已經免費提供在線使用,手稿論文已在全球頂級期刊《自然》上發布,稍后會推出編輯整理版。
谷歌表示,自AlphaFold系列模型發布以來,全球數百萬科研人員在其幫助下實現了多項技術突破,在瘧疾疫苗、癌癥治療和酶設計等獲得了大獎。
最新發布的AlphaFold3是在2代模型基礎之上研發而成,并且使用了全新擴散模型、Pairformer等創新模塊,進一步增強對蛋白質的預測準確率以及架構解讀。
解讀AlphaFold3創新模塊
從AlphaFold3的論文來看,雖然AlphaFold2在預測蛋白質結構方面已經很優秀,但研究人員為了進一步提升其準確率和泛化能力,在AlphaFold3引入了生成式AI領域非常火的擴散模型。
使用擴散模型的好處是,可以直接在原始原子坐標上操作,而不需要依賴于氨基酸特定的框架或側鏈扭轉角度。這種直接預測原子坐標的方法有助于減少立體化學的損失。
其核心思想是將結構預測問題轉化為一個逆向過程,從帶有噪聲的坐標中恢復出真實的生物分子結構。這個過程通過逐步去噪,逐漸精細化結構預測?芍笇lphaFold3學習如何從噪聲數據中恢復出準確的蛋白質結構信息。
在上一代AlphaFold2模型中,Evoformer模塊對準確預測蛋白質結構發揮了重要作用,負責處理多序列比對(MSA)表示、成對表示和單個殘基表示。但Evoformer也有一個非常致命的缺點,就是對算力的消耗非常大,不適用于批量大規模業務。
所以,在AlphaFold3中用Pairformer替代了Evoformer模塊,徹底去除了對MSA表示的處理,只保留了簡單、高效的成對表示和單個殘基表示。
Pairformer模塊只有4個transformer塊組成,僅使用簡單的加權平均方法處理MSA表示,接著所有信息都通過成對表示傳遞給48個標準的transformer塊進一步處理數據。
這種巧妙的設計不僅極大節省了算力,還提升了AlphaFold3的預測泛化能力,可輕松預測各種非天然化合物。
根據谷歌公布的測試數據顯示,AlphaFold3的準確性比 PoseBusters 基準測試中最佳傳統方法高出50%,這也是首個超越基于物理的生物分子結構預測AI模型。
為什么預測蛋白質結構很重要
所有的植物、動物和人類細胞內部都有數十億的分子機器,并由蛋白質、DNA等多種分子組成。
但是,這些分子并不是獨立工作的,它們需要互相配合才能完成復雜的生命活動。只有通過研究這些分子如何協同工作,我們才能真正理解生命的運作過程。
例如,當你吃東西的時候體內的消化酶(一種蛋白質)就開始工作,幫助你分解食物。消化酶需要與食物中的分子相互作用,把大的分子分解成小的分子,身體才能吸收這些營養物質。
因此,蛋白質在所有生物過程中都扮演關鍵角色,包括細胞信號傳遞、免疫反應、代謝和細胞結構維持等。
很多疾病,例如,癌癥、阿爾茨海默病、心血管疾病等,都與蛋白質的異常功能或折疊有關。
只有通過預測和理解特定蛋白質的結構,醫療科學家可以更好地理解疾病的分子基礎,進而發現疾病的成因和潛在的治療目標,加速醫藥的研發進程。
文章內容僅供閱讀,不構成投資建議,請謹慎對待。投資者據此操作,風險自擔。
海報生成中...
海藝AI的模型系統在國際市場上廣受好評,目前站內累計模型數超過80萬個,涵蓋寫實、二次元、插畫、設計、攝影、風格化圖像等多類型應用場景,基本覆蓋所有主流創作風格。
IDC今日發布的《全球智能家居清潔機器人設備市場季度跟蹤報告,2025年第二季度》顯示,上半年全球智能家居清潔機器人市場出貨1,2萬臺,同比增長33%,顯示出品類強勁的市場需求。