王琳琳
近日,谷歌深腦團隊(DeepMind)和同構(gòu)公司(Isomorphic)在國際科技期刊《自然》發(fā)表一項重大研究成果,揭示在蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域取得的突破性進展??茖W(xué)家通過聯(lián)合自注意力機制和擴散模塊,推出一種新模型,可成功預(yù)測幾乎所有生命分子的結(jié)構(gòu)及其相互作用。這一突破讓我們對生命中復(fù)雜現(xiàn)象的理解進入了一個全新的階段。
圖庫版權(quán)圖片,轉(zhuǎn)載使用可能引發(fā)版權(quán)糾紛
AI大模型讓藥物研發(fā)更精準(zhǔn)
相較于此前的蛋白質(zhì)結(jié)構(gòu)和相互作用預(yù)測工具,這項研究成果將成功率提升50%以上。它不僅可取代現(xiàn)有的許多結(jié)構(gòu)解析工作,還能廣泛應(yīng)用于生物醫(yī)藥行業(yè),大大加速了新型藥物的開發(fā)進程,并顯著降低開發(fā)成本。舉個例子來說,在抗腫瘤免疫調(diào)節(jié)過程中,通過對相關(guān)蛋白結(jié)構(gòu)預(yù)測,以及相應(yīng)蛋白與新型小分子藥物結(jié)合后的結(jié)構(gòu)變化預(yù)測,可有效評估小分子藥物的療效潛力。這一過程僅需在服務(wù)器上輸入蛋白質(zhì)的基因序列和小分子結(jié)構(gòu)式,即可快速完成預(yù)測。相比之下,傳統(tǒng)方法則需進行大量耗時且昂貴的生物化學(xué)實驗才能獲得類似結(jié)果。
然而,生物大分子的結(jié)構(gòu)多變與復(fù)雜相互作用,只是生命復(fù)雜性的冰山一角。為了真正理解生命如何從一個個單獨分子形成細胞,進而形成個體并表現(xiàn)出生長發(fā)育、自我繁殖,以及適應(yīng)環(huán)境等多種復(fù)雜行為,我們不僅需要掌握生物分子的結(jié)構(gòu)和相互作用,還必須了解這些生命分子如何在生命體內(nèi)的集體運動機制。
為了精確描述生命體中無數(shù)分子的集體運動機制,科學(xué)家們建立了數(shù)學(xué)模型來描述系統(tǒng)狀態(tài)隨時間的變化。這些模型被稱為動力學(xué)模型。事實上,在現(xiàn)實世界中,細胞中的分子會受到溶液、溫度和其他分子的相互作用等因素干擾,導(dǎo)致我們無法精確預(yù)測這些分子的具體狀態(tài)。為了應(yīng)對這種不確定性,科學(xué)家們開始采用概率的方法,描述這種概率分布變化的模型,被稱為隨機動力學(xué)模型。
通過求解隨機動力學(xué)方程,我們可以了解關(guān)于分子運動的所有信息。但是,概率性導(dǎo)致數(shù)據(jù)信息量變得巨大,需要計算的空間點的個數(shù)也隨著分子數(shù)量的增加而呈指數(shù)級增加。例如,對100種化合物分子而言,就需要計算超過10^300個空間位置,這甚至遠遠超過了整個宇宙中的原子個數(shù),得到所有空間位置概率所需的計算時間也與宇宙的年齡相當(dāng)。因此,為了處理如此龐大的計算量,科學(xué)家們一直在探索更加高效的計算方法和模型,希望能更精準(zhǔn)、更快速地揭示生命分子的動態(tài)行為。
AI大模型實現(xiàn)隨機動力系統(tǒng)高效解算
為了破解這一計算難題,中國科學(xué)院長春應(yīng)用化學(xué)研究所博士劉傳波和國科溫州研究院研究員汪勁在國際期刊《美國科學(xué)院院刊》上發(fā)表了一篇突破性的文章。他們提出了一種基于AI大模型的隨機動力系統(tǒng)求解方法。通過使用基于強化學(xué)習(xí)的知識蒸餾技術(shù),他們首次證明,可以在極高精度下將高維隨機系統(tǒng)的全部動力學(xué)信息,編碼到一個統(tǒng)一的神經(jīng)網(wǎng)絡(luò)中。這可以形象地比喻為將一個如同宇宙般龐大的空間壓縮進一個神經(jīng)網(wǎng)絡(luò)大模型。此求解方法將原本指數(shù)級的計算復(fù)雜度壓縮到近似線性,使得對包含超過100種化合物的隨機動力系統(tǒng)的精確求解成為可能,成功攻克了隨機動力系統(tǒng)的計算難題。同時,他們還發(fā)現(xiàn)經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)獲得了與大語言模型類似的泛化能力,可根據(jù)已學(xué)習(xí)過的方程精確預(yù)測其他動力學(xué)方程的概率。這可以類比于人類舉一反三的能力,例如,學(xué)習(xí)了1+1=2之后,就知道1+2=3。而且神經(jīng)網(wǎng)絡(luò)比人類更加精確,展現(xiàn)出了超越人類的對隨機動力系統(tǒng)的理解能力。通過應(yīng)用這一新方法,未來科學(xué)家將能以前所未有的精度對整個細胞乃至整個組織進行定量分析,從而探索生命行為如何從一堆無生命的分子中涌現(xiàn)出來。
古希臘德爾斐神廟墻上鐫刻著“認(rèn)識你自己”的箴言。幾千年來,這句古老的智慧名言激發(fā)了無數(shù)哲學(xué)家的深思與探討。今天,隨著人工智能大模型技術(shù)的飛速發(fā)展,這句話正獲得全新的意義。借助AI大模型對生命系統(tǒng)中分子結(jié)構(gòu)和相互作用的預(yù)測,以及對分子在細胞中運動的精確計算,人類終于可以逐步揭開生命的神秘面紗,逐漸認(rèn)識真實的自己。
(作者系吉林省科普創(chuàng)作協(xié)會會員、吉林省科學(xué)技術(shù)工作者服務(wù)中心助理研究員)