清華大學劉洋老師組、人民大學高瓴人工智能學院黃文炳老師組、字節(jié)跳動 AI 制藥團隊共同提出了一種跨分子種類統(tǒng)一生成框架 UniMoMo 。該框架基于分子片段(block)對不同種類的分子進行統(tǒng)一表示,使用變分自編碼器對每個 block 的全原子構(gòu)象進行壓縮,并在壓縮后的隱空間進行幾何擴散建模(diffusion),從而實現(xiàn)對同一靶點不同結(jié)合分子種類(小分子、多肽、抗體)的設計。 UniMoMo 在多類分子任務基準的評測中均實現(xiàn)領先表現(xiàn),展示了跨模態(tài)知識遷移與數(shù)據(jù)共享的巨大潛力。
相關成果以「UniMoMo: Unified Generative Modeling of 3D Molecules for De Novo Binder Design」為題,入選 ICML 2025 。
為什么需要統(tǒng)一建模
不同的分子類型在藥物開發(fā)中各有優(yōu)劣,因此在不同的疾病場景中往往需要選擇最合適的分子類型。例如:
* 小分子體積小、易于口服、穿透性強,適合進入細胞內(nèi)部作用于靶點,廣泛應用于慢性病和代謝類疾病等;
* 多肽類分子擁有較高的靶向性,能夠與蛋白質(zhì)表面的大而平的區(qū)域結(jié)合,適合靶向「難成藥」的蛋白互作位點,常用于癌癥、炎癥等治療中;
* 抗體具有極高的選擇性和親和力,能夠穩(wěn)定識別特定的蛋白標志物,特別適合免疫治療等精確干預場景。
因此,面對不同的疾病機制、靶點特征和用藥需求,適合使用的分子類型是不同的?,F(xiàn)有的生成方法通常只針對某一類分子(如小分子、肽或抗體)進行建模,既無法滿足多樣化的治療需求,也無法利用不同分子之間的共性來提升模型性能。
從應用角度來看,統(tǒng)一建模可以讓我們針對同一個靶點同時探索多種類型的候選藥物,為不同的下游場景提供更多選擇。
從機器學習角度出發(fā),不同分子類型之間共享相似的結(jié)合規(guī)律(氫鍵、π-π 堆疊、鹽橋等)和幾何約束(鍵長、鍵角等),是可以相互借鑒的,因此統(tǒng)一建模通過利用更大的數(shù)據(jù)規(guī)模,應當能提升模型的泛化能力和交叉遷移能力。

UniMoMo 為同一結(jié)合位點設計不同種類的結(jié)合分子生成式統(tǒng)一建模的困難
盡管統(tǒng)一生成不同類型分子的想法令人期待,但要實現(xiàn)這樣一個框架仍面臨巨大挑戰(zhàn),主要體現(xiàn)在分子表示的選擇,以及生成算法的設計上。
首先,不同分子類型在結(jié)構(gòu)表示上存在較大差異:小分子由各種官能團組成,結(jié)構(gòu)高度多樣且非線性;而肽和抗體則由氨基酸以線性序列連接構(gòu)成,尤其抗體還具有功能明確的功能區(qū)域劃分。一種直觀但效果不佳的做法是將所有分子都視為原子圖來建模。然而這種方式忽略了分子天然的層次結(jié)構(gòu),比如苯環(huán)或標準氨基酸等關鍵子結(jié)構(gòu),并且導致在處理如抗體這類結(jié)合面較大的體系時計算成本極高。
反之,如果僅使用常見的結(jié)構(gòu)片段詞表構(gòu)建立片段級別的圖(例如多數(shù)蛋白質(zhì)設計的工作,只考慮 Cα 坐標),而忽略原子級細節(jié),則會犧牲分子生成的可遷移性與精度,因為結(jié)合分子設計的本質(zhì)規(guī)律是與靶點的空間相互作用,以及分子內(nèi)部的幾何約束,這些都是定義在原子級別上的物理規(guī)律,需要精確的全原子信息支持。
因此,要構(gòu)建一個真正有效且高效的統(tǒng)一分子表示,就必須同時解決兩個難題:既要保留原子層面的幾何細節(jié),又要抽象出結(jié)構(gòu)上的層級先驗。
其次,如果在生成中引入結(jié)構(gòu)片段來保留層級先驗,則對生成算法帶來核心挑戰(zhàn):傳統(tǒng)的擴散模型通常依賴于定長、固定結(jié)構(gòu)的數(shù)據(jù)表示,例如固定數(shù)量的點云或原子。對于 AF3 一類的結(jié)構(gòu)預測模型而言,由于 2D 拓撲是提前給定的,擴散過程中并不會產(chǎn)生原子數(shù)或 2D 結(jié)構(gòu)的變化。而對于分子生成的任務,2D 拓撲和 3D 結(jié)構(gòu)是需要被同時生成的,而當去噪過程中結(jié)構(gòu)片段的類型發(fā)生變化時,其所對應的原子數(shù)量、種類和排布都會隨之改變。這一點打破了常規(guī)擴散模型的假設,對建模提出了極高要求。
UniMoMo:統(tǒng)一的生成模型
為了解決不同分子類型結(jié)構(gòu)差異大、建模難度高的問題,文章提出了一個全新的框架——UniMoMo,它從兩個關鍵設計入手,有效兼顧了結(jié)構(gòu)的層次性和原子級精度:
* 統(tǒng)一表示:以 block 形式建模所有分子類型。
無論是小分子、肽還是抗體,UniMoMo 都將其結(jié)構(gòu)表示為由分子片段(block)組成的圖。其中每個 block 可以是一個標準氨基酸,也可以是一個常見的小分子片段(如苯環(huán)、吲哚等)。在文章的實現(xiàn)中,記錄的分子片段包括所有標準氨基酸和由主子圖(principle subgraph)挖掘算法自動識別而得的小分子片段。所有的非天然氨基酸可以當作小分子進行分詞。這種表示方式既同時保留了分子的原子級別細節(jié),以及不同種類分子自身的層級結(jié)構(gòu),使統(tǒng)一建模成為可能。
* 全原子幾何隱空間擴散模型:在壓縮表示上進行高效生成。
為了解決生成過程中 block 種類改變導致的原子種類和數(shù)量同步改變的問題,并且為了提升生成效率和結(jié)構(gòu)精度,文章設計了一個全原子的迭代變分自編碼器(IterVAE),將每個 block 中的所有原子壓縮為隱空間中的一個「點」,包括定長的隱空間表示向量和對應的隱空間坐標。
然后,模型在這個壓縮的幾何隱空間中進行生成式建模,生成新分子的潛在表示,最后再解碼回完整的原子結(jié)構(gòu)。由于隱空間的數(shù)據(jù)表示是定長(預先給定 block 的數(shù)量)且連續(xù)的,因此可以很容易地兼容已有的各種生成算法。在目前的嘗試中,擴散模型(diffusion)已經(jīng)能產(chǎn)生比較不錯的結(jié)果。這種設計使得模型在生成過程中聚焦于 block 之間的全局布局,而細致的原子級構(gòu)造則由解碼器來補全,從而同時實現(xiàn)了高效性與原子級準確性的統(tǒng)一。

不同分子種類的分詞方案以及模型整體架構(gòu)統(tǒng)一建模超越單域建模
為了驗證 UniMoMo 在不同分子類型上的通用性與有效性,作者在多個基于結(jié)構(gòu)設計任務中進行了系統(tǒng)評估,涵蓋了小分子、多肽和抗體三類代表性的結(jié)合分子。通過與對應領域內(nèi)最具代表性的單分子類型生成模型進行對比,實驗旨在探討統(tǒng)一建模是否具備更強的幾何建模能力與跨模態(tài)泛化能力,特別是在空間結(jié)構(gòu)合理性與結(jié)合能力等關鍵指標上的表現(xiàn)。
結(jié)果顯示,統(tǒng)一訓練的 UniMoMo 在所有分子類型上都實現(xiàn)了全面超越,不僅在結(jié)構(gòu)還原精度上表現(xiàn)優(yōu)異,更在關鍵的幾何合理性和與靶點的相互作用質(zhì)量上取得顯著提升。
與靶點結(jié)合的多肽設計結(jié)果
在多肽生成任務中,UniMoMo 在多個關鍵指標上顯著優(yōu)于現(xiàn)有的專域模型,包括 RFDiffusion 、 PepFlow 和 PepGLAD 等。尤其在結(jié)構(gòu)準確性方面,UniMoMo 達到了更低的復合物 RMSD 和單體的 RMSD,表明其生成的肽結(jié)構(gòu)更加接近真實結(jié)合構(gòu)象。
UniMoMo 還能生成具有更低 Rosetta 結(jié)合能的結(jié)構(gòu),反映出其對蛋白結(jié)合位點幾何特征的更強建模能力。此外,在衡量多肽構(gòu)象質(zhì)量的二面角度分布一致性(JSD of backbone/sidechain torsions)以及原子級空間沖突(clash rate)等幾何合理性指標上,UniMoMo 同樣展現(xiàn)出領先表現(xiàn)。并且,使用所有數(shù)據(jù)訓練的 UniMoMo(all)在各種指標上一致性地超過了僅使用多肽數(shù)據(jù)訓練的模型,證明了 UniMoMo 的跨分子種類學習和泛化的能力。
抗體 CDR-H3 的設計結(jié)果
抗體 CDR-H3 的設計的合理性結(jié)果
在抗體設計任務中,UniMoMo 同樣展現(xiàn)出強勁性能。相比現(xiàn)有方法如 MEAN 、 dyMEAN 和 DiffAb,UniMoMo 在召回天然結(jié)合的序列和結(jié)構(gòu)(AAR 和 RMSD)以及結(jié)合能提升(IMP)等關鍵指標上均實現(xiàn)全面超越。特別是在多次采樣生成的評估中,UniMoMo 能夠以更高概率生成接近天然構(gòu)象的抗體片段,顯示出其在抗體結(jié)構(gòu)空間中的良好探索能力。
同樣的,使用跨分子類型數(shù)據(jù)聯(lián)合訓練的 UniMoMo(all)在所有指標上均優(yōu)于僅使用抗體數(shù)據(jù)訓練的版本,說明統(tǒng)一建模確實有助于模型學習到更普適、更可遷移的分子結(jié)構(gòu)空間規(guī)律。這一結(jié)果凸顯了不同分子類型之間在結(jié)構(gòu)建模上的共性,也驗證了跨域數(shù)據(jù)融合對提升生成質(zhì)量的顯著價值。
小分子設計的整體比較
小分子設計的子結(jié)構(gòu)分析
在小分子生成任務中,UniMoMo 同樣展現(xiàn)了優(yōu)越的性能。通過在 CrossDocked2020 數(shù)據(jù)集上的評估,作者發(fā)現(xiàn) UniMoMo 在基于 CBGBench 的綜合評價上超越了現(xiàn)有主流方法。
具體而言,UniMoMo 在子結(jié)構(gòu)分布(原子種類、官能團等)、化學性質(zhì)合理性(QED 、 LogP 、 SA 等)、幾何結(jié)構(gòu)質(zhì)量(鍵長/角度分布與原子沖突率等)以及相互作用得分(Vina docking)等方面均取得了更高的綜合評分(完整的實驗結(jié)果請查看原文)。尤為重要的是,與僅在小分子數(shù)據(jù)上訓練的單域版本相比,跨分子類型訓練的 UniMoMo(all)在所有評估維度上均有顯著提升。這表明,即便是在分子結(jié)構(gòu)構(gòu)成最為靈活、類型最為多樣的小分子場景中,統(tǒng)一模型依然能夠從其他分子類型中遷移幾何規(guī)律與相互作用模式,進而提升小分子的單體構(gòu)象和相對口袋空間布局的合理性。這一現(xiàn)象再次驗證了 UniMoMo 的核心理念:不同分子之間的幾何約束和結(jié)合機制具有可共享的模式,統(tǒng)一建??梢杂行Ъぐl(fā)這一潛力。
綜合三類任務的實驗結(jié)果,UniMoMo 展現(xiàn)出高度一致的優(yōu)勢:使用跨分子種類數(shù)據(jù)訓練的統(tǒng)一模型在各自任務中優(yōu)于現(xiàn)有的單域生成模型,且相比只用單域數(shù)據(jù)訓練的 UniMoMo 有明顯的能力提升。這一現(xiàn)象表明,分子設計中看似截然不同的任務,其底層的物理化學約束與空間幾何規(guī)律實則具有高度共性,而 UniMoMo 的統(tǒng)一建模策略正好捕捉并放大了這種共性,從而實現(xiàn)跨任務遷移、互補增強。這些結(jié)果不僅驗證了 UniMoMo 的有效性,也為未來構(gòu)建更強大的統(tǒng)一的分子生成系統(tǒng)提供了強有力的實證支持。
GPCR 案例研究
UniMoMo 在 GPCR 相同結(jié)合位點設計的不同結(jié)合分子
作為案例,作者選取了人類最重要的藥物靶標之一——G 蛋白偶聯(lián)受體(GPCR),評估 UniMoMo 在同一結(jié)合位點上生成不同類型分子(多肽、抗體、小分子)的能力。 UniMoMo 所生成的多肽、抗體和小分子常用結(jié)合能評價的力場(Rosetta ΔG,Vina score)下均展現(xiàn)出不錯的分布。而更令人驚喜的是,生成的小分子結(jié)構(gòu)中還自發(fā)地模擬出類似天然氨基酸側(cè)鏈的官能團,用于構(gòu)建氫鍵,與靶點形成關鍵互作。此外,小分子還借鑒了多肽與抗體中的局部幾何構(gòu)型,如分子骨架上的酰胺連接,使其能夠有效填充原本更適合大分子的結(jié)合口袋。這一案例生動展示了 UniMoMo 在實際任務中跨模態(tài)借鑒、自動適應結(jié)合口袋的能力,體現(xiàn)了其在三維結(jié)構(gòu)層面深度理解靶點與分子之間相互作用,以及分子內(nèi)部幾何約束的潛力。
未來的探索
盡管 UniMoMo 已在多個分子類型與任務中展現(xiàn)出強大的統(tǒng)一生成能力,但作者也指出,該方向仍存在諸多值得探索的未來可能。
當前工作主要聚焦于天然氨基酸與常見分子片段的建模,后續(xù)可進一步擴展到非天然氨基酸、后修飾多肽/抗體、環(huán)狀分子等結(jié)構(gòu)更加復雜的藥物形式,從而覆蓋更廣泛的候選分子空間。統(tǒng)一建模的理念也為模型的可控性和可解釋性研究提供了契機,有望進一步推進生成模型向更可信、更實用的分子設計平臺發(fā)展。總之,UniMoMo 的提出不僅為分子設計任務提供了一個通用而強大的生成框架,也為 AI 驅(qū)動的藥物發(fā)現(xiàn)打開了一個充滿潛力的新方向。