桑樹是薔薇目桑科桑屬的重要經(jīng)濟(jì)林木,在世界范圍內(nèi)廣泛分布。桑樹具有豐富的遺傳資源,其不僅是全球養(yǎng)蠶業(yè)的基礎(chǔ),更對人類的健康和生態(tài)環(huán)境保護(hù)具有重要作用。2013年首個基于二代測序技術(shù)的桑樹基因組發(fā)表,極大地推進(jìn)了桑樹遺傳育種和種質(zhì)資源改良進(jìn)程。2022年該團(tuán)隊又基于三代ONT技術(shù)重新測序組裝新版基因組,使得基因組的完整性進(jìn)一步提高。然而該基因組與預(yù)估的基因組大小依然有較大差距,依然存在未組裝完成的序列以及未掛載到染色體的序列,這些序列中包括了著絲粒、端粒以及其他一些重復(fù)序列,序列的缺失限制了對基因組的利用。
2023年7月,Horticulture Research在線發(fā)表了基地科研團(tuán)隊題為***“The gap-free genome of mulberry elucidates the architecture and evolution of polycentric chromosomes”***的研究論文。這是桑樹首個報道的無缺口參考基因組,是繼2013年桑樹基因組圖譜發(fā)表后,桑樹基因組學(xué)領(lǐng)域中又一里程碑事件。
該研究基于川桑Morus notabilis,利用PacBio HiFi、ONT ultra-long以及Hi-C技術(shù)組裝得到首個0 gap的桑樹完整基因組Mnot-SWU。該基因組大小為410.45 Mb,contig N50達(dá)到75.38 Mb,BUSCO評估基因組完整性為98.51%。通過注釋,共獲得27413個基因,基因數(shù)量高于之前所有基因組版本中基因數(shù)量。在該Mnot-SWU基因組中,重復(fù)序列占比為59.20%。
作者開展比較基因組分析,發(fā)現(xiàn)與之前版本基因組相比,Mnot-SWU共新組裝出83.81 Mb的區(qū)間,Mnot-SWU的每條染色體上均存在數(shù)個新組裝的區(qū)間,且這些新組裝區(qū)間與基因組中串聯(lián)重復(fù)序列分布模式一致,與基因分布模式相反。作者進(jìn)一步通過對串聯(lián)重復(fù)序列聚類鑒定出桑樹的著絲粒序列m3cp,通過分析m3cp的分布模式,并進(jìn)一步結(jié)合Chip-seq以及FISH驗證,最終證實(shí)桑樹是一個多著絲粒染色體的物種。通過對chr5染色體結(jié)構(gòu)特征的分析,提出了桑樹染色體斷裂融合循環(huán)的模型:在chr5染色體的28-33 Mb區(qū)間內(nèi)存在一個新形成的著絲粒,該著絲粒的形成,介導(dǎo)了桑樹染色體的斷裂融合現(xiàn)象。
在2013年首個桑樹基因組發(fā)布10年后,該研究公開了桑樹T2T完整參考基因組,這是植物中首個報道的多著絲粒形態(tài)的T2T基因組,不僅為桑樹染色體的進(jìn)化研究提供重要參考,更對桑樹的育種和遺傳改良具有重要意義。