泛基因组(Pan-genome)是指某一物种内所有个体基因组信息的集合,包括核心基因组(所有个体共有的基因)和可变基因组(部分个体特有的基因)。这一概念的提出极大地推动了基因组学研究的深入发展,尤其是在揭示物种遗传多样性、进化机制以及重要性状基因挖掘等方面具有重要意义。
泛基因组在植物研究中具有重要的科学意义与应用价值。相比单一参考基因组,泛基因组提供了一个更全面的视角,能够囊括物种内部的全部基因组多样性,揭示核心基因与可变基因的分布与功能。在植物研究中,利用泛基因组可以解析物种内不同个体对环境胁迫、病虫害的适应性机制,探究关键性状的遗传基础,并为育种提供精确的分子标记。此外,泛基因组还有助于深入研究植物进化历史和自然选择的遗传痕迹,有效提升对植物遗传多样性和生态适应性的认知。往期,我们系统的介绍过泛基因组,盘点过木本植物和水果的泛基因组文章,今天我们接着盘点经济作物的泛基因组文章,涉及大豆、棉花、向日葵、油菜和芝麻等经济作物。
Pan-Genome of Wild and Cultivated Soybeans

发表单位:中国科学院遗传与发育生物学研究所
发表期刊:Cell(IF=45.6)
发表时间:2020
材料选择:3个野生大豆、9个地方品种和14个栽培品种
主要内容:大豆是最重要的植物油和蛋白质饲料作物之一。为了捕捉其基因组的全部多样性,需要从多样化的大豆种质资源中构建一个完整的高质量泛基因组。该研究对从2,898个深度测序的大豆种质中选出的26个代表性大豆进行了单独的全新基因组组装。结合这些组装的基因组和之前报道的三个基因组,研究构建了一个基于图的基因组并进行了泛基因组分析。通过这种方法,鉴定出了许多无法通过短序列直接比对到单一参考基因组而检测出的遗传变异。基于图基因组,对2,898个种质资源的结构变异进行基因型分析,以及对26个代表性大豆的RNA测序(RNA-seq)数据分析,揭示了与重要性状相关的候选基因。这一泛基因组资源将推动大豆在进化研究和功能基因组学研究中的发展。

图:27份大豆材料的泛基因组和核心基因组分析
Convergence and divergence of diploid and tetraploid cotton genomes

发表单位:华中农业大学
发表期刊:Nature Genetics(IF=31.8)
发表时间:2024
材料选择:23份陆地草(AD1)半野生材料和37个具有纤维表型多样性和地理分布的品种
主要内容:多倍化是物种形成和进化的重要驱动力;然而,多倍体和祖先二倍体之间对特定性状进行平行选择的基因组基础仍未被探索。在此,研究通过对50个具有遗传多样性的材料进行基因组装,构建了二倍体(A2)和异源四倍体(AD1)棉花物种的基于图谱的泛基因组。研究描绘了四倍体栽培品种的镶嵌基因组图谱,展示了半野生形式对现代栽培品种的基因组贡献。泛基因组比较鉴定了二倍体和四倍体棉花之间的共线性区域和高度分化区域,这些区域显示了持续的变异,并表明序列进化的持续过程可能与两个亚基因组的基因组大小变化有关。研究强调在二倍体中43%的基因表达遗传调控关系涵盖了多倍化后序列差异,并具体表征了6个位于遗传上的未被深入研究的趋同遗传位点,这些位点对纤维质量平行选择做出了贡献。这项研究为泛基因组剖析生物体中理想性状平行选择的遗传调控成分提供了框架。

图:二倍体与四倍体的泛基因组的比较
Sunflower pan-genome analysis shows that hybridization altered gene content and disease Resistance

发表单位:加拿大英属哥伦比亚大学
发表期刊:Nature Plants(IF=15.8)
发表时间:2019
材料选择:从全球范围内包含40000份栽培和野生材料的向日葵种子资源库中选了493份材料,其中包括287份来自栽培SAM种群,17个美洲原住民地方品种,代表11个兼容野生物种的189份野生材料。
主要内容:经过驯化的植物和动物通常会对选择表现出强烈反应,但这些反应所依赖的遗传多样性的起源仍然知之甚少。尽管经历了驯化和改良的瓶颈,栽培向日葵在遗传上仍保持高度多样性,这可能是由于与野生近缘种的杂交导致的。为了表征向日葵的遗传多样性并量化野生近缘种的贡献,研究对287个栽培品种、17个美洲原住民地方品种,以及代表11个兼容野生物种的189份野生材料进行了测序。针对无法映射到向日葵参考基因组的栽培品种序列,研究对每种基因型进行了从头组装,以确定其基因库或“泛基因组”。随后,将组装的基因与野生物种进行了比较,以估算其起源。结果表明,栽培向日葵的泛基因组包含61,205个基因,其中27%的基因在不同基因型间具有变异。栽培向日葵泛基因组约有10%是通过与野生向日葵种群的基因渗入获得的,其中1.5%的基因完全源于基因渗入。基因本体功能分析进一步表明,与生物抗性相关的基因在渗入区域中显著过度代表,这一观察结果与育种记录一致。对与霜霉病抗性相关的等位基因变异的分析表明,这些渗入在应对全球性挑战性病害的抗性中起到了重要作用。

图:栽培种向日葵的泛基因组
Cicer super-pangenome provides insights into species evolution and agronomic trait loci for crop improvement in chickpea

发表单位:国际半干旱热带作物研究所、西澳大学等
发表期刊:Nature Genetics(IF=31.8)
发表时间:2024
材料选择:8个野生种
主要内容:鹰嘴豆(Cicer arietinum L.)是一种在干旱和半干旱地区种植的重要豆类作物,其遗传多样性有限。为扩大其遗传多样性,正在利用其尚未被广泛研究的野生近缘种开展相关工作。在此,研究基于8种一年生野生鹰嘴豆物种的从头基因组组装,构建了鹰嘴豆超级泛基因组。研究鉴定了24,827个基因家族,包括14,748个核心基因家族、2,958个软核心基因家族、6,212个非必需基因家族和909个物种特异性基因家族。非必需基因基因家族富集了与关键农艺性状相关的基因。通过比较栽培种和野生种基因组的结构变异,构建了基于图谱的基因组,揭示了影响开花时间、春化和抗病性等性状的基因变异。这些变异将有助于通过标记辅助选择或基因编辑,将野生鹰嘴豆物种中的优良性状转移到优质鹰嘴豆品种中。本研究为鹰嘴豆的遗传多样性及作物改良潜力提供了宝贵的见解。

图:鹰嘴豆超级泛基因组的景观
Structural variation reshapes population gene expression and trait variation in 2,105 Brassica napus accessions

发表单位:中国农业科学院油料作物研究所和华中农业大学
发表期刊:Nature Genetics(IF=31.8)
发表时间:2024
材料选择:16个具有代表性形态的新多倍体油菜
主要内容:尽管已知个体基因组结构变异(SVs)会影响基因表达和性状变异,但其在物种范围内的影响程度和规模仍不清楚。研究基于16个具有代表性形态的新多倍体油菜(Brassica napus)材料的基因组组装构建了一个包含334,461个SV的参考库,并在2,105个重测序基因组中检测到258,865个SV。结合来自5个组织的群体转录组数据,研究发现285,976个SV-表达数量性状位点(eQTLs),这些位点与73,580个基因的表达变化相关。研究团队开发了一种用于SV-全基因组关联研究(SV-GWAS)和基于表型数据的转录组关联研究,以及eQTLs和eQTL-GWAS共定位高通量联合分析的流程,鉴定出726个SV-基因表达-性状变异的关联,其中部分通过转基因实验得到验证。研究表明,SV对性状变异的重塑具有普遍性,例如芥子油苷生物合成和运输通路的变异。该研究突出了全基因组和物种规模SV的影响,为研究进化、基因发现和育种提供了重要的方法学策略和宝贵资源。

图:甘蓝型油菜泛SV的鉴定与表征。
Genomic evolution and insights into agronomic trait innovations of Sesamum species

发表单位:河南省农业科学院
发表期刊:Plant Communications
发表时间:2024
材料选择:栽培芝麻和6种野生芝麻
主要内容:芝麻是一种古老的含油作物,具有高含油量和优质油品。然而,其重要农艺性状的进化历史和遗传机制仍不清楚。该研究报告了栽培芝麻(Sesamum indicum L.)和来自芝麻属的六种野生芝麻的染色体级基因组,它们代表了该属中的所有三种核型。核型分析和基于基因组的系统发育分析揭示了芝麻属从n=13到n=16的进化路径,并表明在野生种Sesamum radiatum中发生了异源四倍化事件。研究发现芝麻属在第三纪时期(距今48.5–19.7百万年)早期分化,并且其在真双子叶植物中的古老系统发育位置得到证实。泛基因组分析揭示了7个芝麻物种中9164个核心基因家族,这些基因家族显著富集于包括脂肪酸(FA)代谢和脂肪酸生物合成在内的多种代谢通路中。在磷脂酰乙醇胺结合蛋白(PEBP)基因家族中的SiPT1和SiDT1的结构变异导致了芝麻在植物结构和花序发育表型上的基因组进化。对种间群体和基因组比较的全基因组关联研究(GWAS)发现,野生芝麻和栽培芝麻的长末端重复插入和DIR基因的序列缺失;这两种变异分别独立导致对枯萎病高度易感。在560个芝麻资源的GWAS研究中结合超表达实验确认了NAC1和PPO基因在上调芝麻豆油含量中起重要作用。研究为栽培和野生芝麻物种提供了高质量的基因组资源,同时也为芝麻及其他含油作物的分子育种策略提供了宝贵的见解。

图:芝麻基因组
Gene mining and genomics-assisted breeding empowered by the pangenome of tea plant Camellia sinensis

发表单位:中国农业科学院深圳农业基因组研究所
发表期间:Nature Plants
发表时间:2023
材料选择:22个茶树品种(18个测序组装,4个来已发表数据),品种来自三类:17个中华种(C. sinensis var. Sinensis,CSS),4个阿萨姆种(C. sinensis var. Assamica,CSA),1个白毛茶(C. sinensis var. Pubilimba,CSP)
主要内容:茶是世界上最古老的作物之一,其栽培目的是为了生产出各种口味的饮料。尽管测序技术有所进步,但茶的关键农艺性状背后的遗传机制仍不明确。研究呈现了22个优良品种的高质量泛基因组,代表了该物种广泛的遗传多样性。分析显示,最近的长末端重复爆发贡献了近20%的基因拷贝,引入了影响如叶色等表型的功能性遗传变异。图形泛基因组提高了全基因组关联研究的效率,并允许识别控制芽苞发生时机的关键基因。研究还发现等位变异与口味相关化学成分之间有强烈的相关性。这些发现加深了我们对茶质量遗传基础的理解,并提供了宝贵的基因组资源,以促进其基因组辅助育种。

图:基于22个de nove组装的茶叶基因组,检测结构变异(SVs)并构建泛基因组。
本期,经济作物相关的泛基因组文章盘点到这了,如您有泛基因组相关的研究计划,欢迎联系我们~

项目咨询
精选合集,欢迎收藏哟!
