NEWS
新闻资讯
|
客户文章 | Hortic Res桂花全基因组重测序为研究花色进化提供了新思路发表单位:湖北科技学院和华中农业大学 发表日期:2021年5月1日 期 刊:Horticulture Research(IF: 6.793) 2021年5月1日,湖北科技学院陈洪国教授团队与华中农业大学王彩云教授课题组联合在园艺权威期刊Horticulture Research(IF: 6.793)发表题为“Whole-genome resequencing of Osmanthus fragrans provides insights into flower color evolution”的研究论文。该研究作者组装了桂花品种“柳叶金桂”的高质量基因组,还对122个样品(119个桂花和3个木犀属)进行了重测序。全基因组关联分析确定了桂花橙/红色性状的SNP位点和候选基因,RNA-seq为候选基因的差异表达分析提供了支持。最终该研究为桂花品种的遗传进化及重要观赏性状花色形成研究提供了一定的思路。爱基百客为该研究提供RNA-seq的技术支持。 研究背景 桂花是我国已有2500年历史的著名观赏植物。在漫长的驯化过程中发现了超过160个栽培品种。根据花色和开花季节,它们被分为四个品种群,包括金桂组、银桂组、丹桂组和四季桂组。这些群体为遗传进化和变异研究提供了一系列的材料,但不同颜色品种的进化关系仍不清楚。在该研究中作者构建了一个秋桂类品种“柳叶金桂”的参考基因组,还对122个样品(119个桂花品种和3个其他木犀属植物)进行了重测序,调查了柳叶金桂的花色特征和驯化历史。群体结构分析表明,这119个种质资源形成了明显的区域聚类。 研究思路 研究结果 1. 基因组测序、组装与注释 利用包含575个contigs的PacBio数据构建了一个733Mb的基因组,占比93.54%的基因组。结合Hi-C文库辅助基因组组装,将92.41%的组装序列锚定到23条染色体上。最终正确的染色体级别基因组大小有677Mb,带有541个contigs。为了评估基因组在核苷酸水平上的准确性,Illumina短reads与组装序列比对,作者鉴定出0.0032%的纯合子SNPs,这表明该基因组具有很高的准确性。作者对基因组进行注释,并使用BUSCO评估基因注释的质量
2. 比较基因组学 为了研究OFL(桂花“柳叶金桂”)的进化历史,作者比较其他的开花植物(水稻、罂粟、甜橙、拟南芥等12个)的基因组。作者将41252个基因聚集到16107个基因家族。共有191个基因被鉴定为共有的单拷贝同源基因(图1)。 为了揭示OFL与其他近缘物种的系统发育关系,186个单拷贝同源基因的蛋白序列用来重建系统发育树。根据分化时间和系统发育关系,OFL基因组中有4325个基因家族显著扩张,1851个基因家族显著收缩(p<0.05)。那些扩增的基因家族包含3274个显著富集的KEGG通路(q value <0.05)(图2)。涉及单萜、二萜、倍半萜、三萜、柠檬烯和类胡萝卜素生物合成的基因得到扩张。 图1 基因数目的进化 图2 不同植物物种最新共同祖先的基因家族扩张和收缩分析 3. 基因组变异和群体进化 花色不同的不同品种桂花的进化关系尚不清楚。因此,作者收集了119个表型多样的桂花群体及其近缘物种进行全基因组重测序,以OFL基因组为参考基因组,研究花颜色性状的遗传结构。作者获得了2072100个SNPs,构建进化树将群体分为三类:A类主要由丹桂组构成,B类和C类主要由银桂和四季桂单独构成。PCA分析也是类似的结果(图3a)。 对这些群体进行群体结构分析,聚类(k)为8时,检测到的CV误差最小。其中“丹桂组”混合程度最低,其他品种均有来自不同桂花祖先的共同祖先(图3b)。4个种群的LD衰减图显示,“丹桂组”的LD衰减速度最快,其次是“四季桂组”,“金桂组”,最后是“银桂组”(图3c)。 图3 基因组变异与种群进化分析 4. 观赏性状的GWAS分析 颜色是桂花及其重要的观赏性状,作者做了GWAS分析寻找桂花品种与花瓣颜色显著相关的标记。桂花的颜色分为白色、黄色和橙色/红色。CMLM模式鉴定得到25个重要位点,包含35个基因(图4)。主要候选区域分布在6条染色体上,鉴定到的候选基因包含细胞色素C氧化酶(LYG001209)、蛋白转运蛋白sec16(SEC16B,LYG008575)、乙烯应答转录因子2(ERF2,LYG012560)等。为了验证与花色相关的候选基因的差异表达情况,作者对桂花(根、茎、叶和花,6个不同时期)进行RNA-seq。结果显示35个基因中有12个在不同花期差异表达(图5)。 图4 SNP与花瓣颜色的全基因组关联分析 图5 花瓣颜色相关基因的表达模式 5. CCD4基因位点的变异 据以前报道,“丹桂组”桂花呈橙红色是类胡萝卜素积累的结果。作者分析了CCD基因家族在不同组织部位(根、茎、叶)和不同花期(S1-S6)的表达模式。桂花基因组共有4个CCD4基因,包括定位于2号染色体的CCD4a(LYG004804)、定位于4号染色体的CCD4b(LYG008494)和CCD4c(LYG008495)、定位于15号染色体的CCD4d(LYG026704)。结果显示CCD4b、CCD4c和CCD4d基因在不同花期差异表达,CCD4a仅在根中高表达(图6)。 RT-PCR结果显示CCD4中唯一一个在开花过程中表达差异的是CCD4d,与之前的研究结果相同(图7)。作者在CCD4d基因的第一个编码区发现了一个34 bp缺失的等位基因,存在于“丹桂组”的所有品种。缺失指定为“a”,野生型等位指定为“A”。作者分析了122个重测序样本,结果显示没有一个AA基因型样品来自“丹桂组”,基因型Aa样本包括所有四个群体的品种,包括白色、黄色和橙色/红色的花朵颜色(图8)。 图6 桂花CCD基因家族的表达模式 图7 CCD4d基因在不同花期的转录水平 图8 CCD4d基因34 bp缺失分析 总结在该研究中,联合Illumina、PacBio和Hi-C平台,作者成功测序和组装了具有经济价值的园艺植物桂花的参考基因组。作者还通过对来自4个桂花类群的119份桂花材料的基因组变异和群体进化进行重测序,探讨了桂花花色的起源和进化,发现了几个与花色相关的基因。桂花的参考基因组和基因组变异图谱为桂花品种的进化提供了见解,使基础和应用植物学家受益。 |