NEWS
新闻资讯
|
浅谈染色质开放性与转录组联合分析内容前段时间我们系统性介绍了转录组与染色质开放性结合进行不同方向科学研究的思路和例文分享(万能研究思路:转录组+染色质开放性),后续陆续有客户针对分析内容提出了诸多问题,我们今天就和各位聊一聊转录组与染色质开放性结合的研究分析到底要做些什么? 首先,还是简单介绍一下两个技术手段。ATAC-seq,该技术重点想要解决的问题是开放性染色质区域在哪里,而转录组测序则是在关注基因表达量具体变化情况。那么两个技术结合的意义在于将阐述不同生命学过程中染色质的开放性是如何影响基因的表达的,在此背后进行数据的深度分析和挖掘,从而阐述生命活动机制。那么我们还是参照文章内容,展示一下需要做哪些分析,怎么展示该分析内容。 整体而言,分析内容包括三部分:首先,ATAC-seq和RNA-seq 的标准结果展示,其次两者联合分析,最后是重点数据的重点分析。 part1 标准分析结果 转录组标准分析结果 转录组的标准分析主要集中在差异表达基因的鉴定和分析上,包括通过PCA或者样本相关性结果展示组内的重复性和组间的差异性,通过火山图或者热图来展示差异表达基因,随后即对差异表达基因进行基因的GO和KEGG注释和富集分析,多个样本可以进行表达量聚类分析。 (从左至右:PCA、火山图、热图) (从左至右:差异基因GO、KEGG分析;表达量聚类分析) ATAC-seq标准分析结果 ATAC-seq的标准分析主要侧重点在于开放染色质区域的鉴定,以此延伸的内容稍多一些。首先包括了插入片段的分布,reads在TSS上下游2K范围的分布等展示实验的成功性,但是必须要说明,该部分结果不都是理想状态(例如无明显的核小体分布等)。其次和转录组相似,PCA或者样本相关性结果展示其重复性。随后即call peak结果,包括peak全基因组范围内的分布、功能元件的分布等,另外peak的关联基因分析,关联基因的GO和KEGG注释和富集分析,motif分析等。 (从左至右:插入片段分布、TSS上下游分布;reads分布热图;PCA) (从左至右:peak基因功能元件分布;全基因组分布1;全基因分布2) 因为样本常为多组差异样本,因此差异分析也是重点所在,包括差异peak的鉴定、差异peak关联基因分析、差异peak motif分析等。 (部分差异peak分析内容) 注:关于一些测序的具体情况(例如测序量、比对率、以及常规分析内容)等常于结果描述部分一笔带过后添加至附件,结果展示部分还是需要精简重要结果进行展示。 Part2: 联合分析 1、相关性分析 该部分分析主要是为了展示ATAC-seq和RNA-seq的相关性,经典展示内容即利用差异peak和差异表达基因进行关联,通过散点图计算两者的相关性。由此也衍生出其他类型不同的分析内容,一类是直接利用ATAC-seq和RNA-seq数据进行散点图绘制,即不再使用差异数据,也可进行相关性计算。另外一类,则是在经典分析内容上进行基因功能元件上的区分,即将不同功能元件的差异数据进行散点图绘制,探究不同基因功能元件上的相关性。需要注意的是,一般该分析相关性(r值)都不会特别高,可能与基因表达调控机制的复杂性有关。
相关性分析除了经典散点图绘制外,也会通过展示不同ATAC-seq数据类别(例如peak不同分布范围,或者不同peak个数等)下基因表达量的箱型图,从而显示ATAC-seq和RNA-seq相关性。 (其他相关性分析) 2、Overlap核心基因的挖掘 核心基因挖掘基本思路是将差异表达基因和差异peak关联基因做Overlap分析,鉴定获得两者common基因,随后对common基因进行基因注释和富集分析。另外会对一些重点关注基因进行可视化展示。 (Overlap核心基因分析和可视化展示) Part 3: 重点数据的重点分析 该部分分析并无具体分析套路,还是要基于不同的分析方向进行探究。下面举例以供参考,例如,会针对一些重点GO和KEGG进行网络图绘制,展示不同term下基因的具体注释和富集关系。再比如,会针对重点关注motif,分析其靶基因,并针对靶基因进行motif(或转录因子)--靶基因的网络图绘制。另外会针对重点关注的motif进行足迹分析,探究其结合具体位置。 (从左至右:目标GO对应关系图;转录因子-靶基因网络图;足迹分析图) 写在最后: 染色质开放性和基因表达量存在内在联系,因此ATAC-seq与RNA-seq联合应用阐述基因调控机制具有广泛适用性,并以此挖掘出重要的基因或者转录因子也为研究提供了一定的方向。另外科研的复杂性也一定赋予了分析的复杂性,本文针对文献常用分析内容进行简单汇总,爱基百客具有专业的生信分析团队,上述提到的分析皆有成熟、丰富的分析经验,也期待更加惊艳的分析思路为该技术手段的应用提供新的思路,爱基百客生信团队也将竭尽全力将您的想法变成现实。 |