NEWS
新闻资讯
|
ChIP/ATAC/CUT/DAP必看——*Peak到底怎么来的在分子生物学研究中,识别和分析基因组范围内的调控元素是理解基因表达调控机制的关键。随着高通量测序技术的不断进步,诸如ChIP-seq、ATAC-seq、CUT&Tag和DAP-seq等技术为我们提供了强大的工具,以揭示转录因子结合位点、开放染色质区域和DNA结合蛋白的相互作用等信息。在这些实验数据中,我们常常接触到“peak/差异Peak”的概念。从分析逻辑上来说Peak究竟是如何产生的?本文将探讨这些问题背后的分析逻辑,主要围绕以下四个问题帮助大家更好地理解这些高通量数据的分析结果。 Q1: merge peak 和合并组peak是什么,计算逻辑以及差异是什么? A1: 首先我们来解释下什么是peak,peak(峰)是指在基因组中发现的特定区域,这些区域显示出显著的信号强度,通常与转录因子结合或其他蛋白质-DNA相互作用相关。表观组学的研究一般会同组设计2~3个重复,MACS2软件(图1)进行call peak时,会基于reads进行建模以及均一化(方便IN和IP之间具有可比性),随后利用泊松分布计算显著性p值后,利用预先设置的显著性阈值输出peak结果文件(图1)。除了单样本IP VS IN的call peak,当组内有生物学重复时,MACS也能整合组内重复数据输出“以组为单位的peak结果”(图2)。除了MACS自身分析的“组peak”外,我们还会人为对组内生物学重复peak进行merge peak分析,得到以第二种方式分析的“组的peak”,分析逻辑如图3。 图 1 MACS2分析流程 图 2 “合并组peak”的分析逻辑 图 3 merge peak示意图 Q2: diff peak计算逻辑? A2:差异peak就是要涉及到组间比较了,通常使用的分析软件是DiffBind分析包。该软件会对两个不同组样品进行差异分析,计算peaks重复间隔的测序reads数,并基于结合亲和力鉴定具有统计显著性的差异结合位点,确定样品间上调或下调差异修饰的区间。分析思路采用了RNA-seq中差异基因表达的方式来进行peak的差异分析,和macs2的差异功能(bdgdiff)不同,DiffBind需要依赖已有的peak calling结果,将peak区域当做RNA-seq中的基因区域,然后对这些区域进行定量和差异分析,其核心的差异分析通过调用RNA-seq中常用的R包来实现。通常默认的模型是DESeq2。这就意味着如果要用DiffBind进行差异分析的话,必须要有重复样本,否则行不通。 除了直接使用DiffBind软件计算组间差异,还可以顺着merge peak的位置信息,通过取交集的方式分析两组样本间的差异。 Q3: diff peak的结果文件怎么看?Up / down代表什么? A3: Diff_anotation注释表格(图4)是整个差异组比较中最核心的部分:“Treat_vs_CK.merge_peak_down.peak_annotation”是利用组内重复merge取交集后的peak再按照peak位置关系做组间比较,得到Treat与CK相比较只在CK中有富集的峰;“Treat_vs_CK.merge_peak_up.peak_annotation”是利用组内重复merge取交集后的peak再按照peak位置关系做组间比较,得到Treat与CK相比较只在Treat中有富集的峰; 以上merge之间peak的比较只有有无的区别,没有显著性的统计学计算。 “Treat_vs_CK.down.peak_annotation”是利用DiffBind软件(默认是内置DESeq2逻辑)分析组间peak差异,与merge_peak分析不同,该软件包会进行统计学显著性的计算,并对富集倍率有一定要求,默认阈值为FDR值小于0.05,并且Fold(log2FC)小于0。分析结果包含Fold、p.value、FDR、关联靶基因等,如图5。down是指Treat与CK相比较,在Treat中富集倍率降低的peak区域。 “Treat_vs_CK.up.peak_annotation”同样也是利用DiffBind软件分析的,是指Treat与CK相比较,在Treat中富集倍率升高的peak区域。 “Treat_vs_CK.mid”是样本间所有差异的Peak的文件,老师们可以利用这个文件结果,自主利用阈值筛选;“Treat_vs_CK.nofilt”同样也是样本间所有差异的Peak的文件,只不过包含了注释信息。 两种比较方案有不同的侧重点,merge diff侧重于分析A组相对于B组的“特有peak”,而diffbind则倾向于分析两组间固定区域的结合强度差异(FOLD)。因此,两个差异方案结合,能从不同角度探究组间差异,老师可自行按照自身关注点来选择以哪种结果进行后续研究。 图 4 Diff_anotation文件 图 5 软件分析表格结果 Q4: 无重复单样本组间比较和多重复样本组间比较的逻辑差异 A4: 对于多重复样本差异分析可以参考上述A3中的DiffBind软件包或者先取组内交集merge再做组间比较;而对于单样本的组间比较就没有那么多选择了,只能通过peak位置判断差异,取两组间非交集的peak区域。 上述所有的分析内容,在爱基的ChIP-seq、ATAC-seq、CUT&Tag和DAP-seq项目中都可以分析哦,依据分析出来的peak爱基还可以提供指定的基因/peak的reads富集峰图,欢迎各位有相关需求的老师前来咨询~ 项目咨询 爱基百客王牌产品 ChIP-seq技术将染色质免疫共沉淀和二代测序技术结合,是研究体内蛋白质与DNA相互作用的有力工具,可用于组蛋白修饰、RNA聚合酶、转录因子和辅因子以及G4链体(G4)等方面的研究,技术成熟稳定。爱基百客ChIP-seq可提供: ChIP-seq测序分析 Peak分析:Peak注释和分布分析,Peak关联基因的GO、KEGG的注释和富集分析,转录因子和Motif分析等。 多样本差异分析:差异Peak分布情况统计,差异Peak关联基因GO、KEGG功能注释与富集,转录因子预测,Motif预测等。 后续验证 · ChIP-qPCR 分析组蛋白修饰/转录因子与染色质区域的结合情况,揭示染色质状态和基因表达调控之间的关系,真实反映结合特性。 · EMSA 基于DNA-蛋白质复合体在聚丙烯酰胺凝胶电泳(PAGE)中的迁移率不同,检测活化的与DNA结合的蛋白转录或调节因子。 · 双荧光素酶报告实验 检测转录因子与靶启动子的特异结合。 ChIP-seq+转录组关联分析 ChIP-seq和转录组关联分析可以做以下2个方面的研究 · DNA结合蛋白和基因表达调控: 通过ChIP-seq技术可以确定DNA结合蛋白(如转录因子)的结合位点,然后与转录组数据结合分析,可以获得转录因子直接调控的靶基因,为全面理解转录因子调控功能提供依据。 · 组蛋白修饰和基因表达: ChIP-seq可以用于鉴定组蛋白修饰的位点,结合转录组数据可以了解这些修饰对基因表达的影响。 爱基百客ChIP-seq三大优势 · 优势一: 项目经验丰富,研究物种200+种,累计实验2000余次。全面覆盖医口和农口等不同样本,不惧特殊样本(如脂肪组织、高淀粉组织和真菌类),抗体经验也极其丰富(多种组蛋白修饰、转录因子、标签抗体以及p300和RNApol II等均有涉及); · 优势二: 提供前期实验设计、测序、分析以及后期验证(ChIP-qPCR、EMSA)一站式服务; · 优势三: 项目文章多次发表于Science、Cancer Cell、Nature Plants、Nature Metabolism以及Plant Cell等期刊。
Zhang, Y., Liu, T., Meyer, C. A., Eeckhoute, J., Johnson, D. S., Bernstein, B. E., Nusbaum, C., Myers, R. M., Brown, M., Li, W., & Liu, X. S. (2008). Model-based analysis of ChIP-Seq (MACS). Genome biology, 9(9), R137. https://doi.org/10.1186/gb-2008-9-9-r137 Stark, R., & Brown, G. (2011). DiffBind: differential binding analysis of ChIP-Seq peak data. R package version, 100, 4-3 了 解 更 多 { 往 期 精 彩 回 顾 } 精选合集,欢迎收藏哟! |