NEWS
新闻资讯
|
综述解读 | 一文了解ATAC-Seq技术的发展、原理、应用和未来趋势2022年5月13日,国际知名期刊Briefings in Bioinformatics上发表了西北工业大学一篇关于ATAC-seq的综述文章,该研究聚焦于表观组学和转录组。通过回顾ATAC-seq的文献,作者描绘了测序方法,重点介绍了ATAC-seq的多组学联合应用,并在疾病和物种方面举了一系列研究案例。最后,作者汇总并比较分析了ATAC-seq数据分析的程序、网站和工具。小编节选其中的重要内容分享给大家。 Part 1 介绍 ATAC-seq技术使用Tn5转座酶来切割那些没有结合蛋白保护的DNA区域,用于分析染色质的开放性和测定染色质结构的动态变化。ATAC-seq和ChIP-seq具有高度的一致性和互补性。联合ATAC-seq和ChIP-seq可以探索蛋白调控基因表达的机制,为识别转录起始调控因子引起的转录差异提供了可能。ATAC-seq和ChIP-seq可以联合决定特异RNA表达水平的RNA-seq,提供基因表达调控的统一图谱。目前,多组学联合为揭示基因组功能特征提供了强有力的手段,揭示了生物学前沿的基因调控机制。 Part 2 ATAC-seq的发展 利用关键词检索和统计分析近些年ATAC-seq技术的文章发表量、期刊和研究领域。自2013年ATAC-seq技术发布以来,使用该技术发表的文章呈指数级别增长(图1A)。联合ATAC-seq、ChIP-seq和RNA-seq技术的文章发表量也在稳步增长,这暗示多组学数据联合分析的发展趋势。 ATAC-seq相关的研究已经出现在不同领域的200多份期刊上。前50名的期刊如图1B,发表最频繁的两个杂志是Nature Communications和Scientific Reports。其次的期刊有Nucleic Acids Research、Genome Biology、eLife、Cell Reports、 Genome Research、Cell、Methods in Molecular Biology和Bioinformatics。 ATAC-seq研究的主要课题之一是染色质结构和可及性的鉴定。表观遗传变化与癌症等疾病的发生发展密切相关。统计了使用ATAC-seq和/或其他测序技术的癌症和其他疾病的研究,发现共有204个研究,涉及36种癌症和57种疾病。作者统计了每年癌症研究和其他疾病的数量(使用ATAC-seq和/或其他测序技术),近年来呈指数增长(图1C)。 图1 ATAC-seq技术文献计量和数据统计
对发表文章的主题内容进行了分析,早期的文章聚焦于功能探究(landscape、site、pattern),随后的文章专注数据分析(tools、data、analysis),最近的文章则拓展到各种生物主题(process、pathway、treatment)。经常出现的关键词被分为三组(图2B),蓝色组(方法发展)专注于ATAC-seq在分子水平的方法和应用,如DNA可及性、增强子和转录因子;绿色组(数据分析)重点在ATAC-seq的方案和流程,从上游测序到下游数据分析,如样品制备、实验方案和数据分析;红色组(表型研究)聚焦于实际应用,比如基因、调控、通路和疾病。表型研究的组群正在增长,而其他两个则在下降,这表明ATAC-seq正在开发其在更多实际应用中的价值。 图2 ATAC-seq文章的关键词相关性分析和集群变化。
Part 3 ATAC-seq技术原理 随着对基因调控机制认识的深入,人们发现表观遗传学的变化起着重要的作用。这些变化有DNA碱基修饰和染色质结构变化。目前可以使用广泛的测序技术来测量表观遗传学中染色质结构从低水平到高水平的变化。比如,检测DNA甲基化的重亚硫酸盐测序法、检测3D基因组的Hi-C、DNase-seq、MNase-seq、FAIRE-seq和ATAC-seq等技术。 ATAC-seq技术流程 核浆分离后从细胞或组织样本中分离细胞核,核染色质由转座酶切割。紧密包裹的染色质DNA不被转座酶切割,而开放的染色质区域被随机切碎。纯化片段DNA,构建测序文库,采用NGS测序技术对样品进行测序。将测序片段比对到参考基因组后,可以确定开放的染色质区域。 典型的ATAC-seq数据分析有6步: A. 原始测序reads的质量控制; B. 将读取的数据与参考基因组比对; C. Peak calling; D. Peak注释; E. 差异分析 F. 其他下游分析,如motif富集分析。 由于ATAC-seq不需要抗体,它提供了一种有效的方法来表征表观遗传景观和识别潜在的顺式调控模块。与其他技术相比,ATAC-seq具有样本量少、制样时间短、可靠性高等优点。ATAC-seq以其无可比拟的优势,迅速成为研究开放调控区域的有效方法。 图3. ATAC-seq的原理和工作流程。 A. ATAC-seq、ChIP-seq和RNA-seq的原理。B. ATAC-seq数据分析的通用流程。 ATAC-seq技术通常需要额外的步骤来去除线粒体DNA的污染,这可以通过实验和分析来完成;一些高通量测序技术不可避免地会产生错误或偏差,包括ATAC-seq。研究发现Tn5转座酶优先靶向核小体DNA的出入位点,这可能会导致有偏差的测序结果。不过,这种转座酶偏差可以通过开发计算工具或改进的统计模型来纠正。 单细胞ATAC-seq 类似RNA-seq和ChIP-seq,ATAC-seq也迈入了单细胞水平。然而,单细胞ATAC-seq数据需要更仔细的数据分析。联合scATAC-seq和scRNA-seq,差异可及性和差异基因表达可以联系在一起。使用scATAC-seq和单细胞DNA甲基化分析已被讨论作为探索基因调控编程的一种方法。 表观基因组和转录组的联合非常有必要。从根本上说,转录组是转录、转录后调控和RNA降解的结果,但表观组学提供转录起始的视角。以活性转录因子及其靶基因结合为特征的基因调控网络可导致细胞类型特异性的转录状态,进而决定细胞异质性。单细胞多组学将帮助我们更好地理解细胞特性和发育途径。 Part 4 不同物种中的应用 从NCBI的GEO中收集使用ATAC-seq技术的物种信息,共有来自65个物种的2000多个数据集。根据进化关系构建进化树,分为4类:动物、植物、真菌和原生动物(图4)。小鼠和人的数据占总数据的90%,其他大多数物种的数据还在积累中。 图4 应用ATAC-seq数据建立了65种物种的系统发育树。 人类疾病的应用案例 表观遗传的改变被认为是导致癌症的原因之一。癌症研究中胰腺癌、肝癌和膀胱癌,采用了ATAC-seq和RNA-seq与ChIP-seq等测序技术发现了新的调控机制,并指出表观遗传学调控可能是一个很有前途的抗癌靶点。 最近一个白血病的研究揭示了Ikaros蛋白的作用。该研究使用了ChIP-seq、RNA-seq、ATAC-seq以及其他功能实验,Ikaros调控其目标基因全局表观景观和启动子区域的表观遗传特征[1]。此外,公共数据集也为多组学分析提供了越来越多的实用数据。2018年一个研究是利用癌症基因组公共数据,整合了23种癌症类型的不同测序数据发表在了Science杂志上[2]。研究试图利用ATAC-seq来协助识别远端调控元件,促进癌症类型的分类。使用全基因组测序(WGS-seq)和ATAC-seq来识别发生在调控区域的体细胞突变,这会导致染色质可及性的显著增加。除了癌症,染色质景观的变化已被研究在多种类型的疾病,如2型糖尿病、阿尔茨海默病、骨关节炎、冠状动脉疾病、类风湿关节炎、帕金森病和硬皮病。这些发现为了解其发病机制和治疗靶点提供了关键的见解。 epiCOLOC是一个收集了数以万计的bulk或单细胞表观基因组分析的门户网站,覆盖了53个人体组织/细胞类型,可能有助于解释染色质可及性和转录事件的生物学问题。 其他动物物种的应用案例 除了人以外,其他动物也产生了大量的表观数据。ENCODE中的1128个ChIP-seq分析和132个ATAC-seq分析给小鼠胚胎发育过程提供了一个全面的染色质动态视角[3]。在斑马鱼中RNA-seq、ATAC-seq、ChIP-seq、WGBS和Hi-C的应用生成了全面的转录组、顺势调控元件、异染色质、甲基化组和3D基因组图谱[4]。在蚊子中,ATAC-seq等技术为研究染色质结构和调控提供了重要的见解,并对染色质相关蛋白与3D基因组结构的关系进行了回顾[5]。 染色质可及性数据也可以在物种之间进行比较。对三种脊椎动物(小鼠、鸡和青鳉)胚胎发生期间可接近的染色质区域进行了全基因组评估,并估计了这些区域的进化年龄,以确定它们在系统发育树中的进化起源[6]。 植物的应用案例 染色质可及性在植物中也有广泛应用。比如,单细胞核RNA测序和单细胞ATAC-seq数据的联合分析表明,细胞型特异性标记基因在拟南芥根中显示了细胞型特异性染色质可及性模式。这些数据还表明,差异染色质可及性是在细胞类型水平上调控基因活性的关键机制[7]。除了模式植物,还有对农作物染色质结构的研究。利用Hi-C、RNA-seq和ATAC-seq,已经证明了染色质环是玉米基因调控机制的组成部分,以数量有限的染色质环锚为核心结构单元[8]。 真菌和原生动物的应用案例 在真菌和原生动物中,环境刺激的研究尤为重要。广叶绣球菌中ATAC-seq和RNA-seq联合分析为它的光诱导原基形成(LIPF)中关键通路和中枢基因的调控提供新观点[9]。此外,白色念珠菌响应氧化应激的反应和海葵响应热胁迫的研究[10,11]证明了ATAC-seq技术在真菌和原生动物响应环境刺激中的应用。 以上这些应用案例表明ATAC-seq可在疾病机制研究、分子靶向、染色质可及性定位、染色质结构检测和生物环境压力等方面发挥强大而有效的作用。 Part 5 数据分析工具 ATAC-seq为获得表观遗传信息和探索转录调控机制提供了一种有效的工具,具有广泛的应用前景。分析ATAC-seq数据需要一定程度的计算和编程技能,了解基于unix或linux操作系统下的命令行操作,以及统计知识。这对于大部分科研工作者有难度。作者汇总了几个流程、程序和网站来帮助研究人员分析和可视化ATAC-seq数据。重点关注bulk ATAC-seq数据分析管道,总结了现有的16种分析工具(表1)。 表1 bulk ATAC-seq数据分析流程 Part 6 结论 ATAC-seq的出现为从染色质可及性的角度理解生物机制提供了一个新的视角。可以根据实际的问题联合其他各种测序技术。应用方面ATAC-seq单独使用时可以提供染色质可及性图谱,联合ChIP-seq和RNA-seq时可以为调控机制提供见解,联合Hi-C时可以描绘染色质宏观结构。 尽管联合分析有很多优势,但是联合多种测序技术仍然有不少挑战:
这篇综述回顾了ATAC-seq有关的文献,介绍了ATAC-seq的原理,重点介绍了ATAC-seq的主要技术特点。利用ATAC-seq建立了一个系统发育树。研究发现小鼠和人占ATAC-seq总数据的90%左右,而其他大部分物种仍处于数据积累阶段。另外在总结人类疾病和其他物种的发现时阐述了前沿发现和多组数据分析在当前研究中的作用。作者还收集并比较了ATAC-seq分析流程,使缺乏编程技能的生物研究人员能够更好地分析和探索ATAC-seq数据。 通过这篇综述,可以看出多组学分析和单细胞测序技术将成为未来研究的主流技术。 爱基百客在表观组学上有丰富的项目经验,综述提到的ATAC-seq、ChIP-seq、RNA-seq和Hi-C等技术均可以提供。另外,单细胞测序领域我们也有很强的细胞解离经验,有单细胞多组学测序需求的老师可以咨询我们。 往期精选 文献资料: 1. Gowda C, Song C, Ding Y, et al. Cellular signaling and epigenetic regulation of gene expression in leukemia. Adv Biol Regul 2020;75:100665. 2. Corces MR, Granja JM, Shams S, et al. The chromatin accessibility landscape of primary human cancers. Science 2018;362:eaav1898. 3. Gorkin DU, Barozzi I, Zhao Y, et al. An atlas of dynamic chromatin landscapes in mouse fetal development. Nature 2020;583:744–51. 4. Yang H, Luan Y, Liu T, et al. A map of cis-regulatory elements and 3D genome structures in zebrafish. Nature 2020;588:337–43. 5. Lezcano OM, Sanchez-Polo M, Ruiz JL, et al. Chromatin structure and function in mosquitoes. Front Genet 2020;11:602949. 6. Uesaka M, Kuratani S, Takeda H, et al. Recapitulation-like developmental transitions of chromatin accessibility in vertebrates.Zoological Lett 2019;5:33. 7. Farmer A, Thibivilliers S, Ryu KH, et al. Single-nucleus RNA and ATAC sequencing reveals the impact of chromatin accessibility on gene expression in Arabidopsis roots at the single-cell level. Mol Plant 2021;14:372–83. 8.Deschamps S, Crow JA, Chaidir N, et al. Chromatin loop anchors contain core structural components of the gene expression machinery in maize. BMC Genom 2021;22:23. 9. Yang C, Ma L, Xiao D, et al. Integration of ATAC-Seq and RNASeq identifies key genes in light-induced primordia formation of Sparassis latifolia. Int J Mol Sci 2019;21:185. 10. Jenull S, Tscherner M, Mair T, et al. ATAC-Seq identifies chromatin landscapes linked to the regulation of oxidative stress in the human fungal pathogen Candida albicans. J Fungi 2020;6:182. 11. Weizman E, Levy O. The role of chromatin dynamics under global warming response in the symbiotic coral model Aiptasia. Commun Biol 2019;2:282. |