SAMPLE DELIVERY GUIDE
送样指南
|
染色质图谱Q1:什么是ATAC-seq? A1:ATAC-seq (Assay for Transposase Accessible Chromatin with high-throughput sequencing) 是利用转座酶研究染色质活性区域,结合高通量测序技术发展出来的新技术。Tn5转座体可将其衔接子负载整合到可接近的染色质区域,而空间位阻较不可接近的染色质使得转座不可能发生,从而获得全基因组染色质开放图谱、转录因子结合及核小体定位等关键信息。 Q2:ATAC-seq的应用方向? A2:1植物非生物逆境,病虫害,营养,激素等处理前后及动物疾病,转录活性差异;2不同组织,器官转录活性差异,找到组织特异基因和启动子;3利用ATAC-seq技术来研究A、B、D三个亚基因组的转录因子结合位点的差异,从而研究同源基因的表达调控差异。而六倍体与二倍体、四倍体等位基因间调控位点的比较;4通过ATAC-seq定义的open chromatin区域 ,再结合motif 分析,识别哪种转录因子参与了基因表达调控(对于抗体质量不好的TF,尤其有效);5将ATAC-seq和RNA-seq进行整合研究,将会获得对生物体中的转录调控机制,宏观分析细胞在该特定时空下整个基因组的调控网络。 Q3:什么是ChIP-seq? A3:ChIP-seq是染色质免疫沉淀测序的简称。基本上,ChIP-seq是与DNA结合蛋白共沉淀的基因组DNA片段的测序。以这种方式最常研究的DNA结合蛋白是转录因子(例如p53或NFκB),染色质修饰酶(例如p300,组蛋白去乙酰化酶),与基因组DNA相互作用的组蛋白修饰(例如H3K4me3)和转录复合物成分(例如RNA polII)。 Q4:ChIP-seq的应用方向? A4:一个具体的贡献是鉴定新的调控元件—例如,已经在小鼠脑中使用p300结合位点鉴定出新的组织特异性增强子。组蛋白修饰的ChIP-seq也可以获得关于基因组调控区域的新见解。然而,也许ChIP-seq方法的最重要贡献是在基因组规模上提供蛋白质-DNA相互作用的“群体”分析。如表明单个转录因子是如何通过识别motif,与其他共定位转录因子共存以及与转录起始位点的距离不同而采用不同的基因调控机制。 Q5:ChIP-seq、CUT&Tag以及DAP-seq的异同 A5:ChIP-seq、CUT&Tag以及DAP-seq都是研究染色质与蛋白相互作用的技术,但是三种技术预处理原理侧重点不同,ChIP-seq和CUT&Tag都是在体内进行,染色质与蛋白相互作用更真实,ChIP-seq需要的样本量较大,而CUT&Tag是微量样本适用。而DAP-seq是在体外进行研究,其优点在于不需要转基因材料,也无需相应蛋白抗体,在不容易获得材料以及抗体时, DAP-seq也是不错的选择
Q6:如何确定测序深度已足够? A6:这个问题的核心是确定测序是否已经达到了渐近饱和点,超过这个点就不会发现新的结合位点。可以尝试通过模拟来估计结合饱和度。通过在测序reads中连续较小的随机子集上运行峰值调用算法,可以针对reads的数量(在x轴上)绘制检测到的peaks的数量(在y轴上)。曲线 通常是(但不总是)在开始时迅速上升,但随后开始饱和。曲线可以外推以估计它将开始出现平滑时的测序reads数量。以这种方式估算精确的饱和点可能不是很严格,但通常只需要近似就足够了。显然,结合更广泛的因子(如某些组蛋白标记)需要更多的序列才能达到饱和。 Q7:怎么call peaks? A7:现在有大量的免费和商业的call peaks软件包。Call peaks算法寻找“peaks” - tags显著富集的区域,通常被认为反映了转录因子与该区域的结合。虽然一些软件包只是简单地聚合映射tags而不考虑链,但其他软件包使用链信息来更敏感地定位peaks。一些call peaks调用算法需要用户提供一个对照文库,而另一些算法则不需要,但是ChIP-seq在进行reads测序时存在几种已知的偏差来源,因此没有对照文库的peaks是非常不可靠的,应该避免。 通常基于ChIP文库和对照文库的比较,使用诸如P值或错误发现率(FDR)等度量值来量化peaks中的置信度,尽管不同的峰值调用包在完成该操作时会有所不同。 Q8:测序reads的偏差来源都有哪些? A8:首先是GC含量,一些平台对高GC区域测序有一定的偏好性。另外,基因组中同源短序列的出现频率、基因组扩增和重复元件也会造成映射偏差。因此需要对照样品,通常是Input DNA。然而,即使这样,某些偏差似乎仍然存在;特别是基因组标记如转录起始位点,甚至会在Input中出现更多的reads。染色质结构则会引入物理性偏差,造成染色质非均匀剪切,特别地,异染色质比常染色质更难剪切,导致这部分的测序reads偏少,结果就是转录基因中的区域似乎比沉默基因中的更多。一些流程也会使用PCR步骤,这可能导致reads的虚假复制。因此,大多数工作流程都会删除多个相同的reads副本。 |