在学习转录组测序相关知识以前,首先我们要知道为什么研究转录组学。每个细胞中包含有很多遗传信息,但是这些遗传信息只有一部分会被表达,在表达的过程中就会产生mRNA转录本(衡量基因表达量的指标),进而我们通过高通量测序就能得知,哪些基因是活跃可以表达的,并产生了多少转录本(图1)。
图1.mRNA转录
今天小编就带大家一起来认识一下真核转录组测序,篇尾还有转录组常见问题解答。
01 概 念
转录组:广义上指某一生理条件下,细胞内所有转录产物的集合,包括mRNA、rRNA、tRNA以及其他非编码RNA,狭义上的转录组指的是所有mRNA的集合。转录组测序:转录组测序指利用高通量测序技术,全面快速获取某一物种特定组织或器官在某一状态下的几乎所有转录本,主要包括mRNA和非编码RNA的序列信息。转录组测序主要分为三大类,真核有参转录组、真核无参转录组和原核转录组,今天重点介绍真核转录组相关知识。真核有参转录组:是指对已有参考基因组的真核生物或其组织、细胞等进行转录组测序。测序结果通过与参考基因组比对,可验证转录组测序的测序饱和度和基因覆盖度,同时可获得基因结构、基因表达差异和可变剪接等信息。真核无参转录组:无参就是指在没有参考基因组的情况下,对真核生物转录组进行测序。真核无参转录组测序由于没有参考基因组,因此测序分析比有参转录组要复杂很多。首先,在获得原 始数据后,需要对数据进行质控拼接为unigene,再以unigene为参考序列进行后续分析,包括功能注释、SNP、SSR标记开发等。也可以对多个样本进行差异基因表达分析和差异基因功能富集分析等,用于发现功能基因,为下一步研究提供方向。
真核转录组测序流程包括总RNA的提取和质检、mRNA的分离和片段化、cDNA的合成和PCR富集等过程,具体步骤在图3中显示。
第一步总RNA提取后需要对其纯度、浓度和完整性进行质量检测。此外,为了保证后续有足够的mRNA建库,建议RNA起始量为1~4μg。分离:利用mRNA特有的polyA结构用 oligo(dT)磁珠分离出 mRNA。片段化:利用超声打断的方式,将mRNA打断成200-300bp的片段。以RNA为模板,用随机六聚体引物和逆转录酶合成cDNA第一链,并以第一链cDNA为模板进行第二链cDNA的合成。
04 总技术路线:
真核转录组测序技术能够对植物的基因表达、发育过程以及细胞类型进行测序分析。例如,研究人员利用转录组测序研究药用植物,研究结果可以帮助研究人员分析药用植物的功能基因和调控机制,改进育种选择和栽培技术[1]。
哺乳动物基因组的巨大性和复杂性给其转录组研究带来严峻挑战。Mortazavi等研究员结合Illumina测序平台,对成年小鼠的脑、肺、骨骼肌组织RNA进行转录组高通量测序及分析,获得1.4亿数据,约90%的位置与已知外显子相匹配,同时也发现了未见报道的序列信息[2]。
转录组学是医学研究中的一个有力的工具。例如,转录组学可以应用于早期肿瘤的生物标志物的检测;此外,转录组还可以获得物种或者组织的转录本信息,从而发现新的基因等[3]。
(1)对于mRNA,原核转录组mRNA没有polyA尾结构,通常使用去核糖体RNA方式进行捕获;而真核mRNA-seq通常使用polyd(T)捕获的方式建库。(2) 真核转录组除了mRNA-seq,还有ncRNA-seq产品,比如miRNA、lncRNA、circRNA和全转录组。原核转录组是没有这些产品的。
(3)对于分析内容,真核转录组主要为差异基因的表达量和功能富集分析;原核转录组由于基因组的结构特征,会存在很多功能相关的基因前后相连成串,由一个共同的控制区进行转录调控的操纵子结构,所以会有操纵子分析;另外由于无法对原核转录组进行单独的sRNA测序,所以在分析时会进行sRNA预测;这是原核转录组与真和转录组分析差异的主要两个部分。
2.转录组测序可以同时检测 mRNA、miRNA 及其他非编码 RNA?理论上技术是可行的,但是通常会根据测序对象长度的不同,在测序建库的时候会选择不同的片段大小,测序读长也会有不同。一般来讲,如果要进行microRNA 测序的话,通常将 microRNA 分离出来单独进行测序。mRNA 测序,通常建库时选择 200-300bp大小片段,采用 125PE/150PE 测序。而长链非编码 RNA(IncRNA)分为正向转录和反向转录,所以常采用链特异性建库测序。
是的,转录组测序必须设置生物学重复,一般应该设置重复3次以上,具体情况根据具体实验来确定,样本数量越多对于统计筛选越有利。
4.对动植物样本进行转录组测序,要测多少数据量,如何估测?由于转录组测序需要进行表达量的分析,因此不推荐使用覆盖度,在确定测序量时,我们以产生的reads 数作为依据。转录组测序所需的测序量随物种转录组大小的不同而有所差别,而转录组的大小受基因数目和丰度双重影响,不同物种间变化很大。因此在测序之前,需要对转录组的大小进行评估。针对有参考基因组的物种,可通过分析基因组信息,统计编码基因个数及其碱基数来评估转录组的大小,同时也可参考相近或相关物种转录组研究的文章;对于没有参考基因的物种,只能参考相近物种的转录组大小。
测序深度:测序得到的总碱基数与待测转录组大小的比值。
覆盖率:指测序获得的序列占整个转录组的比例。
本期我们主要从真核转录组的基本概念、分类、测序流程、技术路线、应用及应答知识等方面进行介绍,后面我们会继续分享转录组报告解读等相关内容,大家可以继续关注我们。爱基百客生物专注提供领先的表观组学技术服务,在转录组测序方面拥有丰富的项目经验,有相关需求的老师可以和我们联系。转录组开学大促的活动还有几天结束,有需求的老师不要错过了~
[1] Junda Guo, Zhen Huang,et al. Research Progress and Future Development Trends in Medicinal Plant Transcriptomics.2021.28.380-390.[2]祁云霞,刘永斌,荣威恒.转录组研究新技术:RNA-seq及其应用. 2011,33(11):1191一1202.[3] Tang F , Lao K , Surani M A . Development and applications of single-cell transcriptome analysis.[J]. Nature Methods, 2011, 8:S6.