NEWS
新闻资讯
|
扒一扒那些好用的转录因子TF-DNA数据库(上)还在苦恼没有好用的转录因子数据库?还处于只知道JASPAR数据库的境地?其实,至少还有20+宝藏数据库等大家发现哟!不知道没关系,小编今天就来给大家揭秘~ 因篇幅太长,本次揭秘分上下两集,先放出来10个数据库给老师们解解馋。数据库比较特色的功能都会单独标注出来,有相关需求的老师也可以重点关注~ 一、JASPAR 2024 二、Animal TFDB 4.0 三、PlantPAN 4.0 四、Plant TFDB 5.0 五、cistrome DB 六、hTFtarget 七、KnockTF 2.0 八、ChIPBase v3.0 九、TRRUST v2 十、HOCOMOCO
Fungi(真菌)、Insecta(昆虫)、Nematoda(线虫)、Plantae(植物)、Urochordata(尾索动物)、Vertebrata(脊椎动物)
(1)已知TF-已知DNA找结合位点(JASPAR-Scan) Tips:JASPAR虽然也可以已知DNA预测上游TF,但一般不用,因为用起来比较麻烦,需要人为限定物种后,勾选所有找到的TF信息然后利用scan分析。 (2)【Enrichment Analysis】(预测哪些来自JASPAR数据库的TFBSs在一组给定的基因组区域中富集)以及【TFBS extraction】(TFBS提取工具)也可能有老师关心,但数据库不支持在线使用,只提供了使用代码。懂生信的老师可以自行去看看。
Primates(灵长类)、Rodents(啮齿类)、Laurasiatheria(劳亚兽类)、Fishes(鱼类)、Birds&Reptiles(鸟&爬行动物)、Afrotheria(非洲兽类)、Amphibians(两栖类)。基本上囊括了目前常见的研究物种。
https://guolab.wchscu.cn/AnimalTFDB4//#/
(1)**物种**转录因子家族汇总 例如:人-bZIP (2)转录因子预测——预测**是否可能是TF 注意:支持批量预测,但单次搜索protein序列需<1w (3)转录因子结合预测——预测**序列可能被什么TF结合
http://plantpan.itps.ncku.edu.tw/plantpan4/index.html#hero
(1)基因结构、功能注释 包括基因GO注释、基因结构可视化,以及启动子功能元件注释(TFBS、Conserved non-coding elements、Tandem Repeat以及CpG岛) (2)TF结构域分析 可以通过TF名称、结构域特征(如GCC box)、motif矩阵、TF家族、物种来搜索。 (3)启动子分析 主要在于预测启动子上可能存在的TFBS。部分功能与(1)是重叠的。还支持来自ChIP-seq数据的预测
绿藻(16种)、轮藻(1种)、地钱(1种)、苔藓植物(2种)、石松(1种)、松柏(5种)、被子植物(1种)、单子叶植物(38种)、双子叶植物(100种)
https://planttfdb.gao-lab.org/index.php
PlantTFDB被整合进了PlantRegMap,这个数据库功能十分强大,包含TF数据库,TF调控图谱,TF预测、比对、TFBS功能等。本次只展示PlantTFDB 5.0 (1)TF基础信息 还是比较全的。常见命名、TF家族、DNA结合域、3D结构、功能、motif矩阵、顺式元件、突变信息、甚至是TF相关文献。 (2)TF预测 通过输入感兴趣的蛋白序列,可预测是否属于**TF家族。 (3)其他功能比如TFBS预测还是需要回到PlantRegMap去使用
(1)已报道的ChIP数据 适配于研究常见TF/组蛋白修饰,有关注的细胞系且关注的靶基因,但自身没有seq数据的研究者。cistrome DB有常见人鼠不同细胞系的ChIP数据,且提供了在线可视化以及可供下载的bed、bw文件。 (2)ToolKit以及Cistrome-GO 一个是有已知区域寻找未知TF结合信息;一个是有已知的TF寻找可能存在的结合信息。
(1)TF 某个TF能调控**靶基因 (2)Target 某个靶基因可能被**TF结合 (3)TF共调控关系分析——co-regulation 适配于蛋白复合体(或拮抗)共调控靶基因的结合预测。支持多个TF预测共同的靶点,也支持多个靶基因预测共同可能存在结合的TF。 (4)TF互作——co-association 适配于研究蛋白互作的研究者,对自身关注的TF可能与**互作预测,可结合coIP等湿实验缩小研究范围。但仅限于数据库内保存的TF。
http://www.licpathway.net/KnockTF/index.html
这个数据库主要适配TF-knock down/out的数据集。 (1)已有TF,关注TF改变后的靶基因 限定物种、TF名称、knock方式、组织等以便于寻找到最符合研究者预测的数据集。随后选择数据集overview可以看到在符合前期条件的数据集中,TF关联改变的靶基因信息 (2)已有靶基因,关注能结合的TF 选择特定的【Search by Target Gene】功能,输入关注的靶基因,还可以通过限定FC来筛选TF数据集(但是只有2个选项,1.5/2)。 (3)TF富集以及差异TF GSEA 适配于有RNA-seq数据集,想要与TF knock数据集中的靶基因进行表达关联,限人鼠。
https://rnasysu.com/chipbase3/index.php
这个数据库涵盖内容非常广,目前3.0版本已囊括了5w+ChIP数据集,1.51亿个调控关系,并且包含了TF与RNA(mRNA、lncRNA、miRNA、其他ncRNA等)的相互作用。此外,增强子模块、Epilnter(RNA修饰与组蛋白修饰之间的潜在作用)、疾病模块(正常vs疾病的调控共表达网络)也是很值得去挖掘的。在此只展示TF-RNA互作查找案例。
(1)特定protein(不限于TF)的上下游调控网络 网站第一个功能【1. Search a gene in TRRUST database】。 如果是TF,会有TF-**靶基因以及**TF-目标TF的调控网络;如果是nonTF,则只会有**TF-目标pro的调控网络。 (2)在一组geneset中找寻hub-TF 网站第二个功能【2. Find key regulators for query genes】 适配于有RNA-seq或其他geneset数据,想要找到这些基因中比较重要的TF。
提供了680个人和453个小鼠TF的转录因子(TF)结合模型。 (1)主页类似于Animal TFDB 4.0,做了一个树状图的TF家族统计。同时也可自行通过搜索功能来找感兴趣的TF及对应矩阵信息。 (2)MoloTool 类似于Jaspar的scan功能,预测特定TF与特定序列的结合情况。 (3)MACRO-APE 比较2个motif矩阵的相似程度。 (4)PERFECTOS-APE 预测单核苷酸变异(SNVs)或多态性(SNPs)可能的调节作用。主要观点是SNV可能直接位于转录因子结合位点,不同的SNV等位基因可以改变结合亲和力。这个对同时研究基因突变与表观遗传学关联的研究者来说还是蛮有意义的功能。 好啦,看了这篇文章,有没有找到符合你预期想法的数据库呢,快去搜索对应数据库,研究怎么使用吧~ 后期【扒一扒(下册)】还会有10个数据库,敬请期待吧。 Tips:**表示某某的意思。 项目咨询 { 往 期 精 彩 回 顾 } 精选合集,欢迎收藏哟! |