NEWS
新闻资讯
|
扒一扒那些好用的转录因子TF-DNA数据库(下)在转录调控网络研究中,选择合适的数据库工具对于提高研究效率和数据可靠性至关重要。上期我们解锁了10个宝藏转录因子数据库【扒一扒那些好用的转录因子TF-DNA数据库(上)】,不知道老师们有没有找到趁手的工具?如果还没看过瘾,别着急——剩下的10+个数据库更是个个身怀绝技! 十一、Genecards—人类基因综合知识库 十二、ChIP-Atlas—大规模表观基因组数据挖掘平台 十三、MotifMap—转录因子结合位点预测数据库 十四、TRANSFAC—转录因子数据库 十五、UniPROBE—体外蛋白质结合微阵列数据库 十六、GRNdb—基因调控网络单细胞数据库 十七、TransmiR—转录因子-miRNA调控数据库 十八、ChEA3—多组学整合的转录因子富集分析平台 十九、GTRD—基因转录调控标准化数据库 二十、footprintDB—蛋白质-DNA相互作用结构数据库 二十一、RiceTFtarget—水稻转录调控预测平台
Human
https://www.genecards.org/
该知识库自动集成了来自约200个网络来源的以基因为中心的数据,包括基因组学、转录组学、蛋白质组学、遗传学、临床和功能信息。还链接了同系列GeneCards Suite数据库【MalaCards(human disease)、GeneHancer(human enhancer)、GeneCaRNA(human ncRNA)以及PathCards(human biological pathways)】。 ![]() 包括基因名称、功能、疾病关联、结构域、治疗药物、不同组织表达情况、关联promoter/enhancers、细胞定位、抗体、突变、敲除、动物模型等等。对于想要快速了解**基因的研究者来讲是一个非常实用且全面的数据库。 ![]()
六种模式生物(人、小鼠、大鼠、果蝇、线虫和酵母)
https://chip-atlas.org/
收录了43w+的ChIP-seq,ATAC-seq以及Bisulfite-seq实验数据。相关功能包括在线可视化(peak Browser)、TF靶基因寻找(Target Genes)等都是能够让使用者在没有自己的测序数据的情况下,使用已有数据进行预测。除此之外还有Enrichment Analysis(确定一组基因组位点和基因的共同表观遗传特征)、Colocalization(预测与给定转录因子形成复合物的潜在相互作用蛋白)等功能。 ![]() 大概列举2个小工具 (1)IGV可视化:Peak Browser Visualize TF-binding,histone marks,chromatin accessibility,and DNA methylation on IGV ![]() 一定要注意,在点击【View On IGV】之前,需要确保你的IGV软件(它不是一个在线的可视化,依赖于链接电脑里的IGV软件)已经打开了,且端口60151已正常启动。 ![]() (2)TF靶基因寻找(Target Genes) Search for genes bound by given transcription factors ![]() ![]() 也支持下载后查看 ![]()
模式生物:人(Human)、小鼠(Mouse)、果蝇(Fly)、酵母(Yeast)、线虫(Worm)
http://motifmap.ics.uci.edu/
MotifMap是专注于分析和可视化转录因子结合位点(TFBSs)和motifs的数据库,整合了多种来源的ChIP-seq数据和高通量测序数据,利用基因组序列和motif模型系统性地预测并注释转录因子结合位点,提供模式物种基因组中编码的候选调控元件的综合图谱,旨在提供全面、准确的TF与DNA相互作用的信息(如结合位点、结合强度等)。在多个物种的基因组(如人类、小鼠、果蝇等)中预测TFBS,并提供基因组浏览器可视化和TFBS的保守性评分(采用Bayesian Branch Length Score统计方法)。 其核心功能包括:Motif Search针对特定转录因子检索全基因组推定结合位点并查看序列标志图;Gene Search输入基因名称查找转录起始位点上下游区域的转录因子结合位点;SNPer分析特定基因组位点(如SNP)与转录因子结合位点的重叠关系,评估变异对调控元件的潜在影响。 ![]()
数据库收录了超过1,000个物种(真核生物为主)的转录因子数据
https://genexplain.com/transfac/
TRANSFAC是转录因子数据库领域的金标准,整合了大量经实验验证的转录因子结合位点(TFBS)和调控元件信息,提供全面的转录调控数据资源。其核心功能包括:MATCH工具用于预测DNA序列中的转录因子结合位点;P-MATCH结合转录因子结合偏好和启动子序列特征进行预测;PATCH工具基于TRANSFAC矩阵库快速扫描序列中的潜在结合位点;Gene Regulation工具支持启动子分析和调控网络构建;ChIP-seq数据整合提供大量染色质免疫共沉淀测序数据的分析结果;矩阵搜索利用位置权重矩阵(PWM)评估结合位点亲和力;基因组浏览器可视化展示转录因子结合位点在基因组中的分布;数据导出支持多种格式下载转录因子、结合位点和矩阵数据,为转录调控机制研究、基因表达调控网络分析和药物靶点发现提供重要支持。 ![]()
涵盖多种模式生物
http://thebrain.bwh.harvard.edu/uniprobe/
UniPROBE是通用蛋白质结合微阵列(Universal PBM)数据的专业存储库,通过体外蛋白质结合微阵列(PBM)技术系统性地测定蛋白质的DNA结合特异性,为转录因子-DNA相互作用研究提供高通量、无偏倚的实验数据支持。数据库为每个蛋白质(或蛋白复合物)条目提供所有可能k-mer(长度为k的核苷酸序列变体)的定量结合偏好数据,以及位置权重矩阵(PWM)和motif模型(Sequence Logo)展示。 其核心功能包括:文本搜索快速检索特定转录因子的PBM数据;Motif相似性比较评估用户上传数据与数据库PWM的相似度;结合位点定位在用户输入的核苷酸序列中扫描潜在转录因子结合位点;蛋白质BLAST(blastp)查找UniPROBE中的蛋白质序列匹配项;数据下载支持多种格式导出k-mer结合强度、PWM矩阵及序列标志。所有数据均经过标准化处理,采用E-score(富集分数,范围-0.5至+0.5)量化结合亲和力,为转录调控网络构建、基因表达调控机制研究和非编码区变异功能注释提供重要的体外实验依据。 ![]()
人(Human)和小鼠(Mouse)
http://www.grndb.com/
GRNdb是一个专注于单细胞和bulk RNA-seq数据的基因调控网络(GRN)数据库,基于已知TF-target关系和SCENIC算法,系统预测了184种不同生理和病理条件下转录因子(TF)与下游靶基因的调控网络,旨在解码基因表达调控的功能和机制。 其核心功能包括:Search(搜索)支持通过基因符号、Entrez ID或Ensembl ID快速检索特定TF或靶基因的调控网络,返回t-SNE聚类图、调控子活性热图、TF-target调控网络图、表达谱小提琴图及详细调控信息表,并可比较两种条件下的GRN差异;Browse(浏览)可查看特定条件下所有活性TF-target对的详细信息,包括细胞类型统计、调控子数量及结合基序(NES>3);Expression(表达分析)探索基因在不同癌症中的表达谱和相关性;Survival(生存分析)针对33种TCGA癌症进行基因表达水平与患者生存期的关联分析(Log-rank检验);Download(数据下载)提供所有预测GRN、TF-target对及结合基序的矩阵文件下载。数据库共收录77,746个调控子(regulons)和19,687,841个TF-target对,为研究基因表达异质性和疾病发病机制提供重要资源。 ![]()
包括人(Human)、小鼠(Mouse)、大鼠(Rat)、果蝇(Fly)、线虫(Worm)等29个物种。
http://www.cuilab.cn/transmir/
TransmiR是专注于转录因子(TF)调控microRNA(miRNA)的专业数据库,整合文献挖掘和ChIP-seq数据,系统收录TF对miRNA转录水平的调控关系。核心功能包括:Search支持单/多关键词模糊搜索,检索TF-miRNA调控对及其作用类型(激活/抑制)、证据等级、组织来源等信息;Network可视化展示特定TF、miRNA或疾病的调控网络,支持缩放、拖拽及节点高亮交互;Enrichment analysis对输入的miRNA列表进行TF富集分析,预测潜在的上游调控因子;Predict基于JASPAR和HOCOMOCO的TF结合基序,预测人类、小鼠和大鼠中的TF-miRNA调控关系;Download提供文献整理、ChIP-seq来源及预测数据的批量下载。数据库区分证据等级(Level 1/2和文献来源),并标注反馈调控环(feedback loops),为研究miRNA转录调控机制和疾病相关调控网络提供重要资源。 ![]()
主要是人(Human),部分数据包含小鼠(Mouse)和大鼠(Rat)
https://maayanlab.cloud/chea3/
ChEA3是ChIP-X富集分析工具的第3版,通过整合正交组学数据预测调控用户提交基因集的转录因子。其核心功能包括:基因集提交输入HGNC标准基因符号列表进行TF富集分析;多库整合分析整合ENCODE、ReMap、文献ChIP-seq三大来源的TF-target关联,以及GTEx、ARCHS4的TF-基因共表达数据和Enrichr的共发生数据;综合评分排序采用Mean Rank和Top Rank算法生成整合排名,提高上游TF预测准确性;结果可视化生成可搜索、可排序的数据表格,展示显著富集的TF及其重叠基因;R包支持通过rChEA3包在R环境中直接调用API,实现自动化分析流程。该工具可识别基因表达变化背后的调控因子,并推断TF作为激活剂或抑制剂的特性。
涵盖人、小鼠、大鼠、斑马鱼、秀丽隐杆线虫、黑腹果蝇、酿酒酵母、裂殖酵母、拟南芥
http://gtrd.biouml.org/
GTRD是基因转录调控数据库,通过标准化流程统一处理海量ChIP-seq、DNase-seq等NGS数据,构建非冗余的转录因子结合位点(TFBS)集合。核心功能包括:数据浏览与搜索支持按细胞类型、转录因子或基因浏览信息,可搜索指定基因附近的TFBS或特定TF潜在调控的所有基因;基因组浏览器可视化基于BioUML平台整合Ensembl基因结构、重复序列、ChIP-seq读段比对、峰簇、元簇及HOCOMOCO预测的TFBS;多方法峰calling采用MACS、SISSRs、GEM、PICS四种方法识别峰,经聚类和元聚类生成非冗余TFBS集;数据整合报告提供按细胞类型、TF或基因的综合表格报告,并链接至FANTOM5、ENCODE、GTEx等专业数据库;质量控制应用ENCODE标准及跨方法比较的双重质控;数据下载支持原始数据和处理结果的批量获取。数据库每半年更新,为转录调控机制研究提供高质量、标准化的ChIP-seq数据资源。
涵盖多细胞生物和细菌。
http://floresta.eead.csic.es/footprintdb/
footprintDB是整合文献和公共库中精选DNA结合位点数据的专业数据库,系统标注转录因子的结合界面残基,提供蛋白质-DNA相互作用的双向预测服务。核心功能包括:DNA到蛋白质预测输入特定DNA位点或基序,检索可能结合的转录因子,结果按界面相似性排序;蛋白质到DNA预测输入转录因子序列,预测其识别的DNA基序或位点;界面相似性评估基于3D-footprint数据库中的蛋白质-DNA复合物结构,推断结合界面残基并计算相似性评分;跨物种扩展可将预测限定在用户指定的单一蛋白质组内;序列搜索支持蛋白质序列或DNA基序的相似性比对;数据下载提供转录因子、DNA基序(PSSM)和结合位点的批量下载。数据库整合了JASPAR、UniPROBE、HumanTF、RegulonDB、DBTBS等多个权威数据源,为转录因子功能注释和调控网络构建提供重要支持。 ![]()
RiceTFtarget专注于水稻(Oryza sativa),具体为粳稻亚种(Oryza sativa subsp. japonica)。
https://cbi.njau.edu.cn/RiceTFtarget/
RiceTFtarget是基于基因共表达、基序扫描和机器学习的水稻转录因子-靶基因预测工具。核心功能包括:双向查询输入转录因子基因ID查询其调控的靶基因,或输入靶基因ID查询调控它的转录因子;共表达分析基于149个无冗余水稻RNA-seq数据集或21种不同组织计算Pearson相关系数(PCC);基序扫描利用FIMO软件将TF识别基序扫描水稻基因启动子序列,获得假定的转录因子结合位点(TFBS);机器学习预测基于11个TF的ChIP-seq数据(126,167个峰)提取46个基因组特征,构建随机森林模型预测任意TF的结合位点;网络构建选择top N(top5/top10/top20/全部)的TF-target对构建调控网络;参数自定义用户可自由调节PCC阈值、组织类型、基序结合要求及机器学习预测标签(0或1)以获取宽松或严格的预测结果;数据下载提供启动子序列、TF信息、基序扫描结果等批量下载。查询结果展示共表达相关系数、TF结合位点信息及机器学习预测结果,为水稻转录调控机制研究提供多维度数据支持。 ![]() 二十余个转录因子数据库的“全景地图”已为您解锁!无论您深耕人类疾病调控,还是聚焦作物逆境响应,相信都能从中找到趁手的工具。转录调控数据库的分享暂告一段落,但精彩持续放送——我们将继续为您带来更多实用的科研干货,敬请关注,下期再见!
项目咨询 了 解 更 多 { 往 期 精 彩 回 顾 }
|



















