NEWS
新闻资讯
|
干货分享 ▏快看看还有哪些植物研究的数据库是你还不知道的?植物学研究的征程漫长且充满挑战,从微观的基因序列到宏观的生态群落,每一步探索都伴随着海量数据的积累。在当今大数据驱动科研的浪潮中,数据库作为数据的有序集合与分析枢纽,正深刻影响着植物学研究的广度与深度。随着科研的不断推进,新的技术手段催生了更多类型的数据,也促使越来越多的专业数据库诞生。但对于许多科研工作者而言,仍有许多宝藏般的数据库尚未被充分挖掘和利用。今天,就让我们一同走进那些或许您还未曾知晓的植物研究数据库,探寻其中蕴藏的无限可能。 JGI Phytozome是由美国能源部联合基因组研究所(JGI)开发的综合性植物基因组数据库,现已成为植物基因组学研究的核心平台。该数据库整合了覆盖全生命谱系的植物基因组资源,包含从藻类、苔藓等基础类群到高等被子植物的高质量基因组与泛基因组数据,为植物进化机制解析、比较基因组学及功能基因挖掘提供了系统化的数据支撑。JGI Phytozome的主要优势在于以下几个方面: 强大的搜索功能:提供了多种搜索方式,如快速搜索、关键词搜索等。在“Phytozome quick search”中,用户可以看到数据库中所有可用的植物物种及其图片,直接选择感兴趣的物种进行检索和分析。关键词搜索则可以帮助用户在整个物种列表中搜索特定的植物物种。 序列比对工具:支持BLAST比对,用户可以将自己的序列与数据库中的植物基因组序列进行比对,以确定该序列所属的物种或基因家族,或者寻找同源基因等。 可视化工具:配备了JBrowse基因组浏览器,可对所有基因组进行图形化可视化展示,方便用户直观地查看基因在染色体上的位置、基因结构、转录本等信息,有助于深入理解基因组的组织和结构。 数据挖掘与分析工具:具有Phytomine和Biomart等工具,允许用户基于查询进行数据挖掘和分析,如检索特定条件下的基因集、挖掘基因家族成员、进行基因表达数据的分析等,为比较基因组学研究提供了有力支持。
Brassicaceae Database(BRAD)是由中国农业科学院蔬菜花卉研究所开发的十字花科植物基因组资源综合数据库,这些数据不仅为研究十字花科植物的基因结构、功能及进化提供了基础,也有助于深入了解十字花科植物在生长发育、环境适应等方面的遗传机制。BRAD的主要优势在于以下几个方面: 多类型数据整合:除了基因组序列数据外,还整合了基因注释、遗传图谱、代谢物等多方面的数据。这些不同类型的数据相互关联、相互补充,能够为科研人员提供关于十字花科植物从基因到代谢产物,从遗传信息到生理功能的全方位、多层次的信息,有助于深入理解十字花科植物复杂的生物学过程和分子机制。 针对性强:与综合性生物数据库相比,BRAD专注于十字花科植物这一特定类群的研究。这种专注性使得数据库能够更深入、更全面地收集、整理和分析与十字花科植物相关的数据和信息。 具备专业的数据分析功能:拥有一系列专业实用的数据分析功能,如基因表达分析、差异基因分析、功能富集分析、代谢通路分析等。这些分析功能能够帮助科研人员深入挖掘数据背后的生物学信息,揭示十字花科植物的生长发育、环境适应、代谢调控等生物学过程的分子机制。
柑橘基因组数据库(Citrus Genome Database,CGD)是一个由美国农业部和国家科学基金会资助,华盛顿州立大学Mainlab构建和维护的柑橘类数据库,旨在促进柑橘的基础、转化和应用研究。CGD的主要优势在于以下几个方面: 物种丰富:涵盖了甜橙、克莱门氏小柑橘、葡萄柚、橘子、柚子、柠檬、酸橙等柑橘属的多个物种以及与柑橘黄龙病(HLB)相关的生物数据。 数据丰富:包含柑橘的基因组学、遗传学和育种等多组学数据信息,如克莱门氏小柑橘基因组、甜橙基因组、63个柑橘遗传图谱、42,238个柑橘标记、479个柑橘数量性状位点(QTL)等。
模式植物拟南芥突变体库TAIR成立于1999年,经过15年的发展,TAIR已成为国际上最权威的拟南芥基因组数据库和拟南芥基因组注释系统,具有丰富的数据资源和最新的注释信息。除数据外,TAIR同时提供多种生物信息学工具供用户分析处理数据。TAIR的主要优势在于以下几个方面: 全面的数据信息:TAIR提供的数据包括完整的基因组序列以及基因结构、基因产物信息、基因表达、DNA和种子库、基因组图、遗传和物理标记。此外,还包括文献及拟南芥研究现状等方面的信息。 更新速度快:TAIR的数据更新迅速,基因产物功能每两周更新一次,基因结构信息每年更新1-2次,确保研究人员可以访问到最新的研究成果。
玉米遗传学和基因组学数据库MaizeGDB创建的主旨是为玉米研究界提供长期的数据存储、技术支持和稳定的数据支撑,并为访问、集成、知识发现提供信息学服务。MaizeGDB的主要优势在于以下几个方面: 全面的数据信息:该数据库是一个集合玉米相关的序列、种质资源、表型、基因型和核型变异,以及染色体图谱等数据的多功能数据库。 与其他数据库交互性强:与Gramene、Phytozome、NCBI等数据库互通,支持跨物种比较基因组分析。
IWGSC(International Wheat Genome Sequencing Consortium,国际小麦基因组测序联盟)是一个由小麦种植者和植物科学家组成的国际合作组织,成立于2005年。IWGSC的主要优势在于以下几个方面: 突破性技术革新:攻克六倍体小麦基因组组装难题,提供染色体级别的参考序列。 与其他数据库交互性强:与Ensembl数据库同步更新,支持跨物种比较基因组分析;且与Grain Genes等其他数据库交互,可获取小麦表型与遗传资源数据库,从而获取更多样的种质信息。
RGAP(Rice Genome Annotation Project)是由密歇根州立大学主导的水稻基因组研究核心平台,以日本晴(Nipponbare)为参考基因组,收录了包含基因组数据和CDS数据,用户可以通过geneID和RAP-db进行基因名转换,利用已知序列进行BLAST搜索,以获取基因的loci号、基因结构和CDS序列等信息。与其他水稻的数据库相比,RGAP的主要优势在于以下几个方面: 数据全面性更强:同步更新了基因表达与共表达数据(如组织特异性表达谱),并新增Syntelog分析页面,整合两个跨物种同源基因数据集(如水稻与玉米、拟南芥的共线性基因比对),为功能基因组学与进化研究提供关键资源。 工具实用性更强:2024年9月3日,RGAP完成重要升级:基因组浏览器升级至Jbrowse2,支持多轨道交互式浏览;BLAST检索、共表达分析、syntelog比对无缝衔接。
SoyBase数据库于1990年建立,是全球第一个大豆遗传与基因组学研究的数据库和资源平台。SoyBase的主要优势在于以下几个方面: 多维数据可视化:该数据库整合了大豆的遗传图谱和超过4800个双亲QTL定量性状基因座信息,并提供大豆突变体的详细信息。同时还包括代谢途径、转录组数据、甲基化数据以及与其它豆类物种的比较信息。 开放共享与互操作性更强:所有数据(基因组、QTL、突变体)均可免费下载,无访问限制,一键跳转至Phytozome(比较基因组)、LegumeInfo(豆科资源)、NCBI等外部数据库且兼容常用生物信息学工具。
PlantTFDB基于特定的家族分配规则,从165个物种中识别出320,370个转录因子,并将它们分为58个家族,涵盖绿色植物的主要谱系,能提供整个绿色植物的基因组转录因子库。该数据库的界面简单易懂,大家可以通过TFID和常用名称快速搜索查询,或者通过序列在BLAST页面中进行查询且数据库设有支持蛋白质和核酸序列的转录因子预测服务器,允许用户从多个序列(文件最大100M)中识别转录因子。除此之外,该数据库还收集了顺式作用元件和转录因子与顺式作用元件之间的功能相互作用数据。PlantTFDB的主要优势在于以下几个方面: 扩展转录因子库:建立了“扩展转录因子库”(TFext)部分,方便用户快速访问新测序物种的转录因子库。 转录因子间的进化解析:通过结合转录因子结合位点的碱基变异结合亲和力和进化足迹,推断出转录因子间的进化关系。 小工具丰富:开发了一些分析和预测小工具,例如FunTFBS用于筛选功能性转录因子结合位点的算法等,供用户在线使用。
JASPAR是一个定期维护的开放获取数据库(https://jaspar.elixir.no/),以位置频率矩阵(PFM)形式存储人工整理的转录因子结合概况,涵盖脊椎动物、昆虫、线虫、真菌、植物和尾索动物等多物种转录因子数据。JASPAR数据库目前分为两个部分,一个是CORE图谱集,这些图谱来自已发表的资源和文献。每个条目都至少有两个正交实验支持进行验证。另一个部分是2020年,增加了UNVALIDATED据集,以反映更广泛使用高通量测序方法所产生的更多图谱,而这些图谱的独立验证尚未完成。JASPAR的主要优势在于以下几个方面: 数据收集整合:收集来自各种文献和实验的转录因子结合位点数据,并整合到统一平台。 格式标准化:所有数据采用标准化格式,便于用户使用和分析。 工具支持丰富:提供多种生物信息学工具和资源,如可预测用户输入的蛋白序列的潜在结合motif,帮助研究人员分析和解释转录因子结合位点数据。
PPDB是一个植物启动子数据库,提供有关转录起始位点(TSSs)、核心启动子结构(TATA盒、启动子、GA和CA元件)和调控元件组(REGs)等转录调控元件信息。PPDB的主要优势在于以下几个方面: 全面的物种覆盖与数据整合:覆盖多种重要植物物种,包括模式植物(如拟南芥、水稻、玉米等)和经济作物,支持跨物种比较;提供启动子区域的精确边界定义(如转录起始位点、TATA框、CAAT框等),并结合基因组位置信息进行可视化展示。 深度功能注释与调控元件分析:系统鉴定启动子中的调控元件(如激素响应元件、逆境响应元件、光响应元件等),并关联到已知的转录因子结合位点。将调控元件按生物学功能(如发育、胁迫响应、代谢调控等)分类,便于用户快速定位目标元件。 跨数据库整合与多组学关联:关联基因表达谱(如组织特异性、发育阶段特异性表达),帮助用户分析启动子活性与基因表达的关系;与Plant CARE、PLACE等植物调控元件数据库互补,提供更全面的调控信息。
PlantPAN4.0作为ChIP-seq研究利器,更新的数据库,用于识别植物启动子中的保守非编码序列并探索动态转录调控。基因注释和启动子序列有115个物种。Plant PAN4.0可以帮助我们查看顺式调控元件之间的进化差异和相似性;此外,该系统还可以帮助鉴定同源基因之间的保守非编码序列。PlantPAN4.0的主要优势在于以下几个方面: 数据整合丰富:数据库转录因子结合位点库包含3428个非冗余矩阵,用于18305个转录因子;PlantPAN4.0可以有效地重建基因调控网络,并有助于比较不同植物物种和实验中的基因组顺式调控元件。 重建调控网络:此外,手动更新了调控因子的基因组景观,并添加了来自单细胞绿藻(Chlamydomonas reinhardtii)的ChIP-seq数据集。
Plant CARE是一个的植物顺式作用元件、增强子和抑制子分析的网站,可用于查找启动子序列中的转录因子结合位点等重要调控元件。Plant CARE的主要优势在于以下几个方面: 跨物种覆盖与特异性注释:多物种兼容,涵盖模式植物(如拟南芥、水稻)和经济作物(如小麦、玉米、番茄等),且部分元件标注其在特定组织(如根、叶、花)或发育阶段(如种子萌发、开花)中的活性。 强大的在线分析工具:用户可直接提交DNA序列,自动识别其中的顺式作用元件,并生成可视化图谱,支持同时分析多条启动子序列,适合高通量研究。
Plant.MAP数据库旨在为研究植物蛋白互作和功能提供支持。该数据库收集了13大类植物(拟南芥、西兰花、大豆、大麻、番茄、藜麦、玉米、水稻、小麦、椰子、蕨类、卷柏和绿藻)的蛋白质复合物信息,包括实验验证和预测模型数据。用户可以通过该平台查询特定蛋白质复合物的组成、功能、亚细胞定位、蛋白互作评分等。Plant.MAP的主要优势在于以下几个方面: 多组学数据深度整合:整合基因组、转录组、表观组(如DNA甲基化、组蛋白修饰)、蛋白质互作(PPI)和代谢组数据,提供基因调控的全维度视角。 物种覆盖与数据规模:以拟南芥为核心,逐步扩展至水稻、玉米、大豆等作物,支持跨物种比较。整合公共数据库中的数千个实验数据集,覆盖多种生长条件和处理。
BioGRID是研究蛋白互作综合性的数据库,该数据库包含了蛋白质-蛋白质、蛋白质-小分子和遗传相互作用数据,覆盖范围广泛。目前最新版的BioBRID数据库(4.4.244),利用文献挖掘(包括重点低通量研究和大型高通量数据集),已经收集了2,840,984个蛋白质和遗传相互作用、31,144个化学相互作用和1,128,339个翻译后修饰。BioGRID的主要优势在于以下几个方面: CRISPR组学整合:BioGRID又称为CRISPR筛选开放存储库(ORCS)数据库,目前包含了植物和动物细胞系中进行的超过500个全基因组筛选。这些筛选报告了基因-表型和基因-基因关系。 数据更新频率快:BioGRID几乎每个月都会更新数据,确保信息的时效性和准确性。因此在使用BioGRID进行预测时,一定要记住您当前使用的版本。
PMhub数据库通过整合公共质谱数据、自己的多种植物代谢质谱数据、转录组数据和基因组数据等,为研究人员提供植物代谢物查询、代谢物结构解析、代谢物网络分析和代谢物遗传分析等功能。PM hub的主要优势在于以下几个方面: 综合性强与数据丰富:PM Hub包含了从不同来源收集的188,938种植物代谢物的化学数据,以及与这些代谢物相对应的193,910个标准/硅内高分辨率串联质谱仪(HRMS/MS)光谱。除了其广泛的文献衍生数据,PM Hub还拥有相当大的实验代谢物集合。 功能全面:PM hub提供了多种功能,包括代谢物查询、代谢物结构解析、代谢物网络分析和代谢物遗传分析等。这使得研究人员能够轻松地搜索、浏览和分析代谢物数据。
MetaDb数据库包含了有关药用植物基因、转录因子、代谢途径和代谢物的公开可用数据的详细信息,为研究人员提供了宝贵的资源,以理解合成和调控过程。此外,MetaDb还向用户提供了便捷的访问方式,可以使用常用的生物信息学分析工具、数据库和服务器,如ChemDoole2D、BLAST和SWISS-MODEL等。MetaDb的主要优势在于以下几个方面: 专业领域的深入覆盖:MetaDB数据库中包含了苯酚类、萜类和生物碱类代谢途径的地图,以及预测、基因组学、富集分析、分析工具和化学绘图等在线工具和数据库的链接,这些都是对药用植物研究极其重要的功能。 扩展性强:随着药用植物研究的持续进展,MetaDB能够适应快速数据迭代的需求,为研究人员提供最新的数据支持。
项目咨询 了 解 更 多 { 往 期 精 彩 回 顾 } |