标题
更多

关于我们



武汉爱基百客生物科技有限公司(简称爱基百客),位于武汉高农生物园,办公面积逾3000平方米,是一家专注于表观组学、单细胞时空组学和高通量测序分析服务的新型生物科技企业。


公司旨在为客户提供专业的科研服务,运营至今合作的科研客户近千家,涵盖国内知名科研院所、高校以及相关生物企业,运营至今销售额超1亿元,科研成果曾多次在CellScience、Cancer Cell、Plant Cell、Nature Communications、J HEMATOL ONCOL等国际高水平学术期刊发表,受到了客户广泛好评,是国内成长最迅速的多组学科研服务企业之一。

加入我们

NEWS

新闻资讯

详细内容

如何填写测序项目信息分析表?(2026年版)

banner.png


测序相关的项目启动后,项目系统会自动推送《信息分析搜集表》到您的邮箱。这张表填得好不好,直接决定后续分析能不能精准回答您的科学问题。怎么填?注意啥?小编以爱基百客王牌ChIP-seq产品为例,带您逐项梳理,确保信息提交一次到位,分析流程无缝衔接。

项目信息——分析类型的选择

图片1.png

这一栏需要您从下拉菜单里,选择对应项目的分析流程。打个比方,如果您的项目要做ChIP-seq分析,直接在下拉框里选“ChIP-seq”就好啦~

这样一来,生信工程师收到表格后,一眼就能明白这个项目需要走哪个分析流程,省心又高效。

 小贴士:如果不确定选哪个,可以看看合同上的产品名称,或随时咨询您的专属技术支持~

基因组信息的填写

图片2.png

单细胞项目:人(GRCh38)、小鼠(mm39/GRCm39),采用通用基因组,无需单独填写,基因展示形式默认Gene name。 WES项目:人基因组固定为GRCh38.p14,无需单独填写。基因组信息主要分为五个部分,我们逐个说清:

1、物种拉丁名

这是最基本的身份标识,请填写标准物种拉丁学名(如Arabidopsis thaliana),确保与参考基因组来源数据库一致。

2、参考基因组链接

简单来说就是基因组的序列文件,常见genome.fasta格式,这个链接内的数据主要是构建的基因组内不同染色体的碱基序列信息。在测序后需要进行测序数据的比对,真正比对上的reads才会用作后续的分析,所以链接的准确性非常关键。

  • 案例(Arabidopsis_thaliana.TAIR10)

图片3.png

关于基因组版本的选择建议

1)优先选择权威数据库发布的最新稳定版本(如Ensembl、NCBI、TAIR等);具体查找方法可以参考我们前期推文《科普篇 | 如何查找参考基因组信息

2)若您的研究需要与其他组学项目数据比较,建议选用相同版本以保证可比性;

3)《信息分析搜集表》底部第3页提供的公司已有参考基因组,来自其他项目老师填写,我们保存。只对该基因组是否可正常分析进行保证(即基因组是否完整),不保证注释的完整性等信息。我们不做推荐,客户自行决定是否使用。一般情况下,排名越靠后,基因组版本越新。

图片4.png

3、对应的注释文件

有了基因组序列,我们还需要知道reads具体落在哪个基因上、位于基因的哪个区域(启动子、外显子、内含子等)。这就需要第二个文件来辅助,也就是基因组的注释文件,通常是gff、gtf格式的文件(建议优先选择gff)。

注释文件对序列进行了结构解读,包含染色体位置、基因名称、基因ID、内含子/外显子边界等信息,是定位测序数据基因组位置的关键。

  • 案例(Arabidopsis_thaliana.TAIR10)

图片5.png

4、对应的蛋白文件

除了基因的序列文件外,我们也需要知道这些基因的功能信息。因此需要通过基因编码蛋白的序列信息推测基因功能,就需要用到最后一个文件——蛋白序列文件。通常为pep.fapeptide.fatsa,示例见下。后续分析时将利用蛋白的序列信息与已知数据库(GO、KEGG、NR等)进行同源比对分析,推测基因具体功能。

  • 案例(Arabidopsis_thaliana.TAIR10)

图片6.png

5、基因展现形式

在分析结果中,当数据以表格形式展示时,通常会展示gene ID和gene name两个信息;但当图片中涉及基因信息(如基因表达热图)时,仅能展现其中一种形式,所以需要老师确定是以gene ID(如ENSG00000272398)还是gene name(如CD24)进行展示。

样品命名

图片7.png

为什么要特别强调样品命名?主要有两个原因:

  • 第一,技术规范要求。生信软件对都输入样本名称有严格格式要求:仅限【字母、数字和下划线】的格式,且不能以数字开头(见上图红字提示)。此外,请避开CON、PRN、NUL等系统保留文件名,这些是Windows系统的专用命名,使用它们可能导致结果文件与系统冲突。

  • 第二,方便您解读结果。建议同一组内的生物学重复保持命名一致性(如T1、T2、T3),不同组之间用明显区分的命名。更推荐您直接用计划用于文章发表的名称来命名,这样拿到结果后无需再改,省时省力~

※小贴士:ChIP-seq项目每个样本包含IP和Input两个文库,我们默认视为同一组数据。报告和数据文件会自动命名为「样本名_IP」「样本名_IN」(如T_1_IP、T_1_IN),您只需填写基础样本名(如T_1)即可,无需额外拆分填写~

比对方案

图片8.png

在完成了基因组的填写、样本名称的修正后,终于来到了对于老师进行了多组实验想要寻找差异的比对方案填写了。

 基本原则

1)有生物学重复时建议以组别为单位进行比较,而不是单个样本之间。这能充分利用重复数据,使差异分析结果更稳健。例如:T组(含T1, T2, T3三个重复)vs C组(含C1, C2, C3三个重复),在表格中直接填写“T” vs “C”。

2)无生物学重复时则直接填写具体的样本名称进行比较(如T1 vs C1)。

 设计建议

差异分析建议遵循单一变量原则,这样结果的生物学解释更清晰。比如您有A、B、C三组,可以设计A vs B、A vs C,也可以加上B vs C。

以上就是信息分析表的核心填写指南。ChIP-seq以外,RNA-seq、ATAC-seq、CUT&Tag等其他测序产品的填写逻辑基本一致,您可以参照本文填写。

最后,祝愿各位老师都能选对基因组、设计好方案,找到预期的分析结果。科研路上,爱基百客与您同行,一起冲冲冲!

市场部小助理微信  6.png

项目咨询

2025.06.17 产品总览-2.jpg

了 解 更 多

{ 往 期 精 彩 回 顾 }

尾巴2.png

         询服务热线


027-65522558


(市场部

18971172815


(行政部





联系我


Q Q: 270105245   1511879086   465436937           

邮箱: service@igenebook.com

地址:武汉市东湖高新区高新大道888号高农生物二期3A栋

网址: www.igenebook.com


公司主要提供表观组学技术服务、NGS测序服务、单细胞测序服务

欢迎咨询!鄂ICP备17016573号-2   技术支持:武汉网站建设

关注我们

二维码

公众号二维码



二维码
客服中心
联系方式
027-65522558
- 线上客服
微信 一对一业务咨询
seo seo