ΩOmicSolution蛋白质组学技术平台

Spectronaut 分支培训资料

SPP指南:OmicSolution Pipeline Pro 操作入门

SPP 用于管理 Spectronaut 相关项目的任务创建、队列调度、结果回看、QC 检查、参数复用和集群运行。它不替代 Spectronaut 的搜索引擎,而是把多项目、多版本和多节点运行组织成可追溯的生产流程。

SPP 队列主界面
主界面默认进入 Task Queue。用户先确认队列、任务状态和输出目录,再选择新建任务、恢复已有结果或打开结果/QC 视图。

基本功能

SPP 把 Spectronaut 项目管理拆成六类动作

日常使用时不需要记住全部按钮。先把任务类型、参数输入、队列执行、结果诊断、QC 检查和运行环境分清,绝大多数项目都可以按同一条路径完成。

01

新建任务

从 Analysis、QC Only、Library Generation、Export / Re-export、Transform、Realtime 或 Existing Project 选择任务大类。

02

参数与资源

集中配置 raw/.d、FASTA/BGSFASTA、Spectronaut 版本、PROP、RS、Condition 和输出目录。

03

队列调度

在 Task Queue 中启动、暂停、终止、重试、删除或保存任务,并按项目输出目录查看运行状态。

04

结果诊断

用 Results Summary 查看 Step 1.1、1.3、2.1、Final Result、AGS group 完整性和失败样品。

05

QC 回看

用 QC Viewer 读取 TIC/BPC、TIMS IM QC、方法信息和批量导出结果,判断原始数据质量。

06

运行环境

通过 Global Settings 与 Cluster Manager 管理默认目录、Spectronaut 版本、worker 节点和并发策略。

操作流程

从默认项目到可复核结果的推荐路径

准备 确认项目根目录、raw/.d、FASTA、PROP、RS、Condition
建任务 New Task 选择任务大类,Analysis 项目进入流程说明与参数页
入队列 Add to Queue 后回到 Task Queue,检查状态、SP Version 与输出目录
执行 Start Queue 或 Start Selected,按本机、Advanced 或 Cluster 策略运行
回看 View Results / QC Viewer 判断结果完整性、缺失样品和原始数据质量
重提 Modify Project、Retry Missing、Recover Existing Output 复用已有项目结果

界面识别

主界面和新建任务向导

SPP 的主界面不是单个分析表单,而是项目队列。新建任务只负责把一个可执行任务规范化,真正的执行和回看都回到队列完成。

SPP Task Queue 主界面
Task Queue 主界面。上方是队列操作按钮,中部是任务表,底部是系统日志和任务监控。蓝色选中行代表当前操作对象;完成任务可打开结果,QC 任务可进入 QC Viewer。
New Task 任务分类页面
任务分类页面。先选任务大类再进入参数页。Analysis 用于 Spectronaut 主分析,QC Only 只读取原始数据做质量控制,Existing Project 用于把已有输出目录恢复到队列。
Analysis 任务流程说明
Analysis 流程说明。Analysis 任务按 1.1、1.2、1.3、1.4、2.1、2.2 组织。1.1/1.3/2.1 适合分布式并行,1.2/1.4/2.2 是汇总或最终报告节点。

Analysis 节点

Analysis 不是两步,而是 1.1 到 2.2 的完整链路

SPP 把 Spectronaut 主分析拆成六个可追踪节点。单样本节点适合并行运行,汇总节点需要在同一节点上完成整合。排查失败任务时,先判断失败发生在哪个节点,再决定是补单个样品、补汇总节点,还是从 DIA 分析重新开始。

1.1Database Search可并行

逐个 raw/.d 调用 Pulsar 进行数据库搜索,生成每个样品的初始搜索档案。

  • 输入:原始文件、FASTA/BGSFASTA、PROP 或默认搜索参数。
  • 产物:`step1.1` 中的样本级 PSAR 与日志。
  • 检查:缺失样品通常先看原始文件路径、FASTA、Spectronaut 版本和日志结尾。
1.2QSP Generation汇总节点

汇总 Step 1.1 的搜索档案,生成后续批量处理使用的 QSP 或优化模型。

  • 输入:`step1.1` 目录中的样本级搜索结果。
  • 产物:`step1.2` 中的 QSP 文件与全局统计。
  • 检查:如果 QSP 不存在,后续 1.3 无法继续;优先回看 1.1 是否完整。
1.3Batch Processing可并行

用 Step 1.2 的模型回到每个样品,生成更完整的样本级最终 PSAR。

  • 输入:每个样品的 1.1 PSAR 和 1.2 QSP。
  • 产物:`step1.3` 中的 `*-final.psar` 与样本日志。
  • 检查:某个样品 1.3 缺失时,多数情况下只需要补该样品相关节点。
1.4Library Generation汇总节点

把 Step 1.3 的样本级档案整合成项目可用的 Spectronaut library。

  • 输入:`step1.3` 目录中的最终 PSAR 集合。
  • 产物:`step1.4` 中的 `.kit` 谱库。
  • 检查:没有 `.kit` 时,2.1 无法用项目内建库继续;可改用外部库或补 1.4。
2.1DIA Analysis可并行

用 `.kit` 或外部 library 对每个 raw/.d 进行 DIA 分析,形成样本级 SNE 或中间结果。

  • 输入:原始文件、library、PROP 或分析设置。
  • 产物:`step2.1` 中的样本级 DIA 结果。
  • 检查:若只有少数样品失败,可优先补 2.1;若库文件错误,需要回到 1.4 或更早节点。
2.2Final Merge汇总节点

整合 Step 2.1 的样本级结果,按 merge、combine、noMBR 或 AGS 规则生成最终项目结果。

  • 输入:`step2.1` 结果、RS、Condition 和输出规则。
  • 产物:Final SNE、report、AGS group 结果或交付表。
  • 检查:如果 2.1 已完整但 Final Result 缺失,通常从 2.2 重提更合适。
使用外部 library 的项目可以从 2.1 进入 DIA 分析;只改 Condition、RS 或导出表时,通常不需要回到 1.1。Modify Project 会根据已存在的中间结果提示更合适的重提节点。

任务类型

选择任务大类时先看目标输出

New Task 中的功能大类覆盖从主分析、原始数据 QC、实时监控、谱库构建到已有结果再利用的完整路径。不同大类的差异不在按钮名称,而在是否重新搜索、是否读取已有 SNE、是否只做质量控制,以及最终要交付哪类文件。

Analysis

新建 Spectronaut 主分析任务,覆盖 merge、combine、noMBR、AGS、directDIA 等模式,是从 raw/.d 到最终结果的主入口。

QC Only

只读取原始数据做 TIC/BPC、TIMS IM 和方法信息检查,不生成 Spectronaut 主分析结果。

Realtime

持续监控新进入目录的 RAW/.d。directDIA 可按文件连续产出,cohortDIA 可先做 1.1,再在达到阈值或手动启动后进入完整分析。

Library Generation

从 PSAR、directDIA 结果或原始文件构建可复用的 KIT/TSV library,用于后续 DIA 分析或项目复用。

Export / Re-export

基于已有 SNE 或 manageSNE/combine 结果重新导出 report、Parquet、XIC DB 或其他结果文件,不重复执行完整搜索。

Transform

把 normal report、SNE+RS 或导出表转换为后续统计、PTM、pivot、交付模板所需的结构化表格。

Existing Project

把已有输出目录重新加载到队列中,用于 View Results、Modify Project、Retry Missing 或派生兼容任务。

任务大类 适用场景 关键输入 输出与后续动作
Analysis 常规 merge、combine、noMBR、AGS、directDIA 主分析 raw/.d、FASTA/BGSFASTA、PROP、RS、Condition、输出目录 生成中间结果、SNE、report 和可回看的项目摘要
QC Only 只检查原始数据质量,不启动 Spectronaut 主分析 Thermo RAW 或 Bruker .d;队列任务通常至少需要两个文件,QC Viewer 可用于单文件曲线回看 TIC/BPC、TIMS IM QC、批量 PNG 和 QC 报告
Realtime 监控目录中新产生的 RAW/.d,文件稳定后自动提交 directDIA 或 cohortDIA Monitor folder、数据类型、稳定等待时间、输出目录,以及 FASTA/PROP/RS 等分析参数 directDIA 可按文件独立产出结果;cohortDIA 可等待阈值或手动 Start 后进入完整队列
Library Generation 从 PSAR/directDIA 或 RAW/.d 构建 KIT/TSV 谱库 PSAR/directDIA 结果或原始文件、FASTA、PROP 生成可用于后续分析的库文件
Export / Re-export 从已有 SNE 重新导出 report、Parquet 或 XIC DB SNE、RS、PROP、输出目录 输出 report、manageSNE/combine 结果或二次分析数据
Transform 把 Normal report 或 SNE+RS 输出转换为后续分析表格 Normal report、SNE、RS、转换规则 long-to-wide、pivot、PTM 或客户交付表
Existing Project 已有输出目录仍在,需要恢复队列记录或重新接管项目 完整输出目录中的 analysis_config、results 和中间目录 恢复为 Recovered 任务,可继续 View Results、Modify 或 Retry

结果与 QC

完成任务后先看完整性,再看生物学解释

SPP 的结果回看重点是运行状态和交付完整性:Step 1.1/1.3 是否形成样本级中间结果,Step 2.1 与 Final Result 是否齐全,哪些 group 缺失,哪些样品失败,原始数据 TIC/BPC 是否异常。只有这些检查通过后,结果才适合进入后续统计和报告。

SPP Results Summary 窗口
Results Summary。顶部显示任务 ID、输出目录、raw 文件数量、分析模式和状态;中部按 AGS group 或样品列出 Step 1.1、Step 1.3、Step 2.1 与 Final Result;红色提示用于定位缺失目录或未完成 group。
SPP QC Viewer TIC 图
QC Viewer。TIC/BPC 视图用于快速识别采集中断、总强度偏低、峰形异常或样品间差异;TIMS IM QC 与方法信息可用于进一步定位 Bruker 数据问题。

运行环境

默认目录、版本和 worker 状态决定队列能否稳定运行

SPP Global Settings 窗口
Global Settings。这里维护内置文件目录、默认 raw 目录、默认输出根目录、命名模板、Spectronaut 父目录和默认版本。正式项目应先确认这些路径可读写。
SPP Cluster Manager 窗口
Cluster Manager。集群视图显示在线 worker、延时、速度、App Version、SP Match 和默认 Spectronaut 版本。集群运行前应先确认 worker 与主程序版本和 Spectronaut 版本匹配;主任务节点策略和并发数会影响 1.2/1.4/2.2 这类汇总节点的稳定性。

运行前检查

提交任务前按这张清单确认

数据与路径

  • Thermo 数据使用 `.raw` 文件;Bruker 数据使用完整 `.d` 目录。
  • Bruker `.d` 目录应包含 `analysis.tdf` 和 `analysis.tdf_bin`。
  • 输出目录不要与旧项目冲突;需要复用旧项目时优先使用 Existing Project 或 Modify Project。
  • Realtime 任务应确认 monitor folder、数据类型、稳定等待时间,以及 directDIA/cohortDIA 的触发方式。

分析资源

  • FASTA/BGSFASTA、PROP 和 RS 与当前任务类型匹配。
  • Condition 中的样品名与 raw/.d 文件名能够正确对应。
  • PTM、AGS、combine、noMBR 等分支任务使用对应的 report schema 和参数设置。

运行环境

  • Global Settings 中默认 Spectronaut 版本已经扫描并可用。
  • 本机或 worker 节点内存、磁盘和临时目录足够。
  • Cluster 运行前确认 worker 在线、App Version 一致、SP Match 正常。

完成后复核

  • Results Summary 中 Step 1.1、Step 1.3、Step 2.1 与 Final Result 没有异常缺口。
  • AGS group、reference group 和样品数与实验设计一致。
  • QC Viewer 的 TIC/BPC、总强度和方法信息支持该批数据继续进入报告。