ΩOmicSolution蛋白质组学技术平台

练习与排错

软件问题集与排错

这里汇总 Spectronaut 与 SpectroDive 的问题集、场景题和常见误区,集中处理 workflow 判断、字段理解、排错顺序和项目解释。

discovery 练习 targeted 练习 字段、流程与场景考核

考核结构

问题结构

这里按基础判断、流程判断、结果判断和标准化与自动化四层组织,对应软件模块中的核心问题。

基础层

知识检查

确认 workflow、panel、conditions、calibration curve 和 report schema 这些基础对象是否已经建立。

进阶层

字段与命令

字段题和命令题集中处理术语、字段和自动化参数在项目中的实际作用。

应用层

场景与排错

场景题和排错题负责把 discovery 与 targeted 放回真实项目,检验路线选择、风险来源和修正顺序。

问题层级 当前内容 关联模块
基础判断 分清 discovery 与 verification,分清 library、panel、conditions、QC 与 report 的作用。 Spectronaut / SpectroDive
流程判断 知道每个 workflow 的输入输出、什么时候该 review、什么时候该 refinement。 Spectronaut Analysis / SpectroDive Analysis
结果判断 能解释字段、报表结构、QC 指标和绝对定量范围。 Spectronaut Reporting / SpectroDive Reporting
标准化与自动化 能解释 settings、schema、command line 和 XIC export / CCS 合并等高级能力。 Spectronaut Settings / SpectroDive Settings

Knowledge Checks

Spectronaut 问题集

这组题集中处理 discovery 软件的核心判断。回答时需要同时说明它影响哪类输入、哪一步分析和什么样的输出。

问题 1:什么时候优先选 library-based DIA,什么时候优先选 directDIA?

解析:已有高质量谱库、追求更高覆盖或要承接历史项目时优先 library-based;没有现成谱库、项目启动速度更重要、希望减少前置实验成本时优先 directDIA。进一步要比较的不是“谁更高级”,而是输入资源、深度目标和 workflow 维护成本。

问题 2:Conditions Set-up 对 Post Analysis 的影响

解析:differential abundance、PCA、heatmap、GO enrichment 都依赖条件、重复和分组信息。条件设置错了,统计比较本身就会失真,后续任何候选蛋白和通路解释都会被污染。

问题 3:Spectronaut 里最常被忽略的两个后半本模块是什么?

解析:`QC Perspective` 和 `Settings / Appendices`。前者决定队列化项目能否长期稳定运行,后者决定团队能否把分析参数固定成可复用的 schema 和 SOP。

问题 4:Spectronaut 不应只停留在 differential abundance 结果页

解析:differential abundance 只是 discovery 分析流程的一个输出面。真正决定结果是否可信的,是前面的 library 或 directDIA 选择、conditions、FDR 与 Q-value 结构、QC 历史、missing value 情况以及 report schema 是否进入后续统计和交付。

问题 5:Search Archive 在软件操作中的位置

解析:Search Archive 关系到搜索结果的保存、复核、复用和团队共享。若不了解它的作用,就很难理解同一个项目中的 library、settings 和历史搜索记录为什么必须保持一致,而不能当作一次性临时文件处理。

Knowledge Checks

SpectroDive 问题集

这组题集中处理 targeted verification 的判断逻辑,不是界面点击顺序,而是 panel、schedule、calibration 和 report 的实际后果。

问题 1:SpectroDive 以 panel 作为方法起点

解析:targeted proteomics 的核心不是“跑一份 raw”,而是 panel 的定义是否正确。Q1 / Q3、iRT、fragment 选择、label channel 和 response factor 都在 panel 阶段决定了后续 method export、analysis 和 quantification 的上限。

问题 2:scheduled method 的核心风险指标是什么?

解析:并发 transitions 数和窗口宽度。窗口太宽或 panel 太大,会导致 concurrent transitions 过高,继而压缩 dwell time,影响信噪比和定量质量。

问题 3:Calibration Curve 在 SpectroDive 中真正解决什么问题?

解析:它把相对信号转成绝对定量框架,并提供 LOD、LLOQ、ULOQ 和线性定量区间判断。如果只生成了曲线图但没规划 calibrant、dilution factor 和 .ccs 复用策略,就不算真正掌握这一部分。

问题 4:review tree 中 accept、reject、exclude 的影响

解析:这些动作会改变候选 transition、峰组和后续报告的构成。它们不是视觉标注,而是对定量证据进行取舍。若不能说清每个动作的后果,就说明还没有真正掌握 targeted review。

问题 5:绝对定量中 report、QC 和 calibration curve 的对应关系

解析:绝对定量不是单独看 `AbsoluteAmount` 一个字段,而是要同时理解曲线是否在线性范围内、QC 是否稳定、CV 是否可接受,以及当前样本处于 LLOQ/ULOQ 的什么位置。脱离这几层关系,任何绝对量都可能被误读。

Troubleshooting

常见误区与排错思路

这一节集中处理排错顺序。真正的排错不是先怪软件,而是沿着样本、采集、文件、条件、统计、导出一步步回推。

误区:DIA 软件结果不好,一定是软件参数问题

排错顺序应从样本、前处理、仪器状态、library / FASTA、conditions、QC,再到 settings。很多问题并不出在软件最后一步。

误区:PRM / MRM 只要 panel 越大越好

大 panel 会推高 concurrent transitions,影响 dwell time 和调度质量。真实项目里需要在覆盖面和方法可执行性之间折中。

误区:后半本可不看

后半本其实决定你能不能把软件从“会点”变成“能交付、能 SOP 化、能稳定复核”。尤其是 appendices、plots、report headers 和 settings。

误区:QC 只是给平台管理员看的

无论是 Spectronaut 还是 SpectroDive,QC 都必须进入日常使用者的工作范围,否则结果好坏很难被正确解释。

你看到的表面问题 第一优先排查什么 第二优先排查什么
识别数突然下降 仪器状态、样本前处理和 RT / QC 漂移。 library / FASTA / panel 文件是否与当前 raw 匹配。
差异分析结果极不稳定 conditions、replicates、缺失值和 normalization 逻辑。 过滤阈值、Q-value 和导出表结构是否进入下游统计。
scheduled method 跑不稳 panel 大小、窗口宽度、并发 transitions 与 dwell time。 RT calibration 是否准确,fragment 是否过多或不稳定。
绝对量看起来异常 calibration curve、LLOQ / ULOQ、样本位置是否超线性范围。 QC 和 review tree 是否已经排除异常 transition 或峰组。

Header Drills

报表字段问题集

字段题对应对象层级、判断逻辑与字段联读关系,不只是翻译缩写。

问题 1:在 Spectronaut 报表里看到 `EG.Cscore`、`EG.Qvalue`、`EG.MeanTailingFactor`,你应该分别先想到什么?

解析:`EG.Cscore` 先看识别质量与打分强弱,`EG.Qvalue` 先看 FDR 控制下是否还能算可信识别,`EG.MeanTailingFactor` 先看峰型是否拖尾异常。三者一起看,才更接近真实 review 逻辑。

问题 2:在 SpectroDive 报表里 `EG.AbsoluteAmount` 有值,但 `EG.AbsoluteAmountRangeLimitted` 为空或提示超范围,意味着什么?

解析:说明软件仍可计算出一个绝对量,但它可能不在线性范围内。真正进入报告和决策时,必须结合 `LLOQ / ULOQ / LinearRangeLocation / CV at LLOQ` 一起判断。

问题 3:`PEP.IsProteotypic = false` 时的证据边界

解析:它说明该 peptide 不是唯一对应某一个蛋白的特异肽段。做 biomarker 验证、面板固化或 panel 设计时,往往应优先选 proteotypic peptide,避免解释歧义。

问题 4:`PG.Quantity`、`PEP.Quantity`、`FG.Quantity` 的层级区别

解析:这三个字段对应蛋白组、前体和 fragment 不同层级。若不知道对象层级差异,就可能把上游 review 或 filtering 的结果错误地拿去做下游统计,造成表观一致但生物学含义完全不同的结果。

Command-Line Drills

命令行与自动化问题集

这一组集中处理 GUI 设置向 SOP、批处理和可复核团队流程的迁移。

问题 1:你要把一批 DIA run 放进标准化分析流水线,优先记住 Spectronaut 的哪几类命令?

解析:建库用 `lg`,library-based 分析用 `diaanalysis`,library-free 用 `direct`,批量报表或实验合并时再考虑 `combine` 与 `manageSNE`。先按任务类型记命令,比死背参数更有效。

问题 2:`command arguments file` 与 JSON settings override 的标准化作用

解析:这两者让 GUI 里调好的规则可以迁移到 pipeline。前者可把长命令保存为可复用脚本输入,后者可在固定 schema 上做少量覆盖,避免团队每次重新手调。

问题 3:SpectroDive 命令行除了直接跑 analysis,还有什么容易被忽略但很有用?

解析:还能加载已保存实验、导出各种 report,以及把多个 calibration curve 集合合并成 `.ccs` 文件,直接进入后续绝对定量项目。

问题 4:`--setXICExportDirectory` 对 Spectronaut 的意义是什么?

解析:它会打开自动 XIC 存储,把定量分析过程中生成的 XIC 以 SQLite 形式导出,直接进入高级排错、峰图复查和二次开发。这是把软件结果开放给数据库工作流的重要接口。

问题 5:固化 schema、settings 和 arguments file 的意义

解析:一旦项目从单次实验走向批量项目或团队协作,参数管理就会比个人记忆更重要。把 schema 与 arguments file 固化下来,能减少“这次点得和上次不一样”的隐性漂移。

Scenario Drills

场景题

场景题集中处理软件语言与项目语言之间的转换,可按“问题是什么、现在在哪一步、路线选择依据、风险在哪里”四个层次组织答案。

场景 1:你要做 300 例血浆 discovery,软件路线怎么选?

处理路径:先走易肽系列 + Auto 工作站 + DIA discovery,优先 Spectronaut;如果没有现成高质量谱库,可从 directDIA 起步。重点不在绝对定量,而在稳定性、CV、批次设计和后分析候选筛选。

场景 2:你已经有一组候选 biomarker,要走验证与转化

处理路径:把候选 peptide / protein 迁到 SpectroDive,设计 panel、做 RT calibration、导出 scheduled method,如需绝对定量则建立 calibration curves,并把 report schema 固化成验证模板。

场景 3:一个你总是把 normal report 和 run pivot report 搞混

处理路径:先回到 Report Perspective,明确 normal report 是长格式、利于后处理;run pivot 更偏向下游浏览与展示。最好结合真实表头对比一次。

场景 4:discovery 结果与 targeted verification 的衔接

处理路径:discovery 对应广度筛选和候选发现,verification 对应对有限候选做高特异、可重复、可量化的检测。两者不是替代关系,而是项目推进不同阶段所需的不同证据层。