软件练习与排错 | OmicSolution

考核结构

问题结构

这里按基础判断、流程判断、结果判断和标准化与自动化四层组织，对应软件模块中的核心问题。

基础层

知识检查

确认 workflow、panel、conditions、calibration curve 和 report schema 这些基础对象是否已经建立。

进阶层

字段与命令

字段题和命令题集中处理术语、字段和自动化参数在项目中的实际作用。

应用层

场景与排错

场景题和排错题负责把 discovery 与 targeted 放回真实项目，检验路线选择、风险来源和修正顺序。

问题层级	当前内容	关联模块
基础判断	分清 discovery 与 verification，分清 library、panel、conditions、QC 与 report 的作用。	Spectronaut / SpectroDive
流程判断	知道每个 workflow 的输入输出、什么时候该 review、什么时候该 refinement。	Spectronaut Analysis / SpectroDive Analysis
结果判断	能解释字段、报表结构、QC 指标和绝对定量范围。	Spectronaut Reporting / SpectroDive Reporting
标准化与自动化	能解释 settings、schema、command line 和 XIC export / CCS 合并等高级能力。	Spectronaut Settings / SpectroDive Settings

Knowledge Checks

Spectronaut 问题集

这组题集中处理 discovery 软件的核心判断。回答时需要同时说明它影响哪类输入、哪一步分析和什么样的输出。

问题 1：什么时候优先选 library-based DIA，什么时候优先选 directDIA？

解析：已有高质量谱库、追求更高覆盖或要承接历史项目时优先 library-based；没有现成谱库、项目启动速度更重要、希望减少前置实验成本时优先 directDIA。进一步要比较的不是“谁更高级”，而是输入资源、深度目标和 workflow 维护成本。

问题 2：Conditions Set-up 对 Post Analysis 的影响

解析：differential abundance、PCA、heatmap、GO enrichment 都依赖条件、重复和分组信息。条件设置错了，统计比较本身就会失真，后续任何候选蛋白和通路解释都会被污染。

问题 3：Spectronaut 里最常被忽略的两个后半本模块是什么？

解析：`QC Perspective` 和 `Settings / Appendices`。前者决定队列化项目能否长期稳定运行，后者决定团队能否把分析参数固定成可复用的 schema 和 SOP。

问题 4：Spectronaut 不应只停留在 differential abundance 结果页

解析：differential abundance 只是 discovery 分析流程的一个输出面。真正决定结果是否可信的，是前面的 library 或 directDIA 选择、conditions、FDR 与 Q-value 结构、QC 历史、missing value 情况以及 report schema 是否进入后续统计和交付。

问题 5：Search Archive 在软件操作中的位置

解析：Search Archive 关系到搜索结果的保存、复核、复用和团队共享。若不了解它的作用，就很难理解同一个项目中的 library、settings 和历史搜索记录为什么必须保持一致，而不能当作一次性临时文件处理。

Knowledge Checks

SpectroDive 问题集

这组题集中处理 targeted verification 的判断逻辑，不是界面点击顺序，而是 panel、schedule、calibration 和 report 的实际后果。

问题 1：SpectroDive 以 panel 作为方法起点

解析：targeted proteomics 的核心不是“跑一份 raw”，而是 panel 的定义是否正确。Q1 / Q3、iRT、fragment 选择、label channel 和 response factor 都在 panel 阶段决定了后续 method export、analysis 和 quantification 的上限。

问题 2：scheduled method 的核心风险指标是什么？

解析：并发 transitions 数和窗口宽度。窗口太宽或 panel 太大，会导致 concurrent transitions 过高，继而压缩 dwell time，影响信噪比和定量质量。

问题 3：Calibration Curve 在 SpectroDive 中真正解决什么问题？

解析：它把相对信号转成绝对定量框架，并提供 LOD、LLOQ、ULOQ 和线性定量区间判断。如果只生成了曲线图但没规划 calibrant、dilution factor 和 .ccs 复用策略，就不算真正掌握这一部分。

问题 4：review tree 中 accept、reject、exclude 的影响

解析：这些动作会改变候选 transition、峰组和后续报告的构成。它们不是视觉标注，而是对定量证据进行取舍。若不能说清每个动作的后果，就说明还没有真正掌握 targeted review。

问题 5：绝对定量中 report、QC 和 calibration curve 的对应关系

解析：绝对定量不是单独看 `AbsoluteAmount` 一个字段，而是要同时理解曲线是否在线性范围内、QC 是否稳定、CV 是否可接受，以及当前样本处于 LLOQ/ULOQ 的什么位置。脱离这几层关系，任何绝对量都可能被误读。

Troubleshooting

常见误区与排错思路

这一节集中处理排错顺序。真正的排错不是先怪软件，而是沿着样本、采集、文件、条件、统计、导出一步步回推。

误区：DIA 软件结果不好，一定是软件参数问题

排错顺序应从样本、前处理、仪器状态、library / FASTA、conditions、QC，再到 settings。很多问题并不出在软件最后一步。

误区：PRM / MRM 只要 panel 越大越好

大 panel 会推高 concurrent transitions，影响 dwell time 和调度质量。真实项目里需要在覆盖面和方法可执行性之间折中。

误区：后半本可不看

后半本其实决定你能不能把软件从“会点”变成“能交付、能 SOP 化、能稳定复核”。尤其是 appendices、plots、report headers 和 settings。

误区：QC 只是给平台管理员看的

无论是 Spectronaut 还是 SpectroDive，QC 都必须进入日常使用者的工作范围，否则结果好坏很难被正确解释。

你看到的表面问题	第一优先排查什么	第二优先排查什么
识别数突然下降	仪器状态、样本前处理和 RT / QC 漂移。	library / FASTA / panel 文件是否与当前 raw 匹配。
差异分析结果极不稳定	conditions、replicates、缺失值和 normalization 逻辑。	过滤阈值、Q-value 和导出表结构是否进入下游统计。
scheduled method 跑不稳	panel 大小、窗口宽度、并发 transitions 与 dwell time。	RT calibration 是否准确，fragment 是否过多或不稳定。
绝对量看起来异常	calibration curve、LLOQ / ULOQ、样本位置是否超线性范围。	QC 和 review tree 是否已经排除异常 transition 或峰组。

Header Drills

报表字段问题集

字段题对应对象层级、判断逻辑与字段联读关系，不只是翻译缩写。

问题 1：在 Spectronaut 报表里看到 `EG.Cscore`、`EG.Qvalue`、`EG.MeanTailingFactor`，你应该分别先想到什么？

解析：`EG.Cscore` 先看识别质量与打分强弱，`EG.Qvalue` 先看 FDR 控制下是否还能算可信识别，`EG.MeanTailingFactor` 先看峰型是否拖尾异常。三者一起看，才更接近真实 review 逻辑。

问题 2：在 SpectroDive 报表里 `EG.AbsoluteAmount` 有值，但 `EG.AbsoluteAmountRangeLimitted` 为空或提示超范围，意味着什么？

解析：说明软件仍可计算出一个绝对量，但它可能不在线性范围内。真正进入报告和决策时，必须结合 `LLOQ / ULOQ / LinearRangeLocation / CV at LLOQ` 一起判断。

问题 3：`PEP.IsProteotypic = false` 时的证据边界

解析：它说明该 peptide 不是唯一对应某一个蛋白的特异肽段。做 biomarker 验证、面板固化或 panel 设计时，往往应优先选 proteotypic peptide，避免解释歧义。

问题 4：`PG.Quantity`、`PEP.Quantity`、`FG.Quantity` 的层级区别

解析：这三个字段对应蛋白组、前体和 fragment 不同层级。若不知道对象层级差异，就可能把上游 review 或 filtering 的结果错误地拿去做下游统计，造成表观一致但生物学含义完全不同的结果。

Command-Line Drills

命令行与自动化问题集

这一组集中处理 GUI 设置向 SOP、批处理和可复核团队流程的迁移。

问题 1：你要把一批 DIA run 放进标准化分析流水线，优先记住 Spectronaut 的哪几类命令？

解析：建库用 `lg`，library-based 分析用 `diaanalysis`，library-free 用 `direct`，批量报表或实验合并时再考虑 `combine` 与 `manageSNE`。先按任务类型记命令，比死背参数更有效。

问题 2：`command arguments file` 与 JSON settings override 的标准化作用

解析：这两者让 GUI 里调好的规则可以迁移到 pipeline。前者可把长命令保存为可复用脚本输入，后者可在固定 schema 上做少量覆盖，避免团队每次重新手调。

问题 3：SpectroDive 命令行除了直接跑 analysis，还有什么容易被忽略但很有用？

解析：还能加载已保存实验、导出各种 report，以及把多个 calibration curve 集合合并成 `.ccs` 文件，直接进入后续绝对定量项目。

问题 4：`--setXICExportDirectory` 对 Spectronaut 的意义是什么？

解析：它会打开自动 XIC 存储，把定量分析过程中生成的 XIC 以 SQLite 形式导出，直接进入高级排错、峰图复查和二次开发。这是把软件结果开放给数据库工作流的重要接口。

问题 5：固化 schema、settings 和 arguments file 的意义

解析：一旦项目从单次实验走向批量项目或团队协作，参数管理就会比个人记忆更重要。把 schema 与 arguments file 固化下来，能减少“这次点得和上次不一样”的隐性漂移。

Scenario Drills

场景题

场景题集中处理软件语言与项目语言之间的转换，可按“问题是什么、现在在哪一步、路线选择依据、风险在哪里”四个层次组织答案。

场景 1：你要做 300 例血浆 discovery，软件路线怎么选？

处理路径：先走易肽系列 + Auto 工作站 + DIA discovery，优先 Spectronaut；如果没有现成高质量谱库，可从 directDIA 起步。重点不在绝对定量，而在稳定性、CV、批次设计和后分析候选筛选。

场景 2：你已经有一组候选 biomarker，要走验证与转化

处理路径：把候选 peptide / protein 迁到 SpectroDive，设计 panel、做 RT calibration、导出 scheduled method，如需绝对定量则建立 calibration curves，并把 report schema 固化成验证模板。

场景 3：一个你总是把 normal report 和 run pivot report 搞混

处理路径：先回到 Report Perspective，明确 normal report 是长格式、利于后处理；run pivot 更偏向下游浏览与展示。最好结合真实表头对比一次。

场景 4：discovery 结果与 targeted verification 的衔接

处理路径：discovery 对应广度筛选和候选发现，verification 对应对有限候选做高特异、可重复、可量化的检测。两者不是替代关系，而是项目推进不同阶段所需的不同证据层。

软件问题集与排错