ΩOmicSolution蛋白质组学技术平台

Spectronaut Utility

JSON 与 FASTA Header Parsing Rule 在线校验

粘贴 FASTA header parsing rule JSON 或 directDIA settings JSON,即刻完成本地校验、修复、复核和下载。文件只在浏览器本地处理,不上传。

在线校验台

粘贴或上传 JSON,立即得到修复建议

选择文件类型后,粘贴内容或上传 .json。修复按钮会处理智能引号、尾随逗号、字符串型数字/布尔值等常见格式问题,并生成可下载的修复稿。

使用范围

两类 JSON 的用途不同

Linux parsing rule

FASTA header 解析规则

FASTA header parsing rule JSON 只用于 convertFASTA 命令。它不是 directDIA settings override,而是定义普通 FASTA header 如何被解析并写入 Managed FASTA .bgsfasta。核心字段包括 nameproteinIDTokenkeywordsparsingRule

directDIA JSON

命令行 settings override

-j 导入的 JSON 会覆盖默认设置或 -s 指定的 .prop 设置。结构上分为 DIA_AnalysisPulsar_Search,分别控制定量分析和 directDIA 搜索/建库。

convertFASTA

FASTA header JSON 的命令行使用方式

convertFASTA 用于把一个或多个 plain-text FASTA 文件转换为 Spectronaut 可复用的 Managed FASTA .bgsfasta。当默认 UniProt header 规则不能覆盖自定义数据库时,通过 --parsingRule 指定自定义规则 JSON。

基础命令模板

dotnet Spectronaut.dll convertFASTA -fasta "D:\db\protein.fasta" --parsingRule "D:\rules\custom-rule.json" -o "D:\managed-fasta"

输出目录中生成的 .bgsfasta 才是后续 library generation、directDIA 或 protein inference 更稳定的输入形式。

必需参数

-fasta <fasta>输入 plain-text FASTA 蛋白数据库路径。
-o, --output <output>Managed FASTA 输出目录。
--parsingRule <rule.json>自定义 header parsing rule JSON 文件;未指定时使用默认 UniProt 规则。

运行与排错参数

-setTemp <folder>指定临时目录。大 FASTA 或网络盘环境中建议放到本地高速盘。
-v, --verbose输出更详细的错误信息,适合排查 header 解析失败或路径问题。
--terminateAfterError遇到错误立即终止,适合批处理前的严格检查。
-segmented启用 segmented-diaPASEF 方法支持,当前属于 beta 功能。

字段速查

校验重点字段

Identification

Precursor_PEP_CutoffPrecursor_Qvalue_CutoffProtein_Qvalue_Cutoff_ExperimentProtein_Qvalue_Cutoff_RunSingle_Hit_Protein_Rule 直接影响结果可信度边界。

Quantification

Data_FilteringCross_Run_NormalizationImputation_StrategyPerform_IM_Peak_PickingPerform_background_noise_removal 定义跨 run 定量和离子淌度峰处理。

Pulsar Search

Enzymes_Cleavage_RulesDigest_TypeMax_Peptide_LengthMissed_CleavagesSearch_ModeDirectDIA_WorkflowIon_Types 定义 directDIA 搜索空间。

Tolerances

Calibration_SearchMain_Search 与 MS1/MS2 correction factor 控制不同仪器平台的质量容差策略。常规优先使用 dynamic,只有明确校准边界时才进入 static 或 relative。