FASTA header 解析规则
FASTA header parsing rule JSON 只用于 convertFASTA 命令。它不是 directDIA settings override,而是定义普通 FASTA header 如何被解析并写入 Managed FASTA .bgsfasta。核心字段包括 name、proteinIDToken、keywords 和 parsingRule。
Spectronaut Utility
粘贴 FASTA header parsing rule JSON 或 directDIA settings JSON,即刻完成本地校验、修复、复核和下载。文件只在浏览器本地处理,不上传。
在线校验台
选择文件类型后,粘贴内容或上传 .json。修复按钮会处理智能引号、尾随逗号、字符串型数字/布尔值等常见格式问题,并生成可下载的修复稿。
使用范围
FASTA header parsing rule JSON 只用于 convertFASTA 命令。它不是 directDIA settings override,而是定义普通 FASTA header 如何被解析并写入 Managed FASTA .bgsfasta。核心字段包括 name、proteinIDToken、keywords 和 parsingRule。
-j 导入的 JSON 会覆盖默认设置或 -s 指定的 .prop 设置。结构上分为 DIA_Analysis 与 Pulsar_Search,分别控制定量分析和 directDIA 搜索/建库。
convertFASTA
convertFASTA 用于把一个或多个 plain-text FASTA 文件转换为 Spectronaut 可复用的 Managed FASTA .bgsfasta。当默认 UniProt header 规则不能覆盖自定义数据库时,通过 --parsingRule 指定自定义规则 JSON。
dotnet Spectronaut.dll convertFASTA -fasta "D:\db\protein.fasta" --parsingRule "D:\rules\custom-rule.json" -o "D:\managed-fasta"
输出目录中生成的 .bgsfasta 才是后续 library generation、directDIA 或 protein inference 更稳定的输入形式。
-fasta <fasta> | 输入 plain-text FASTA 蛋白数据库路径。 |
-o, --output <output> | Managed FASTA 输出目录。 |
--parsingRule <rule.json> | 自定义 header parsing rule JSON 文件;未指定时使用默认 UniProt 规则。 |
-setTemp <folder> | 指定临时目录。大 FASTA 或网络盘环境中建议放到本地高速盘。 |
-v, --verbose | 输出更详细的错误信息,适合排查 header 解析失败或路径问题。 |
--terminateAfterError | 遇到错误立即终止,适合批处理前的严格检查。 |
-segmented | 启用 segmented-diaPASEF 方法支持,当前属于 beta 功能。 |
字段速查
Precursor_PEP_Cutoff、Precursor_Qvalue_Cutoff、Protein_Qvalue_Cutoff_Experiment、Protein_Qvalue_Cutoff_Run 和 Single_Hit_Protein_Rule 直接影响结果可信度边界。
Data_Filtering、Cross_Run_Normalization、Imputation_Strategy、Perform_IM_Peak_Picking 和 Perform_background_noise_removal 定义跨 run 定量和离子淌度峰处理。
Enzymes_Cleavage_Rules、Digest_Type、Max_Peptide_Length、Missed_Cleavages、Search_Mode、DirectDIA_Workflow 和 Ion_Types 定义 directDIA 搜索空间。
Calibration_Search、Main_Search 与 MS1/MS2 correction factor 控制不同仪器平台的质量容差策略。常规优先使用 dynamic,只有明确校准边界时才进入 static 或 relative。