- Add base_prokka genome annotation tool with pixi config - Add CRISPR-Cas analysis src (CRISPRCasFinder.pl, environment config) - Add test data and documentation Co-Authored-By: Claude <noreply@anthropic.com>
1.5 KiB
1.5 KiB
模块 1:基因组注释
目标:通过prokka对进行原核生物基因基因组注释 ,为后续分析提供输入文件。
1) Conda 环境
- 环境名:
prokka - 说明:运行prokka进行基因组注释
- 激活:
conda env create -f prokka.yml
conda activate prokka
已安装环境:✅(yml配置文件:
prokka.yml)
2) 启动命令
2.1 单基因组运行(推荐模板)
prokka \
--outdir <OUTDIR> \
--prefix <genome> \
--cpus 8 \
--genus Bacillus \
--species Bacillus thuringiensis \
genome.fna
3) 参数说明(阈值含义 + 默认值)
| 参数 | 含义 | 阈值/影响 | 默认值 |
|---|---|---|---|
--outdir |
输出目录 | N/A | N/A |
--prefix |
输出结果文件前缀 | N/A | N/A |
--cpus |
线程数 | 影响速度 | N/A |
--genus |
物种所属“属” | N/A | N/A |
--cpus |
物种所属“种” | N/A | 8 |
genome.fna |
输入基因组 | N/A | NA |
4) 输出结果文件(结构与解析)
4.1 输出目录结构(建议)
OUTDIR/
<genome>.faa # 基因注释蛋白质文件
<genome>.ffn # 基因注释核酸文件
<genome>.fna # 基因组文件
<genome>.gbk # genbank格式注释文件
<genome>.gff # gff格式注释文件
<genome>.log
<genome>.fsa
<genome>.sqn
<genome>.tbl
<genome>.tsv
<genome>.txt
<genome>.err
prokka注释文件夹中的gbk、faa格式的文件用于杀虫素预测;faa、gff用于CRISPRCasFinder.pl的输入文件。