Files
zly 8e0deb1691 feat: add base_prokka tool and CRISPR-Cas analysis source code
- Add base_prokka genome annotation tool with pixi config
- Add CRISPR-Cas analysis src (CRISPRCasFinder.pl, environment config)
- Add test data and documentation

Co-Authored-By: Claude <noreply@anthropic.com>
2026-01-28 20:31:00 +08:00

1.5 KiB
Raw Permalink Blame History

模块 1基因组注释

目标通过prokka对进行原核生物基因基因组注释 ,为后续分析提供输入文件。


1) Conda 环境

  • 环境名:prokka
  • 说明运行prokka进行基因组注释
  • 激活:
conda env create -f prokka.yml
conda activate prokka

已安装环境:yml配置文件 prokka.yml


2) 启动命令

2.1 单基因组运行(推荐模板)

prokka \
  --outdir <OUTDIR> \
  --prefix <genome> \
  --cpus 8 \
  --genus Bacillus \
  --species Bacillus thuringiensis \
  genome.fna

3) 参数说明(阈值含义 + 默认值)

参数 含义 阈值/影响 默认值
--outdir 输出目录 N/A N/A
--prefix 输出结果文件前缀 N/A N/A
--cpus 线程数 影响速度 N/A
--genus 物种所属“属” N/A N/A
--cpus 物种所属“种” N/A 8
genome.fna 输入基因组 N/A NA

4) 输出结果文件(结构与解析)

4.1 输出目录结构(建议)

OUTDIR/
  <genome>.faa # 基因注释蛋白质文件
  <genome>.ffn # 基因注释核酸文件
  <genome>.fna # 基因组文件 
  <genome>.gbk # genbank格式注释文件
  <genome>.gff # gff格式注释文件
  <genome>.log
  <genome>.fsa
  <genome>.sqn
  <genome>.tbl
  <genome>.tsv
  <genome>.txt
  <genome>.err

prokka注释文件夹中的gbk、faa格式的文件用于杀虫素预测faa、gff用于CRISPRCasFinder.pl的输入文件。