Identificação de variantes de SARS-Cov-2

Escolha sua amostra

Amostras
SRR13418674
SRR13418675
SRR13418676
SRR13418679
SRR13418680
SRR13418681
SRR13418682
cd ~/eusoujacu
mkdir SARS
cd SARS
cp /home/bioufmg2/anaconda3/bak/SARS/<AMOSTRA>*.fastq.gz .

Entre no ambiente conda

conda activate SARS

Controle de qualidade

trimmomatic PE -threads 20 <AMOSTRA>_1.fastq.gz <AMOSTRA>_2.fastq.gz Paired_R1.fastq.gz Unpaired_R1.fastq.gz Paired_R2.fastq.gz Unpaired_R2.fastq.gz ILLUMINACLIP:/home/bioufmg2/anaconda3/bak/SARS/adapters.fasta:2:30:10:2:keepBothReads LEADING:5 TRAILING:5 SLIDINGWINDOW:4:20 MINLEN:50

Mapeamento ao genoma de referência

STAR --runThreadN 2 --genomeDir /home/bioufmg2/anaconda3/bak/SARS/reference/ --readFilesIn Paired_R1.fastq.gz Paired_R2.fastq.gz --readFilesCommand zcat --outSAMtype BAM SortedByCoordinate --outFileNamePrefix SARS --limitBAMsortRAM 1014992814

Identificação de variações genéticas

bcftools mpileup -f /home/bioufmg2/anaconda3/bak/SARS/RefSeq.fasta SARSAligned.sortedByCoord.out.bam | bcftools call -mv -Ob -o SNVs.bcf
bcftools view SNVs.bcf -i '%QUAL>150' > SNVs.txt

Montagem do genoma viral

spades.py --only-assembler --trusted-contigs /home/bioufmg2/anaconda3/bak/SARS/RefSeq.fasta -1 Paired_R1.fastq.gz -2 Paired_R2.fastq.gz -t 2 -o assembly

Filtragem de fragmentos

cat assembly/scaffolds.fasta | perl /home/bioufmg2/anaconda3/bak/SARS/filter_small.pl 20000 > pangolin_input.fasta

Faz identicação de variante de SARS-Cov-2

conda activate pangolin
pangolin pangolin_input.fasta