반응형

/* 2017.8.7 */


공부와 메모를 위한 포스팅입니다.


platypus 설치 링크


http://www.well.ox.ac.uk/platypus

https://github.com/andyrimmer/Platypus


위의 매뉴얼대로하면 된다.

압축파일을 다운받고 빌드하면 설치 완료.

또한 두 번째 github 링크 주소에서 나오듯이 htslib를 설치하여야 한다. (dependancy가 있다.)


platypus는 haplotype variant calling 하는 프로그램.

command line에서 실행할 때는 파이썬 프로그램을 command line에서 실행하는 것처럼 하면 된다.


platypus 실행


가장 간단하게 platypus를 실행하는 방법은


python Platypus.py callVariants --bamFiles=input.bam --refFile=ref.fa --output=VariantCalls.vcf


플라티푸스 폴더에 들어가서 저 명령어를 실행하는 것인데,

이 때, 1개 이상의 BAM 파일을 인풋으로 제공할 수 있으며, reference file은 fast파일로 제공하면된다.

또한 BAM 파일은 samtools나 이와 비슷한 프로그램으로 indexing이 되어있어야하며,

FASTA 파일도 마찬가지로 "samtools faidx" 나 이와 비슷한 프로그램으로 indexing 되어있어야한다.


아웃풋은 1개의 .vcf 파일과 log 파일이다.

log 파일의 최하단에 'Finished variant calling' 메시지를 보고 제대로 작동하였음을 확인할 수 있다.


그러면 이제 samtools로 bam 파일과 fasta 파일을 indexing 하는 것을 해보자.

반응형

'Domains > Bioinformatics' 카테고리의 다른 글

Platypus 를 통한 variant calling  (0) 2017.08.07
bam 파일 인덱싱  (0) 2017.08.07
samtools 설치시 에러 해결  (0) 2017.07.16
윈도우 우분투에 GATK 설치하기  (0) 2017.06.24
non-coding RNA는 어떻게 만들어지나?  (0) 2017.05.28