Variant Calling


정의


variant call 은 어떤 개인의 genome혹은 transcriptome에서 reference와 뉴클레오타이드 서열의 차이가 있는지를 결정하는 것이다. 이 과정은 variant frequency와 confidence measure가 고려된다.


유즈케이스

 

DNA-seq : variants

  • 질병과의 유전적 연관성
  • 암에서의 돌연변이 알아내기
  • 이형접한 인구 빈도 알아내기

RNA-seq : allele-speicifc expression

  • Allelic imbalance
  • Association with isoform usage (splicing QTLs)
  • RNA editing (allele absent from genome)


Chip-seq : allele-specific binding

  • protein binding이 allele-specific하게 일어나는 현상


핵심은 variant call을 통해 어떤 locus에 'variant가 있다' 라는 정보를 알 수 있기 때문에 이를 통해 위와 같은 연구를 할 수 있음


Variant Call은 Genotype 보다 더 일반적인 접근이다.


genotype은 어떤 locus의 allele의 집합을 나타낸다. 근데 배수성을 보통 2n으로 가정하고 한다.  또한 genotype은 주로 SNP에 대해서만 고려된다. 하지만 RNA-seq 같은 경우 2n이 아니며 genotype이 없다. 또 암유전체학 등에서는 copy number variation이 중요하기 때문에 variantl call이 genotype보다 일반적인 접근법이라 할 수 있다.


 


 


참고

https://www.bioconductor.org/help/course-materials/2014/CSAMA2014/3_Wednesday/lectures/VariantCallingLecture.pdf

 

파일첨부

VariantCallingLecture.pdf

 


참고할 사이트들


Best Practices workflow

https://software.broadinstitute.org/gatk/best-practices/bp_3step.php?case=GermShortWGS

'Domains > Bioinformatics' 카테고리의 다른 글

GATK4 설치  (0) 2018.02.20
Chip-seq 데이터를 통한 binding motif 분석 [rGADEM]  (0) 2018.01.13
Variant calling 이란?  (0) 2017.11.20
IGV Tutorial [BAM File]  (0) 2017.10.16
Sam File  (0) 2017.10.16
K-MERS 란  (2) 2017.10.12