반응형
Variant Calling
정의
variant call 은 어떤 개인의 genome혹은 transcriptome에서 reference와 뉴클레오타이드 서열의 차이가 있는지를 결정하는 것이다. 이 과정은 variant frequency와 confidence measure가 고려된다.
유즈케이스
DNA-seq : variants
- 질병과의 유전적 연관성
- 암에서의 돌연변이 알아내기
- 이형접한 인구 빈도 알아내기
RNA-seq : allele-speicifc expression
- Allelic imbalance
- Association with isoform usage (splicing QTLs)
- RNA editing (allele absent from genome)
Chip-seq : allele-specific binding
- protein binding이 allele-specific하게 일어나는 현상
핵심은 variant call을 통해 어떤 locus에 'variant가 있다' 라는 정보를 알 수 있기 때문에 이를 통해 위와 같은 연구를 할 수 있음
Variant Call은 Genotype 보다 더 일반적인 접근이다.
genotype은 어떤 locus의 allele의 집합을 나타낸다. 근데 배수성을 보통 2n으로 가정하고 한다. 또한 genotype은 주로 SNP에 대해서만 고려된다. 하지만 RNA-seq 같은 경우 2n이 아니며 genotype이 없다. 또 암유전체학 등에서는 copy number variation이 중요하기 때문에 variantl call이 genotype보다 일반적인 접근법이라 할 수 있다.
참고
파일첨부
참고할 사이트들
Best Practices workflow
https://software.broadinstitute.org/gatk/best-practices/bp_3step.php?case=GermShortWGS
반응형
'Domains > Bioinformatics' 카테고리의 다른 글
GATK4 설치 (0) | 2018.02.20 |
---|---|
Chip-seq 데이터를 통한 binding motif 분석 [rGADEM] (0) | 2018.01.13 |
IGV Tutorial [BAM File] (0) | 2017.10.16 |
Sam File (0) | 2017.10.16 |
K-MERS 란 (2) | 2017.10.12 |