반응형
Sam File
sam file은 시퀀스 정보를 저장하는 파일이다. 근데 fasta 포맷처럼 시퀀스가 일렬로 쭉 나열되 있는 것이 아니라 reference 시퀀스에 align된 시퀀스를 저장한다. 그래서 시퀀스와 함께, 그 시퀀스가 referecne 시퀀스에 매핑된 정보를 CIGAR 포맷으로 나타낸다. 또 bam file로 변환할 수 있는데 bam file은 sam file과 같은 정보를 갖고 있지만 binary 형태로 변환된 데이터이다. sam file은 텍스트 데이터인데 이를 binary로 변환함으로써 데이터를 압축하는 효과를 나타낸다.
이것이 sam 파일의 기본적인 포맷. (https://genome.sph.umich.edu/wiki/SAM)
그리고 각각의 필드에 대한 설명은 https://en.wikipedia.org/wiki/SAM_(file_format)에 나와 있다.
반응형
'Domains > Bioinformatics' 카테고리의 다른 글
Variant calling 이란? (0) | 2017.11.20 |
---|---|
IGV Tutorial [BAM File] (0) | 2017.10.16 |
K-MERS 란 (2) | 2017.10.12 |
Chip-seq 관련 정리 - 데이터 받기 (1) | 2017.10.07 |
dbSNP 관련 정리 (4) | 2017.09.25 |