생물정보학/NGS 데이터분석 기초
NGS의 원리
ppsy
2024. 7. 25. 19:28
이 포스팅은 INCOEDU | KOBIC 교육센터의 온라인 강의 내용을 듣고 복습한 내용을 바탕으로 만들어졌습니다.
저작권 보호 등의 문제 발생 시 삭제 하겠습니다.
https://edu.insilicogen.com/kobic/course/167
차세대 생명정보 온라인 교육 | KOBIC 교육센터
KOBIC 차세대 생명정보 교육은 바이오 데이터 분석 및 활용을 위한 IT 기술(프로그래밍 언어, 리눅스)과 바이오 데이터 분석 전문기술을 제공합니다.
edu.insilicogen.com
Illumina Solexa sequencing
Illumina Solexa sequencing은 가장 보편적인 NGS입니다.
Illumina sequencing은 서로 다른 수십억개 target ssDNA를 Flowcell에 부어 분석합니다.
1. 준비
분석할 target ssDNA의 양 끝 말단에 adaptor 시퀀스을 붙입니다.
adpator 시퀀스는 flowcell과 상보적인 시퀀스, 인덱스 시퀀스, 프라이머 결합 시퀀스를 포함합니다.
Flowcell 바닥에는 양 쪽 adaptor 시퀀스와 상보적인 DNA들을 고정시킵니다.
2. PCR
target ssDNA(forward strands) Flowcell에 부어 고정된 adaptor 시퀀스에 hybridization 시킵니다.
그리고 DNA polymerase, primer, dNTP를 넣고 PCR합니다.
넣어준 forward strands로 부터 바닥에 고정된 reverse strand가 합성됩니다.
그리고 그 reverse strands들은 끝 부분 어댑터 시퀀스에 의해 다른 Flowcell 바닥의 DNA와 브릿지를 형성합니다.
브릿지를 형성한 reverse strands들은 또 다시 forward strands를 합성하고 연쇄반응으로 DNA가 증폭됩니다.
Flow cell에 고정된 DNA가 충분히 증폭됐다면 고정되지 않은 forward strands를 제거해줍니다.
3. Sequencing
시퀀싱을 진행하기 앞서 forward strands만 시퀀싱 하기 위해 제한효소로 reverse strands들을 제거합니다.
그리고 primer, 형광dNTP, DNA polymerase를 넣고 DNA를 합성합니다.
형광 dNTP가 DNA에 중합될 때 형광을 내고 중합을 멈추는데 이것을 기록하고 dNTP의 terminator를 떼냅니다.
이 사이클은 약 100번 정도 반복되어 100 bp 서열을 읽을 수 있습니다.
그리고 시퀀싱이 끝나면 시퀀싱한 조각에 상보적인 strands를 합성하여 시퀀싱합니다.
결과적으로 앞, 뒤 서열을 모두 얻을 수 있는데 이를 Paired-end sequencing이라고 합니다.
Ion Torrent semiconductor sequencing
DNA polymerization에서 1 base가 추가될 때마다 1 H+가 발생한다는 점에서 착안되었습니다.
Ion Torrent semiconductor sequencing은 H+에 의해 발생한 전기적 신호를 읽어 시퀀싱하는 방법입니다.
1. Sequencing
네 종류 dNTP를 차례로 넣고 씻어내는 것을 반복합니다. 즉 염기 하나 분석에 1~4회 반응을 시도합니다.
Terminator를 사용하지 않아 연속으로 존재하는 염기의 경우 한 번에 두 dNTP가 중합됩니다.
이 경우 H+가 더 많이 발생하여 그만큼 전기 신호가 강합니다. 즉 강해진 전기신호로 연속적 염기서열을 읽습니다.
2. emulsion PCR
이 방법을 사용하는 데 있어서 DNA 조각들이 서로 간섭하지 않게 하면서 DNA를 증폭할 기술이 필요합니다.
emulsion PCR은 특정 서열의 DNA 조각에 bead를 붙게 하여 emulsion 기름방울에 넣는 방법을 사용합니다.
이 각각의 기름방울 안에서 PCR이 일어나며 한 구슬의 표면은 DNA 조각으로 도배됩니다.
이렇게 얻어진 구슬을 well에 넣어 Ion Torrent semiconductor sequencing을 할 수 있습니다.
PacBio SMRT sequencing
DNA의 증폭없이 단일 DNA 분자를 시퀀싱 하는 방법입니다.
한 번에 긴 DNA 서열을 시퀀싱할 수 있지만 오류율이 비교적 높습니다.
1. Sequencing
인산기에 형광이 결합한 hexaphosphat nucleotide를 사용합니다.
DNA를 중합시키면 매 염기가 결합할 때마다 형광물질이 떨어져나오게 됩니다.
하나의 well에 하나의 DNA fragment와 4종류의 형광 hexaphosphate nt가 들어갑니다.
각각 형광 nt는 신호가 약하지만 nt가 중합에 참여하면 신호의 강도가 커지고 지속시간이 길어집니다.
2. Detecting
이 방법을 사용하는데 있어서 작은 공간에 DNA를 가두어 집중된 레이저로 형광을 검출하는 기술이 필요합니다.
그 기술은 Zero Mode Waveguid 기술입니다.
Oxford Nanopore Sequence
DNA를 ssDNA로 만들어 nanopore를 통과시키는 방법입니다.
Nanopore는 helicase와 연결되어 DNA가 풀어져 ssDNA가 nanopore를 통과하게 합니다.
DNA의 통과는 nanopore에 의한 막 전위 차이 변화를 일으킵니다.
한 번에 약 4nt에 해당하는 단위로 signal이 측정됩니다.
따라서 signal data에서 single nt 서열을 복구하는 소프트웨어가 중요한 역할을 합니다.