Inhoudsopgave
HC1 Genome sequencing and assembly (10)................................................................................................... 2
HC2 Epigenomics (5).................................................................................................................................... 12
HC3 Enhancers (5)........................................................................................................................................ 17
HC4 Transport elements (9).......................................................................................................................... 22
1
,HC1 Genome sequencing and assembly (10)
inhoud
Historisch perspectief en typische workflow
Short read-sequencingtechnieken (SRS)
Datarepresentatie (FASTQ)
Genoomassemblage (technieken en uitdagingen)
Long read-sequencing (LRS) en assemblage
Alternatieve scaffoldingtechnieken
Gen voorspelling
Ondersteuning bieden voor genvoorspellingen
Overview typical workflow
Shotgun sequencing: Er worden sequencing reads gegenereerd dat zijn de pijltjes.
Genome assembly: De reads worden over elkaar heen geplakt als ze deels
overeenkomen. Hierdoor krijg je contigs. En als je bepaalde links hebt zoals de
puntjes tussen de reads dan kan je de contigs aan elkaar plakken. Dit kan je
bijvoorbeeld doen dat deze contigs van het zelfde chromosoom in deze volgorde
voorkomen, hierdoor kan je scaffolden met erin dus gaps
o Scaffolden is het aan elkaar plakken van reads in een bepaalde volgorde,
met her en der gaps met onbekende bp
annotation: Je wilt vervolgens het chromsoom dat je hebt geassembleed, structureel
analyseren. bepalen waar alle genen liggen en waar ze voor dienen.
Hoe je een menselijk genoom sequencet: Sanger sequencing methode
Sanger Sequencing (heel langzaam) is gebaseerd op twee hoofdprincipes:
o DNA kan worden gescheiden op grootte
o DNA (elongatie) kan chemisch worden gemodificeerd
Chain-terminating inhibitors
Hierdoor krijg je steeds DNA replicatie van verschillende lengtes
Elke keer als een chain-terminating inhibitor wordt geincorpt, waarvan bekend is aan
welke nucleotide hij complementair is, dan stopt de elongatie en weet je welke base
op het einde van die DNA streng zit.
Er wordt dus steeds dATP (normale A nuclotide) en ddATP (terminator) toegevoegd
in een lagere concentratie. hierdoor wordt dus vaak gwn dATP erin gezet en soms
ddATP en dan stopt de elongatie en weet je dat daar nucleotide T zit die
complementair eraan is. Je hebt dus voor elke base zo’n terminator
Belangrijkste punten:
1) sequentiebepaling door synthese (niet degradatie)
2) radioactieve primers hybridiseren met DNA
3) polymerase + dNTPS + ddNTP-terminators bij lage concentratie
4) 1 baan per base, ladder visueel interpreteren
Hoe je een menselijk genoom sequencet: Lee Hood-automatisering
Lee hood deed ook de sanger sequencing methode maar gebruikte voor elke
nucleotide een ander kleurtje waardoor je ze tegelijk kon gebruiken en
gebruikte een robot. Hierdoor ging het sneller. Read lengtes van ~500bp
2
, Sanger-sequencing: technologische vooruitgang
1977: Fred Sanger
o 1 hardwerkende technicus = 700 basen per dag = 118.000 jaar (om het
menselijk genoom te sequencen)
1985: ABI 370 (eerste geautomatiseerde sequencer)
o 5000 basen per dag = 16.000 jaar
1995: ABI 377 (grotere gels, betere chemie en optica, gevoeligere kleurstoffen,
snellere computers)
o 19.000 basen per dag = 4.400 jaar
1999: ABI 3700 (96 capillairen, 96 well plates, vloeistofverwerkingsrobots)
o 400.000 basen per dag = 205 jaar
o Meerdere ABI3700 in meerdere labs verspreid beperkte het naar 10 jaar
De concurrerende humaan genoomprojecten
De whole genome shotgun methode werd in het prive door onderzoekers
gedaan en was veel sneller en goedkoper dan hierarchical shotgun
Beide gebruikte sanger sequencing toe om zoveel mogelijk DNA fragmenten
te sequensen. en vervolgens werden ze geassembleed
Bij hierarchical shotgun werden allemaal kleine delen van het genoom los
gesequenst en dat ging heel traag
Bij whole genome shotgun gooiden ze gwn alles bij elkaar fragmenten en allemaal
tegelijk sequensen en dan allemaal op 1 hoop gooien en ze puzzelen.
Kosten per ruwe megabase van DNA sequence en kosten per humaan genoom
Het werd steeds goedkoper om DNA te sequencen
In 2006 werd een nieuw sequencing techniek geintroduceerd die veel goedkoper
en sneller was-> namelijk illumina
Short-read sequencing (454, illumina, iontorrent)
Next- en third-generatie DNA-sequentietechnieken
• 2005: 454 (Roche)
• 2006: Solexa (Illumina)
• 2007: ABI/SOLiD (Life Technologies)
• 2010: Complete Genomics
• 2010: Ion Torrent (Life Technologies)
• 2011: Pacific Biosciences
• 2015: Oxford Nanopore Technologies (ONT)
454 sequencing
Je hebt al het gefragmenteerde DNA in een grote bak. Bij 454 sequencing worden
er uiteindes, genaamd adapters, op de fragmenten gezet. De adapters zorgen
ervoor dat ze aan een balletje kunnen binden (1 per balletje).
En vervolgens wordt dat stukje DNA op het balletje vermenigvuldigd,
waardoor op een balletje allemaal dezelfde stukjes DNA zit
Deze balletjes met veel dezelfde stukjes DNA worden geladen in welletjes
en vervolgens vindt de sequencing reactie plaats
Bij 454 sequencing wordt er gebruik gemaakt van luciferase (genereerd lichtflits)
3