Aantekeningen les week 1
Introductie in OMICS. Er zijn verschillende vormen van OMICS, namelijk transcriptomics,
proteomics en metablomics. Het analyseren van je micro array data is transcriptomics; hierbij
kijk je naar genen (je kijkt naar alle genen die al zijn getranscribeerd, dus naar het mRNA).
Je stelt hierbij de vraag welke genen er worden beïnvloed door ALCAM signalering. De
positieven worden geverifieerd door middel van een Q-PCR. Proteomics is met eiwitten,
hierbij kan je denken aan de gelatine zymografie analyse van de MMP-2 expressie en
activiteit. Metabolomics, dit is alles om eiwitten heen; dus bijvoorbeeld als eiwitten iets gaan
produceren (hierbij kan je denken aan de HPLC analyse van de membraan lipiden
compositie). OMICS is eigenlijk de studie van alles. Er is meer dan alleen DNA. Je hebt dus
het genoom, hierna het transcriptoom, daarna het proteoom en uiteindelijk het metaboloom.
Op DNA niveau spreek je van genomics, dit is de studie van alle genen.
Transcriptomics, op de afbeelding zie je allemaal stipjes en elk stipje geeft een bepaald
expressie level van een enkel gen weer. Als hij oplicht dan is het mRNA gebonden en kan je
zien dat er expressie is. Bij proteomics kan je op verschillende levels naar een eiwit kijken,
namelijk de 3D structuur, het expressie level en de interacties die eiwitten kunnen aangaan.
Belangrijk hierbij is dat er veel bio-informatica bij is betrokken. Metabolomics; op de
afbeelding zie je een GCMS profile, hier zie hoeveel een bepaalde metaboliet tot expressie
wordt gebracht in de cel. Het uiteindelijke doel is om te leren hoe een gen tot expressie wordt
gebracht, hoe het eiwit eruit ziet en wat de functie van dit eiwit uiteindelijk is. Dit noemen we
System Biology Research (het totale plaatje). OMICS betekent veel bio-informatica.
Transcriptomics. Dit gaat over alle genen en hoe ze tot expressie komen. Dit is van belang
om te kijken wanneer een gen anders tot expressie komt dan normaal. Als je weet wanneer
een gen tot expressie komt en hoeveel er van dit gen tot expressie wordt gebracht, dan kan
dit als aangrijpingspunt dienen voor een medicijn. Op dit moment hebben we veel genomen
gesequenced, dit lijdt tot nieuwe vragen.
Hoe verschillen de expressie levels van genen in verschillende celtypen? Hoe verandert de
gen expressie bij een ziekte of bij een behandeling van een ziekte? Welke functies hebben
genen? In welk proces participeren genen en hun producten? Hoe worden genen
gereguleerd? Hoe interacteren genen en gen producten met elkaar?
Als je de expressie weet, kan je de hypothese stellen wat de functie van een gen is (dat hij
bijvoorbeeld ergens verantwoordelijk voor is). Om al deze vragen te beantwoorden maken
we gebruik van verschillende tools, namelijk RNAseq (RNA sequencing); Expressed
Sequence Tag (EST) sequencing en Micro-arrays. De verschillende tools worden nu
besproken.
RNAseq. Hierbij sequence je RNA, namelijk mRNA (want je bent geïnteresseerd in de
expressie van genen). Dit doe je door middel van next generation sequencing (dit resulteert
in biljoenen sequenties per run). Als je het over transcriptomics hebt, is het altijd mRNA.
Tevens bestudeer je hoe vaak elk gen tot expressie wordt gebracht. Je sequenced een paar
basenparen en dit is genoeg om het te relateren aan een bepaald genoom. Je telt het aantal
fragmenten die gesequenced zijn per gen en bepaalt hiermee het relatieve expressielevel.
Met deze techniek meet je de globale levels van de gen expressie. Je alignt het met een
genoom sequentie. Deze techniek wordt elke dag goedkoper.
Hoe doen we dit in de praktijk? Als eerst moeten we kijken hoeveel monsters we hebben.
We moeten in twee dimenties kijken (in gezond en ongezond, dus met ziekte of zonder
ziekte). Als eerste stap dient het mRNA geïsoleerd te worden. Het is van belang dat je
mRNA een poly-A-tail heeft. Daarna willen we deze sequenties sequencen. We moeten er
eerst cDNA van maken, de hoofd reden hiervoor is dat het minder snel wordt afgebroken dan
mRNA. mRNA is heel gevoelig voor RNases en die zijn overal. Dus met cDNA heb je een
veel stabieler component die je kan sequencen. Adapters worden aan het cDNA toegevoegd
,en deze zijn nodig om te sequencen. Je telt uiteindelijk hoe vaak je de sequentie hebt die
gerelateerd is tot jouw gen. Als je dit vergelijkt met waarmee je het wil vergelijken kan je
zeggen op het is op-gereguleerd of is down-gereguleerd. Je moet altijd in je gedachten
houden dat het genoom meerdere van deze sequenties kan hebben die gerelateerd aan het
gen. Als je al die sequenties telt dan meet je de genexpressie. Heel belangrijk is dat je altijd
een referentie genoom nodig hebt bij deze techniek (als je die niet hebt dan kan je deze
techniek niet gebruiken).
Expressed Sequence Tag (EST). Er is één groot verschil met de RNA sequencing. Hierbij
ligeer je je cDNA namelijk in een vector en je gebruikt deze vector om te sequencen. Je kan
nu het hele gen sequencen (je kan de primer namelijk twee kanten op laten lopen). Dus je
kan hem aan beide kanten sequencen. Hierbij is het nadeel dat je als je veel intronen in je
gen hebt dan mis je die. Deze tool gebruik je als je geen referentie genoom hebt, hij is niet
op basis van eerdere sequence informatie. Deze techniek is heel moeizaam en duur. Je
moet heel vaak sequencen wil je het expressie level van genen die weinig tot expressie
komen meten. Als je kan kiezen kies dan altijd RNA sequencing.
Micro-array. Bij de Northern blot wordt er gebruik gemaakt van een probe die bindt aan
het single stranded DNA van het gen. Aan de probe zit een fluorescent label. Deze probe is
specifiek voor jou gen van interesse. Het nadeel van Northern blot is dat je één gen per keer
kan bestuderen.
Micro-arrays kunnen veel verschillende genen tegelijk meten. In tegenstelling tot de Northern
blot (hierbij was de probe gelabeld), is bij de micro array het cDNA/RNA gelabeld. Hierbij
bindt je probe aan een oppervlak (voor elk gen bindt er een probe aan het oppervlak). Elke
cirkel is een ander gen met de probe. De probe heeft dus geen fluorescente tag. Je incubeert
met een bepaald monster en je lijkt op hetzelfde moment voor veel verschillende genen waar
het mRNA bindt. Hoe vaker het bindt, hoe meer gen expressie (hoe helderder de cirkel
wordt). Het monster is gelabeld met fluorescente tag. Bij de micro-array isoleer je eerst al het
mRNA, daarna omzetten naar cDNA en dan label je het (dit cDNA is enkelstrengs). Het gaat
hier om het enkelstrengs DNA van alle genen van een organisme. Het gaat dus om alle
genen die tot expressie komen in de cel. Dit is een cDNA array. Je hebt twee verschillende
vormen van micro arrays, namelijk de cDNA micro array en de oligonucleotide micro array.
Over welke we het heel de tijd hadden is de cDNA micro array. Op de afbeelding zie je twee
verschillende personen. Je hebt twee verschillende RNA monsters en deze label je ieder met
een bepaalde kleur; met groen en rood. Hierbij vergelijk je dus twee monsters op hetzelfde
moment. Als je ziet dat er twee genen hetzelfde expressieniveau hebben dan komt er een
kleur tussenin (dan heb je dus beetje rood en groen). Dus elk stipje is een bepaald gen; je
kan nu van twee verschillende monsters het expressieniveau vergelijken (je kan bijvoorbeeld
anafase en interfase met elkaar vergelijken.
Oligonucleotide array. Bij cDNA array vindt je cDNA, hier vindt je oligonucleotiden (dit is een
klein stuk DNA, ongeveer 20 bp). Deze bevatten dus probes van oligonucleotiden
(enkelstrengs DNA). Je kan dit zelf ontwikkelen, dus zelf selecteren naar welke genen je
kijkt. Bij cDNA microrrays kan je cross hybridization krijgen, dit wil zeggen dat genen die op
elkaar lijken aan elkaar kunnen binden. Nu kan je denken dat een gen tot expressie is
gebracht terwijl dit in werkelijkheid niet is. Met deze oligonucleotide array kan je exact probes
maken die je precies op je gen van expressie passen. Het gaat hier om perfect match probes
(precies de exacte sequentie) = PM. Je ontwerpt ook mis match probes (één nucleotiden
verschil) = MM. Deze probe kan niet binden. Als er wel binding is bij de MM (als je
bijvoorbeeld het verkeerde gen hebt of verkeerde hybridizatie), kan je deze verkeerde
binding detecteren. Je hebt dus per gen een PM probe en een MM probe. Het doel van een
mis match probe is dus om de vals positieven te corrigeren. Als deze bindt is dit dus geen
mRNA dat gerelateerd is aan het gen van interesse. Het nadeel van deze is dat je één
monster tegelijk kan onderzoeken, dus hier kan je niet met verschillende kleuren werken en
dus twee RNA monsters met elkaar vergelijken. Oligonucletides arrays moet je zelf
ontwerpen (dit is dus best duur). Je gebruikt deze array als je een specifieke set van genen
, wil bestuderen. cDNA array gebruik je om dingen te vergelijken en bij de oligonucleotiden
array heb je maar één sample. Het is van belang dat je weet dat je eerst het mRNA isoleert
er hier vervolgens cDNA van maakt, aan het cDNA wordt een fluorescent label gekoppeld.
De probe zit gebonden aan de plaat. Bij micro arrays meet je relatieve expressielevels,
bijvoorbeeld de interfase vs. de anafase; een behandeling vs. de controle; ziek weefsel vs.
normaal weefsel; verschillende tijdsmomenten; etc.
Is de micro array nu nog steeds een up to date techniek? Op dit moment wordt sequencing
het meest gebruikt om genexpressie te meten. Je ziet dat de array technieken terug komen
in verschillende vormen.
Bij micro-array maak je dus gebruik van hibridizatie (dit kan altijd misgaan, daarom
verschillende micro-arrays). Beide micro-arrays en RNA sequencing hebben een referentie
genoom nodig. In alle aspecten is de RNA sequencing de beste optie.
Om data te interpreteren moet je een vergelijking maken tussen de expressie levels van
verschillende monsters. Voor de data analyse moet je een goed overzicht hebben van de
verschillende vormen van variatie die de bronnen kunnen hebben. Je moet bijvoorbeeld
goed in de gaten houden dat op het moment dat je met een micro array de expressie van
genen bestudeert, dat je eigenlijk altijd een snap ‘shot maakt’. Het is dus echt een moment
opname in een bepaald weefsel in een bepaalde tijd (er kan dus veel variatie zitten op het
moment dat je meet). Tevens moet je in de gaten houden dat als je weinig mRNA hebt, dat
het kan voorkomen dat hij deze niet kan detecteren. Nu kan je misschien een foute conclusie
trekken; dat er geen expressie is, terwijl dit in werkelijkheid wel het geval is. Het voordeel van
de micro array in vergelijking met de Northern blot is dat je veel genen tegelijk kan meten.
Ook moet je bij de micro array weten dat je relatief meet en niet absoluut (dus je hebt het niet
in getallen, dus geen aantallen van mRNA moleculen).
Om data te genereren moet je eerst pre-processing doen (de achtergrond eraf halen, je data
filteren en een log transformatie uitzetten). Tevens moet je je variatie controleren. Hier
komen experimental design (biologische en technische variatie) en normalisatie bij kijken.
Om de variabiliteit te controleren moet je goed kijken naar de biologische en de technische
variabiliteit. Deze muizen zijn niet hetzelfde, ook al zien ze er precies hetzelfde uit en zijn ze
op dezelfde manier behandeld. Het is van belang om de variabiliteit alvorens de start van het
experiment te controleren, bijvoorbeeld door stress te vermijden en de RNA kwaliteit en de