Samenvatting Chemometrie
Multicolineariteit
Onafhankelijke variabelenzijn afhankelijk van elkaar
Variabelen zijn niet uniek
Zet elke onafhankelijke waarde uit tegen de rest
StDev > wanneer er geen correlatie is
Oplossing
o Probleem verwijderen
o Als het model een goede R2 geeft, dan gebrui je die variabelen wel
voor de R2pred.
o Vervolgens veranderen de coëfficiënten en de standaardfout.
VIF
De mate waarin de StDev groter wordt door correlatie
Berekend uit R2
VIF = 1 -> Geen correlatie
VIF < 5 -> Matige correlatie
VIF 5 – 10 -> Extreme correlatie
R2
Geeft aan hoe goed de data gefit is
Geeft aan hoe goed het nieuwe responsen kan voorspellen
Kwadraten
Toevoegen zodra je in het residu vs fitted model gebogen predictors ziet ->
MSS kwadraten.
FFD
Full Factorial Design
Onafhankelijke variabelen
Alle coëfficiënten kunnen onafhankelijk bepaald worden en hebben een
onafhankelijke bijdrage
Als je variabelen eruit haalt blijven de coëfficiënten hetzelfde.
2k
Coded met -1, 0 en 1 i.p.v. echte waarden
RSD
Respons Surface Design
Kwadraten toevoegen
Optimum bepalen
FrFD
Fractional Factorial Design
Aantal experimenten en factoren nemen toe
1 of meerdere factoren worden toegevoegd zonder dat er extra
experimenten worden uitgevoerd.
Fractie, 1x halveren = ½, 2x halveren = ¼, etc. 1/2 p. 2k-p.
Coded en Uncoded formules
, Gemiddelde effect
Pseudo Error
Lenths PSE
Normale verdeling rondom 0 = niet significant
Onafhankelijke variabele
Onafhankelijk van andere variabelen, x-as
Afhankelijke variabelen
Afhankelijk van onafhankelijke variabelen, y-as
Durbin Watson Test
Is er een random verdeling of niet?
DW = 2 -> Geen autocorrelatie, random verdeeld
DW < 2 -> Positieve autocorrelatie, underfitting
DW > 3 -> Negatieve autocorrelatie, overfitting
PRESS
Predicted Residual Error of Sum of Squares
Er doet steeds een punt niet mee
Het verschil tussen yber en ymeting in het kwadraat
Overfitting, underfitting en beste fit
Overfitting: R2 is goed, R2pred is klein.
Underfitting: Allebei zijn slecht
Multicolineariteit
Onafhankelijke variabelenzijn afhankelijk van elkaar
Variabelen zijn niet uniek
Zet elke onafhankelijke waarde uit tegen de rest
StDev > wanneer er geen correlatie is
Oplossing
o Probleem verwijderen
o Als het model een goede R2 geeft, dan gebrui je die variabelen wel
voor de R2pred.
o Vervolgens veranderen de coëfficiënten en de standaardfout.
VIF
De mate waarin de StDev groter wordt door correlatie
Berekend uit R2
VIF = 1 -> Geen correlatie
VIF < 5 -> Matige correlatie
VIF 5 – 10 -> Extreme correlatie
R2
Geeft aan hoe goed de data gefit is
Geeft aan hoe goed het nieuwe responsen kan voorspellen
Kwadraten
Toevoegen zodra je in het residu vs fitted model gebogen predictors ziet ->
MSS kwadraten.
FFD
Full Factorial Design
Onafhankelijke variabelen
Alle coëfficiënten kunnen onafhankelijk bepaald worden en hebben een
onafhankelijke bijdrage
Als je variabelen eruit haalt blijven de coëfficiënten hetzelfde.
2k
Coded met -1, 0 en 1 i.p.v. echte waarden
RSD
Respons Surface Design
Kwadraten toevoegen
Optimum bepalen
FrFD
Fractional Factorial Design
Aantal experimenten en factoren nemen toe
1 of meerdere factoren worden toegevoegd zonder dat er extra
experimenten worden uitgevoerd.
Fractie, 1x halveren = ½, 2x halveren = ¼, etc. 1/2 p. 2k-p.
Coded en Uncoded formules
, Gemiddelde effect
Pseudo Error
Lenths PSE
Normale verdeling rondom 0 = niet significant
Onafhankelijke variabele
Onafhankelijk van andere variabelen, x-as
Afhankelijke variabelen
Afhankelijk van onafhankelijke variabelen, y-as
Durbin Watson Test
Is er een random verdeling of niet?
DW = 2 -> Geen autocorrelatie, random verdeeld
DW < 2 -> Positieve autocorrelatie, underfitting
DW > 3 -> Negatieve autocorrelatie, overfitting
PRESS
Predicted Residual Error of Sum of Squares
Er doet steeds een punt niet mee
Het verschil tussen yber en ymeting in het kwadraat
Overfitting, underfitting en beste fit
Overfitting: R2 is goed, R2pred is klein.
Underfitting: Allebei zijn slecht