Written by students who passed Immediately available after payment Read online or as PDF Wrong document? Swap it for free 4.6 TrustPilot
logo-home
Summary

Data Mining and its Applications summary - GRADE - 8,5

Rating
-
Sold
-
Pages
50
Uploaded on
26-06-2025
Written in
2024/2025

Summary for the Data Mining and its Applications open book exam, contains all the LATEST material. 8.5 achieved with this summary! Week 1 in Dutch, the rest in English

Institution
Course

Content preview

Data Mining and its Applications
Samenvatting open boek tentamen blok 2.b

Week 1- Introduction to data mining

Lecture
1. Wat is Data Mining?
Definitie:
Data Mining is het proces waarbij je uit grote, vaak heterogene datasets interessante patronen
of inzichten haalt door middel van statistiek, machine learning of AI-technieken.
●​ NIST: analyseren van grote datasets om patronen te ontdekken die leiden tot kennis.
●​ ISO: patroonherkenning in kwantitatieve data door analyse vanuit meerdere
perspectieven.​

Kenmerken:
●​ Werkt met grote volumes data
●​ Data vaak verzameld voor andere doeleinden
●​ Richt zich op het vinden van bruikbare kennis, bijv. in de commerciële,
maatschappelijke of wetenschappelijke context
●​ Maakt gebruik van machine learning, statistiek en rekenkracht

2. Data Mining & AI
Data mining maakt vaak deel uit van of maakt gebruik van:
Term Omschrijving

AI Simuleren van menselijke intelligentie

ML Algoritmen leren uit data zonder expliciete
programmering

Deep Learning Neurale netwerken herkennen complexe patronen

LLM (Large Language Models) AI-modellen zoals ChatGPT die tekst begrijpen/genereren


Toepassingen: aanbevelingssystemen, beeldherkenning, automatische tekstgeneratie,
fraudedetectie, voorspellingen.

,4. Het Data Mining Proces (CRISP-DM)
CRISP-DM fasen:
1.​ Inception/discovery​
Doelstelling bepalen, context schetsen, eerste hypothese formuleren
2.​ Data preparation​
Data extraheren, transformeren, semantisch begrijpen
3.​ Model planning​
Selectie van technieken, bepalen van procesflow
4.​ Model building​
Trainen, testen en valideren van modellen
5.​ Resultaatcommunicatie​
Presentatie en evaluatie bij stakeholders
6.​ Operationalisatie​
Pilot, implementatie, en eventueel continu gebruik

Alternatief projectmodel (volgens college):
1.​ Inception
2.​ Understanding
3.​ Prepare
4.​ Model
5.​ Evaluate
6.​ Operationalize

5. Betrokken stakeholders
Rol Verantwoordelijkheden

Business user Domeinkennis, doelbepaling, interpretatie

Project sponsor ROI, strategische doelen

Project manager Tijd, scope, kwaliteit, budget

BI-analist KPI’s, dashboards, brugfunctie

Data admin/integrator Toegang, security, dataflow

Data Modellering, analyse,
scientist/engineer methodeverantwoording
→ Goed samenspel tussen deze rollen voorkomt communicatieproblemen of mismatch in
verwachtingen.

,6. Type problemen in Data Mining
Type Voorbeelden

Clustering / Welke klantgroepen bestaan er?
Segmentatie

Classificatie Gaat iemand reageren? Is iemand
kredietwaardig?

Regressie Hoe verandert een koers of prijs over tijd?

Generatie (GenAI) Scenario's of visualisaties genereren o.b.v. input


7. Exploratory Data Analysis (EDA)
Doel:
●​ Vertrouwen krijgen in de data
●​ Inzichten in verdelingen, verbanden en datakwaliteit
●​ Valideren van aannames over representativiteit en relevantie
●​
Attribuutanalyse:
●​ Nominaal: labels (man/vrouw, producttype)
●​ Ordinaal: gesorteerde categorieën (BSc < MSc < PhD)
●​ Numeriek:
○​ Discreet: hele getallen (aantal kinderen)
○​ Continu: kommagetallen (lengte, gewicht)
○​ Schaaltypes: interval (datum), ratio (afstand), absoluut (telling)

Visualisatieprincipes (college)
Bij datavisualisatie draait het om begrijpelijkheid:
●​ Simplicity: toon alleen wat nodig is.
●​ Focus: leg nadruk op relevante info.
●​ Contrast: gebruik kleur en vorm verstandig.
●​ Storytelling: breng een boodschap over, niet alleen een beeld.
Visualisatietypen:
●​ 1D: histogram, barplot
●​ 2D: scatterplot, heatmap
●​ 3D: scatterplot matrix, parallel coordinates

, Hoofdstuk 1 - inleiding
1.1 Motivatie: Waarom data science?
●​ Door technologische vooruitgang kunnen we enorme hoeveelheden gegevens
verzamelen en opslaan.
●​ Gegevens ≠ kennis: patronen blijven vaak verborgen in ruwe data.
●​ Belangrijk doel: gegevens omzetten in kennis → inzichten en voorspellingen.
●​ “We verdrinken in informatie, maar hongeren naar kennis.” – John Naisbett​

1.1.1 Gegevens vs. Kennis
Gegevens (data) Kennis (knowledge)

Gaat over individuele Gaat over algemene
gevallen regels/wetten

Makkelijk te verzamelen Moeilijk te vinden

Laat geen voorspellingen Maakt voorspellingen
toe mogelijk


Goede kennis voldoet aan:
●​ Correctheid
●​ Algemeenheid
●​ Bruikbaarheid
●​ Begrijpelijkheid
●​ Nieuwheid​

1.1.2 Kepler vs. Brahe – een historisch voorbeeld
●​ Tycho Brahe verzamelde nauwkeurige astronomische data.
●​ Johannes Kepler ontdekte uit die data de wetten van planeetbeweging.
●​ Illustratie van: data ≠ kennis, analyse vereist modellen, interpretatie en intuïtie.​

1.1.3 Intelligente gegevens wetenschap
●​ Statistiek is slechts een deel van data science.
●​ Twee soorten studies:
○​ Experimenteel: data-generatie wordt gestuurd.
○​ Observationeel: data wordt enkel waargenomen.
●​ Veel data science technieken zijn verkennend (hypothese-genererend), niet altijd
hypothese-toetsend.​

Written for

Institution
Study
Course

Document information

Uploaded on
June 26, 2025
Number of pages
50
Written in
2024/2025
Type
SUMMARY

Subjects

$9.17
Get access to the full document:

Wrong document? Swap it for free Within 14 days of purchase and before downloading, you can choose a different document. You can simply spend the amount again.
Written by students who passed
Immediately available after payment
Read online or as PDF

Get to know the seller
Seller avatar
sjmvriesde

Get to know the seller

Seller avatar
sjmvriesde Rijksuniversiteit Groningen
Follow You need to be logged in order to follow users or courses
Sold
1
Member since
1 year
Number of followers
0
Documents
2
Last sold
4 months ago

0.0

0 reviews

5
0
4
0
3
0
2
0
1
0

Recently viewed by you

Why students choose Stuvia

Created by fellow students, verified by reviews

Quality you can trust: written by students who passed their tests and reviewed by others who've used these notes.

Didn't get what you expected? Choose another document

No worries! You can instantly pick a different document that better fits what you're looking for.

Pay as you like, start learning right away

No subscription, no commitments. Pay the way you're used to via credit card and download your PDF document instantly.

Student with book image

“Bought, downloaded, and aced it. It really can be that simple.”

Alisha Student

Working on your references?

Create accurate citations in APA, MLA and Harvard with our free citation generator.

Working on your references?

Frequently asked questions