Geschreven door studenten die geslaagd zijn Direct beschikbaar na je betaling Online lezen of als PDF Verkeerd document? Gratis ruilen 4,6 TrustPilot
logo-home
Samenvatting

Summary - Interactive Data Transformation (IDT - Master Information Management

Beoordeling
-
Verkocht
1
Pagina's
33
Geüpload op
09-11-2023
Geschreven in
2021/2022

This summary contains notes from all lectures. Passed my exam thanks to this summary.

Voorbeeld van de inhoud

Summary - Interactive Data
Transformation - Master Information
Management
Sven van Alem

, Table of contents
1. Lecture 1: DBMS & Relational & SQL............................................................................................... 3
1.1 Database Management Systems ............................................................................................. 3
1.2 Relational Data Model ............................................................................................................. 4
1.3 Single table queries using SQL ................................................................................................. 5
2. Lecture 2: Entity Relationship, and translating from natural .......................................................... 6
2.1 Entity-Relationship Model ....................................................................................................... 6
2.2 Business concepts.................................................................................................................... 6
2.3 Relationships, degrees, and cardinalities ................................................................................ 8
2.4 Generalization and Specialization ........................................................................................... 9
3. Lecture 3: Translating ERD to DB schema & Database Normalization .......................................... 11
3.1 Relational schema ................................................................................................................. 11
3.2 Transforming ERD to Relational schema ............................................................................... 11
3.3 Data Normalization ............................................................................................................... 14
4. Lecture 4: Evolution of data management, big data, and data intensive systems ....................... 16
4.1 Evolution of Data management ............................................................................................ 16
4.2 Big Data Analytics .................................................................................................................. 16
4.3 Reasons for going beyond traditional RDBMS ...................................................................... 17
4.4 Big data .................................................................................................................................. 18
4.5 Storage layer (HDFS) .............................................................................................................. 19
4.6 Computation layer (MapReduce) .......................................................................................... 20
5. Lecture 5: The Spark ecosystem, RDDs, Programming model, and PySpark ................................ 23
5.1 Data flow models................................................................................................................... 23
5.2 Lambda expressions: preliminary material ........................................................................... 23
5.3 Apache spark architecture .................................................................................................... 24
5.4 The programming model: why spark?................................................................................... 25
Lecture 6: Data transformations with SQL, entity recognition, data cleaning tools, etc. ..................... 28
6.1 Processing multiple tables ..................................................................................................... 28
6.2 Views ..................................................................................................................................... 29
6.3 Functions ............................................................................................................................... 29
6.4 Creating & Populating ........................................................................................................... 30
6.5 Data from Websites, Integration & Cleaning, Entity Extraction & resolution....................... 31




2

Documentinformatie

Geüpload op
9 november 2023
Aantal pagina's
33
Geschreven in
2021/2022
Type
SAMENVATTING

Onderwerpen

€6,48
Krijg toegang tot het volledige document:

Verkeerd document? Gratis ruilen Binnen 14 dagen na aankoop en voor het downloaden kun je een ander document kiezen. Je kunt het bedrag gewoon opnieuw besteden.
Geschreven door studenten die geslaagd zijn
Direct beschikbaar na je betaling
Online lezen of als PDF

Maak kennis met de verkoper
Seller avatar
svenvanalem

Maak kennis met de verkoper

Seller avatar
svenvanalem Tilburg University
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
8
Lid sinds
2 jaar
Aantal volgers
6
Documenten
9
Laatst verkocht
1 jaar geleden

0,0

0 beoordelingen

5
0
4
0
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Bezig met je bronvermelding?

Maak nauwkeurige citaten in APA, MLA en Harvard met onze gratis bronnengenerator.

Bezig met je bronvermelding?

Veelgestelde vragen