Geschreven door studenten die geslaagd zijn Direct beschikbaar na je betaling Online lezen of als PDF Verkeerd document? Gratis ruilen 4,6 TrustPilot
logo-home
Tentamen (uitwerkingen)

Answers Exam questions Data Engineering

Beoordeling
-
Verkocht
6
Pagina's
65
Cijfer
8-9
Geüpload op
08-06-2023
Geschreven in
2022/2023

Answers Exam questions Data Engineering

Instelling
Vak

Voorbeeld van de inhoud

Exam Questions Data Engineering
Exam Questions Data Engineering 1

Introduction and file formats 2

Computer architecture and operating systems 12

Networks 16

Regular expressions exercises 19

Cloud services 20

Linux 26

Algorithms 28

Data structures 32

Algorithm and datastructure exercises 37

Relational databases 39

Sql exercises 44

Data warehousing 45

Nosql 47

Visualization 50

Parallel and distributed computing 53

Map-Reduce 59

Map-Reduce exercises 61

Recommender systems 61




1

,Introduction and file formats
How are integer, decimal numbers, text and images stored in a computer? Give an
example of binary encoding for each type.

Computers works with bits or boolean values (0/1).

1) For integers:
First bit for the sign: 1 is negative, 0 is
positive. N bits for representing a number
between 0 and 2N -1.

2) For Decimal:
We get rid of the decimal point and store 2 integers: the exponent and
mantissa (Like scientific notation).




For example, the decimal number 3.14 can be encoded in binary as per the
IEEE 754 standard, resulting in a binary representation like
01000000010010001111010111000011.

3) For Text:
= Sequence of characters or string
Each character is encoded using a single byte using an encoding table.
Example: “Len” = [76, 101, 110] or 3 bytes. Check ASCII table for codes.
For example, the ASCII encoding of the letter 'A' is 65, which in binary is
01000001

4) For Images:
- Matrix of pixels.
- Each pixel represented by 3 numbers between 0 and 255 for red, green and
blue intensity.
- Thus: 4K image = 3840 x 2160 x 3 bytes = 2.4 MB
For example, the RGB encoding of a pixel with red = 255, green = 0, and
blue = 127 would be represented in binary as 11111111 00000000
01111111




2

,What is encoding and decoding? Explain and give an example.

1. Encoding (In-memory to On-file), serialization: Encoding is the process of converting
data from its in-memory representation into a format suitable for storage in files or
other persistent storage.
2. Decoding (On-file to In-memory) deserialization: Decoding is the reverse process of
encoding. It involves reading data from files or other persistent storage and
reconstructing the original in-memory data structures or objects.

It involves parsing or interpreting the stored data, extracting relevant information, and
reconstructing the appropriate data structures or objects.

During decoding, the stored data is read from the file and processed according to the
encoding scheme used.

We saw three different data models for representing data. Name and provide a short
summary of each data model.
The relational model:
- Consists of tables and rows (or tuples /records)
- Each column contains primitive value such as string, integer, float or date
- Two types of tables:
o Entities, i.e. Persons, groups, objects
o Relations between entities: i.e. Part-of, has-a, has-many, linked-to
o Each table can be saved as Comma-Seperated-Values (or CSV) file

Strengths Weaknesses

Structured Static and less flexible schema

Schema checking Joins = necessary evil (they are
complex)

Natural model

Flexible queries




3

, The document-oriented model:
- Consists of keys and documents, that is, each key is associated with one document
- Document is a tree containing:
o Primitive values
o Nested entities
o One-to-many relations
- Each document can be stored (and transferred) in JSON or XML

Strengths Weaknesses

Flexible No static schema checking

Natural model when data is tree- Less flexible queries: Document
structured with few intra structure reflects common
document relations operations
(E.g. text documents (with
chapters, sections paragraphs…))

Performance is good since no
joins

The graph-oriented model: Consists of nodes and edges
- A node is an instance of an entity and has a unique ID
- An edge is a relation between two nodes and has a unique ID
- A node and edge have named properties with a primitive value

Strengths Weaknesses

Flexible: schema easily changed No static schema checking

Natural model: social or Used less in industry (academic
geographic networks model)

Variable number of joins Used in domains where
everything is connected through
everything




4

Gekoppeld boek

Geschreven voor

Instelling
Studie
Vak

Documentinformatie

Geüpload op
8 juni 2023
Bestand laatst geupdate op
12 juni 2023
Aantal pagina's
65
Geschreven in
2022/2023
Type
Tentamen (uitwerkingen)
Bevat
Vragen en antwoorden

Onderwerpen

€7,99
Krijg toegang tot het volledige document:

Verkeerd document? Gratis ruilen Binnen 14 dagen na aankoop en voor het downloaden kun je een ander document kiezen. Je kunt het bedrag gewoon opnieuw besteden.
Geschreven door studenten die geslaagd zijn
Direct beschikbaar na je betaling
Online lezen of als PDF

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
PVE1 Universiteit Antwerpen
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
21
Lid sinds
5 jaar
Aantal volgers
16
Documenten
5
Laatst verkocht
1 jaar geleden

5,0

1 beoordelingen

5
1
4
0
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Bezig met je bronvermelding?

Maak nauwkeurige citaten in APA, MLA en Harvard met onze gratis bronnengenerator.

Bezig met je bronvermelding?

Veelgestelde vragen