Samenvatting

Taal en Technologie (samenvatting boek Taaltechnologie Ontrafeld, hoorcollege aantekeningen, werkcollege vragen)

Beoordeling

Verkocht

Pagina's

Geüpload op

18-01-2026

Geschreven in

2024/2025

Bevat een volledige samenvatting van het boek Taaltechnologie Ontrafeld, de hoorcollege aantekeningen en oefenvragen uit de werkcolleges van het vak Taal en Technologie uit het eerste jaar van Communicatie- en informatiewetenschappen (CIW).

Meer zien Lees minder

Instelling

Vak

Voorbeeld van de inhoud

Taal en Technologie (samenvatting boek
Taaltechnologie ontrafeld, hoorcollege
aantekeningen, werkcollege vragen)
Inhoud
Taal en Technologie (samenvatting boek Taaltechnologie ontrafeld, hoorcollege
aantekeningen, werkcollege vragen)......................................................................1
Taaltechnologie ontrafeld (Cynthia van Hee & Veronique Hoste)........................2
Deel 1............................................................................................................... 2
Deel 2............................................................................................................... 5
Deel 3............................................................................................................... 7
Hoorcolleges........................................................................................................ 8
Week 1............................................................................................................. 8
Week 2............................................................................................................. 9
Week 3........................................................................................................... 10
Week 4........................................................................................................... 12
Week 5........................................................................................................... 13
Week 6........................................................................................................... 14
Werkcolleges..................................................................................................... 15
Algemene aantekeningen:............................................................................. 15
Vragen over hoofdstukken en artikelen:.........................................................16

1

,Taaltechnologie ontrafeld (Cynthia van Hee & Veronique
Hoste)
Deel 1
Hoofdstuk 1.1
Natuurlijketaalverwerking= technologie aanwenden om taal te analyseren of
te genereren.
4 deelprocessen van natuurlijketaalverwerking:
- Spraakherkenning
- Tekstinterpretatie
- Tekstgeneratie
- Spraaksynthese
Automatische systemen of toepassingen die binnen het onderzoeksdomein van
natuurlijketaalverwerking ontwikkeld worden, noemen we NLP-systemen.
Machinelearning= NLP-systemen die ontstaan door het trainen van een
algoritme met behulp van een dataset.

Hoofdstuk 1.2
Ambiguïteit= dubbelzinnigheid van woorden, dus wei/wij of licht/ligt of bank.
Bij tekstinterpretatie kan ambiguïteit op verschillende niveaus voorkomen:
- Morfologisch niveau (het woord massagebed kan bidden met een grote
groep betekenen of het bed van een massage. Het opsplitsen van de
morfemen massa, gebed of massage en bed kan de dubbelzinnigheid
oplossen)
- Syntactisch niveau (de politie verwondde de man met het pistool 
heeft de politie een pistool gebruikt om de man te verwonden of heeft de
politie een man verwond die een pistool vast had?)
- Semantisch niveau (muis kan een computermuis zijn of het dier. De
context of omliggende woorden kunnen de dubbelzinnigheid oplossen)
- Discours niveau (marie nodigde eva uit. Ze had een witte broek aan. 
wie van de twee had de witte broek aan?)
Deze niveaus vormen samen het watervalmodel. Hiermee kan een tekst op
verschillende niveaus onder de loep genomen worden, zodat we
taaltechnologische systemen kunnen ontwikkelen die onze taal correct
interpreteren.
Voorafgaand aan deze stappen moet zinssplitsing en tokenisering gebeuren. Elk
woord en leesteken is een los token.
Morfologisch:
Bij morfologie gaat het om welke vormen woorden kunnen aannemen
(enkelvoud/meervoud, vervoegingen, vergrotingen etc). Bij part-of-speech
tagging (PoS-tagger) wordt bij elk token ook een woordsoort toegekend. Bij
lemmatisering worden woorden herleid tot hun basisvorm.

2

, Syntactisch:
Bij parsing worden functies aan bepaalde zinsdelen of tokens toegekend.
Hierdoor ontstaat een syntactische-analyseboom.
Semantisch:
De distributionele hypothese stelt dat de betekenis van woorden bepaald
wordt door de context of de omringende woorden in de zin.
Polysemie= de verschillende betekenissen van een woord zijn verwant
Homoniem= de verschillende betekenissen van een woord zijn niet
verwant.
Er zijn twee taaltechnologische toepassingen om de juiste betekenis van
woorden in een zin te bepalen: WSD (automatische desambiguering) en
NER (automatisch herkennen van eigennamen).
Discours:
Coreferentie= meerdere woorden of woordgroepen verwijzen naar
hetzelfde.
Pragmatiek bestudeert de relatie tussen taaluitdrukkingen en de context of
situaties waarin ze passen. De zin “het is warm hier” is volgens de
pragmatiek dubbelzinnig, omdat het kan betekenen dat de spreker wil
meedelen dat die het warm heeft, of dat die wilt dat iemand het raam
opent. De betekenis van de zin hangt dus af van de context.

Hoofdstuk 1.3
Een computer kan taal op 2 manieren leren:
Regelgebaseerd: experts stellen regels op waarmee de computer leert
(top-down/deductief)
Datagebaseerd: computer extraheert de kennis die nodig is uit data
(bottom-up/inductief)  machinelearning
Machinelearning is een techniek om software zich autonoom te laten
verbeteren door het analyseren en herkennen van patronen in data. 4 belangrijke
componenten:
- Data
- Taak
- Leerproces
- Evaluatie
Garbage in, garbage out: automatische systemen kunnen enkel waardevolle
output leveren als de input die ze kregen kwaliteitsvol en relevant is.
Een voorbeeld van crowdsourcing is Wikipedia, maar dit wordt ook gebruikt in
onderzoekscontexten, dan heet het echter citizen science. Vaak hebben deze
onderzoeksprojecten 2 doelen: enerzijds data verzamelen, anderzijds wetenschap
dichterbij de maatschappij brengen.

3

Meld schending auteursrecht

Gekoppeld boek

Veronique Hoste, Cynthia Van Hee Taaltechnologie ontrafeld

Uitgave:13 mei 2024
ISBN:9789463106221
Druk:1

Geschreven voor

Instelling: Universiteit Utrecht (UU)
Studie: Communicatie- en informatiewetenschappen
Vak: Taal en technologie (CI2V24001)

Alle documenten voor dit vak (7)

Documentinformatie

Heel boek samengevat?: Ja
Geüpload op: 18 januari 2026
Aantal pagina's: 23
Geschreven in: 2024/2025
Type: SAMENVATTING

Onderwerpen

€8,66

Krijg toegang tot het volledige document:

Geschreven door studenten die geslaagd zijn

Direct beschikbaar na je betaling

Online lezen of als PDF

Maak kennis met de verkoper

sdebos

5,0

(1)

Maak kennis met de verkoper

sdebos Universiteit Utrecht

Bekijk profiel

Volgen

Verkocht

Lid sinds

4 maanden

Aantal volgers

Documenten

Laatst verkocht

1 week geleden

5,0

1 beoordelingen

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper sdebos. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €8,66. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews) Afgelopen 30 dagen zijn er 53790 samenvattingen verkocht Opgericht in 2010, al 16 jaar dé plek om samenvattingen te kopen

Taal en Technologie (samenvatting boek Taaltechnologie Ontrafeld, hoorcollege aantekeningen, werkcollege vragen)

Voorbeeld van de inhoud

Gekoppeld boek

Geschreven voor

Documentinformatie

Onderwerpen

Meer vakken binnen Universiteit Utrecht (UU) > Communicatie- en informatiewetenschappen

Maak kennis met de verkoper

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Niet tevreden? Kies een ander document

Betaal zoals je wilt, start meteen met leren

Bezig met je bronvermelding?

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Tevredenheidsgarantie: hoe werkt dat?

Van wie koop ik deze samenvatting?

Zit ik meteen vast aan een abonnement?

Is Stuvia te vertrouwen?