Geschreven door studenten die geslaagd zijn Direct beschikbaar na je betaling Online lezen of als PDF Verkeerd document? Gratis ruilen 4,6 TrustPilot
logo-home
College aantekeningen

Begrippen van alle colleges - Tekstanalyse (822127-B-6)

Beoordeling
-
Verkocht
-
Pagina's
6
Geüpload op
12-11-2023
Geschreven in
2021/2022

Begrippen tabel van alle colleges Tekstanalyse (van college 1 t/m 9)

Instelling
Vak

Voorbeeld van de inhoud

Hoorcollege 9
CAREC/CARES Crowdsourced Algorithm of Reading
Comprehension / Speech
Coh-metrix levels - Surface level
- Textbase
- Situatiemodel
Surface level Zijn de woorden bekend en de zinnen niet te
ingewikkeld?
Tekstbase Sluiten de zinnen op elkaar aan, referentieel en
lexicaal?
Situatiemodel Wat voor situatie wordt er beschreven?
Temporele cohesie Zijn opeenvolgende hoofdwerkwoorden gelijk
qua tijd (tt, vt) en aspect (voltooid, onvoltooid)?
Hoge repetitiescore Indicatief voor consistentie
Lage repetitiescore Er zijn veel shifts
Intentionaliteit De handelingen van personen in dienst van het
bereiken van doelen
Intentionele partikels In order to, so that
Causaliteit Oorzaak-gevolgmechanismen in de wereld die
buiten deze doelen staan
Causale partikels Because, therefore
Lemmata Aantal tot woordenboekvorm hereleide types
N-gram Een venster dat je over de tekst heen schuift,
waarbij n correspondeert met de grootte van het
venster in aantal woorden
Beperkingen van het corpus - Alleen taal uit boeken
- Boeken worden niet gewogen naar hoe
wijd ze verspreid zijn en hoeveel ze
gelezen worden
- Niet geactualiseerd
- N-grams tot n = 5

College 8
Leesbaarheidsformule Flesch-Kincaid grade Zinslengte en woordlengte
level 0,39 (totaal woorden / totaal zinnen) + 11,8
(totaal lettergrepen / totaal woorden) – 11,59
Product tekstbegrip Kan de lezer een volledige en coherente mentale
representatie van de tekst maken?
Proces tekstbegrip Hoeveel moeite moet de lezer hiervoor doen?
Tekortkomingen leesbaarheidsformules - Predictoren zijn niet causaal relevant
- Zinslengte vs zinscomplexiteit
- Afhankelijkheidslengte zou beter zijn
- Je kunt de zinnen door elkaar husselen
zonder dat de leesbaarheidsscore
verandert.
- Negeert variatie binnen de tekst
- Voorkennis en vaardigheid lezer worden
genegeerd.
- Nader onderzoek is nodig om
moeilijkheid voor individuele lezers te
kunnen voorspellen.
Gebruikte kenmerken voor 1. Woordmoeilijkheid
leesbaarheidsanalyse in T-scan 2. Zinscomplexiteit
3. Informatiedichtheid

, 4. Coherentie
5. Concreetheid
6. Persoonlijkheid
Soorten maten om kenmerken te meten 1. Dichtheid (kenmerk X : vast aantal
woorden)
2. Porportie (aandeel)
3. Ratio (kenmerk X : kenmerk Y)
Type-Token Ratio Type = aantal unieke woorden
Token = totaal aantal woorden
Hoe hoger de TTR, hoe meer unieke woorden
op het totaal
Measure of Textual Lexical Diversity Lengte-ongevoelig alternatief voor TTR
Lemmatisering Alle verbuigingen/vervoegingen van een woord
aan dezelfde vorm toegewezen
(woordboekvorm)
Conclusie leesbaarheidsvoorspelling Toewijzen teksten aan algemene doelgroep kan
vrij goed, maar bepaling moeilijkheid voor
individuele lezer is lastiger.

College 7
Praktisch nut van computationele lexicale - Diverse NLP toepassingen gebruiken
analyse semantische relaties tussen woorden in
een tekst
- Automatisch samenvatten
- Automatische correctie van typefouten
Relatedness Dit omvat meronymie (= huis – verdieping).
Maar ook functionele associatie (regen – plas)
Similarity Special case of semantic relatedness
Distance De inverse van relatedness.
Wordnet Gebouwd op woordbetekenissen. Gelabelde
semantische relaties tussen woordbetekenissen,
meer dan alleen synoniemen.
Meest frequente relatie in naamwoorden Hyponymie/hyperonomie/meronymie
(WordNet)
Meest frequente relaties in werkwoorden Troponymie (= steeds specifiekere manieren om
(WordNet) een handeling te beschrijven)
Synset Synonym set (bijv. alle betekenissen van coffee)
Path-based similarity Concepten zijn meer gelijkend als ze dichterbij
elkaar in de hiërarchie zitten, gemeten met het
aantal stappen om van concept A naar concept B
te komen.
Padlengte Gelijk aan het aantal stappen dat je nodig hebt
om van het ene concept naar het andere concept
te gaan.
Probelemen met path-based similarity Elke stap weegt even zwaar, en dat is
problematisch want hoger in de hiërarchie zijn
de stappen intuïtief hoger en abstracter.
Normalized Path Length Houdt rekening met de maximale diepte van de
hiërarchie
Conceptual similarity Houdt rekening met het niveau binnen de
hiërarchie (gezien vanuit de most specific
common subsumer)
Information based approach Gedeelde informatiewaarde tussen twee
concepten is de informatiewaarde van de most

Geschreven voor

Instelling
Studie
Vak

Documentinformatie

Geüpload op
12 november 2023
Aantal pagina's
6
Geschreven in
2021/2022
Type
College aantekeningen
Docent(en)
Leonoor oversteegen
Bevat
Alle colleges

Onderwerpen

$6.80
Krijg toegang tot het volledige document:

Verkeerd document? Gratis ruilen Binnen 14 dagen na aankoop en voor het downloaden kun je een ander document kiezen. Je kunt het bedrag gewoon opnieuw besteden.
Geschreven door studenten die geslaagd zijn
Direct beschikbaar na je betaling
Online lezen of als PDF

Maak kennis met de verkoper
Seller avatar
nhackl
3.0
(1)

Maak kennis met de verkoper

Seller avatar
nhackl Tilburg University
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
3
Lid sinds
2 jaar
Aantal volgers
1
Documenten
15
Laatst verkocht
1 jaar geleden

3.0

1 beoordelingen

5
0
4
0
3
1
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Bezig met je bronvermelding?

Maak nauwkeurige citaten in APA, MLA en Harvard met onze gratis bronnengenerator.

Bezig met je bronvermelding?

Veelgestelde vragen