Tentamen (uitwerkingen)

CS7643 Exam Study Guide – Reinforcement Learning & Deep Learning with 50 questions and answers

Beoordeling

Verkocht

Pagina's

Cijfer

Geüpload op

17-02-2026

Geschreven in

2025/2026

This CS7643 Exam Study Guide provides 50 essential questions and answers covering advanced topics in reinforcement learning and deep learning. It is designed to help students quickly grasp theoretical foundations and practical algorithms for exam success. Key topics include: Reinforcement Learning fundamentals: evaluative feedback, sequential decisions, delayed rewards, and challenges. Markov Decision Processes (MDPs), value iteration, and policy iteration. Deep Q-Learning, fitted Q-iteration, and experience replay. Policy gradient methods: REINFORCE, Actor-Critic, Advantage Actor-Critic. Semi-supervised, self-supervised, and few-shot learning approaches. Meta-learning strategies: MatchingNet, ProtoNet, RelationNet, MAML, and LSTM-based learners. Surrogate tasks, contrastive loss, instance discrimination, and deep clustering. Advanced techniques: momentum encoder, memory bank, and complexity analysis of MDP algorithms. This guide is perfect for CS7643 students preparing for exams, offering concise explanations, equations, and algorithm breakdowns to strengthen both understanding and application.

Meer zien Lees minder

Instelling

Vak

Voorbeeld van de inhoud

CS7643 EXAM STUDY GUIDE

1. Reinforcement learning

Answer Sequential decision making in an environment with evaluative feedback

Environment: may be unknown, non-linear, stochastic and complex
Agent: learns a policy to map states of the environments to actions
- seeks to maximize long-term reward

2. RL
Answer Evaluative Feedback: - Pick an action, receive a reward
- No supervision for what the correct action is or would have been (unlike supervised
learning)

3. RL: Sequential Decisions
Answer - Plan and execution actions over a sequence of states
- Reward may be delayed, requiring optimization of future rewards (long-term planning)

4.Signature Challenges in RL

Answer Evaluative Feedback: Need trial and error to find the right action

Delayed Feedback: Actions may not lead to immediate reward

Non-stationarity: Data distribution of visited states changes when the policy changes

Fleeting Nature: of online data (may only see data once)

, CS7643 EXAM STUDY GUIDE

5.MDP
Answer Framework underlying RL
S: Set of states
A: Set of actions
R: Distribution of
Rewards T:
Transition
probabiliity y:
Discount property

Markov Property: Current state completely characterizes state of the environment

6.RL
Answer Equations relating optimal quantities: 1. V*(S) = max_a(Q*(s, a)
2. PI*(s) = argmax_a(Q*(s, a)

7.V*(S)
Answer max_a (sum_(s') { p(s'|s, a) [r(s, a) + yV*(s')] } )

8.Q*(s,a)
Answer sum_(s') { p(s'|s, a) [r(s, a) + y*max_(a'){Q*(s', a') ] }

9.Value Iteration
Answer v_(i+1) = max_a (sum_(s') { p(s'|s, a) [r(s, a) + yV_(i)(s')] } ) - repeat until
convergence
- Time complexity per iteration O(|S^2| |A|)

Meld schending auteursrecht

Geschreven voor

Vak: CS7643

Alle documenten voor dit vak (140)

Documentinformatie

Geüpload op: 17 februari 2026
Aantal pagina's: 14
Geschreven in: 2025/2026
Type: Tentamen (uitwerkingen)
Bevat: Vragen en antwoorden

Onderwerpen

reinforcement learning rl
markov decision processes mdp
actor critic advantage actor critic
surrogate tasks contrastive learning
momentum encoder memory bank

$9.99

Krijg toegang tot het volledige document:

Geschreven door studenten die geslaagd zijn

Direct beschikbaar na je betaling

Online lezen of als PDF

Maak kennis met de verkoper

EliteExamVault

Maak kennis met de verkoper

EliteExamVault Massachusetts Institute Of Technology

Bekijk profiel

Volgen

Verkocht

Lid sinds

8 maanden

Aantal volgers

Documenten

Laatst verkocht

5 maanden geleden

Elite Exam Vault

Welcome to my study guide empire where strategy meets clarity. I curate tiered, printable resources designed for learners, coaches, and creators across disciplines. Whether you're prepping for exams, building your own toolkit, or seeking emotional resonance in your workflow, my bundles are structured to help you win. Every product is crafted with mastery, impact, and conversion in mind. Let’s stack victories one guide at a time.

0.0

0 beoordelingen

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper EliteExamVault. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor $9.99. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews) Afgelopen 30 dagen zijn er 48849 samenvattingen verkocht Opgericht in 2010, al 16 jaar dé plek om samenvattingen te kopen

CS7643 Exam Study Guide – Reinforcement Learning & Deep Learning with 50 questions and answers

Voorbeeld van de inhoud

Geschreven voor

Documentinformatie

Onderwerpen

Maak kennis met de verkoper

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Niet tevreden? Kies een ander document

Betaal zoals je wilt, start meteen met leren

Bezig met je bronvermelding?

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Tevredenheidsgarantie: hoe werkt dat?

Van wie koop ik deze samenvatting?

Zit ik meteen vast aan een abonnement?

Is Stuvia te vertrouwen?