Geschreven door studenten die geslaagd zijn Direct beschikbaar na je betaling Online lezen of als PDF Verkeerd document? Gratis ruilen 4,6 TrustPilot
logo-home
Tentamen (uitwerkingen)

CS7643 Exam Study Guide – Reinforcement Learning & Deep Learning with 50 questions and answers

Beoordeling
-
Verkocht
-
Pagina's
14
Cijfer
A
Geüpload op
17-02-2026
Geschreven in
2025/2026

This CS7643 Exam Study Guide provides 50 essential questions and answers covering advanced topics in reinforcement learning and deep learning. It is designed to help students quickly grasp theoretical foundations and practical algorithms for exam success. Key topics include: Reinforcement Learning fundamentals: evaluative feedback, sequential decisions, delayed rewards, and challenges. Markov Decision Processes (MDPs), value iteration, and policy iteration. Deep Q-Learning, fitted Q-iteration, and experience replay. Policy gradient methods: REINFORCE, Actor-Critic, Advantage Actor-Critic. Semi-supervised, self-supervised, and few-shot learning approaches. Meta-learning strategies: MatchingNet, ProtoNet, RelationNet, MAML, and LSTM-based learners. Surrogate tasks, contrastive loss, instance discrimination, and deep clustering. Advanced techniques: momentum encoder, memory bank, and complexity analysis of MDP algorithms. This guide is perfect for CS7643 students preparing for exams, offering concise explanations, equations, and algorithm breakdowns to strengthen both understanding and application.

Meer zien Lees minder
Instelling
Vak

Voorbeeld van de inhoud

CS7643 EXAM STUDY GUIDE


1. Reinforcement learning

Answer Sequential decision making in an environment with evaluative feedback

Environment: may be unknown, non-linear, stochastic and complex
Agent: learns a policy to map states of the environments to actions
- seeks to maximize long-term reward



2. RL
Answer Evaluative Feedback: - Pick an action, receive a reward
- No supervision for what the correct action is or would have been (unlike supervised
learning)



3. RL: Sequential Decisions
Answer - Plan and execution actions over a sequence of states
- Reward may be delayed, requiring optimization of future rewards (long-term planning)



4.Signature Challenges in RL

Answer Evaluative Feedback: Need trial and error to find the right action

Delayed Feedback: Actions may not lead to immediate reward

Non-stationarity: Data distribution of visited states changes when the policy changes

Fleeting Nature: of online data (may only see data once)




, CS7643 EXAM STUDY GUIDE


5.MDP
Answer Framework underlying RL
S: Set of states
A: Set of actions
R: Distribution of
Rewards T:
Transition
probabiliity y:
Discount property

Markov Property: Current state completely characterizes state of the environment



6.RL
Answer Equations relating optimal quantities: 1. V*(S) = max_a(Q*(s, a)
2. PI*(s) = argmax_a(Q*(s, a)



7.V*(S)
Answer max_a (sum_(s') { p(s'|s, a) [r(s, a) + yV*(s')] } )



8.Q*(s,a)
Answer sum_(s') { p(s'|s, a) [r(s, a) + y*max_(a'){Q*(s', a') ] }



9.Value Iteration
Answer v_(i+1) = max_a (sum_(s') { p(s'|s, a) [r(s, a) + yV_(i)(s')] } ) - repeat until
convergence
- Time complexity per iteration O(|S^2| |A|)

Geschreven voor

Vak

Documentinformatie

Geüpload op
17 februari 2026
Aantal pagina's
14
Geschreven in
2025/2026
Type
Tentamen (uitwerkingen)
Bevat
Vragen en antwoorden

Onderwerpen

$9.99
Krijg toegang tot het volledige document:

Verkeerd document? Gratis ruilen Binnen 14 dagen na aankoop en voor het downloaden kun je een ander document kiezen. Je kunt het bedrag gewoon opnieuw besteden.
Geschreven door studenten die geslaagd zijn
Direct beschikbaar na je betaling
Online lezen of als PDF

Maak kennis met de verkoper
Seller avatar
EliteExamVault

Maak kennis met de verkoper

Seller avatar
EliteExamVault Massachusetts Institute Of Technology
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
4
Lid sinds
8 maanden
Aantal volgers
1
Documenten
95
Laatst verkocht
5 maanden geleden
Elite Exam Vault

Welcome to my study guide empire where strategy meets clarity. I curate tiered, printable resources designed for learners, coaches, and creators across disciplines. Whether you're prepping for exams, building your own toolkit, or seeking emotional resonance in your workflow, my bundles are structured to help you win. Every product is crafted with mastery, impact, and conversion in mind. Let’s stack victories one guide at a time.

0.0

0 beoordelingen

5
0
4
0
3
0
2
0
1
0

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Bezig met je bronvermelding?

Maak nauwkeurige citaten in APA, MLA en Harvard met onze gratis bronnengenerator.

Bezig met je bronvermelding?

Veelgestelde vragen