This is an archived version of the Machine Learning Lab website for documentation purposes. The host is in no way affiliated with the University of Freiburg, its Faculty of Engineering or any of its members.
Spezialvorlesung (Special Lecture) KI (D)
Optimierendes Lernen (Reinforcement Learning)
Dr. M. Lauer, Jan Wülfing
- Ankündigungen:
- erste Vorlesung: 23.10.2013
- Übungen im Wechsel mit Vorlesung nach Ankündigung
- Vorlesungen/ Übungen
- Mittwoch, 10:00 - 11:30, Geb. 101 - SR 00-010/14
- Freitag, 10:00 - 11:30, Geb. 101 - SR 00-010/14
- Prüfung
- Mündliche Prüfung
- Prüfungen werden abgehalten in Geb. 79, Raum 0 09
- Kreditpunkte:
- 6 ECTS
- Sprache:
- Englisch
Überblick:
Die Vorlesung behandelt den Lerntypus des optimierenden Lernens (Reinforcement Learning). Beim optimierenden Lernen steht dem Lerner nur die Information über Erfolg oder Misserfolg zur Verfügung. Die Vorlesung bespricht Lösungsmethoden und Algorithmen zur Lösung dieser Aufgabenstellung auf der Grundlage Markov'scher Entscheidungsprobleme.
Folien:
- chapter 1 (introduction) PDF
- chapter 2 (MDPs and dynamic programming) PDF
- chapter 3+4 (value iteration) PDF
- chapter 5 (modeling the world with MDPs) PDF
- chapter 6 (TD-learning) PDF
- chapter 7 (optimistic policy iteration) PDF
- chapter 8 (trajectory based learning) PDF
- chapter 9 (Q-learning) PDF
- chapter 13 (multi agent learning) PDF
- chapter 10 (function approximators) PDF
- chapter 14 (RL with function approximators) PDF
- chapter 15 (Policy gradient approaches) PDF
- chapter 16 (wrap-up) PDF