This is an archived version of the Machine Learning Lab website for documentation purposes. The host is in no way affiliated with the University of Freiburg, its Faculty of Engineering or any of its members.

Spezialvorlesung (Special Lecture) KI (D)

Optimierendes Lernen (Reinforcement Learning)
Dr. M. Lauer, Jan Wülfing

Eintrag im Vorlesungsverzeichnis (Vorlesung/Übung)
Ankündigungen:
- erste Vorlesung: 23.10.2013
- Übungen im Wechsel mit Vorlesung nach Ankündigung

Vorlesungen/ Übungen
- Mittwoch, 10:00 - 11:30, Geb. 101 - SR 00-010/14
- Freitag, 10:00 - 11:30, Geb. 101 - SR 00-010/14

Prüfung
- Mündliche Prüfung
- Prüfungen werden abgehalten in Geb. 79, Raum 0 09
Kreditpunkte:
- 6 ECTS
Sprache:
- Englisch

Überblick:

Die Vorlesung behandelt den Lerntypus des optimierenden Lernens (Reinforcement Learning). Beim optimierenden Lernen steht dem Lerner nur die Information über Erfolg oder Misserfolg zur Verfügung. Die Vorlesung bespricht Lösungsmethoden und Algorithmen zur Lösung dieser Aufgabenstellung auf der Grundlage Markov'scher Entscheidungsprobleme.

Folien:

chapter 1 (introduction) PDF
chapter 2 (MDPs and dynamic programming) PDF
chapter 3+4 (value iteration) PDF
chapter 5 (modeling the world with MDPs) PDF
chapter 6 (TD-learning) PDF
chapter 7 (optimistic policy iteration) PDF
chapter 8 (trajectory based learning) PDF
chapter 9 (Q-learning) PDF
chapter 13 (multi agent learning) PDF
chapter 10 (function approximators) PDF
chapter 14 (RL with function approximators) PDF
chapter 15 (Policy gradient approaches) PDF
chapter 16 (wrap-up) PDF