This is an archived version of the Machine Learning Lab website for documentation purposes. The host is in no way affiliated with the University of Freiburg, its Faculty of Engineering or any of its members.
Oberseminar
Batch Reinforcement Learning
Prof. Dr. Martin Riedmiller und Sascha Lange
- Seminar:
- Donnerstag, 09:00 - 11:00, Gebäude 079, Raum 079/00 19
- Kreditpunkte:
- 4 ECTS
- Sprache:
- Deutsch
Übersicht:
Syllabus: Das Oberseminar wird in Form eines Lesezirkels durchgeführt, bei dem wöchentlich wechselnde Artikel aus dem Bereich des Maschinellen Lernens gelesen und diskutiert werden. Die Artikelauswahl wird in der ersten gemeinsamen Sitzung erarbeitet, wobei Vorschläge von den Teilnehmern willkommen sind. Für die Vergabe von Kreditpunkten wird regelmäßige, aktive Teilnahme an den Diskussionen und die Vorbereitung eines Kurzvortrages erwartet.
Literaturliste
- Antos, Munos, Szepesvari. Fitted Q-iteration in continuous action-space MDPs. Neural Information Processing Systems, Vancouver, Canada, 2007. Extended version
- Brian Sallans, Geoffrey Hinton. Using Free Energies to Represent Q-values in a Multiagent Reinforcement learning Task. Advances in Neural Information Processing Systems 13, MIT Press, Cambridge, MA. PDF
- Schneegass, D. and Udluft, S. and Martinetz, T. Improving optimality of neural rewards regression for data-efficient batch near-optimal policy identification. International Conference on Artificial Neural Networks (ICANN 2007), pp 109-118. PDF
- Huang, G.B. and Zhu, Q.Y. and Siew, C.K., Extreme learning machine: theory and applications. Neurocomputing, 70(1-3):489–501, 2006. PDF