Zum Inhalt
Fakultät für Informatik

Schrankenberechnung für Concurrent MDPs

Masterarbeit; Ansprechpartner: Prof. Dr. Buchholz

 • Vorstellung der Modelle aus [1] und [2].
 • Beschreibung deterministischer und zyklischer Politiken für CMDPs.
 • Berechnung von Schranken für deterministische stationäre Politiken mit Hilfe von ILPs und Schnittebenen (als Erweiterung des Ansatzes aus [1]).

 [1] P. Buchholz, D. Scheftelowitsch Computation of weighted sums of rewards for concurrent MDPs. Math. Meth. of OR 89(1): 1-42 (2019).

 [2] Lauren N. Steimle, David L. Kaufman, Brian T. Denton. Multi-model Markov Decision Processes Under revision, available at http://www.optimization-online.org/DB HTML/2018/01/6434.html