Schrankenberechnung für Concurrent MDPs
• Vorstellung der Modelle aus [1] und [2].
• Beschreibung deterministischer und zyklischer Politiken für CMDPs.
• Berechnung von Schranken für deterministische stationäre Politiken mit Hilfe von ILPs und Schnittebenen (als Erweiterung des Ansatzes aus [1]).
[1] P. Buchholz, D. Scheftelowitsch Computation of weighted sums of rewards for concurrent MDPs. Math. Meth. of OR 89(1): 1-42 (2019).
[2] Lauren N. Steimle, David L. Kaufman, Brian T. Denton. Multi-model Markov Decision Processes Under revision, available at http://www.optimization-online.org/DB HTML/2018/01/6434.html