GPU-Implementierung von Operationen auf HTDs
• Beschreibung der hierarchsichen Tucker Dekomposition und der zugehörigen Operationen [2].
• Parallelisierung der C-Implementierung aus [1] mit Hilfe von CUDA.
• Vergleich sequentieller und GPU-Implementierung.
[1] Peter Buchholz, Tugrul Dayar, Jan Kriege, M. Can Orhan. On compact solution vectors in Kronecker-based Markovian analysis. Perform. Eval. 115: 132-149 (2017).
[2] Daniel Kressner, Christine Tobler. Algorithm 941: htucker - A Matlab Toolbox for Tensors in Hierarchical Tucker Format. ACM Trans. Math. Softw. 40(3): 22:1-22:22 (2014).