顶见 · 经管顶刊中文导读
🌙
加速正则化马尔可夫决策过程的原始-对偶方法
Accelerating Primal-Dual Methods for Regularized Markov Decision Processes
SIAM Journal on Optimization · 2024
被引 0
ABS 3
Haoya Li
Hsiang‐Fu Yu
Lexing Ying
Inderjit S. Dhillon
运筹学
优化理论
马尔可夫决策过程
机器学习
阅读原文 ↗