顶见 · 经管顶刊中文导读
🌙
线性规划的Fisher-Rao梯度流与状态-动作自然策略梯度
Fisher–Rao Gradient Flows of Linear Programs and State-Action Natural Policy Gradients
SIAM Journal on Optimization · 2025
被引 2
ABS 3
Johannes Müller
Semih Çaycı
Guido Montúfar
数学优化
强化学习
算法
数理经济学
阅读原文 ↗