🌙

线性规划的Fisher-Rao梯度流与状态-动作自然策略梯度

Fisher–Rao Gradient Flows of Linear Programs and State-Action Natural Policy Gradients

SIAM Journal on Optimization · 2025
被引 2
ABS 3
数学优化强化学习算法数理经济学