Fix PPORecurrent training issue: tuned learning rate and added missing max_grad_norm by emiliof114 · Pull Request #4 · fei-yang-wu/RLOpt

emiliof114 · 2025-10-14T20:35:30Z

This PR fixes the failed PPORecurrent training test by stabilizing optimization.

Changes:

Result:
PPORecurrent training now improves average return as expected.

Fix: tuned learning rate and resolved missing max_grad_norm issue

3fd2b7f

fei-yang-wu marked this pull request as draft March 19, 2026 22:13

Provide feedback