Research Technical Daily Life Month Journal

Academic Projects Links About Travellings 🚇

Back

Tags: #rl

Jan 23, 2026

RL的原理-4-值迭代与策略迭代

值迭代与策略迭代的原理与算法，有点懵，review++

4 min read
- rl
- review
Jan 21, 2026

RL的原理-3-贝尔曼最优公式

贝尔曼最优公式求解方法以及性质

4 min read
- rl
Jan 20, 2026

RL的原理-2-贝尔曼公式

贝尔曼公式

4 min read
- rl
Jan 17, 2026

RL的原理-1-基本概念

强化学习（Reinforcement Learning, RL）中的一些基本概念，包括状态、动作、奖励、策略等。

4 min read
- rl

© 2026 林夕夕 & Site policy Astro & Axi theme powered

鲁ICP备2026004663号-1 |

鲁公网安备37021002001599号