强化学习 - Eric Blog

Learning 是否会替代 Planning？以RL为思考 - Eric Blog

强化学习

Learning 是否会替代 Planning？以RL为思考

本篇内容来自AI 在具身智能领域，强化学习（RL）与运动规划（Planning）的关系并非简单的“替代”或“缩水”，而是...

Eric2025-05-25 1.23k 0

【Deepseek】扫地机器人规控与强化学习结合的可能性探索 - Eric Blog

强化学习

【Deepseek】扫地机器人规控与强化学习结合的可能性探索

问：我想将强化学习融合到移动机器人（如扫地机器人等）的运动控制中，我该如何去思考这种可行性，请你给我一条可能的方向，并...

Eric2025-02-20 1.79k 0

【Deepseek】Q-learning - Eric Blog

强化学习

【Deepseek】Q-learning

在强化学习中，Q-learning 是一种经典的 off-policy 算法，用于学习最优策略。它的核心思想是通过更新 ...

Eric2025-02-19 1.16k 0

马尔科夫奖励过程 - Eric Blog

强化学习

马尔科夫奖励过程

原文链接：第二章马尔可夫决策过程 (MDP) (datawhalechina.github.io) 马尔可夫奖励过程（...

Eric2024-08-21 928 0

X