强化学习概述

强化学习是?

核心概念:Agent, Environment, State, Action, Reward

交互流程

Cartpole 示例

Gymnasium 介绍

示例

Last modified: 2026-05-24