强化学习中的状态、动作、奖励
状态、动作与奖励收藏这部分内容有帮助吗?
有帮助报告问题标记为完成参考文献
Reinforcement Learning: An Introduction, Richard S. Sutton and Andrew G. Barto, 2018 (The MIT Press) - 一本基础教材,全面介绍了强化学习问题中作为智能体与环境交互核心的状态、动作和奖励概念。CS234: Reinforcement Learning (Winter 2019) - Lecture 2: Markov Decision Processes, Emma Brunskill, 2019 Stanford University Course Materials (Stanford University) - 大学课程讲义,清晰地定义了状态、动作、奖励及其在马尔可夫决策过程中的作用。6.S191: Introduction to Deep Learning (2021) - Lecture 9: Reinforcement Learning, Lex Fridman, 2021 MIT OpenCourseWare - 麻省理工学院深度学习入门课程中的一节课,简明扼要地介绍了强化学习的基本组成部分,包括状态、动作和奖励。© 2025 ApX Machine Learning