强化学习(Reinforcement learning)
强化学习又称增强学习。 强化学习要解决的问题:一个能够感知环境的自治智能体(Agent),如何通过学习选择能够达到目标的最优动作,即强化学习Agent的任务是从环境收集的数据,并作出相应的动作,此动作的表达将收到激励或者惩罚,以改进Agent对环境的决策。 强化学习的特征:1. Agent不是静止的、被动的等待,而是主动对环境做出试探;2. 环境对试探动作反馈的信息是评...
·
强化学习又称增强学习。
强化学习要解决的问题:
一个能够感知环境的自治智能体(Agent),如何通过学习选择能够达到目标的最优动作,即强化学习Agent的任务是从环境收集的数据,并作出相应的动作,此动作的表达将收到激励或者惩罚,以改进Agent对环境的决策。
强化学习的特征:
1. Agent不是静止的、被动的等待,而是主动对环境做出试探;
2. 环境对试探动作反馈的信息是评价性的;
3. Agent在行动-评论的环境中获得知识,改进行动方案以适应环境,达到预期目的。
强化学习的特点:
1. 强化学习是一种弱的学习方式,体现为:Agent通过与环境不断地试错交互来进行学习;强化信号可能是稀疏且合理延迟的;不要求(或要求较少)先验知识;
2. 强化学习是一种增量式学习,并可以在线使用;
3. 强化学习可以应用于不确定性环境;
4. 强化学习可以与监督学习、智能探索和结构控制等结合使用。
强化学习的基本要素:
1. 策略
2. 值函数
3. 回报函数
4.环境模型(非必需)
更多推荐
已为社区贡献3条内容
所有评论(0)