交互式机器学习/ 强化学习在图像领域中的应用
交互式机器学习参考:深度学习在交互式图像分割中的应用 - 知乎Nat. Methods | ilastik:为生物图像分析而生的交互式机器学习平台_DrugAI-CSDN博客https://d-nb.info/1183327005/34(Interactive Object Detection)强化学习参考:基于强化学习的图像分割算法研究 - 百度学术Deep Reinforcement Lear
交互式机器学习
参考:
Nat. Methods | ilastik:为生物图像分析而生的交互式机器学习平台_DrugAI-CSDN博客
https://d-nb.info/1183327005/34 (Interactive Object Detection)
CVPR 2020 | 利用强化学习进行交互式3D医学图像分割_zandaoguang的博客-CSDN博客
强化学习
参考:
Deep Reinforcement Learning in Computer Vision: A Comprehensive Survey:
https://arxiv.org/pdf/2108.11510.pdf
强化学习在视觉上的应用(RL for computer Vision) - 知乎
**model-free 与 model-based的区别
Model指的是针对环境的建模,即输入Action,环境的响应:Reward和State。 Model-Free:环境对输入的响应就是一个映射,without model,如常见的深度强化学习DQN/A3C/PPO等; Model-Based:环境对输入的响应是统计概率分布P(s_new|s,a)及P(r|s,a),如动态规划等传统强化学习方法。
**on-policy
与 off-policy
的区别
- 如果要学习的 agent 跟和环境互动的 agent 是同一个的话, 这个叫做
on-policy(同策略)
。 - 如果要学习的 agent 跟和环境互动的 agent 不是同一个的话, 那这个叫做
off-policy(异策略)
。
更多推荐
所有评论(0)