交互式机器学习

参考:

深度学习在交互式图像分割中的应用 - 知乎

Nat. Methods | ilastik:为生物图像分析而生的交互式机器学习平台_DrugAI-CSDN博客

https://d-nb.info/1183327005/34 (Interactive Object Detection)

CVPR 2020 | 利用强化学习进行交互式3D医学图像分割_zandaoguang的博客-CSDN博客

强化学习

参考:

基于强化学习的图像分割算法研究 - 百度学术

Deep Reinforcement Learning in Computer Vision: A Comprehensive Survey:

https://arxiv.org/pdf/2108.11510.pdf

强化学习在视觉上的应用(RL for computer Vision) - 知乎

深度强化学习在医学影像任务中的应用 - 知乎

**model-free 与 model-based的区别

Model指的是针对环境的建模,即输入Action,环境的响应:Reward和State。 Model-Free:环境对输入的响应就是一个映射,without model,如常见的深度强化学习DQN/A3C/PPO等; Model-Based:环境对输入的响应是统计概率分布P(s_new|s,a)及P(r|s,a),如动态规划等传统强化学习方法。

**on-policyoff-policy的区别

  • 如果要学习的 agent 跟和环境互动的 agent 是同一个的话, 这个叫做on-policy(同策略)
  • 如果要学习的 agent 跟和环境互动的 agent 不是同一个的话, 那这个叫做off-policy(异策略)

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐