MLNG这个系列主要是Andrew Ng在斯坦福所教授的《机器学习》课程的笔记。

很多事情(手写字体识别、自动飞行)很难以人工程序写出来,这时候需要ML去让机器学习内在的pattern。

监督学习

学习理论

如何通过定理保证ML一定能工作,达到一定的精确度。

数据是否足够。

非监督学习

对图片使用聚类方法,将像素聚类,生成3D模型。

计算机集群组织

社交网络分析

市场分类

将两个人混合的说话的声音分开

将人声和背景声分开(independent component analysis)

ICA algorithm:

[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');

Reinforcement Learning

强化学习,在一段时间内做多次决策。

核心是定义,回报函数(reward function)找到方式定义好的行为以及坏的行为,以期获得更多的回报更少的惩罚。

应用:机器人。

例子:控制飞行器。
飞行器在一次操作失误的情况下并不会坠毁,必须在连续多次失误操作中才会坠毁。同样,只要连续多次正确操作就可以正常飞行。
因此,定义回报函数,正确操作时给以回报,错误操作时给以惩罚。慢慢地,飞行器就会朝着正确地飞行方式,开始快乐地飞行。

参考资料

  1. CS229主页
Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐