MLNG_机器学习的动机与应用

机器学习监督学习非监督学习学习理论强化学习

Young_Gy · 2015-09-09 16:17:21 发布

MLNG这个系列主要是Andrew Ng在斯坦福所教授的《机器学习》课程的笔记。

很多事情（手写字体识别、自动飞行）很难以人工程序写出来，这时候需要ML去让机器学习内在的pattern。

监督学习

如何通过定理保证ML一定能工作，达到一定的精确度。

数据是否足够。

对图片使用聚类方法，将像素聚类，生成3D模型。

计算机集群组织

社交网络分析

市场分类

将两个人混合的说话的声音分开

将人声和背景声分开（independent component analysis）

[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');

强化学习，在一段时间内做多次决策。

核心是定义，回报函数（reward function）找到方式定义好的行为以及坏的行为，以期获得更多的回报更少的惩罚。

应用：机器人。

例子：控制飞行器。
飞行器在一次操作失误的情况下并不会坠毁，必须在连续多次失误操作中才会坠毁。同样，只要连续多次正确操作就可以正常飞行。
因此，定义回报函数，正确操作时给以回报，错误操作时给以惩罚。慢慢地，飞行器就会朝着正确地飞行方式，开始快乐地飞行。

CSDN联合极客时间，共同打造面向开发者的精品内容学习社区，助力成长！

更多推荐

玩转 AIGC 工具，早点下班！

用 OpenAI Assistants 做大模型应用开发

1 小时解读鸿蒙 10 大热点问题

查看更多评论

已为社区贡献2条内容