机器学习
机器学习Machine Learning基本概念**机器学习定义(Mitchell 1997):**对于某类任务T和性能量度P,一个计算机程序被认为可以从经验E中学习,通过经验E改进后,它在任务T上由性能度量P衡量的性能有所提升。致力于研究如何通过计算的手段,利用经验来改善自身的性能。机器学习所研究的主要内容是关于在计算机上从数据中产生“模型”(model)的算法即“学习算法”。机器学习是...
机器学习Machine Learning
基本概念
机器学习定义(Mitchell 1997):对于某类任务T和性能量度P,一个计算机程序被认为可以从经验E中学习,通过经验E改进后,它在任务T上由性能度量P衡量的性能有所提升。
致力于研究如何通过计算的手段,利用经验来改善自身的性能。机器学习所研究的主要内容是关于在计算机上从数据中产生“模型”(model)的算法即“学习算法”。
机器学习是关于研究算法的学问。
从数据中学得模型的过程称为“学习”或“训练”学得模型适用于新样本的能力,称为“泛化”能力
(1)任务T:学习过程本身不能算是任务。学习是我们所谓的获取完成任务的能力。通常机器学习任务定义为机器学习系统如何处理样本。(样本:收集到的已经量化的特征的集合 x∈R^n)
机器学习常见任务列举:
分类,回归(预测值是连续的),转录,机器翻译,结构化输出,异常检测,合成和采样,聚类,去噪,缺失值填补,密度估计等
(2)性能度量P:评估机器学习算法的能力。
(3)经验E:大部分学习算法可以被理解成在整个数据集上获取经验。根据学习过程中的不同经验,机器学习可以大致分为无
监督(unsupervised)算法和监督(supervised)算法
“经验”常以“数据”的形式存在
机器学习分类
(1)监督学习
训练含有很多特征的数据集,不过数据集中的样本都有一个标签(label)或目标(target)。(计算机自己做一些事情)回归(Regression)、分类(Classification)
(2)无监督学习
无监督学习:训练含有很多特征的数据集,然后学习出这个数据集上有用的结构性质。(教会计算机做一些事情) 聚类
(3)半监督学习
半监督学习一般针对的问题是数据量超级大但是有标签数据很少或者说标签数据的获取很难很贵的情况,训练的时候有一部分是有标签的而有一部分是没有的;
(4)强化学习
一直激励学习的方式,通过激励函数来让模型不断根据遇到的情况做出调整;
更多推荐
所有评论(0)