机器学习系列(一)—— 绪言
一、序言刚进入研一,目前正在学习机器学习相关课程,从本篇博客开始记录学习历程,和大家一起共同学习进步!在学习之前,最好有数学基础(高等数学、线性代数和概率论数理统计)和Python基础。如果没学过Python可以到这里学习 => 《Python菜鸟教程》。由于本人为初学者,若在内容上有不当之处,还请各位前辈和同学帮忙指出。二、机器学习简介1、机器学习机器学习是一门多领域交叉学科,涉及概率论、
目录
一、序言
刚进入研一,目前正在学习机器学习相关课程,从本篇博客开始记录学习历程,和大家一起共同学习进步!在学习之前,最好有数学基础(高等数学、线性代数和概率论数理统计)和Python基础。如果没学过Python可以到这里学习 => 《Python菜鸟教程》。由于本人为初学者,若在内容上有不当之处,还请各位前辈和同学帮忙指出。
二、机器学习简介
1、机器学习
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
它是人工智能的核心,是使计算机具有智能的根本途径。
机器学习是一类算法的统称,机器学习方法是计算机利用已有的数据(经验),得出了某种模型(规律),并利用此模型预测未来(结果)的一种方法。
2、机器学习和人工智能
2.1 人工智能、机器学习、神经网络和深度学习的关系如下:
2.2 机器学习的分类:
- 有监督学习:分类和回归属于监督学习,这类算法必须知道预测什么。即目标变量的分类信息。(分类问题、回归问题属于有监督学习)
- 无监督学习:此时数据没有类别信息,也不会给定目标值。(聚类问题属于无监督学习)
- 强化学习:又称增强学习,通过与环境进行交互来学习解决问题的一类算法。
2.3 机器学习关注的问题
2.3.1 分类问题
划分有限个类别,根据数据样本的特征,判断属于哪一个类别。常见的如:(1)垃圾邮件分类 (2)图像分类 (3)文字识别
2.3.2 回归问题
根据数据样本上抽取出的特征,预测一个连续值的结果。常见的如:股票走势、房价走势等
2.3.3 聚类问题
根据数据样本上抽取出的特征,让样本抱抱团(相近/相关的样本在一团内)。如:用户群体划分和新闻分类。
三、机器学习的应用
3.1 计算机视觉
典型的应用包括:人脸识别、车牌识别、扫描文字识别、图片内容识别、图片搜索等等。
3.2 自然语言处理
典型的应用包括:搜索引擎智能匹配、文本内容理解、文本情绪判断,语音识别、输入法、机器翻译等等。
3.3 社会网络分析
典型的应用包括:用户画像、网络关联分析、欺诈作弊发现、热点发现等等。
3.4 推荐
典型的应用包括:虾米音乐的“歌曲推荐”,某宝的“猜你喜欢”等等。
四、机器学习的步骤
本部分来自CSDN博主zxhohai
通常学习一个好的函数,分为以下三步:
1、选择一个合适的模型,这通常需要依据实际问题而定,针对不同的问题和任务需要选取恰当的模型,模型就是一组函数的集合。
2、判断一个函数的好坏,这需要确定一个衡量标准,也就是我们通常说的损失函数(Loss
Function),损失函数的确定也需要依据具体问题而定,如回归问题一般采用欧式距离,分类问题一般采用交叉熵代价函数。
3、找出“最好”的函数,如何从众多函数中最快的找出“最好”的那一个,这一步是最大的难点,做到又快又准往往不是一件容易的事情。常用的方法有梯度下降算法,最小二乘法等和其他一些技巧(tricks)。
学习得到“最好”的函数后,需要在新样本上进行测试,只有在新样本上表现很好,才算是一个“好”的函数。
开发机器学习应用程序的步骤:(Step 4 -5为核心)
- 收集数据
- 准备输入数据 =>为算法准备特定的数据格式
- 分析输入数据 =>确保数据集中没有垃圾数据
- 训练算法 =>从输入数据中抽取知识和信息
- 测试算法 =>
- 使用算法 => 将机器学习算法转化成应用程序,执行实际任务
五、学习路线
0.math (数学基础)
1.python-basic (python基础)
2.numpy(numpy基础)
3.pandas(pandas基础)
4.scipy(scipy基础)
5.data-visualization(数据可视化基础,包含matplotlib和seaborn)
6.scikit-learn(scikit-learn基础)
7.machine-learning(机器学习基础)
8.deep-learning(深度学习基础)
9.feature-engineering(特征工程基础)
更多推荐
所有评论(0)