目录

1. 人工智能

科学计算库:

机器学习算法:

2. 人工智能发展历程

图灵测试:

达特茅斯会议:

3. 人工智能的主要分支

人工智能、机器学习和深度学习:

4. 人工智能发展必备三要素

数据:

算法:

计算力:

5. 机器学习工作流程

什么是机器学习:

工作流程:

结构化数据和非结构化数据:

数据基本处理:

特征工程:

6. 机器学习算法分类

监督学习:

无监督学习:

无监督学习:

强化学习:

7. 分类模型评估

准确率:

精确率:

召回率:

F1-score:

AUC指标:

8. 回归模型评估

9. 拟合

10. 总结


1. 人工智能

科学计算库:

MATPLOTLIB:数据可视化

NUMPY:数组计算

PANDAS:处理数据集

机器学习算法:

有监督算法,无监督算法

2. 人工智能发展历程

图灵测试:

测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。多次测试(一般为5min之内),如果有超过30%的测试者不能确定被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能

达特茅斯会议:

人工智能的起点,1956年被称之为人工智能元年

3. 人工智能的主要分支

人工智能、机器学习和深度学习:

机器学习是人工智能的一个实现途径,深度学习是机器学习的一个方法发展而来的

4. 人工智能发展必备三要素

数据:

学习规律的例子

算法:

解决问题的思路

卷积网络:处理图像任务

循环神经网络:处理序列(时序)任务

计算力:

让模型去学习和计算,参数量大

CPU:单核心强,能够应付各种不同的任务,串行任务,一般4核、8核

GPU:早期是图形卡(显卡),针对的是同类型并行的任务,一般2000核以上,大大缩减模型训练的时间

5. 机器学习工作流程

什么是机器学习:

机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测

工作流程:

(1)获取数据,完整的数据集

(2)数据基本处理

(3)特征工程

(4)机器学习(模型训练),训练模型的数据(训练集)

(5)模型评估,测试模型用到的数据集(测试集)

结构化数据和非结构化数据:

结构化数据:机器学习阶段用到的数据集类型,表格数据

非结构化数据:深度学习阶段,图片、语音、文字数据

数据基本处理:

对数进行缺失值、异常值处理

特征工程:

特征提取,特征预处理(数据去量纲化),特征降维(减少特征数量,同时保留原数据的大部分信息)。

6. 机器学习算法分类

监督学习:

输入数据是由特征值和目标值所组成的。输出离散(分类),输出连续(回归)。

无监督学习:

训练数据只包含特征值。

无监督学习:

训练集同时包含有标记样本数据和未标记样本数据。

强化学习:

没有训练数据,建立模型的时候人为设定好模型可以操作的规则,不断自我尝试,自己探索。

7. 分类模型评估

准确率:

预测正确的数占样本总数的比例。

精确率:

正确预测为正占全部预测为正的比例。

TP/(TP+FP)

召回率:

正确预测为正占全部正样本的比例。

TP/(TP+FN)

F1-score:

评估模型的稳健性。

2*精确率*召回率/(精确率+召回率)。越大越好。

AUC指标:

评估样本不均衡的情况。越大越好。

8. 回归模型评估

均方根误差(RMSE),相对平方误差(RSE),平均绝对误差(MAE),相对绝对误差(RAE),决定系数。

9. 拟合

欠拟合,过拟合

10. 总结

(1)获取数据

(2)数据基本处理

(3)特征工程

(4)机器学习(模型训练)

(5)模型评估

机器学习免费服务:https://studio.azureml.net/

UCI机器学习数据库网址:https://archive.ics.uci.edu/ml/datasets/census+income

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐