Python 高级:人工智能概述
目录1. 人工智能科学计算库:机器学习算法:2. 人工智能发展历程图灵测试:达特茅斯会议:3. 人工智能的主要分支人工智能、机器学习和深度学习:4. 人工智能发展必备三要素数据:算法:计算力:5. 机器学习工作流程什么是机器学习:工作流程:结构化数据和非结构化数据:数据基本处理:特征工程:6. 机器学习算法分类监督学习...
目录
1. 人工智能
科学计算库:
MATPLOTLIB:数据可视化
NUMPY:数组计算
PANDAS:处理数据集
机器学习算法:
有监督算法,无监督算法
2. 人工智能发展历程
图灵测试:
测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。多次测试(一般为5min之内),如果有超过30%的测试者不能确定被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能
达特茅斯会议:
人工智能的起点,1956年被称之为人工智能元年
3. 人工智能的主要分支
人工智能、机器学习和深度学习:
机器学习是人工智能的一个实现途径,深度学习是机器学习的一个方法发展而来的
4. 人工智能发展必备三要素
数据:
学习规律的例子
算法:
解决问题的思路
卷积网络:处理图像任务
循环神经网络:处理序列(时序)任务
计算力:
让模型去学习和计算,参数量大
CPU:单核心强,能够应付各种不同的任务,串行任务,一般4核、8核
GPU:早期是图形卡(显卡),针对的是同类型并行的任务,一般2000核以上,大大缩减模型训练的时间
5. 机器学习工作流程
什么是机器学习:
机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测
工作流程:
(1)获取数据,完整的数据集
(2)数据基本处理
(3)特征工程
(4)机器学习(模型训练),训练模型的数据(训练集)
(5)模型评估,测试模型用到的数据集(测试集)
结构化数据和非结构化数据:
结构化数据:机器学习阶段用到的数据集类型,表格数据
非结构化数据:深度学习阶段,图片、语音、文字数据
数据基本处理:
对数进行缺失值、异常值处理
特征工程:
特征提取,特征预处理(数据去量纲化),特征降维(减少特征数量,同时保留原数据的大部分信息)。
6. 机器学习算法分类
监督学习:
输入数据是由特征值和目标值所组成的。输出离散(分类),输出连续(回归)。
无监督学习:
训练数据只包含特征值。
无监督学习:
训练集同时包含有标记样本数据和未标记样本数据。
强化学习:
没有训练数据,建立模型的时候人为设定好模型可以操作的规则,不断自我尝试,自己探索。
7. 分类模型评估
准确率:
预测正确的数占样本总数的比例。
精确率:
正确预测为正占全部预测为正的比例。
TP/(TP+FP)
召回率:
正确预测为正占全部正样本的比例。
TP/(TP+FN)
F1-score:
评估模型的稳健性。
2*精确率*召回率/(精确率+召回率)。越大越好。
AUC指标:
评估样本不均衡的情况。越大越好。
8. 回归模型评估
均方根误差(RMSE),相对平方误差(RSE),平均绝对误差(MAE),相对绝对误差(RAE),决定系数。
9. 拟合
欠拟合,过拟合
10. 总结
(1)获取数据
(2)数据基本处理
(3)特征工程
(4)机器学习(模型训练)
(5)模型评估
机器学习免费服务:https://studio.azureml.net/
UCI机器学习数据库网址:https://archive.ics.uci.edu/ml/datasets/census+income
更多推荐
所有评论(0)