第2章 理论基础 自主学习报告
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档目录一、学习目的二、知识点1.数据科学的学科地位2.统计学3.机器学习4.数据可视化总结一、学习目的掌握数据科学的学科地位;理解机器学习、统计学、可视化理论对数据科学的主要影响;了解:数据科学的理论基础—机器学习、统计学、可视化理论—的知识体系及代表性方法。一、pandas是什么?示例:pandas 是基于NumPy 的一种工具,该工
·
目录
一、数据科学的学科地位
1.数据科学的定义

2.数据科学与其他学科的区别

3.数据科学的学科定位

二、统计学
1.统计方法的基本类型

2.基于python的统计建模流程
a.数据的读入
b.数据的理解
c.数据的规整化处理
d.模型的训练
e.模型的解读与评价
f.模型的优化和重新选择
g.模型假定的分析与讨论
三、机器学习
1.常用的机器学习算法
| 有监督 | 无监督 | |
| 连续型 |
聚类与维度下降 SDV PCA K-Means |
回归 线性回归 多项式回归 决策树 随机森林 |
| 分类型 |
关联分析 Apriori FP-Growth
隐马尔可夫模型 |
分类 KNN 逻辑回归 朴素贝叶斯 SVM |
2.python编程步骤
(1)数据的读入
(2)数据理解
(3)数据规整化处理
(4)数据建模
(5)模型评估
(6)模型预测
(7)结果显示
四、数据可视化
1.相对统计学,数据可视化主要有以下两方面优势:
(1)数据可视化处理可以洞察统计分析无法发现的结构和细节
(2)数据可视化处理结果的解读对用户知识水平要求较低
2.Tableau与VizQL技术
更多推荐



所有评论(0)