小象学院Python数据分析第二期【升级版】

1285458-20180516222745946-850298871.png

主讲老师:

梁斌 资深算法工程师

查尔斯特大学(Charles Sturt University)计算机博士,从事机器学习、计算机视觉及模式识别等相关方向的研究,在计算机视觉等国际会议及期刊发表10余篇学术论文。现就职于澳大利亚某科学研究机构,负责算法改进及其产品化、数据分析处理及可视化。

课程简介:

近两年来,数据分析师的岗位需求非常大,90%的岗位技能需要掌握Python作为数据分析工具,本课程以案例驱动的方式讲解如何利用Python完成数据获取、处理、数据分析及可视化方面常用的数据分析方法与技巧。

升级版第二期的课程更新内容:

本期课程在《Python数据分析》升级版的基础上,主要新增了探索性数据分析(Exploratory Data Analysis,EDA)、金融数据量化分析及深度学习基础等三大数据分析工具,覆盖了时下最前沿的数据分析技术。具体新增内容如下:

新增探索性数据分析,更好地结合数据可视化发掘数据的模式与特点

新增金融数据量化分析,更好地结合时间序列分析探索金融数据的发展趋势

新增深度学习基础,更好地结合机器学习探索人工智能的技术趋势

升级并调整全部随课项目,并提供更详细的分析步骤

系统性地将相关章节的项目整理成一个完整的项目,使学员能够更加充分地理解数据分析的流程和步骤

注意:本资源是2017年2月开班的第一期升级版,除去上面部分列出的更新内容就是本版(第一期升级版)的内容.

面向人群:

1. 想了解和学习典型的数据分析流程和实践方法的学习者

2. 想接触和学习非结构化数据(比如:文本、图像等)分析的学习者

3. 想学习数据分析中常用建模知识的相关从业人员

4. 尚不会使用Python的数据分析师从业者

5. 想转行从事数据分析师行业的学习者

6. 想使用Python实现金融数据分析、机器学习或深度学习的工程师

学习收益:

通过本课程的学习,学员将会收获:

1. 熟悉数据分析的流程,包括数据采集、处理、可视化、数据建模等

2. 掌握Python语言作为数据分析工具,从而有能力驾驭不同领域数据分析实践

3. 掌握非结构化数据的处理与分析、探索性数据分析及量化分析

4. 快速积累多个业务领域数据分析项目经验,包括金融数据、文本数据及图像数据

5. 掌握使用Python实现基于机器学习及深度学习的数据分析和预测

6. 掌握数据分析中常用的建模知识

学习方式:

在线直播,共10次课,每次2-3小时

每周2次(周六、日,晚上20:00 - 22:00)

注意:第一次课是5月28日晚上20:00 - 22:00

第二次课是5月29日晚上20:00 - 22:00

直播后提供录制回放视频,可在线反复观看

课程大纲:

第一课 工作环境准备及数据分析建模理论基础 (2-3课时)

1. 课程介绍

2. 数据分析的基本概念

3. Python简介和环境部署

4. NumPy数据结构及向量化

5. 数据分析建模理论基础

a. 机器学习基础

b. 数据分析建模过程

c. 常用的数据分析建模工具

6. 实战案例1:使用Python实现蒙特卡洛模拟的期权估值

第二课 数据分析工具Pandas (2-3课时)

1. Pandas的数据结构

2. Pandas的数据操作

a. 数据的导入、导出

b. 数据的过滤筛选

c. 索引及多重索引

3. Pandas统计计算和描述

4. 数据的分组与聚合

5. 数据清洗、合并、转化和重构

6. 实战案例2-1:Lending Club借贷数据处理及初步分析

第三课 探索性数据分析(EDA)及数据可视化 (2-3课时)

1. 什么是EDA

2. 探索单变量、多变量的关系及其可视化

3. 3D绘图

4. 实战案例2-2:Lending Club借贷数据探索性分析及可视化

第四课 机器学习及scikit-learn(2-3课时)

1. 机器学习基本概念与流程

2. Python机器学习库scikit-learn

3. 常用评价指标

4. 分类预测模型– Logistic回归与Softmax回归

5. 实战案例2-3:Lending Club借贷违约预测

第五课 金融数据分析(1)--金融时间序列(2-3课时)

1. Pandas的时间处理及操作

2. 金融数据

3. 金融学图表

4. 高频数据分析

5. 实战案例3-1:股票收益率回归分析

第六课 金融数据分析(2)--量化分析 (2-3课时)量化分析基础

1. 量化策略建模流程及回测

2. 常用量化分析指标及框架

3. TA-Lib金融软件工具

4. 实战案例3-2:多因子策略模型

第七课 图像数据处理及分析 (2-3课时)

1. 基本的图像操作和处理

2. 常用的图像特征描述

3. 聚类模型:K-Means

4. 实战案例4:电影海报主色调聚类分析

第八课 深度学习及TensorFlow (2-3课时)

1. 人工神经网络及深度学习

2. TensorFlow框架学习及使用

3. TensorFlow实现卷积神经网络

4. 实战案例5:基于TensorFlow的101类图像识别(Caltech101)

第九课 文本数据分析 (2-3课时)

1. Python文本分析工具NLTK

2. 情感分析与文本分类

3. TensorFlow实现文本深度表示模型Word2Vec

4. 分类与预测模型-- 朴素贝叶斯

5. 实战案例6:搜狐新闻数据分类

第十课 项目实战(2-3课时)

1. 交叉验证及参数调整

2. 特征降维与特征选择

3. 实战案例7:根据日常新闻预测股市动向

4. 课程总结

常见问题:

Q: 本课程需要什么基础?

A:有基本的大学数学基础, 掌握Python基本编程。

Q: 会有实际上机演示和动手操作吗?

A: 有,几乎每节课,老师均会准备上机演示部分,学员可以学习老师的实践经验。

Q: 本课程必须提前掌握Python吗?

A: 不是必须的,本课程将系统讲授Python编程语言。如果你熟悉其他编程语言Java、C、Scala,学习Python是很容易的。

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐