我被问到的最常见问题是:“ 我如何开始?”

我对机器学习入门的最佳建议分为五个步骤:

有关此自顶向下方法的更多信息,请参见:

我的许多学生都使用这种方法在Kaggle比赛中继续表现出色,并获得了机器学习工程师和数据科学家的工作。

应用机器学习过程

 

机器学习的好处是预测和做出预测的模型。

拥有应用机器学习的技能意味着知道如何始终如一地可靠地对问题进行高质量的预测。您需要遵循系统的流程。

您可以按照以下5个步骤进行操作,以在预测建模问题上始终如一地获得高于平均水平的结果:

有关此过程的完整摘要,请参见以下文章:

机器学习的概率

 

概率是量化和控制不确定性的数学。它是许多数学领域(如统计学)的基石,对于应用机器学习至关重要。

以下是3个步骤的过程,您可以使用它来快速掌握机器学习的可能性。

您可以在此处查看有关概率的所有教程。以下是一些最受欢迎的教程。

概率基础

贝叶斯定理

概率分布

信息论

机器学习统计

 

统计方法是深入了解机器学习算法行为所必需的重要数学基础领域。

下面是3个步骤的过程,您可以用来快速掌握用于机器学习的统计方法。

您可以在此处查看所有统计方法的帖子。以下是一些最受欢迎的教程。

统计摘要

统计假设检验

重采样方法

估算统计

机器学习的线性代数

 

线性代数是实现对机器学习算法的更深入理解所需的重要数学基础领域。

以下是3个步骤,您可以用来快速学习线性代数以进行机器学习。

您可以在此处查看所有线性代数的帖子。以下是一些最受欢迎的教程。

Python中的线性代数

矩阵

向量

矩阵分解

了解机器学习算法

 

机器学习与机器学习算法有关。

您需要知道哪些算法可用于给定问题,它们如何工作以及如何最大程度地利用它们。

这是机器学习算法的入门方法:

您可以在此处查看所有机器学习算法文章。以下是一些最受欢迎的教程。

线性算法

非线性算法

合奏算法

如何学习/学习机器学习算法

Weka机器学习(无代码)

 

Weka是一个平台,您可以使用它来开始应用机器学习。

它具有图形用户界面,这意味着无需编程,并且提供了一套最新的算法。

这是您如何开始使用Weka的方法:

您可以在此处查看所有Weka机器学习文章。以下是一些最受欢迎的教程。

在Weka中准备数据

Weka算法教程

Python机器学习(scikit-learn)

 

Python是应用机器学习发展最快的平台之一。

您可以在模型的开发和操作部署中使用相同的工具,例如pandas和scikit-learn。

以下是您可以用来开始使用Python机器学习的步骤:

您可以在此处查看所有Python机器学习文章。以下是一些最受欢迎的教程。

用Python准备数据

Python机器学习

R机器学习(插入符号)

 

R是用于统计计算的平台,并且是专业数据科学家中最受欢迎的平台。

它之所以受欢迎,是因为有大量可用的技术,并且由于这些方法的强大接口(例如强大的插入符号程序包)。

这是R机器学习的入门方法:

您可以在这里查看所有R机器学习文章。以下是一些最受欢迎的教程。

R中的数据准备

R中的应用机器学习

从零开始的代码算法(Python)

 

通过从头开始编码,您可以学到很多有关机器学习算法的知识。

通过编码学习是许多开发人员和工程师的首选学习方式。

这是通过从头开始编写所有代码来开始机器学习的方法。

您可以在此处查看Scratch帖子中的所有代码算法。以下是一些最受欢迎的教程。

准备数据

线性算法

算法评估

非线性算法

时间序列预测简介(Python)

 

时间序列预测是业务应用程序中的重要主题。

许多数据集包含一个时间成分,但是从机器学习的角度来看,很少涉及时间序列的主题。

以下是时间序列预测的入门方法:

您可以在此处查看所有时间序列预测帖子。以下是一些最受欢迎的教程。

数据准备教程

预测教程

Python中的XGBoost(随机梯度增强)

 

XGBoost是梯度提升决策树的高度优化实现。

它之所以受欢迎,是因为它被世界上一些最好的数据科学家用来赢得机器学习竞赛。

这是XGBoost入门的方法:

您可以在此处查看所有XGBoosts帖子。以下是一些最受欢迎的教程。

XGBoost基础

XGBoost调整

分类不平衡

 

不平衡分类是指分类任务,其中一类的实例比另一类更多。

这些类型的问题通常需要使用专门的性能指标和学习算法,因为标准指标和方法不可靠或完全失败。

这是不平衡分类的入门方法:

您可以在此处查看所有不平衡分类的帖子

深度学习(Keras)

 

深度学习是一个引人入胜且强大的领域。

最新的结果来自深度学习领域,它是机器学习的一个子领域,不容忽视。

这是开始深度学习的方法:

您可以在此处查看所有深度学习文章。以下是一些最受欢迎的教程。

背景

多层感知器

卷积神经网络

递归神经网络

更好的深度学习表现

 

尽管定义和拟合深度学习神经网络模型很容易,但是要在特定的预测建模问题上获得良好的性能可能会充满挑战。

您可以使用标准技术来改善学习,减少过度拟合并通过深度学习模型做出更好的预测。

这是开始获得更好的深度学习性能的方法:

您可以在此处查看所有更好的深度学习文章。以下是一些最受欢迎的教程。

更好的学习(修复培训)

更好的泛化(修复过度拟合)

更好的预测(合奏)

提示,技巧和资源

长短期记忆网络(LSTM)

 

长短期记忆(LSTM)递归神经网络是为序列预测问题设计的,是用于挑战性预测问题的最新深度学习技术。

这是在Python中开始使用LSTM的方法:

您可以在此处查看所有LSTM帖子。以下是通过Keras深度学习库在Python中使用LSTM的一些最受欢迎的教程的精选。

LSTM的数据准备

LSTM行为

用LSTM建模

LSTM时间序列

自然语言处理深度学习(NLP)

 

由于自然语言的混乱性质,因此很难处理文本数据。

文本不是“已解决”的,而是要获得有关具有挑战性的NLP问题的最新结果,您需要采用深度学习方法

这是开始进行自然语言处理的深度学习的方法:

您可以在此处查看有关NLP帖子的所有深度学习。以下是一些最受欢迎的教程。

词袋模型

语言建模

文字摘要

文字分类

词嵌入

图片字幕

文字翻译

用于计算机视觉的深度学习

 

由于原始像素之间的鸿沟以及图像中的含义,使用图像数据非常困难。

不能解决计算机视觉问题,但是要获得具有挑战性的计算机视觉任务(例如对象检测和面部识别)的最新结果,您需要深度学习方法。

这是开始进行计算机视觉深度学习的方法:

您可以在此处查看有关Computer Vision的所有深度学习文章。以下是一些最受欢迎的教程。

图像数据处理

图像数据增强

影像分类

图像数据准备

卷积神经网络的基础

物体识别

深度学习以进行时间序列预测

 

深度学习神经网络能够自动学习从输入到输出的任意复杂映射,并支持多个输入和输出。

MLP,CNN和LSTM等方法为时间序列预测提供了很多希望。

以下是开始进行时间序列预测的深度学习的方法:

您可以在此处查看有关时间序列预测帖子的所有深度学习。以下是一些最受欢迎的教程。

预测趋势和季节性(单变量)

人类活动识别(多变量分类)

预测用电量(多变量,多步骤)

型号类型

时间序列案例研究

预测空气污染(多变量,多步骤)

生成对抗网络(GAN)

 

生成对抗网络,简称GAN,是一种使用深度学习方法(例如卷积神经网络)进行生成建模的方法。

GAN是一个令人兴奋且瞬息万变的领域,它具有生成模型的承诺,能够在各种问题域中生成逼真的示例,尤其是在图像到图像的翻译任务中。

以下是开始生成对抗网络的深度学习的方法:

您可以在此处查看列出的所有“ 生成对抗网络”教程。以下是一些最受欢迎的教程。

GAN基础知识

GAN损失函数

开发简单的GAN模型

用于图像翻译的GAN

喜欢点下关注,你的关注是我写作的最大支持

 

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐