基本流程

  • 1.获取数据
  • 2.数据处理
  • 3.特征工程
  • 4.机器学习
  • 5.模型评估
    • 5.1 结果达到预期要求使用
    • 5.2 结果没达到预期要求重新调整参数训练

基本流程详解

  • 获取数据
    • 数据采集方式(
      • 爬虫
      • 自己网站
      • app埋点
      • 购买数据
      • 通过数据服务商
  • 数据处理
    • 前期处理
      • 无量纲化
        • 标准化
        • 区间缩放法
        • 标准化和归一化
      • 对定量特征二值化
      • 对定性特征哑编码
      • 缺失值计算
      • 数据变换
  • 特征工程 (数据和特征决定了机器学习的上限)
    • 特征选择
      • Filter
        • 方差选择法
        • 相关系数法
        • 卡方检验
        • 互信息法
      • Wrapper
        • 递归特征消除法
      • Embedded
        • 基于惩罚项的特征选择法
        • 基于树模型的特征选择法
    • 降维
      • 主成分分析法(PCA)
      • 线性判别分析法(LDA)
  • 机器学习
    • 读取数据
    • 开始训练
      • 可以联机学习
      • 可以分段学习
    • 保存模型
    • 评估
  • 模型评估
    • 主要参数
      • 召回率
      • 覆盖率
    • 其他指标

解决的问题

  • 1.分类问题
    • 1.1 准备带标签的数据
    • 1.2 训练并检验
    • 1.3 分类(离散)
  • 2.回归问题
    • 2.1 准备带标签的数据
    • 2.2 训练并检验
    • 2.3 回归(连续)
  • 3.聚类问题
    • 3.1 准备不带标签的数据
    • 3.2 聚类

阐述人工智能学习锻炼平台

1.和鲸社区
2.kaggle
3.飞浆 AI Studio
4.天池大数据
5.datafountain

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐