文章目录[隐藏]

数据仓库

数据仓库的特点:

  1. 面向主题
  2. 集成的
  3. 相对稳定的(非易失的)
  4. 反映历史变化(随着时间变化)

数据挖掘

方法

  1. 决策树
  2. 神经网络
  3. 遗传算法
  4. 关联规则挖掘算法

分类

  1. 关联分析:挖掘出隐藏在数据间的相互关系。
  2. 序列模式分析:侧重点是分析数据间的前后关系(因果关系)。
  3. 分类分析:为每一个记录赋予一个标记再按标记分类。
  4. 聚类分析:分类分析法的逆过程。

反规范化

由于规范化会使表不断的拆分,从而导致数据表过多。这样虽然减少了数据冗余,提高了增、删、改的速度,但会增加查询的工作量。系统需要进行多次连接,才能进行查询操作,使得系统效率大大下降

技术手段

  1. 增加派生性冗余列
  2. 增加冗余列
  3. 重新组表
  4. 分割表

大数据

对海量信息处理的方法

比较

大数据处理系统的特性

  1. 高度可扩展性
  2. 高性能
  3. 高度容错
  4. 支持异构环境
  5. 较短的分析延迟
  6. 易用且开放的接口
  7. 较低成本
  8. 向下兼容性

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐