Python 机器学习

2018年3天快速入门python机器学习【黑马程序员】

(三)小案例

在这里插入图片描述
根据题的信息,我们显然需要找出消费者和产之间的联系:及 aisle 和 user_id之间的关系
我们的思路如下:
1.合并表,使得我们想要的两个字段出现在一个表中
2.交叉表(crossTab)(交叉表是用于统计分组频率的特殊透视表)
3.降维

首先读取数据

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.合并

我们观察之后,order_id,aisle_id,product_id分别是外键,可以通过他们将四个表合并
使用merge方法
在这里插入图片描述

2.交叉表在这里插入图片描述

我们可以看出,很多的特征基本上都是0,这产生了大量的冗余,所以接下来我们要进行降维的操作

3.降维

这里我们使用了PCA降维
参数0.95表示保留95%的原数据的情况下进行降维
在这里插入图片描述

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐