机器学习(三)小案例
Python 机器学习2018年3天快速入门python机器学习【黑马程序员】(三)小案例2、合并表order_products__prior.csv:订单与商品信息字段:order_id, product_id, add_to_cart_order, reorderedproducts.csv:商品信息字段:product_id, product_name, aisle_id, ...
·
Python 机器学习
(三)小案例
根据题的信息,我们显然需要找出消费者和产之间的联系:及 aisle 和 user_id之间的关系
我们的思路如下:
1.合并表,使得我们想要的两个字段出现在一个表中
2.交叉表(crossTab)(交叉表是用于统计分组频率的特殊透视表)
3.降维
首先读取数据
1.合并
我们观察之后,order_id,aisle_id,product_id分别是外键,可以通过他们将四个表合并
使用merge方法
2.交叉表
我们可以看出,很多的特征基本上都是0,这产生了大量的冗余,所以接下来我们要进行降维的操作
3.降维
这里我们使用了PCA降维
参数0.95表示保留95%的原数据的情况下进行降维
更多推荐
已为社区贡献6条内容
所有评论(0)