数据特征处理

在机器学习的算法训练中,有很多数据的特征值不止一个,特征值中有些属性的数字过大,从而对计算结果的影响太大,但是实际情况是每个属性都同等重要,这时候就要处理这种不同取值范围的特征值,通常采用数值归一化,将取值范围处理为0-1或者其他范围之间。

1.数据归一化:

在这里插入图片描述

sklearn归一化API

from sklearn.preprocessing import MinMaxScaler

在这里插入图片描述

举例:

 mm=MinMaxScaler(feature_range=(0,1))#feature_range默认为0到1可以更改
 data=mm.fit_transform([[90,20,4,10],[40,24,3,20],[70,30,5,30]])
 print(data)

结果:

在这里插入图片描述

sklearn标准化API(正态分布)


在这里插入图片描述

举例

st=StandardScaler()
data=st.fit_transform([[1,-1,3],[2,4,2],[4,6,-1]])
print(data)

结果

在这里插入图片描述

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐