波士顿房价数据集可视化

1.Keras

  • 是一个高层的神经网络和深度学习库。
  • 可以快速搭建神经网络模型,非常易于调试和扩展。
  • TensorFlow的官方API
  • 内置了一些常用的公共数据集,可以通过keras.datasets模块加载和访问。

Keras中集成的数据集

序号 名称 说明
1 boston_housing 波士顿房价数据集
2 CIFAR10 10种类别的图片集
3 CIFAR100 100种类别的图片集
4 MNIST 手写数字图片集
5 Fashion-MNIST 10种时尚类别的图片集
6 IMDB 电影点评数据集
7 reuters 路透社新闻数据集

3.波士顿房价数据集

  • 卡内基梅隆大学,StatLib库,1978年
  • 涵盖了麻省波士顿的506个不同郊区的房屋数据
  • 404条训练数据集,102条测试数据集
  • 每条数据14个字段,包含13个属性,和1个房价的平均值
序号 变量名 说 明 示 例
1 CRIM 城镇人均犯罪率 0.00632
2 ZN 超过25000平方英尺的住宅用地所占比例 18.0
3 INDUS 城镇非零售业的商业用地所占比例 2.31
4 CHAS 是否被Charles河流穿过(取值1:是;取值0:否) 0
5 NOX 一氧化碳浓度 0.538
6 RM 每栋住宅的平均房间数 6.575
7 AGE 早于1940年建成的自住房屋比例 65.2
8 DIS 到波士顿5个中心区域的加权平均距离 4.0900
9 RAD 到达高速公路的便利指数 1
10 TAX 每10000美元的全值财产税率 296
11 PTRATIO 城镇中师生比例 15.3
12 B 反映城镇中的黑人比例的指标,越靠近0.63越小;B=1000*(BK-0.63) 2 ,其中BK是黑人的比例。 396.90
13 LSTAT 低收入人口的比例 7.68
14 MEDV 自住房屋房价的平均房价(单位为1000美元) 24.0

4.加载数据集

.load_data()方法

  • 本地默认路径
  • C:\Users\user_name.keras\datasets
  • C:\Users\Administrator.keras\datasets\boston_housing.npz
#波士顿房价数据集可视化完整代码
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

boston_housing = tf.keras.datasets.boston_housing  
#tf.keras.datasets前缀,为keras在TensorFlow中的实现
#boston_housing 数据集名称

#改变数据集划分比例
(train_x,train_y),(_,_) = boston_housing.load_data(test_split=0)
#test_split=0  即测试集所占全部数据集的比例
#因为测试集也作为了数据集,后期不再使用测试集,故用_这个变量表示测试集

plt.rcParams['font.sans-serif']=['SimHei']   #中文字体配置
plt.rcParams['axes.unicode_minus']=False

titles = ["CRIM","ZN","INDUS","CHAS","NOX","RM","AGE",
         "DIS","RAD","TAX","PTRATIO","B-1000","LSTAT","MEDV"]  #子标题名称存放在列表中

plt.figure(figsize=(12,12))  #设置绘图尺寸

for i in range(13):          #利用循环依次绘制13个属性与房价的关系散点图
    plt.subplot(4,4,(i+1))   #子图为4x4排列共16个图的位置,实际上只绘制了13个
    plt.scatter(train_x[:,i],train_y)  #绘制散点图
    plt.xlabel(titles[i])      #设置x轴标签文本
    plt.ylabel("Price($1000's)")  #设置y轴标签文本
    plt.title(str(i+1)+"."+titles[i]+"-Price")   #设置子图标题

plt.tight_layout()  #自动调整子图间隔
plt.suptitle("各个属性与房价的关系",x=0.5,y=1.02,fontsize=20) #设置全局标题
plt.show()   #显示绘图

波士顿数据集可视化

Logo

CSDN联合极客时间,共同打造面向开发者的精品内容学习社区,助力成长!

更多推荐