深度学习_Tensorflow2.0_Matplotlib_波士顿房价数据集可视化

波士顿房价数据集可视化1.Keras是一个高层的神经网络和深度学习库。可以快速搭建神经网络模型，非常易于调试和扩展。TensorFlow的官方API内置了一些常用的公共数据集，可以通过keras.datasets模块加载和访问。Keras中集成的数据集序号名称说明1boston_housing波士顿房价数据集2CIFAR1010种类别的图片集3CIFAR100100种类别的图片集4MNIST手写数

Climb_Ma

1094人浏览 · 2020-08-11 00:37:49

Climb_Ma · 2020-08-11 00:37:49 发布

波士顿房价数据集可视化

1.Keras

是一个高层的神经网络和深度学习库。
可以快速搭建神经网络模型，非常易于调试和扩展。
TensorFlow的官方API
内置了一些常用的公共数据集，可以通过keras.datasets模块加载和访问。

Keras中集成的数据集

序号	名称	说明
1	boston_housing	波士顿房价数据集
2	CIFAR10	10种类别的图片集
3	CIFAR100	100种类别的图片集
4	MNIST	手写数字图片集
5	Fashion-MNIST	10种时尚类别的图片集
6	IMDB	电影点评数据集
7	reuters	路透社新闻数据集

3.波士顿房价数据集

卡内基梅隆大学，StatLib库，1978年
涵盖了麻省波士顿的506个不同郊区的房屋数据
404条训练数据集，102条测试数据集
每条数据14个字段，包含13个属性，和1个房价的平均值

序号	变量名	说明	示例
1	CRIM	城镇人均犯罪率	0.00632
2	ZN	超过25000平方英尺的住宅用地所占比例	18.0
3	INDUS	城镇非零售业的商业用地所占比例	2.31
4	CHAS	是否被Charles河流穿过（取值1：是；取值0：否）	0
5	NOX	一氧化碳浓度	0.538
6	RM	每栋住宅的平均房间数	6.575
7	AGE	早于1940年建成的自住房屋比例	65.2
8	DIS	到波士顿5个中心区域的加权平均距离	4.0900
9	RAD	到达高速公路的便利指数	1
10	TAX	每10000美元的全值财产税率	296
11	PTRATIO	城镇中师生比例	15.3
12	B	反映城镇中的黑人比例的指标，越靠近0.63越小；B=1000*(BK-0.63) 2 ，其中BK是黑人的比例。	396.90
13	LSTAT	低收入人口的比例	7.68
14	MEDV	自住房屋房价的平均房价（单位为1000美元）	24.0

4.加载数据集

.load_data()方法

本地默认路径
C:\Users\user_name.keras\datasets
C:\Users\Administrator.keras\datasets\boston_housing.npz

#波士顿房价数据集可视化完整代码
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

boston_housing = tf.keras.datasets.boston_housing  
#tf.keras.datasets前缀，为keras在TensorFlow中的实现
#boston_housing 数据集名称

#改变数据集划分比例
(train_x,train_y),(_,_) = boston_housing.load_data(test_split=0)
#test_split=0  即测试集所占全部数据集的比例
#因为测试集也作为了数据集，后期不再使用测试集，故用_这个变量表示测试集

plt.rcParams['font.sans-serif']=['SimHei']   #中文字体配置
plt.rcParams['axes.unicode_minus']=False

titles = ["CRIM","ZN","INDUS","CHAS","NOX","RM","AGE",
         "DIS","RAD","TAX","PTRATIO","B-1000","LSTAT","MEDV"]  #子标题名称存放在列表中

plt.figure(figsize=(12,12))  #设置绘图尺寸

for i in range(13):          #利用循环依次绘制13个属性与房价的关系散点图
    plt.subplot(4,4,(i+1))   #子图为4x4排列共16个图的位置，实际上只绘制了13个
    plt.scatter(train_x[:,i],train_y)  #绘制散点图
    plt.xlabel(titles[i])      #设置x轴标签文本
    plt.ylabel("Price($1000's)")  #设置y轴标签文本
    plt.title(str(i+1)+"."+titles[i]+"-Price")   #设置子图标题

plt.tight_layout()  #自动调整子图间隔
plt.suptitle("各个属性与房价的关系",x=0.5,y=1.02,fontsize=20) #设置全局标题
plt.show()   #显示绘图