深度学习_Tensorflow2.0_Matplotlib_波士顿房价数据集可视化
波士顿房价数据集可视化1.Keras是一个高层的神经网络和深度学习库。可以快速搭建神经网络模型,非常易于调试和扩展。TensorFlow的官方API内置了一些常用的公共数据集,可以通过keras.datasets模块加载和访问。Keras中集成的数据集序号名称说明1boston_housing波士顿房价数据集2CIFAR1010种类别的图片集3CIFAR100100种类别的图片集4MNIST手写数
·
波士顿房价数据集可视化
1.Keras
- 是一个高层的神经网络和深度学习库。
- 可以快速搭建神经网络模型,非常易于调试和扩展。
- TensorFlow的官方API
- 内置了一些常用的公共数据集,可以通过keras.datasets模块加载和访问。
Keras中集成的数据集
| 序号 | 名称 | 说明 |
|---|---|---|
| 1 | boston_housing | 波士顿房价数据集 |
| 2 | CIFAR10 | 10种类别的图片集 |
| 3 | CIFAR100 | 100种类别的图片集 |
| 4 | MNIST | 手写数字图片集 |
| 5 | Fashion-MNIST | 10种时尚类别的图片集 |
| 6 | IMDB | 电影点评数据集 |
| 7 | reuters | 路透社新闻数据集 |
3.波士顿房价数据集
- 卡内基梅隆大学,StatLib库,1978年
- 涵盖了麻省波士顿的506个不同郊区的房屋数据
- 404条训练数据集,102条测试数据集
- 每条数据14个字段,包含13个属性,和1个房价的平均值
| 序号 | 变量名 | 说 明 | 示 例 |
|---|---|---|---|
| 1 | CRIM | 城镇人均犯罪率 | 0.00632 |
| 2 | ZN | 超过25000平方英尺的住宅用地所占比例 | 18.0 |
| 3 | INDUS | 城镇非零售业的商业用地所占比例 | 2.31 |
| 4 | CHAS | 是否被Charles河流穿过(取值1:是;取值0:否) | 0 |
| 5 | NOX | 一氧化碳浓度 | 0.538 |
| 6 | RM | 每栋住宅的平均房间数 | 6.575 |
| 7 | AGE | 早于1940年建成的自住房屋比例 | 65.2 |
| 8 | DIS | 到波士顿5个中心区域的加权平均距离 | 4.0900 |
| 9 | RAD | 到达高速公路的便利指数 | 1 |
| 10 | TAX | 每10000美元的全值财产税率 | 296 |
| 11 | PTRATIO | 城镇中师生比例 | 15.3 |
| 12 | B | 反映城镇中的黑人比例的指标,越靠近0.63越小;B=1000*(BK-0.63) 2 ,其中BK是黑人的比例。 | 396.90 |
| 13 | LSTAT | 低收入人口的比例 | 7.68 |
| 14 | MEDV | 自住房屋房价的平均房价(单位为1000美元) | 24.0 |
4.加载数据集
.load_data()方法
- 本地默认路径
- C:\Users\user_name.keras\datasets
- C:\Users\Administrator.keras\datasets\boston_housing.npz
#波士顿房价数据集可视化完整代码
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
boston_housing = tf.keras.datasets.boston_housing
#tf.keras.datasets前缀,为keras在TensorFlow中的实现
#boston_housing 数据集名称
#改变数据集划分比例
(train_x,train_y),(_,_) = boston_housing.load_data(test_split=0)
#test_split=0 即测试集所占全部数据集的比例
#因为测试集也作为了数据集,后期不再使用测试集,故用_这个变量表示测试集
plt.rcParams['font.sans-serif']=['SimHei'] #中文字体配置
plt.rcParams['axes.unicode_minus']=False
titles = ["CRIM","ZN","INDUS","CHAS","NOX","RM","AGE",
"DIS","RAD","TAX","PTRATIO","B-1000","LSTAT","MEDV"] #子标题名称存放在列表中
plt.figure(figsize=(12,12)) #设置绘图尺寸
for i in range(13): #利用循环依次绘制13个属性与房价的关系散点图
plt.subplot(4,4,(i+1)) #子图为4x4排列共16个图的位置,实际上只绘制了13个
plt.scatter(train_x[:,i],train_y) #绘制散点图
plt.xlabel(titles[i]) #设置x轴标签文本
plt.ylabel("Price($1000's)") #设置y轴标签文本
plt.title(str(i+1)+"."+titles[i]+"-Price") #设置子图标题
plt.tight_layout() #自动调整子图间隔
plt.suptitle("各个属性与房价的关系",x=0.5,y=1.02,fontsize=20) #设置全局标题
plt.show() #显示绘图

更多推荐



所有评论(0)