数据可视化编程题练习
数据可视化编程部分练习pythonpython使用pandas、numpy、seaborn、matplotlib使用Seaborn绘制条形图,展示2014年12月31日北京地区PM2.5的变化情况。import seaborn as snsimport matplotlib.pyplot as pltimport pandas as pd# 请在下方作答 ###将数据框df_air中的time变量
·
数据可视化编程部分练习
python
使用pandas、numpy、seaborn、matplotlib
- 使用Seaborn绘制条形图,展示2014年12月31日北京地区PM2.5的变化情况。
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
# 请在下方作答 #
##将数据框df_air中的time变量转化为datetime格式
air["time"] = pd.to_datetime(air['time'])
##设置seaborn绘图风格
sns.set(style='ticks')
## 创建大小为(10, 5)的图形,返回Figure对象fig
fig = plt.figure(figsize = (10, 5))
## 添加X轴标签为time,字体大小为15
plt.xlabel('time',fontsize=15)
## 添加Y轴标签为PM2.5,字体大小为15
plt.ylabel('PM2.5',fontsize=15)
##设置图形的标题为PM2.5 of Beijing,字体大小为20
plt.title('PM2.5 of Beijing',fontsize=20)
##使用plot()函数绘制折线图
plt.plot(air['time'],air['PM2.5'])
plt.show()
- 使用seaborn包中的scatterplot()函数绘制分组散点图,展示传奇宠物小精灵与非传奇宠物小精灵攻击力与防御力之间的关系。
import matplotlib.pyplot as plt
import seaborn as sns
# 请在下方作答 #
##设置seaborn绘图风格和调色盘
sns.set(style="whitegrid")
##创建大小为(10, 5)的图形,返回Figure对象fig
fig = plt.figure(figsize = (10,5))
## 添加X轴标签为Attack,字体大小为15
plt.xlabel("Attack",fontsize=15)
## 添加Y轴标签为Defense,字体大小为15
plt.ylabel("Defense",fontsize=15)
##使用scatterplot()函数绘制分组散点图,使用参数hue进行分组
sns.scatterplot(data=data,x='Attack',y='Defense',hue='Legendary',palette='Set2')
- 使用Seaborn中的boxplot()函数绘制箱线图,展示不同学习时间的学生的期终成绩分布
import matplotlib.pyplot as plt
import seaborn as sns
##设置seaborn绘图风格
sns.set_style('whitegrid')
##创建大小为(8, 5)的图形,返回Figure对象fig
fig = plt.figure(figsize=(8,5))
##将X轴的刻度标签存储在列表中
order=['<2 hours','2 to 5 hours','5 to 10 hours','>10 hours']
##使用boxplot()函数绘制箱线图,使用参数order调整X轴刻度标签顺序
sns.boxplot(x='studytime',y='final score',data = data,order =['<2 hours','2 to 5 hours','5 to 10 hours','>10 hours'],color='b',showmeans=True,notch=True)
## 添加X轴标签为Study Time,字体大小为15
plt.xlabel('Study Time',fontsize = 15)
## 添加Y轴标签为Final Score,字体大小为15
plt.ylabel('Final Score',fontsize = 15)
- 数据集coronary一共包含11个特征,共462个样本点,字段及说明如下
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('coronary.csv')
## 创建大小为(10, 5)的图形,返回Figure对象fig
fig = plt.figure(figsize=(10, 5))
## 绘制折线图
Ldl = data['Ldl'][0:50]
plt.title('Line chart')
plt.plot(list(np.arange(50)),list(Ldl), color='deeppink', linestyle='--', marker='*')
- 数据集Candy_data.csv一共包含4个特征,共548个样本,描述1972年1月到2017年8月每月的糖果产量。数据集的字段描述如下
参考样图如下:
import pandas as pd
import matplotlib.pyplot as plt
data = pd.read_csv('Candy_data.csv')
## 创建大小为(20, 5)的图形,返回Figure对象fig
fig = plt.figure(figsize=(20,5))
## 添加Y轴标签
plt.ylabel('IPG3113N')
##设置图形的标题
plt.title('Line',fontsize=16)
##使用plot()函数绘制折线图
plt.plot(np.arange(548),data['IPG3113N'])
- 数据集winemag.csv一共包含10个特征,共150930个样本点,字段及说明如下:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
reviews = pd.read_csv("winemag.csv", index_col=0)
## 创建大小为(10, 5)的图形,返回Figure对象fig
fig = plt.figure(figsize=(10, 5))
## 提取数据
reviews_sort = reviews['variety'].value_counts(sort=True,ascending=False)
top5_variety = reviews_sort[0:5]
data_variety = reviews.loc[reviews['variety'].isin(list(top5_variety.index))]
data_variety = data_variety[['variety','points']]
## 绘图
sns.boxplot(x='variety',y='points',data=data_variety)
更多推荐
已为社区贡献1条内容
所有评论(0)