100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > python数据分析实战项目—运用matplotlib可视化分析10000条北京各大区二手房区域信息

python数据分析实战项目—运用matplotlib可视化分析10000条北京各大区二手房区域信息

时间:2019-06-26 13:03:26

相关推荐

python数据分析实战项目—运用matplotlib可视化分析10000条北京各大区二手房区域信息

文章目录

开发工具数据内容实现代码运行效果10000条二手房信息下载地址总结

开发工具

python版本:Python 3.6.1

python开发工具:JetBrains PyCharm .3.6 x64

第三方库:pandas ;matplotlib ;seaborn

数据内容

实现代码

import pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltplt.style.use('fivethirtyeight')sns.set_style({'font.sans-serif': ['simhei', 'Arial']})lianjia_df = pd.read_csv('lianjia.csv')# 添加房屋均价: 总价/房屋大小df = lianjia_df.copy()df['PerPrice'] = round(lianjia_df['Price'] / lianjia_df['Size'], 2)# 重新摆放列位置columns = ['Region', 'District', 'Garden', 'Layout', 'Floor', 'Year', 'Size', 'Elevator', 'Direction', 'Renovation','PerPrice', 'Price']df = pd.DataFrame(df, columns=columns)# 二手房区域分组对比二手房数量和每平米价格df_house_count = df.groupby('Region')['Price'].count().sort_values(ascending=False).to_frame().reset_index()df_house_mean = df.groupby('Region')['PerPrice'].mean().sort_values(ascending=False).to_frame().reset_index()f, [ax1, ax2, ax3] = plt.subplots(3, 1, figsize=(20, 20))# 每平米单价对比图sns.barplot(x='Region', y='PerPrice', palette='Blues_d', data=df_house_mean, ax=ax1)ax1.set_title('北京各大区二手房每平米单价对比', fontsize=15)ax1.set_xlabel('区域')ax1.set_ylabel('每平米单价')# 各区域二手房数量sns.barplot(x='Region', y='Price', palette='Greens_d', data=df_house_count, ax=ax2)ax2.set_title('北京各大区二手房数量对比', fontsize=15)ax2.set_xlabel('区域')ax2.set_ylabel('数量')# 各区域二手房房屋总价sns.boxplot(x='Region', y='Price', data=df, ax=ax3)ax3.set_title('北京各大区二手房房屋总价', fontsize=15)ax3.set_xlabel('区域')ax3.set_ylabel('房屋总价')plt.show()

运行效果

从第一个区域与每平米单价图中可以看到,西城、东城和海淀地区价格相对较高

从第二个区域与数量图中可以看到,海淀,朝阳,丰台和昌平数量都在2500以上

从第三个区域与总价图中可以看到,总价的平均价格都在1000以下

10000条二手房信息下载地址

/f/13238771-530323628-1950bb

(访问密码:8835)

总结

这里主要运用了python的barplot绘制条形图函数和boxplot箱线图函数分析区域与每平米价格、数量和房屋总价的关系

python数据分析实战项目—运用matplotlib可视化分析10000条北京各大区二手房区域信息(附源码)

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。