大众点评热门餐厅抓取与数据分析
大众点评抓取与分析
背景
有没有一种去其他城市旅游的时候想吃地方特色,但是却又不知道到该去哪里吃的感觉呢?反正我是有这种感觉,尤其是不想去其他城市却在泡面中度过,无法感受当地的美食特色,因此对大众点评热门城市热门店铺进行了数据获取,然后对想去的城市的网红店铺大众评分及各项指标进行了获取与分析。
页面分析
分析条目
我对上海,北京,广州,深圳,天津,杭州,南京,苏州,成都,武汉,重庆,西安等热门城市的排行前100的商铺进行数据获取,并分析最终所获取数据集。
1. 各大城市餐厅星级统计
从上图(各大城市餐厅星级统计与评分)可以看出大众点评中TOP100餐厅主要是以四星以上居多,注意这个四星是大众点评自己称谓,并不是星级酒店的称号。纵轴为该星级下该城市下餐厅数目,如上海四星半餐厅有45家。
2. 各大城市口味,环境,服务,及综合指数
根据大众点评城市列表页中美食商铺排行榜,我们可以获得每个店铺的“口味”、“环境”、“服务”,这些指数,我们根据这些指数求平均可得到综合评价,我们可以根据这些综合指标对商铺进行排名,最终得到TOP10商铺。
以北京地区为例首先得到各类指标走势图。
因为做了排序,所以100家商铺各项指标都由高到低,同时动态图上也可获得具体哪家餐厅比较好,因为这里静态图关系,无法演示。
然后我们对这100家商铺里排行最高的TOP10商家做词云绘制,如下。
同时得到各商铺具体评分。
具体城市商铺TOP10排行见附录《TOP10商铺排行详细信息》
3. 各大城市饭店集中区域
在分析数据过程中发现对于各商铺有两个字段较为关键,一个是商铺详细地址,一个是商铺所属城市区域,这样我们便可统计该城市下到底哪些区域排行较高的商铺比较集中。
以北京商铺为例,分析北京各个区内商铺多少家,可以看出主要集中在三里屯,当然可能也是三里屯的吃客们喜欢使用大众点评的缘故,所以信息较多。
商铺密集程度:
同样我们对各个城市都做了具体分析,完整图表见:
完整代码见:
/Liangchengdeye/DaZhongdianping/blob/master/daZhongFood/bin/foodClassArea.py
4. 菜品分类
既然对商铺区域进行了分类,那我们也可以对各个城市的菜品进行分类,看看吃客们都钟情于哪些菜,吃客们的菜品分类单也一定程度上说明了该城市这些菜要好吃一点哦。
如对成都进行分析可以发现,成都的吃客们还是比较钟情于川菜和火锅,其他中餐类就相对排行较低,这一结果也符合我们对四川人爱吃火锅这一观点的认知。
详细菜品分类:
对其他几个城市也做一个简单汇总。
根据以上图表可以发现,好像好多城市吃客们对日本料理都较为感兴趣,也许这些吃客们都喜欢用大众点评吧,哈哈,不过本土菜都很好吃的哦。排行中还有一个特点,有个东南亚菜,出现在各个城市榜单中,不过就没有日本料理排行高了,基本都属于垫底,还有个“串串香”,对,你没看错,貌似大家都爱吃的串串香也出于垫底位置哦,不过,情有可原哦,谁吃个串串香还会去点评点评呢,不都是出门左转,路边店铺就能吃到嘛,哈哈,所以以上统计还是特殊情况特殊对待。
5. 综合评价
以上都是本人综合各项指标进行的统计分析,那么每个吃客有每个不同的评判标准,因此我们对每个城市的每种美食的各项指标做了不同类别分析。吃客们可以根据自己的评判指标进行对自己喜爱商铺的分类了。
例如,我们以西安TOP10商铺进行分析。
“天素无届舒食餐厅”各项指标如下,吃客们根据自己的标准可以进行分析。
后记
每个城市都有每个城市独特的味道,也许这些味道并没有上排行榜,但是都真真切切的存在,可能是家的味道,可能是当地独有的特色味道,例如“肉夹馍”,每个城市都有,但是味道可能都不一样,到底好不好吃并不一定完全取决于这些数据,毕竟吃客们味蕾并不相同,但是这些数据指标也能给我们提供一定帮助,比如我去西安旅游,可是到底什么好吃,也许我并不知道,所以看看这些数据还是有助于防止我们踩坑。
附录《TOP10商铺排行详细信息》
我们对各个城市TOP10商铺进行了详细信息展示,主要有期大众网址,感兴趣的可以去瞅瞅具体店铺什么菜好吃哦。