之前看过一篇数据分析教程,是,把上海晚上10点之后的商店数据搜索出来,然后数据可视化,形成热力图。觉得挺有意思,就如法炮制,制作一个
分析思路
南阳的夜晚去哪儿浪?那就要先想想,晚上还有哪些场所还在营业了,自然逃不过酒吧、KTV、咖啡馆、电影院、洗浴中心……选定这几个关键词,先用百度POI数据爬取插件,进行数据搜索,然后利用BDP进行可视化操作。
先把结果放出来看看效果吧。颜色越深,就说明数量越多,图中可以看出,工业北路、人民北路、泰山路、独山大道中段、中达路附近比较集中。
数据搜集及加工
根据关键词,先用百度POI数据插件爬取数据,这个插件是个小爬虫工具,把商店名称、坐标和地址都爬取出来了,挺好用的,不过,他的搜索最低范围是市级。将搜到的数据,分别复制到excel表中,然后使用数据分列将内容进行拆分。加工之后发现,酒吧共49个,咖啡店98个,KTV162个,洗浴中心595个,数据和实际会有偏差,比如搜索重复或者部分已经关店了,不过也能反映一些问题了……
数据可视化
利用BDP数据分析个人版,将整理好的excel表上传到后台,然后操作仪表盘,生成热力图就可以了。具体操作步骤,网站有详细视频介绍,这里就不再赘述。
先看下南阳洗浴会所的热力图,这几个红点的位置记清了吗,哈哈。
酒吧、KTV、咖啡店数量不多且分散,合到一起看下:集中在市中心了。
最后是4个场所的叠加热力图。
应用延伸
数据可视化之后,效果直观并且高大上。应用的地方非常多,比如你想在当地开一家店,可以利用热力图,分析下人口密度、消费力水平、已开店数量等因素,为你的选址提供更科学的依据。
领取专属 10元无门槛券
私享最新 技术干货