数据提取与IP查询、数据异常与清洗、评论数变化情况分析,本文继续对地理信息进行处理,并分别提取出省份和城市数据,从而可以用 pyecharts 进行地图可视化。...', '甘肃', '美国德克萨斯州', '美国俄亥俄州', '河北张家口', '美国佛罗里达州', '广东珠海', '瑞典', '江西鹰潭', '广西钦州', '江西', '新疆巴音郭楞蒙古自治州',...'甘肃天水', '湖南永州', '美国密歇根州', '安徽蚌埠', '安徽铜陵', '河南焦作', '安徽马鞍山', '美国田纳西州']
地理信息的处理,算是本系列文章的一大亮点...现在看来,这回的数据真的算好的了,地理信息都是真实的,不会有用户自定义、瞎填的情况出现;格式较为统一,而且数据量也小,再不济,哪怕手动提取省份和城市也不是不可以......的列表,用来存储出现过的海外国家,然后遍历所有的337条area_name元素,包含这些国家名的就添加到drop列表里,然后根据其他国内的地理信息的长度分别打印出来,这样数据就清晰多了!