背景介绍
我们知道再爬虫的过程中我们对于爬取到的网页数据需要进行解析,因为大多数数据是不需要的,所以我们需要进行数据解析,常用的数据解析方式有正则表达式,xpath,bs4,这次我们来介绍一下另一个数据解析库..., key:value, ... }的键值对的结构,在面向对象的语言中,key为对象的属性,value为对应的属性值,所以很容易理解,取值方法为 对象.key 获取属性值,这个属性值的类型可以是数字、字符串...,取值方式和所有语言中一样,使用索引获取,字段值的类型可以是 数字、字符串、数组、对象几种。...-8')
json.dump(json_info,file)
结果如下:
ceshii,json(目录文件产生)
三、JsonPath
JsonPath 是一种信息抽取类库,是从JSON文档中抽取指定信息的工具...() 支持过滤操作.
n/a () 支持表达式计算
() n/a 分组,JsonPath不支持
四、案例测试
我们爬取淘票票官网的城市信息,保存为json文件,进行jsonpath语法测试,获取所有城市名称