前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >在Python中操纵json数据的最佳方式

在Python中操纵json数据的最佳方式

作者头像
派大星的数据屋
发布于 2022-04-03 06:05:44
发布于 2022-04-03 06:05:44
4.5K00
代码可运行
举报
运行总次数:0
代码可运行

❝本文示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes ❞

1 简介

在日常使用Python的过程中,我们经常会与json格式的数据打交道,尤其是那种嵌套结构复杂的json数据,从中抽取复杂结构下键值对数据的过程枯燥且费事。

而熟悉xpath的朋友都知道,对于xml格式类型的具有层次结构的数据,我们可以通过编写xpath语句来灵活地提取出满足某些结构规则的数据。

类似的,JSONPath也是用于从json数据中按照层次规则抽取数据的一种实用工具,在Python中我们可以使用jsonpath这个库来实现JSONPath的功能。

2 在Python中使用JSONPath提取json数据

jsonpath是一个第三方库,所以我们首先需要通过pip install jsonpath对其进行安装。

2.1 一个简单的例子

安装完成后,我们首先来看一个简单的例子,从而初探其使用方式:

这里使用到的示例json数据来自高德地图步行导航接口,包含了从天安门广场到西单大悦城的步行导航结果,原始数据如下,层次结构较深:

假如我想要获取其嵌套结构中steps键值对下每段行程的耗时duration数据,配合jsonpath就可以这样做:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import json
from jsonpath import jsonpath

# 读入示例json数据
with open('json示例.json', encoding='utf-8') as j:
    demo_json = json.loads(j.read())

# 配合JSONPath表达式提取数据
jsonpath(demo_json, '$..steps[*].duration')

其中$..steps[*].duration就是我们用于描述数据位置规则的JSONPath语句,配合jsonpath()便可以提取出对应信息,下面我们就来学习jsonpath中支持的常用JSONPath语法:

2.2 jsonpath中的常用JSONPath语法

为了满足日常提取数据的需求,JSONPath中设计了一系列语法规则来实现对目标值的定位,其中常用的有:

  • 「按位置选择节点」

jsonpath中主要有以下几种按位置选择节点的方式:

功能

语法

根节点

$

当前节点

@

子节点

.或[]

任意子节点

*

任意后代节点

..

让我们来演示一下它们的一些用法:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 提取所有duration键对应值
jsonpath(demo_json, '$..duration')
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 提取所有steps键的子节点对应instruction值
jsonpath(demo_json, '$..steps.*.instruction')
  • 「索引子节点」

有些时候我们需要在选择过程中对子节点做多选或按位置选择操作,就可以使用到jsonpath中的相关功能:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 多选所有steps键的子节点对应的instruction与action值
jsonpath(demo_json, '$..steps.*[instruction,action]')
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 选择steps键的第0个子节点对应的instruction与action值
jsonpath(demo_json, '$..steps[0][instruction,action]')

# 选择steps键的第13(不包括3)个子节点对应的instruction与action值
jsonpath(demo_json, '$..steps[1:3][instruction,action]')

# 配合@,选择steps键的最后一个子节点对应的instruction与action值
jsonpath(demo_json, '$..steps[(@.length-1)][instruction,action]')
  • 「条件筛选」

有些时候我们需要根据子节点的某些键值对值,对选择的节点进行筛选,在jsonpath中支持常用的==!=><等比较运算符,以==比较符为例,这里配合@定位符从当前节点提取子节点,语法为?(@.键名 比较符 值)

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 找到所有steps子节点中orientation为“西”的
jsonpath(demo_json, '$..steps[?(@.orientation == "西")]')

而如果想要提取所有具有指定键的节点,可以参考下面的例子:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 找到所有具有polyline键的节点对应的polyline与road键对应值
jsonpath(demo_json, '$..[?(@.polyline)][polyline,road]')

2.3 返回结果的形式

在前面的例子中,我们所有的返回结果直接就是提取到的满足条件的结果,而jsonpath()中还提供了另一种特殊的结果返回形式,只需要设置参数result_type=None就可以改直接返回结果为返回每个结果的JSONPath表达式:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 获取结果的JSONPath表达式
jsonpath(demo_json, '$..[?(@.polyline)][polyline,road]', result_type=None)

以上介绍的均为jsonpath库中的常规功能,可以满足基础的json数据提取需求,而除了jsonpath之外,还有其他具有更加丰富拓展功能的JSONPath类的第三方库,可以帮助我们实现很多进阶灵活的操作,我们将在下一篇文章中继续讨论。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-08-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python大数据分析 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
java hashCode是什么?有什么作用?
hashCode() 是一个Java中的方法,它返回对象的哈希码(hash code)。hashCode是由对象根据其特征属性计算得出的一个整数值。它用于快速识别对象并在哈希表等数据结构中进行高效的存储和检索。
高久峰
2023/07/13
1.3K0
探索对象的奥秘:解析Java中的Object类,有两下子!
咦咦咦,各位小可爱,我是你们的好伙伴——bug菌,今天又来给大家普及Java SE相关知识点了,别躲起来啊,听我讲干货还不快点赞,赞多了我就有动力讲得更嗨啦!所以呀,养成先点赞后阅读的好习惯,别被干货淹没了哦~
bug菌
2024/07/02
2280
探索对象的奥秘:解析Java中的Object类,有两下子!
在根类Object中,实现了equals()和hashCode()这两个方法
在根类Object中,实现了equals()和hashCode()这两个方法   equals()是对两个对象的地址值进行的比较(即比较引用是否相同),用==实现。   hashCode():计算出对象实例的哈希码。根类Object的hashCode()方法的计算依赖于对象实例的内存地址,即内存地址由哈希函数生成一个int值,故每个Object对象的hashCode都是唯一的;当然,当对象所对应的类重写了hashCode()方法时,结果就截然不同了。之所以有hashCode方法,是因为在批量的对象比较中,hashCode要比equals来得快,很多集合都用到了hashCode,比如Hashtable。
用户7365393
2021/10/07
6170
Java实战入门:深入解析Java中的hashCode()方法
在Java编程中,hashCode()方法是一个非常重要的方法,尤其是在涉及到集合类(如HashMap、HashSet等)时。本文将详细解析Java中的hashCode()方法,包括其定义、作用、如何正确实现、以及它在实际应用中的重要性。 取材自该网站:Java方法
E绵绵
2024/05/31
1.1K0
为什么重写 equals() 时必须重写 hashCode() 方法?(简单易理解)
所以在涉及到hashcode的容器中(比如HashSet),判断自己是否持有该对象时,会先检查hashCode是否相等,如果hashCode不相等,就会直接认为不相等,并存入容器中,不会再调用equals进行比较。
人不走空
2024/02/20
1.4K0
为什么重写 equals() 时必须重写 hashCode() 方法?(简单易理解)
9. 说说hashCode() 和 equals() 之间的关系?
hashCode() 的作用是获取哈希码,也称为散列码;它实际上是返回一个int整数。这个哈希码的作用是确定该对象在哈希表中的索引位置。
用户11332765
2024/10/28
960
9. 说说hashCode() 和 equals() 之间的关系?
Object类的常见方法总结
Object 类是 Java 中所有类的父类,每个类都直接或间接地继承自 Object 类。Object 类中定义了一些常用的方法,这些方法在 Java 编程中非常有用。以下是 Object 类中的一些常见方法及其用途:
代码小李
2025/01/30
1130
【JavaSE专栏37】Java常用类 Object 解析,万物皆对象
本文讲解了 Java 中常用类 Object 的语法、使用说明和应用场景,并给出了样例代码。
Designer 小郑
2023/08/02
1640
【JavaSE专栏37】Java常用类 Object 解析,万物皆对象
深入了解Java中的Object类
今天我要给大家分享一些自己日常学习到的一些知识点,并以文字的形式跟大家一起交流,互相学习,一个人虽可以走的更快,但一群人可以走的更远。
喵手
2023/11/18
3300
深入了解Java中的Object类
【面试题精讲】为什么重写equals时必须重写hashCode方法?
面试题手册: https://store.amazingmemo.com/chapterDetail/1685324709017001
程序员朱永胜
2023/10/08
4660
equals和hashcode
才学java的时候,打印某个对象是打印的一串莫名其妙的数字,后来知道这个是hashcode,就以为hashcode是对象的某个地址信息,直到看了一些文章才发现事实并非如此。
leobhao
2022/06/28
5850
Java HashCode详解
一、为什么要有Hash算法 Java中的集合有两类,一类是List,一类是Set。List内的元素是有序的,元素可以重复。Set元素无序,但元素不可重复。要想保证元素不重复,两个元素是否重复应该依据什么来判断呢?用Object.equals方法。但若每增加一个元素就检查一次,那么当元素很多时,后添加到集合中的元素比较的次数就非常多了。也就是说若集合中已有1000个元素,那么第1001个元素加入集合时,它就要调用1000次equals方法。这显然会大大降低效率。于是Java采用了哈希表的原理。哈希(Hash)
汤高
2018/01/11
4.1K0
Java HashCode详解
Object类
java.lang.Object类是类层次结构的根类,每个类(除了Object类本身)都使用Object类作为超类。一个类如果没有显示声明继承另一个类,则相当于默认继承了Object类。换句话说,Object类的变量可以接收任意类型的对象。Java规定Object[]可以接收任意类型对象的数组,但是不能接收基本数据类型的数组。
别团等shy哥发育
2023/02/25
4870
Object类
【JAVA-Day37】Java中Object的使用解析
在本篇技术博客中,我们将深入探讨Java中Object类的各个方面,包括其定义、核心方法以及在实际应用中的应用场景。通过详细分析,我们将更好地理解和利用Java中的Object类。下面,让我们逐一研究各个内容模块。
默 语
2024/11/20
1840
【JAVA-Day37】Java中Object的使用解析
JAVA中重写equals()方法为什么要重写hashcode()方法说明
重写hashCode()时最重要的原因就是:无论何时,对同一个对象调用hashCode()都应该生成同样的值。如果在将一个对象用put()方法添加进HashMap时产生一个hashCode()值,而用get()取出时却产生了另外一个 hashCode()值,那么就无法重新取得该对象了。所以,如果你的hashCode()方法依赖于对象中易变的数据,那用户就要小心了,因为此数据发生变化时,hashCode()就会产生一个不同的hash码,相当于产生了一个不同的“键”。        Object的hashCode()方法,返回的是当前对象的内存地址。下次如果我们需要取一个一样的“键”对应的键值对的时候,我们就无法得到一样的hashCode值了。因为我们后来创建的“键”对象已经不是存入HashMap中的那个内存地址的对象了。        我们看一个简单的例子,就能更加清楚的理解上面的意思。假定我们写了一个类:Person (人),我们判断一个对象“人”是否指向同一个人,只要知道这个人的身份证号一直就可以了。        先来个没有重写Code类的hashcode()的例子吧,看看是什么效果:
bear_fish
2018/09/20
1.2K0
JAVA中重写equals()方法为什么要重写hashcode()方法说明
【面试题精讲】hashCode有什么用?
hashCode() 是 Java 中的一个方法,它用于返回对象的哈希码。哈希码是根据对象的内容计算出来的一个整数值。
程序员朱永胜
2023/10/08
4680
Object.hashCode() 详解
在Java编程中,hashCode方法是一个常见而重要的概念。它通常用于哈希表、集合以及一些需要高效检索数据的数据结构中。然而,对于许多开发者来说,hashCode方法可能是一个容易被忽略或者被简单实现的部分。在本文中,我们将深入探讨Java中hashCode的一些思考,以便更好地理解其背后的原理和影响。
修己xj
2023/12/26
3950
Object.hashCode() 详解
面试官:重写 equals 时为什么一定要重写 hashCode?
equals 方法和 hashCode 方法是 Object 类中的两个基础方法,它们共同协作来判断两个对象是否相等。为什么要这样设计嘞?原因就出在“性能” 2 字上。​
磊哥
2021/12/05
20.7K0
面试官:重写 equals 时为什么一定要重写 hashCode?
【IT领域新生必看】Java编程中的神奇对比:深入理解`equals`与`==`的区别
在Java编程中,比较对象是一个常见的操作。equals和==是两种常用的比较方式,但它们的工作原理和应用场景有所不同。对于初学者来说,理解equals与==的区别,是编写正确和高效代码的关键一步。本篇文章将详细介绍equals与==的定义、用法及其区别,帮助你全面理解这些重要概念。
E绵绵
2024/07/08
3700
Java基础提升篇:equals()与hashCode()方法详解
概述 java.lang.Object类中有两个非常重要的方法: 1public boolean equals(Object obj) 2public int hashCode() 3 Object类是类继承结构的基础,所以是每一个类的父类。所有的对象,包括数组,都实现了在Object类中定义的方法。 equals()方法详解 equals()方法是用来判断其他的对象是否和该对象相等. equals()方法在object类中定义如下: 1public boolean equals(Object obj)
好好学java
2018/07/02
4270
相关推荐
java hashCode是什么?有什么作用?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验