首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

(六)Python:Pandas中的DataFrame

目录 基本特征 创建 自动生成行索引 自定义生成行索引 使用 索引与值 基本操作 统计功能  ---- 基本特征 一个表格型的数据结构 含有一组有序的列(类似于index) 大致可看成共享同一个index...“del 数据”的方式进行,但这种方式是直接对原始数据操作,不是很安全,pandas 中可利用 drop()方法删除指定轴上的数据,drop()方法返回一个新的对象,不会直接修改原始数据。...5000, 'tax': 0.05} print(aDF) print("===============================") print(aDF.drop(5)) # 返回删除第5行的数据...,可以改变原来的数据,代码如下: import pandas as pd import numpy as np data = np.array([('xiaoming', 4000), ('xiaohong...对象的修改和删除还有很多方法,在此不一一列举,有兴趣的同学可以自己去找一下 统计功能  DataFrame对象成员找最低工资和高工资人群信息          DataFrame有非常强大的统计功能,它有大量的函数可以使用

3.8K20

盘点一个Pandas数据分组的问题

一、前言 前几天在Python白银交流群【上海新年人】问了一个Pandas数据分组的问题,问题如下: list1 = '电子税票号码 征收税务机关 社保经办机构 单位编号 费种 征收品目 征收子目 费款所属期...【上海新年人】:对的草莓大哥,我想要的是每组都有一个行标签,想要的是这样子的效果。 【论草莓如何成为冻干莓】:那你这个想用concat来操作可能不太行,你直接分组写入到excel表吧。...【论草莓如何成为冻干莓】:你分组写入就不用重新赋值了,可以直接写入。 【上海新年人】:哦,我想想。 如果你也有类似这种Python相关的小问题,欢迎随时来交流群学习交流哦,有问必答!...这篇文章主要盘点了一个Python网络爬虫的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。...最后感谢粉丝【大写一个Y】提出的问题,感谢【PI】给出的思路,感谢【莫生气】等人参与学习交流。

8510
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    掌握pandas中的时序数据分组运算

    pandas分析处理时间序列数据时,经常需要对原始时间粒度下的数据,按照不同的时间粒度进行分组聚合运算,譬如基于每个交易日的股票收盘价,计算每个月的最低和最高收盘价。...图1 2 在pandas中进行时间分组聚合 在pandas中根据具体任务场景的不同,对时间序列进行分组聚合可通过以下两类方式实现: 2.1 利用resample()对时序数据进行分组聚合 resample...原始的意思是「重采样」,可分为「上采样」与「下采样」,而我们通常情况下使用的都是「下采样」,也就是从高频的数据中按照一定规则计算出更低频的数据,就像我们一开始说的对每日数据按月汇总那样。...如果你熟悉pandas中的groupby()分组运算,那么你就可以很快地理解resample()的使用方式,它本质上就是在对时间序列数据进行“分组”,最基础的参数为rule,用于设置按照何种方式进行重采样...我们对index为日期时间类型的DataFrame应用resample()方法,传入的参数'M'是resample第一个位置上的参数rule,用于确定时间窗口的规则,譬如这里的字符串'M'就代表「月且聚合结果中显示对应月的最后一天

    3.4K10

    盘点Pandas数据分组后常见的一个问题

    一、前言 前几天在Python最强王者交流群【郎爱君】问了一个Pandas的问题,报错结果如下图所示。...下图是代码: 下图是报错信息: 二、实现过程 这个问题倒是不难,不经常使用分组的小伙伴可能很难看出来问题,但是对于经常使用的大佬来说,这个问题就很常见了。...这里【月神】直截了当的指出了问题,如下图所示,一起来学习下吧! 将圈圈内的两个变量,用中括号括起来就可以了。 完美地解决粉丝的问题! 三、总结 大家好,我是皮皮。...这篇文章主要盘点了一个pandas的基础问题,文中针对该问题给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。...最后感谢粉丝【封代春】提问,感谢【月神】给出的思路和代码解析,感谢【dcpeng】等人参与学习交流。

    56210

    pandas | 如何在DataFrame中通过索引高效获取数据?

    今天是pandas数据处理专题第三篇文章,我们来聊聊DataFrame中的索引。 上篇文章当中我们简单介绍了一下DataFrame这个数据结构的一些常见的用法,从整体上大概了解了一下这个数据结构。...数据准备 上一篇文章当中我们了解了DataFrame可以看成是一系列Series组合的dict,所以我们想要查询表中的某一列,也就是查询某一个Series,我们只需要像是dict一样传入key值就可以查找了...不仅如此,loc方法也是支持切片的,也就是说虽然我们传进的是一个字符串,但是它在原数据当中是对应了一个位置的。我们使用切片,pandas会自动替我们完成索引对应位置的映射。 ?...总结 今天主要介绍了loc、iloc和逻辑索引在pandas当中的用法,这也是pandas数据查询最常用的方法,也是我们使用过程当中必然会用到的内容。建议大家都能深刻理解,把它记牢。...很多人在学习pandas的前期遇到最多的一个问题就是会把iloc和loc记混淆,搞不清楚哪个是索引查询哪个是行号查询。

    13.6K10

    【数据处理包Pandas】DataFrame的创建

    一、DataFrame简介   DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。...index:行索引,用于指定行的标签,默认为整数索引。 columns:列索引,用于指定列的标签,默认为整数索引。 dtype:数据类型,用于指定DataFrame中的数据类型,默认为None。...NumPy 库和 Pandas 库: import numpy as np import pandas as pd 二、基于一维数据创建 DataFrame对象看成一维对象的有序序列,序列中的对象元素又分成按列排列和按行排列两种情况...(二)按行排列 按行排列,需要基于列表构建:列表中的元素可以是一维 Series 对象、一维列表、一维 Numpy 数组或字典都行。...字符串在 Pandas 中被处理成object类型的对象。

    6700

    Pandas DataFrame 中的自连接和交叉连接

    有很多种不同种类的 JOINS操作,并且pandas 也提供了这些方式的实现来轻松组合 Series 或 DataFrame。...自连接 顾名思义,自连接是将 DataFrame 连接到自己的连接。也就是说连接的左边和右边都是同一个DataFrame 。自连接通常用于查询分层数据集或比较同一 DataFrame 中的行。...注:如果我们想排除Regina Philangi ,可以使用内连接"how = 'inner'" 我们也可以使用 pandas.merge () 函数在 Pandas 中执行自连接,如下所示。...这个示例数据种两个 DataFrame 都没有索引所以使用 pandas.merge() 函数很方便。...总结 在本文中,介绍了如何在Pandas中使用连接的操作,以及它们是如何在 Pandas DataFrame 中执行的。这是一篇非常简单的入门文章,希望在你处理数据的时候有所帮助。

    4.3K20

    pandas | 详解DataFrame中的apply与applymap方法

    今天是pandas数据处理专题的第5篇文章,我们来聊聊pandas的一些高级运算。...今天这篇文章我们来聊聊dataframe中的广播机制,以及apply函数的使用方法。 dataframe广播 广播机制我们其实并不陌生, 我们在之前介绍numpy的专题文章当中曾经介绍过广播。...比如我们可以这样对DataFrame当中的某一行以及某一列应用平方这个方法。 ? 另外,apply中函数的作用域并不只局限在元素,我们也可以写出作用在一行或者是一列上的函数。...最后我们来介绍一下applymap,它是元素级的map,我们可以用它来操作DataFrame中的每一个元素。比如我们可以用它来转换DataFrame当中数据的格式。 ?...总结 今天的文章我们主要介绍了pandas当中apply与applymap的使用方法, 这两个方法在我们日常操作DataFrame的数据非常常用,可以说是手术刀级的api。

    3K20

    python下的Pandas中DataFrame基本操作(二),DataFrame、dict、array构造简析

    DataFrame简介:   DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。...跟其他类似的数据结构相比(如R的data.frame),DataFrame中面向行和面向列的操作基本上是平衡的。...其实,DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。...导入基本python库: import numpy as np import pandas as pd DataFrame构造:   1:直接传入一个由等长列表或NumPy数组组成的字典; dict...7 subkey2 2 5 8 subkey3 3 6 9 请务必保证嵌套字典的key的一致性,不然的话,数据会异常,但不会显式的报错,而是显示出NaN,

    5.9K30

    数据分析-Pandas DataFrame的连接与追加

    微信公众号:yale记 关注可了解更多的教程问题或建议,请公众号留言。 背景介绍 今天我们学习多个DataFrame之间的连接和追加的操作,在合并DataFrame时,您可能会考虑很多目标。...或者您可能希望添加更多列,我们现在将开始介绍两种主要合并DataFrame的方式:连接和追加。 ? 入门示例 ? ? ? ? ?...代码片段: # ## Dataframe的连接和追加数据 # In[23]: import pandas as pd # In[24]: df1 = pd.DataFrame({'num':[60,20,80,90...# In[27]: concat_df = pd.concat([df1,df2]) concat_df # ## 连接三个dataframe # In[28]: concat_df_all = pd.concat...([df1,df2,df3],sort=False) concat_df_all # ## 使用append()追加dataframe # In[29]: df4 = df1.append(df2) df4

    13.8K31
    领券