首页
学习
活动
专区
圈层
工具
发布

(六)Python:Pandas中的DataFrame

DataFrame也能自动生成行索引,索引从0开始,代码如下所示: import pandas as pd data = {'name': ['aaaaaa', 'bbbbbb', 'cccccc']...的行索引、列索引和值,代码如下所示: import pandas as pd import numpy as np data = np.array([('aaaa', 4000), ('bbbb',...admin  2 3  admin  3 另一种删除方法     name  a 1  admin  1 3  admin  3 (1)添加列         添加列可直接赋值,例如给 aDF 中添加...,但这种方式是直接对原始数据操作,不是很安全,pandas 中可利用 drop()方法删除指定轴上的数据,drop()方法返回一个新的对象,不会直接修改原始数据。...对象的修改和删除还有很多方法,在此不一一列举,有兴趣的同学可以自己去找一下 统计功能  DataFrame对象成员找最低工资和高工资人群信息          DataFrame有非常强大的统计功能,它有大量的函数可以使用

5.6K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    pandas | DataFrame中的排序与汇总方法

    今天是pandas数据处理专题的第六篇文章,我们来聊聊DataFrame的排序与汇总运算。...在上一篇文章当中我们主要介绍了DataFrame当中的apply方法,如何在一个DataFrame对每一行或者是每一列进行广播运算,使得我们可以在很短的时间内处理整份数据。...排序 排序是我们一个非常基本的需求,在pandas当中将这个需求进一步细分,细分成了根据索引排序以及根据值排序。我们先来看看Series当中的排序方法。...Series当中的排序方法有两个,一个是sort_index,顾名思义根据Series中的索引对这些值进行排序。另一个是sort_values,根据Series中的值来排序。...排名 有的时候我们希望得到元素的排名,我们会希望知道当前元素在整体当中排第几,pandas当中也提供了这个功能,它就是rank方法。 ?

    5.8K50

    pandas DataFrame的创建方法

    pandas DataFrame的增删查改总结系列文章: pandas DaFrame的创建方法 pandas DataFrame的查询方法 pandas DataFrame行或列的删除方法 pandas...DataFrame的修改方法 在pandas里,DataFrame是最经常用的数据结构,这里总结生成和添加数据的方法: ①、把其他格式的数据整理到DataFrame中; ②在已有的DataFrame...字典类型读取到DataFrame(dict to DataFrame) 假如我们在做实验的时候得到的数据是dict类型,为了方便之后的数据统计和计算,我们想把它转换为DataFrame,存在很多写法,这里简单介绍常用的几种...2. csv文件构建DataFrame(csv to DataFrame) 我们实验的时候数据一般比较大,而csv文件是文本格式的数据,占用更少的存储,所以一般数据来源是csv文件,从csv文件中如何构建...中删除N列或者N行)(在DataFrame中查询某N列或者某N行)(在DataFrame中修改数据)

    3.4K20

    Pandas中的数据转换

    .*", " ") 再来看下分割操作,例如根据空字符串来分割某一列 user_info.city.str.split(" ") 分割列表中的元素可以使用 get 或 [] 符号进行访问: user_info.city.str.split...Series中的每个字符串 slice_replace() 用传递的值替换每个字符串中的切片 count() 计数模式的发生 startswith() 相当于每个元素的str.startswith(pat...) endswith() 相当于每个元素的str.endswith(pat) findall() 计算每个字符串的所有模式/正则表达式的列表 match() 在每个元素上调用re.match,返回匹配的组作为列表...常用到的函数有:map、apply、applymap。 map 是 Series 中特有的方法,通过它可以对 Series 中的每个元素实现转换。...(c)将(b)中的ID列结果拆分为原列表相应的5列,并使用equals检验是否一致。

    1.3K10

    Pandas DataFrame 中的自连接和交叉连接

    有很多种不同种类的 JOINS操作,并且pandas 也提供了这些方式的实现来轻松组合 Series 或 DataFrame。...自连接 顾名思义,自连接是将 DataFrame 连接到自己的连接。也就是说连接的左边和右边都是同一个DataFrame 。自连接通常用于查询分层数据集或比较同一 DataFrame 中的行。...注:如果我们想排除Regina Philangi ,可以使用内连接"how = 'inner'" 我们也可以使用 pandas.merge () 函数在 Pandas 中执行自连接,如下所示。...df_manager2 的输出与 df_manager 相同。 交叉连接 交叉连接也是一种连接类型,可以生成两个或多个表中行的笛卡尔积。它将第一个表中的行与第二个表中的每一行组合在一起。...总结 在本文中,介绍了如何在Pandas中使用连接的操作,以及它们是如何在 Pandas DataFrame 中执行的。这是一篇非常简单的入门文章,希望在你处理数据的时候有所帮助。

    5.4K20

    pandas | 详解DataFrame中的apply与applymap方法

    今天是pandas数据处理专题的第5篇文章,我们来聊聊pandas的一些高级运算。...今天这篇文章我们来聊聊dataframe中的广播机制,以及apply函数的使用方法。 dataframe广播 广播机制我们其实并不陌生, 我们在之前介绍numpy的专题文章当中曾经介绍过广播。...比如我们将一个二维数组减去一个一维数组,numpy会先将一位数组拓展到二维之后再进行减法运算。看起来就像是二维数组的每一行分别减去了这一个一维数组一样。...最后我们来介绍一下applymap,它是元素级的map,我们可以用它来操作DataFrame中的每一个元素。比如我们可以用它来转换DataFrame当中数据的格式。 ?...总结 今天的文章我们主要介绍了pandas当中apply与applymap的使用方法, 这两个方法在我们日常操作DataFrame的数据非常常用,可以说是手术刀级的api。

    3.7K20

    加载大型CSV文件到Pandas DataFrame的技巧和诀窍

    因此,这个数据集是用来说明本文概念的理想数据集。 将CSV文件加载到Pandas DataFrame中 首先,让我们从加载包含超过1亿行的整个CSV文件开始。...检查列 让我们检查数据框中的列: df.columns 现在,你应该意识到这个CSV文件没有标题,因此Pandas将假定CSV文件的第一行包含标题: Index(['198801', '1', '103...行数据加载到了Pandas DataFrame中。...与前面的部分一样,缺点是在加载过程中必须扫描整个CSV文件(因此加载DataFrame需要22秒)。 总结 在本文中,介绍了许多从CSV文件加载Pandas DataFrame的技巧。...通常情况下,没有必要将整个CSV文件加载到DataFrame中。通过仅加载所需的数据,你不仅可以节省加载所需数据的时间,还可以节省内存,因为DataFrame需要的内存更少。

    1.1K10

    字符串和列表之间的转换

    字符串本身是由一个或多个字符组成;列表可以看作是由一个或多个相对独立的字符串构成,因此,两者之间在一定条件下是可以转换的。...split命令可以将字符串按照指定规则进行分割,并将分割后的各个字符串构成列表返回。该命令接收两个参数,第一个参数是字符串变量,第二个参数是分割字符。看一个例子。...在这个例子中变量birthday其内容由“/”隔开。Split命令将其按照“/”分割成独立的三部分。这样返回值就可以按照列表方式进行处理。 ?...它把列表元素串接成一个字符串,元素之间用指定的分隔符号隔开。该命令接收两个参数,第一个参数是列表,第二个参数是分割字符。看一个例子。 ? 再看一个例子。...例如,Vivado中很多Tcl命令返回的结果是一个列表,这在Tcl Console中查看很不方便,因为所有列表元素都在一行。

    3K11

    合并Pandas的DataFrame方法汇总

    ---- Pandas是数据分析、机器学习等常用的工具,其中的DataFrame又是最常用的数据类型,对它的操作,不得不熟练。...Pandas提供好几种方法和函数来实现合并DataFrame的操作,一般的操作结果是创建一个新的DataFrame,而对原始数据没有任何影响。...在上面的示例中,还设置了参数 indicator为True,以便Pandas在DataFrame的末尾添加一个额外的_merge 列。.../example.com/img/id007.jpg']                              }) 为了按行联接df2和df2_addition,可以将它们作为objs参数传递到一个列表中...这样,就要保留第一个DataFrame中的所有非缺失值,同时用第二个DataFrame可用的非缺失值(如果有这样的非缺失值)替换第一个DataFrame中的所有NaN。

    6.4K10

    python下的Pandas中DataFrame基本操作(二),DataFrame、dict、array构造简析

    DataFrame简介:   DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。...其实,DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。...:第一种是两个不同列表转换成一个数据框,第二种是一个包含不同子列表的列表转换成为数据框。...第一种:两个不同列表转换成为数据框 from pandas.core.frame import DataFrame a=[1,2,3,4]#列表a b=[5,6,7,8]#列表b c={"a" : a,...7 3 4 8 第二种:将包含不同子列表的列表转换为数据框 from pandas.core.frame import DataFrame a=[[1,2,3,4],[5,6,7,8]]#包含两个不同的子列表

    5.5K30
    领券