首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【R语言】数据框按两列排序

我相信大家经常会使用Excel对数据进行排序。有时候我们会按照两个条件来对数据排序。假设我们手上有下面这套数据,9个人,第二列(score)为他们的考试成绩,第三列(code)为对应的评级。...主要用的是R中的order这个函数。...#读入文件,data.txt中存放的数据为以上表格中展示的数据 file=read.table(file="data.txt",header=T,sep="\t") #先按照code升序,再按照Score...,只需要前面加个负号就可以了 View(file[order(file$Code,-file$Score),]) 下面是按照code升序,然后再按score降序排列的结果,是不是跟Excel处理的结果一样...在R里面我们还可以指定code按照一定的顺序来排列 #按照指定的因子顺序排序,先good,在excellent,最后poor file$Code <- factor(file$Code , levels

2.3K20

【Python】基于某些列删除数据框中的重复值

=True) 按照多列去重实例 一、drop_duplicates函数介绍 drop_duplicates函数可以按某列去重,也可以按多列去重。...subset:用来指定特定的列,根据指定的列对数据框去重。默认值为None,即DataFrame中一行元素全部相同时才去除。...从结果知,参数为默认值时,是在原数据的copy上删除数据,保留重复数据第一条并返回新数据框。 感兴趣的可以打印name数据框,删重操作不影响name的值。...结果和按照某一列去重(参数为默认值)是一样的。 如果想保留原始数据框直接用默认值即可,如果想直接在原始数据框删重可设置参数inplace=True。...但是对于两列中元素顺序相反的数据框去重,drop_duplicates函数无能为力。 如需处理这种类型的数据去重问题,参见本公众号中的文章【Python】基于多列组合删除数据框中的重复值。 -end-

20.5K31
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【Python】基于多列组合删除数据框中的重复值

    最近公司在做关联图谱的项目,想挖掘团伙犯罪。在准备关系数据时需要根据两列组合删除数据框中的重复值,两列中元素的顺序可能是相反的。...本文介绍一句语句解决多列组合删除数据框中重复值的问题。 一、举一个小例子 在Python中有一个包含3列的数据框,希望根据列name1和name2组合(在两行中顺序不一样)消除重复项。...二、基于两列删除数据框中的重复值 1 加载数据 # coding: utf-8 import os #导入设置路径的库 import pandas as pd #导入数据处理的库...import numpy as np #导入数据处理的库 os.chdir('F:/微信公众号/Python/26.基于多列组合删除数据框中的重复值') #把路径改为数据存放的路径 df =...从上图可以看出用set替换frozense会报不可哈希的错误。 三、把代码推广到多列 解决多列组合删除数据框中重复值的问题,只要把代码中取两列的代码变成多列即可。

    14.7K30

    JavaScript——快速判断数组对象的值是否全部满足条件

    前言 EasyBe主题开发中遇到一个问题,查看了下MDN文档找到了比较合适的方法,这里只做了简单的示例,详细的一些描述和原理建议访问MDN进行查看; every: every ArrayEvery:...ArrayEvery some: some ArraySome: ArraySome 内容 every every() 方法测试一个数组内的所有元素是否都能通过某个指定函数的测试。...它返回一个布尔值。 若收到一个空数组,此方法在任何情况下都会返回 true。...示例 // 判断是否所有值都不为空 let data = [ { "name": "author", "value": "123" }, {...== '') some some() 方法测试数组中是不是至少有 1 个元素通过了被提供的函数测试。它返回的是一个 Boolean 类型的值。

    9710

    使用FILTER函数筛选满足多个条件的数据

    标签:Excel函数,FILTER函数 FILTER函数是一个动态数组函数,可以基于定义的条件筛选一系列数据,其语法为: FILTER(数组,包括, [是否为空]) 其中,参数数组,是想要筛选的数据,...参数包括,指定筛选的条件,应返回TRUE,以便将其包含在查询中。参数是否为空,如果没有满足筛选条件的结果,则可以给该参数指定要返回的内容,可选。 我们可以使用FILTER函数返回满足多个条件的数据。...假设我们要获取两个条件都满足时的数据,如下图1所示示例数据,要返回白鹤公司销售香蕉的数据。...图1 可以使用公式: =FILTER(A2:D11,(A2:A11=G1)*(C2:C11=G2)) 公式中,两个条件相乘表示两者都要满足。结果如下图2所示。...图2 如果我们想要获取芒果和葡萄的所有数据,则使用公式: =FILTER(A2:D11,(C2:C11="芒果")+(C2:C11="葡萄")) 将两个条件相加,表示两者满足之一即可。

    3.5K20

    问与答81: 如何求一组数据中满足多个条件的最大值?

    Q:在工作表中有一些数据,如下图1所示,我想要获取“参数3”等于“A”、”参数4“等于”C1“对应的”参数5”中的最大值,能够使用公式解决吗? ? 图1 A:这种情况用公式很容易解决。...在单元格F13中输入数组公式: =MAX(IF((参数3=D13)*(参数4=E13),参数5,0)) 记得按Ctrl+Shift+Enter组合键完成输入。...我们看看公式中的: (参数3=D13)*(参数4=E13) 将D2:D12中的值与D13中的值比较: {"A";"B";"A";"B";"A";"A";"B";"A";"B";"A";"A"}=”A”...代表同一行的列D和列E中包含“A”和“C1”。...D和列E中包含“A”和“C1”对应的列F中的值和0组成的数组,取其最大值就是想要的结果: 0.545 本例可以扩展到更多的条件。

    4K30

    Excel公式练习59: 获取与满足多个查找条件的所有值

    本次的练习是:如下图1所示,单元格区域A1:E25中存放着数据,列D中是要查找的值需满足的条件,列I和列J中显示查找到的结果,示例中显示的是1月份南区超市销售的蔬菜及其数量。 ?...图1 要求在I2中输入公式,向右向下拖拉以获取全部满足条件的数据。 先不看答案,自已动手试一试。...公式解析 公式中的: COUNTIFS($A:$A,$G$6,$B:$B,$G$9,$C:$C,$G$3)<ROWS($I$2:I2) 用来计算符合条件的结果数(本例中为5),并与已放置值的单元格数(已返回的值...FALSE;TRUE;TRUE;FALSE;TRUE}=3 转换为: {1;1;2;2;1;2;0;0;1;1;0;1;2;2;3;3;2;3;1;1;3;3;1;2}=3 数组中有5个3,表明有5条数据满足条件...、3……等,从而可以获取相应位置的值。

    2.8K20

    Power BI 图像在条件格式和列值的行为差异

    Power BI在表格矩阵条件格式和列、值区域均可以放入图像,支持URL、Base64、SVG等格式。同样的图像在不同的区域有不同的显示特性。...接着,我们进行极小值测试,将图像度量值调整为5*5,可以看到条件格式显示效果不变,但是列的图像变小。 另一端极大值测试,将图像度量值调整为100*100,显示效果似乎与36*36没什么不同。...以上测试可以得出第一个结论:条件格式图像的显示大小和图像本身的大小无关;列值的图像显示大小既受图像本身大小影响,又受表格矩阵格式设置区域的区域空间影响。 那么,条件格式图像大小是不是恒定的?不是。...还是36*36的正方形,这里把表格的字体放大,可以看到条件格式的正方形图像也对应放大,列值的图像没有变化。 所以,条件格式图像的大小依托于当前列值的文本格式。...换一个场景,对店铺名称施加排名条件格式(SVG图像),为该列设置背景色,可以看到背景色穿透了本应存在的缝隙,条件格式和列值融为一体。

    16510

    Excel公式技巧21: 统计至少在一列中满足条件的行数

    在这篇文章中,探讨一种计算在至少一列中满足规定条件的行数的解决方案,示例工作表如下图1所示,其中详细列出了各个国家在不同年份废镍的出口水平。 ?...(N(B2:B14>=1000),N(C2:C14>=1000)) 现在,如果我们希望计算2004年和2005年的数据中至少有一个满足此标准的国家数量呢?...由于数据较少,我们可以从工作表中清楚地标出满足条件的数据,如下图2所示。 ? 图2 显然,“标准的”COUNTIF(S)公式结构不能满足要求,因为我们必须确保不要重复计数。...如下图3所示,我们可以在工作表中标出满足条件的数据,除了2个国家外,其他11个国家都满足条件。 ?...并且,由于上述数组(一个13行乘9列的数组)包含9列,因此我们用来形成乘积的矩阵的行数必须等于该数组的列数。

    4.1K10

    seaborn可视化数据框中的多个列元素

    seaborn提供了一个快速展示数据库中列元素分布和相互关系的函数,即pairplot函数,该函数会自动选取数据框中值为数字的列元素,通过方阵的形式展现其分布和关系,其中对角线用于展示各个列元素的分布情况...,剩余的空间则展示每两个列元素之间的关系,基本用法如下 >>> df = pd.read_csv("penguins.csv") >>> sns.pairplot(df) >>> plt.show()...函数自动选了数据框中的3列元素进行可视化,对角线上,以直方图的形式展示每列元素的分布,而关于对角线堆成的上,下半角则用于可视化两列之间的关系,默认的可视化形式是散点图,该函数常用的参数有以下几个 ###...#### 3、 x_vars和y_vars 默认情况下,程序会对数据框中所有的数值列进行可视化,通过x_vars和y_vars可以用列名称来指定我们需要可视化的列,用法如下 >>> sns.pairplot...通过pairpplot函数,可以同时展示数据框中的多个数值型列元素的关系,在快速探究一组数据的分布时,非常的好用。

    5.2K31

    Excel按某一列数据从另一列找到对应字段的数值

    本文介绍在Excel中,从某一列数据中找到与已知数据对应的字段,并提取这个字段对应数值的方法。   首先,来明确一下我们的需求。...现在已知一个Excel数据,假设其中W列包含了上海市全部社区的名称,而其后的Y列则是这些社区对应的面积;随后,Z列是另一批社区的名称,其中既有上海市的社区(也就是在W列中的数据),也可能会有其他城市的社区...此外,在列号字母和行号数字前,一定要加   随后,3表示在用来【寻找社区面积】的那一堆数据里,社区面积排在第几列。...其次,如下图所示,可以看到Z列中有一个品欣雅苑居委会,由于这个居委会在W列中不存在,所以其对应的AA列面积就是NA值。   ...如果不希望出现NA值,我们可以通过批量替换的方式,将Excel表格中的NA值替换为0或者其他值。   至此,大功告成。 欢迎关注(几乎)全网:疯狂学习GIS

    17310

    Excel公式技巧20: 从列表中返回满足多个条件的数据

    在实际工作中,我们经常需要从某列返回数据,该数据对应于另一列满足一个或多个条件的数据中的最大值。 如下图1所示,需要返回指定序号(列A)的最新版本(列B)对应的日期(列C)。 ?...原因是与条件对应的最大值不是在B2:B10中,而是针对不同的序号。而且,如果该情况发生在希望返回的值之前行中,则MATCH函数显然不会返回我们想要的值。...B10,0)) 转换为: =INDEX(C2:C10,MATCH(4,B2:B10,0)) 转换为: =INDEX(C2:C10,MATCH(4,{4;2;5;3;1;3;4;1;2},0)) 很显示,数组中的第一个满足条件的值并不是我们想要查找的值所在的位置...: =INDEX(C2:C10,1) 得到: 2013-2-21 这并不是满足我们的条件对应的值。...由于数组中的最小值为0.2,在数组中的第7个位置,因此上述公式构造的结果为: {0;0;0;0;0;0;1;0;0;0} 获得此数组后,我们只需要从列C中与该数组出现的非零条目(即1)相对应的位置返回数据即可

    9.3K10

    Excel公式技巧14: 在主工作表中汇总多个工作表中满足条件的值

    我们可能熟悉使用INDEX、SMALL等在给定单列或单行数组的情况下,返回满足一个或多个条件的值的列表。这是一项标准的公式技术。...可以很容易地验证,在该公式中的单个条件可以扩展到多个条件,因此,我们现在有了从一维数组和二维数组中生成单列列表的方法。 那么,可以更进一步吗?...本文提供了一种方法,在给定一个或多个相同布局的工作表的情况下,可以创建另一个“主”工作表,该工作表仅由满足特定条件的所有工作表中的数据组成。并且,这里不使用VBA,仅使用公式。...图3 想要创建一个主工作表Master,其数据来源于上面三个工作表中列D中的值为“Y”的数据: ?...实际上,该技术的核心为:通过生成动态汇总小计数量的数组,该小计数量由来自每个工作表中符合条件(即在列D中的值为“Y”)的行数组成,然后将公式所在单元格相对行数与该数组相比较,以便有效地确定公式所在行中要指定的工作表

    9.1K21

    2.37 PowerBI数据建模-按列排序的副作用,ALL失效了

    使用ALL函数来计算占比,明明公式正确,返回的百分比却都是100%,百思不得其解,这是软件的Bug吗? 举例基于下表,计算每个班级的人数占比。...班级人数'[人数])总人数_Wrong = CALCULATE([人数],ALL('班级人数'[班级]))班级人数占比_Wrong = DIVIDE([人数],[总人数])异常结果如下:解决方案班级这一列使用了按列排序...,把班级字段拖入报表中的时候,实际上还拖入了一个看不到的班级排序字段,这样才能实现排序的效果。...这种情况下,ALL函数只用了一个字段,并没有彻底清除筛选,所以分母的总人数返回的还是每个班级的人数。把字段和排序字段都放到ALL的参数中,就会返回正确的结果。...本例把ALL的参数调整为班级和用于排序的班级排序字段,如下:总人数 = CALCULATE([人数],ALL('班级人数'[班级],'班级人数'[班级排序]))拓展按列排序还会有其他的副作用,比如判断某个被排序的字段是否被筛选

    3500

    面试算法,在绝对值排序数组中快速查找满足条件的元素配对

    对于数组A,绝对值排序满足以下条件:|A[i]| 满足A[j] == m 那么我们就可以直接返回配对(i,j),这种做法在数组元素全是正数,全是负数,以及是绝对值排序时都成立,只是在绝对值排序的数组中,进行二分查找时...因此在查找满足条件的元素配对时,我们先看看前两种情况是否能查找到满足条件的元素,如果不行,那么我们再依据第三种情况去查找,无论是否存在满足条件的元素配对,我们算法的时间复杂度都是O(n)。..." and " + this.sortedArray[this.indexJ]); } } } 类FindPairInAbsoluteSortedArray用于在绝对值排序的数组中查找满足条件的元素配对...,它先根据两元素都是正数的情况下查找,然后再根据两元素都是负数的情况下查找,如果这两种情况都找不到,再尝试两元素一正一负的情况下查找,如果三种情况都找不到满足条件的元素,那么这样的元素在数组中不存在。

    4.4K10

    R 茶话会(七:高效的处理数据框的列)

    前言 这个笔记的起因是在学习DataExplorer 包的时候,发现: 这我乍一看,牛批啊。这语法还挺长见识的。 转念思考了一下,其实目的也就是将数据框中的指定列转换为因子。...换句话说,就是如何可以批量的对数据框的指定行或者列进行某种操作。...(这里更多强调的是对原始数据框的直接操作,如果是统计计算直接找summarise 和它的小伙伴们,其他的玩意儿也各有不同,掉头左转: 34....R 数据整理(六:根据分类新增列的种种方法 1.0) 其实按照我的思路,还是惯用的循环了,对数据框的列名判断一下,如果所取的列在数据框中,就修改一下其格式,重新赋值: data(cancer, package...这里就回到开始的问题了,如果是希望对数据框本身进行处理,而非统计学运算呢?

    1.5K20
    领券