腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
在
dataframe
中找到副本,并且只保留最高
的
副本。
python
、
pandas
、
dataframe
、
csv
、
data-manipulation
我试图为每个较高
的
组在
dataframe
中找到
重复
项
,以便稍后可以根据索引
从
另一个
dataframe
中
删除
这些副本,这样主
dataframe
就没有
重复
,只有最低值。基本上,假设我们有这样
的
数据: 1 1 402 3 2 4062 416 5
浏览 8
提问于2021-11-10
得票数 0
回答已采纳
1
回答
从
具有
多个
列
和
字符串
的
DataFrame
中
删除
连续
的
重复
项
python
、
pandas
、
dataframe
我有过 df = pd.
DataFrame
([{'a':1,'b':1,'c':'x'},{'a':1,'b':1,'c':'x'}, {'a':2,'b':2, 'c':'x'}, {'a':1,''x'}, {'a':1,'b':1,'c
浏览 10
提问于2020-11-06
得票数 1
回答已采纳
1
回答
如何将一
列
添加到
多个
具有
不同值
的
.csv文件
python
、
csv
、
dataframe
我有以下场景:我有一个包含
多个
.csv文件
的
文件夹,我最终希望合并并
删除
重复
的
文件。 我目前遇到
的
问题是,我只想
删除
合并文件时产生
的
重复
项
。换句话说:一些单独
的
.csv文件已经有了我不想
删除
的
重复
行。 为了实现这一点,我考虑为每个单独
的
.csv文件分配一个
具有
固定值
的
额外
列
。
浏览 22
提问于2019-09-03
得票数 0
回答已采纳
1
回答
Pandas
Dataframe
丢弃记录及其副本
python-3.x
我希望
删除
基于
列
的
pandas
Dataframe
中
具有
重复
项
及其
重复
项
的
记录
浏览 18
提问于2019-11-14
得票数 0
回答已采纳
1
回答
python pandas,
删除
用于任何
DataFrame
特定
列
的
重复
功能,但有一个例外:
python
、
pandas
、
dataframe
、
csv
、
data-science
无论如何,我正在试图弄清楚如何为
从
.csv文件读取
的
DataFrame
的
一个或
多个
列
的
所有单元格实现
删除
重复
项
功能,在python脚本
中
,您可以设置要在
DataFrame
的
列
的
所有单元格
中
删除
重复
项
的
符号,但有一个例外,当一个符号是一个单元
浏览 1
提问于2021-04-05
得票数 0
2
回答
中
的
id参考
列
scala
、
apache-spark-sql
,customers_id#130 是否有一种方法可以根据
Dataframe
中
的
顺序或数字ID (而不是别名)引用
中
的
列
?但是,虽然我可以在select函数中使用OriginalDataframe.customer_id,但withColumnRename函数只接受
字符串
别名,因此不能在最终
的
dataframe
中
重命名
重复
的
列
因此,我想最终
的</em
浏览 0
提问于2016-09-30
得票数 1
1
回答
将
列
合并为一个
列
,同时
删除
NaN值
和
重复
项
python
、
merge
、
multiple-columns
我正在尝试将
多个
列
合并为一
列
,同时
删除
重复
项
和
空值,但保留行。我所拥有的: df= pd.
DataFrame
(np.array([['nan', 'nan', 'nan'], ['nan', 2, 2], ['nan', 'x', 'nan']]), columns=['a', 'b&
浏览 24
提问于2021-06-24
得票数 0
回答已采纳
1
回答
如何在Excel 2010
中
删除
单列
中
的
重复
项
excel
、
excel-formula
、
excel-2010
我们有一个相当大
的
电子表格,其中可能有许多
重复
项
。 我正在尝试找到一种方法来突出显示
和
删除
单个
列
中
的
重复
项
-例如,B
列
用于电子邮件地址。一个人
的
电子邮件应该只出现一次,所以如果他们在B
列
中出现
的
次数更多,那么X行就是
重复
的
信息。行X可能包含B
列
中
电子邮件地址
的</em
浏览 1
提问于2016-12-06
得票数 0
1
回答
Pandas
Dataframe
在一
列
列表
中
删除
重复
项
?
python
、
pandas
、
numpy
、
dataframe
我正在尝试
删除
列
a
和
c
中
的
重复
项
。[1, 0] 3 ab a b c1 [0, 0] 2 bc 我尝试过
的
:没有a
列
的
列表。而c
列
不是
字符串
。pd.
DataFrame
(np.unique(df), columns=df.columns)适用
浏览 0
提问于2020-07-30
得票数 0
2
回答
尽管数据大小未超过内存,但仍出现内存不足错误
python
、
pandas
、
dask
我正在尝试从一个MySQL表中加载一个dask数据帧,它占用了大约4 4gb
的
磁盘空间。我使用
的
是一台内存为8 8gb
的
机器,但当我执行drop复制并尝试获取数据帧
的
长度时,就遇到了内存不足错误。下面是我
的
代码片段:df = df[[
浏览 0
提问于2021-07-13
得票数 1
1
回答
使用python跨数据框比较
和
查找
重复
的
值(而不是整个
列
python
、
numpy
、
duplicates
、
multiple-columns
、
pairwise
我有一个很大
的
时间表数据帧,我需要计算运行
的
实验数量。挑战在于,for
的
用法在行
中
重复
(这是可以
的
),但在某些
列
中
重复
,但不是所有
列
中
。我想
删除
第二个条目(如果
重复
的话),但我不能
删除
整个第二
列
,因为它也将包含一些新值。如何以并排
的
方式比较两个
列
的
单个条目,并在存在
重
浏览 19
提问于2020-09-16
得票数 0
3
回答
将用户(在多行上
重复
)和数据表
中
的
项
转换为标签
python
、
pandas
、
scikit-learn
、
sklearn-pandas
我有一个像这样
的
DataFrame
['a', 1], ['c', 1], ['c', 3], ['c', 4]每个用户跨
多个</em
浏览 5
提问于2019-10-16
得票数 3
回答已采纳
2
回答
Ocaml:如何
删除
列表中所有
重复
的
元素?
list
、
duplicates
、
ocaml
在学习Ocaml时,我看到了一个
从
列表
中
删除
重复
元素
的
代码。-> x::[] if x=y then remove (y::tl) else x::remove (y::tl) 但是,我发现这段代码只
删除
连续
的
重复
项
,所以如果我尝试一些单独
的
重复
项
,例如6;6;8;9;4;2;5;1;5;2;3,代码
浏览 22
提问于2019-10-12
得票数 0
回答已采纳
1
回答
如何选择要
删除
的
重复
行?
scala
、
apache-spark
、
dataframe
、
apache-spark-sql
我正在尝试将一个新数据集与一个旧数据集合并,每个表类型都有一个包含主键
的
SeqString,以及一个旧数据帧
和
一个
具有
相同模式
的
新数据帧。如果主键
列
值匹配,我想用新数据帧
中
的
行替换旧数据帧
中
的
行,如果它们不匹配,我想将行添加到。("old/new",lit("2")))我添加了一个由1
和
浏览 17
提问于2016-08-05
得票数 0
回答已采纳
1
回答
(VBA)
删除
同一区域
的
重复
单元
excel
我有一个问题,以致无法
删除
同一节
中
的
重复
项
(B
列
中
的
同名)。它应该扫描每一节,并保持每节
的
第一个唯一值。 问题是,它分析两个
连续
行是否
具有
相同
的
名称(这表明了部分),并基于此
删除
重复
项
。它不分析每一节,例如第1行
和
最后一行,而是1乘1,这是错误
的
,因为每一节
的
倒数第一行或最后
浏览 1
提问于2020-04-01
得票数 0
回答已采纳
1
回答
根据
从
第三
列
开始
的
所有
列
从
熊猫数据
中
删除
副本
python
、
pandas
我有一个50 +
列
的
dataframe
,前两个是唯一
的
ID。由于某些原因,对于不同
的
ID,来自第三
列
的
数据可以完全相同。 我想要实现
的
是根据
从
第三
列
开始
的
所有
列
从
dataframe
删除
重复
项
。如果有超过1行
具有
不同ID
和
来自第三
列
的
浏览 13
提问于2022-01-18
得票数 1
回答已采纳
1
回答
字符串
中
的
Pyspark双字符替换避免未映射到pandas或rdd
的
特定单词
python
、
pandas
、
apache-spark
、
pyspark
、
apache-spark-sql
我继承了一个修改pyspark
dataframe
中一些
字符串
的
程序。其中一个步骤涉及
从
字符串
中
的
一些单词
中
删除
双/三/等字母,以及一个额外
的
例外列表,即使它们有
重复
的
字母也会保持不变。目前,这是通过将
dataframe
转换为
具有
udf
的
pandas,然后在读回pyspark之前对生成
的
pa
浏览 7
提问于2021-03-15
得票数 0
回答已采纳
1
回答
如何将set函数应用于特定
列
的
所有行,该
列
的
条目是
具有
重复
值
的
列表?
python
、
pandas
在我
的
pandas数据框
中
,我有一个
列
,该
列
的
每一行都是一个
具有
重复
值
的
列表。例如,一个有3行
的
数据框:df = pd.
DataFrame
({'Column_1': [[1,2,3,2],[1,1,2],[1,2,3]]})我想要
删除
重复
项
。我
的
预期输出类似于[[1,2,3],[1,2],[1,2,3]]。如何应用set函数来
浏览 13
提问于2020-08-03
得票数 0
回答已采纳
1
回答
DataFrame
-
删除
在特定
列
中
与前一行
具有
相同值
的
行
python
、
pandas
、
dataframe
我有一个熊猫
dataframe
,我想检查每一行在某一
列
中
是否有相同
的
值(让我们称之为porduct_type),如果有,就
删除
它。换句话说,在一组在特定
列
中
具有
相同值
的
连续
行
中
,我只想保留一个行。例如,如果A
列
是我们不希望
连续
重复
的
列
:A B 0
浏览 5
提问于2014-07-24
得票数 5
回答已采纳
1
回答
检测导致行唯一性
的
熊猫
列
python
、
pandas
我试图在熊猫
DataFrame
中
删除
多
列
的
重复
行。问题是,必须有一些
具有
唯一值
的
列
,因为df.drop_duplicates(subset=None, keep='first', inplace=True)并没有
删除
我希望它
删除
的
所有行。选择两行在我看来是
重复
的
,我尝试了一个视觉比较,但无法识别它们之间
的
差异
浏览 6
提问于2020-06-24
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
肝了3天,整理了90个Pandas案例
pandas系列学习(三):DataFrame
这些很实用的Pandas技巧,你都会了吗?-乌森数据可视化系列(1)
每天读一本:利用Python进行数据分析
使用Python建立你数据科学的“肌肉记忆”
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券