首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

在Python Pandas中,如何根据现有的2列重复值添加新列

在Python Pandas中,可以使用duplicated()函数来判断DataFrame中的重复值。然后,可以使用条件判断语句和np.where()函数来根据重复值添加新列。

以下是完善且全面的答案:

在Python Pandas中,可以使用以下步骤来根据现有的两列重复值添加新列:

  1. 导入必要的库:
代码语言:txt
复制
import pandas as pd
import numpy as np
  1. 创建一个DataFrame示例:
代码语言:txt
复制
data = {'A': [1, 2, 3, 4, 4],
        'B': [5, 6, 7, 7, 8]}
df = pd.DataFrame(data)
  1. 使用duplicated()函数判断DataFrame中的重复值,并将结果保存在新列is_duplicate中:
代码语言:txt
复制
df['is_duplicate'] = df.duplicated()
  1. 使用条件判断语句和np.where()函数根据重复值添加新列new_column
代码语言:txt
复制
df['new_column'] = np.where(df['is_duplicate'], '重复', '不重复')

完整的代码示例:

代码语言:txt
复制
import pandas as pd
import numpy as np

# 创建DataFrame示例
data = {'A': [1, 2, 3, 4, 4],
        'B': [5, 6, 7, 7, 8]}
df = pd.DataFrame(data)

# 判断重复值
df['is_duplicate'] = df.duplicated()

# 根据重复值添加新列
df['new_column'] = np.where(df['is_duplicate'], '重复', '不重复')

print(df)

运行结果:

代码语言:txt
复制
   A  B  is_duplicate new_column
0  1  5         False       不重复
1  2  6         False       不重复
2  3  7         False       不重复
3  4  7         False       不重复
4  4  8          True         重复

这样就根据现有的两列重复值成功添加了新列new_column,并标记了重复和非重复的行。

推荐的腾讯云相关产品:腾讯云数据库(TencentDB)

产品介绍链接地址:腾讯云数据库(TencentDB)

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

领券